genshi/genshi-test: genshi/output.py annotate

annotate genshi/output.py @ 500:0742f421caba experimental-inline

Merged revisions 487-603 via svnmerge from http://svn.edgewall.org/repos/genshi/trunk

author	cmlenz
date	Fri, 01 Jun 2007 17:21:47 +0000
parents	49aa525b8f83
children	1837f39efd6f

rev	line source
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	1 # -- coding: utf-8 --
821114ec4f69 Initial import. cmlenz parents: diff changeset	2 #
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	3 # Copyright (C) 2006-2007 Edgewall Software
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	4 # All rights reserved.
821114ec4f69 Initial import. cmlenz parents: diff changeset	5 #
821114ec4f69 Initial import. cmlenz parents: diff changeset	6 # This software is licensed as described in the file COPYING, which
821114ec4f69 Initial import. cmlenz parents: diff changeset	7 # you should have received as part of this distribution. The terms
230 24757b771651 Renamed Markup to Genshi in repository. cmlenz parents: 219 diff changeset	8 # are also available at http://genshi.edgewall.org/wiki/License.
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	9 #
821114ec4f69 Initial import. cmlenz parents: diff changeset	10 # This software consists of voluntary contributions made by many
821114ec4f69 Initial import. cmlenz parents: diff changeset	11 # individuals. For the exact contribution history, see the revision
230 24757b771651 Renamed Markup to Genshi in repository. cmlenz parents: 219 diff changeset	12 # history and logs, available at http://genshi.edgewall.org/log/.
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	13
821114ec4f69 Initial import. cmlenz parents: diff changeset	14 """This module provides different kinds of serialization methods for XML event
821114ec4f69 Initial import. cmlenz parents: diff changeset	15 streams.
821114ec4f69 Initial import. cmlenz parents: diff changeset	16 """
821114ec4f69 Initial import. cmlenz parents: diff changeset	17
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	18 from itertools import chain
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	19 try:
821114ec4f69 Initial import. cmlenz parents: diff changeset	20 frozenset
821114ec4f69 Initial import. cmlenz parents: diff changeset	21 except NameError:
821114ec4f69 Initial import. cmlenz parents: diff changeset	22 from sets import ImmutableSet as frozenset
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	23 import re
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	24
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	25 from genshi.core import escape, Attrs, Markup, Namespace, QName, StreamEventKind
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	26 from genshi.core import START, END, TEXT, XML_DECL, DOCTYPE, START_NS, END_NS, \
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	27 START_CDATA, END_CDATA, PI, COMMENT, XML_NAMESPACE
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	28
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	29 __all__ = ['encode', 'get_serializer', 'DocType', 'XMLSerializer',
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	30 'XHTMLSerializer', 'HTMLSerializer', 'TextSerializer']
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	31 __docformat__ = 'restructuredtext en'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	32
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	33 def encode(iterator, method='xml', encoding='utf-8'):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	34 """Encode serializer output into a string.
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	35
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	36 :param iterator: the iterator returned from serializing a stream (basically
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	37 any iterator that yields unicode objects)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	38 :param method: the serialization method; determines how characters not
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	39 representable in the specified encoding are treated
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	40 :param encoding: how the output string should be encoded; if set to `None`,
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	41 this method returns a `unicode` object
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	42 :return: a string or unicode object (depending on the `encoding` parameter)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	43 :since: version 0.4.1
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	44 """
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	45 output = u''.join(list(iterator))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	46 if encoding is not None:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	47 errors = 'replace'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	48 if method != 'text' and not isinstance(method, TextSerializer):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	49 errors = 'xmlcharrefreplace'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	50 return output.encode(encoding, errors)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	51 return output
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	52
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	53 def get_serializer(method='xml', **kwargs):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	54 """Return a serializer object for the given method.
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	55
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	56 :param method: the serialization method; can be either "xml", "xhtml",
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	57 "html", "text", or a custom serializer class
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	58
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	59 Any additional keyword arguments are passed to the serializer, and thus
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	60 depend on the `method` parameter value.
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	61
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	62 :see: `XMLSerializer`, `XHTMLSerializer`, `HTMLSerializer`, `TextSerializer`
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	63 :since: version 0.4.1
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	64 """
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	65 if isinstance(method, basestring):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	66 method = {'xml': XMLSerializer,
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	67 'xhtml': XHTMLSerializer,
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	68 'html': HTMLSerializer,
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	69 'text': TextSerializer}[method.lower()]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	70 return method(**kwargs)
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	71
821114ec4f69 Initial import. cmlenz parents: diff changeset	72
85 db8f2958c670 Improve handling of DOCTYPE declarations. cmlenz parents: 73 diff changeset	73 class DocType(object):
db8f2958c670 Improve handling of DOCTYPE declarations. cmlenz parents: 73 diff changeset	74 """Defines a number of commonly used DOCTYPE declarations as constants."""
db8f2958c670 Improve handling of DOCTYPE declarations. cmlenz parents: 73 diff changeset	75
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	76 HTML_STRICT = (
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	77 'html', '-//W3C//DTD HTML 4.01//EN',
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	78 'http://www.w3.org/TR/html4/strict.dtd'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	79 )
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	80 HTML_TRANSITIONAL = (
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	81 'html', '-//W3C//DTD HTML 4.01 Transitional//EN',
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	82 'http://www.w3.org/TR/html4/loose.dtd'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	83 )
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	84 HTML_FRAMESET = (
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	85 'html', '-//W3C//DTD HTML 4.01 Frameset//EN',
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	86 'http://www.w3.org/TR/html4/frameset.dtd'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	87 )
85 db8f2958c670 Improve handling of DOCTYPE declarations. cmlenz parents: 73 diff changeset	88 HTML = HTML_STRICT
db8f2958c670 Improve handling of DOCTYPE declarations. cmlenz parents: 73 diff changeset	89
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	90 HTML5 = ('html', None, None)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	91
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	92 XHTML_STRICT = (
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	93 'html', '-//W3C//DTD XHTML 1.0 Strict//EN',
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	94 'http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	95 )
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	96 XHTML_TRANSITIONAL = (
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	97 'html', '-//W3C//DTD XHTML 1.0 Transitional//EN',
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	98 'http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	99 )
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	100 XHTML_FRAMESET = (
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	101 'html', '-//W3C//DTD XHTML 1.0 Frameset//EN',
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	102 'http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	103 )
85 db8f2958c670 Improve handling of DOCTYPE declarations. cmlenz parents: 73 diff changeset	104 XHTML = XHTML_STRICT
db8f2958c670 Improve handling of DOCTYPE declarations. cmlenz parents: 73 diff changeset	105
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	106 def get(cls, name):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	107 """Return the ``(name, pubid, sysid)`` tuple of the ``DOCTYPE``
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	108 declaration for the specified name.
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	109
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	110 The following names are recognized in this version:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	111 * "html" or "html-strict" for the HTML 4.01 strict DTD
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	112 * "html-transitional" for the HTML 4.01 transitional DTD
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	113 * "html-transitional" for the HTML 4.01 frameset DTD
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	114 * "html5" for the ``DOCTYPE`` proposed for HTML5
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	115 * "xhtml" or "xhtml-strict" for the XHTML 1.0 strict DTD
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	116 * "xhtml-transitional" for the XHTML 1.0 transitional DTD
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	117 * "xhtml-frameset" for the XHTML 1.0 frameset DTD
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	118
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	119 :param name: the name of the ``DOCTYPE``
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	120 :return: the ``(name, pubid, sysid)`` tuple for the requested
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	121 ``DOCTYPE``, or ``None`` if the name is not recognized
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	122 :since: version 0.4.1
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	123 """
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	124 return {
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	125 'html': cls.HTML, 'html-strict': cls.HTML_STRICT,
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	126 'html-transitional': DocType.HTML_TRANSITIONAL,
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	127 'html-frameset': DocType.HTML_FRAMESET,
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	128 'html5': cls.HTML5,
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	129 'xhtml': cls.XHTML, 'xhtml-strict': cls.XHTML_STRICT,
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	130 'xhtml-transitional': cls.XHTML_TRANSITIONAL,
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	131 'xhtml-frameset': cls.XHTML_FRAMESET,
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	132 }.get(name.lower())
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	133 get = classmethod(get)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	134
85 db8f2958c670 Improve handling of DOCTYPE declarations. cmlenz parents: 73 diff changeset	135
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	136 class XMLSerializer(object):
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	137 """Produces XML text from an event stream.
821114ec4f69 Initial import. cmlenz parents: diff changeset	138
230 24757b771651 Renamed Markup to Genshi in repository. cmlenz parents: 219 diff changeset	139 >>> from genshi.builder import tag
20 e3d3c1d8c98a Fix tests broken in [20]. cmlenz parents: 19 diff changeset	140 >>> elem = tag.div(tag.a(href='foo'), tag.br, tag.hr(noshade=True))
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	141 >>> print ''.join(XMLSerializer()(elem.generate()))
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	142 <div><a href="foo"/><br/><hr noshade="True"/></div>
821114ec4f69 Initial import. cmlenz parents: diff changeset	143 """
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	144
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	145 _PRESERVE_SPACE = frozenset()
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	146
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	147 def __init__(self, doctype=None, strip_whitespace=True,
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	148 namespace_prefixes=None):
85 db8f2958c670 Improve handling of DOCTYPE declarations. cmlenz parents: 73 diff changeset	149 """Initialize the XML serializer.
db8f2958c670 Improve handling of DOCTYPE declarations. cmlenz parents: 73 diff changeset	150
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	151 :param doctype: a ``(name, pubid, sysid)`` tuple that represents the
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	152 DOCTYPE declaration that should be included at the top
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	153 of the generated output, or the name of a DOCTYPE as
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	154 defined in `DocType.get`
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	155 :param strip_whitespace: whether extraneous whitespace should be
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	156 stripped from the output
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	157 :note: Changed in 0.4.2: The `doctype` parameter can now be a string.
85 db8f2958c670 Improve handling of DOCTYPE declarations. cmlenz parents: 73 diff changeset	158 """
db8f2958c670 Improve handling of DOCTYPE declarations. cmlenz parents: 73 diff changeset	159 self.preamble = []
db8f2958c670 Improve handling of DOCTYPE declarations. cmlenz parents: 73 diff changeset	160 if doctype:
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	161 if isinstance(doctype, basestring):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	162 doctype = DocType.get(doctype)
85 db8f2958c670 Improve handling of DOCTYPE declarations. cmlenz parents: 73 diff changeset	163 self.preamble.append((DOCTYPE, doctype, (None, -1, -1)))
212 e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	164 self.filters = [EmptyTagFilter()]
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	165 if strip_whitespace:
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	166 self.filters.append(WhitespaceFilter(self._PRESERVE_SPACE))
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	167 self.filters.append(NamespaceFlattener(prefixes=namespace_prefixes))
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	168
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	169 def __call__(self, stream):
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	170 have_decl = have_doctype = False
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	171 in_cdata = False
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	172
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	173 stream = chain(self.preamble, stream)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	174 for filter_ in self.filters:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	175 stream = filter_(stream)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	176 for kind, data, pos in stream:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	177
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	178 if kind is START or kind is EMPTY:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	179 tag, attrib = data
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	180 buf = ['<', tag]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	181 for attr, value in attrib:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	182 buf += [' ', attr, '="', escape(value), '"']
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	183 buf.append(kind is EMPTY and '/>' or '>')
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	184 yield Markup(u''.join(buf))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	185
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	186 elif kind is END:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	187 yield Markup('</%s>' % data)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	188
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	189 elif kind is TEXT:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	190 if in_cdata:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	191 yield data
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	192 else:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	193 yield escape(data, quotes=False)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	194
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	195 elif kind is COMMENT:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	196 yield Markup('<!--%s-->' % data)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	197
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	198 elif kind is XML_DECL and not have_decl:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	199 version, encoding, standalone = data
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	200 buf = ['<?xml version="%s"' % version]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	201 if encoding:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	202 buf.append(' encoding="%s"' % encoding)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	203 if standalone != -1:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	204 standalone = standalone and 'yes' or 'no'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	205 buf.append(' standalone="%s"' % standalone)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	206 buf.append('?>\n')
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	207 yield Markup(u''.join(buf))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	208 have_decl = True
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	209
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	210 elif kind is DOCTYPE and not have_doctype:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	211 name, pubid, sysid = data
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	212 buf = ['<!DOCTYPE %s']
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	213 if pubid:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	214 buf.append(' PUBLIC "%s"')
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	215 elif sysid:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	216 buf.append(' SYSTEM')
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	217 if sysid:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	218 buf.append(' "%s"')
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	219 buf.append('>\n')
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	220 yield Markup(u''.join(buf), *filter(None, data))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	221 have_doctype = True
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	222
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	223 elif kind is START_CDATA:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	224 yield Markup('<![CDATA[')
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	225 in_cdata = True
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	226
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	227 elif kind is END_CDATA:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	228 yield Markup(']]>')
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	229 in_cdata = False
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	230
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	231 elif kind is PI:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	232 yield Markup('<?%s %s?>' % data)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	233
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	234
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	235 class XHTMLSerializer(XMLSerializer):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	236 """Produces XHTML text from an event stream.
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	237
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	238 >>> from genshi.builder import tag
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	239 >>> elem = tag.div(tag.a(href='foo'), tag.br, tag.hr(noshade=True))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	240 >>> print ''.join(XHTMLSerializer()(elem.generate()))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	241 <div><a href="foo"></a><br /><hr noshade="noshade" /></div>
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	242 """
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	243
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	244 _EMPTY_ELEMS = frozenset(['area', 'base', 'basefont', 'br', 'col', 'frame',
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	245 'hr', 'img', 'input', 'isindex', 'link', 'meta',
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	246 'param'])
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	247 _BOOLEAN_ATTRS = frozenset(['selected', 'checked', 'compact', 'declare',
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	248 'defer', 'disabled', 'ismap', 'multiple',
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	249 'nohref', 'noresize', 'noshade', 'nowrap'])
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	250 _PRESERVE_SPACE = frozenset([
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	251 QName('pre'), QName('http://www.w3.org/1999/xhtml}pre'),
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	252 QName('textarea'), QName('http://www.w3.org/1999/xhtml}textarea')
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	253 ])
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	254
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	255 def __init__(self, doctype=None, strip_whitespace=True,
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	256 namespace_prefixes=None):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	257 super(XHTMLSerializer, self).__init__(doctype, False)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	258 self.filters = [EmptyTagFilter()]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	259 if strip_whitespace:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	260 self.filters.append(WhitespaceFilter(self._PRESERVE_SPACE))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	261 namespace_prefixes = namespace_prefixes or {}
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	262 namespace_prefixes['http://www.w3.org/1999/xhtml'] = ''
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	263 self.filters.append(NamespaceFlattener(prefixes=namespace_prefixes))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	264
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	265 def __call__(self, stream):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	266 boolean_attrs = self._BOOLEAN_ATTRS
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	267 empty_elems = self._EMPTY_ELEMS
143 ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	268 have_doctype = False
ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	269 in_cdata = False
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	270
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	271 stream = chain(self.preamble, stream)
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	272 for filter_ in self.filters:
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	273 stream = filter_(stream)
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	274 for kind, data, pos in stream:
821114ec4f69 Initial import. cmlenz parents: diff changeset	275
212 e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	276 if kind is START or kind is EMPTY:
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	277 tag, attrib = data
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	278 buf = ['<', tag]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	279 for attr, value in attrib:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	280 if attr in boolean_attrs:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	281 value = attr
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	282 buf += [' ', attr, '="', escape(value), '"']
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	283 if kind is EMPTY:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	284 if tag in empty_elems:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	285 buf.append(' />')
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	286 else:
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	287 buf.append('></%s>' % tag)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	288 else:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	289 buf.append('>')
398 49aa525b8f83 inline branch: Merged [480:486/trunk]. cmlenz parents: 347 diff changeset	290 yield Markup(u''.join(buf))
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	291
69 e9a3930f8823 A couple of minor performance improvements. cmlenz parents: 66 diff changeset	292 elif kind is END:
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	293 yield Markup('</%s>' % data)
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	294
69 e9a3930f8823 A couple of minor performance improvements. cmlenz parents: 66 diff changeset	295 elif kind is TEXT:
143 ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	296 if in_cdata:
ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	297 yield data
ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	298 else:
ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	299 yield escape(data, quotes=False)
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	300
89 d4c7617900e3 Support comments in templates that are not included in the output, in the same way Kid does: if the comment text starts with a `!` character, it is stripped from the output. cmlenz parents: 85 diff changeset	301 elif kind is COMMENT:
d4c7617900e3 Support comments in templates that are not included in the output, in the same way Kid does: if the comment text starts with a `!` character, it is stripped from the output. cmlenz parents: 85 diff changeset	302 yield Markup('<!--%s-->' % data)
d4c7617900e3 Support comments in templates that are not included in the output, in the same way Kid does: if the comment text starts with a `!` character, it is stripped from the output. cmlenz parents: 85 diff changeset	303
136 636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	304 elif kind is DOCTYPE and not have_doctype:
636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	305 name, pubid, sysid = data
636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	306 buf = ['<!DOCTYPE %s']
636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	307 if pubid:
398 49aa525b8f83 inline branch: Merged [480:486/trunk]. cmlenz parents: 347 diff changeset	308 buf.append(' PUBLIC "%s"')
136 636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	309 elif sysid:
398 49aa525b8f83 inline branch: Merged [480:486/trunk]. cmlenz parents: 347 diff changeset	310 buf.append(' SYSTEM')
136 636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	311 if sysid:
398 49aa525b8f83 inline branch: Merged [480:486/trunk]. cmlenz parents: 347 diff changeset	312 buf.append(' "%s"')
49aa525b8f83 inline branch: Merged [480:486/trunk]. cmlenz parents: 347 diff changeset	313 buf.append('>\n')
49aa525b8f83 inline branch: Merged [480:486/trunk]. cmlenz parents: 347 diff changeset	314 yield Markup(u''.join(buf), *filter(None, data))
136 636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	315 have_doctype = True
109 2de3f9d84a1c Reorder the conditional branches in the serializers so that the more common event kinds are on top. cmlenz parents: 105 diff changeset	316
143 ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	317 elif kind is START_CDATA:
ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	318 yield Markup('<![CDATA[')
ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	319 in_cdata = True
ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	320
ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	321 elif kind is END_CDATA:
ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	322 yield Markup(']]>')
ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	323 in_cdata = False
ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	324
105 334a338847af Include processing instructions in serialized streams. cmlenz parents: 96 diff changeset	325 elif kind is PI:
334a338847af Include processing instructions in serialized streams. cmlenz parents: 96 diff changeset	326 yield Markup('<?%s %s?>' % data)
334a338847af Include processing instructions in serialized streams. cmlenz parents: 96 diff changeset	327
96 35d681a94763 Add an XHTML serialization method. Now really need to get rid of some code duplication in the `markup.output` module. cmlenz parents: 89 diff changeset	328
35d681a94763 Add an XHTML serialization method. Now really need to get rid of some code duplication in the `markup.output` module. cmlenz parents: 89 diff changeset	329 class HTMLSerializer(XHTMLSerializer):
35d681a94763 Add an XHTML serialization method. Now really need to get rid of some code duplication in the `markup.output` module. cmlenz parents: 89 diff changeset	330 """Produces HTML text from an event stream.
35d681a94763 Add an XHTML serialization method. Now really need to get rid of some code duplication in the `markup.output` module. cmlenz parents: 89 diff changeset	331
230 24757b771651 Renamed Markup to Genshi in repository. cmlenz parents: 219 diff changeset	332 >>> from genshi.builder import tag
96 35d681a94763 Add an XHTML serialization method. Now really need to get rid of some code duplication in the `markup.output` module. cmlenz parents: 89 diff changeset	333 >>> elem = tag.div(tag.a(href='foo'), tag.br, tag.hr(noshade=True))
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	334 >>> print ''.join(HTMLSerializer()(elem.generate()))
96 35d681a94763 Add an XHTML serialization method. Now really need to get rid of some code duplication in the `markup.output` module. cmlenz parents: 89 diff changeset	335 <div><a href="foo"></a><br><hr noshade></div>
35d681a94763 Add an XHTML serialization method. Now really need to get rid of some code duplication in the `markup.output` module. cmlenz parents: 89 diff changeset	336 """
35d681a94763 Add an XHTML serialization method. Now really need to get rid of some code duplication in the `markup.output` module. cmlenz parents: 89 diff changeset	337
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	338 _NOESCAPE_ELEMS = frozenset([
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	339 QName('script'), QName('http://www.w3.org/1999/xhtml}script'),
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	340 QName('style'), QName('http://www.w3.org/1999/xhtml}style')
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	341 ])
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	342
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	343 def __init__(self, doctype=None, strip_whitespace=True):
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	344 """Initialize the HTML serializer.
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	345
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	346 :param doctype: a ``(name, pubid, sysid)`` tuple that represents the
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	347 DOCTYPE declaration that should be included at the top
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	348 of the generated output
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	349 :param strip_whitespace: whether extraneous whitespace should be
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	350 stripped from the output
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	351 """
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	352 super(HTMLSerializer, self).__init__(doctype, False)
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	353 self.filters = [EmptyTagFilter()]
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	354 if strip_whitespace:
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	355 self.filters.append(WhitespaceFilter(self._PRESERVE_SPACE,
305 6e6950ac0e56 Various performance-oriented tweaks. cmlenz parents: 280 diff changeset	356 self._NOESCAPE_ELEMS))
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	357 self.filters.append(NamespaceStripper('http://www.w3.org/1999/xhtml'))
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	358
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	359 def __call__(self, stream):
136 636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	360 boolean_attrs = self._BOOLEAN_ATTRS
636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	361 empty_elems = self._EMPTY_ELEMS
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	362 noescape_elems = self._NOESCAPE_ELEMS
96 35d681a94763 Add an XHTML serialization method. Now really need to get rid of some code duplication in the `markup.output` module. cmlenz parents: 89 diff changeset	363 have_doctype = False
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	364 noescape = False
96 35d681a94763 Add an XHTML serialization method. Now really need to get rid of some code duplication in the `markup.output` module. cmlenz parents: 89 diff changeset	365
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	366 stream = chain(self.preamble, stream)
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	367 for filter_ in self.filters:
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	368 stream = filter_(stream)
96 35d681a94763 Add an XHTML serialization method. Now really need to get rid of some code duplication in the `markup.output` module. cmlenz parents: 89 diff changeset	369 for kind, data, pos in stream:
35d681a94763 Add an XHTML serialization method. Now really need to get rid of some code duplication in the `markup.output` module. cmlenz parents: 89 diff changeset	370
212 e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	371 if kind is START or kind is EMPTY:
96 35d681a94763 Add an XHTML serialization method. Now really need to get rid of some code duplication in the `markup.output` module. cmlenz parents: 89 diff changeset	372 tag, attrib = data
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	373 buf = ['<', tag]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	374 for attr, value in attrib:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	375 if attr in boolean_attrs:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	376 if value:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	377 buf += [' ', attr]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	378 else:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	379 buf += [' ', attr, '="', escape(value), '"']
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	380 buf.append('>')
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	381 if kind is EMPTY:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	382 if tag not in empty_elems:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	383 buf.append('</%s>' % tag)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	384 yield Markup(u''.join(buf))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	385 if tag in noescape_elems:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	386 noescape = True
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	387
69 e9a3930f8823 A couple of minor performance improvements. cmlenz parents: 66 diff changeset	388 elif kind is END:
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	389 yield Markup('</%s>' % data)
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	390 noescape = False
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	391
69 e9a3930f8823 A couple of minor performance improvements. cmlenz parents: 66 diff changeset	392 elif kind is TEXT:
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	393 if noescape:
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	394 yield data
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	395 else:
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	396 yield escape(data, quotes=False)
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	397
89 d4c7617900e3 Support comments in templates that are not included in the output, in the same way Kid does: if the comment text starts with a `!` character, it is stripped from the output. cmlenz parents: 85 diff changeset	398 elif kind is COMMENT:
d4c7617900e3 Support comments in templates that are not included in the output, in the same way Kid does: if the comment text starts with a `!` character, it is stripped from the output. cmlenz parents: 85 diff changeset	399 yield Markup('<!--%s-->' % data)
d4c7617900e3 Support comments in templates that are not included in the output, in the same way Kid does: if the comment text starts with a `!` character, it is stripped from the output. cmlenz parents: 85 diff changeset	400
136 636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	401 elif kind is DOCTYPE and not have_doctype:
636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	402 name, pubid, sysid = data
636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	403 buf = ['<!DOCTYPE %s']
636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	404 if pubid:
398 49aa525b8f83 inline branch: Merged [480:486/trunk]. cmlenz parents: 347 diff changeset	405 buf.append(' PUBLIC "%s"')
136 636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	406 elif sysid:
398 49aa525b8f83 inline branch: Merged [480:486/trunk]. cmlenz parents: 347 diff changeset	407 buf.append(' SYSTEM')
136 636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	408 if sysid:
398 49aa525b8f83 inline branch: Merged [480:486/trunk]. cmlenz parents: 347 diff changeset	409 buf.append(' "%s"')
49aa525b8f83 inline branch: Merged [480:486/trunk]. cmlenz parents: 347 diff changeset	410 buf.append('>\n')
49aa525b8f83 inline branch: Merged [480:486/trunk]. cmlenz parents: 347 diff changeset	411 yield Markup(u''.join(buf), *filter(None, data))
136 636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	412 have_doctype = True
109 2de3f9d84a1c Reorder the conditional branches in the serializers so that the more common event kinds are on top. cmlenz parents: 105 diff changeset	413
105 334a338847af Include processing instructions in serialized streams. cmlenz parents: 96 diff changeset	414 elif kind is PI:
334a338847af Include processing instructions in serialized streams. cmlenz parents: 96 diff changeset	415 yield Markup('<?%s %s?>' % data)
334a338847af Include processing instructions in serialized streams. cmlenz parents: 96 diff changeset	416
1 821114ec4f69 Initial import. cmlenz parents: diff changeset	417
200 50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	418 class TextSerializer(object):
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	419 """Produces plain text from an event stream.
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	420
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	421 Only text events are included in the output. Unlike the other serializer,
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	422 special XML characters are not escaped:
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	423
230 24757b771651 Renamed Markup to Genshi in repository. cmlenz parents: 219 diff changeset	424 >>> from genshi.builder import tag
200 50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	425 >>> elem = tag.div(tag.a('<Hello!>', href='foo'), tag.br)
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	426 >>> print elem
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	427 <div><a href="foo"><Hello!></a><br/></div>
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	428 >>> print ''.join(TextSerializer()(elem.generate()))
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	429 <Hello!>
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	430
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	431 If text events contain literal markup (instances of the `Markup` class),
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	432 tags or entities are stripped from the output:
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	433
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	434 >>> elem = tag.div(Markup('<a href="foo">Hello!</a><br/>'))
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	435 >>> print elem
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	436 <div><a href="foo">Hello!</a><br/></div>
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	437 >>> print ''.join(TextSerializer()(elem.generate()))
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	438 Hello!
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	439 """
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	440
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	441 def __call__(self, stream):
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	442 for event in stream:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	443 if event[0] is TEXT:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	444 data = event[1]
200 50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	445 if type(data) is Markup:
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	446 data = data.striptags().stripentities()
201 0f16c907077e The `TextSerializer` should produce `unicode` objects, not `Markup` objects. cmlenz parents: 200 diff changeset	447 yield unicode(data)
200 50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	448
50eab0469148 Add serialization to plain text, based on cboos' patch. Closes #41. cmlenz parents: 178 diff changeset	449
212 e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	450 class EmptyTagFilter(object):
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	451 """Combines `START` and `STOP` events into `EMPTY` events for elements that
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	452 have no contents.
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	453 """
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	454
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	455 EMPTY = StreamEventKind('EMPTY')
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	456
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	457 def __call__(self, stream):
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	458 prev = (None, None, None)
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	459 for ev in stream:
212 e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	460 if prev[0] is START:
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	461 if ev[0] is END:
212 e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	462 prev = EMPTY, prev[1], prev[2]
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	463 yield prev
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	464 continue
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	465 else:
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	466 yield prev
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	467 if ev[0] is not START:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	468 yield ev
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	469 prev = ev
212 e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	470
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	471
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	472 EMPTY = EmptyTagFilter.EMPTY
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	473
e8c43127d9a9 Refactored the handling of empty tags in the serializer: use an `EmptyTagFilter` that combines adjacent start/end events, instead of the generic pushback-iterator. cmlenz parents: 201 diff changeset	474
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	475 class NamespaceFlattener(object):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	476 r"""Output stream filter that removes namespace information from the stream,
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	477 instead adding namespace attributes and prefixes as needed.
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	478
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	479 :param prefixes: optional mapping of namespace URIs to prefixes
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	480
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	481 >>> from genshi.input import XML
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	482 >>> xml = XML('''<doc xmlns="NS1" xmlns:two="NS2">
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	483 ... <two:item/>
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	484 ... </doc>''')
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	485 >>> for kind, data, pos in NamespaceFlattener()(xml):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	486 ... print kind, repr(data)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	487 START (u'doc', Attrs([(u'xmlns', u'NS1'), (u'xmlns:two', u'NS2')]))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	488 TEXT u'\n '
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	489 START (u'two:item', Attrs())
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	490 END u'two:item'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	491 TEXT u'\n'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	492 END u'doc'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	493 """
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	494
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	495 def __init__(self, prefixes=None):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	496 self.prefixes = {XML_NAMESPACE.uri: 'xml'}
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	497 if prefixes is not None:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	498 self.prefixes.update(prefixes)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	499
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	500 def __call__(self, stream):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	501 prefixes = dict([(v, [k]) for k, v in self.prefixes.items()])
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	502 namespaces = {XML_NAMESPACE.uri: ['xml']}
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	503 def _push_ns(prefix, uri):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	504 namespaces.setdefault(uri, []).append(prefix)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	505 prefixes.setdefault(prefix, []).append(uri)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	506
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	507 ns_attrs = []
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	508 _push_ns_attr = ns_attrs.append
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	509 def _make_ns_attr(prefix, uri):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	510 return u'xmlns%s' % (prefix and ':%s' % prefix or ''), uri
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	511
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	512 def _gen_prefix():
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	513 val = 0
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	514 while 1:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	515 val += 1
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	516 yield 'ns%d' % val
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	517 _gen_prefix = _gen_prefix().next
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	518
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	519 for kind, data, pos in stream:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	520
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	521 if kind is START or kind is EMPTY:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	522 tag, attrs = data
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	523
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	524 tagname = tag.localname
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	525 tagns = tag.namespace
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	526 if tagns:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	527 if tagns in namespaces:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	528 prefix = namespaces[tagns][-1]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	529 if prefix:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	530 tagname = u'%s:%s' % (prefix, tagname)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	531 else:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	532 _push_ns_attr((u'xmlns', tagns))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	533 _push_ns('', tagns)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	534
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	535 new_attrs = []
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	536 for attr, value in attrs:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	537 attrname = attr.localname
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	538 attrns = attr.namespace
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	539 if attrns:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	540 if attrns not in namespaces:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	541 prefix = _gen_prefix()
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	542 _push_ns(prefix, attrns)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	543 _push_ns_attr(('xmlns:%s' % prefix, attrns))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	544 else:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	545 prefix = namespaces[attrns][-1]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	546 if prefix:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	547 attrname = u'%s:%s' % (prefix, attrname)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	548 new_attrs.append((attrname, value))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	549
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	550 yield kind, (tagname, Attrs(ns_attrs + new_attrs)), pos
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	551 del ns_attrs[:]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	552
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	553 elif kind is END:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	554 tagname = data.localname
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	555 tagns = data.namespace
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	556 if tagns:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	557 prefix = namespaces[tagns][-1]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	558 if prefix:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	559 tagname = u'%s:%s' % (prefix, tagname)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	560 yield kind, tagname, pos
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	561
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	562 elif kind is START_NS:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	563 prefix, uri = data
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	564 if uri not in namespaces:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	565 prefix = prefixes.get(uri, [prefix])[-1]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	566 _push_ns_attr(_make_ns_attr(prefix, uri))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	567 _push_ns(prefix, uri)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	568
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	569 elif kind is END_NS:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	570 if data in prefixes:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	571 uris = prefixes.get(data)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	572 uri = uris.pop()
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	573 if not uris:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	574 del prefixes[data]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	575 if uri not in uris or uri != uris[-1]:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	576 uri_prefixes = namespaces[uri]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	577 uri_prefixes.pop()
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	578 if not uri_prefixes:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	579 del namespaces[uri]
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	580 if ns_attrs:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	581 attr = _make_ns_attr(data, uri)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	582 if attr in ns_attrs:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	583 ns_attrs.remove(attr)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	584
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	585 else:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	586 yield kind, data, pos
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	587
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	588
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	589 class NamespaceStripper(object):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	590 r"""Stream filter that removes all namespace information from a stream, and
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	591 optionally strips out all tags not in a given namespace.
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	592
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	593 :param namespace: the URI of the namespace that should not be stripped. If
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	594 not set, only elements with no namespace are included in
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	595 the output.
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	596
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	597 >>> from genshi.input import XML
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	598 >>> xml = XML('''<doc xmlns="NS1" xmlns:two="NS2">
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	599 ... <two:item/>
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	600 ... </doc>''')
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	601 >>> for kind, data, pos in NamespaceStripper(Namespace('NS1'))(xml):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	602 ... print kind, repr(data)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	603 START (u'doc', Attrs())
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	604 TEXT u'\n '
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	605 TEXT u'\n'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	606 END u'doc'
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	607 """
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	608
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	609 def __init__(self, namespace=None):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	610 if namespace is not None:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	611 self.namespace = Namespace(namespace)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	612 else:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	613 self.namespace = {}
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	614
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	615 def __call__(self, stream):
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	616 namespace = self.namespace
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	617
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	618 for kind, data, pos in stream:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	619
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	620 if kind is START or kind is EMPTY:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	621 tag, attrs = data
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	622 if tag.namespace and tag not in namespace:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	623 continue
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	624
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	625 new_attrs = []
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	626 for attr, value in attrs:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	627 if not attr.namespace or attr in namespace:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	628 new_attrs.append((attr, value))
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	629
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	630 data = tag.localname, Attrs(new_attrs)
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	631
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	632 elif kind is END:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	633 if data.namespace and data not in namespace:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	634 continue
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	635 data = data.localname
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	636
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	637 elif kind is START_NS or kind is END_NS:
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	638 continue
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	639
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	640 yield kind, data, pos
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	641
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	642
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	643 class WhitespaceFilter(object):
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	644 """A filter that removes extraneous ignorable white space from the
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	645 stream.
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	646 """
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	647
305 6e6950ac0e56 Various performance-oriented tweaks. cmlenz parents: 280 diff changeset	648 def __init__(self, preserve=None, noescape=None):
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	649 """Initialize the filter.
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	650
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	651 :param preserve: a set or sequence of tag names for which white-space
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	652 should be preserved
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	653 :param noescape: a set or sequence of tag names for which text content
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	654 should not be escaped
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	655
347 c0a4114786cc cspeedups branch: Merged [423:426/trunk]. cmlenz parents: 305 diff changeset	656 The `noescape` set is expected to refer to elements that cannot contain
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	657 further child elements (such as ``<style>`` or ``<script>`` in HTML
0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	658 documents).
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	659 """
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	660 if preserve is None:
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	661 preserve = []
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	662 self.preserve = frozenset(preserve)
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	663 if noescape is None:
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	664 noescape = []
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	665 self.noescape = frozenset(noescape)
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	666
219 0f897d319002 Minor improvements to `WhitespaceFilter`. cmlenz parents: 213 diff changeset	667 def __call__(self, stream, ctxt=None, space=XML_NAMESPACE['space'],
0f897d319002 Minor improvements to `WhitespaceFilter`. cmlenz parents: 213 diff changeset	668 trim_trailing_space=re.compile('[ \t]+(?=\n)').sub,
0f897d319002 Minor improvements to `WhitespaceFilter`. cmlenz parents: 213 diff changeset	669 collapse_lines=re.compile('\n{2,}').sub):
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	670 mjoin = Markup('').join
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	671 preserve_elems = self.preserve
347 c0a4114786cc cspeedups branch: Merged [423:426/trunk]. cmlenz parents: 305 diff changeset	672 preserve = 0
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	673 noescape_elems = self.noescape
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	674 noescape = False
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	675
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	676 textbuf = []
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	677 push_text = textbuf.append
136 636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	678 pop_text = textbuf.pop
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	679 for kind, data, pos in chain(stream, [(None, None, None)]):
500 0742f421caba Merged revisions 487-603 via svnmerge from cmlenz parents: 398 diff changeset	680
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	681 if kind is TEXT:
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	682 if noescape:
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	683 data = Markup(data)
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	684 push_text(data)
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	685 else:
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	686 if textbuf:
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	687 if len(textbuf) > 1:
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	688 text = mjoin(textbuf, escape_quotes=False)
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	689 del textbuf[:]
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	690 else:
136 636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	691 text = escape(pop_text(), quotes=False)
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	692 if not preserve:
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	693 text = collapse_lines('\n', trim_trailing_space('', text))
93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	694 yield TEXT, Markup(text), pos
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	695
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	696 if kind is START:
347 c0a4114786cc cspeedups branch: Merged [423:426/trunk]. cmlenz parents: 305 diff changeset	697 tag, attrs = data
c0a4114786cc cspeedups branch: Merged [423:426/trunk]. cmlenz parents: 305 diff changeset	698 if preserve or (tag in preserve_elems or
c0a4114786cc cspeedups branch: Merged [423:426/trunk]. cmlenz parents: 305 diff changeset	699 attrs.get(space) == 'preserve'):
c0a4114786cc cspeedups branch: Merged [423:426/trunk]. cmlenz parents: 305 diff changeset	700 preserve += 1
219 0f897d319002 Minor improvements to `WhitespaceFilter`. cmlenz parents: 213 diff changeset	701 if not noescape and tag in noescape_elems:
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	702 noescape = True
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	703
b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	704 elif kind is END:
347 c0a4114786cc cspeedups branch: Merged [423:426/trunk]. cmlenz parents: 305 diff changeset	705 noescape = False
c0a4114786cc cspeedups branch: Merged [423:426/trunk]. cmlenz parents: 305 diff changeset	706 if preserve:
c0a4114786cc cspeedups branch: Merged [423:426/trunk]. cmlenz parents: 305 diff changeset	707 preserve -= 1
141 b3ceaa35fb6b * No escaping of `<script>` or `<style>` tags in HTML output (see #24) cmlenz parents: 140 diff changeset	708
305 6e6950ac0e56 Various performance-oriented tweaks. cmlenz parents: 280 diff changeset	709 elif kind is START_CDATA:
143 ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	710 noescape = True
ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	711
305 6e6950ac0e56 Various performance-oriented tweaks. cmlenz parents: 280 diff changeset	712 elif kind is END_CDATA:
143 ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	713 noescape = False
ef761afcedff CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24. cmlenz parents: 141 diff changeset	714
136 636e0100fcaf Minor performance improvements in serialization. cmlenz parents: 123 diff changeset	715 if kind:
123 93bbdcf9428b Fix for #18: whitespace in space-sensitive elements such as `<pre>` and `<textarea>` is now preserved. cmlenz parents: 109 diff changeset	716 yield kind, data, pos

Mercurial > genshi > genshi-test

annotate genshi/output.py @ 500:0742f421caba experimental-inline