genshi/genshi-test: markup/output.py comparison

comparison markup/output.py @ 143:ef761afcedff

CDATA sections in XML input now appear as CDATA sections in the output. This should address the problem with escaping the contents of `<style>` and `<script>` elements, which would only get interpreted correctly if the output was served as `application/xhtml+xml`. Closes #24.

author	cmlenz
date	Fri, 11 Aug 2006 14:08:13 +0000
parents	b3ceaa35fb6b
children	56d534eb53f9

comparison

equal deleted inserted replaced

-:b49cc51999b9
+:ef761afcedff
 except NameError:
 from sets import ImmutableSet as frozenset
 import re
 from markup.core import escape, Markup, Namespace, QName, XML_NAMESPACE
-from markup.core import DOCTYPE, START, END, START_NS, END_NS, TEXT, COMMENT, PI
+from markup.core import DOCTYPE, START, END, START_NS, END_NS, TEXT, \
+START_CDATA, END_CDATA, PI, COMMENT
 __all__ = ['Serializer', 'XMLSerializer', 'HTMLSerializer']
 class DocType(object):
 self.filters = []
 if strip_whitespace:
 self.filters.append(WhitespaceFilter(self._PRESERVE_SPACE))
 def __call__(self, stream):
-have_doctype = False
 ns_attrib = []
 ns_mapping = {XML_NAMESPACE.uri: 'xml'}
+have_doctype = False
+in_cdata = False
 stream = chain(self.preamble, stream)
 for filter_ in self.filters:
 stream = filter_(stream)
 stream = _PushbackIterator(stream)
 if prefix:
 tagname = '%s:%s' % (prefix, tag.localname)
 yield Markup('</%s>' % tagname)
 elif kind is TEXT:
-yield escape(data, quotes=False)
+if in_cdata:
+yield data
+else:
+yield escape(data, quotes=False)
 elif kind is COMMENT:
 yield Markup('<!--%s-->' % data)
 elif kind is DOCTYPE and not have_doctype:
 if not prefix:
 ns_attrib.append((QName('xmlns'), uri))
 else:
 ns_attrib.append((QName('xmlns:%s' % prefix), uri))
+elif kind is START_CDATA:
+yield Markup('<![CDATA[')
+in_cdata = True
+elif kind is END_CDATA:
+yield Markup(']]>')
+in_cdata = False
 elif kind is PI:
 yield Markup('<?%s %s?>' % data)
 class XHTMLSerializer(XMLSerializer):
 ns_attrib = []
 ns_mapping = {XML_NAMESPACE.uri: 'xml'}
 boolean_attrs = self._BOOLEAN_ATTRS
 empty_elems = self._EMPTY_ELEMS
 have_doctype = False
+in_cdata = False
 stream = chain(self.preamble, stream)
 for filter_ in self.filters:
 stream = filter_(stream)
 stream = _PushbackIterator(stream)
 if prefix:
 tagname = '%s:%s' % (prefix, tag.localname)
 yield Markup('</%s>' % tagname)
 elif kind is TEXT:
-yield escape(data, quotes=False)
+if in_cdata:
+yield data
+else:
+yield escape(data, quotes=False)
 elif kind is COMMENT:
 yield Markup('<!--%s-->' % data)
 elif kind is DOCTYPE and not have_doctype:
 if not prefix:
 ns_attrib.append((QName('xmlns'), uri))
 else:
 ns_attrib.append((QName('xmlns:%s' % prefix), uri))
+elif kind is START_CDATA:
+yield Markup('<![CDATA[')
+in_cdata = True
+elif kind is END_CDATA:
+yield Markup(']]>')
+in_cdata = False
 elif kind is PI:
 yield Markup('<?%s %s?>' % data)
 class HTMLSerializer(XHTMLSerializer):
 stripped from the output
 """
 super(HTMLSerializer, self).__init__(doctype, False)
 if strip_whitespace:
 self.filters.append(WhitespaceFilter(self._PRESERVE_SPACE,
-self._NOESCAPE_ELEMS))
+self._NOESCAPE_ELEMS, True))
 def __call__(self, stream):
 namespace = self.NAMESPACE
 ns_mapping = {}
 boolean_attrs = self._BOOLEAN_ATTRS
 _TRAILING_SPACE = re.compile('[ \t]+(?=\n)')
 _LINE_COLLAPSE = re.compile('\n{2,}')
 _XML_SPACE = XML_NAMESPACE['space']
-def __init__(self, preserve=None, noescape=None):
+def __init__(self, preserve=None, noescape=None, escape_cdata=False):
 """Initialize the filter.
 @param preserve: a set or sequence of tag names for which white-space
 should be ignored.
 @param noescape: a set or sequence of tag names for which text content
 preserve = []
 self.preserve = frozenset(preserve)
 if noescape is None:
 noescape = []
 self.noescape = frozenset(noescape)
+self.escape_cdata = escape_cdata
 def __call__(self, stream, ctxt=None):
 trim_trailing_space = self._TRAILING_SPACE.sub
 collapse_lines = self._LINE_COLLAPSE.sub
 xml_space = self._XML_SPACE
 mjoin = Markup('').join
 preserve_elems = self.preserve
 preserve = False
 noescape_elems = self.noescape
 noescape = False
+escape_cdata = self.escape_cdata
 textbuf = []
 push_text = textbuf.append
 pop_text = textbuf.pop
 for kind, data, pos in chain(stream, [(None, None, None)]):
 noescape = True
 elif kind is END:
 preserve = noescape = False
+elif kind is START_CDATA and not escape_cdata:
+noescape = True
+elif kind is END_CDATA and not escape_cdata:
+noescape = False
 if kind:
 yield kind, data, pos
 class _PushbackIterator(object):

Mercurial > genshi > genshi-test

comparison markup/output.py @ 143:ef761afcedff