Bump revision for 4.0 release
[geekigeeki.git] / geekigeeki.py
index d208bb723fa672890c99155a6791d93d921c29da..71920f370b9dd74f6c0df8b057bf308a404fa9f0 100755 (executable)
@@ -1,4 +1,4 @@
-#!/usr/bin/python3.0
+#!/usr/bin/python
 # -*- coding: utf-8 -*-
 #
 # Copyright 1999, 2000 Martin Pool <mbp@humbug.org.au>
 # You should have received a copy of the GNU General Public License
 # along with this program.  If not, see <http://www.gnu.org/licenses/>.
 
-__version__ = '$Id$'[4:12]
+__version__ = '4.0-' + '$Id$'[4:11]
 
 from time import clock
 start_time = clock()
+title_done = False
 
 import cgi, sys, os, re, errno, stat
 
-# Regular expression defining a WikiWord
-# (but this definition is also assumed in other places)
-word_re = re.compile(r"^\b((([A-Z][a-z0-9]+){2,}/)*([A-Z][a-z0-9]+){2,})\b$")
+image_ext = 'png|gif|jpg|jpeg|bmp|ico'
+video_ext = "ogg|ogv|oga" # Not supported by Firefox 3.5: mkv|mpg|mpeg|mp4|avi|asf|flv|wmv|qt
+image_re = re.compile(r".*\.(" + image_ext + "|" +  video_ext + ")", re.IGNORECASE)
+video_re = re.compile(r".*\.(" + video_ext + ")", re.IGNORECASE)
 # FIXME: we accept stuff like foo/../bar and we shouldn't
-file_re = re.compile(r"^\b([A-Za-z0-9_\-][A-Za-z0-9_\.\-/]*)\b$")
-img_re = re.compile(r"^.*\.(png|gif|jpg|jpeg|bmp|ico|ogm|ogg|mkv|mpg|mpeg|mp4|avi|asf|flv|wmv|qt)$", re.IGNORECASE)
-video_re = re.compile(r"^.*\.(ogm|ogg|mkv|mpg|mpeg|mp4|avi|asf|flv|wmv|qt)$", re.IGNORECASE)
-url_re = re.compile(r"^[a-z]{3,8}://[^\s'\"]+\S$")
-link_re = re.compile(r"(?:\[\[|{{)([^\s\|]+)(?:\s*\|\s*([^\]]+)|)(?:\]\]|}})")
-ext_re = re.compile(r"\.([^\./]+)$")
-
-title_done = False
+file_re  = re.compile(r"([A-Za-z0-9_\-][A-Za-z0-9_\.\-/]*)")
+url_re   = re.compile(r"[a-z]{3,8}://[^\s'\"]+\S")
+ext_re   = re.compile(r"\.([^\./]+)$")
 
 # CGI stuff ---------------------------------------------------------
 def script_name():
@@ -83,6 +80,30 @@ def relative_url(pathname, privileged=False):
 def permalink(s):
     return re.sub(' ', '-', re.sub('[^a-z0-9_ ]', '', s.lower()).strip())
 
+def humanlink(s):
+    return re.sub(r'(?:.*[/:]|)([^:/\.]+)(?:\.[^/:]+|)$', r'\1', s.replace('_', ' '))
+
+# Split arg lists like "blah| blah blah| width=100 | align = center",
+# return a list containing anonymous arguments and a map containing the named arguments
+def parse_args(s):
+    args = []
+    kwargs = {} 
+    for arg in s.strip('<[{}]>').split('|'):
+        m = re.match('\s*(\w+)\s*=\s*(.+)\s*', arg)
+        if m is not None:
+            kwargs[m.group(1)] = m.group(2)
+        else:
+            args.append(arg.strip())
+    return (args, kwargs)
+
+def url_args(kvargs):
+    argv = []
+    for k, v in kvargs.items():
+        argv.append(k + '=' + v)
+    if argv:
+        return '?' + '&amp;'.join(argv)
+    return ''
+
 # Formatting stuff --------------------------------------------------
 def emit_header(mime_type="text/html"):
     print("Content-type: " + mime_type + "; charset=utf-8\n")
@@ -123,7 +144,7 @@ def send_title(name, text="Limbo", msg_text=None, msg_type='error', writable=Fal
 
     if name and writable and privileged_url is not None:
         print(' <link rel="alternate" type="application/x-wiki" title="Edit this page" href="%s" />' \
-            % (privileged_path() + '?edit=' + name))
+            % (privileged_path() + '?a=edit&q=' + name))
 
     if history_url is not None:
         print(' <link rel="alternate" type="application/rss+xml" title="RSS" href="%s" />' \
@@ -133,7 +154,7 @@ def send_title(name, text="Limbo", msg_text=None, msg_type='error', writable=Fal
 
     # Body
     if name and writable and privileged_url is not None:
-        print('<body ondblclick="location.href=\'' + privileged_path() + '?edit=' + name + '\'">')
+        print('<body ondblclick="location.href=\'' + privileged_path() + '?a=edit&q=' + name + '\'">')
     else:
         print('<body>')
 
@@ -142,24 +163,24 @@ def send_title(name, text="Limbo", msg_text=None, msg_type='error', writable=Fal
 
     # Navbar
     print('<div class="nav">')
-    print link_tag('FrontPage', site_icon or 'Home', 'navlink')
+    print link_tag('FrontPage', site_icon or 'Home', cssclass='navlink')
     if name:
-        print('  <b>' + link_tag('?fullsearch=' + name, text, 'navlink') + '</b> ')
+        print('  <b>' + link_tag('?fullsearch=' + name, text, cssclass='navlink') + '</b> ')
     else:
         print('  <b>' + text + '</b> ')
-    print(' | ' + link_tag('FindPage', 'Find Page', 'navlink'))
+    print(' | ' + link_tag('FindPage', 'Find Page', cssclass='navlink'))
     if 'history_url' in globals():
         print(' | <a href="' + relative_url(history_url) + '" class="navlink">Recent Changes</a>')
         if name:
             print(' | <a href="' + relative_url(history_url + '?a=history;f=' + name) + '" class="navlink">Page History</a>')
 
     if name:
-        print(' | ' + link_tag('?raw=' + name, 'Raw Text', 'navlink'))
+        print(' | ' + link_tag(name + '?a=raw', 'Raw Text', cssclass='navlink'))
         if privileged_url is not None:
             if writable:
-                print(' | ' + link_tag('?edit=' + name, 'Edit', 'navlink', privileged=True))
+                print(' | ' + link_tag('?a=edit&q=' + name, 'Edit', cssclass='navlink', privileged=True))
             else:
-                print(' | ' + link_tag(name, 'Login', 'navlink', privileged=True))
+                print(' | ' + link_tag(name, 'Login', cssclass='navlink', privileged=True))
 
     else:
         print(' | <i>Immutable Page</i>')
@@ -175,35 +196,36 @@ def send_httperror(status="403 Not Found", query=""):
     send_title(None, msg_text=("%s: on query '%s'" % (status, query)))
     send_footer()
 
-def link_tag(params, text=None, link_class=None, privileged=False):
+def link_tag(dest, text=None, privileged=False, **kvargs):
     if text is None:
-        text = params # default
-    elif img_re.match(text):
+        text = humanlink(dest)
+    elif image_re.match(text):
         text = '<img border="0" src="' + relative_url(text) + '" alt="' + text + '" />'
 
+    link_class = kvargs.get('class', kvargs.get('cssclass', None))
     if not link_class:
-        if is_external_url(params):
+        if is_external_url(dest):
             link_class = 'external'
-        elif file_re.match(params) and Page(params).exists():
+        elif file_re.match(dest) and Page(dest).exists():
             link_class = 'wikilink'
         else:
-            params = nonexist_pfx + params
+            text = nonexist_pfx + text
             link_class = 'nonexistent'
 
-    classattr = 'class="%s" ' % link_class
     # Prevent crawlers from following links potentially added by spammers or to generated pages
+    nofollow = ''
     if link_class == 'external' or link_class == 'navlink':
-        classattr += 'rel="nofollow"'
+        nofollow = 'rel="nofollow" '
 
-    return '<a %shref="%s">%s</a>' % (classattr, relative_url(params, privileged=privileged), text)
+    return '<a class="%s" %shref="%s">%s</a>' % (link_class, nofollow, relative_url(dest, privileged=privileged), text)
 
-def link_inline(name, descr=None, args=''):
-    if not descr: descr = name
+def link_inline(name, descr=None, kvargs={}):
+    if not descr: descr = humanlink(name)
     url = relative_url(name)
     if video_re.match(name):
-        return '<video src="%s">Your browser does not support the HTML5 video tag</video>' % url
-    elif img_re.match(name):
-        return '<a href="%s"><img border="0" src="%s" alt="%s" /></a>' % (url, url + args, descr)
+        return '<video controls="1" src="%s">Your browser does not support the HTML5 video tag</video>' % url
+    elif image_re.match(name):
+        return '<a href="%s"><img border="0" src="%s" alt="%s" /></a>' % (url, url + url_args(kvargs), descr)
     elif file_re.match(name) and not ext_re.search(name): # FIXME: this guesses a wiki page
         return Page(name).send_naked()
     else:
@@ -212,8 +234,12 @@ def link_inline(name, descr=None, args=''):
 
 # Search ---------------------------------------------------
 
-def handle_fullsearch(needle):
-    send_title(None, 'Full text search for "%s"' % (needle))
+def print_search_stats(hits, searched):
+    print("<p>%d hits out of %d pages searched.</p>" % (hits, searched))
+
+def handle_fullsearch(query, form):
+    needle = form['q'].value
+    send_title(None, 'Full text search for "' + needle + '"')
 
     needle_re = re.compile(needle, re.IGNORECASE)
     hits = []
@@ -239,9 +265,9 @@ def handle_fullsearch(needle):
 
     print_search_stats(len(hits), len(all_pages))
 
-def handle_titlesearch(needle):
-    # TODO: check needle is legal -- but probably we can just accept any RE
-    send_title(None, "Title search for \"" + needle + '"')
+def handle_titlesearch(query, form):
+    needle = form['q'].value
+    send_title(None, 'Title search for "' + needle + '"')
 
     needle_re = re.compile(needle, re.IGNORECASE)
     all_pages = page_list()
@@ -254,22 +280,19 @@ def handle_titlesearch(needle):
 
     print_search_stats(len(hits), len(all_pages))
 
-def print_search_stats(hits, searched):
-    print("<p>%d hits out of %d pages searched.</p>" % (hits, searched))
-
-def handle_raw(pagename):
+def handle_raw(pagename, form):
     if not file_re.match(pagename):
         send_httperror("403 Forbidden", pagename)
         return
 
     Page(pagename).send_raw()
 
-def handle_edit(pagename):
+def handle_edit(pagename, form):
     if not file_re.match(pagename):
         send_httperror("403 Forbidden", pagename)
         return
 
-    pg = Page(pagename)
+    pg = Page(form['q'].value)
     if 'save' in form:
         if form['file'].value:
             pg.save(form['file'].file.read(), form['changelog'].value)
@@ -286,12 +309,27 @@ def handle_edit(pagename):
             text = form['savetext'].value
         pg.send_editor(text)
 
+def handle_get(pagename, form):
+        if file_re.match(pagename):
+            # FIMXE: this is all bullshit, MimeTypes bases its guess on the extension!
+            from mimetypes import MimeTypes
+            mimetype, encoding = MimeTypes().guess_type(pagename)
+            if mimetype:
+                Page(pagename).send_raw(mimetype=mimetype, args=form)
+            else:
+                Page(pagename).format()
+        else:
+            send_httperror("403 Forbidden", pagename)
+
 # Used by macros/WordIndex and macros/TitleIndex
 def make_index_key():
     links = ['<a href="#%s">%s</a>' % (ch, ch) for ch in 'abcdefghijklmnopqrstuvwxyz']
     return '<p style="text-align: center">' + ' | '.join(links) + '</p>'
 
-def page_list(dirname = None, re = word_re):
+def page_list(dirname=None, re=None):
+    if re is None:
+        # FIXME: WikiWord is too restrictive now!
+        re = re.compile(r"^\b((([A-Z][a-z0-9]+){2,}/)*([A-Z][a-z0-9]+){2,})\b$")
     return sorted(filter(re.match, os.listdir(dirname or data_dir)))
 
 def send_footer(mod_string=None):
@@ -358,48 +396,35 @@ class WikiFormatter:
         return self._undent() + '\n<hr size="%d" noshade="noshade" />\n' % (len(word) - 2)
 
     def _macro_repl(self, word):
-        m = re.compile("\<\<([^\s\|\>]+)(?:\s*\|\s*([^\>]+)|)\>\>").match(word)
-        name = m.group(1)
-        argv = [name]
-        if m.group(2):
-            argv.extend(m.group(2).split('|'))
-        argv = list(map(str.strip, argv))
-
-        macro = globals().get('_macro_' + name)
-        if not macro:
-            try:
+        try:
+            args, kwargs = parse_args(word)
+            macro = globals().get('_macro_' + args[0])
+            if not macro:
                 exec(open("macros/" + name + ".py").read(), globals())
-            except IOError as err:
-                if err.errno == errno.ENOENT: pass
-            macro = globals().get('_macro_' + name)
-        if macro:
-            return macro(argv)
-        else:
-            msg = '&lt;&lt;' + '|'.join(argv) + '&gt;&gt;'
+                macro = globals().get('_macro_' + name)
+            return macro(*args, **kwargs)
+        except Exception:
+            msg = cgi.escape(word)
             if not self.in_html:
                 msg = '<strong class="error">' + msg + '</strong>'
             return msg
 
     def _hurl_repl(self, word):
-        m = link_re.match(word)
-        return link_tag(m.group(1), m.group(2))
+        args, kvargs = parse_args(word)
+        return link_tag(*args, **kvargs)
 
     def _inl_repl(self, word):
-        (name, descr) = link_re.match(word).groups()
-
-        if descr:
-            argv = descr.split('|')
-            descr = argv.pop(0)
-            args = ''
-            if argv:
-                args = '?' + '&amp;'.join(argv)
-
-            # The "extthumb" nonsense works around a limitation of the HTML block model
-            return '<div class="extthumb"><div class="thumb">' \
-                + link_inline(name, descr, args) \
+        args, kvargs = parse_args(word)
+        name = args.pop(0)
+        if len(args):
+            descr = args.pop(0)
+            # This double div nonsense works around a limitation of the HTML block model
+            return '<div class="' + kvargs.get('class', 'thumb') + '">' \
+                + '<div class="innerthumb">' \
+                + link_inline(name, descr, kvargs) \
                 + '<div class="caption">' + descr + '</div></div></div>'
         else:
-            return link_inline(name, name)
+            return link_inline(name, None, kvargs)
 
     def _html_repl(self, word):
         if not self.in_html and word.startswith('<div'): word = '</p>' + word
@@ -526,7 +551,7 @@ class WikiFormatter:
             | (?P<ent>   [<>&] )
 
             # Auto links (LEGACY)
-            | (?P<img>   \b[a-zA-Z0-9_/-]+\.(png|gif|jpg|jpeg|bmp|ico|ogm|ogg|mkv|mpg|mpeg|mp4|avi|asf|flv|wmv|qt))
+            | (?P<img>   \b[a-zA-Z0-9_/-]+\.(""" + image_ext + "|" + video_ext + r"""))
             | (?P<word>  \b(?:[A-Z][a-z]+){2,}\b)
             | (?P<url>   (http|https|ftp|mailto)\:[^\s'\"]+\S)
             | (?P<email> [-\w._+]+\@[\w.-]+)
@@ -552,7 +577,8 @@ class WikiFormatter:
         tr_re = re.compile(r"^\s*\|\|")
         eol_re = re.compile(r"\r?\n")
         # For each line, we scan through looking for magic strings, outputting verbatim any intervening text
-        for self.line in eol_re.split(str(self.raw.expandtabs(), 'utf-8')):
+        #3.0: for self.line in eol_re.split(str(self.raw.expandtabs(), 'utf-8')):
+        for self.line in eol_re.split(str(self.raw.expandtabs())):
             # Skip pragmas
             if self.in_header:
                 if self.line.startswith('#'):
@@ -570,7 +596,8 @@ class WikiFormatter:
                     print('</p><p>')
                 else:
                     indent = indent_re.match(self.line)
-                    print(self._indent_to(len(indent.group(0))), end=' ')
+                    #3.0: print(self._indent_to(len(indent.group(0))), end=' ')
+                    print(self._indent_to(len(indent.group(0))))
                     print(re.sub(scan_re, self.replace, self.line))
 
         if self.in_pre: print('</pre>')
@@ -598,7 +625,7 @@ class Page:
         try:
             os.stat(self._filename())
             return True
-        except OSError as err:
+        except OSError, err:
             if err.errno == errno.ENOENT:
                 return False
             raise err
@@ -606,10 +633,10 @@ class Page:
     def get_raw_body(self, default=None):
         try:
             return open(self._filename(), 'rb').read()
-        except IOError as err:
+        except IOError, err:
             if err.errno == errno.ENOENT:
                 if default is None:
-                    default = '//[[?edit=%s|Describe %s]]//' % (self.page_name, self.page_name)
+                    default = '//[[?a=edit&q=%s|Describe %s]]//' % (self.page_name, self.page_name)
                 return default
             if err.errno == errno.EISDIR:
                 return self.format_dir()
@@ -624,10 +651,10 @@ class Page:
         out += ' ==\n'
  
         for filename in page_list(self._filename(), file_re):
-            if img_re.match(filename):
+            if image_re.match(filename):
                 if image_maxwidth:
-                    maxwidth_arg = '|maxwidth=' + str(image_maxwidth)
-                out += '{{' + self.page_name + '/' + filename + '|' + filename + maxwidth_arg + '}}\n'
+                    maxwidth_arg = ' | maxwidth=' + str(image_maxwidth)
+                out += '{{' + self.page_name + '/' + filename + ' | ' + humanlink(filename) + maxwidth_arg + ' | class=thumbleft}}\n'
             else:
                 out += ' * [[' + self.page_name + '/' + filename + ']]\n'
         return out
@@ -644,7 +671,7 @@ class Page:
                         break
                     self._pragmas[m.group(1)] = m.group(2).strip()
                     #print "bernie: pragmas[" + m.group(1) + "] = " + m.group(2) + "<br>\n"
-            except IOError as err:
+            except IOError, err:
                 if err.errno != errno.ENOENT and err.errno != errno.EISDIR:
                     raise er
         return self._pragmas
@@ -695,7 +722,7 @@ class Page:
         try:
             from time import localtime, strftime
             modtime = localtime(os.stat(self._filename())[stat.ST_MTIME])
-        except OSError as err:
+        except OSError, err:
             if err.errno != errno.ENOENT:
                 raise err
             return None
@@ -716,7 +743,7 @@ class Page:
             + ' from ' + cgi.escape(get_hostname(remote_host()))
             + '</b></p>'))
         print('<div class="editor"><form name="editform" method="post" enctype="multipart/form-data" action="%s">' % relative_url(self.page_name))
-        print('<input type="hidden" name="edit" value="%s">' % (self.page_name))
+        print('<input type="hidden" name="a" value="edit" /><input type="hidden" name="q" value="' + self.page_name + '" />')
         print('<input type="input" id="editor" name="changelog" value="Edit page %s" accesskey="c" /><br />' % (self.page_name))
         print('<textarea wrap="off" spellcheck="true" id="editor" name="savetext" rows="17" cols="100" accesskey="e">%s</textarea>' \
             % cgi.escape(preview or self.get_raw_body(default='')))
@@ -766,7 +793,7 @@ class Page:
             # Bad Bill!  POSIX rename ought to replace. :-(
             try:
                 os.remove(name)
-            except OSError as err:
+            except OSError, err:
                 if err.errno != errno.ENOENT: raise err
         os.rename(tmp_filename, name)
 
@@ -792,29 +819,16 @@ class Page:
             self.msg_text = 'Thank you for your contribution.  Your attention to detail is appreciated.'
             self.msg_type = 'success'
 
-def main():
-    for cmd in form:
-        handler = globals().get('handle_' + cmd)
-        if handler:
-            handler(form[cmd].value)
-            break
-    else:
-        query = query_string()
-        if file_re.match(query):
-            # FIMXE: this is all bullshit, MimeTypes bases its guess on the extension!
-            from mimetypes import MimeTypes
-            mimetype, encoding = MimeTypes().guess_type(query)
-            if mimetype:
-                Page(query).send_raw(mimetype=mimetype, args=form)
-            else:
-                Page(query).format()
-        else:
-            send_httperror("403 Forbidden", query)
-
 try:
     exec(open("geekigeeki.conf.py").read())
     form = cgi.FieldStorage()
-    main()
+    action = form.getvalue('a', 'get')
+    handler = globals().get('handle_' + action)
+    if handler:
+        handler(query_string(), form)
+    else:
+        send_httperror("403 Forbidden", query_string())
+
 except Exception:
     import traceback
     msg_text = traceback.format_exc()