]> CyberLeo.Net >> Repos - SourceForge/phpwiki.git/blob - lib/WikiDB/backend.php
add case_exact search
[SourceForge/phpwiki.git] / lib / WikiDB / backend.php
1 <?php // -*-php-*-
2 rcs_id('$Id: backend.php,v 1.13 2004-11-23 13:35:32 rurban Exp $');
3
4 /*
5   Pagedata
6
7    maintained by WikiPage 
8     //:latestversion
9     //:deleted (*)     (Set if latest content is empty.)
10     //:pagename (*)
11
12     hits
13     is_locked
14
15   Versiondata
16
17     %content (?should this be here?)
18     _supplanted : Time version ceased to be the current version
19
20     mtime (*)   : Time of version edit.
21     orig_mtime
22     is_minor_edit (*)
23     author      : nominal author
24     author_id   : authenticated author
25     summary
26
27     //version
28     //created (*)
29     //%superceded
30         
31     //:serial
32
33      (types are scalars: strings, ints, bools)
34 */     
35
36 /**
37  * A WikiDB_backend handles the storage and retrieval of data for a WikiDB.
38  *
39  * A WikiDB_backend handles the storage and retrieval of data for a WikiDB.
40  * It does not have to be this way, of course, but the standard WikiDB uses
41  * a WikiDB_backend.  (Other WikiDB's could be written which use some other
42  * method to access their underlying data store.)
43  *
44  * The interface outlined here seems to work well with both RDBM based
45  * and flat DBM/hash based methods of data storage.
46  *
47  * Though it contains some default implementation of certain methods,
48  * this is an abstract base class.  It is expected that most effificient
49  * backends will override nearly all the methods in this class.
50  *
51  * @access protected
52  * @see WikiDB
53  */
54 class WikiDB_backend
55 {
56     /**
57      * Get page meta-data from database.
58      *
59      * @param $pagename string Page name.
60      * @return hash
61      * Returns a hash containing the page meta-data.
62      * Returns an empty array if there is no meta-data for the requested page.
63      * Keys which might be present in the hash are:
64      * <dl>
65      *  <dt> locked  <dd> If the page is locked.
66      *  <dt> hits    <dd> The page hit count.
67      *  <dt> created <dd> Unix time of page creation. (FIXME: Deprecated: I
68      *                    don't think we need this...) 
69      * </dl>
70      */
71     function get_pagedata($pagename) {
72         trigger_error("virtual", E_USER_ERROR);
73     }
74
75     /**
76      * Update the page meta-data.
77      *
78      * Set page meta-data.
79      *
80      * Only meta-data whose keys are preset in $newdata is affected.
81      *
82      * For example:
83      * <pre>
84      *   $backend->update_pagedata($pagename, array('locked' => 1)); 
85      * </pre>
86      * will set the value of 'locked' to 1 for the specified page, but it
87      * will not affect the value of 'hits' (or whatever other meta-data
88      * may have been stored for the page.)
89      *
90      * To delete a particular piece of meta-data, set it's value to false.
91      * <pre>
92      *   $backend->update_pagedata($pagename, array('locked' => false)); 
93      * </pre>
94      *
95      * @param $pagename string Page name.
96      * @param $newdata hash New meta-data.
97      */
98     function update_pagedata($pagename, $newdata) {
99         trigger_error("virtual", E_USER_ERROR);
100     }
101     
102
103     /**
104      * Get the current version number for a page.
105      *
106      * @param $pagename string Page name.
107      * @return int The latest version number for the page.  Returns zero if
108      *  no versions of a page exist.
109      */
110     function get_latest_version($pagename) {
111         trigger_error("virtual", E_USER_ERROR);
112     }
113     
114     /**
115      * Get preceding version number.
116      *
117      * @param $pagename string Page name.
118      * @param $version int Find version before this one.
119      * @return int The version number of the version in the database which
120      *  immediately preceeds $version.
121      */
122     function get_previous_version($pagename, $version) {
123         trigger_error("virtual", E_USER_ERROR);
124     }
125     
126     /**
127      * Get revision meta-data and content.
128      *
129      * @param $pagename string Page name.
130      * @param $version integer Which version to get.
131      * @param $want_content boolean
132      *  Indicates the caller really wants the page content.  If this
133      *  flag is not set, the backend is free to skip fetching of the
134      *  page content (as that may be expensive).  If the backend omits
135      *  the content, the backend might still want to set the value of
136      *  '%content' to the empty string if it knows there's no content.
137      *
138      * @return hash The version data, or false if specified version does not
139      *    exist.
140      *
141      * Some keys which might be present in the $versiondata hash are:
142      * <dl>
143      * <dt> %content
144      *  <dd> This is a pseudo-meta-data element (since it's actually
145      *       the page data, get it?) containing the page content.
146      *       If the content was not fetched, this key may not be present.
147      * </dl>
148      * For description of other version meta-data see WikiDB_PageRevision::get().
149      * @see WikiDB_PageRevision::get
150      */
151     function get_versiondata($pagename, $version, $want_content = false) {
152         trigger_error("virtual", E_USER_ERROR);
153     }
154
155     /**
156      * Delete page from the database.
157      *
158      * Delete page (and all it's revisions) from the database.
159      *
160      * This should remove all links (from the named page) from
161      * the link database.
162      *
163      * @param $pagename string Page name.
164      */
165     function delete_page($pagename) {
166         trigger_error("virtual", E_USER_ERROR);
167     }
168             
169     /**
170      * Delete an old revision of a page.
171      *
172      * Note that one is never allowed to delete the most recent version,
173      * but that this requirement is enforced by WikiDB not by the backend.
174      *
175      * In fact, to be safe, backends should probably allow the deletion of
176      * the most recent version.
177      *
178      * @param $pagename string Page name.
179      * @param $version integer Version to delete.
180      */
181     function delete_versiondata($pagename, $version) {
182         trigger_error("virtual", E_USER_ERROR);
183     }
184
185     /**
186      * Create a new page revision.
187      *
188      * If the given ($pagename,$version) is already in the database,
189      * this method completely overwrites any stored data for that version.
190      *
191      * @param $pagename string Page name.
192      * @param $version int New revisions content.
193      * @param $data hash New revision metadata.
194      *
195      * @see get_versiondata
196      */
197     function set_versiondata($pagename, $version, $data) {
198         trigger_error("virtual", E_USER_ERROR);
199     }
200
201     /**
202      * Update page version meta-data.
203      *
204      * If the given ($pagename,$version) is already in the database,
205      * this method only changes those meta-data values whose keys are
206      * explicity listed in $newdata.
207      *
208      * @param $pagename string Page name.
209      * @param $version int New revisions content.
210      * @param $newdata hash New revision metadata.
211      * @see set_versiondata, get_versiondata
212      */
213     function update_versiondata($pagename, $version, $newdata) {
214         $data = $this->get_versiondata($pagename, $version, true);
215         if (!$data) {
216             assert($data);
217             return;
218         }
219         foreach ($newdata as $key => $val) {
220             if (empty($val))
221                 unset($data[$key]);
222             else
223                 $data[$key] = $val;
224         }
225         $this->set_versiondata($pagename, $version, $data);
226     }
227     
228     /**
229      * Set links for page.
230      *
231      * @param $pagename string Page name.
232      *
233      * @param $links array List of page(names) which page links to.
234      */
235     function set_links($pagename, $links) {
236         trigger_error("virtual", E_USER_ERROR);
237     }
238         
239     /**
240      * Find pages which link to or are linked from a page.
241      *
242      * @param $pagename string Page name.
243      * @param $reversed boolean True to get backlinks.
244      *
245      * FIXME: array or iterator?
246      * @return object A WikiDB_backend_iterator.
247      */
248     function get_links($pagename, $reversed) {
249         //FIXME: implement simple (but slow) link finder.
250         die("FIXME");
251     }
252
253     /**
254      * Get all revisions of a page.
255      *
256      * @param $pagename string The page name.
257      * @return object A WikiDB_backend_iterator.
258      */
259     function get_all_revisions($pagename) {
260         include_once('lib/WikiDB/backend/dumb/AllRevisionsIter.php');
261         return new WikiDB_backend_dumb_AllRevisionsIter($this, $pagename);
262     }
263     
264     /**
265      * Get all pages in the database.
266      *
267      * Pages should be returned in alphabetical order if that is
268      * feasable.
269      *
270      * @access protected
271      *
272      * @param $include_defaulted boolean
273      * If set, even pages with no content will be returned
274      * --- but still only if they have at least one revision (not
275      * counting the default revision 0) entered in the database.
276      *
277      * Normally pages whose current revision has empty content
278      * are not returned as these pages are considered to be
279      * non-existing.
280      *
281      * @return object A WikiDB_backend_iterator.
282      */
283     function get_all_pages($include_defaulted, $orderby=false, $limit=false, $exclude=false) {
284         trigger_error("virtual", E_USER_ERROR);
285     }
286         
287     /**
288      * Title or full text search.
289      *
290      * Pages should be returned in alphabetical order if that is
291      * feasable.
292      *
293      * @access protected
294      *
295      * @param $search object A TextSearchQuery object describing what pages
296      * are to be searched for.
297      *
298      * @param $fullsearch boolean If true, a full text search is performed,
299      *  otherwise a title search is performed.
300      *
301      * @return object A WikiDB_backend_iterator.
302      *
303      * @see WikiDB::titleSearch
304      */
305     function text_search($search='', $fullsearch=false, $case_exact=false) {
306         // This is method implements a simple linear search
307         // through all the pages in the database.
308         //
309         // It is expected that most backends will overload
310         // method with something more efficient.
311         include_once('lib/WikiDB/backend/dumb/TextSearchIter.php');
312         $pages = $this->get_all_pages(false);
313         return new WikiDB_backend_dumb_TextSearchIter($this, $pages, $search, $fullsearch);
314     }
315
316     /**
317      * Find pages with highest hit counts.
318      *
319      * Find the pages with the highest hit counts.  The pages should
320      * be returned in reverse order by hit count.
321      *
322      * @access protected
323      * @param $limit integer  No more than this many pages
324      * @return object A WikiDB_backend_iterator.
325      */
326     function most_popular($limit, $sortby='-hits') {
327         // This is method fetches all pages, then
328         // sorts them by hit count.
329         // (Not very efficient.)
330         //
331         // It is expected that most backends will overload
332         // method with something more efficient.
333         include_once('lib/WikiDB/backend/dumb/MostPopularIter.php');
334         $pages = $this->get_all_pages(false, $sortby, $limit);
335         
336         return new WikiDB_backend_dumb_MostPopularIter($this, $pages, $limit);
337     }
338
339     /**
340      * Find recent changes.
341      *
342      * @access protected
343      * @param $params hash See WikiDB::mostRecent for a description
344      *  of parameters which can be included in this hash.
345      * @return object A WikiDB_backend_iterator.
346      * @see WikiDB::mostRecent
347      */
348     function most_recent($params) {
349         // This method is very inefficient and searches through
350         // all pages for the most recent changes.
351         //
352         // It is expected that most backends will overload
353         // method with something more efficient.
354         include_once('lib/WikiDB/backend/dumb/MostRecentIter.php');
355         $pages = $this->get_all_pages(true, '-mtime');
356         return new WikiDB_backend_dumb_MostRecentIter($this, $pages, $params);
357     }
358
359     function wanted_pages($exclude_from='', $exclude='', $sortby=false, $limit=false) {
360         include_once('lib/WikiDB/backend/dumb/WantedPagesIter.php');
361         $allpages = $this->get_all_pages(true,false,false,$exclude_from);
362         return new WikiDB_backend_dumb_WantedPagesIter($this, $allpages, $exclude, $sortby, $limit);
363     }
364
365     /**
366      * Lock backend database.
367      *
368      * Calls may be nested.
369      *
370      * @param $write_lock boolean Unless this is set to false, a write lock
371      *     is acquired, otherwise a read lock.  If the backend doesn't support
372      *     read locking, then it should make a write lock no matter which type
373      *     of lock was requested.
374      *
375      *     All backends <em>should</em> support write locking.
376      */
377     function lock($write_lock = true) {
378     }
379
380     /**
381      * Unlock backend database.
382      *
383      * @param $force boolean Normally, the database is not unlocked until
384      *  unlock() is called as many times as lock() has been.  If $force is
385      *  set to true, the the database is unconditionally unlocked.
386      */
387     function unlock($force = false) {
388     }
389
390
391     /**
392      * Close database.
393      */
394     function close () {
395     }
396
397     /**
398      * Synchronize with filesystem.
399      *
400      * This should flush all unwritten data to the filesystem.
401      */
402     function sync() {
403     }
404
405     /**
406      * Optimize the database.
407      */
408     function optimize() {
409     }
410
411     /**
412      * Check database integrity.
413      *
414      * This should check the validity of the internal structure of the database.
415      * Errors should be reported via:
416      * <pre>
417      *   trigger_error("Message goes here.", E_USER_WARNING);
418      * </pre>
419      *
420      * @return boolean True iff database is in a consistent state.
421      */
422     function check() {
423     }
424
425     /**
426      * Put the database into a consistent state.
427      *
428      * This should put the database into a consistent state.
429      * (I.e. rebuild indexes, etc...)
430      *
431      * @return boolean True iff successful.
432      */
433     function rebuild() {
434     }
435
436     function _parse_searchwords($search) {
437         $search = strtolower(trim($search));
438         if (!$search)
439             return array(array(),array());
440         
441         $words = preg_split('/\s+/', $search);
442         $exclude = array();
443         foreach ($words as $key => $word) {
444             if ($word[0] == '-' && $word != '-') {
445                 $word = substr($word, 1);
446                 $exclude[] = preg_quote($word);
447                 unset($words[$key]);
448             }
449         }
450         return array($words, $exclude);
451     }
452
453     /** 
454      * Split the given limit parameter into offset,pagesize. (offset is optional. default: 0)
455      * Duplicate the PageList function here to avoid loading the whole PageList.php 
456      * Usage: 
457      *   list($offset,$pagesize) = $this->limit($args['limit']);
458      */
459     function limit($limit) {
460         if (strstr($limit, ','))
461             return split(',', $limit);
462         else
463             return array(0, $limit);
464     }
465     
466     /** 
467      * Handle sortby requests for the DB iterator and table header links.
468      * Prefix the column with + or - like "+pagename","-mtime", ...
469      * supported actions: 'flip_order' "mtime" => "+mtime" => "-mtime" ...
470      *                    'db'         "-pagename" => "pagename DESC"
471      * In PageList all columns are sortable. (patch by DanFr)
472      * Here with the backend only some, the rest is delayed to PageList.
473      * (some kind of DumbIter)
474      * Duplicate the PageList function here to avoid loading the whole 
475      * PageList.php, and it forces the backend specific sortable_columns()
476      */
477     function sortby ($column, $action) {
478         if (empty($column)) return '';
479         //support multiple comma-delimited sortby args: "+hits,+pagename"
480         if (strstr($column,',')) {
481             $result = array();
482             foreach (explode(',',$column) as $col) {
483                 $result[] = $this->sortby($col,$action);
484             }
485             return join(",",$result);
486         }
487         if (substr($column,0,1) == '+') {
488             $order = '+'; $column = substr($column,1);
489         } elseif (substr($column,0,1) == '-') {
490             $order = '-'; $column = substr($column,1);
491         }
492         // default order: +pagename, -mtime, -hits
493         if (empty($order))
494             if (in_array($column,array('mtime','hits')))
495                 $order = '-';
496             else
497                 $order = '+';
498         if ($action == 'flip_order') {
499             return ($order == '+' ? '-' : '+') . $column;
500         } elseif ($action == 'init') {
501             $this->_sortby[$column] = $order;
502             return $order . $column;
503         } elseif ($action == 'check') {
504             return (!empty($this->_sortby[$column]) or 
505                     ($GLOBALS['request']->getArg('sortby') and 
506                      strstr($GLOBALS['request']->getArg('sortby'),$column)));
507         } elseif ($action == 'db') {
508             // native sort possible?
509             $sortable_columns = $this->sortable_columns();
510             if (in_array($column, $sortable_columns))
511                 // asc or desc: +pagename, -pagename
512                 return $column . ($order == '+' ? ' ASC' : ' DESC');
513             else 
514                 return '';
515         }
516         return '';
517     }
518
519     function sortable_columns() {
520         return array('pagename'/*,'mtime','author_id','author'*/);
521     }
522
523     // quote only strings or do smartquote? add ' or not? (NULL)
524     // ADODB adds surrounding quotes, SQL not yet!
525     function quote ($s) {
526         return $s;
527     }
528
529 };
530
531 /**
532  * Iterator returned by backend methods which (possibly) return
533  * multiple records.
534  *
535  * FIXME: This might be two seperate classes: page_iter and version_iter.
536  * For the versions we have WikiDB_backend_dumb_AllRevisionsIter.
537  */
538 class WikiDB_backend_iterator
539 {
540     /**
541      * Get the next record in the iterator set.
542      *
543      * This returns a hash. The hash may contain the following keys:
544      * <dl>
545      * <dt> pagename <dt> (string) the page name
546      * <dt> version  <dt> (int) the version number
547      * <dt> pagedata <dt> (hash) page meta-data (as returned from backend::get_pagedata().)
548      * <dt> versiondata <dt> (hash) page meta-data (as returned from backend::get_versiondata().)
549      *
550      * If this is a page iterator, it must contain the 'pagename' entry --- the others
551      * are optional.
552      *
553      * If this is a version iterator, the 'pagename', 'version', <strong>and</strong> 'versiondata'
554      * entries are mandatory.  ('pagedata' is optional.)
555      */
556     function next() {
557         trigger_error("virtual", E_USER_ERROR);
558     }
559
560     function count() {
561         return count($this->_pages);
562     }
563
564     /**
565      * Release resources held by this iterator.
566      */
567     function free() {
568     }
569 };
570
571 // For emacs users
572 // Local Variables:
573 // mode: php
574 // tab-width: 8
575 // c-basic-offset: 4
576 // c-hanging-comment-ender-p: nil
577 // indent-tabs-mode: nil
578 // End:
579 ?>