Make Sanitizer::removeHTMLtags() and ::removeHTMLComments public
[mediawiki.git] / maintenance / tables.sql
blob112ac0534cfa6f8ddc0db9dd7ee30b4032cd89e9
1 -- SQL to create the initial tables for the MediaWiki database.
2 -- This is read and executed by the install script; you should
3 -- not have to run it by itself unless doing a manual install.
5 -- This is a shared schema file used for both MySQL and SQLite installs.
7 --
8 -- General notes:
9 --
10 -- If possible, create tables as InnoDB to benefit from the
11 -- superior resiliency against crashes and ability to read
12 -- during writes (and write during reads!)
14 -- Only the 'searchindex' table requires MyISAM due to the
15 -- requirement for fulltext index support, which is missing
16 -- from InnoDB.
19 -- The MySQL table backend for MediaWiki currently uses
20 -- 14-character BINARY or VARBINARY fields to store timestamps.
21 -- The format is YYYYMMDDHHMMSS, which is derived from the
22 -- text format of MySQL's TIMESTAMP fields.
24 -- Historically TIMESTAMP fields were used, but abandoned
25 -- in early 2002 after a lot of trouble with the fields
26 -- auto-updating.
28 -- The Postgres backend uses TIMESTAMPTZ fields for timestamps,
29 -- and we will migrate the MySQL definitions at some point as
30 -- well.
33 -- The /*_*/ comments in this and other files are
34 -- replaced with the defined table prefix by the installer
35 -- and updater scripts. If you are installing or running
36 -- updates manually, you will need to manually insert the
37 -- table prefix if any when running these scripts.
42 -- The user table contains basic account information,
43 -- authentication keys, etc.
45 -- Some multi-wiki sites may share a single central user table
46 -- between separate wikis using the $wgSharedDB setting.
48 -- Note that when a external authentication plugin is used,
49 -- user table entries still need to be created to store
50 -- preferences and to key tracking information in the other
51 -- tables.
53 CREATE TABLE /*_*/user (
54   user_id int unsigned NOT NULL PRIMARY KEY AUTO_INCREMENT,
56   -- Usernames must be unique, must not be in the form of
57   -- an IP address. _Shouldn't_ allow slashes or case
58   -- conflicts. Spaces are allowed, and are _not_ converted
59   -- to underscores like titles. See the User::newFromName() for
60   -- the specific tests that usernames have to pass.
61   user_name varchar(255) binary NOT NULL default '',
63   -- Optional 'real name' to be displayed in credit listings
64   user_real_name varchar(255) binary NOT NULL default '',
66   -- Password hashes, see User::crypt() and User::comparePasswords()
67   -- in User.php for the algorithm
68   user_password tinyblob NOT NULL,
70   -- When using 'mail me a new password', a random
71   -- password is generated and the hash stored here.
72   -- The previous password is left in place until
73   -- someone actually logs in with the new password,
74   -- at which point the hash is moved to user_password
75   -- and the old password is invalidated.
76   user_newpassword tinyblob NOT NULL,
78   -- Timestamp of the last time when a new password was
79   -- sent, for throttling and expiring purposes
80   -- Emailed passwords will expire $wgNewPasswordExpiry
81   -- (a week) after being set. If user_newpass_time is NULL
82   -- (eg. created by mail) it doesn't expire.
83   user_newpass_time binary(14),
85   -- Note: email should be restricted, not public info.
86   -- Same with passwords.
87   user_email tinytext NOT NULL,
89   -- If the browser sends an If-Modified-Since header, a 304 response is
90   -- suppressed if the value in this field for the current user is later than
91   -- the value in the IMS header. That is, this field is an invalidation timestamp
92   -- for the browser cache of logged-in users. Among other things, it is used
93   -- to prevent pages generated for a previously logged in user from being
94   -- displayed after a session expiry followed by a fresh login.
95   user_touched binary(14) NOT NULL default '',
97   -- A pseudorandomly generated value that is stored in
98   -- a cookie when the "remember password" feature is
99   -- used (previously, a hash of the password was used, but
100   -- this was vulnerable to cookie-stealing attacks)
101   user_token binary(32) NOT NULL default '',
103   -- Initially NULL; when a user's e-mail address has been
104   -- validated by returning with a mailed token, this is
105   -- set to the current timestamp.
106   user_email_authenticated binary(14),
108   -- Randomly generated token created when the e-mail address
109   -- is set and a confirmation test mail sent.
110   user_email_token binary(32),
112   -- Expiration date for the user_email_token
113   user_email_token_expires binary(14),
115   -- Timestamp of account registration.
116   -- Accounts predating this schema addition may contain NULL.
117   user_registration binary(14),
119   -- Count of edits and edit-like actions.
120   --
121   -- *NOT* intended to be an accurate copy of COUNT(*) WHERE rev_user=user_id
122   -- May contain NULL for old accounts if batch-update scripts haven't been
123   -- run, as well as listing deleted edits and other myriad ways it could be
124   -- out of sync.
125   --
126   -- Meant primarily for heuristic checks to give an impression of whether
127   -- the account has been used much.
128   --
129   user_editcount int,
131   -- Expiration date for user password. Use $user->expirePassword()
132   -- to force a password reset.
133   user_password_expires varbinary(14) DEFAULT NULL
135 ) /*$wgDBTableOptions*/;
137 CREATE UNIQUE INDEX /*i*/user_name ON /*_*/user (user_name);
138 CREATE INDEX /*i*/user_email_token ON /*_*/user (user_email_token);
139 CREATE INDEX /*i*/user_email ON /*_*/user (user_email(50));
143 -- User permissions have been broken out to a separate table;
144 -- this allows sites with a shared user table to have different
145 -- permissions assigned to a user in each project.
147 -- This table replaces the old user_rights field which used a
148 -- comma-separated blob.
150 CREATE TABLE /*_*/user_groups (
151   -- Key to user_id
152   ug_user int unsigned NOT NULL default 0,
154   -- Group names are short symbolic string keys.
155   -- The set of group names is open-ended, though in practice
156   -- only some predefined ones are likely to be used.
157   --
158   -- At runtime $wgGroupPermissions will associate group keys
159   -- with particular permissions. A user will have the combined
160   -- permissions of any group they're explicitly in, plus
161   -- the implicit '*' and 'user' groups.
162   ug_group varbinary(255) NOT NULL default ''
163 ) /*$wgDBTableOptions*/;
165 CREATE UNIQUE INDEX /*i*/ug_user_group ON /*_*/user_groups (ug_user,ug_group);
166 CREATE INDEX /*i*/ug_group ON /*_*/user_groups (ug_group);
168 -- Stores the groups the user has once belonged to.
169 -- The user may still belong to these groups (check user_groups).
170 -- Users are not autopromoted to groups from which they were removed.
171 CREATE TABLE /*_*/user_former_groups (
172   -- Key to user_id
173   ufg_user int unsigned NOT NULL default 0,
174   ufg_group varbinary(255) NOT NULL default ''
175 ) /*$wgDBTableOptions*/;
177 CREATE UNIQUE INDEX /*i*/ufg_user_group ON /*_*/user_former_groups (ufg_user,ufg_group);
180 -- Stores notifications of user talk page changes, for the display
181 -- of the "you have new messages" box
183 CREATE TABLE /*_*/user_newtalk (
184   -- Key to user.user_id
185   user_id int NOT NULL default 0,
186   -- If the user is an anonymous user their IP address is stored here
187   -- since the user_id of 0 is ambiguous
188   user_ip varbinary(40) NOT NULL default '',
189   -- The highest timestamp of revisions of the talk page viewed
190   -- by this user
191   user_last_timestamp varbinary(14) NULL default NULL
192 ) /*$wgDBTableOptions*/;
194 -- Indexes renamed for SQLite in 1.14
195 CREATE INDEX /*i*/un_user_id ON /*_*/user_newtalk (user_id);
196 CREATE INDEX /*i*/un_user_ip ON /*_*/user_newtalk (user_ip);
200 -- User preferences and perhaps other fun stuff. :)
201 -- Replaces the old user.user_options blob, with a couple nice properties:
203 -- 1) We only store non-default settings, so changes to the defauls
204 --    are now reflected for everybody, not just new accounts.
205 -- 2) We can more easily do bulk lookups, statistics, or modifications of
206 --    saved options since it's a sane table structure.
208 CREATE TABLE /*_*/user_properties (
209   -- Foreign key to user.user_id
210   up_user int NOT NULL,
212   -- Name of the option being saved. This is indexed for bulk lookup.
213   up_property varbinary(255) NOT NULL,
215   -- Property value as a string.
216   up_value blob
217 ) /*$wgDBTableOptions*/;
219 CREATE UNIQUE INDEX /*i*/user_properties_user_property ON /*_*/user_properties (up_user,up_property);
220 CREATE INDEX /*i*/user_properties_property ON /*_*/user_properties (up_property);
223 -- Core of the wiki: each page has an entry here which identifies
224 -- it by title and contains some essential metadata.
226 CREATE TABLE /*_*/page (
227   -- Unique identifier number. The page_id will be preserved across
228   -- edits and rename operations, but not deletions and recreations.
229   page_id int unsigned NOT NULL PRIMARY KEY AUTO_INCREMENT,
231   -- A page name is broken into a namespace and a title.
232   -- The namespace keys are UI-language-independent constants,
233   -- defined in includes/Defines.php
234   page_namespace int NOT NULL,
236   -- The rest of the title, as text.
237   -- Spaces are transformed into underscores in title storage.
238   page_title varchar(255) binary NOT NULL,
240   -- Comma-separated set of permission keys indicating who
241   -- can move or edit the page.
242   page_restrictions tinyblob NOT NULL,
244   -- 1 indicates the article is a redirect.
245   page_is_redirect tinyint unsigned NOT NULL default 0,
247   -- 1 indicates this is a new entry, with only one edit.
248   -- Not all pages with one edit are new pages.
249   page_is_new tinyint unsigned NOT NULL default 0,
251   -- Random value between 0 and 1, used for Special:Randompage
252   page_random real unsigned NOT NULL,
254   -- This timestamp is updated whenever the page changes in
255   -- a way requiring it to be re-rendered, invalidating caches.
256   -- Aside from editing this includes permission changes,
257   -- creation or deletion of linked pages, and alteration
258   -- of contained templates.
259   page_touched binary(14) NOT NULL default '',
261   -- This timestamp is updated whenever a page is re-parsed and
262   -- it has all the link tracking tables updated for it. This is
263   -- useful for de-duplicating expensive backlink update jobs.
264   page_links_updated varbinary(14) NULL default NULL,
266   -- Handy key to revision.rev_id of the current revision.
267   -- This may be 0 during page creation, but that shouldn't
268   -- happen outside of a transaction... hopefully.
269   page_latest int unsigned NOT NULL,
271   -- Uncompressed length in bytes of the page's current source text.
272   page_len int unsigned NOT NULL,
274   -- content model, see CONTENT_MODEL_XXX constants
275   page_content_model varbinary(32) DEFAULT NULL,
277   -- Page content language
278   page_lang varbinary(35) DEFAULT NULL
279 ) /*$wgDBTableOptions*/;
281 CREATE UNIQUE INDEX /*i*/name_title ON /*_*/page (page_namespace,page_title);
282 CREATE INDEX /*i*/page_random ON /*_*/page (page_random);
283 CREATE INDEX /*i*/page_len ON /*_*/page (page_len);
284 CREATE INDEX /*i*/page_redirect_namespace_len ON /*_*/page (page_is_redirect, page_namespace, page_len);
287 -- Every edit of a page creates also a revision row.
288 -- This stores metadata about the revision, and a reference
289 -- to the text storage backend.
291 CREATE TABLE /*_*/revision (
292   -- Unique ID to identify each revision
293   rev_id int unsigned NOT NULL PRIMARY KEY AUTO_INCREMENT,
295   -- Key to page_id. This should _never_ be invalid.
296   rev_page int unsigned NOT NULL,
298   -- Key to text.old_id, where the actual bulk text is stored.
299   -- It's possible for multiple revisions to use the same text,
300   -- for instance revisions where only metadata is altered
301   -- or a rollback to a previous version.
302   rev_text_id int unsigned NOT NULL,
304   -- Text comment summarizing the change.
305   -- This text is shown in the history and other changes lists,
306   -- rendered in a subset of wiki markup by Linker::formatComment()
307   rev_comment tinyblob NOT NULL,
309   -- Key to user.user_id of the user who made this edit.
310   -- Stores 0 for anonymous edits and for some mass imports.
311   rev_user int unsigned NOT NULL default 0,
313   -- Text username or IP address of the editor.
314   rev_user_text varchar(255) binary NOT NULL default '',
316   -- Timestamp of when revision was created
317   rev_timestamp binary(14) NOT NULL default '',
319   -- Records whether the user marked the 'minor edit' checkbox.
320   -- Many automated edits are marked as minor.
321   rev_minor_edit tinyint unsigned NOT NULL default 0,
323   -- Restrictions on who can access this revision
324   rev_deleted tinyint unsigned NOT NULL default 0,
326   -- Length of this revision in bytes
327   rev_len int unsigned,
329   -- Key to revision.rev_id
330   -- This field is used to add support for a tree structure (The Adjacency List Model)
331   rev_parent_id int unsigned default NULL,
333   -- SHA-1 text content hash in base-36
334   rev_sha1 varbinary(32) NOT NULL default '',
336   -- content model, see CONTENT_MODEL_XXX constants
337   rev_content_model varbinary(32) DEFAULT NULL,
339   -- content format, see CONTENT_FORMAT_XXX constants
340   rev_content_format varbinary(64) DEFAULT NULL
342 ) /*$wgDBTableOptions*/ MAX_ROWS=10000000 AVG_ROW_LENGTH=1024;
343 -- In case tables are created as MyISAM, use row hints for MySQL <5.0 to avoid 4GB limit
345 CREATE UNIQUE INDEX /*i*/rev_page_id ON /*_*/revision (rev_page, rev_id);
346 CREATE INDEX /*i*/rev_timestamp ON /*_*/revision (rev_timestamp);
347 CREATE INDEX /*i*/page_timestamp ON /*_*/revision (rev_page,rev_timestamp);
348 CREATE INDEX /*i*/user_timestamp ON /*_*/revision (rev_user,rev_timestamp);
349 CREATE INDEX /*i*/usertext_timestamp ON /*_*/revision (rev_user_text,rev_timestamp);
350 CREATE INDEX /*i*/page_user_timestamp ON /*_*/revision (rev_page,rev_user,rev_timestamp);
353 -- Holds text of individual page revisions.
355 -- Field names are a holdover from the 'old' revisions table in
356 -- MediaWiki 1.4 and earlier: an upgrade will transform that
357 -- table into the 'text' table to minimize unnecessary churning
358 -- and downtime. If upgrading, the other fields will be left unused.
360 CREATE TABLE /*_*/text (
361   -- Unique text storage key number.
362   -- Note that the 'oldid' parameter used in URLs does *not*
363   -- refer to this number anymore, but to rev_id.
364   --
365   -- revision.rev_text_id is a key to this column
366   old_id int unsigned NOT NULL PRIMARY KEY AUTO_INCREMENT,
368   -- Depending on the contents of the old_flags field, the text
369   -- may be convenient plain text, or it may be funkily encoded.
370   old_text mediumblob NOT NULL,
372   -- Comma-separated list of flags:
373   -- gzip: text is compressed with PHP's gzdeflate() function.
374   -- utf-8: text was stored as UTF-8.
375   --        If $wgLegacyEncoding option is on, rows *without* this flag
376   --        will be converted to UTF-8 transparently at load time. Note
377   --        that due to a bug in a maintenance script, this flag may
378   --        have been stored as 'utf8' in some cases (T18841).
379   -- object: text field contained a serialized PHP object.
380   --         The object either contains multiple versions compressed
381   --         together to achieve a better compression ratio, or it refers
382   --         to another row where the text can be found.
383   -- external: text was stored in an external location specified by old_text.
384   --           Any additional flags apply to the data stored at that URL, not
385   --           the URL itself. The 'object' flag is *not* set for URLs of the
386   --           form 'DB://cluster/id/itemid', because the external storage
387   --           system itself decompresses these.
388   old_flags tinyblob NOT NULL
389 ) /*$wgDBTableOptions*/ MAX_ROWS=10000000 AVG_ROW_LENGTH=10240;
390 -- In case tables are created as MyISAM, use row hints for MySQL <5.0 to avoid 4GB limit
394 -- Holding area for deleted articles, which may be viewed
395 -- or restored by admins through the Special:Undelete interface.
396 -- The fields generally correspond to the page, revision, and text
397 -- fields, with several caveats.
399 CREATE TABLE /*_*/archive (
400   -- Primary key
401   ar_id int unsigned NOT NULL PRIMARY KEY AUTO_INCREMENT,
402   ar_namespace int NOT NULL default 0,
403   ar_title varchar(255) binary NOT NULL default '',
405   -- Newly deleted pages will not store text in this table,
406   -- but will reference the separately existing text rows.
407   -- This field is retained for backwards compatibility,
408   -- so old archived pages will remain accessible after
409   -- upgrading from 1.4 to 1.5.
410   -- Text may be gzipped or otherwise funky.
411   ar_text mediumblob NOT NULL,
413   -- Basic revision stuff...
414   ar_comment tinyblob NOT NULL,
415   ar_user int unsigned NOT NULL default 0,
416   ar_user_text varchar(255) binary NOT NULL,
417   ar_timestamp binary(14) NOT NULL default '',
418   ar_minor_edit tinyint NOT NULL default 0,
420   -- See ar_text note.
421   ar_flags tinyblob NOT NULL,
423   -- When revisions are deleted, their unique rev_id is stored
424   -- here so it can be retained after undeletion. This is necessary
425   -- to retain permalinks to given revisions after accidental delete
426   -- cycles or messy operations like history merges.
427   --
428   -- Old entries from 1.4 will be NULL here, and a new rev_id will
429   -- be created on undeletion for those revisions.
430   ar_rev_id int unsigned,
432   -- For newly deleted revisions, this is the text.old_id key to the
433   -- actual stored text. To avoid breaking the block-compression scheme
434   -- and otherwise making storage changes harder, the actual text is
435   -- *not* deleted from the text table, merely hidden by removal of the
436   -- page and revision entries.
437   --
438   -- Old entries deleted under 1.2-1.4 will have NULL here, and their
439   -- ar_text and ar_flags fields will be used to create a new text
440   -- row upon undeletion.
441   ar_text_id int unsigned,
443   -- rev_deleted for archives
444   ar_deleted tinyint unsigned NOT NULL default 0,
446   -- Length of this revision in bytes
447   ar_len int unsigned,
449   -- Reference to page_id. Useful for sysadmin fixing of large pages
450   -- merged together in the archives, or for cleanly restoring a page
451   -- at its original ID number if possible.
452   --
453   -- Will be NULL for pages deleted prior to 1.11.
454   ar_page_id int unsigned,
456   -- Original previous revision
457   ar_parent_id int unsigned default NULL,
459   -- SHA-1 text content hash in base-36
460   ar_sha1 varbinary(32) NOT NULL default '',
462   -- content model, see CONTENT_MODEL_XXX constants
463   ar_content_model varbinary(32) DEFAULT NULL,
465   -- content format, see CONTENT_FORMAT_XXX constants
466   ar_content_format varbinary(64) DEFAULT NULL
467 ) /*$wgDBTableOptions*/;
469 CREATE INDEX /*i*/name_title_timestamp ON /*_*/archive (ar_namespace,ar_title,ar_timestamp);
470 CREATE INDEX /*i*/ar_usertext_timestamp ON /*_*/archive (ar_user_text,ar_timestamp);
471 CREATE INDEX /*i*/ar_revid ON /*_*/archive (ar_rev_id);
475 -- Track page-to-page hyperlinks within the wiki.
477 CREATE TABLE /*_*/pagelinks (
478   -- Key to the page_id of the page containing the link.
479   pl_from int unsigned NOT NULL default 0,
480   -- Namespace for this page
481   pl_from_namespace int NOT NULL default 0,
483   -- Key to page_namespace/page_title of the target page.
484   -- The target page may or may not exist, and due to renames
485   -- and deletions may refer to different page records as time
486   -- goes by.
487   pl_namespace int NOT NULL default 0,
488   pl_title varchar(255) binary NOT NULL default ''
489 ) /*$wgDBTableOptions*/;
491 CREATE UNIQUE INDEX /*i*/pl_from ON /*_*/pagelinks (pl_from,pl_namespace,pl_title);
492 CREATE INDEX /*i*/pl_namespace ON /*_*/pagelinks (pl_namespace,pl_title,pl_from);
493 CREATE INDEX /*i*/pl_backlinks_namespace ON /*_*/pagelinks (pl_namespace,pl_title,pl_from_namespace,pl_from);
497 -- Track template inclusions.
499 CREATE TABLE /*_*/templatelinks (
500   -- Key to the page_id of the page containing the link.
501   tl_from int unsigned NOT NULL default 0,
502   -- Namespace for this page
503   tl_from_namespace int NOT NULL default 0,
505   -- Key to page_namespace/page_title of the target page.
506   -- The target page may or may not exist, and due to renames
507   -- and deletions may refer to different page records as time
508   -- goes by.
509   tl_namespace int NOT NULL default 0,
510   tl_title varchar(255) binary NOT NULL default ''
511 ) /*$wgDBTableOptions*/;
513 CREATE UNIQUE INDEX /*i*/tl_from ON /*_*/templatelinks (tl_from,tl_namespace,tl_title);
514 CREATE INDEX /*i*/tl_namespace ON /*_*/templatelinks (tl_namespace,tl_title,tl_from);
515 CREATE INDEX /*i*/tl_backlinks_namespace ON /*_*/templatelinks (tl_namespace,tl_title,tl_from_namespace,tl_from);
519 -- Track links to images *used inline*
520 -- We don't distinguish live from broken links here, so
521 -- they do not need to be changed on upload/removal.
523 CREATE TABLE /*_*/imagelinks (
524   -- Key to page_id of the page containing the image / media link.
525   il_from int unsigned NOT NULL default 0,
526   -- Namespace for this page
527   il_from_namespace int NOT NULL default 0,
529   -- Filename of target image.
530   -- This is also the page_title of the file's description page;
531   -- all such pages are in namespace 6 (NS_FILE).
532   il_to varchar(255) binary NOT NULL default ''
533 ) /*$wgDBTableOptions*/;
535 CREATE UNIQUE INDEX /*i*/il_from ON /*_*/imagelinks (il_from,il_to);
536 CREATE INDEX /*i*/il_to ON /*_*/imagelinks (il_to,il_from);
537 CREATE INDEX /*i*/il_backlinks_namespace ON /*_*/imagelinks (il_to,il_from_namespace,il_from);
541 -- Track category inclusions *used inline*
542 -- This tracks a single level of category membership
544 CREATE TABLE /*_*/categorylinks (
545   -- Key to page_id of the page defined as a category member.
546   cl_from int unsigned NOT NULL default 0,
548   -- Name of the category.
549   -- This is also the page_title of the category's description page;
550   -- all such pages are in namespace 14 (NS_CATEGORY).
551   cl_to varchar(255) binary NOT NULL default '',
553   -- A binary string obtained by applying a sortkey generation algorithm
554   -- (Collation::getSortKey()) to page_title, or cl_sortkey_prefix . "\n"
555   -- . page_title if cl_sortkey_prefix is nonempty.
556   cl_sortkey varbinary(230) NOT NULL default '',
558   -- A prefix for the raw sortkey manually specified by the user, either via
559   -- [[Category:Foo|prefix]] or {{defaultsort:prefix}}.  If nonempty, it's
560   -- concatenated with a line break followed by the page title before the sortkey
561   -- conversion algorithm is run.  We store this so that we can update
562   -- collations without reparsing all pages.
563   -- Note: If you change the length of this field, you also need to change
564   -- code in LinksUpdate.php. See bug 25254.
565   cl_sortkey_prefix varchar(255) binary NOT NULL default '',
567   -- This isn't really used at present. Provided for an optional
568   -- sorting method by approximate addition time.
569   cl_timestamp timestamp NOT NULL,
571   -- Stores $wgCategoryCollation at the time cl_sortkey was generated.  This
572   -- can be used to install new collation versions, tracking which rows are not
573   -- yet updated.  '' means no collation, this is a legacy row that needs to be
574   -- updated by updateCollation.php.  In the future, it might be possible to
575   -- specify different collations per category.
576   cl_collation varbinary(32) NOT NULL default '',
578   -- Stores whether cl_from is a category, file, or other page, so we can
579   -- paginate the three categories separately.  This never has to be updated
580   -- after the page is created, since none of these page types can be moved to
581   -- any other.
582   cl_type ENUM('page', 'subcat', 'file') NOT NULL default 'page'
583 ) /*$wgDBTableOptions*/;
585 CREATE UNIQUE INDEX /*i*/cl_from ON /*_*/categorylinks (cl_from,cl_to);
587 -- We always sort within a given category, and within a given type.  FIXME:
588 -- Formerly this index didn't cover cl_type (since that didn't exist), so old
589 -- callers won't be using an index: fix this?
590 CREATE INDEX /*i*/cl_sortkey ON /*_*/categorylinks (cl_to,cl_type,cl_sortkey,cl_from);
592 -- Used by the API (and some extensions)
593 CREATE INDEX /*i*/cl_timestamp ON /*_*/categorylinks (cl_to,cl_timestamp);
595 -- FIXME: Not used, delete this
596 CREATE INDEX /*i*/cl_collation ON /*_*/categorylinks (cl_collation);
599 -- Track all existing categories.  Something is a category if 1) it has an en-
600 -- try somewhere in categorylinks, or 2) it once did.  Categories might not
601 -- have corresponding pages, so they need to be tracked separately.
603 CREATE TABLE /*_*/category (
604   -- Primary key
605   cat_id int unsigned NOT NULL PRIMARY KEY AUTO_INCREMENT,
607   -- Name of the category, in the same form as page_title (with underscores).
608   -- If there is a category page corresponding to this category, by definition,
609   -- it has this name (in the Category namespace).
610   cat_title varchar(255) binary NOT NULL,
612   -- The numbers of member pages (including categories and media), subcatego-
613   -- ries, and Image: namespace members, respectively.  These are signed to
614   -- make underflow more obvious.  We make the first number include the second
615   -- two for better sorting: subtracting for display is easy, adding for order-
616   -- ing is not.
617   cat_pages int signed NOT NULL default 0,
618   cat_subcats int signed NOT NULL default 0,
619   cat_files int signed NOT NULL default 0
620 ) /*$wgDBTableOptions*/;
622 CREATE UNIQUE INDEX /*i*/cat_title ON /*_*/category (cat_title);
624 -- For Special:Mostlinkedcategories
625 CREATE INDEX /*i*/cat_pages ON /*_*/category (cat_pages);
629 -- Track links to external URLs
631 CREATE TABLE /*_*/externallinks (
632   -- Primary key
633   el_id int unsigned NOT NULL PRIMARY KEY AUTO_INCREMENT,
635   -- page_id of the referring page
636   el_from int unsigned NOT NULL default 0,
638   -- The URL
639   el_to blob NOT NULL,
641   -- In the case of HTTP URLs, this is the URL with any username or password
642   -- removed, and with the labels in the hostname reversed and converted to
643   -- lower case. An extra dot is added to allow for matching of either
644   -- example.com or *.example.com in a single scan.
645   -- Example:
646   --      http://user:password@sub.example.com/page.html
647   --   becomes
648   --      http://com.example.sub./page.html
649   -- which allows for fast searching for all pages under example.com with the
650   -- clause:
651   --      WHERE el_index LIKE 'http://com.example.%'
652   el_index blob NOT NULL
653 ) /*$wgDBTableOptions*/;
655 CREATE INDEX /*i*/el_from ON /*_*/externallinks (el_from, el_to(40));
656 CREATE INDEX /*i*/el_to ON /*_*/externallinks (el_to(60), el_from);
657 CREATE INDEX /*i*/el_index ON /*_*/externallinks (el_index(60));
660 -- Track interlanguage links
662 CREATE TABLE /*_*/langlinks (
663   -- page_id of the referring page
664   ll_from int unsigned NOT NULL default 0,
666   -- Language code of the target
667   ll_lang varbinary(20) NOT NULL default '',
669   -- Title of the target, including namespace
670   ll_title varchar(255) binary NOT NULL default ''
671 ) /*$wgDBTableOptions*/;
673 CREATE UNIQUE INDEX /*i*/ll_from ON /*_*/langlinks (ll_from, ll_lang);
674 CREATE INDEX /*i*/ll_lang ON /*_*/langlinks (ll_lang, ll_title);
678 -- Track inline interwiki links
680 CREATE TABLE /*_*/iwlinks (
681   -- page_id of the referring page
682   iwl_from int unsigned NOT NULL default 0,
684   -- Interwiki prefix code of the target
685   iwl_prefix varbinary(20) NOT NULL default '',
687   -- Title of the target, including namespace
688   iwl_title varchar(255) binary NOT NULL default ''
689 ) /*$wgDBTableOptions*/;
691 CREATE UNIQUE INDEX /*i*/iwl_from ON /*_*/iwlinks (iwl_from, iwl_prefix, iwl_title);
692 CREATE INDEX /*i*/iwl_prefix_title_from ON /*_*/iwlinks (iwl_prefix, iwl_title, iwl_from);
693 CREATE INDEX /*i*/iwl_prefix_from_title ON /*_*/iwlinks (iwl_prefix, iwl_from, iwl_title);
697 -- Contains a single row with some aggregate info
698 -- on the state of the site.
700 CREATE TABLE /*_*/site_stats (
701   -- The single row should contain 1 here.
702   ss_row_id int unsigned NOT NULL,
704   -- Total number of edits performed.
705   ss_total_edits bigint unsigned default 0,
707   -- An approximate count of pages matching the following criteria:
708   -- * in namespace 0
709   -- * not a redirect
710   -- * contains the text '[['
711   -- See Article::isCountable() in includes/Article.php
712   ss_good_articles bigint unsigned default 0,
714   -- Total pages, theoretically equal to SELECT COUNT(*) FROM page; except faster
715   ss_total_pages bigint default '-1',
717   -- Number of users, theoretically equal to SELECT COUNT(*) FROM user;
718   ss_users bigint default '-1',
720   -- Number of users that still edit
721   ss_active_users bigint default '-1',
723   -- Number of images, equivalent to SELECT COUNT(*) FROM image
724   ss_images int default 0
725 ) /*$wgDBTableOptions*/;
727 -- Pointless index to assuage developer superstitions
728 CREATE UNIQUE INDEX /*i*/ss_row_id ON /*_*/site_stats (ss_row_id);
731 -- The internet is full of jerks, alas. Sometimes it's handy
732 -- to block a vandal or troll account.
734 CREATE TABLE /*_*/ipblocks (
735   -- Primary key, introduced for privacy.
736   ipb_id int NOT NULL PRIMARY KEY AUTO_INCREMENT,
738   -- Blocked IP address in dotted-quad form or user name.
739   ipb_address tinyblob NOT NULL,
741   -- Blocked user ID or 0 for IP blocks.
742   ipb_user int unsigned NOT NULL default 0,
744   -- User ID who made the block.
745   ipb_by int unsigned NOT NULL default 0,
747   -- User name of blocker
748   ipb_by_text varchar(255) binary NOT NULL default '',
750   -- Text comment made by blocker.
751   ipb_reason tinyblob NOT NULL,
753   -- Creation (or refresh) date in standard YMDHMS form.
754   -- IP blocks expire automatically.
755   ipb_timestamp binary(14) NOT NULL default '',
757   -- Indicates that the IP address was banned because a banned
758   -- user accessed a page through it. If this is 1, ipb_address
759   -- will be hidden, and the block identified by block ID number.
760   ipb_auto bool NOT NULL default 0,
762   -- If set to 1, block applies only to logged-out users
763   ipb_anon_only bool NOT NULL default 0,
765   -- Block prevents account creation from matching IP addresses
766   ipb_create_account bool NOT NULL default 1,
768   -- Block triggers autoblocks
769   ipb_enable_autoblock bool NOT NULL default '1',
771   -- Time at which the block will expire.
772   -- May be "infinity"
773   ipb_expiry varbinary(14) NOT NULL default '',
775   -- Start and end of an address range, in hexadecimal
776   -- Size chosen to allow IPv6
777   -- FIXME: these fields were originally blank for single-IP blocks,
778   -- but now they are populated. No migration was ever done. They
779   -- should be fixed to be blank again for such blocks (bug 49504).
780   ipb_range_start tinyblob NOT NULL,
781   ipb_range_end tinyblob NOT NULL,
783   -- Flag for entries hidden from users and Sysops
784   ipb_deleted bool NOT NULL default 0,
786   -- Block prevents user from accessing Special:Emailuser
787   ipb_block_email bool NOT NULL default 0,
789   -- Block allows user to edit their own talk page
790   ipb_allow_usertalk bool NOT NULL default 0,
792   -- ID of the block that caused this block to exist
793   -- Autoblocks set this to the original block
794   -- so that the original block being deleted also
795   -- deletes the autoblocks
796   ipb_parent_block_id int default NULL
798 ) /*$wgDBTableOptions*/;
800 -- Unique index to support "user already blocked" messages
801 -- Any new options which prevent collisions should be included
802 CREATE UNIQUE INDEX /*i*/ipb_address ON /*_*/ipblocks (ipb_address(255), ipb_user, ipb_auto, ipb_anon_only);
804 CREATE INDEX /*i*/ipb_user ON /*_*/ipblocks (ipb_user);
805 CREATE INDEX /*i*/ipb_range ON /*_*/ipblocks (ipb_range_start(8), ipb_range_end(8));
806 CREATE INDEX /*i*/ipb_timestamp ON /*_*/ipblocks (ipb_timestamp);
807 CREATE INDEX /*i*/ipb_expiry ON /*_*/ipblocks (ipb_expiry);
808 CREATE INDEX /*i*/ipb_parent_block_id ON /*_*/ipblocks (ipb_parent_block_id);
812 -- Uploaded images and other files.
814 CREATE TABLE /*_*/image (
815   -- Filename.
816   -- This is also the title of the associated description page,
817   -- which will be in namespace 6 (NS_FILE).
818   img_name varchar(255) binary NOT NULL default '' PRIMARY KEY,
820   -- File size in bytes.
821   img_size int unsigned NOT NULL default 0,
823   -- For images, size in pixels.
824   img_width int NOT NULL default 0,
825   img_height int NOT NULL default 0,
827   -- Extracted Exif metadata stored as a serialized PHP array.
828   img_metadata mediumblob NOT NULL,
830   -- For images, bits per pixel if known.
831   img_bits int NOT NULL default 0,
833   -- Media type as defined by the MEDIATYPE_xxx constants
834   img_media_type ENUM("UNKNOWN", "BITMAP", "DRAWING", "AUDIO", "VIDEO", "MULTIMEDIA", "OFFICE", "TEXT", "EXECUTABLE", "ARCHIVE") default NULL,
836   -- major part of a MIME media type as defined by IANA
837   -- see http://www.iana.org/assignments/media-types/
838   -- for "chemical" cf. http://dx.doi.org/10.1021/ci9803233 by the ACS
839   img_major_mime ENUM("unknown", "application", "audio", "image", "text", "video", "message", "model", "multipart", "chemical") NOT NULL default "unknown",
841   -- minor part of a MIME media type as defined by IANA
842   -- the minor parts are not required to adher to any standard
843   -- but should be consistent throughout the database
844   -- see http://www.iana.org/assignments/media-types/
845   img_minor_mime varbinary(100) NOT NULL default "unknown",
847   -- Description field as entered by the uploader.
848   -- This is displayed in image upload history and logs.
849   img_description tinyblob NOT NULL,
851   -- user_id and user_name of uploader.
852   img_user int unsigned NOT NULL default 0,
853   img_user_text varchar(255) binary NOT NULL,
855   -- Time of the upload.
856   img_timestamp varbinary(14) NOT NULL default '',
858   -- SHA-1 content hash in base-36
859   img_sha1 varbinary(32) NOT NULL default ''
860 ) /*$wgDBTableOptions*/;
862 CREATE INDEX /*i*/img_usertext_timestamp ON /*_*/image (img_user_text,img_timestamp);
863 -- Used by Special:ListFiles for sort-by-size
864 CREATE INDEX /*i*/img_size ON /*_*/image (img_size);
865 -- Used by Special:Newimages and Special:ListFiles
866 CREATE INDEX /*i*/img_timestamp ON /*_*/image (img_timestamp);
867 -- Used in API and duplicate search
868 CREATE INDEX /*i*/img_sha1 ON /*_*/image (img_sha1(10));
869 -- Used to get media of one type
870 CREATE INDEX /*i*/img_media_mime ON /*_*/image (img_media_type,img_major_mime,img_minor_mime);
874 -- Previous revisions of uploaded files.
875 -- Awkwardly, image rows have to be moved into
876 -- this table at re-upload time.
878 CREATE TABLE /*_*/oldimage (
879   -- Base filename: key to image.img_name
880   oi_name varchar(255) binary NOT NULL default '',
882   -- Filename of the archived file.
883   -- This is generally a timestamp and '!' prepended to the base name.
884   oi_archive_name varchar(255) binary NOT NULL default '',
886   -- Other fields as in image...
887   oi_size int unsigned NOT NULL default 0,
888   oi_width int NOT NULL default 0,
889   oi_height int NOT NULL default 0,
890   oi_bits int NOT NULL default 0,
891   oi_description tinyblob NOT NULL,
892   oi_user int unsigned NOT NULL default 0,
893   oi_user_text varchar(255) binary NOT NULL,
894   oi_timestamp binary(14) NOT NULL default '',
896   oi_metadata mediumblob NOT NULL,
897   oi_media_type ENUM("UNKNOWN", "BITMAP", "DRAWING", "AUDIO", "VIDEO", "MULTIMEDIA", "OFFICE", "TEXT", "EXECUTABLE", "ARCHIVE") default NULL,
898   oi_major_mime ENUM("unknown", "application", "audio", "image", "text", "video", "message", "model", "multipart", "chemical") NOT NULL default "unknown",
899   oi_minor_mime varbinary(100) NOT NULL default "unknown",
900   oi_deleted tinyint unsigned NOT NULL default 0,
901   oi_sha1 varbinary(32) NOT NULL default ''
902 ) /*$wgDBTableOptions*/;
904 CREATE INDEX /*i*/oi_usertext_timestamp ON /*_*/oldimage (oi_user_text,oi_timestamp);
905 CREATE INDEX /*i*/oi_name_timestamp ON /*_*/oldimage (oi_name,oi_timestamp);
906 -- oi_archive_name truncated to 14 to avoid key length overflow
907 CREATE INDEX /*i*/oi_name_archive_name ON /*_*/oldimage (oi_name,oi_archive_name(14));
908 CREATE INDEX /*i*/oi_sha1 ON /*_*/oldimage (oi_sha1(10));
912 -- Record of deleted file data
914 CREATE TABLE /*_*/filearchive (
915   -- Unique row id
916   fa_id int NOT NULL PRIMARY KEY AUTO_INCREMENT,
918   -- Original base filename; key to image.img_name, page.page_title, etc
919   fa_name varchar(255) binary NOT NULL default '',
921   -- Filename of archived file, if an old revision
922   fa_archive_name varchar(255) binary default '',
924   -- Which storage bin (directory tree or object store) the file data
925   -- is stored in. Should be 'deleted' for files that have been deleted;
926   -- any other bin is not yet in use.
927   fa_storage_group varbinary(16),
929   -- SHA-1 of the file contents plus extension, used as a key for storage.
930   -- eg 8f8a562add37052a1848ff7771a2c515db94baa9.jpg
931   --
932   -- If NULL, the file was missing at deletion time or has been purged
933   -- from the archival storage.
934   fa_storage_key varbinary(64) default '',
936   -- Deletion information, if this file is deleted.
937   fa_deleted_user int,
938   fa_deleted_timestamp binary(14) default '',
939   fa_deleted_reason text,
941   -- Duped fields from image
942   fa_size int unsigned default 0,
943   fa_width int default 0,
944   fa_height int default 0,
945   fa_metadata mediumblob,
946   fa_bits int default 0,
947   fa_media_type ENUM("UNKNOWN", "BITMAP", "DRAWING", "AUDIO", "VIDEO", "MULTIMEDIA", "OFFICE", "TEXT", "EXECUTABLE", "ARCHIVE") default NULL,
948   fa_major_mime ENUM("unknown", "application", "audio", "image", "text", "video", "message", "model", "multipart", "chemical") default "unknown",
949   fa_minor_mime varbinary(100) default "unknown",
950   fa_description tinyblob,
951   fa_user int unsigned default 0,
952   fa_user_text varchar(255) binary,
953   fa_timestamp binary(14) default '',
955   -- Visibility of deleted revisions, bitfield
956   fa_deleted tinyint unsigned NOT NULL default 0,
958   -- sha1 hash of file content
959   fa_sha1 varbinary(32) NOT NULL default ''
960 ) /*$wgDBTableOptions*/;
962 -- pick out by image name
963 CREATE INDEX /*i*/fa_name ON /*_*/filearchive (fa_name, fa_timestamp);
964 -- pick out dupe files
965 CREATE INDEX /*i*/fa_storage_group ON /*_*/filearchive (fa_storage_group, fa_storage_key);
966 -- sort by deletion time
967 CREATE INDEX /*i*/fa_deleted_timestamp ON /*_*/filearchive (fa_deleted_timestamp);
968 -- sort by uploader
969 CREATE INDEX /*i*/fa_user_timestamp ON /*_*/filearchive (fa_user_text,fa_timestamp);
970 -- find file by sha1, 10 bytes will be enough for hashes to be indexed
971 CREATE INDEX /*i*/fa_sha1 ON /*_*/filearchive (fa_sha1(10));
975 -- Store information about newly uploaded files before they're
976 -- moved into the actual filestore
978 CREATE TABLE /*_*/uploadstash (
979   us_id int unsigned NOT NULL PRIMARY KEY AUTO_INCREMENT,
981   -- the user who uploaded the file.
982   us_user int unsigned NOT NULL,
984   -- file key. this is how applications actually search for the file.
985   -- this might go away, or become the primary key.
986   us_key varchar(255) NOT NULL,
988   -- the original path
989   us_orig_path varchar(255) NOT NULL,
991   -- the temporary path at which the file is actually stored
992   us_path varchar(255) NOT NULL,
994   -- which type of upload the file came from (sometimes)
995   us_source_type varchar(50),
997   -- the date/time on which the file was added
998   us_timestamp varbinary(14) NOT NULL,
1000   us_status varchar(50) NOT NULL,
1002   -- chunk counter starts at 0, current offset is stored in us_size
1003   us_chunk_inx int unsigned NULL,
1005   -- Serialized file properties from FSFile::getProps()
1006   us_props blob,
1008   -- file size in bytes
1009   us_size int unsigned NOT NULL,
1010   -- this hash comes from FSFile::getSha1Base36(), and is 31 characters
1011   us_sha1 varchar(31) NOT NULL,
1012   us_mime varchar(255),
1013   -- Media type as defined by the MEDIATYPE_xxx constants, should duplicate definition in the image table
1014   us_media_type ENUM("UNKNOWN", "BITMAP", "DRAWING", "AUDIO", "VIDEO", "MULTIMEDIA", "OFFICE", "TEXT", "EXECUTABLE", "ARCHIVE") default NULL,
1015   -- image-specific properties
1016   us_image_width int unsigned,
1017   us_image_height int unsigned,
1018   us_image_bits smallint unsigned
1020 ) /*$wgDBTableOptions*/;
1022 -- sometimes there's a delete for all of a user's stuff.
1023 CREATE INDEX /*i*/us_user ON /*_*/uploadstash (us_user);
1024 -- pick out files by key, enforce key uniqueness
1025 CREATE UNIQUE INDEX /*i*/us_key ON /*_*/uploadstash (us_key);
1026 -- the abandoned upload cleanup script needs this
1027 CREATE INDEX /*i*/us_timestamp ON /*_*/uploadstash (us_timestamp);
1031 -- Primarily a summary table for Special:Recentchanges,
1032 -- this table contains some additional info on edits from
1033 -- the last few days, see Article::editUpdates()
1035 CREATE TABLE /*_*/recentchanges (
1036   rc_id int NOT NULL PRIMARY KEY AUTO_INCREMENT,
1037   rc_timestamp varbinary(14) NOT NULL default '',
1039   -- As in revision
1040   rc_user int unsigned NOT NULL default 0,
1041   rc_user_text varchar(255) binary NOT NULL,
1043   -- When pages are renamed, their RC entries do _not_ change.
1044   rc_namespace int NOT NULL default 0,
1045   rc_title varchar(255) binary NOT NULL default '',
1047   -- as in revision...
1048   rc_comment varchar(255) binary NOT NULL default '',
1049   rc_minor tinyint unsigned NOT NULL default 0,
1051   -- Edits by user accounts with the 'bot' rights key are
1052   -- marked with a 1 here, and will be hidden from the
1053   -- default view.
1054   rc_bot tinyint unsigned NOT NULL default 0,
1056   -- Set if this change corresponds to a page creation
1057   rc_new tinyint unsigned NOT NULL default 0,
1059   -- Key to page_id (was cur_id prior to 1.5).
1060   -- This will keep links working after moves while
1061   -- retaining the at-the-time name in the changes list.
1062   rc_cur_id int unsigned NOT NULL default 0,
1064   -- rev_id of the given revision
1065   rc_this_oldid int unsigned NOT NULL default 0,
1067   -- rev_id of the prior revision, for generating diff links.
1068   rc_last_oldid int unsigned NOT NULL default 0,
1070   -- The type of change entry (RC_EDIT,RC_NEW,RC_LOG,RC_EXTERNAL)
1071   rc_type tinyint unsigned NOT NULL default 0,
1073   -- The source of the change entry (replaces rc_type)
1074   -- default of '' is temporary, needed for initial migration
1075   rc_source varchar(16) binary not null default '',
1077   -- If the Recent Changes Patrol option is enabled,
1078   -- users may mark edits as having been reviewed to
1079   -- remove a warning flag on the RC list.
1080   -- A value of 1 indicates the page has been reviewed.
1081   rc_patrolled tinyint unsigned NOT NULL default 0,
1083   -- Recorded IP address the edit was made from, if the
1084   -- $wgPutIPinRC option is enabled.
1085   rc_ip varbinary(40) NOT NULL default '',
1087   -- Text length in characters before
1088   -- and after the edit
1089   rc_old_len int,
1090   rc_new_len int,
1092   -- Visibility of recent changes items, bitfield
1093   rc_deleted tinyint unsigned NOT NULL default 0,
1095   -- Value corresponding to log_id, specific log entries
1096   rc_logid int unsigned NOT NULL default 0,
1097   -- Store log type info here, or null
1098   rc_log_type varbinary(255) NULL default NULL,
1099   -- Store log action or null
1100   rc_log_action varbinary(255) NULL default NULL,
1101   -- Log params
1102   rc_params blob NULL
1103 ) /*$wgDBTableOptions*/;
1105 CREATE INDEX /*i*/rc_timestamp ON /*_*/recentchanges (rc_timestamp);
1106 CREATE INDEX /*i*/rc_namespace_title ON /*_*/recentchanges (rc_namespace, rc_title);
1107 CREATE INDEX /*i*/rc_cur_id ON /*_*/recentchanges (rc_cur_id);
1108 CREATE INDEX /*i*/new_name_timestamp ON /*_*/recentchanges (rc_new,rc_namespace,rc_timestamp);
1109 CREATE INDEX /*i*/rc_ip ON /*_*/recentchanges (rc_ip);
1110 CREATE INDEX /*i*/rc_ns_usertext ON /*_*/recentchanges (rc_namespace, rc_user_text);
1111 CREATE INDEX /*i*/rc_user_text ON /*_*/recentchanges (rc_user_text, rc_timestamp);
1114 CREATE TABLE /*_*/watchlist (
1115   -- Key to user.user_id
1116   wl_user int unsigned NOT NULL,
1118   -- Key to page_namespace/page_title
1119   -- Note that users may watch pages which do not exist yet,
1120   -- or existed in the past but have been deleted.
1121   wl_namespace int NOT NULL default 0,
1122   wl_title varchar(255) binary NOT NULL default '',
1124   -- Timestamp used to send notification e-mails and show "updated since last visit" markers on
1125   -- history and recent changes / watchlist. Set to NULL when the user visits the latest revision
1126   -- of the page, which means that they should be sent an e-mail on the next change.
1127   wl_notificationtimestamp varbinary(14)
1129 ) /*$wgDBTableOptions*/;
1131 CREATE UNIQUE INDEX /*i*/wl_user ON /*_*/watchlist (wl_user, wl_namespace, wl_title);
1132 CREATE INDEX /*i*/namespace_title ON /*_*/watchlist (wl_namespace, wl_title);
1133 CREATE INDEX /*i*/wl_user_notificationtimestamp ON /*_*/watchlist (wl_user, wl_notificationtimestamp);
1137 -- When using the default MySQL search backend, page titles
1138 -- and text are munged to strip markup, do Unicode case folding,
1139 -- and prepare the result for MySQL's fulltext index.
1141 -- This table must be MyISAM; InnoDB does not support the needed
1142 -- fulltext index.
1144 CREATE TABLE /*_*/searchindex (
1145   -- Key to page_id
1146   si_page int unsigned NOT NULL,
1148   -- Munged version of title
1149   si_title varchar(255) NOT NULL default '',
1151   -- Munged version of body text
1152   si_text mediumtext NOT NULL
1153 ) ENGINE=MyISAM DEFAULT CHARSET=utf8;
1155 CREATE UNIQUE INDEX /*i*/si_page ON /*_*/searchindex (si_page);
1156 CREATE FULLTEXT INDEX /*i*/si_title ON /*_*/searchindex (si_title);
1157 CREATE FULLTEXT INDEX /*i*/si_text ON /*_*/searchindex (si_text);
1161 -- Recognized interwiki link prefixes
1163 CREATE TABLE /*_*/interwiki (
1164   -- The interwiki prefix, (e.g. "Meatball", or the language prefix "de")
1165   iw_prefix varchar(32) NOT NULL,
1167   -- The URL of the wiki, with "$1" as a placeholder for an article name.
1168   -- Any spaces in the name will be transformed to underscores before
1169   -- insertion.
1170   iw_url blob NOT NULL,
1172   -- The URL of the file api.php
1173   iw_api blob NOT NULL,
1175   -- The name of the database (for a connection to be established with wfGetLB( 'wikiid' ))
1176   iw_wikiid varchar(64) NOT NULL,
1178   -- A boolean value indicating whether the wiki is in this project
1179   -- (used, for example, to detect redirect loops)
1180   iw_local bool NOT NULL,
1182   -- Boolean value indicating whether interwiki transclusions are allowed.
1183   iw_trans tinyint NOT NULL default 0
1184 ) /*$wgDBTableOptions*/;
1186 CREATE UNIQUE INDEX /*i*/iw_prefix ON /*_*/interwiki (iw_prefix);
1190 -- Used for caching expensive grouped queries
1192 CREATE TABLE /*_*/querycache (
1193   -- A key name, generally the base name of of the special page.
1194   qc_type varbinary(32) NOT NULL,
1196   -- Some sort of stored value. Sizes, counts...
1197   qc_value int unsigned NOT NULL default 0,
1199   -- Target namespace+title
1200   qc_namespace int NOT NULL default 0,
1201   qc_title varchar(255) binary NOT NULL default ''
1202 ) /*$wgDBTableOptions*/;
1204 CREATE INDEX /*i*/qc_type ON /*_*/querycache (qc_type,qc_value);
1208 -- For a few generic cache operations if not using Memcached
1210 CREATE TABLE /*_*/objectcache (
1211   keyname varbinary(255) NOT NULL default '' PRIMARY KEY,
1212   value mediumblob,
1213   exptime datetime
1214 ) /*$wgDBTableOptions*/;
1215 CREATE INDEX /*i*/exptime ON /*_*/objectcache (exptime);
1219 -- Cache of interwiki transclusion
1221 CREATE TABLE /*_*/transcache (
1222   tc_url varbinary(255) NOT NULL,
1223   tc_contents text,
1224   tc_time binary(14) NOT NULL
1225 ) /*$wgDBTableOptions*/;
1227 CREATE UNIQUE INDEX /*i*/tc_url_idx ON /*_*/transcache (tc_url);
1230 CREATE TABLE /*_*/logging (
1231   -- Log ID, for referring to this specific log entry, probably for deletion and such.
1232   log_id int unsigned NOT NULL PRIMARY KEY AUTO_INCREMENT,
1234   -- Symbolic keys for the general log type and the action type
1235   -- within the log. The output format will be controlled by the
1236   -- action field, but only the type controls categorization.
1237   log_type varbinary(32) NOT NULL default '',
1238   log_action varbinary(32) NOT NULL default '',
1240   -- Timestamp. Duh.
1241   log_timestamp binary(14) NOT NULL default '19700101000000',
1243   -- The user who performed this action; key to user_id
1244   log_user int unsigned NOT NULL default 0,
1246   -- Name of the user who performed this action
1247   log_user_text varchar(255) binary NOT NULL default '',
1249   -- Key to the page affected. Where a user is the target,
1250   -- this will point to the user page.
1251   log_namespace int NOT NULL default 0,
1252   log_title varchar(255) binary NOT NULL default '',
1253   log_page int unsigned NULL,
1255   -- Freeform text. Interpreted as edit history comments.
1256   log_comment varchar(255) NOT NULL default '',
1258   -- miscellaneous parameters:
1259   -- LF separated list (old system) or serialized PHP array (new system)
1260   log_params blob NOT NULL,
1262   -- rev_deleted for logs
1263   log_deleted tinyint unsigned NOT NULL default 0
1264 ) /*$wgDBTableOptions*/;
1266 CREATE INDEX /*i*/type_time ON /*_*/logging (log_type, log_timestamp);
1267 CREATE INDEX /*i*/user_time ON /*_*/logging (log_user, log_timestamp);
1268 CREATE INDEX /*i*/page_time ON /*_*/logging (log_namespace, log_title, log_timestamp);
1269 CREATE INDEX /*i*/times ON /*_*/logging (log_timestamp);
1270 CREATE INDEX /*i*/log_user_type_time ON /*_*/logging (log_user, log_type, log_timestamp);
1271 CREATE INDEX /*i*/log_page_id_time ON /*_*/logging (log_page,log_timestamp);
1272 CREATE INDEX /*i*/type_action ON /*_*/logging (log_type, log_action, log_timestamp);
1273 CREATE INDEX /*i*/log_user_text_type_time ON /*_*/logging (log_user_text, log_type, log_timestamp);
1274 CREATE INDEX /*i*/log_user_text_time ON /*_*/logging (log_user_text, log_timestamp);
1277 CREATE TABLE /*_*/log_search (
1278   -- The type of ID (rev ID, log ID, rev timestamp, username)
1279   ls_field varbinary(32) NOT NULL,
1280   -- The value of the ID
1281   ls_value varchar(255) NOT NULL,
1282   -- Key to log_id
1283   ls_log_id int unsigned NOT NULL default 0
1284 ) /*$wgDBTableOptions*/;
1285 CREATE UNIQUE INDEX /*i*/ls_field_val ON /*_*/log_search (ls_field,ls_value,ls_log_id);
1286 CREATE INDEX /*i*/ls_log_id ON /*_*/log_search (ls_log_id);
1289 -- Jobs performed by parallel apache threads or a command-line daemon
1290 CREATE TABLE /*_*/job (
1291   job_id int unsigned NOT NULL PRIMARY KEY AUTO_INCREMENT,
1293   -- Command name
1294   -- Limited to 60 to prevent key length overflow
1295   job_cmd varbinary(60) NOT NULL default '',
1297   -- Namespace and title to act on
1298   -- Should be 0 and '' if the command does not operate on a title
1299   job_namespace int NOT NULL,
1300   job_title varchar(255) binary NOT NULL,
1302   -- Timestamp of when the job was inserted
1303   -- NULL for jobs added before addition of the timestamp
1304   job_timestamp varbinary(14) NULL default NULL,
1306   -- Any other parameters to the command
1307   -- Stored as a PHP serialized array, or an empty string if there are no parameters
1308   job_params blob NOT NULL,
1310   -- Random, non-unique, number used for job acquisition (for lock concurrency)
1311   job_random integer unsigned NOT NULL default 0,
1313   -- The number of times this job has been locked
1314   job_attempts integer unsigned NOT NULL default 0,
1316   -- Field that conveys process locks on rows via process UUIDs
1317   job_token varbinary(32) NOT NULL default '',
1319   -- Timestamp when the job was locked
1320   job_token_timestamp varbinary(14) NULL default NULL,
1322   -- Base 36 SHA1 of the job parameters relevant to detecting duplicates
1323   job_sha1 varbinary(32) NOT NULL default ''
1324 ) /*$wgDBTableOptions*/;
1326 CREATE INDEX /*i*/job_sha1 ON /*_*/job (job_sha1);
1327 CREATE INDEX /*i*/job_cmd_token ON /*_*/job (job_cmd,job_token,job_random);
1328 CREATE INDEX /*i*/job_cmd_token_id ON /*_*/job (job_cmd,job_token,job_id);
1329 CREATE INDEX /*i*/job_cmd ON /*_*/job (job_cmd, job_namespace, job_title, job_params(128));
1330 CREATE INDEX /*i*/job_timestamp ON /*_*/job (job_timestamp);
1333 -- Details of updates to cached special pages
1334 CREATE TABLE /*_*/querycache_info (
1335   -- Special page name
1336   -- Corresponds to a qc_type value
1337   qci_type varbinary(32) NOT NULL default '',
1339   -- Timestamp of last update
1340   qci_timestamp binary(14) NOT NULL default '19700101000000'
1341 ) /*$wgDBTableOptions*/;
1343 CREATE UNIQUE INDEX /*i*/qci_type ON /*_*/querycache_info (qci_type);
1346 -- For each redirect, this table contains exactly one row defining its target
1347 CREATE TABLE /*_*/redirect (
1348   -- Key to the page_id of the redirect page
1349   rd_from int unsigned NOT NULL default 0 PRIMARY KEY,
1351   -- Key to page_namespace/page_title of the target page.
1352   -- The target page may or may not exist, and due to renames
1353   -- and deletions may refer to different page records as time
1354   -- goes by.
1355   rd_namespace int NOT NULL default 0,
1356   rd_title varchar(255) binary NOT NULL default '',
1357   rd_interwiki varchar(32) default NULL,
1358   rd_fragment varchar(255) binary default NULL
1359 ) /*$wgDBTableOptions*/;
1361 CREATE INDEX /*i*/rd_ns_title ON /*_*/redirect (rd_namespace,rd_title,rd_from);
1364 -- Used for caching expensive grouped queries that need two links (for example double-redirects)
1365 CREATE TABLE /*_*/querycachetwo (
1366   -- A key name, generally the base name of of the special page.
1367   qcc_type varbinary(32) NOT NULL,
1369   -- Some sort of stored value. Sizes, counts...
1370   qcc_value int unsigned NOT NULL default 0,
1372   -- Target namespace+title
1373   qcc_namespace int NOT NULL default 0,
1374   qcc_title varchar(255) binary NOT NULL default '',
1376   -- Target namespace+title2
1377   qcc_namespacetwo int NOT NULL default 0,
1378   qcc_titletwo varchar(255) binary NOT NULL default ''
1379 ) /*$wgDBTableOptions*/;
1381 CREATE INDEX /*i*/qcc_type ON /*_*/querycachetwo (qcc_type,qcc_value);
1382 CREATE INDEX /*i*/qcc_title ON /*_*/querycachetwo (qcc_type,qcc_namespace,qcc_title);
1383 CREATE INDEX /*i*/qcc_titletwo ON /*_*/querycachetwo (qcc_type,qcc_namespacetwo,qcc_titletwo);
1386 -- Used for storing page restrictions (i.e. protection levels)
1387 CREATE TABLE /*_*/page_restrictions (
1388   -- Field for an ID for this restrictions row (sort-key for Special:ProtectedPages)
1389   pr_id int unsigned NOT NULL PRIMARY KEY AUTO_INCREMENT,
1390   -- Page to apply restrictions to (Foreign Key to page).
1391   pr_page int NOT NULL,
1392   -- The protection type (edit, move, etc)
1393   pr_type varbinary(60) NOT NULL,
1394   -- The protection level (Sysop, autoconfirmed, etc)
1395   pr_level varbinary(60) NOT NULL,
1396   -- Whether or not to cascade the protection down to pages transcluded.
1397   pr_cascade tinyint NOT NULL,
1398   -- Field for future support of per-user restriction.
1399   pr_user int NULL,
1400   -- Field for time-limited protection.
1401   pr_expiry varbinary(14) NULL
1402 ) /*$wgDBTableOptions*/;
1404 CREATE UNIQUE INDEX /*i*/pr_pagetype ON /*_*/page_restrictions (pr_page,pr_type);
1405 CREATE INDEX /*i*/pr_typelevel ON /*_*/page_restrictions (pr_type,pr_level);
1406 CREATE INDEX /*i*/pr_level ON /*_*/page_restrictions (pr_level);
1407 CREATE INDEX /*i*/pr_cascade ON /*_*/page_restrictions (pr_cascade);
1410 -- Protected titles - nonexistent pages that have been protected
1411 CREATE TABLE /*_*/protected_titles (
1412   pt_namespace int NOT NULL,
1413   pt_title varchar(255) binary NOT NULL,
1414   pt_user int unsigned NOT NULL,
1415   pt_reason tinyblob,
1416   pt_timestamp binary(14) NOT NULL,
1417   pt_expiry varbinary(14) NOT NULL default '',
1418   pt_create_perm varbinary(60) NOT NULL
1419 ) /*$wgDBTableOptions*/;
1421 CREATE UNIQUE INDEX /*i*/pt_namespace_title ON /*_*/protected_titles (pt_namespace,pt_title);
1422 CREATE INDEX /*i*/pt_timestamp ON /*_*/protected_titles (pt_timestamp);
1425 -- Name/value pairs indexed by page_id
1426 CREATE TABLE /*_*/page_props (
1427   pp_page int NOT NULL,
1428   pp_propname varbinary(60) NOT NULL,
1429   pp_value blob NOT NULL,
1430   pp_sortkey float DEFAULT NULL
1431 ) /*$wgDBTableOptions*/;
1433 CREATE UNIQUE INDEX /*i*/pp_page_propname ON /*_*/page_props (pp_page,pp_propname);
1434 CREATE UNIQUE INDEX /*i*/pp_propname_page ON /*_*/page_props (pp_propname,pp_page);
1435 CREATE UNIQUE INDEX /*i*/pp_propname_sortkey_page ON /*_*/page_props (pp_propname,pp_sortkey,pp_page);
1437 -- A table to log updates, one text key row per update.
1438 CREATE TABLE /*_*/updatelog (
1439   ul_key varchar(255) NOT NULL PRIMARY KEY,
1440   ul_value blob
1441 ) /*$wgDBTableOptions*/;
1444 -- A table to track tags for revisions, logs and recent changes.
1445 CREATE TABLE /*_*/change_tag (
1446   -- RCID for the change
1447   ct_rc_id int NULL,
1448   -- LOGID for the change
1449   ct_log_id int NULL,
1450   -- REVID for the change
1451   ct_rev_id int NULL,
1452   -- Tag applied
1453   ct_tag varchar(255) NOT NULL,
1454   -- Parameters for the tag, presently unused
1455   ct_params blob NULL
1456 ) /*$wgDBTableOptions*/;
1458 CREATE UNIQUE INDEX /*i*/change_tag_rc_tag ON /*_*/change_tag (ct_rc_id,ct_tag);
1459 CREATE UNIQUE INDEX /*i*/change_tag_log_tag ON /*_*/change_tag (ct_log_id,ct_tag);
1460 CREATE UNIQUE INDEX /*i*/change_tag_rev_tag ON /*_*/change_tag (ct_rev_id,ct_tag);
1461 -- Covering index, so we can pull all the info only out of the index.
1462 CREATE INDEX /*i*/change_tag_tag_id ON /*_*/change_tag (ct_tag,ct_rc_id,ct_rev_id,ct_log_id);
1465 -- Rollup table to pull a LIST of tags simply without ugly GROUP_CONCAT
1466 -- that only works on MySQL 4.1+
1467 CREATE TABLE /*_*/tag_summary (
1468   -- RCID for the change
1469   ts_rc_id int NULL,
1470   -- LOGID for the change
1471   ts_log_id int NULL,
1472   -- REVID for the change
1473   ts_rev_id int NULL,
1474   -- Comma-separated list of tags
1475   ts_tags blob NOT NULL
1476 ) /*$wgDBTableOptions*/;
1478 CREATE UNIQUE INDEX /*i*/tag_summary_rc_id ON /*_*/tag_summary (ts_rc_id);
1479 CREATE UNIQUE INDEX /*i*/tag_summary_log_id ON /*_*/tag_summary (ts_log_id);
1480 CREATE UNIQUE INDEX /*i*/tag_summary_rev_id ON /*_*/tag_summary (ts_rev_id);
1483 CREATE TABLE /*_*/valid_tag (
1484   vt_tag varchar(255) NOT NULL PRIMARY KEY
1485 ) /*$wgDBTableOptions*/;
1487 -- Table for storing localisation data
1488 CREATE TABLE /*_*/l10n_cache (
1489   -- Language code
1490   lc_lang varbinary(32) NOT NULL,
1491   -- Cache key
1492   lc_key varchar(255) NOT NULL,
1493   -- Value
1494   lc_value mediumblob NOT NULL
1495 ) /*$wgDBTableOptions*/;
1496 CREATE INDEX /*i*/lc_lang_key ON /*_*/l10n_cache (lc_lang, lc_key);
1498 -- Table for caching JSON message blobs for the resource loader
1499 CREATE TABLE /*_*/msg_resource (
1500   -- Resource name
1501   mr_resource varbinary(255) NOT NULL,
1502   -- Language code
1503   mr_lang varbinary(32) NOT NULL,
1504   -- JSON blob
1505   mr_blob mediumblob NOT NULL,
1506   -- Timestamp of last update
1507   mr_timestamp binary(14) NOT NULL
1508 ) /*$wgDBTableOptions*/;
1509 CREATE UNIQUE INDEX /*i*/mr_resource_lang ON /*_*/msg_resource (mr_resource, mr_lang);
1511 -- Table for administering which message is contained in which resource
1512 CREATE TABLE /*_*/msg_resource_links (
1513   mrl_resource varbinary(255) NOT NULL,
1514   -- Message key
1515   mrl_message varbinary(255) NOT NULL
1516 ) /*$wgDBTableOptions*/;
1517 CREATE UNIQUE INDEX /*i*/mrl_message_resource ON /*_*/msg_resource_links (mrl_message, mrl_resource);
1519 -- Table caching which local files a module depends on that aren't
1520 -- registered directly, used for fast retrieval of file dependency.
1521 -- Currently only used for tracking images that CSS depends on
1522 CREATE TABLE /*_*/module_deps (
1523   -- Module name
1524   md_module varbinary(255) NOT NULL,
1525   -- Skin name
1526   md_skin varbinary(32) NOT NULL,
1527   -- JSON blob with file dependencies
1528   md_deps mediumblob NOT NULL
1529 ) /*$wgDBTableOptions*/;
1530 CREATE UNIQUE INDEX /*i*/md_module_skin ON /*_*/module_deps (md_module, md_skin);
1532 -- Holds all the sites known to the wiki.
1533 CREATE TABLE /*_*/sites (
1534   -- Numeric id of the site
1535   site_id                    INT UNSIGNED        NOT NULL PRIMARY KEY AUTO_INCREMENT,
1537   -- Global identifier for the site, ie 'enwiktionary'
1538   site_global_key            varbinary(32)       NOT NULL,
1540   -- Type of the site, ie 'mediawiki'
1541   site_type                  varbinary(32)       NOT NULL,
1543   -- Group of the site, ie 'wikipedia'
1544   site_group                 varbinary(32)       NOT NULL,
1546   -- Source of the site data, ie 'local', 'wikidata', 'my-magical-repo'
1547   site_source                varbinary(32)       NOT NULL,
1549   -- Language code of the sites primary language.
1550   site_language              varbinary(32)       NOT NULL,
1552   -- Protocol of the site, ie 'http://', 'irc://', '//'
1553   -- This field is an index for lookups and is build from type specific data in site_data.
1554   site_protocol              varbinary(32)       NOT NULL,
1556   -- Domain of the site in reverse order, ie 'org.mediawiki.www.'
1557   -- This field is an index for lookups and is build from type specific data in site_data.
1558   site_domain                VARCHAR(255)        NOT NULL,
1560   -- Type dependent site data.
1561   site_data                  BLOB                NOT NULL,
1563   -- If site.tld/path/key:pageTitle should forward users to  the page on
1564   -- the actual site, where "key" is the local identifier.
1565   site_forward              bool                NOT NULL,
1567   -- Type dependent site config.
1568   -- For instance if template transclusion should be allowed if it's a MediaWiki.
1569   site_config               BLOB                NOT NULL
1570 ) /*$wgDBTableOptions*/;
1572 CREATE UNIQUE INDEX /*i*/sites_global_key ON /*_*/sites (site_global_key);
1573 CREATE INDEX /*i*/sites_type ON /*_*/sites (site_type);
1574 CREATE INDEX /*i*/sites_group ON /*_*/sites (site_group);
1575 CREATE INDEX /*i*/sites_source ON /*_*/sites (site_source);
1576 CREATE INDEX /*i*/sites_language ON /*_*/sites (site_language);
1577 CREATE INDEX /*i*/sites_protocol ON /*_*/sites (site_protocol);
1578 CREATE INDEX /*i*/sites_domain ON /*_*/sites (site_domain);
1579 CREATE INDEX /*i*/sites_forward ON /*_*/sites (site_forward);
1581 -- Links local site identifiers to their corresponding site.
1582 CREATE TABLE /*_*/site_identifiers (
1583   -- Key on site.site_id
1584   si_site                    INT UNSIGNED        NOT NULL,
1586   -- local key type, ie 'interwiki' or 'langlink'
1587   si_type                    varbinary(32)       NOT NULL,
1589   -- local key value, ie 'en' or 'wiktionary'
1590   si_key                     varbinary(32)       NOT NULL
1591 ) /*$wgDBTableOptions*/;
1593 CREATE UNIQUE INDEX /*i*/site_ids_type ON /*_*/site_identifiers (si_type, si_key);
1594 CREATE INDEX /*i*/site_ids_site ON /*_*/site_identifiers (si_site);
1595 CREATE INDEX /*i*/site_ids_key ON /*_*/site_identifiers (si_key);
1597 -- vim: sw=2 sts=2 et