kd2.py also now uses BaseDictionary for entry lookup support.
[jblite.git] / jmdict_plan.txt
bloba747c160f5d2a39807e2319ae68ab82d058d8e76
1 JMDict structure\r
2 ================\r
3 \r
4 JMdict\r
5   entry\r
6     ent_seq (int)  # Just use orig code; don't add autonumber\r
7     k_ele*\r
8       keb (text)\r
9       ke_inf* (info field: ENTITY: &ateji; &iK; &ik; &io; &oK;)\r
10       ke_pri* (priority: TEXT (or could make a table and ref by int to save space...))\r
11     r_ele+\r
12       reb (text)\r
13       re_nokanji? (empty tag: boolean t/f)\r
14       re_restr* (text, matches one "keb" string)\r
15       re_inf* (info: ENTITY: &gikun; &ik; &ok; &uK;)\r
16       re_pri* (see ke_pri)\r
17     info?\r
18       links*   # UNUSED\r
19         link_tag (???)   # UNUSED\r
20         link_desc (text) # UNUSED\r
21         link_uri (text)  # UNUSED\r
22       bibl*    # UNUSED\r
23         bib_tag? (???)   # UNUSED\r
24         bib_txt? (text)  # UNUSED\r
25       etym* (???)   # UNUSED\r
26       audit*\r
27         upd_date (text/date, always YYYY/MM/DD format datestamp)\r
28         upd_detl (text, "Entry amended" (x1818) or "Entry created" (x51861),\r
29                   could have others...)\r
30     sense+\r
31       stagk* (text, matches keb) ("sense tag k")\r
32       stagr* (text, matches reb)\r
33       pos* (text or int ref to entity code)  # check ElementTree parsing of entities\r
34       xref* (text w/ special format - for now, just store)   # What does (#PCDATA)* mean???\r
35       ant* (text, matches keb/reb)\r
36       field* (text or int ref to entity code)\r
37       misc* (text or int ref to entity code)\r
38       s_inf* (text)\r
39       lsource* (xml:lang TEXT (def "eng"),\r
40                 ls_type (implied "full", "part" when spec'd (UNUSED) -> constant tbl?  t/f?),\r
41                 ls_wasei (t/f flag...?) (always "y" if spec'd))\r
42                (text or empty str (why???))\r
43       dial* (entity code)\r
44       gloss* (xml:lang TEXT (def "eng"), g_gend (abs irrel, spec'd gives gender (UNUSED)))\r
45              (TEXT or pri element)\r
46         pri* (???)  # UNUSED\r
47       example* (text)  # UNUSED\r
50 NOTES:\r
51 - ElementTree does auto-convert entities.\r
52 - It's possible to use ElementTree.parse(source_file, parser) to supply parser instance...\r
53   maybe this could used to track entities.\r