update dev300-m58
[ooovba.git] / dictionaries / sw_TZ / README_sw_TZ.txt
blobf6238e6b4784c0ece5a2a82a97c4b7dae8092fe6
1 README Swahili Myspell Dictionary
2 Release 1.1 2005-08-17
4 1. Intro 
6 Myspell Swahili Dictionary - Compiled by Alberto Escudero-Pascual aep@it46.se
7 http://www.it46.se
10 2. Word list Sources
12    The  wordlists  have  been  compiled  based  on  the following
13    resources:
15    - Dr. Jason M. Githeko (githeko at egerton.ac.ke)
16    Egerton University, Njoro, Kenya
17    http://www.egerton.ac.ke/ict/kiswa.php
18    (48340 words)
20    - Prof. D.P.B. Massamba, Prof. A.M. Khamisi et al.
21    TUKI English-Swahili Dictionary
22    (18327 words)
24    - Dr. Martin Benjamin et al. (swahili at yale.edu)
25    The Kamusi Project,
26    http://www.yale.edu/swahili/
27    (15418 words)
29    - Dr. Kevin P. Scannell (scannell at slu.edu)
30    Corpus building for minority languages
31    http://borel.slu.edu/crubadan/
32    (+8008 words)
34    Total words: 67901
36    In  addition,  the programming skills of the following persons
37    have also contributed to the Jambo Spellchecker:
38    Dwayne Bailey, Louise Berthilson, Iñaki Cívico Campos, Alberto
39    Escudero-Pascual and Fredrik Lilieblad.
41 3. Licence
43    The Jambo Spellchecker is released as free software (LGPL).
45 4. Final Notes
47    - Kamusi Project wordlist:
49    The  Kamusi  Project  is  an  ongoing  work  of  collaborative
50    scholarship  that  is  developing a free online dictionary and
51    learning resources for Swahili. Established in 1994, it is the
52    world's  most-used  resource for the Swahili language, and the
53    first  result  for "Swahili" delivered by most Internet search
54    engines;    see    http://www.yale.edu/swahili/    for    more
55    information.
57    - An Crúbadán:
59    The  Swahili  word  list  was  improved with the help of Kevin
60    Scannell's  software  An  Crúbadán, a web crawler that targets
61    minority  languages  and  languages with limited computational
62    resources.
64    In  December  2004, the web crawler searched into 6600+ online
65    Swahili  documents and collected about 10 million (non unique)
66    words .
68    The  goal of the An Crúbadán is to develop language technology
69    for  as  many  languages  as  possible by applying statistical
70    techniques  to the vast quantities of text freely available on
71    the  web.  Text  corpora  have  been  created  for  nearly 200
72    languages so far, and these data are available for use by open
73    source  projects;  see http://borel.slu.edu/crubadan/ for more
74    information.
76 5. TODO
78    Work in the .aff file