Updating non-core libraries for monotonic? change
[factor/jcg.git] / basis / unicode / unicode-docs.factor
blob5b7b7e9ab37306bb325fa962db2dc3143484e45c
1 USING: help.markup help.syntax ;
2 IN: unicode
4 ARTICLE: "unicode" "Unicode"
5 "Unicode is a set of characters, or " { $emphasis "code points" } " covering what's used in most world writing systems. Any Factor string can hold any of these code points transparently; a factor string is a sequence of Unicode code points. Unicode is accompanied by several standard algorithms for common operations like encoding in files, capitalizing a string, finding the boundaries between words, etc. When a programmer is faced with a string manipulation problem, where the string represents human language, a Unicode algorithm is often much better than the naive one. This is not in terms of efficiency, but rather internationalization. Even English text that remains in ASCII is better served by the Unicode collation algorithm than a naive algorithm. The Unicode algorithms implemented here are:"
6 { $vocab-subsection "Case mapping" "unicode.case" }
7 { $vocab-subsection "Collation and weak comparison" "unicode.collation" }
8 { $vocab-subsection "Character classes" "unicode.categories" }
9 { $vocab-subsection "Word and grapheme breaks" "unicode.breaks" }
10 { $vocab-subsection "Unicode normalization" "unicode.normalize" }
11 "The following are mostly for internal use:"
12 { $vocab-subsection "Unicode syntax" "unicode.syntax" }
13 { $vocab-subsection "Unicode data tables" "unicode.data" }
14 { $see-also "io.encodings" } ;
16 ABOUT: "unicode"