Switch to autoconf 2.72.
[libiconv.git] / NEWS
blob364b7410a7567e19336e4fe0384214b5d8b27ef6
1 New in 1.18:
2 * Many more transliterations.
3 * GB18030 is now an alias for GB18030:2005. A new converter for GB18030:2022
4   is added. Since this encoding merely cleans up a few private-use-area
5   mappings, you can continue to use the GB18030 converter, for backward
6   compatibility. Its Unicode to GB18030 conversion direction has been
7   enhanced, to help transitioning away from PUA code points.
8 * When converting from/to an EBCDIC encoding, a non-standard way of
9   converting newlines can be requested
10     - at the C level, by calling iconvctl with argument ICONV_SET_FROM_SURFACE
11       or ICONV_SET_TO_SURFACE, or
12     - from the iconv program, by setting the environment variable
13       ICONV_EBCDIC_ZOS_UNIX to a non-empty value.
14 * Special support for z/OS: The iconv program adds a charset metadata tag to
15   its output file. (Contributed by Mike Fulton.)
17 New in 1.17:
18 * The libiconv library is now licensed under the LGPL version 2.1, instead of
19   the LGPL version 2.0. The iconv program continues to be licensed under GPL
20   version 3.
21 * Added converters for many single-byte EBCDIC encodings:
22   IBM-{037,273,277,278,280,282,284,285,297,423,424,425,500,838,870,871,875},
23   IBM-{880,905,924,1025,1026,1047,1097,1112,1122,1123,1130,1132,1137,1140},
24   IBM-{1141,1142,1143,1144,1145,1146,1147,1148,1149,1153,1154,1155,1156,1157},
25   IBM-{1158,1160,1164,1165,1166,4971,12712,16804}.
26   They are available through the configure option '--enable-extra-encodings'.
28 New in 1.16:
29 * The preloadable library has been removed.
31 New in 1.15:
32 * The UTF-8 converter now rejects surrogates and out-of-range code points.
33 * Added ISO-2022-JP-MS converter.
34 * Updated the CP1255 converter to map one more character.
35 * The functions now support strings longer than 2 GB.
37 New in 1.14:
38 * The 'iconv' program now produces its output as soon as it can. It no longer
39   unnecessarily waits for more input.
40 * Updated the GB18030 converter to map 25 characters to code points that have
41   been to Unicode since 2000, rather than to code points in the Private Use
42   Area.
43 * Updated the BIG5-HKSCS converter. The old BIG5-HKSCS converter is renamed to
44   BIG5-HKSCS:2004. A new converter BIG5-HKSCS:2008 is added. BIG5-HKSCS is now
45   an alias for BIG5-HKSCS:2008.
46 * Fixed a bug in the conversion to wchar_t.
47 * Fixed a small bug in the CP1258 converter.
49 New in 1.13:
50 * The library and the iconv program now understand platform dependent aliases,
51   for better compatibility with the platform's own iconv_open function.
52   Examples: "646" on Solaris, "iso88591" on HP-UX, "IBM-1252" on AIX.
53 * For stateful encodings, when the input ends with a shift sequence followed
54   by invalid input, the iconv function now increments the input pointer past
55   the shift sequence before returning (size_t)(-1) with errno = EILSEQ. This
56   is also like GNU libc's iconv() behaves.
57 * The library exports a new function iconv_open_into() that stores the
58   conversion descriptor in pre-allocated memory, rather than allocating fresh
59   memory for it.
60 * Added CP1131 converter.
62 New in 1.12:
63 * The iconv program is now licensed under the GPL version 3, instead of the
64   GPL version 2. The libiconv library continues to be licensed under LGPL.
65 * Added RK1048 converter.
66 * On AIX, an existing system libiconv no longer causes setlocale() to fail.
67 * Upgraded EUC-KR, JOHAB to include the Korean postal code sign.
69 New in 1.11:
70 * The iconv program has new options --unicode-subst, --byte-subst,
71   --widechar-subst that allow to specify substitutions for characters that
72   cannot be converted.
73 * The iconv program now understands long options:
74     long option    equivalent to
75     --from-code    -f
76     --to-code      -t
77     --list         -l
78     --silent       -s
79 * The CP936 converter is now different from the GBK converter: it has changed
80   to include the Euro sign and private area characters. CP936 is no longer an
81   alias of GBK.
82 * Updated GB18030 converter to include all private area characters.
83 * Updated CP950 converter to include the Euro sign and private area characters.
84 * Updated CP949 converter to include private area characters.
85 * Updated the BIG5-HKSCS converter. The old BIG5-HKSCS converter is renamed to
86   BIG5-HKSCS:1999 and updated to Unicode 4. New converters BIG5-HKSCS:2001 and
87   BIG5-HKSCS:2004 are added. BIG5-HKSCS is now an alias for BIG5-HKSCS:2004.
88 * Added a few irreversible mappings to the CP932 converter.
89 * Tidy up the list of symbols exported from libiconv (assumes gcc >= 4.0).
91 New in 1.10:
92 * Added ISO-8859-11 converter.
93 * Updated the ISO-8859-7 converter.
94 * Added ATARIST converter, available through --enable-extra-encodings.
95 * Added BIG5-2003 converter (experimental), available through
96   --enable-extra-encodings.
97 * Updated EUC-TW converter to include the Euro sign.
98 * The preloadable library has been renamed from libiconv_plug.so to
99   preloadable_libiconv.so.
100 * Portability to mingw.
102 New in 1.9:
103 * Many more transliterations.
104 * New configuration option --enable-relocatable.  See the INSTALL.generic file
105   for details.
107 New in 1.8:
108 * The iconv program has new options -l, -c, -s.
109 * The iconv program is internationalized.
110 * Added C99 converter.
111 * Added KOI8-T converter.
112 * New configuration option --enable-extra-encodings that enables a bunch of
113   additional encodings; see the README for details.
114 * Updated the ISO-8859-16 converter.
115 * Upgraded BIG5-HKSCS, EUC-TW, ISO-2022-CN, ISO-2022-CN-EXT converters to
116   Unicode 3.2.
117 * Upgraded EUC-KR, CP949, JOHAB converters to include the Euro sign.
118 * Changed the ARMSCII-8 converter.
119 * Extended the EUC-JP encoder so that YEN SIGN characters don't cause failures
120   in Shift_JIS to EUC-JP conversion.
121 * The JAVA converter now handles characters outside the Unicode BMP correctly.
122 * Fixed a bug in the CP1255, CP1258, TCVN decoders: The base characters of
123   combining characters could be dropped at the end of the conversion buffer.
124 * Fixed a bug in the transliteration that could lead to excessive memory
125   allocations in libintl when transliteration was needed.
126 * Portability to BSD/OS and SCO 3.2.5.
128 New in 1.7:
129 * Added UTF-32, UTF-32BE, UTF-32LE converters.
130 * Changed CP1255, CP1258 and TCVN converters to handle combining characters.
131 * Changed EUC-JP, SHIFT_JIS, CP932, ISO-2022-JP, ISO-2022-JP-2, ISO-2022-JP-1
132   converters to use fullwidth Yen sign instead of halfwidth Yen sign, and
133   fullwidth tilde instead of halfwidth tilde.
134 * Upgraded EUC-TW, ISO-2022-CN, ISO-2022-CN-EXT converters to Unicode 3.1.
135 * Changed the GB18030 converter to not reject unassigned and private-use
136   Unicode characters.
137 * Fixed a bug in the byte order mark treatment of the UCS-4 decoder.
138 * The manual pages are now distributed also in HTML format.
140 New in 1.6:
141 * The iconv program's -f and -t options are now optional.
142 * Many more transliterations.
143 * Added CP862 converter.
144 * Changed the GB18030 converter.
145 * Portability to DOS with DJGPP.
147 New in 1.5:
148 * Added an iconv(1) program.
149 * New locale dependent encodings "char", "wchar_t".
150 * Transliteration is now off by default. Use a //TRANSLIT suffix to enable it.
151 * The JOHAB encoding is documented again.
152 * Changed a few mappings in the CP950 converter.
154 New in 1.4:
155 * Added GB18030, BIG5HKSCS converters.
156 * Portability to OS/2 with emx+gcc.
158 New in 1.3:
159 * Added UCS-2BE, UCS-2LE, UCS-4BE, UCS-4LE converters.
160 * Fixed the definition of EILSEQ on SunOS4.
161 * Fixed a build problem on OSF/1.
162 * Support for building as a shared library on Woe32.
164 New in 1.2:
165 * Added UTF-16BE and UTF-16LE converters.
166 * Changed the UTF-16 encoder.
167 * Fixed the treatment of tab characters in the UTF-7 converter.
168 * Fixed an internal error when output buffer was not large enough.
170 New in 1.1:
171 * Added ISO-8859-16 converter.
172 * Added CP932 converter, a variant of SHIFT_JIS.
173 * Added CP949 converter, a variant of EUC-KR.
174 * Improved the ISO-2022-CN-EXT converter: It now covers the ISO-IR-165 range.
175 * Updated the ISO-8859-8 conversion table.
176 * The JOHAB encoding is deprecated and not documented any more.
177 * Fixed two build problems: 1. "make -n check" failed. 2. When libiconv was
178   already installed, "make" failed.
180 New in 1.0:
181 * Added transliteration facilities.
182 * Added a test suite.
183 * Fixed the iconv(3) manual page and function: the return value was not
184   described correctly.
185 * Fixed a bug in the CP1258 decoder: invalid bytes now yield EILSEQ instead of
186   U+FFFD.
187 * Fixed a bug in the Georgian-PS encoder: accept U+00E6.
188 * Fixed a bug in the EUC-JP encoder: reject 0x8E5C and 0x8E7E.
189 * Fixed a bug in the KSC5601 and JOHAB converters: they recognized some Hangul
190   characters at some invalid code positions.
191 * Fixed a bug in the EUC-TW decoder; it was severely broken.
192 * Fixed a bug in the CP950 converter: it recognized a dubious BIG5 range.
194 New in 0.3:
195 * Reduced the size of the tables needed for the JOHAB converter.
196 * Portability to Woe32.
198 New in 0.2:
199 * Added KOI8-RU, CP850, CP866, CP874, CP950, ISO-2022-CN-EXT, GBK and
200   ISO-2022-JP-1 converters.
201 * Added MACINTOSH as an alias for MAC-ROMAN.
202 * Added ASMO-708 as an alias for ISO-8859-6.
203 * Added ELOT_928 as an alias for ISO-8859-7.
204 * Improved the EUC-TW converter: Treat CNS 11643 plane 3.
205 * Improved the ISO-2022-KR and EUC-KR converters: Hangul characters are
206   decomposed into Jamo when needed.
207 * Improved the CP932 converter.
208 * Updated the CP1133, MULELAO-1 and ARMSCII-8 mappings.
209 * The EUC-JP and SHIFT_JIS converters now cover the user-defined range.
210 * Fixed a possible buffer overrun in the JOHAB converter.
211 * Fixed a bug in the UTF-7, ISO-2022-*, HZ decoders: a shift sequence a the
212   end of the input no longer gives an error.
213 * The HZ encoder now always terminates its output in the ASCII state.
214 * Use a perfect hash table for looking up the aliases.
216 New in 0.1:
217 * Portability to Linux/glibc-2.0.x, Linux/libc5, OSF/1, FreeBSD.
218 * Fixed a bug in the EUC-JP decoder. Extended the ISO-2022-JP-2 converter.
219 * Made TIS-620 mapping consistent with glibc-2.1.