Document XSTORE
[nasm/avx512.git] / CHANGES
blob1f00f20fdc779058c2ea6f7bea488035596d670f
1 0.98.36
2 -------
3 * Update rdoff - librarian/archiver - common rec - docs!
4 * Fix signed/unsigned problems.
5 * Fix JMP FAR label and CALL FAR label.
6 * Add new multisection support - map files - fix align bug
7 * Fix sysexit, movhps/movlps reg,reg bugs in insns.dat
8 * "Q" or "O" suffixes indicate octal
9 * Support Prescott new instructions.
10 * Cyrix XSTORE instruction.
12 0.98.35
13 -------
14 * Fix build failure on 16-bit DOS (Makefile.bc3 workaround for compiler bug.)
15 * Fix dependencies and compiler warnings.
16 * Add "const" in a number of places.
17 * Add -X option to specify error reporting format (use -Xvc to
18   integrate with Microsoft Visual Studio.)
19 * Minor changes for code legibility.
20 * Drop use of tmpnam() in rdoff (security fix.)
22 0.98.34
23 -------
24 * Correct additional address-size vs. operand-size confusions.
25 * Generate dependencies for all Makefiles automatically.
26 * Add support for unimplemented (but theoretically available)
27   registers such as tr0 and cr5.  Segment registers 6 and 7 are called
28   segr6 and segr7 for the operations which they can be represented.
29 * Correct some disassembler bugs related to redundant address-size prefixes.
30   Some work still remains in this area.
31 * Correctly generate an error for things like "SEG eax".
32 * Add the JMPE instruction, enabled by "CPU IA64".
33 * Correct compilation on newer gcc/glibc platforms.
34 * Issue an error on things like "jmp far eax".
37 0.98.33
38 -------
40 * New __NASM_PATCHLEVEL__ and __NASM_VERSION_ID__ standard macros to
41   round out the version-query macros.  version.pl now understands
42   X.YYplWW or X.YY.ZZplWW as a version number, equivalent to
43   X.YY.ZZ.WW (or X.YY.0.WW, as appropriate).
44 * New keyword "strict" to disable the optimization of specific
45   operands.
46 * Fix the handing of size overrides with JMP instructions
47   (instructions such as "jmp dword foo".)
48 * Fix the handling of "ABSOLUTE label", where "label" points into a
49   relocatable segment.
50 * Fix OBJ output format with lots of externs.
51 * More documentation updates.
52 * Add -Ov option to get verbose information about optimizations.
53 * Undo a braindead change which broke %elif directives.
54 * Makefile updates.
57 0.98.32
58 -------
60 * Fix NASM crashing when %macro directives were left unterminated.
61 * Lots of documentation updates.
62 * Complete rewrite of the PostScript/PDF documentation generator.
63 * The MS Visual C++ Makefile was updated and corrected.
64 * Recognize .rodata as a standard section name in ELF.
65 * Fix some obsolete Perl4-isms in Perl scripts.
66 * Fix configure.in to work with autoconf 2.5x.
67 * Fix a couple of "make cleaner" misses.
68 * Make the normal "./configure && make" work with Cygwin.
71 0.98.31
72 -------
74 * Correctly build in a separate object directory again.
75 * Derive all references to the version number from the version file.
76 * New standard macros __NASM_SUBMINOR__ and __NASM_VER__ macros.
77 * Lots of Makefile updates and bug fixes.
78 * New %ifmacro directive to test for multiline macros.
79 * Documentation updates.
80 * Fixes for 16-bit OBJ format output.
81 * Changed the NASM environment variable to NASMENV.
84 0.98.30
85 -------
87 * Changed doc files a lot: completely removed old READMExx and
88   Wishlist files, incorporating all information in CHANGES and TODO.
89 * I waited a long time to rename zoutieee.c to (original) outieee.c
90 * moved all output modules to output/ subdirectory.
91 * Added 'make strip' target to strip debug info from nasm & ndisasm.
92 * Added INSTALL file with installation instructions.
93 * Added -v option description to nasm man.
94 * Added dist makefile target to produce source distributions.
95 * 16-bit support for ELF output format (GNU extension, but useful.)
98 0.98.28
99 -------
101 * Fastcooked this for Debian's Woody release:
102 Frank applied the INCBIN bug patch to 0.98.25alt and called
103 it 0.98.28 to not confuse poor little apt-get.
106 0.98.26
107 -------
109 * Reorganised files even better from 0.98.25alt
112 0.98.25alt
113 ----------
115 * Prettified the source tree. Moved files to more reasonable places.
116 * Added findleak.pl script to misc/ directory.
117 * Attempted to fix doc.
119 0.98.25
120 -------
122 * Line continuation character '\'
123 * Docs inadvertantly reverted - "dos packaging".
126 0.98.24p1
127 ---------
129 * FIXME: Someone, document this please.
132 0.98.24
133 -------
135 * Documentation - Ndisasm doc added to Nasm.doc.
138 0.98.23
139 -------
141 * Attempted to remove rdoff version1
142 * Lino Mastrodomenico's patches to preproc.c (%$$ bug?).
145 0.98.22
146 -------
148 * Update rdoff2 - attempt to remove v1.
151 0.98.21
152 -------
154 * Optimization fixes.
157 0.98.20
158 -------
160 * Optimization fixes.
163 0.98.19
164 -------
166 * H. J. Lu's patch back out.
169 0.98.18
170 -------
172 * Added ".rdata" to "-f win32".
175 0.98.17
176 -------
178 * H. J. Lu's "bogus elf" patch. (Red Hat problem?)
181 0.98.16
182 -------
184 * Fix whitespace before "[section ..." bug.
186 0.98.15
187 -------
189 * Rdoff changes (?).
190 * Fix fixes to memory leaks.
192 0.98.14
193 -------
195 * Fix memory leaks.
196 * (there was no '.13)
198 0.98.12
199 -------
201 * Update optimization (new function of "-O1")
202 * Changes to test/bintest.asm (?).
204 0.98.11
205 -------
207 * Optimization changes.
208 * Ndisasm fixed.
209 * (there was no '.10)
211 0.98.09
212 -------
214 * Add multiple sections support to "-f bin".
215 * Changed GLOBAL_TEMP_BASE in outelf.c from 6 to 15.
216 * Add "-v" as an alias to the "-r" switch.
217 * Remove "#ifdef" from Tasm compatibility options.
218 * Remove redundant size-overrides on "mov ds, ex", etc.
219 * Fixes to SSE2, other insns.dat (?).
220 * Enable uppercase "I" and "P" switches.
221 * Case insinsitive "seg" and "wrt".
222 * Update install.sh (?).
223 * Allocate tokens in blocks.
224 * Improve "invalid effective address" messages.
226 0.98.08
227 -------
229 * Add "%strlen" and "%substr" macro operators
230 * Fixed broken c16.mac.
231 * Unterminated string error reported.
232 * Fixed bugs as per 0.98bf
235 0.98.09b with John Coffman patches released 28-Oct-2001
236 -------------------------------------------------------
238 Changes from 0.98.07 release to 98.09b as of 28-Oct-2001
240 * More closely compatible with 0.98 when -O0 is implied
241 or specified.  Not strictly identical, since backward 
242 branches in range of short offsets are recognized, and signed
243 byte values with no explicit size specification will be
244 assembled as a single byte.
246 * More forgiving with the PUSH instruction.  0.98 requires
247 a size to be specified always.  0.98.09b will imply the size
248 from the current BITS setting (16 or 32).
250 * Changed definition of the optimization flag:
252         -O0     strict two-pass assembly, JMP and Jcc are
253                 handled more like 0.98, except that back-
254                 ward JMPs are short, if possible.
256         -O1     strict two-pass assembly, but forward
257                 branches are assembled with code guaranteed
258                 to reach; may produce larger code than
259                 -O0, but will produce successful assembly
260                 more often if branch offset sizes are not
261                 specified.
263         -O2     multi-pass optimization, minimize branch
264                 offsets; also will minimize signed immed-
265                 iate bytes, overriding size specification.
267         -O3     like -O2, but more passes taken, if needed
270 0.98.07 released 01/28/01
271 -------------------------
273 *       Added Stepane Denis' SSE2 instructions to a *working*
274         version of the code - some earlier versions were based on
275         broken code - sorry 'bout that. version "0.98.07"
278 01/28/01
279 --------
281 *       Cosmetic modifications to nasm.c, nasm.h,
282         AUTHORS, MODIFIED
285 0.98.06f released 01/18/01
286 --------------------------
288 *       - Add "metalbrain"s jecxz bug fix in insns.dat
289         - alter nasmdoc.src to match - version "0.98.06f"
292 0.98.06e released 01/09/01
293 --------------------------
295 *       Removed the "outforms.h" file - it appears to be
296         someone's old backup of "outform.h". version "0.98.06e" 
299 01/09/01
300 --------
302 * fbk - finally added the fix for the "multiple %includes bug",
303         known since 7/27/99 - reported originally (?) and sent to
304         us by Austin Lunnen - he reports that John Fine had a fix
305         within the day. Here it is...
307 * Nelson Rush resigns from the group. Big thanks to Nelson for
308   his leadership and enthusiasm in getting these changes
309   incorporated into Nasm!
311 * fbk - [list +], [list -] directives - ineptly implemented, should
312         be re-written or removed, perhaps.
314 * Brian Raiter / fbk - "elfso bug" fix - applied to aoutb format
315                        as well - testing might be desirable...
318 08/07/00
319 --------
321 * James Seter - -postfix, -prefix command line switches.
322 * Yuri Zaporogets - rdoff utility changes.
325 0.98p1
326 ------
328 * GAS-like palign (Panos Minos)
329 * FIXME: Someone, fill this in with details
332 0.98bf (bug-fixed)
333 ----------------------------------
335 * Fixed - elf and aoutb bug - shared libraries
336         - multiple "%include" bug in "-f obj"   
337         - jcxz, jecxz bug
338         - unrecognized option bug in ndisasm 
340 0.98.03 with John Coffman's changes released 27-Jul-2000
341 --------------------------------------------------------
343 * Added signed byte optimizations for the 0x81/0x83 class
344 of instructions: ADC, ADD, AND, CMP, OR, SBB, SUB, XOR:
345 when used as 'ADD reg16,imm' or 'ADD reg32,imm.'  Also
346 optimization of signed byte form of 'PUSH imm' and 'IMUL
347 reg,imm'/'IMUL reg,reg,imm.'  No size specification is needed.
349 * Added multi-pass JMP and Jcc offset optimization.  Offsets
350 on forward references will preferentially use the short form,
351 without the need to code a specific size (short or near) for
352 the branch.  Added instructions for 'Jcc label' to use the
353 form 'Jnotcc $+3/JMP label', in cases where a short offset
354 is out of bounds.  If compiling for a 386 or higher CPU, then
355 the 386 form of Jcc will be used instead.
357 This feature is controlled by a new command-line switch: "O",
358 (upper case letter O).  "-O0" reverts the assembler to no
359 extra optimization passes, "-O1" allows up to 5 extra passes,
360 and "-O2"(default), allows up to 10 extra optimization passes.
362 * Added a new directive:  'cpu XXX', where XXX is any of: 
363 8086, 186, 286, 386, 486, 586, pentium, 686, PPro, P2, P3 or
364 Katmai.  All are case insensitive.  All instructions will
365 be selected only if they apply to the selected cpu or lower.
366 Corrected a couple of bugs in cpu-dependence in 'insns.dat'.
368 * Added to 'standard.mac', the "use16" and "use32" forms of
369 the "bits 16/32" directive. This is nothing new, just conforms
370 to a lot of other assemblers. (minor)
372 * Changed label allocation from 320/32 (10000 labels @ 200K+) 
373 to 32/37 (1000 labels); makes running under DOS much easier.
374 Since additional label space is allocated dynamically, this
375 should have no effect on large programs with lots of labels.
376 The 37 is a prime, believed to be better for hashing. (minor)
378 * Integrated patchfile 0.98-0.98.01.  I call this version
379 0.98.03, for historical reasons:  0.98.02 was trashed.
381 --John Coffman <johninsd@san.rr.com>               27-Jul-2000
384 Kendall Bennett's SciTech MGL changes
385 -------------------------------------
386 Note that you must define "TASM_COMPAT" at compile-time
387 to get the Tasm Ideal Mode compatibility.
389 All changes can be compiled in and out using the TASM_COMPAT macros,
390 and when compiled without TASM_COMPAT defined we get the exact same
391 binary as the unmodified 0.98 sources.
393 standard.mac, macros.c:
394  . Added macros to ignore TASM directives before first include
396 nasm.h:
397  . Added extern declaration for tasm_compatible_mode
399 nasm.c:
400  . Added global variable tasm_compatible_mode
401  . Added command line switch for TASM compatible mode (-t)
402  . Changed version command line to reflect when compiled with TASM additions
403  . Added response file processing to allow all arguments on a single
404    line (response file is @resp rather than -@resp for NASM format).
406 labels.c:
407  . Changes islocal() macro to support TASM style @@local labels.
408  . Added islocalchar() macro to support TASM style @@local labels.
410 parser.c:
411  . Added support for TASM style memory references (ie: mov [DWORD eax],10
412    rather than the NASM style mov DWORD [eax],10).
414 preproc.c:
415  . Added new directives, %arg, %local, %stacksize to directives table
416  . Added support for TASM style directives without a leading % symbol.
418 Integrated a block of changes from Andrew Zabolotny <bit@eltech.ru>:
420 * A new keyword %xdefine and its case-insensitive counterpart %ixdefine.
421     They work almost the same way as %define and %idefine but expand
422     the definition immediately, not on the invocation. Something like a cross
423     between %define and %assign. The "x" suffix stands for "eXpand", so
424     "xdefine" can be deciphered as "expand-and-define". Thus you can do
425     things like this:
427         %assign ofs     0
428         
429         %macro  arg     1
430                 %xdefine %1 dword [esp+ofs]
431                 %assign ofs ofs+4
432         %endmacro
434 * Changed the place where the expansion of %$name macros are expanded.
435     Now they are converted into ..@ctxnum.name form when detokenizing, so
436     there are no quirks as before when using %$name arguments to macros,
437     in macros etc. For example:
439         %macro  abc     1
440                 %define %1 hello
441         %endm
443         abc     %$here
444         %$here
446     Now last line will be expanded into "hello" as expected. This also allows
447     for lots of goodies, a good example are extended "proc" macros included
448     in this archive.
450 * Added a check for "cstk" in smacro_defined() before calling get_ctx() -
451     this allows for things like:
453         %ifdef %$abc
454         %endif
456     to work without warnings even in no context.
458 * Added a check for "cstk" in %if*ctx and %elif*ctx directives -
459     this allows to use %ifctx without excessive warnings. If there is
460     no active context, %ifctx goes through "false" branch.
462 * Removed "user error: " prefix with %error directive: it just clobbers the
463     output and has absolutely no functionality. Besides, this allows to write
464     macros that does not differ from built-in functions in any way.
466 * Added expansion of string that is output by %error directive. Now you
467     can do things like:
469         %define hello(x) Hello, x!
471         %define %$name andy
472         %error "hello(%$name)"
474     Same happened with %include directive.
476 * Now all directives that expect an identifier will try to expand and
477     concatenate everything without whitespaces in between before usage.
478     For example, with "unfixed" nasm the commands
480         %define %$abc hello
481         %define __%$abc goodbye
482         __%$abc
484     would produce "incorrect" output: last line will expand to
486         hello goodbyehello
488     Not quite what you expected, eh? :-) The answer is that preprocessor
489     treats the %define construct as if it would be
491         %define __ %$abc goodbye
493     (note the white space between __ and %$abc). After my "fix" it
494     will "correctly" expand into
496         goodbye
498     as expected. Note that I use quotes around words "correct", "incorrect"
499     etc because this is rather a feature not a bug; however current behaviour
500     is more logical (and allows more advanced macro usage :-).
502     Same change was applied to:
503         %push,%macro,%imacro,%define,%idefine,%xdefine,%ixdefine,
504         %assign,%iassign,%undef
506 * A new directive [WARNING {+|-}warning-id] have been added. It works only
507     if the assembly phase is enabled (i.e. it doesn't work with nasm -e).
509 * A new warning type: macro-selfref. By default this warning is disabled;
510     when enabled NASM warns when a macro self-references itself; for example
511     the following source:
513         [WARNING macro-selfref]
515         %macro          push    1-*
516                 %rep    %0
517                         push    %1
518                         %rotate 1
519                 %endrep
520         %endmacro
522                         push    eax,ebx,ecx
524     will produce a warning, but if we remove the first line we won't see it
525     anymore (which is The Right Thing To Do {tm} IMHO since C preprocessor
526     eats such constructs without warnings at all).
528 * Added a "error" routine to preprocessor which always will set ERR_PASS1
529     bit in severity_code. This removes annoying repeated errors on first
530     and second passes from preprocessor.
532 * Added the %+ operator in single-line macros for concatenating two
533     identifiers. Usage example:
535         %define _myfunc _otherfunc
536         %define cextern(x) _ %+ x
537         cextern (myfunc)
539     After first expansion, third line will become "_myfunc". After this
540     expansion is performed again so it becomes "_otherunc".
542 * Now if preprocessor is in a non-emmitting state, no warning or error
543     will be emmitted. Example:
545         %if 1
546                 mov     eax,ebx
547         %else
548                 put anything you want between these two brackets,
549                 even macro-parameter references %1 or local labels %$zz
550                 or macro-local labels %%zz - no warning will be emmitted.
551         %endif
553 * Context-local variables on expansion as a last resort are looked up
554     in outer contexts. For example, the following piece:
556         %push   outer
557         %define %$a [esp]
559                 %push   inner
560                 %$a
561                 %pop
562         %pop
564     will expand correctly the fourth line to [esp]; if we'll define another
565     %$a inside the "inner" context, it will take precedence over outer
566     definition. However, this modification has been applied only to
567     expand_smacro and not to smacro_define: as a consequence expansion
568     looks in outer contexts, but %ifdef won't look in outer contexts.
570     This behaviour is needed because we don't want nested contexts to
571     act on already defined local macros. Example:
573         %define %$arg1  [esp+4]
574         test    eax,eax
575         if      nz
576                 mov     eax,%$arg1
577         endif
579     In this example the "if" mmacro enters into the "if" context, so %$arg1
580     is not valid anymore inside "if". Of course it could be worked around
581     by using explicitely %$$arg1 but this is ugly IMHO.
583 * Fixed memory leak in %undef. The origline wasn't freed before
584     exiting on success.
586 * Fixed trap in preprocessor when line expanded to empty set of tokens.
587     This happens, for example, in the following case:
589         #define SOMETHING
590         SOMETHING
593 0.98
594 ----
596 All changes since NASM 0.98p3 have been produced by H. Peter Anvin <hpa@zytor.com>.
598 * The documentation comment delimiter is \# not #.
599 * Allow EQU definitions to refer to external labels; reported by
600   Pedro Gimeno.
601 * Re-enable support for RDOFF v1; reported by Pedro Gimeno.
602 * Updated License file per OK from Simon and Julian.
605 0.98p9
606 ------
608 * Update documentation (although the instruction set reference will
609   have to wait; I don't want to hold up the 0.98 release for it.)
610 * Verified that the NASM implementation of the PEXTRW and PMOVMSKB
611   instructions is correct.  The encoding differs from what the Intel
612   manuals document, but the Pentium III behaviour matches NASM, not
613   the Intel manuals.
614 * Fix handling of implicit sizes in PSHUFW and PINSRW, reported by
615   Stefan Hoffmeister.
616 * Resurrect the -s option, which was removed when changing the
617   diagnostic output to stdout.
620 0.98p8
621 ------
623 * Fix for "DB" when NASM is running on a bigendian machine.
624 * Invoke insns.pl once for each output script, making Makefile.in
625   legal for "make -j".
626 * Improve the Unix configure-based makefiles to make package
627   creation easier.
628 * Included an RPM .spec file for building RPM (RedHat Package Manager)
629   packages on Linux or Unix systems.
630 * Fix Makefile dependency problems.
631 * Change src/rdsrc.pl to include sectioning information in info
632   output; required for install-info to work.
633 * Updated the RDOFF distribution to version 2 from Jules; minor
634   massaging to make it compile in my environment.
635 * Split doc files that can be built by anyone with a Perl interpreter off
636   into a separate archive.
637 * "Dress rehearsal" release!
640 0.98p7
641 ------
643 * Fixed opcodes with a third byte-sized immediate argument to not
644   complain if given "byte" on the immediate.
645 * Allow %undef to remove single-line macros with arguments.  This
646   matches the behaviour of #undef in the C preprocessor.
647 * Allow -d, -u, -i and -p to be specified as -D, -U, -I and -P for
648   compatibility with most C compilers and preprocessors.  This allows
649   Makefile options to be shared between cc and nasm, for example.
650 * Minor cleanups.
651 * Went through the list of Katmai instructions and hopefully fixed the
652   (rather few) mistakes in it.
653 * (Hopefully) fixed a number of disassembler bugs related to ambiguous
654   instructions (disambiguated by -p) and SSE instructions with REP.
655 * Fix for bug reported by Mark Junger: "call dword 0x12345678" should
656   work and may add an OSP (affected CALL, JMP, Jcc).
657 * Fix for environments when "stderr" isn't a compile-time constant.
660 0.98p6
661 ------
663 * Took officially over coordination of the 0.98 release; so drop
664   the p3.x notation. Skipped p4 and p5 to avoid confusion with John
665   Fine's J4 and J5 releases.
666 * Update the documentation; however, it still doesn't include
667   documentation for the various new instructions.  I somehow wonder if
668   it makes sense to have an instruction set reference in the assembler
669   manual when Intel et al have PDF versions of their manuals online.
670 * Recognize "idt" or "centaur" for the -p option to ndisasm.
671 * Changed error messages back to stderr where they belong, but add an
672   -E option to redirect them elsewhere (the DOS shell cannot redirect
673   stderr.)
674 * -M option to generate Makefile dependencies (based on code from Alex
675   Verstak.)
676 * %undef preprocessor directive, and -u option, that undefines a
677   single-line macro.
678 * OS/2 Makefile (Mkfiles/Makefile.os2) for Borland under OS/2; from
679   Chuck Crayne.
680 * Various minor bugfixes (reported by):
681   - Dangling %s in preproc.c (Martin Junker)
682 * THERE ARE KNOWN BUGS IN SSE AND THE OTHER KATMAI INSTRUCTIONS.  I am
683   on a trip and didn't bring the Katmai instruction reference, so I
684   can't work on them right now.
685 * Updated the License file per agreement with Simon and Jules to
686   include a GPL distribution clause.
689 0.98p3.7
690 --------
692 * (Hopefully) fixed the canned Makefiles to include the outrdf2 and
693   zoutieee modules.
694 * Renamed changes.asm to changed.asm.
697 0.98p3.6
698 --------
700 * Fixed a bunch of instructions that were added in 0.98p3.5 which had
701   memory operands, and the address-size prefix was missing from the
702   instruction pattern.
705 0.98p3.5
706 --------
708 * Merged in changes from John S. Fine's 0.98-J5 release.  John's based
709   0.98-J5 on my 0.98p3.3 release; this merges the changes.
710 * Expanded the instructions flag field to a long so we can fit more
711   flags; mark SSE (KNI) and AMD or Katmai-specific instructions as
712   such.
713 * Fix the "PRIV" flag on a bunch of instructions, and create new
714   "PROT" flag for protected-mode-only instructions (orthogonal to if
715   the instruction is privileged!) and new "SMM" flag for SMM-only
716   instructions.
717 * Added AMD-only SYSCALL and SYSRET instructions.
718 * Make SSE actually work, and add new Katmai MMX instructions.
719 * Added a -p (preferred vendor) option to ndisasm so that it can
720   distinguish e.g. Cyrix opcodes also used in SSE.  For example:
722         ndisasm -p cyrix aliased.bin
723         00000000  670F514310        paddsiw mm0,[ebx+0x10]
724         00000005  670F514320        paddsiw mm0,[ebx+0x20]
725         ndisasm -p intel aliased.bin
726         00000000  670F514310        sqrtps xmm0,[ebx+0x10]
727         00000005  670F514320        sqrtps xmm0,[ebx+0x20]
728 * Added a bunch of Cyrix-specific instructions.
731 0.98p3.4
732 --------
734 * Made at least an attempt to modify all the additional Makefiles (in
735   the Mkfiles directory).  I can't test it, but this was the best I
736   could do.
737 * DOS DJGPP+"Opus Make" Makefile from John S. Fine.
738 * changes.asm changes from John S. Fine.
741 0.98p3.3
742 --------
744 * Patch from Conan Brink to allow nesting of %rep directives.
745 * If we're going to allow INT01 as an alias for INT1/ICEBP (one of
746   Jules 0.98p3 changes), then we should allow INT03 as an alias for INT3
747   as well.
748 * Updated changes.asm to include the latest changes.
749 * Tried to clean up the <CR>s that had snuck in from a DOS/Windows
750   environment into my Unix environment, and try to make sure than
751   DOS/Windows users get them back.
752 * We would silently generate broken tools if insns.dat wasn't sorted
753   properly.  Change insns.pl so that the order doesn't matter.
754 * Fix bug in insns.pl (introduced by me) which would cause conditional
755   instructions to have an extra "cc" in disassembly, e.g. "jnz"
756   disassembled as "jccnz".
759 0.98p3.2
760 --------
762 * Merged in John S. Fine's changes from his 0.98-J4 prerelease; see
763   http://www.csoft.net/cz/johnfine/
764 * Changed previous "spotless" Makefile target (appropriate for distribution)
765   to "distclean", and added "cleaner" target which is same as "clean"
766   except deletes files generated by Perl scripts; "spotless" is union.
767 * Removed BASIC programs from distribution.  Get a Perl interpreter
768   instead (see below.)
769 * Calling this "pre-release 3.2" rather than "p3-hpa2" because of
770   John's contributions.
771 * Actually link in the IEEE output format (zoutieee.c); fix a bunch of
772   compiler warnings in that file.  Note I don't know what IEEE output
773   is supposed to look like, so these changes were made "blind".
776 0.98p3-hpa
777 ----------
779 * Merged nasm098p3.zip with nasm-0.97.tar.gz to create a fully
780   buildable version for Unix systems (Makefile.in updates, etc.)
781 * Changed insns.pl to create the instruction tables in nasm.h and
782   names.c, so that a new instruction can be added by adding it *only*
783   to insns.dat.
784 * Added the following new instructions: SYSENTER, SYSEXIT, FXSAVE,
785   FXRSTOR, UD1, UD2 (the latter two are two opcodes that Intel
786   guarantee will never be used; one of them is documented as UD2 in
787   Intel documentation, the other one just as "Undefined Opcode" --
788   calling it UD1 seemed to make sense.)
789 * MAX_SYMBOL was defined to be 9, but LOADALL286 and LOADALL386 are 10
790   characters long.  Now MAX_SYMBOL is derived from insns.dat.
791 * A note on the BASIC programs included: forget them.  insns.bas is
792   already out of date.  Get yourself a Perl interpreter for your
793   platform of choice at:
795         http://www.cpan.org/ports/index.html
798 0.98 pre-release 3
799 -------------------
801 added response file support, improved command line handling, new layout
802 help screen
804 fixed limit checking bug, 'OUT byte nn, reg' bug, and a couple of rdoff
805 related bugs, updated Wishlist; 0.98 Prerelease 3.
808 0.98 pre-release 2
809 -------------------
811 fixed bug in outcoff.c to do with truncating section names longer
812 than 8 characters, referencing beyond end of string; 0.98 pre-release 2
815 0.98 pre-released May 1999
816 --------------------------
818 Fixed a bug whereby STRUC didn't work at all in RDF.
820 Fixed a problem with group specification in PUBDEFs in OBJ.
822 Improved ease of adding new output formats. Contribution due to
823 Fox Cutter.
825 Fixed a bug in relocations in the `bin' format: was showing up when
826 a relocatable reference crossed an 8192-byte boundary in any output
827 section.
829 Fixed a bug in local labels: local-label lookups were inconsistent
830 between passes one and two if an EQU occurred between the definition
831 of a global label and the subsequent use of a local label local to
832 that global.
834 Fixed a seg-fault in the preprocessor (again) which happened when
835 you use a blank line as the first line of a multi-line macro
836 definition and then defined a label on the same line as a call to
837 that macro.
839 Fixed a stale-pointer bug in the handling of the NASM environment
840 variable. Thanks to Thomas McWilliams.
842 ELF had a hard limit on the number of sections which caused
843 segfaults when transgressed. Fixed.
845 Added ability for ndisasm to read from stdin by using `-' as the
846 filename.
848 ndisasm wasn't outputting the TO keyword. Fixed.
850 Fixed error cascade on bogus expression in %if - an error in
851 evaluation was causing the entire %if to be discarded, thus creating
852 trouble later when the %else or %endif was encountered.
854 Forward reference tracking was instruction-granular not operand-
855 granular, which was causing 286-specific code to be generated
856 needlessly on code of the form `shr word [forwardref],1'. Thanks to
857 Jim Hague for sending a patch.
859 All messages now appear on stdout, as sending them to stderr serves
860 no useful purpose other than to make redirection difficult.
862 Fixed the problem with EQUs pointing to an external symbol - this
863 now generates an error message.
865 Allowed multiple size prefixes to an operand, of which only the first
866 is taken into account.
868 Incorporated John Fine's changes, including fixes of a large number
869 of preprocessor bugs, some small problems in OBJ, and a reworking of
870 label handling to define labels before their line is assembled, rather
871 than after.
873 Reformatted a lot of the source code to be more readable. Included
874 'coding.txt' as a guideline for how to format code for contributors.
876 Stopped nested %reps causing a panic - they now cause a slightly more
877 friendly error message instead.
879 Fixed floating point constant problems (patch by Pedro Gimeno)
881 Fixed the return value of insn_size() not being checked for -1, indicating
882 an error.
884 Incorporated 3D now instructions.
886 Fixed the 'mov eax, eax + ebx' bug.
888 Fixed the GLOBAL EQU bug in ELF. Released developers release 3.
890 Incorporated John Fine's command line parsing changes
892 Incorporated David Lindauer's OMF debug support
894 Made changes for LCC 4.0 support (__NASM_CDecl__, removed register size
895 specification warning when sizes agree).
897 Released NASM 0.98 Pre-release 1
900 0.97 released December 1997
901 ---------------------------
903 This was entirely a bug-fix release to 0.96, which seems to have got
904 cursed. Silly me.
906 Fixed stupid mistake in OBJ which caused `MOV EAX,<constant>' to
907 fail. Caused by an error in the `MOV EAX,<segment>' support.
909 ndisasm hung at EOF when compiled with lcc on Linux because lcc on
910 Linux somehow breaks feof(). ndisasm now does not rely on feof().
912 A heading in the documentation was missing due to a markup error in
913 the indexing. Fixed.
915 Fixed failure to update all pointers on realloc() within extended-
916 operand code in parser.c. Was causing wrong behaviour and seg faults
917 on lines such as `dd 0.0,0.0,0.0,0.0,...'
919 Fixed a subtle preprocessor bug whereby invoking one multi-line
920 macro on the first line of the expansion of another, when the second
921 had been invoked with a label defined before it, didn't expand the
922 inner macro. 
924 Added internal.doc back in to the distribution archives - it was
925 missing in 0.96 *blush*
927 Fixed bug causing 0.96 to be unable to assemble its own test files,
928 specifically objtest.asm. *blush again*
930 Fixed seg-faults and bogus error messages caused by mismatching
931 %rep and %endrep within multi-line macro definitions.
933 Fixed a problem with buffer overrun in OBJ, which was causing
934 corruption at ends of long PUBDEF records.
936 Separated DOS archives into main-program and documentation to reduce
937 download size.
940 0.96 released November 1997
941 ---------------------------
943 Fixed a bug whereby, if `nasm sourcefile' would cause a filename
944 collision warning and put output into `nasm.out', then `nasm
945 sourcefile -o outputfile' still gave the warning even though the
946 `-o' was honoured.
948 Fixed name pollution under Digital UNIX: one of its header files
949 defined R_SP, which broke the enum in nasm.h.
951 Fixed minor instruction table problems: FUCOM and FUCOMP didn't have
952 two-operand forms; NDISASM didn't recognise the longer register
953 forms of PUSH and POP (eg FF F3 for PUSH BX); TEST mem,imm32 was
954 flagged as undocumented; the 32-bit forms of CMOV had 16-bit operand
955 size prefixes; `AAD imm' and `AAM imm' are no longer flagged as
956 undocumented because the Intel Architecture reference documents
957 them.
959 Fixed a problem with the local-label mechanism, whereby strange
960 types of symbol (EQUs, auto-defined OBJ segment base symbols)
961 interfered with the `previous global label' value and screwed up
962 local labels.
964 Fixed a bug whereby the stub preprocessor didn't communicate with
965 the listing file generator, so that the -a and -l options in
966 conjunction would produce a useless listing file.
968 Merged `os2' object file format back into `obj', after discovering
969 that `obj' _also_ shouldn't have a link pass separator in a module
970 containing a non-trivial MODEND. Flat segments are now declared
971 using the FLAT attribute. `os2' is no longer a valid object format
972 name: use `obj'.
974 Removed the fixed-size temporary storage in the evaluator. Very very
975 long expressions (like `mov ax,1+1+1+1+...' for two hundred 1s or
976 so) should now no longer crash NASM.
978 Fixed a bug involving segfaults on disassembly of MMX instructions,
979 by changing the meaning of one of the operand-type flags in nasm.h.
980 This may cause other apparently unrelated MMX problems; it needs to
981 be tested thoroughly.
983 Fixed some buffer overrun problems with large OBJ output files.
984 Thanks to DJ Delorie for the bug report and fix.
986 Made preprocess-only mode actually listen to the %line markers as it
987 prints them, so that it can report errors more sanely.
989 Re-designed the evaluator to keep more sensible track of expressions
990 involving forward references: can now cope with previously-nightmare
991 situations such as
992    mov ax,foo | bar
993    foo equ 1
994    bar equ 2
996 Added the ALIGN and ALIGNB standard macros.
998 Added PIC support in ELF: use of WRT to obtain the four extra
999 relocation types needed.
1001 Added the ability for output file formats to define their own
1002 extensions to the GLOBAL, COMMON and EXTERN directives.
1004 Implemented common-variable alignment, and global-symbol type and
1005 size declarations, in ELF.
1007 Implemented NEAR and FAR keywords for common variables, plus
1008 far-common element size specification, in OBJ.
1010 Added a feature whereby EXTERNs and COMMONs in OBJ can be given a
1011 default WRT specification (either a segment or a group).
1013 Transformed the Unix NASM archive into an auto-configuring package.
1015 Added a sanity-check for people applying SEG to things which are
1016 already segment bases: this previously went unnoticed by the SEG
1017 processing and caused OBJ-driver panics later.
1019 Added the ability, in OBJ format, to deal with `MOV EAX,<segment>'
1020 type references: OBJ doesn't directly support dword-size segment
1021 base fixups, but as long as the low two bytes of the constant term
1022 are zero, a word-size fixup can be generated instead and it will
1023 work.
1025 Added the ability to specify sections' alignment requirements in
1026 Win32 object files and pure binary files.
1028 Added preprocess-time expression evaluation: the %assign (and
1029 %iassign) directive and the bare %if (and %elif) conditional. Added
1030 relational operators to the evaluator, for use only in %if
1031 constructs: the standard relationals = < > <= >= <> (and C-like
1032 synonyms == and !=) plus low-precedence logical operators &&, ^^ and
1035 Added a preprocessor repeat construct: %rep / %exitrep / %endrep.
1037 Added the __FILE__ and __LINE__ standard macros.
1039 Added a sanity check for number constants being greater than
1040 0xFFFFFFFF. The warning can be disabled.
1042 Added the %0 token whereby a variadic multi-line macro can tell how
1043 many parameters it's been given in a specific invocation.
1045 Added %rotate, allowing multi-line macro parameters to be cycled.
1047 Added the `*' option for the maximum parameter count on multi-line
1048 macros, allowing them to take arbitrarily many parameters.
1050 Added the ability for the user-level forms of EXTERN, GLOBAL and
1051 COMMON to take more than one argument.
1053 Added the IMPORT and EXPORT directives in OBJ format, to deal with
1054 Windows DLLs.
1056 Added some more preprocessor %if constructs: %ifidn / %ifidni (exact
1057 textual identity), and %ifid / %ifnum / %ifstr (token type testing).
1059 Added the ability to distinguish SHL AX,1 (the 8086 version) from
1060 SHL AX,BYTE 1 (the 286-and-upwards version whose constant happens to
1061 be 1).
1063 Added NetBSD/FreeBSD/OpenBSD's variant of a.out format, complete
1064 with PIC shared library features.
1066 Changed NASM's idiosyncratic handling of FCLEX, FDISI, FENI, FINIT,
1067 FSAVE, FSTCW, FSTENV, and FSTSW to bring it into line with the
1068 otherwise accepted standard. The previous behaviour, though it was a
1069 deliberate feature, was a deliberate feature based on a
1070 misunderstanding. Apologies for the inconvenience.
1072 Improved the flexibility of ABSOLUTE: you can now give it an
1073 expression rather than being restricted to a constant, and it can
1074 take relocatable arguments as well.
1076 Added the ability for a variable to be declared as EXTERN multiple
1077 times, and the subsequent definitions are just ignored.
1079 We now allow instruction prefixes (CS, DS, LOCK, REPZ etc) to be
1080 alone on a line (without a following instruction).
1082 Improved sanity checks on whether the arguments to EXTERN, GLOBAL
1083 and COMMON are valid identifiers.
1085 Added misc/exebin.mac to allow direct generation of .EXE files by
1086 hacking up an EXE header using DB and DW; also added test/binexe.asm
1087 to demonstrate the use of this. Thanks to Yann Guidon for
1088 contributing the EXE header code.
1090 ndisasm forgot to check whether the input file had been successfully
1091 opened. Now it does. Doh!
1093 Added the Cyrix extensions to the MMX instruction set.
1095 Added a hinting mechanism to allow [EAX+EBX] and [EBX+EAX] to be
1096 assembled differently. This is important since [ESI+EBP] and
1097 [EBP+ESI] have different default base segment registers.
1099 Added support for the PharLap OMF extension for 4096-byte segment
1100 alignment.
1103 0.95 released July 1997
1104 -----------------------
1106 Fixed yet another ELF bug. This one manifested if the user relied on
1107 the default segment, and attempted to define global symbols without
1108 first explicitly declaring the target segment.
1110 Added makefiles (for NASM and the RDF tools) to build Win32 console
1111 apps under Symantec C++. Donated by Mark Junker.
1113 Added `macros.bas' and `insns.bas', QBasic versions of the Perl
1114 scripts that convert `standard.mac' to `macros.c' and convert
1115 `insns.dat' to `insnsa.c' and `insnsd.c'. Also thanks to Mark
1116 Junker.
1118 Changed the diassembled forms of the conditional instructions so
1119 that JB is now emitted as JC, and other similar changes. Suggested
1120 list by Ulrich Doewich.
1122 Added `@' to the list of valid characters to begin an identifier
1123 with.
1125 Documentary changes, notably the addition of the `Common Problems'
1126 section in nasm.doc.
1128 Fixed a bug relating to 32-bit PC-relative fixups in OBJ.
1130 Fixed a bug in perm_copy() in labels.c which was causing exceptions
1131 in cleanup_labels() on some systems.
1133 Positivity sanity check in TIMES argument changed from a warning to
1134 an error following a further complaint.
1136 Changed the acceptable limits on byte and word operands to allow
1137 things like `~10111001b' to work.
1139 Fixed a major problem in the preprocessor which caused seg-faults if
1140 macro definitions contained blank lines or comment-only lines.
1142 Fixed inadequate error checking on the commas separating the
1143 arguments to `db', `dw' etc.
1145 Fixed a crippling bug in the handling of macros with operand counts
1146 defined with a `+' modifier.
1148 Fixed a bug whereby object file formats which stored the input file
1149 name in the output file (such as OBJ and COFF) weren't doing so
1150 correctly when the output file name was specified on the command
1151 line.
1153 Removed [INC] and [INCLUDE] support for good, since they were
1154 obsolete anyway.
1156 Fixed a bug in OBJ which caused all fixups to be output in 16-bit
1157 (old-format) FIXUPP records, rather than putting the 32-bit ones in
1158 FIXUPP32 (new-format) records.
1160 Added, tentatively, OS/2 object file support (as a minor variant on
1161 OBJ).
1163 Updates to Fox Cutter's Borland C makefile, Makefile.bc2.
1165 Removed a spurious second fclose() on the output file.
1167 Added the `-s' command line option to redirect all messages which
1168 would go to stderr (errors, help text) to stdout instead.
1170 Added the `-w' command line option to selectively suppress some
1171 classes of assembly warning messages.
1173 Added the `-p' pre-include and `-d' pre-define command-line options.
1175 Added an include file search path: the `-i' command line option.
1177 Fixed a silly little preprocessor bug whereby starting a line with a
1178 `%!' environment-variable reference caused an `unknown directive'
1179 error.
1181 Added the long-awaited listing file support: the `-l' command line
1182 option.
1184 Fixed a problem with OBJ format whereby, in the absence of any
1185 explicit segment definition, non-global symbols declared in the
1186 implicit default segment generated spurious EXTDEF records in the
1187 output.
1189 Added the NASM environment variable.
1191 From this version forward, Win32 console-mode binaries will be
1192 included in the DOS distribution in addition to the 16-bit binaries.
1193 Added Makefile.vc for this purpose.
1195 Added `return 0;' to test/objlink.c to prevent compiler warnings.
1197 Added the __NASM_MAJOR__ and __NASM_MINOR__ standard defines.
1199 Added an alternative memory-reference syntax in which prefixing an
1200 operand with `&' is equivalent to enclosing it in square brackets,
1201 at the request of Fox Cutter.
1203 Errors in pass two now cause the program to return a non-zero error
1204 code, which they didn't before.
1206 Fixed the single-line macro cycle detection, which didn't work at
1207 all on macros with no parameters (caused an infinite loop). Also
1208 changed the behaviour of single-line macro cycle detection to work
1209 like cpp, so that macros like `extrn' as given in the documentation
1210 can be implemented.
1212 Fixed the implementation of WRT, which was too restrictive in that
1213 you couldn't do `mov ax,[di+abc wrt dgroup]' because (di+abc) wasn't
1214 a relocatable reference.
1217 0.94 released April 1997
1218 ------------------------
1220 Major item: added the macro processor.
1222 Added undocumented instructions SMI, IBTS, XBTS and LOADALL286. Also
1223 reorganised CMPXCHG instruction into early-486 and Pentium forms.
1224 Thanks to Thobias Jones for the information.
1226 Fixed two more stupid bugs in ELF, which were causing `ld' to
1227 continue to seg-fault in a lot of non-trivial cases.
1229 Fixed a seg-fault in the label manager.
1231 Stopped FBLD and FBSTP from _requiring_ the TWORD keyword, which is
1232 the only option for BCD loads/stores in any case.
1234 Ensured FLDCW, FSTCW and FSTSW can cope with the WORD keyword, if
1235 anyone bothers to provide it. Previously they complained unless no
1236 keyword at all was present.
1238 Some forms of FDIV/FDIVR and FSUB/FSUBR were still inverted: a
1239 vestige of a bug that I thought had been fixed in 0.92. This was
1240 fixed, hopefully for good this time...
1242 Another minor phase error (insofar as a phase error can _ever_ be
1243 minor) fixed, this one occurring in code of the form
1244    rol ax,forward_reference
1245    forward_reference equ 1
1247 The number supplied to TIMES is now sanity-checked for positivity,
1248 and also may be greater than 64K (which previously didn't work on
1249 16-bit systems).
1251 Added Watcom C makefiles, and misc/pmw.bat, donated by Dominik Behr.
1253 Added the INCBIN pseudo-opcode.
1255 Due to the advent of the preprocessor, the [INCLUDE] and [INC]
1256 directives have become obsolete. They are still supported in this
1257 version, with a warning, but won't be in the next.
1259 Fixed a bug in OBJ format, which caused incorrect object records to
1260 be output when absolute labels were made global.
1262 Updates to RDOFF subdirectory, and changes to outrdf.c.
1265 0.93 released January 1997
1266 --------------------------
1268 This release went out in a great hurry after semi-crippling bugs
1269 were found in 0.92.
1271 Really _did_ fix the stack overflows this time. *blush*
1273 Had problems with EA instruction sizes changing between passes, when
1274 an offset contained a forward reference and so 4 bytes were
1275 allocated for the offset in pass one; by pass two the symbol had
1276 been defined and happened to be a small absolute value, so only 1
1277 byte got allocated, causing instruction size mismatch between passes
1278 and hence incorrect address calculations. Fixed.
1280 Stupid bug in the revised ELF section generation fixed (associated
1281 string-table section for .symtab was hard-coded as 7, even when this
1282 didn't fit with the real section table). Was causing `ld' to
1283 seg-fault under Linux.
1285 Included a new Borland C makefile, Makefile.bc2, donated by Fox
1286 Cutter <lmb@comtch.iea.com>.
1289 0.92 released January 1997
1290 --------------------------
1292 The FDIVP/FDIVRP and FSUBP/FSUBRP pairs had been inverted: this was
1293 fixed. This also affected the LCC driver.
1295 Fixed a bug regarding 32-bit effective addresses of the form
1296 [other_register+ESP].
1298 Documentary changes, notably documentation of the fact that Borland
1299 Win32 compilers use `obj' rather than `win32' object format.
1301 Fixed the COMENT record in OBJ files, which was formatted
1302 incorrectly.
1304 Fixed a bug causing segfaults in large RDF files.
1306 OBJ format now strips initial periods from segment and group
1307 definitions, in order to avoid complications with the local label
1308 syntax.
1310 Fixed a bug in disassembling far calls and jumps in NDISASM.
1312 Added support for user-defined sections in COFF and ELF files.
1314 Compiled the DOS binaries with a sensible amount of stack, to
1315 prevent stack overflows on any arithmetic expression containing
1316 parentheses.
1318 Fixed a bug in handling of files that do not terminate in a newline.
1321 0.91 released November 1996
1322 ---------------------------
1324 Loads of bug fixes.
1325 Support for RDF added.
1326 Support for DBG debugging format added.
1327 Support for 32-bit extensions to Microsoft OBJ format added.
1328 Revised for Borland C: some variable names changed, makefile added.
1329 LCC support revised to actually work.
1330 JMP/CALL NEAR/FAR notation added.
1331 `a16', `o16', `a32' and `o32' prefixes added.
1332 Range checking on short jumps implemented.
1333 MMX instruction support added.
1334 Negative floating point constant support added.
1335 Memory handling improved to bypass 64K barrier under DOS.
1336 $ prefix to force treatment of reserved words as identifiers added.
1337 Default-size mechanism for object formats added.
1338 Compile-time configurability added.
1339 `#', `@', `~' and `?' are now valid characters in labels.
1340 `-e' and `-k' options in NDISASM added.
1343 0.90 released October 1996
1344 --------------------------
1346 First release version. First support for object file output. Other
1347 changes from previous version (0.3x) too numerous to document.