Bug fixes for lcs.diff2html; xml.writer
[factor/jcg.git] / basis / help / cookbook / cookbook.factor
blobebc711d5273ca13b4ef4211b7dc0ef7561eac5d3
1 USING: help.markup help.syntax io kernel math namespaces parser
2 prettyprint sequences vocabs.loader namespaces stack-checker
3 help command-line multiline ;
4 IN: help.cookbook
6 ARTICLE: "cookbook-syntax" "Basic syntax cookbook"
7 "The following is a simple snippet of Factor code:"
8 { $example "10 sq 5 - ." "95" }
9 "You can click on it to evaluate it in the listener, and it will print the same output value as indicated above."
10 $nl
11 "Factor has a very simple syntax. Your program consists of " { $emphasis "words" } " and " { $emphasis "literals" } ". In the above snippet, the words are " { $link sq } ", " { $link - } " and " { $link . } ". The two integers 10 and 5 are literals."
12 $nl
13 "Factor evaluates code left to right, and stores intermediate values on a " { $emphasis "stack" } ". If you think of the stack as a pile of papers, then " { $emphasis "pushing" } " a value on the stack corresponds to placing a piece of paper at the top of the pile, while " { $emphasis "popping" } " a value corresponds to removing the topmost piece."
14 $nl
15 "All words except those which only push literals on the stack must have a " { $emphasis "stack effect declaration" } ", for example " { $snippet "( x y -- z )" } " denotes that a word takes two inputs, with " { $snippet "y" } " at the top of the stack, and returns one output. Stack effect declarations can be viewed by browsing source code, or using tools such as " { $link see } "; they are also checked by the compiler. See " { $link "effect-declaration" } "."
16 $nl
17 "Coming back to the example in the beginning of this article, the following series of steps occurs as the code is evaluated:"
18 { $table
19     { "Action" "Stack contents" }
20     { "10 is pushed on the stack." { $snippet "10" } }
21     { { "The " { $link sq } " word is executed. It pops one input from the stack - the integer 10 - and squares it, pushing the result." } { $snippet "100" } }
22     { { "5 is pushed on the stack." } { $snippet "100 5" } }
23     { { "The " { $link - } " word is executed. It pops two inputs from the stack - the integers 100 and 5 - and subtracts 5 from 100, pushing the result." } { $snippet "95" } }
24     { { "The " { $link . } " word is executed. It pops one input from the stack - the integer 95 - and prints it in the listener's output area." } { } }
26 "Factor supports many other data types:"
27 { $code
28     "10.5"
29     "\"character strings\""
30     "{ 1 2 3 }"
31     "! by the way, this is a comment"
32     "#! and so is this"
34 { $references
35     { "Factor's syntax can be extended, the parser can be called reflectively, and the " { $link . } " word is in fact a general facility for turning almost any object into a form which can be parsed back in again. If this interests you, consult the following sections:" }
36     "syntax"
37     "parser"
38     "prettyprint"
39 } ;
41 ARTICLE: "cookbook-colon-defs" "Shuffle word and definition cookbook"
42 "The " { $link dup } " word makes a copy of the value at the top of the stack:"
43 { $example "5 dup * ." "25" }
44 "The " { $link sq } " word is actually defined as follows:"
45 { $code ": sq ( x -- y ) dup * ;" }
46 "(You could have looked this up yourself by clicking on the " { $link sq } " word itself.)"
47 $nl
48 "Note the key elements in a word definition: The colon " { $link POSTPONE: : } " denotes the start of a word definition. The name of the new word must immediately follow. The word definition then continues on until the " { $link POSTPONE: ; } " token signifies the end of the definition. This type of word definition is called a " { $emphasis "compound definition." }
49 $nl
50 "Factor is all about code reuse through short and logical colon definitions. Breaking up a problem into small pieces which are easy to test is called " { $emphasis "factoring." }
51 $nl
52 "Another example of a colon definition:"
53 { $code ": neg ( x -- -x ) 0 swap - ;" }
54 "Here the " { $link swap } " shuffle word is used to interchange the top two stack elements. Note the difference that " { $link swap } " makes in the following two snippets:"
55 { $code
56     "5 0 -       ! Computes 5-0"
57     "5 0 swap -  ! Computes 0-5"
59 "Also, in the above example a stack effect declaration is written between " { $snippet "(" } " and " { $snippet ")" } " with a mnemonic description of what the word does to the stack. See " { $link "effect-declaration" } " for details."
60 { $curious
61     "This syntax will be familiar to anybody who has used Forth before. However the behavior is slightly different. In most Forth systems, the below code prints 2, because the definition of " { $snippet "b" } " still refers to the previous definition of " { $snippet "a" } ":"
62     { $code
63         ": a 1 ;"
64         ": b ( -- x ) a 1 + ;"
65         ": a 2 ;"
66         "b ."
67     }
68     "In Factor, this example will print 3 since word redefinition is explicitly supported."
69     $nl
70     "Indeed, redefining a word twice in the same source file is an error; this is almost always a mistake since there's no way to call the first definition. See " { $link "definition-checking" } "."
72 { $references
73     { "A whole slew of shuffle words can be used to rearrange the stack. There are forms of word definition other than colon definition, words can be defined entirely at runtime, and word definitions can be " { $emphasis "annotated" } " with tracing calls and breakpoints without modifying the source code." }
74     "shuffle-words"
75     "words"
76     "generic"
77     "tools"
78 } ;
80 ARTICLE: "cookbook-combinators" "Control flow cookbook"
81 "A " { $emphasis "quotation" } " is an object containing code which can be evaluated."
82 { $code
83     "2 2 + .     ! Prints 4"
84     "[ 2 2 + . ] ! Pushes a quotation"
86 "The quotation pushed by the second example will print 4 when called by " { $link call } "."
87 $nl
88 "Quotations are used to implement control flow. For example, conditional execution is done with " { $link if } ":"
89 { $code
90     ": sign-test ( n -- )"
91     "    dup 0 < ["
92     "        drop \"negative\""
93     "    ] ["
94     "        zero? [ \"zero\" ] [ \"positive\" ] if"
95     "    ] if print ;"
97 "The " { $link if } " word takes a boolean, a true quotation, and a false quotation, and executes one of the two quotations depending on the value of the boolean. In Factor, any object not equal to the special value " { $link f } " is considered true, while " { $link f } " is false."
98 $nl
99 "Another useful form of control flow is iteration. You can do something several times:"
100 { $code "10 [ \"Factor rocks!\" print ] times" }
101 "Now we can look at a new data type, the array:"
102 { $code "{ 1 2 3 }" }
103 "An array differs from a quotation in that it cannot be evaluated; it simply stores data."
105 "You can perform an operation on each element of an array:"
106 { $example
107     "{ 1 2 3 } [ \"The number is \" write . ] each"
108     "The number is 1\nThe number is 2\nThe number is 3"
110 "You can transform each element, collecting the results in a new array:"
111 { $example "{ 5 12 0 -12 -5 } [ sq ] map ." "{ 25 144 0 144 25 }" }
112 "You can create a new array, only containing elements which satisfy some condition:"
113 { $example
114     ": negative? ( n -- ? ) 0 < ;"
115     "{ -12 10 16 0 -1 -3 -9 } [ negative? ] filter ."
116     "{ -12 -1 -3 -9 }"
118 { $references
119     { "Since quotations are objects, they can be constructed and taken apart at will. You can write code that writes code. Arrays are just one of the various types of sequences, and the sequence operations such as " { $link each } " and " { $link map } " operate on all types of sequences. There are many more sequence iteration operations than the ones above, too." }
120     "dataflow"
121     "sequences"
122 } ;
124 ARTICLE: "cookbook-variables" "Variables cookbook"
125 "Before using a variable, you must define a symbol for it:"
126 { $code "SYMBOL: name" }
127 "A symbol is a word which pushes itself on the stack when executed. Try it:"
128 { $example "SYMBOL: foo" "foo ." "foo" }
129 "Symbols can be passed to the " { $link get } " and " { $link set } " words to read and write variable values:"
130 { $example "\"Slava\" name set" "name get print" "Slava" }
131 "If you set variables inside a " { $link with-scope } ", their values will be lost after leaving the scope:"
132 { $example
133     ": print-name name get print ;"
134     "\"Slava\" name set"
135     "["
136     "    \"Diana\" name set"
137     "    \"There, the name is \" write  print-name"
138     "] with-scope"
139     "\"Here, the name is \" write  print-name"
140     "There, the name is Diana\nHere, the name is Slava"
142 { $curious
143     "Variables are dynamically-scoped in Factor."
145 { $references
146     "There is a lot more to be said about variables and namespaces."
147     "namespaces"
148 } ;
150 ARTICLE: "cookbook-vocabs" "Vocabularies cookbook"
151 "Rather than being in one flat list, words belong to vocabularies; every word is contained in exactly one. When parsing a word name, the parser searches the " { $emphasis "vocabulary search path" } ". When working at the listener, a useful set of vocabularies is already available. In a source file, all used vocabularies must be imported."
153 "For example, a source file containing the following code will print a parse error if you try loading it:"
154 { $code "\"Hello world\" print" }
155 "The " { $link print } " word is contained inside the " { $vocab-link "io" } " vocabulary, which is available in the listener but must be explicitly added to the search path in source files:"
156 { $code
157     "USE: io"
158     "\"Hello world\" print"
160 "Typically a source file will refer to words in multiple vocabularies, and they can all be added to the search path in one go:"
161 { $code "USING: arrays kernel math ;" }
162 "New words go into the " { $vocab-link "scratchpad" } " vocabulary by default. You can change this with " { $link POSTPONE: IN: } ":"
163 { $code
164     "IN: time-machine"
165     ": time-travel ( when what -- ) frob fizz flap ;"
167 "Note that words must be defined before being referenced. The following is generally invalid:"
168 { $code
169     ": frob accelerate particles ;"
170     ": accelerate accelerator on ;"
171     ": particles [ (particles) ] each ;"
173 "You would have to place the first definition after the two others for the parser to accept the file."
174 { $references
175     { }
176     "vocabulary-search"
177     "words"
178     "parser"
179 } ;
181 ARTICLE: "cookbook-io" "Input and output cookbook"
182 "Ask the user for their age, and print it back:"
183 { $code
184     "USING: io math.parser ;"
185     ": ask-age ( -- ) \"How old are you?\" print ;"
186     ": read-age ( -- n ) readln string>number ;"
187     ": print-age ( n -- )"
188     "    \"You are \" write"
189     "    number>string write"
190     "    \" years old.\" print ;"
191     ": example ( -- ) ask-age read-age print-age ;"
192     "example"
194 "Print the lines of a file in sorted order:"
195 { $code
196     "USING: io io.encodings.utf8 io.files sequences sorting ;"
197     "\"lines.txt\" utf8 file-lines natural-sort [ print ] each"
199 "Read 1024 bytes from a file:"
200 { $code
201     "USING: io io.encodings.binary io.files ;"
202     "\"data.bin\" binary [ 1024 read ] with-file-reader"
204 "Convert a file of 4-byte cells from little to big endian or vice versa, by directly mapping it into memory and operating on it with sequence words:"
205 { $code
206     "USING: accessors grouping io.files io.mmap.char kernel sequences ;"
207     "\"mydata.dat\" ["
208     "    4 <sliced-groups> [ reverse-here ] change-each"
209     "] with-mapped-char-file"
211 "Send some bytes to a remote host:"
212 { $code
213     "USING: io io.encodings.ascii io.sockets strings ;"
214     "\"myhost\" 1033 <inet> ascii"
215     "[ B{ 12 17 102 } write ] with-client"
217 { $references
218     { }
219     "number-strings"
220     "io"
221 } ;
223 ARTICLE: "cookbook-compiler" "Compiler cookbook"
224 "Factor includes two compilers which work behind the scenes. Words are always compiled, and the compilers do not have to be invoked explicitly. For the most part, compilation is a fully transparent process. However, there are a few things worth knowing about the compilation process."
226 "The optimizing compiler trades off compile time for performance of generated code, so loading certain vocabularies might take a while. Saving the image after loading vocabularies can save you a lot of time that you would spend waiting for the same code to load in every coding session; see " { $link "images" } " for information."
228 "After loading a vocabulary, you might see messages like:"
229 { $code
230     ":errors - print 2 compiler errors."
231     ":warnings - print 50 compiler warnings."
233 "These warnings arise from the compiler's stack effect checker. Warnings are non-fatal conditions -- not all code has a static stack effect, so you try to minimize warnings but understand that in many cases they cannot be eliminated. Errors indicate programming mistakes, such as erroneous stack effect declarations."
234 { $references
235     "To learn more about the compiler and static stack effect inference, read these articles:"
236     "compiler"
237     "compiler-errors"
238     "inference"
239 } ;
241 ARTICLE: "cookbook-application" "Application cookbook"
242 "Vocabularies can define a main entry point:"
243 { $code "IN: game-of-life"
244 "..."
245 ": play-life ... ;"
247 "MAIN: play-life"
249 "See " { $link POSTPONE: MAIN: } " for details. The " { $link run } " word loads a vocabulary if necessary, and calls its main entry point; try the following, it's fun:"
250 { $code "\"tetris\" run" }
251 "Factor can deploy stand-alone executables; they do not have any external dependencies and consist entirely of compiled native machine code:"
252 { $code "\"tetris\" deploy-tool" }
253 { $references
254     { }
255     "vocabs.loader"
256     "tools.deploy"
257     "ui.tools.deploy"
258     "cookbook-scripts"
259 } ;
261 ARTICLE: "cookbook-scripts" "Scripting cookbook"
262 "Factor can be used for command-line scripting on Unix-like systems."
264 "To run a script, simply pass it as an argument to the Factor executable:"
265 { $code "./factor cleanup.factor" }
266 "The script may access command line arguments by inspecting the value of the " { $link command-line } " variable. It can also get its own path from the " { $link script } " variable."
267 { $heading "Example: ls" }
268 "Here is an example implementing a simplified version of the Unix " { $snippet "ls" } " command in Factor:"
269 { $code
270     <" USING: command-line namespaces io io.files
271 io.pathnames tools.files sequences kernel ;
273 command-line get [
274     current-directory get directory.
275 ] [
276     dup length 1 = [ first directory. ] [
277         [ [ nl write ":" print ] [ directory. ] bi ] each
278     ] if
279 ] if-empty">
281 "You can put it in a file named " { $snippet "ls.factor" } ", and then run it, to list the " { $snippet "/usr/bin" } " directory for example:"
282 { $code "./factor ls.factor /usr/bin" }
283 { $heading "Example: grep" }
284 "The following is a more complicated example, implementing something like the Unix " { $snippet "grep" } " command:"
285 { $code <" USING: kernel fry io io.files io.encodings.ascii sequences
286 regexp command-line namespaces ;
287 IN: grep
289 : grep-lines ( pattern -- )
290     '[ dup _ matches? [ print ] [ drop ] if ] each-line ;
292 : grep-file ( pattern filename -- )
293     ascii [ grep-lines ] with-file-reader ;
295 : grep-usage ( -- )
296     "Usage: factor grep.factor <pattern> [<file>...]" print ;
298 command-line get [
299     grep-usage
300 ] [
301     unclip <regexp> swap [
302         grep-lines
303     ] [
304         [ grep-file ] with each
305     ] if-empty
306 ] if-empty"> }
307 "You can run it like so,"
308 { $code "./factor grep.factor '.*hello.*' myfile.txt" }
309 "You'll notice this script takes a while to start. This is because it is loading and compiling the " { $vocab-link "regexp" } " vocabulary every time. To speed up startup, load the vocabulary into your image, and save the image:"
310 { $code "USE: regexp" "save" }
311 "Now, the " { $snippet "grep.factor" } " script will start up much faster. See " { $link "images" } " for details."
312 { $heading "Executable scripts" }
313 "It is also possible to make executable scripts. A Factor file can begin with a comment like the following:"
314 { $code "#! /usr/bin/env factor" }
315 "If the text file is made executable, then it can be run, assuming the " { $snippet "factor" } " binary is in your " { $snippet "$PATH" } "."
317 "The space between " { $snippet "#!" } " and " { $snippet "/usr/bin/env" } " is necessary, since " { $link POSTPONE: #! } " is a parsing word, and a syntax error would otherwise result."
318 { $references
319     { }
320     "cli"
321     "cookbook-application"
322     "images"
323 } ;
325 ARTICLE: "cookbook-philosophy" "Factor philosophy"
326 "Learning a stack language is like learning to ride a bicycle: it takes a bit of practice and you might graze your knees a couple of times, but once you get the hang of it, it becomes second nature."
328 "The most common difficulty encountered by beginners is trouble reading and writing code as a result of trying to place too many values on the stack at a time."
330 "Keep the following guidelines in mind to avoid losing your sense of balance:"
331 { $list
332     "Simplify, simplify, simplify. Break your program up into small words which operate on a few values at a time. Most word definitions should fit on a single line; very rarely should they exceed two or three lines."
333     "In addition to keeping your words short, keep them meaningful. Give them good names, and make sure each word only does one thing. Try documenting your words; if the documentation for a word is unclear or complex, chances are the word definition is too. Don't be afraid to refactor your code."
334     "If your code looks repetitive, factor it some more."
335     "If after factoring, your code still looks repetitive, introduce combinators."
336     "If after introducing combinators, your code still looks repetitive, look into using meta-programming techniques."
337     "Try to place items on the stack in the order in which they are needed. If everything is in the correct order, no shuffling needs to be performed."
338     "If you find yourself writing a stack comment in the middle of a word, break the word up."
339     { "Use " { $link "cleave-combinators" } " and " { $link "spread-combinators" } " instead of " { $link "shuffle-words" } " to give your code more structure." }
340     { "Not everything has to go on the stack. The " { $vocab-link "namespaces" } " vocabulary provides dynamically-scoped variables, and the " { $vocab-link "locals" } " vocabulary provides lexically-scoped variables. Learn both and use them where they make sense, but keep in mind that overuse of variables makes code harder to factor." }
341     "Every time you define a word which simply manipulates sequences, hashtables or objects in an abstract way which is not related to your program domain, check the library to see if you can reuse an existing definition."
342     { "Learn to use the " { $link "inference" } " tool." }
343     { "Write unit tests. Factor provides good support for unit testing; see " { $link "tools.test" } ". Once your program has a good test suite you can refactor with confidence and catch regressions early." }
344     "Don't write Factor as if it were C. Imperative programming and indexed loops are almost always not the most idiomatic solution."
345     { "Use sequences, assocs and objects to group related data. Object allocation is very cheap. Don't be afraid to create tuples, pairs and triples. Don't be afraid of operations which allocate new objects either, such as " { $link append } "." }
346     { "If you find yourself writing a loop with a sequence and an index, there's almost always a better way. Learn the " { $link "sequences-combinators" } " by heart." }
347     { "If you find yourself writing a heavily nested loop which performs several steps on each iteration, there is almost always a better way. Break the problem down into a series of passes over the data instead, gradually transforming it into the desired result with a series of simple loops. Factor the loops out and reuse them. If you're working on anything math-related, learn " { $link "math-vectors" } " by heart." }
348     { "If you find yourself wishing you could iterate over the datastack, or capture the contents of the datastack into a sequence, or push each element of a sequence onto the datastack, there is almost always a better way. Use " { $link "sequences" } " instead." }
349     "Don't use meta-programming if there's a simpler way."
350     "Don't worry about efficiency unless your program is too slow. Don't prefer complex code to simple code just because you feel it will be more efficient. The Factor compiler is designed to make idiomatic code run fast."
351     { "None of the above are hard-and-fast rules: there are exceptions to all of them. But one rule unconditionally holds: " { $emphasis "there is always a simpler way" } "." }
353 "Factor tries to implement as much of itself as possible, because this improves simplicity and performance. One consequence is that Factor exposes its internals for extension and study. You even have the option of using low-level features not usually found in high-level languages, such manual memory management, pointer arithmetic, and inline assembly code."
355 "Unsafe features are tucked away so that you will not invoke them by accident, or have to use them to solve conventional programming problems. However when the need arises, unsafe features are invaluable, for example you might have to do some pointer arithmetic when interfacing directly with C libraries." ;
356 ARTICLE: "cookbook-pitfalls" "Pitfalls to avoid"
357 "Factor is a very clean and consistent language. However, it has some limitations and leaky abstractions you should keep in mind, as well as behaviors which differ from other languages you may be used to."
358 { $list
359     "Factor only makes use of one native thread, and Factor threads are scheduled co-operatively. C library calls block the entire VM."
360     "Factor does not hide anything from the programmer, all internals are exposed. It is your responsibility to avoid writing fragile code which depends too much on implementation detail."
361     { "When a source file uses two vocabularies which define words with the same name, the order of the vocabularies in the " { $link POSTPONE: USE: } " or " { $link POSTPONE: USING: } " forms is important. The " { $link POSTPONE: QUALIFIED: } " word implements qualified naming, which can be used to resolve ambiguities." }
362     { "If a literal object appears in a word definition, the object itself is pushed on the stack when the word executes, not a copy. If you intend to mutate this object, you must " { $link clone } " it first. See " { $link "syntax-literals" } "." }
363     { "For a discussion of potential issues surrounding the " { $link f } " object, see " { $link "booleans" } "." }
364     { "Factor's object system is quite flexible. Careless usage of union, mixin and predicate classes can lead to similar problems to those caused by ``multiple inheritance'' in other languages. In particular, it is possible to have two classes such that they have a non-empty intersection and yet neither is a subclass of the other. If a generic word defines methods on two such classes, various disambiguation rules are applied to ensure method dispatch remains deterministic, however they may not be what you expect. See " { $link "method-order" } " for details." }
365     { "Performance-sensitive code should have a static stack effect so that it can be compiled by the optimizing word compiler, which generates more efficient code than the non-optimizing quotation compiler. See " { $link "inference" } " and " { $link "compiler" } "."
366     $nl
367     "This means that methods defined on performance sensitive, frequently-called core generic words such as " { $link nth } " should have static stack effects which are consistent with each other, since a generic word will only have a static stack effect if all methods do."
368     $nl
369     "Unit tests for the " { $vocab-link "stack-checker" } " vocabulary can be used to ensure that any methods your vocabulary defines on core generic words have static stack effects:"
370     { $code "\"stack-checker\" test" }
371     "In general, you should strive to write code with inferable stack effects, even for sections of a program which are not performance sensitive; the " { $link infer. } " tool together with the optimizing compiler's error reporting can catch many bugs ahead of time." }
372     { "Be careful when calling words which access variables from a " { $link make-assoc } " which constructs an assoc with arbitrary keys, since those keys might shadow variables." }
373     { "If " { $link run-file } " throws a stack depth assertion, it means that the top-level form in the file left behind values on the stack. The stack depth is compared before and after loading a source file, since this type of situation is almost always an error. If you have a legitimate need to load a source file which returns data in some manner, define a word in the source file which produces this data on the stack and call the word after loading the file." }
374 } ;
376 ARTICLE: "cookbook-next" "Next steps"
377 "Once you have read through " { $link "first-program" } " and " { $link "cookbook" } ", the best way to keep learning Factor is to start looking at some simple example programs. Here are a few particularly nice vocabularies which should keep you busy for a little while:"
378 { $list
379     { $vocab-link "base64" }
380     { $vocab-link "roman" }
381     { $vocab-link "rot13" }
382     { $vocab-link "smtp" }
383     { $vocab-link "time-server" }
384     { $vocab-link "tools.hexdump" }
385     { $vocab-link "webapps.counter" }
387 "If you see code in there that you do not understand, use " { $link see } " and " { $link help } " to explore." ;
389 ARTICLE: "cookbook" "Factor cookbook"
390 "The Factor cookbook is a high-level overview of the most important concepts required to program in Factor."
391 { $subsection "cookbook-syntax" }
392 { $subsection "cookbook-colon-defs" }
393 { $subsection "cookbook-combinators" }
394 { $subsection "cookbook-variables" }
395 { $subsection "cookbook-vocabs" }
396 { $subsection "cookbook-io" }
397 { $subsection "cookbook-application" }
398 { $subsection "cookbook-scripts" }
399 { $subsection "cookbook-compiler" }
400 { $subsection "cookbook-philosophy" }
401 { $subsection "cookbook-pitfalls" }
402 { $subsection "cookbook-next" } ;
404 ABOUT: "cookbook"