No smart quotes here
[factor/jcg.git] / extra / parser-combinators / regexp / regexp-tests.factor
blob78abd8b38a0fd336dd8233ad948f74106db26af4
1 USING: parser-combinators.regexp tools.test kernel ;
2 IN: parser-combinators.regexp.tests
4 [ f ] [ "b" "a*" f <regexp> matches? ] unit-test
5 [ t ] [ "" "a*" f <regexp> matches? ] unit-test
6 [ t ] [ "a" "a*" f <regexp> matches? ] unit-test
7 [ t ] [ "aaaaaaa" "a*" f <regexp> matches? ] unit-test
8 [ f ] [ "ab" "a*" f <regexp> matches? ] unit-test
10 [ t ] [ "abc" "abc" f <regexp> matches? ] unit-test
11 [ t ] [ "a" "a|b|c" f <regexp> matches? ] unit-test
12 [ t ] [ "b" "a|b|c" f <regexp> matches? ] unit-test
13 [ t ] [ "c" "a|b|c" f <regexp> matches? ] unit-test
14 [ f ] [ "c" "d|e|f" f <regexp> matches? ] unit-test
16 [ f ] [ "aa" "a|b|c" f <regexp> matches? ] unit-test
17 [ f ] [ "bb" "a|b|c" f <regexp> matches? ] unit-test
18 [ f ] [ "cc" "a|b|c" f <regexp> matches? ] unit-test
19 [ f ] [ "cc" "d|e|f" f <regexp> matches? ] unit-test
21 [ f ] [ "" "a+" f <regexp> matches? ] unit-test
22 [ t ] [ "a" "a+" f <regexp> matches? ] unit-test
23 [ t ] [ "aa" "a+" f <regexp> matches? ] unit-test
25 [ t ] [ "" "a?" f <regexp> matches? ] unit-test
26 [ t ] [ "a" "a?" f <regexp> matches? ] unit-test
27 [ f ] [ "aa" "a?" f <regexp> matches? ] unit-test
29 [ f ] [ "" "." f <regexp> matches? ] unit-test
30 [ t ] [ "a" "." f <regexp> matches? ] unit-test
31 [ t ] [ "." "." f <regexp> matches? ] unit-test
32 ! [ f ] [ "\n" "." f <regexp> matches? ] unit-test
34 [ f ] [ "" ".+" f <regexp> matches? ] unit-test
35 [ t ] [ "a" ".+" f <regexp> matches? ] unit-test
36 [ t ] [ "ab" ".+" f <regexp> matches? ] unit-test
38 [ t ] [ "" "a|b*|c+|d?" f <regexp> matches? ] unit-test
39 [ t ] [ "a" "a|b*|c+|d?" f <regexp> matches? ] unit-test
40 [ t ] [ "c" "a|b*|c+|d?" f <regexp> matches? ] unit-test
41 [ t ] [ "cc" "a|b*|c+|d?" f <regexp> matches? ] unit-test
42 [ f ] [ "ccd" "a|b*|c+|d?" f <regexp> matches? ] unit-test
43 [ t ] [ "d" "a|b*|c+|d?" f <regexp> matches? ] unit-test
45 [ t ] [ "foo" "foo|bar" f <regexp> matches? ] unit-test
46 [ t ] [ "bar" "foo|bar" f <regexp> matches? ] unit-test
47 [ f ] [ "foobar" "foo|bar" f <regexp> matches? ] unit-test
49 [ f ] [ "" "(a)" f <regexp> matches? ] unit-test
50 [ t ] [ "a" "(a)" f <regexp> matches? ] unit-test
51 [ f ] [ "aa" "(a)" f <regexp> matches? ] unit-test
52 [ t ] [ "aa" "(a*)" f <regexp> matches? ] unit-test
54 [ f ] [ "aababaaabbac" "(a|b)+" f <regexp> matches? ] unit-test
55 [ t ] [ "ababaaabba" "(a|b)+" f <regexp> matches? ] unit-test
57 [ f ] [ "" "a{1}" f <regexp> matches? ] unit-test
58 [ t ] [ "a" "a{1}" f <regexp> matches? ] unit-test
59 [ f ] [ "aa" "a{1}" f <regexp> matches? ] unit-test
61 [ f ] [ "a" "a{2,}" f <regexp> matches? ] unit-test
62 [ t ] [ "aaa" "a{2,}" f <regexp> matches? ] unit-test
63 [ t ] [ "aaaa" "a{2,}" f <regexp> matches? ] unit-test
64 [ t ] [ "aaaaa" "a{2,}" f <regexp> matches? ] unit-test
66 [ t ] [ "" "a{,2}" f <regexp> matches? ] unit-test
67 [ t ] [ "a" "a{,2}" f <regexp> matches? ] unit-test
68 [ t ] [ "aa" "a{,2}" f <regexp> matches? ] unit-test
69 [ f ] [ "aaa" "a{,2}" f <regexp> matches? ] unit-test
70 [ f ] [ "aaaa" "a{,2}" f <regexp> matches? ] unit-test
71 [ f ] [ "aaaaa" "a{,2}" f <regexp> matches? ] unit-test
73 [ f ] [ "" "a{1,3}" f <regexp> matches? ] unit-test
74 [ t ] [ "a" "a{1,3}" f <regexp> matches? ] unit-test
75 [ t ] [ "aa" "a{1,3}" f <regexp> matches? ] unit-test
76 [ t ] [ "aaa" "a{1,3}" f <regexp> matches? ] unit-test
77 [ f ] [ "aaaa" "a{1,3}" f <regexp> matches? ] unit-test
79 [ f ] [ "" "[a]" f <regexp> matches? ] unit-test
80 [ t ] [ "a" "[a]" f <regexp> matches? ] unit-test
81 [ t ] [ "a" "[abc]" f <regexp> matches? ] unit-test
82 [ f ] [ "b" "[a]" f <regexp> matches? ] unit-test
83 [ f ] [ "d" "[abc]" f <regexp> matches? ] unit-test
84 [ t ] [ "ab" "[abc]{1,2}" f <regexp> matches? ] unit-test
85 [ f ] [ "abc" "[abc]{1,2}" f <regexp> matches? ] unit-test
87 [ f ] [ "" "[^a]" f <regexp> matches? ] unit-test
88 [ f ] [ "a" "[^a]" f <regexp> matches? ] unit-test
89 [ f ] [ "a" "[^abc]" f <regexp> matches? ] unit-test
90 [ t ] [ "b" "[^a]" f <regexp> matches? ] unit-test
91 [ t ] [ "d" "[^abc]" f <regexp> matches? ] unit-test
92 [ f ] [ "ab" "[^abc]{1,2}" f <regexp> matches? ] unit-test
93 [ f ] [ "abc" "[^abc]{1,2}" f <regexp> matches? ] unit-test
95 [ t ] [ "]" "[]]" f <regexp> matches? ] unit-test
96 [ f ] [ "]" "[^]]" f <regexp> matches? ] unit-test
98 ! [ "^" "[^]" f <regexp> matches? ] must-fail
99 [ t ] [ "^" "[]^]" f <regexp> matches? ] unit-test
100 [ t ] [ "]" "[]^]" f <regexp> matches? ] unit-test
102 [ t ] [ "[" "[[]" f <regexp> matches? ] unit-test
103 [ f ] [ "^" "[^^]" f <regexp> matches? ] unit-test
104 [ t ] [ "a" "[^^]" f <regexp> matches? ] unit-test
106 [ t ] [ "-" "[-]" f <regexp> matches? ] unit-test
107 [ f ] [ "a" "[-]" f <regexp> matches? ] unit-test
108 [ f ] [ "-" "[^-]" f <regexp> matches? ] unit-test
109 [ t ] [ "a" "[^-]" f <regexp> matches? ] unit-test
111 [ t ] [ "-" "[-a]" f <regexp> matches? ] unit-test
112 [ t ] [ "a" "[-a]" f <regexp> matches? ] unit-test
113 [ t ] [ "-" "[a-]" f <regexp> matches? ] unit-test
114 [ t ] [ "a" "[a-]" f <regexp> matches? ] unit-test
115 [ f ] [ "b" "[a-]" f <regexp> matches? ] unit-test
116 [ f ] [ "-" "[^-]" f <regexp> matches? ] unit-test
117 [ t ] [ "a" "[^-]" f <regexp> matches? ] unit-test
119 [ f ] [ "-" "[a-c]" f <regexp> matches? ] unit-test
120 [ t ] [ "-" "[^a-c]" f <regexp> matches? ] unit-test
121 [ t ] [ "b" "[a-c]" f <regexp> matches? ] unit-test
122 [ f ] [ "b" "[^a-c]" f <regexp> matches? ] unit-test
124 [ t ] [ "-" "[a-c-]" f <regexp> matches? ] unit-test
125 [ f ] [ "-" "[^a-c-]" f <regexp> matches? ] unit-test
127 [ t ] [ "\\" "[\\\\]" f <regexp> matches? ] unit-test
128 [ f ] [ "a" "[\\\\]" f <regexp> matches? ] unit-test
129 [ f ] [ "\\" "[^\\\\]" f <regexp> matches? ] unit-test
130 [ t ] [ "a" "[^\\\\]" f <regexp> matches? ] unit-test
132 [ t ] [ "0" "[\\d]" f <regexp> matches? ] unit-test
133 [ f ] [ "a" "[\\d]" f <regexp> matches? ] unit-test
134 [ f ] [ "0" "[^\\d]" f <regexp> matches? ] unit-test
135 [ t ] [ "a" "[^\\d]" f <regexp> matches? ] unit-test
137 [ t ] [ "a" "[a-z]{1,}|[A-Z]{2,4}|b*|c|(f|g)*" f <regexp> matches? ] unit-test
138 [ t ] [ "a" "[a-z]{1,2}|[A-Z]{3,3}|b*|c|(f|g)*" f <regexp> matches? ] unit-test
139 [ t ] [ "a" "[a-z]{1,2}|[A-Z]{3,3}" f <regexp> matches? ] unit-test
141 [ t ] [ "1000" "\\d{4,6}" f <regexp> matches? ] unit-test
142 [ t ] [ "1000" "[0-9]{4,6}" f <regexp> matches? ] unit-test
144 [ t ] [ "abc" "\\p{Lower}{3}" f <regexp> matches? ] unit-test
145 [ f ] [ "ABC" "\\p{Lower}{3}" f <regexp> matches? ] unit-test
146 [ t ] [ "ABC" "\\p{Upper}{3}" f <regexp> matches? ] unit-test
147 [ f ] [ "abc" "\\p{Upper}{3}" f <regexp> matches? ] unit-test
149 [ f ] [ "abc" "[\\p{Upper}]{3}" f <regexp> matches? ] unit-test
150 [ t ] [ "ABC" "[\\p{Upper}]{3}" f <regexp> matches? ] unit-test
152 [ t ] [ "" "\\Q\\E" f <regexp> matches? ] unit-test
153 [ f ] [ "a" "\\Q\\E" f <regexp> matches? ] unit-test
154 [ t ] [ "|*+" "\\Q|*+\\E" f <regexp> matches? ] unit-test
155 [ f ] [ "abc" "\\Q|*+\\E" f <regexp> matches? ] unit-test
157 [ t ] [ "S" "\\0123" f <regexp> matches? ] unit-test
158 [ t ] [ "SXY" "\\0123XY" f <regexp> matches? ] unit-test
159 [ t ] [ "x" "\\x78" f <regexp> matches? ] unit-test
160 [ f ] [ "y" "\\x78" f <regexp> matches? ] unit-test
161 [ t ] [ "x" "\\u000078" f <regexp> matches? ] unit-test
162 [ f ] [ "y" "\\u000078" f <regexp> matches? ] unit-test
164 [ t ] [ "ab" "a+b" f <regexp> matches? ] unit-test
165 [ f ] [ "b" "a+b" f <regexp> matches? ] unit-test
166 [ t ] [ "aab" "a+b" f <regexp> matches? ] unit-test
167 [ f ] [ "abb" "a+b" f <regexp> matches? ] unit-test
169 [ t ] [ "abbbb" "ab*" f <regexp> matches? ] unit-test
170 [ t ] [ "a" "ab*" f <regexp> matches? ] unit-test
171 [ f ] [ "abab" "ab*" f <regexp> matches? ] unit-test
173 [ f ] [ "x" "\\." f <regexp> matches? ] unit-test
174 [ t ] [ "." "\\." f <regexp> matches? ] unit-test
176 [ t ] [ "aaaab" "a+ab" f <regexp> matches? ] unit-test
177 [ f ] [ "aaaxb" "a+ab" f <regexp> matches? ] unit-test
178 [ t ] [ "aaacb" "a+cb" f <regexp> matches? ] unit-test
179 [ f ] [ "aaaab" "a++ab" f <regexp> matches? ] unit-test
180 [ t ] [ "aaacb" "a++cb" f <regexp> matches? ] unit-test
182 [ 3 ] [ "aaacb" "a*" f <regexp> match-head ] unit-test
183 [ 1 ] [ "aaacb" "a+?" f <regexp> match-head ] unit-test
184 [ 2 ] [ "aaacb" "aa?" f <regexp> match-head ] unit-test
185 [ 1 ] [ "aaacb" "aa??" f <regexp> match-head ] unit-test
186 [ 3 ] [ "aacb" "aa?c" f <regexp> match-head ] unit-test
187 [ 3 ] [ "aacb" "aa??c" f <regexp> match-head ] unit-test
189 [ t ] [ "aaa" "AAA" t <regexp> matches? ] unit-test
190 [ f ] [ "aax" "AAA" t <regexp> matches? ] unit-test
191 [ t ] [ "aaa" "A*" t <regexp> matches? ] unit-test
192 [ f ] [ "aaba" "A*" t <regexp> matches? ] unit-test
193 [ t ] [ "b" "[AB]" t <regexp> matches? ] unit-test
194 [ f ] [ "c" "[AB]" t <regexp> matches? ] unit-test
195 [ t ] [ "c" "[A-Z]" t <regexp> matches? ] unit-test
196 [ f ] [ "3" "[A-Z]" t <regexp> matches? ] unit-test
198 [ ] [ 
199     "(0[lL]?|[1-9]\\d{0,9}(\\d{0,9}[lL])?|0[xX]\\p{XDigit}{1,8}(\\p{XDigit}{0,8}[lL])?|0[0-7]{1,11}([0-7]{0,11}[lL])?|([0-9]+\\.[0-9]*|\\.[0-9]+)([eE][+-]?[0-9]+)?[fFdD]?|[0-9]+([eE][+-]?[0-9]+[fFdD]?|([eE][+-]?[0-9]+)?[fFdD]))"
200     f <regexp> drop
201 ] unit-test
203 [ t ] [ "fxxbar" "(?!foo).{3}bar" f <regexp> matches? ] unit-test
204 [ f ] [ "foobar" "(?!foo).{3}bar" f <regexp> matches? ] unit-test
206 [ 3 ] [ "foobar" "foo(?=bar)" f <regexp> match-head ] unit-test
207 [ f ] [ "foobxr" "foo(?=bar)" f <regexp> match-head ] unit-test
209 [ f ] [ "foobxr" "foo\\z" f <regexp> match-head ] unit-test
210 [ 3 ] [ "foo" "foo\\z" f <regexp> match-head ] unit-test
212 [ 3 ] [ "foo bar" "foo\\b" f <regexp> match-head ] unit-test
213 [ f ] [ "fooxbar" "foo\\b" f <regexp> matches? ] unit-test
214 [ t ] [ "foo" "foo\\b" f <regexp> matches? ] unit-test
215 [ t ] [ "foo bar" "foo\\b bar" f <regexp> matches? ] unit-test
216 [ f ] [ "fooxbar" "foo\\bxbar" f <regexp> matches? ] unit-test
217 [ f ] [ "foo" "foo\\bbar" f <regexp> matches? ] unit-test
219 [ f ] [ "foo bar" "foo\\B" f <regexp> matches? ] unit-test
220 [ 3 ] [ "fooxbar" "foo\\B" f <regexp> match-head ] unit-test
221 [ t ] [ "foo" "foo\\B" f <regexp> matches? ] unit-test
222 [ f ] [ "foo bar" "foo\\B bar" f <regexp> matches? ] unit-test
223 [ t ] [ "fooxbar" "foo\\Bxbar" f <regexp> matches? ] unit-test
224 [ f ] [ "foo" "foo\\Bbar" f <regexp> matches? ] unit-test
226 [ t ] [ "s@f" "[a-z.-]@[a-z]" f <regexp> matches? ] unit-test
227 [ f ] [ "a" "[a-z.-]@[a-z]" f <regexp> matches? ] unit-test
228 [ t ] [ ".o" "\\.[a-z]" f <regexp> matches? ] unit-test
230 ! Bug in parsing word
231 [ t ] [
232     "a"
233     R' a'
234     matches?
235 ] unit-test