Clean up some duplication
[factor/jcg.git] / extra / reports / noise / noise.factor
blob1ce7f9c726cf4b5d426d0a5868ca6302bef444d2
1 ! Copyright (C) 2008 Slava Pestov.\r
2 ! See http://factorcode.org/license.txt for BSD license.\r
3 USING: accessors assocs math kernel shuffle generalizations\r
4 words quotations arrays combinators sequences math.vectors\r
5 io.styles prettyprint vocabs sorting io generic\r
6 math.statistics math.order locals.types\r
7 locals.definitions ;\r
8 IN: reports.noise\r
9 \r
10 : badness ( word -- n )\r
11     H{\r
12         { -nrot 5 }\r
13         { -roll 4 }\r
14         { -rot 3 }\r
15         { bi@ 1 }\r
16         { 2curry 1 }\r
17         { 2drop 1 }\r
18         { 2dup 1 }\r
19         { 2keep 1 }\r
20         { 2nip 2 }\r
21         { 2over 4 }\r
22         { 2slip 2 }\r
23         { 2swap 3 }\r
24         { 3curry 2 }\r
25         { 3drop 1 }\r
26         { 3dup 2 }\r
27         { 3keep 3 }\r
28         { 3nip 4 }\r
29         { 3slip 3 }\r
30         { 4drop 2 }\r
31         { 4dup 3 }\r
32         { compose 1/2 }\r
33         { curry 1/3 }\r
34         { dip 1 }\r
35         { 2dip 2 }\r
36         { drop 1/3 }\r
37         { dup 1/3 }\r
38         { if 1/3 }\r
39         { when 1/4 }\r
40         { unless 1/4 }\r
41         { when* 1/3 }\r
42         { unless* 1/3 }\r
43         { ?if 1/2 }\r
44         { cond 1/2 }\r
45         { case 1/2 }\r
46         { keep 1 }\r
47         { napply 2 }\r
48         { ncurry 3 }\r
49         { ndip 5 }\r
50         { ndrop 2 }\r
51         { ndup 3 }\r
52         { nip 2 }\r
53         { nipd 3 }\r
54         { nkeep 5 }\r
55         { npick 6 }\r
56         { nrev 5 }\r
57         { nrot 5 }\r
58         { nslip 5 }\r
59         { ntuck 6 }\r
60         { nwith 4 }\r
61         { over 2 }\r
62         { pick 4 }\r
63         { roll 4 }\r
64         { rot 3 }\r
65         { slip 1 }\r
66         { spin 3 }\r
67         { swap 1 }\r
68         { swapd 3 }\r
69         { tuck 2 }\r
70         { tuckd 4 }\r
71         { with 1/2 }\r
73         { bi 1/2 }\r
74         { tri 1 }\r
75         { bi* 1/2 }\r
76         { tri* 1 }\r
78         { cleave 2 }\r
79         { spread 2 }\r
80     } at 0 or ;\r
82 : vsum ( pairs -- pair ) { 0 0 } [ v+ ] reduce ;\r
84 GENERIC: noise ( obj -- pair )\r
86 M: word noise badness 1 2array ;\r
88 M: wrapper noise wrapped>> noise ;\r
90 M: let noise body>> noise ;\r
92 M: wlet noise body>> noise ;\r
94 M: lambda noise body>> noise ;\r
96 M: object noise drop { 0 0 } ;\r
98 M: quotation noise [ noise ] map vsum { 1/4 1/2 } v+ ;\r
100 M: array noise [ noise ] map vsum ;\r
102 : noise-factor ( x y -- z ) / 100 * >integer ;\r
104 : quot-noise-factor ( quot -- n )\r
105     #! For very short words, noise doesn't count so much\r
106     #! (so dup foo swap bar isn't penalized as badly).\r
107     noise first2 {\r
108         { [ over 4 <= ] [ [ drop 0 ] dip ] }\r
109         { [ over 15 >= ] [ [ 2 * ] dip ] }\r
110         [ ]\r
111     } cond\r
112     {\r
113         ! short words are easier to read\r
114         { [ dup 10 <= ] [ [ 2 / ] dip ] }\r
115         { [ dup 5 <= ] [ [ 3 / ] dip ] }\r
116         ! long words are penalized even more\r
117         { [ dup 25 >= ] [ [ 2 * ] dip 20 max ] }\r
118         { [ dup 20 >= ] [ [ 5/3 * ] dip ] }\r
119         { [ dup 15 >= ] [ [ 3/2 * ] dip ] }\r
120         [ ]\r
121     } cond noise-factor ;\r
123 GENERIC: word-noise-factor ( word -- factor )\r
125 M: word word-noise-factor\r
126     def>> quot-noise-factor ;\r
128 M: lambda-word word-noise-factor\r
129     "lambda" word-prop quot-noise-factor ;\r
131 : flatten-generics ( words -- words' )\r
132     [\r
133         dup generic? [ "methods" word-prop values ] [ 1array ] if\r
134     ] map concat ;\r
136 : noisy-words ( -- alist )\r
137     all-words flatten-generics\r
138     [ dup word-noise-factor ] { } map>assoc\r
139     sort-values reverse ;\r
141 : noise. ( alist -- )\r
142     standard-table-style [\r
143         [\r
144             [ [ pprint-cell ] [ pprint-cell ] bi* ] with-row\r
145         ] assoc-each\r
146     ] tabular-output ;\r
148 : vocab-noise-factor ( vocab -- factor )\r
149     words flatten-generics\r
150     [ word-noise-factor dup 20 < [ drop 0 ] when ] map\r
151     [ 0 ] [\r
152         [ [ sum ] [ length 5 max ] bi /i ]\r
153         [ supremum ]\r
154         bi +\r
155     ] if-empty ;\r
157 : noisy-vocabs ( -- alist )\r
158     vocabs [ dup vocab-noise-factor ] { } map>assoc\r
159     sort-values reverse ;\r
161 : noise-report ( -- )\r
162     "NOISY WORDS:" print\r
163     noisy-words 80 head noise.\r
164     nl\r
165     "NOISY VOCABS:" print\r
166     noisy-vocabs 80 head noise. ;\r
168 MAIN: noise-report\r