remove math.blas.syntax and merge parsing words into math.blas.vectors/matrices
[factor/jcg.git] / basis / suffix-arrays / suffix-arrays.factor
blobfa68cc0a8e0a1f63bb3be31d1f4e134ee650cdec
1 ! Copyright (C) 2008 Marc Fauconneau.
2 ! See http://factorcode.org/license.txt for BSD license.
3 USING: parser kernel arrays math accessors sequences
4 math.vectors math.order sorting binary-search sets assocs fry ;
5 IN: suffix-arrays
7 <PRIVATE
9 : suffixes ( string -- suffixes-seq )
10     dup length [ tail-slice ] with map ;
12 : prefix<=> ( begin seq -- <=> )
13     [ <=> ] [ swap head? ] 2bi [ drop +eq+ ] when ;
15 : find-index ( begin suffix-array -- index/f )
16     [ prefix<=> ] with search drop ;
18 : from-to ( index begin suffix-array -- from/f to/f )
19     swap '[ _ head? not ]
20     [ find-last-from drop dup [ 1+ ] when ]
21     [ find-from drop ] 3bi ;
23 : <funky-slice> ( from/f to/f seq -- slice )
24     [
25         tuck
26         [ drop 0 or ] [ length or ] 2bi*
27         [ min ] keep
28     ] keep <slice> ; inline
30 PRIVATE>
32 : >suffix-array ( seq -- array )
33     [ suffixes ] map concat natural-sort ;
35 : SA{ \ } [ >suffix-array ] parse-literal ; parsing
37 : query ( begin suffix-array -- matches )
38     2dup find-index dup
39     [ -rot [ from-to ] keep <funky-slice> [ seq>> ] map prune ]
40     [ 3drop { } ] if ;