test
[ws10smt.git] / extools / test_data / README
blobe368cffc233f1faeebd6d87cb4ab3e0d6e0cbb95
1 The following was used to create the test data.  The real inputs
2 were corpus.fr, corpus.en, and corpus.aligned.  The generated files
3 were corpus.len_cats and fr-en.al.len.
6   ./make_len_cats.pl corpus.en > corpus.len_cats
8   ../merge_lines.pl corpus.fr corpus.en corpus.aligned corpus.len_cats > fr-en.al.len