linux_xanmod: 5.11.14 -> 5.11.15
[NixPkgs.git] / pkgs / development / libraries / languagemachines / mbt.nix
blobefa9ada7d56c9402d190a5cc57b5f1e5bbaede9d
1 { lib, stdenv, fetchurl
2 , automake, autoconf, bzip2, libtar, libtool, pkg-config, autoconf-archive
3 , libxml2
4 , languageMachines
5 }:
7 let
8   release = builtins.fromJSON (builtins.readFile ./release-info/LanguageMachines-mbt.json);
9 in
11 stdenv.mkDerivation {
12   name = "mbt-${release.version}";
13   version = release.version;
14   src = fetchurl { inherit (release) url sha256;
15                    name = "mbt-${release.version}.tar.gz"; };
16   nativeBuildInputs = [ pkg-config ];
17   buildInputs = [ automake autoconf bzip2 libtar libtool autoconf-archive
18                   libxml2
19                   languageMachines.ticcutils
20                   languageMachines.timbl
21                 ];
22   patches = [ ./mbt-add-libxml2-dep.patch ];
23   preConfigure = ''
24     sh bootstrap.sh
25   '';
27   meta = with lib; {
28     description = "Memory Based Tagger";
29     homepage    = "https://languagemachines.github.io/mbt/";
30     license     = licenses.gpl3;
31     platforms   = platforms.all;
32     maintainers = with maintainers; [ roberth ];
34     longDescription = ''
35       MBT is a memory-based tagger-generator and tagger in one. The tagger-generator part can generate a sequence tagger on the basis of a training set of tagged sequences; the tagger part can tag new sequences. MBT can, for instance, be used to generate part-of-speech taggers or chunkers for natural language processing. It has also been used for named-entity recognition, information extraction in domain-specific texts, and disfluency chunking in transcribed speech.
37       Mbt is used by Frog for Dutch tagging.
38     '';
39   };