otadump: init at 0.1.2 (#329129)
[NixPkgs.git] / pkgs / applications / graphics / tesseract / tesseract3.nix
blob4d3a97ade7dd1947e4b98f8d265130b6e2041496
2   lib,
3   stdenv,
4   fetchFromGitHub,
5   autoreconfHook,
6   pkg-config,
7   leptonica,
8   libpng,
9   libtiff,
10   icu,
11   pango,
12   opencl-headers,
15 stdenv.mkDerivation rec {
16   pname = "tesseract";
17   version = "3.05.02";
19   src = fetchFromGitHub {
20     owner = "tesseract-ocr";
21     repo = "tesseract";
22     rev = version;
23     hash = "sha256-28osuZnVwkJpNTYkU+5D5PI8xtViFzGCMScHzkS2H20=";
24   };
26   # leptonica 1.83 made internal structures private. using internal headers isn't
27   # great, but tesseract3's days are numbered anyway
28   postPatch = ''
29     for f in textord/devanagari_processing.cpp cube/cube_line_object.h cube/cube_line_segmenter.h cube/cube_utils.h ; do
30       sed -i '/allheaders.h/a#include "pix_internal.h"' "$f"
31     done
32   '';
34   enableParallelBuilding = true;
36   nativeBuildInputs = [
37     pkg-config
38     autoreconfHook
39   ];
41   buildInputs = [
42     leptonica
43     libpng
44     libtiff
45     icu
46     pango
47     opencl-headers
48   ];
50   LIBLEPT_HEADERSDIR = "${leptonica}/include";
52   meta = {
53     description = "OCR engine";
54     homepage = "https://github.com/tesseract-ocr/tesseract";
55     license = lib.licenses.asl20;
56     maintainers = with lib.maintainers; [ erikarvstedt ];
57     platforms = with lib.platforms; linux ++ darwin;
58     mainProgram = "tesseract";
59   };