mastodon: 4.3.1 -> 4.3.2 (#361487)
[NixPkgs.git] / pkgs / applications / graphics / tesseract / tesseract4.nix
blobe73e237cfea53fb27ce55d29cfd5af5bf8ac202d
1 { lib, stdenv, fetchFromGitHub, autoreconfHook, autoconf-archive, pkg-config
2 , leptonica, libpng, libtiff, icu, pango, opencl-headers }:
4 stdenv.mkDerivation rec {
5   pname = "tesseract";
6   version = "4.1.3";
8   src = fetchFromGitHub {
9     owner = "tesseract-ocr";
10     repo = "tesseract";
11     rev = version;
12     hash = "sha256-sV3w53ky13ESc0dGPutMGQ4TcmOeWJkvUwBPIyzSTc8=";
13   };
15   # leptonica 1.83 made internal structures private. using internal headers isn't
16   # great, but tesseract4's days are numbered anyway
17   postPatch = ''
18     sed -i '/allheaders.h/a#include "pix_internal.h"' src/textord/devanagari_processing.cpp
20     # gcc-13 compat fix, simulate this upstream patch:
21     #   https://github.com/tesseract-ocr/tesseract/commit/17e795aaae7d40dbcb7d3365835c2f55ecc6355d.patch
22     #   https://github.com/tesseract-ocr/tesseract/commit/c0db7b7e930322826e09981360e39fdbd16cc9b0.patch
24     sed -i src/ccutil/helpers.h -e '1i #include <climits>'
25     sed -i src/ccutil/helpers.h -e '1i #include <cstdint>'
26     sed -i src/dict/matchdefs.h -e '1i #include <cstdint>'
27   '';
29   enableParallelBuilding = true;
31   nativeBuildInputs = [
32     pkg-config
33     autoreconfHook
34     autoconf-archive
35   ];
37   buildInputs = [
38     leptonica
39     libpng
40     libtiff
41     icu
42     pango
43     opencl-headers
44   ];
46   meta = {
47     description = "OCR engine";
48     homepage = "https://github.com/tesseract-ocr/tesseract";
49     license = lib.licenses.asl20;
50     maintainers = with lib.maintainers; [ erikarvstedt ];
51     platforms = with lib.platforms; linux ++ darwin;
52     mainProgram = "tesseract";
53   };