mini-gmp.c

   1 /* mini-gmp, a minimalistic implementation of a GNU GMP subset.
   2
   3    Contributed to the GNU project by Niels Möller
   4
   5 Copyright 1991-1997, 1999-2019 Free Software Foundation, Inc.
   6
   7 This file is part of the GNU MP Library.
   8
   9 The GNU MP Library is free software; you can redistribute it and/or modify
  10 it under the terms of either:
  11
  12   * the GNU Lesser General Public License as published by the Free
  13     Software Foundation; either version 3 of the License, or (at your
  14     option) any later version.
  15
  16 or
  17
  18   * the GNU General Public License as published by the Free Software
  19     Foundation; either version 2 of the License, or (at your option) any
  20     later version.
  21
  22 or both in parallel, as here.
  23
  24 The GNU MP Library is distributed in the hope that it will be useful, but
  25 WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
  26 or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
  27 for more details.
  28
  29 You should have received copies of the GNU General Public License and the
  30 GNU Lesser General Public License along with the GNU MP Library.  If not,
  31 see https://www.gnu.org/licenses/.  */
  32
  33 /* Modified by Mikulas Patocka to fit in Ajla */
  34
  35 /* NOTE: All functions in this file which are not declared in
  36    mini-gmp.h are internal, and are not intended to be compatible
  37    with GMP or with future versions of mini-gmp. */
  38
  39 /* Much of the material copied from GMP files, including: gmp-impl.h,
  40    longlong.h, mpn/generic/add_n.c, mpn/generic/addmul_1.c,
  41    mpn/generic/lshift.c, mpn/generic/mul_1.c,
  42    mpn/generic/mul_basecase.c, mpn/generic/rshift.c,
  43    mpn/generic/sbpi1_div_qr.c, mpn/generic/sub_n.c,
  44    mpn/generic/submul_1.c. */
  45
  46 #include "ajla.h"
  47
  48 #ifndef MPINT_GMP
  49
  50 #include <limits.h>
  51
  52 #ifdef __BORLANDC__
  53 #define const
  54 #endif
  55
  56 #include "mini-gmp.h"
  57
  58 #define assert(x)       ajla_assert(x, (file_line, "gmp assertion failed"))
  59
  60 /* Macros */
  61 #define GMP_LIMB_BITS ((int)sizeof(mp_limb_t) * CHAR_BIT)
  62
  63 #define GMP_LIMB_MAX ((mp_limb_t) ~ (mp_limb_t) 0)
  64 #define GMP_LIMB_HIGHBIT ((mp_limb_t) 1 << (GMP_LIMB_BITS - 1))
  65
  66 #define GMP_HLIMB_BIT ((mp_limb_t) 1 << (GMP_LIMB_BITS / 2))
  67 #define GMP_LLIMB_MASK (GMP_HLIMB_BIT - 1)
  68
  69 #define GMP_ULONG_BITS (sizeof(unsigned long) * CHAR_BIT)
  70 #define GMP_ULONG_HIGHBIT ((unsigned long) 1 << (GMP_ULONG_BITS - 1))
  71
  72 #define GMP_ABS(x) ((x) >= 0 ? (x) : -(x))
  73 #define GMP_NEG_CAST(T,x) (-((T)((x) + 1) - 1))
  74
  75 #define GMP_MIN(a, b) ((a) < (b) ? (a) : (b))
  76 #define GMP_MAX(a, b) ((a) > (b) ? (a) : (b))
  77
  78 #define GMP_CMP(a,b) (((a) > (b)) - ((a) < (b)))
  79
  80 #if defined(DBL_MANT_DIG) && FLT_RADIX == 2
  81 #define GMP_DBL_MANT_BITS DBL_MANT_DIG
  82 #else
  83 #define GMP_DBL_MANT_BITS (53)
  84 #endif
  85
  86 /* Return non-zero if xp,xsize and yp,ysize overlap.
  87    If xp+xsize<=yp there's no overlap, or if yp+ysize<=xp there's no
  88    overlap.  If both these are false, there's an overlap. */
  89 #define GMP_MPN_OVERLAP_P(xp, xsize, yp, ysize)                         \
  90   ((xp) + (xsize) > (yp) && (yp) + (ysize) > (xp))
  91
  92 #define gmp_assert_nocarry(x) do { \
  93     mp_limb_t attr_unused __cy = (x);      \
  94     assert (__cy == 0);            \
  95   } while (0)
  96
  97 #define gmp_clz(count, x) do {                                          \
  98     mp_limb_t __clz_x = (x);                                            \
  99     unsigned __clz_c = 0;                                               \
 100     int LOCAL_SHIFT_BITS = 8;                                           \
 101     if (GMP_LIMB_BITS > LOCAL_SHIFT_BITS)                               \
 102       for (;                                                            \
 103            (__clz_x & ((mp_limb_t) 0xff << (GMP_LIMB_BITS - 8))) == 0;  \
 104            __clz_c += 8)                                                \
 105         { __clz_x <<= LOCAL_SHIFT_BITS; }                               \
 106     for (; (__clz_x & GMP_LIMB_HIGHBIT) == 0; __clz_c++)                \
 107       __clz_x <<= 1;                                                    \
 108     (count) = __clz_c;                                                  \
 109   } while (0)
 110
 111 #define gmp_ctz(count, x) do {                                          \
 112     mp_limb_t __ctz_x = (x);                                            \
 113     unsigned __ctz_c = 0;                                               \
 114     gmp_clz (__ctz_c, __ctz_x & - __ctz_x);                             \
 115     (count) = GMP_LIMB_BITS - 1 - __ctz_c;                              \
 116   } while (0)
 117
 118 #define gmp_add_ssaaaa(sh, sl, ah, al, bh, bl) \
 119   do {                                                                  \
 120     mp_limb_t __x;                                                      \
 121     __x = (al) + (bl);                                                  \
 122     (sh) = (ah) + (bh) + (__x < (al));                                  \
 123     (sl) = __x;                                                         \
 124   } while (0)
 125
 126 #define gmp_sub_ddmmss(sh, sl, ah, al, bh, bl) \
 127   do {                                                                  \
 128     mp_limb_t __x;                                                      \
 129     __x = (al) - (bl);                                                  \
 130     (sh) = (ah) - (bh) - ((al) < (bl));                                 \
 131     (sl) = __x;                                                         \
 132   } while (0)
 133
 134 #define gmp_umul_ppmm(w1, w0, u, v)                                     \
 135   do {                                                                  \
 136     int LOCAL_GMP_LIMB_BITS = GMP_LIMB_BITS;                            \
 137     if (sizeof(unsigned int) * CHAR_BIT >= 2 * GMP_LIMB_BITS)           \
 138       {                                                                 \
 139         unsigned int __ww = (unsigned int) (u) * (v);                   \
 140         w0 = (mp_limb_t) __ww;                                          \
 141         w1 = (mp_limb_t) (__ww >> LOCAL_GMP_LIMB_BITS);                 \
 142       }                                                                 \
 143     else if (GMP_ULONG_BITS >= 2 * GMP_LIMB_BITS)                       \
 144       {                                                                 \
 145         unsigned long int __ww = (unsigned long int) (u) * (v);         \
 146         w0 = (mp_limb_t) __ww;                                          \
 147         w1 = (mp_limb_t) (__ww >> LOCAL_GMP_LIMB_BITS);                 \
 148       }                                                                 \
 149     else {                                                              \
 150       mp_limb_t __x0, __x1, __x2, __x3;                                 \
 151       unsigned __ul, __vl, __uh, __vh;                                  \
 152       mp_limb_t __u = (u), __v = (v);                                   \
 153                                                                         \
 154       __ul = __u & GMP_LLIMB_MASK;                                      \
 155       __uh = __u >> (GMP_LIMB_BITS / 2);                                \
 156       __vl = __v & GMP_LLIMB_MASK;                                      \
 157       __vh = __v >> (GMP_LIMB_BITS / 2);                                \
 158                                                                         \
 159       __x0 = (mp_limb_t) __ul * __vl;                                   \
 160       __x1 = (mp_limb_t) __ul * __vh;                                   \
 161       __x2 = (mp_limb_t) __uh * __vl;                                   \
 162       __x3 = (mp_limb_t) __uh * __vh;                                   \
 163                                                                         \
 164       __x1 += __x0 >> (GMP_LIMB_BITS / 2);/* this can't give carry */   \
 165       __x1 += __x2;             /* but this indeed can */               \
 166       if (__x1 < __x2)          /* did we get it? */                    \
 167         __x3 += GMP_HLIMB_BIT;  /* yes, add it in the proper pos. */    \
 168                                                                         \
 169       (w1) = __x3 + (__x1 >> (GMP_LIMB_BITS / 2));                      \
 170       (w0) = (__x1 << (GMP_LIMB_BITS / 2)) + (__x0 & GMP_LLIMB_MASK);   \
 171     }                                                                   \
 172   } while (0)
 173
 174 #define gmp_udiv_qrnnd_preinv(q, r, nh, nl, d, di)                      \
 175   do {                                                                  \
 176     mp_limb_t _qh, _ql, _r, _mask;                                      \
 177     gmp_umul_ppmm (_qh, _ql, (nh), (di));                               \
 178     gmp_add_ssaaaa (_qh, _ql, _qh, _ql, (nh) + 1, (nl));                \
 179     _r = (nl) - _qh * (d);                                              \
 180     _mask = -(mp_limb_t) (_r > _ql); /* both > and >= are OK */         \
 181     _qh += _mask;                                                       \
 182     _r += _mask & (d);                                                  \
 183     if (_r >= (d))                                                      \
 184       {                                                                 \
 185         _r -= (d);                                                      \
 186         _qh++;                                                          \
 187       }                                                                 \
 188                                                                         \
 189     (r) = _r;                                                           \
 190     (q) = _qh;                                                          \
 191   } while (0)
 192
 193 #define gmp_udiv_qr_3by2(q, r1, r0, n2, n1, n0, d1, d0, dinv)           \
 194   do {                                                                  \
 195     mp_limb_t _q0, _t1, _t0, _mask;                                     \
 196     gmp_umul_ppmm ((q), _q0, (n2), (dinv));                             \
 197     gmp_add_ssaaaa ((q), _q0, (q), _q0, (n2), (n1));                    \
 198                                                                         \
 199     /* Compute the two most significant limbs of n - q'd */             \
 200     (r1) = (n1) - (d1) * (q);                                           \
 201     gmp_sub_ddmmss ((r1), (r0), (r1), (n0), (d1), (d0));                \
 202     gmp_umul_ppmm (_t1, _t0, (d0), (q));                                \
 203     gmp_sub_ddmmss ((r1), (r0), (r1), (r0), _t1, _t0);                  \
 204     (q)++;                                                              \
 205                                                                         \
 206     /* Conditionally adjust q and the remainders */                     \
 207     _mask = - (mp_limb_t) ((r1) >= _q0);                                \
 208     (q) += _mask;                                                       \
 209     gmp_add_ssaaaa ((r1), (r0), (r1), (r0), _mask & (d1), _mask & (d0)); \
 210     if ((r1) >= (d1))                                                   \
 211       {                                                                 \
 212         if ((r1) > (d1) || (r0) >= (d0))                                \
 213           {                                                             \
 214             (q)++;                                                      \
 215             gmp_sub_ddmmss ((r1), (r0), (r1), (r0), (d1), (d0));        \
 216           }                                                             \
 217       }                                                                 \
 218   } while (0)
 219
 220 /* Swap macros. */
 221 #define MP_LIMB_T_SWAP(x, y)                                            \
 222   do {                                                                  \
 223     mp_limb_t __mp_limb_t_swap__tmp = (x);                              \
 224     (x) = (y);                                                          \
 225     (y) = __mp_limb_t_swap__tmp;                                        \
 226   } while (0)
 227 #define MP_SIZE_T_SWAP(x, y)                                            \
 228   do {                                                                  \
 229     mp_size_t __mp_size_t_swap__tmp = (x);                              \
 230     (x) = (y);                                                          \
 231     (y) = __mp_size_t_swap__tmp;                                        \
 232   } while (0)
 233 #define MP_BITCNT_T_SWAP(x,y)                   \
 234   do {                                          \
 235     mp_bitcnt_t __mp_bitcnt_t_swap__tmp = (x);  \
 236     (x) = (y);                                  \
 237     (y) = __mp_bitcnt_t_swap__tmp;              \
 238   } while (0)
 239 #define MP_PTR_SWAP(x, y)                                               \
 240   do {                                                                  \
 241     mp_ptr __mp_ptr_swap__tmp = (x);                                    \
 242     (x) = (y);                                                          \
 243     (y) = __mp_ptr_swap__tmp;                                           \
 244   } while (0)
 245 #define MP_SRCPTR_SWAP(x, y)                                            \
 246   do {                                                                  \
 247     mp_srcptr __mp_srcptr_swap__tmp = (x);                              \
 248     (x) = (y);                                                          \
 249     (y) = __mp_srcptr_swap__tmp;                                        \
 250   } while (0)
 251
 252 #define MPN_PTR_SWAP(xp,xs, yp,ys)                                      \
 253   do {                                                                  \
 254     MP_PTR_SWAP (xp, yp);                                               \
 255     MP_SIZE_T_SWAP (xs, ys);                                            \
 256   } while(0)
 257 #define MPN_SRCPTR_SWAP(xp,xs, yp,ys)                                   \
 258   do {                                                                  \
 259     MP_SRCPTR_SWAP (xp, yp);                                            \
 260     MP_SIZE_T_SWAP (xs, ys);                                            \
 261   } while(0)
 262
 263 #define MPZ_PTR_SWAP(x, y)                                              \
 264   do {                                                                  \
 265     mpz_ptr __mpz_ptr_swap__tmp = (x);                                  \
 266     (x) = (y);                                                          \
 267     (y) = __mpz_ptr_swap__tmp;                                          \
 268   } while (0)
 269 #define MPZ_SRCPTR_SWAP(x, y)                                           \
 270   do {                                                                  \
 271     mpz_srcptr __mpz_srcptr_swap__tmp = (x);                            \
 272     (x) = (y);                                                          \
 273     (y) = __mpz_srcptr_swap__tmp;                                       \
 274   } while (0)
 275
 276 const int mp_bits_per_limb = GMP_LIMB_BITS;
 277
 278
 279 /* Memory allocation and other helper functions. */
 280 static attr_noreturn
 281 gmp_die (const char *msg)
 282 {
 283   internal(file_line, "%s", msg);
 284 }
 285
 286 static void *
 287 gmp_default_alloc (size_t size)
 288 {
 289   void *p;
 290
 291   assert (size > 0);
 292
 293   p = malloc (size);
 294   if (!p)
 295     gmp_die("gmp_default_alloc: Virtual memory exhausted.");
 296
 297   return p;
 298 }
 299
 300 static void *
 301 gmp_default_realloc (void *old, size_t attr_unused unused_old_size, size_t new_size)
 302 {
 303   void * p;
 304
 305   p = realloc (old, new_size);
 306
 307   if (!p)
 308     gmp_die("gmp_default_realloc: Virtual memory exhausted.");
 309
 310   return p;
 311 }
 312
 313 static void
 314 gmp_default_free (void *p, size_t attr_unused unused_size)
 315 {
 316   free (p);
 317 }
 318
 319 static void * (*gmp_allocate_func) (size_t) = gmp_default_alloc;
 320 static void * (*gmp_reallocate_func) (void *, size_t, size_t) = gmp_default_realloc;
 321 static void (*gmp_free_func) (void *, size_t) = gmp_default_free;
 322
 323 void
 324 mp_set_memory_functions (void *(*alloc_func) (size_t),
 325                          void *(*realloc_func) (void *, size_t, size_t),
 326                          void (*free_func) (void *, size_t))
 327 {
 328   if (!alloc_func)
 329     alloc_func = gmp_default_alloc;
 330   if (!realloc_func)
 331     realloc_func = gmp_default_realloc;
 332   if (!free_func)
 333     free_func = gmp_default_free;
 334
 335   gmp_allocate_func = alloc_func;
 336   gmp_reallocate_func = realloc_func;
 337   gmp_free_func = free_func;
 338 }
 339
 340 #define gmp_xalloc(size) ((*gmp_allocate_func)((size)))
 341 #define gmp_free(p) ((*gmp_free_func) ((p), 0))
 342
 343 static mp_ptr
 344 gmp_xalloc_limbs (mp_size_t size)
 345 {
 346   return (mp_ptr) gmp_xalloc (size * sizeof (mp_limb_t));
 347 }
 348
 349 static mp_ptr
 350 gmp_xrealloc_limbs (mp_ptr old, mp_size_t size)
 351 {
 352   assert (size > 0);
 353   return (mp_ptr) (*gmp_reallocate_func) (old, 0, size * sizeof (mp_limb_t));
 354 }
 355
 356
 357 /* MPN interface */
 358
 359 static void
 360 mpn_copyi (mp_ptr d, mp_srcptr s, mp_size_t n)
 361 {
 362   mp_size_t i;
 363   for (i = 0; i < n; i++)
 364     d[i] = s[i];
 365 }
 366
 367 static void
 368 mpn_copyd (mp_ptr d, mp_srcptr s, mp_size_t n)
 369 {
 370   while (--n >= 0)
 371     d[n] = s[n];
 372 }
 373
 374 static int
 375 mpn_cmp (mp_srcptr ap, mp_srcptr bp, mp_size_t n)
 376 {
 377   while (--n >= 0)
 378     {
 379       if (ap[n] != bp[n])
 380         return ap[n] > bp[n] ? 1 : -1;
 381     }
 382   return 0;
 383 }
 384
 385 static int
 386 mpn_cmp4 (mp_srcptr ap, mp_size_t an, mp_srcptr bp, mp_size_t bn)
 387 {
 388   if (an != bn)
 389     return an < bn ? -1 : 1;
 390   else
 391     return mpn_cmp (ap, bp, an);
 392 }
 393
 394 static mp_size_t
 395 mpn_normalized_size (mp_srcptr xp, mp_size_t n)
 396 {
 397   while (n > 0 && xp[n-1] == 0)
 398     --n;
 399   return n;
 400 }
 401
 402 static int
 403 mpn_zero_p(mp_srcptr rp, mp_size_t n)
 404 {
 405   return mpn_normalized_size (rp, n) == 0;
 406 }
 407
 408 static void
 409 mpn_zero (mp_ptr rp, mp_size_t n)
 410 {
 411   while (--n >= 0)
 412     rp[n] = 0;
 413 }
 414
 415 static mp_limb_t
 416 mpn_add_1 (mp_ptr rp, mp_srcptr ap, mp_size_t n, mp_limb_t b)
 417 {
 418   mp_size_t i;
 419
 420   assert (n > 0);
 421   i = 0;
 422   do
 423     {
 424       mp_limb_t r = ap[i] + b;
 425       /* Carry out */
 426       b = (r < b);
 427       rp[i] = r;
 428     }
 429   while (++i < n);
 430
 431   return b;
 432 }
 433
 434 static mp_limb_t
 435 mpn_add_n (mp_ptr rp, mp_srcptr ap, mp_srcptr bp, mp_size_t n)
 436 {
 437   mp_size_t i;
 438   mp_limb_t cy;
 439
 440   for (i = 0, cy = 0; i < n; i++)
 441     {
 442       mp_limb_t a, b, r;
 443       a = ap[i]; b = bp[i];
 444       r = a + cy;
 445       cy = (r < cy);
 446       r += b;
 447       cy += (r < b);
 448       rp[i] = r;
 449     }
 450   return cy;
 451 }
 452
 453 static mp_limb_t
 454 mpn_add (mp_ptr rp, mp_srcptr ap, mp_size_t an, mp_srcptr bp, mp_size_t bn)
 455 {
 456   mp_limb_t cy;
 457
 458   assert (an >= bn);
 459
 460   cy = mpn_add_n (rp, ap, bp, bn);
 461   if (an > bn)
 462     cy = mpn_add_1 (rp + bn, ap + bn, an - bn, cy);
 463   return cy;
 464 }
 465
 466 static mp_limb_t
 467 mpn_sub_1 (mp_ptr rp, mp_srcptr ap, mp_size_t n, mp_limb_t b)
 468 {
 469   mp_size_t i;
 470
 471   assert (n > 0);
 472
 473   i = 0;
 474   do
 475     {
 476       mp_limb_t a = ap[i];
 477       /* Carry out */
 478       mp_limb_t cy = a < b;
 479       rp[i] = a - b;
 480       b = cy;
 481     }
 482   while (++i < n);
 483
 484   return b;
 485 }
 486
 487 static mp_limb_t
 488 mpn_sub_n (mp_ptr rp, mp_srcptr ap, mp_srcptr bp, mp_size_t n)
 489 {
 490   mp_size_t i;
 491   mp_limb_t cy;
 492
 493   for (i = 0, cy = 0; i < n; i++)
 494     {
 495       mp_limb_t a, b;
 496       a = ap[i]; b = bp[i];
 497       b += cy;
 498       cy = (b < cy);
 499       cy += (a < b);
 500       rp[i] = a - b;
 501     }
 502   return cy;
 503 }
 504
 505 static mp_limb_t
 506 mpn_sub (mp_ptr rp, mp_srcptr ap, mp_size_t an, mp_srcptr bp, mp_size_t bn)
 507 {
 508   mp_limb_t cy;
 509
 510   assert (an >= bn);
 511
 512   cy = mpn_sub_n (rp, ap, bp, bn);
 513   if (an > bn)
 514     cy = mpn_sub_1 (rp + bn, ap + bn, an - bn, cy);
 515   return cy;
 516 }
 517
 518 static mp_limb_t
 519 mpn_mul_1 (mp_ptr rp, mp_srcptr up, mp_size_t n, mp_limb_t vl)
 520 {
 521   mp_limb_t ul, cl, hpl, lpl;
 522
 523   assert (n >= 1);
 524
 525   cl = 0;
 526   do
 527     {
 528       ul = *up++;
 529       gmp_umul_ppmm (hpl, lpl, ul, vl);
 530
 531       lpl += cl;
 532       cl = (lpl < cl) + hpl;
 533
 534       *rp++ = lpl;
 535     }
 536   while (--n != 0);
 537
 538   return cl;
 539 }
 540
 541 static mp_limb_t
 542 mpn_addmul_1 (mp_ptr rp, mp_srcptr up, mp_size_t n, mp_limb_t vl)
 543 {
 544   mp_limb_t ul, cl, hpl, lpl, rl;
 545
 546   assert (n >= 1);
 547
 548   cl = 0;
 549   do
 550     {
 551       ul = *up++;
 552       gmp_umul_ppmm (hpl, lpl, ul, vl);
 553
 554       lpl += cl;
 555       cl = (lpl < cl) + hpl;
 556
 557       rl = *rp;
 558       lpl = rl + lpl;
 559       cl += lpl < rl;
 560       *rp++ = lpl;
 561     }
 562   while (--n != 0);
 563
 564   return cl;
 565 }
 566
 567 static mp_limb_t
 568 mpn_submul_1 (mp_ptr rp, mp_srcptr up, mp_size_t n, mp_limb_t vl)
 569 {
 570   mp_limb_t ul, cl, hpl, lpl, rl;
 571
 572   assert (n >= 1);
 573
 574   cl = 0;
 575   do
 576     {
 577       ul = *up++;
 578       gmp_umul_ppmm (hpl, lpl, ul, vl);
 579
 580       lpl += cl;
 581       cl = (lpl < cl) + hpl;
 582
 583       rl = *rp;
 584       lpl = rl - lpl;
 585       cl += lpl > rl;
 586       *rp++ = lpl;
 587     }
 588   while (--n != 0);
 589
 590   return cl;
 591 }
 592
 593 static mp_limb_t
 594 mpn_mul (mp_ptr rp, mp_srcptr up, mp_size_t un, mp_srcptr vp, mp_size_t vn)
 595 {
 596   assert (un >= vn);
 597   assert (vn >= 1);
 598   assert (!GMP_MPN_OVERLAP_P(rp, un + vn, up, un));
 599   assert (!GMP_MPN_OVERLAP_P(rp, un + vn, vp, vn));
 600
 601   /* We first multiply by the low order limb. This result can be
 602      stored, not added, to rp. We also avoid a loop for zeroing this
 603      way. */
 604
 605   rp[un] = mpn_mul_1 (rp, up, un, vp[0]);
 606
 607   /* Now accumulate the product of up[] and the next higher limb from
 608      vp[]. */
 609
 610   while (--vn >= 1)
 611     {
 612       rp += 1, vp += 1;
 613       rp[un] = mpn_addmul_1 (rp, up, un, vp[0]);
 614     }
 615   return rp[un];
 616 }
 617
 618
 619 static mp_limb_t
 620 mpn_lshift (mp_ptr rp, mp_srcptr up, mp_size_t n, unsigned int cnt)
 621 {
 622   mp_limb_t high_limb, low_limb;
 623   unsigned int tnc;
 624   mp_limb_t retval;
 625
 626   assert (n >= 1);
 627   assert (cnt >= 1);
 628   assert (cnt < GMP_LIMB_BITS);
 629
 630   up += n;
 631   rp += n;
 632
 633   tnc = GMP_LIMB_BITS - cnt;
 634   low_limb = *--up;
 635   retval = low_limb >> tnc;
 636   high_limb = (low_limb << cnt);
 637
 638   while (--n != 0)
 639     {
 640       low_limb = *--up;
 641       *--rp = high_limb | (low_limb >> tnc);
 642       high_limb = (low_limb << cnt);
 643     }
 644   *--rp = high_limb;
 645
 646   return retval;
 647 }
 648
 649 static mp_limb_t
 650 mpn_rshift (mp_ptr rp, mp_srcptr up, mp_size_t n, unsigned int cnt)
 651 {
 652   mp_limb_t high_limb, low_limb;
 653   unsigned int tnc;
 654   mp_limb_t retval;
 655
 656   assert (n >= 1);
 657   assert (cnt >= 1);
 658   assert (cnt < GMP_LIMB_BITS);
 659
 660   tnc = GMP_LIMB_BITS - cnt;
 661   high_limb = *up++;
 662   retval = (high_limb << tnc);
 663   low_limb = high_limb >> cnt;
 664
 665   while (--n != 0)
 666     {
 667       high_limb = *up++;
 668       *rp++ = low_limb | (high_limb << tnc);
 669       low_limb = high_limb >> cnt;
 670     }
 671   *rp = low_limb;
 672
 673   return retval;
 674 }
 675
 676 static mp_bitcnt_t
 677 mpn_common_scan (mp_limb_t limb, mp_size_t i, mp_srcptr up, mp_size_t un,
 678                  mp_limb_t ux)
 679 {
 680   unsigned cnt;
 681
 682   assert (ux == 0 || ux == GMP_LIMB_MAX);
 683   assert (0 <= i && i <= un );
 684
 685   while (limb == 0)
 686     {
 687       i++;
 688       if (i == un)
 689         return (ux == 0 ? ~(mp_bitcnt_t) 0 : un * (mp_bitcnt_t)GMP_LIMB_BITS);
 690       limb = ux ^ up[i];
 691     }
 692   gmp_ctz (cnt, limb);
 693   return (mp_bitcnt_t) i * GMP_LIMB_BITS + cnt;
 694 }
 695
 696 mp_bitcnt_t
 697 mpn_scan1 (mp_srcptr ptr, mp_bitcnt_t bit)
 698 {
 699   mp_size_t i;
 700   i = bit / GMP_LIMB_BITS;
 701
 702   return mpn_common_scan ( ptr[i] & (GMP_LIMB_MAX << (bit % GMP_LIMB_BITS)),
 703                           i, ptr, i, 0);
 704 }
 705
 706
 707 /* MPN division interface. */
 708
 709 /* The 3/2 inverse is defined as
 710
 711      m = floor( (B^3-1) / (B u1 + u0)) - B
 712 */
 713 static mp_limb_t
 714 mpn_invert_3by2 (mp_limb_t u1, mp_limb_t u0)
 715 {
 716   mp_limb_t r, m;
 717
 718   {
 719     mp_limb_t p, ql;
 720     unsigned ul, uh, qh;
 721
 722     /* For notation, let b denote the half-limb base, so that B = b^2.
 723        Split u1 = b uh + ul. */
 724     ul = u1 & GMP_LLIMB_MASK;
 725     uh = u1 >> (GMP_LIMB_BITS / 2);
 726
 727     /* Approximation of the high half of quotient. Differs from the 2/1
 728        inverse of the half limb uh, since we have already subtracted
 729        u0. */
 730     qh = (u1 ^ GMP_LIMB_MAX) / uh;
 731
 732     /* Adjust to get a half-limb 3/2 inverse, i.e., we want
 733
 734        qh' = floor( (b^3 - 1) / u) - b = floor ((b^3 - b u - 1) / u
 735            = floor( (b (~u) + b-1) / u),
 736
 737        and the remainder
 738
 739        r = b (~u) + b-1 - qh (b uh + ul)
 740        = b (~u - qh uh) + b-1 - qh ul
 741
 742        Subtraction of qh ul may underflow, which implies adjustments.
 743        But by normalization, 2 u >= B > qh ul, so we need to adjust by
 744        at most 2.
 745     */
 746
 747     r = ((~u1 - (mp_limb_t) qh * uh) << (GMP_LIMB_BITS / 2)) | GMP_LLIMB_MASK;
 748
 749     p = (mp_limb_t) qh * ul;
 750     /* Adjustment steps taken from udiv_qrnnd_c */
 751     if (r < p)
 752       {
 753         qh--;
 754         r += u1;
 755         if (r >= u1) /* i.e. we didn't get carry when adding to r */
 756           if (r < p)
 757             {
 758               qh--;
 759               r += u1;
 760             }
 761       }
 762     r -= p;
 763
 764     /* Low half of the quotient is
 765
 766        ql = floor ( (b r + b-1) / u1).
 767
 768        This is a 3/2 division (on half-limbs), for which qh is a
 769        suitable inverse. */
 770
 771     p = (r >> (GMP_LIMB_BITS / 2)) * qh + r;
 772     /* Unlike full-limb 3/2, we can add 1 without overflow. For this to
 773        work, it is essential that ql is a full mp_limb_t. */
 774     ql = (p >> (GMP_LIMB_BITS / 2)) + 1;
 775
 776     /* By the 3/2 trick, we don't need the high half limb. */
 777     r = (r << (GMP_LIMB_BITS / 2)) + GMP_LLIMB_MASK - ql * u1;
 778
 779     if (r >= (GMP_LIMB_MAX & (p << (GMP_LIMB_BITS / 2))))
 780       {
 781         ql--;
 782         r += u1;
 783       }
 784     m = ((mp_limb_t) qh << (GMP_LIMB_BITS / 2)) + ql;
 785     if (r >= u1)
 786       {
 787         m++;
 788         r -= u1;
 789       }
 790   }
 791
 792   /* Now m is the 2/1 inverse of u1. If u0 > 0, adjust it to become a
 793      3/2 inverse. */
 794   if (u0 > 0)
 795     {
 796       mp_limb_t th, tl;
 797       r = ~r;
 798       r += u0;
 799       if (r < u0)
 800         {
 801           m--;
 802           if (r >= u1)
 803             {
 804               m--;
 805               r -= u1;
 806             }
 807           r -= u1;
 808         }
 809       gmp_umul_ppmm (th, tl, u0, m);
 810       r += th;
 811       if (r < th)
 812         {
 813           m--;
 814           m -= ((r > u1) | ((r == u1) & (tl > u0)));
 815         }
 816     }
 817
 818   return m;
 819 }
 820
 821 struct gmp_div_inverse
 822 {
 823   /* Normalization shift count. */
 824   unsigned shift;
 825   /* Normalized divisor (d0 unused for mpn_div_qr_1) */
 826   mp_limb_t d1, d0;
 827   /* Inverse, for 2/1 or 3/2. */
 828   mp_limb_t di;
 829 };
 830
 831 static void
 832 mpn_div_qr_1_invert (struct gmp_div_inverse *inv, mp_limb_t d)
 833 {
 834   unsigned shift;
 835
 836   assert (d > 0);
 837   gmp_clz (shift, d);
 838   inv->shift = shift;
 839   inv->d1 = d << shift;
 840   inv->di = mpn_invert_limb (inv->d1);
 841 }
 842
 843 static void
 844 mpn_div_qr_2_invert (struct gmp_div_inverse *inv,
 845                      mp_limb_t d1, mp_limb_t d0)
 846 {
 847   unsigned shift;
 848
 849   assert (d1 > 0);
 850   gmp_clz (shift, d1);
 851   inv->shift = shift;
 852   if (shift > 0)
 853     {
 854       d1 = (d1 << shift) | (d0 >> (GMP_LIMB_BITS - shift));
 855       d0 <<= shift;
 856     }
 857   inv->d1 = d1;
 858   inv->d0 = d0;
 859   inv->di = mpn_invert_3by2 (d1, d0);
 860 }
 861
 862 static void
 863 mpn_div_qr_invert (struct gmp_div_inverse *inv,
 864                    mp_srcptr dp, mp_size_t dn)
 865 {
 866   assert (dn > 0);
 867
 868   if (dn == 1)
 869     mpn_div_qr_1_invert (inv, dp[0]);
 870   else if (dn == 2)
 871     mpn_div_qr_2_invert (inv, dp[1], dp[0]);
 872   else
 873     {
 874       unsigned shift;
 875       mp_limb_t d1, d0;
 876
 877       d1 = dp[dn-1];
 878       d0 = dp[dn-2];
 879       assert (d1 > 0);
 880       gmp_clz (shift, d1);
 881       inv->shift = shift;
 882       if (shift > 0)
 883         {
 884           d1 = (d1 << shift) | (d0 >> (GMP_LIMB_BITS - shift));
 885           d0 = (d0 << shift) | (dp[dn-3] >> (GMP_LIMB_BITS - shift));
 886         }
 887       inv->d1 = d1;
 888       inv->d0 = d0;
 889       inv->di = mpn_invert_3by2 (d1, d0);
 890     }
 891 }
 892
 893 /* Not matching current public gmp interface, rather corresponding to
 894    the sbpi1_div_* functions. */
 895 static mp_limb_t
 896 mpn_div_qr_1_preinv (mp_ptr qp, mp_srcptr np, mp_size_t nn,
 897                      const struct gmp_div_inverse *inv)
 898 {
 899   mp_limb_t d, di;
 900   mp_limb_t r;
 901   mp_ptr tp = NULL;
 902
 903   if (inv->shift > 0)
 904     {
 905       /* Shift, reusing qp area if possible. In-place shift if qp == np. */
 906       tp = qp ? qp : gmp_xalloc_limbs (nn);
 907       r = mpn_lshift (tp, np, nn, inv->shift);
 908       np = tp;
 909     }
 910   else
 911     r = 0;
 912
 913   d = inv->d1;
 914   di = inv->di;
 915   while (--nn >= 0)
 916     {
 917       mp_limb_t q;
 918
 919       gmp_udiv_qrnnd_preinv (q, r, r, np[nn], d, di);
 920       if (qp)
 921         qp[nn] = q;
 922     }
 923   if ((inv->shift > 0) && (tp != qp))
 924     gmp_free (tp);
 925
 926   return r >> inv->shift;
 927 }
 928
 929 static void
 930 mpn_div_qr_2_preinv (mp_ptr qp, mp_ptr np, mp_size_t nn,
 931                      const struct gmp_div_inverse *inv)
 932 {
 933   unsigned shift;
 934   mp_size_t i;
 935   mp_limb_t d1, d0, di, r1, r0;
 936
 937   assert (nn >= 2);
 938   shift = inv->shift;
 939   d1 = inv->d1;
 940   d0 = inv->d0;
 941   di = inv->di;
 942
 943   if (shift > 0)
 944     r1 = mpn_lshift (np, np, nn, shift);
 945   else
 946     r1 = 0;
 947
 948   r0 = np[nn - 1];
 949
 950   i = nn - 2;
 951   do
 952     {
 953       mp_limb_t n0, q;
 954       n0 = np[i];
 955       gmp_udiv_qr_3by2 (q, r1, r0, r1, r0, n0, d1, d0, di);
 956
 957       if (qp)
 958         qp[i] = q;
 959     }
 960   while (--i >= 0);
 961
 962   if (shift > 0)
 963     {
 964       assert ((r0 & (GMP_LIMB_MAX >> (GMP_LIMB_BITS - shift))) == 0);
 965       r0 = (r0 >> shift) | (r1 << (GMP_LIMB_BITS - shift));
 966       r1 >>= shift;
 967     }
 968
 969   np[1] = r1;
 970   np[0] = r0;
 971 }
 972
 973 static void
 974 mpn_div_qr_pi1 (mp_ptr qp,
 975                 mp_ptr np, mp_size_t nn, mp_limb_t n1,
 976                 mp_srcptr dp, mp_size_t dn,
 977                 mp_limb_t dinv)
 978 {
 979   mp_size_t i;
 980
 981   mp_limb_t d1, d0;
 982   mp_limb_t cy, cy1;
 983   mp_limb_t q;
 984
 985   assert (dn > 2);
 986   assert (nn >= dn);
 987
 988   d1 = dp[dn - 1];
 989   d0 = dp[dn - 2];
 990
 991   assert ((d1 & GMP_LIMB_HIGHBIT) != 0);
 992   /* Iteration variable is the index of the q limb.
 993    *
 994    * We divide <n1, np[dn-1+i], np[dn-2+i], np[dn-3+i],..., np[i]>
 995    * by            <d1,          d0,        dp[dn-3],  ..., dp[0] >
 996    */
 997
 998   i = nn - dn;
 999   do
1000     {
1001       mp_limb_t n0 = np[dn-1+i];
1002
1003       if (n1 == d1 && n0 == d0)
1004         {
1005           q = GMP_LIMB_MAX;
1006           mpn_submul_1 (np+i, dp, dn, q);
1007           n1 = np[dn-1+i];      /* update n1, last loop's value will now be invalid */
1008         }
1009       else
1010         {
1011           gmp_udiv_qr_3by2 (q, n1, n0, n1, n0, np[dn-2+i], d1, d0, dinv);
1012
1013           cy = mpn_submul_1 (np + i, dp, dn-2, q);
1014
1015           cy1 = n0 < cy;
1016           n0 = n0 - cy;
1017           cy = n1 < cy1;
1018           n1 = n1 - cy1;
1019           np[dn-2+i] = n0;
1020
1021           if (cy != 0)
1022             {
1023               n1 += d1 + mpn_add_n (np + i, np + i, dp, dn - 1);
1024               q--;
1025             }
1026         }
1027
1028       if (qp)
1029         qp[i] = q;
1030     }
1031   while (--i >= 0);
1032
1033   np[dn - 1] = n1;
1034 }
1035
1036 static void
1037 mpn_div_qr_preinv (mp_ptr qp, mp_ptr np, mp_size_t nn,
1038                    mp_srcptr dp, mp_size_t dn,
1039                    const struct gmp_div_inverse *inv)
1040 {
1041   assert (dn > 0);
1042   assert (nn >= dn);
1043
1044   if (dn == 1)
1045     np[0] = mpn_div_qr_1_preinv (qp, np, nn, inv);
1046   else if (dn == 2)
1047     mpn_div_qr_2_preinv (qp, np, nn, inv);
1048   else
1049     {
1050       mp_limb_t nh;
1051       unsigned shift;
1052
1053       assert (inv->d1 == dp[dn-1]);
1054       assert (inv->d0 == dp[dn-2]);
1055       assert ((inv->d1 & GMP_LIMB_HIGHBIT) != 0);
1056
1057       shift = inv->shift;
1058       if (shift > 0)
1059         nh = mpn_lshift (np, np, nn, shift);
1060       else
1061         nh = 0;
1062
1063       mpn_div_qr_pi1 (qp, np, nn, nh, dp, dn, inv->di);
1064
1065       if (shift > 0)
1066         gmp_assert_nocarry (mpn_rshift (np, np, dn, shift));
1067     }
1068 }
1069
1070 static void
1071 mpn_div_qr (mp_ptr qp, mp_ptr np, mp_size_t nn, mp_srcptr dp, mp_size_t dn)
1072 {
1073   struct gmp_div_inverse inv;
1074   mp_ptr tp = NULL;
1075
1076   assert (dn > 0);
1077   assert (nn >= dn);
1078
1079   mpn_div_qr_invert (&inv, dp, dn);
1080   if (dn > 2 && inv.shift > 0)
1081     {
1082       tp = gmp_xalloc_limbs (dn);
1083       gmp_assert_nocarry (mpn_lshift (tp, dp, dn, inv.shift));
1084       dp = tp;
1085     }
1086   mpn_div_qr_preinv (qp, np, nn, dp, dn, &inv);
1087   if (tp)
1088     gmp_free (tp);
1089 }
1090
1091
1092 static mp_bitcnt_t
1093 mpn_limb_size_in_base_2 (mp_limb_t u)
1094 {
1095   unsigned shift;
1096
1097   assert (u > 0);
1098   gmp_clz (shift, u);
1099   return GMP_LIMB_BITS - shift;
1100 }
1101
1102
1103 /* MPZ interface */
1104 void
1105 mpz_init (mpz_t r)
1106 {
1107   static const mp_limb_t dummy_limb = GMP_LIMB_MAX & 0xc1a0;
1108
1109   r->_mp_alloc = 0;
1110   r->_mp_size = 0;
1111   r->_mp_d = (mp_ptr) &dummy_limb;
1112 }
1113
1114 /* The utility of this function is a bit limited, since many functions
1115    assigns the result variable using mpz_swap. */
1116 void
1117 mpz_init2 (mpz_t r, mp_bitcnt_t bits)
1118 {
1119   mp_size_t rn;
1120
1121   bits -= (bits != 0);          /* Round down, except if 0 */
1122   rn = 1 + bits / GMP_LIMB_BITS;
1123
1124   r->_mp_alloc = rn;
1125   r->_mp_size = 0;
1126   r->_mp_d = gmp_xalloc_limbs (rn);
1127 }
1128
1129 void
1130 mpz_clear (mpz_t r)
1131 {
1132   if (r->_mp_alloc)
1133     gmp_free (r->_mp_d);
1134 }
1135
1136 static mp_ptr
1137 mpz_realloc (mpz_t r, mp_size_t size)
1138 {
1139   size = GMP_MAX (size, 1);
1140
1141   if (r->_mp_alloc)
1142     r->_mp_d = gmp_xrealloc_limbs (r->_mp_d, size);
1143   else
1144     r->_mp_d = gmp_xalloc_limbs (size);
1145   r->_mp_alloc = size;
1146
1147   if (GMP_ABS (r->_mp_size) > size)
1148     r->_mp_size = 0;
1149
1150   return r->_mp_d;
1151 }
1152
1153 /* Realloc for an mpz_t WHAT if it has less than NEEDED limbs.  */
1154 #define MPZ_REALLOC(z,n) ((n) > (z)->_mp_alloc                  \
1155                           ? mpz_realloc(z,n)                    \
1156                           : (z)->_mp_d)
1157
1158 /* MPZ assignment and basic conversions. */
1159 void
1160 mpz_set_si (mpz_t r, signed long int x)
1161 {
1162   if (x >= 0)
1163     mpz_set_ui (r, x);
1164   else /* (x < 0) */
1165     if (GMP_LIMB_BITS < GMP_ULONG_BITS)
1166       {
1167         mpz_set_ui (r, GMP_NEG_CAST (unsigned long int, x));
1168         mpz_neg (r, r);
1169       }
1170   else
1171     {
1172       r->_mp_size = -1;
1173       MPZ_REALLOC (r, 1)[0] = GMP_NEG_CAST (unsigned long int, x);
1174     }
1175 }
1176
1177 void
1178 mpz_set_ui (mpz_t r, unsigned long int x)
1179 {
1180   if (x > 0)
1181     {
1182       r->_mp_size = 1;
1183       MPZ_REALLOC (r, 1)[0] = x;
1184       if (GMP_LIMB_BITS < GMP_ULONG_BITS)
1185         {
1186           int LOCAL_GMP_LIMB_BITS = GMP_LIMB_BITS;
1187           while (x >>= LOCAL_GMP_LIMB_BITS)
1188             {
1189               ++ r->_mp_size;
1190               MPZ_REALLOC (r, r->_mp_size)[r->_mp_size - 1] = x;
1191             }
1192         }
1193     }
1194   else
1195     r->_mp_size = 0;
1196 }
1197
1198 void
1199 mpz_set (mpz_t r, const mpz_t x)
1200 {
1201   /* Allow the NOP r == x */
1202   if (r != x)
1203     {
1204       mp_size_t n;
1205       mp_ptr rp;
1206
1207       n = GMP_ABS (x->_mp_size);
1208       rp = MPZ_REALLOC (r, n);
1209
1210       mpn_copyi (rp, x->_mp_d, n);
1211       r->_mp_size = x->_mp_size;
1212     }
1213 }
1214
1215 void
1216 mpz_init_set_si (mpz_t r, signed long int x)
1217 {
1218   mpz_init (r);
1219   mpz_set_si (r, x);
1220 }
1221
1222 static void
1223 mpz_init_set_ui (mpz_t r, unsigned long int x)
1224 {
1225   mpz_init (r);
1226   mpz_set_ui (r, x);
1227 }
1228
1229 void
1230 mpz_init_set (mpz_t r, const mpz_t x)
1231 {
1232   mpz_init (r);
1233   mpz_set (r, x);
1234 }
1235
1236 static int
1237 mpz_cmp_ui (const mpz_t u, unsigned long v);
1238 int
1239 mpz_cmpabs_ui (const mpz_t u, unsigned long v);
1240
1241 int
1242 mpz_fits_slong_p (const mpz_t u)
1243 {
1244   return (LONG_MAX + LONG_MIN == 0 || mpz_cmp_ui (u, LONG_MAX) <= 0) &&
1245     mpz_cmpabs_ui (u, GMP_NEG_CAST (unsigned long int, LONG_MIN)) <= 0;
1246 }
1247
1248 static int
1249 mpn_absfits_ulong_p (mp_srcptr up, mp_size_t un)
1250 {
1251   int ulongsize = GMP_ULONG_BITS / GMP_LIMB_BITS;
1252   mp_limb_t ulongrem = 0;
1253
1254   if (GMP_ULONG_BITS % GMP_LIMB_BITS != 0)
1255     ulongrem = (mp_limb_t) (ULONG_MAX >> GMP_LIMB_BITS * ulongsize) + 1;
1256
1257   return un <= ulongsize || (up[ulongsize] < ulongrem && un == ulongsize + 1);
1258 }
1259
1260 int
1261 mpz_fits_ulong_p (const mpz_t u)
1262 {
1263   mp_size_t us = u->_mp_size;
1264
1265   return us >= 0 && mpn_absfits_ulong_p (u->_mp_d, us);
1266 }
1267
1268 long int
1269 mpz_get_si (const mpz_t u)
1270 {
1271   unsigned long r = mpz_get_ui (u);
1272   unsigned long c = -LONG_MAX - LONG_MIN;
1273
1274   if (u->_mp_size < 0)
1275     /* This expression is necessary to properly handle -LONG_MIN */
1276     return -(long) c - (long) ((r - c) & LONG_MAX);
1277   else
1278     return (long) (r & LONG_MAX);
1279 }
1280
1281 unsigned long int
1282 mpz_get_ui (const mpz_t u)
1283 {
1284   if (GMP_LIMB_BITS < GMP_ULONG_BITS)
1285     {
1286       int LOCAL_GMP_LIMB_BITS = GMP_LIMB_BITS;
1287       unsigned long r = 0;
1288       mp_size_t n = GMP_ABS (u->_mp_size);
1289       n = GMP_MIN (n, 1 + (mp_size_t) (GMP_ULONG_BITS - 1) / GMP_LIMB_BITS);
1290       while (--n >= 0)
1291         r = (r << LOCAL_GMP_LIMB_BITS) + u->_mp_d[n];
1292       return r;
1293     }
1294
1295   return u->_mp_size == 0 ? 0 : u->_mp_d[0];
1296 }
1297
1298 size_t
1299 mpz_size (const mpz_t u)
1300 {
1301   return GMP_ABS (u->_mp_size);
1302 }
1303
1304
1305 /* MPZ comparisons and the like. */
1306 int
1307 mpz_sgn (const mpz_t u)
1308 {
1309   return GMP_CMP (u->_mp_size, 0);
1310 }
1311
1312 static int
1313 mpz_cmp_ui (const mpz_t u, unsigned long v)
1314 {
1315   mp_size_t usize = u->_mp_size;
1316
1317   if (usize < 0)
1318     return -1;
1319   else
1320     return mpz_cmpabs_ui (u, v);
1321 }
1322
1323 int
1324 mpz_cmp (const mpz_t a, const mpz_t b)
1325 {
1326   mp_size_t asize = a->_mp_size;
1327   mp_size_t bsize = b->_mp_size;
1328
1329   if (asize != bsize)
1330     return (asize < bsize) ? -1 : 1;
1331   else if (asize >= 0)
1332     return mpn_cmp (a->_mp_d, b->_mp_d, asize);
1333   else
1334     return mpn_cmp (b->_mp_d, a->_mp_d, -asize);
1335 }
1336
1337 int
1338 mpz_cmpabs_ui (const mpz_t u, unsigned long v)
1339 {
1340   mp_size_t un = GMP_ABS (u->_mp_size);
1341
1342   if (! mpn_absfits_ulong_p (u->_mp_d, un))
1343     return 1;
1344   else
1345     {
1346       unsigned long uu = mpz_get_ui (u);
1347       return GMP_CMP(uu, v);
1348     }
1349 }
1350
1351 void
1352 mpz_neg (mpz_t r, const mpz_t u)
1353 {
1354   mpz_set (r, u);
1355   r->_mp_size = -r->_mp_size;
1356 }
1357
1358 static void
1359 mpz_swap (mpz_t u, mpz_t v)
1360 {
1361   MP_SIZE_T_SWAP (u->_mp_size, v->_mp_size);
1362   MP_SIZE_T_SWAP (u->_mp_alloc, v->_mp_alloc);
1363   MP_PTR_SWAP (u->_mp_d, v->_mp_d);
1364 }
1365
1366
1367 /* MPZ addition and subtraction */
1368
1369
1370 void
1371 mpz_add_ui (mpz_t r, const mpz_t a, unsigned long b)
1372 {
1373   mpz_t bb;
1374   mpz_init_set_ui (bb, b);
1375   mpz_add (r, a, bb);
1376   mpz_clear (bb);
1377 }
1378
1379 static void
1380 mpz_ui_sub (mpz_t r, unsigned long a, const mpz_t b);
1381
1382 void
1383 mpz_sub_ui (mpz_t r, const mpz_t a, unsigned long b)
1384 {
1385   mpz_ui_sub (r, b, a);
1386   mpz_neg (r, r);
1387 }
1388
1389 static void
1390 mpz_ui_sub (mpz_t r, unsigned long a, const mpz_t b)
1391 {
1392   mpz_neg (r, b);
1393   mpz_add_ui (r, r, a);
1394 }
1395
1396 static mp_size_t
1397 mpz_abs_add (mpz_t r, const mpz_t a, const mpz_t b)
1398 {
1399   mp_size_t an = GMP_ABS (a->_mp_size);
1400   mp_size_t bn = GMP_ABS (b->_mp_size);
1401   mp_ptr rp;
1402   mp_limb_t cy;
1403
1404   if (an < bn)
1405     {
1406       MPZ_SRCPTR_SWAP (a, b);
1407       MP_SIZE_T_SWAP (an, bn);
1408     }
1409
1410   rp = MPZ_REALLOC (r, an + 1);
1411   cy = mpn_add (rp, a->_mp_d, an, b->_mp_d, bn);
1412
1413   rp[an] = cy;
1414
1415   return an + cy;
1416 }
1417
1418 static mp_size_t
1419 mpz_abs_sub (mpz_t r, const mpz_t a, const mpz_t b)
1420 {
1421   mp_size_t an = GMP_ABS (a->_mp_size);
1422   mp_size_t bn = GMP_ABS (b->_mp_size);
1423   int cmp;
1424   mp_ptr rp;
1425
1426   cmp = mpn_cmp4 (a->_mp_d, an, b->_mp_d, bn);
1427   if (cmp > 0)
1428     {
1429       rp = MPZ_REALLOC (r, an);
1430       gmp_assert_nocarry (mpn_sub (rp, a->_mp_d, an, b->_mp_d, bn));
1431       return mpn_normalized_size (rp, an);
1432     }
1433   else if (cmp < 0)
1434     {
1435       rp = MPZ_REALLOC (r, bn);
1436       gmp_assert_nocarry (mpn_sub (rp, b->_mp_d, bn, a->_mp_d, an));
1437       return -mpn_normalized_size (rp, bn);
1438     }
1439   else
1440     return 0;
1441 }
1442
1443 void
1444 mpz_add (mpz_t r, const mpz_t a, const mpz_t b)
1445 {
1446   mp_size_t rn;
1447
1448   if ( (a->_mp_size ^ b->_mp_size) >= 0)
1449     rn = mpz_abs_add (r, a, b);
1450   else
1451     rn = mpz_abs_sub (r, a, b);
1452
1453   r->_mp_size = a->_mp_size >= 0 ? rn : - rn;
1454 }
1455
1456 void
1457 mpz_sub (mpz_t r, const mpz_t a, const mpz_t b)
1458 {
1459   mp_size_t rn;
1460
1461   if ( (a->_mp_size ^ b->_mp_size) >= 0)
1462     rn = mpz_abs_sub (r, a, b);
1463   else
1464     rn = mpz_abs_add (r, a, b);
1465
1466   r->_mp_size = a->_mp_size >= 0 ? rn : - rn;
1467 }
1468
1469
1470 void
1471 mpz_mul (mpz_t r, const mpz_t u, const mpz_t v)
1472 {
1473   int sign;
1474   mp_size_t un, vn, rn;
1475   mpz_t t;
1476   mp_ptr tp;
1477
1478   un = u->_mp_size;
1479   vn = v->_mp_size;
1480
1481   if (un == 0 || vn == 0)
1482     {
1483       r->_mp_size = 0;
1484       return;
1485     }
1486
1487   sign = (un ^ vn) < 0;
1488
1489   un = GMP_ABS (un);
1490   vn = GMP_ABS (vn);
1491
1492   mpz_init2 (t, (un + vn) * GMP_LIMB_BITS);
1493
1494   tp = t->_mp_d;
1495   if (un >= vn)
1496     mpn_mul (tp, u->_mp_d, un, v->_mp_d, vn);
1497   else
1498     mpn_mul (tp, v->_mp_d, vn, u->_mp_d, un);
1499
1500   rn = un + vn;
1501   rn -= tp[rn-1] == 0;
1502
1503   t->_mp_size = sign ? - rn : rn;
1504   mpz_swap (r, t);
1505   mpz_clear (t);
1506 }
1507
1508 void
1509 mpz_mul_2exp (mpz_t r, const mpz_t u, mp_bitcnt_t bits)
1510 {
1511   mp_size_t un, rn;
1512   mp_size_t limbs;
1513   unsigned shift;
1514   mp_ptr rp;
1515
1516   un = GMP_ABS (u->_mp_size);
1517   if (un == 0)
1518     {
1519       r->_mp_size = 0;
1520       return;
1521     }
1522
1523   limbs = bits / GMP_LIMB_BITS;
1524   shift = bits % GMP_LIMB_BITS;
1525
1526   rn = un + limbs + (shift > 0);
1527   rp = MPZ_REALLOC (r, rn);
1528   if (shift > 0)
1529     {
1530       mp_limb_t cy = mpn_lshift (rp + limbs, u->_mp_d, un, shift);
1531       rp[rn-1] = cy;
1532       rn -= (cy == 0);
1533     }
1534   else
1535     mpn_copyd (rp + limbs, u->_mp_d, un);
1536
1537   mpn_zero (rp, limbs);
1538
1539   r->_mp_size = (u->_mp_size < 0) ? - rn : rn;
1540 }
1541
1542
1543 /* MPZ division */
1544 enum mpz_div_round_mode { GMP_DIV_FLOOR, GMP_DIV_CEIL, GMP_DIV_TRUNC };
1545
1546 /* Allows q or r to be zero. Returns 1 iff remainder is non-zero. */
1547 static int
1548 mpz_div_qr (mpz_t q, mpz_t r,
1549             const mpz_t n, const mpz_t d, enum mpz_div_round_mode mode)
1550 {
1551   mp_size_t ns, ds, nn, dn, qs;
1552   ns = n->_mp_size;
1553   ds = d->_mp_size;
1554
1555   if (ds == 0)
1556     gmp_die("mpz_div_qr: Divide by zero.");
1557
1558   if (ns == 0)
1559     {
1560       if (q)
1561         q->_mp_size = 0;
1562       if (r)
1563         r->_mp_size = 0;
1564       return 0;
1565     }
1566
1567   nn = GMP_ABS (ns);
1568   dn = GMP_ABS (ds);
1569
1570   qs = ds ^ ns;
1571
1572   if (nn < dn)
1573     {
1574       if (mode == GMP_DIV_CEIL && qs >= 0)
1575         {
1576           /* q = 1, r = n - d */
1577           if (r)
1578             mpz_sub (r, n, d);
1579           if (q)
1580             mpz_set_ui (q, 1);
1581         }
1582       else if (mode == GMP_DIV_FLOOR && qs < 0)
1583         {
1584           /* q = -1, r = n + d */
1585           if (r)
1586             mpz_add (r, n, d);
1587           if (q)
1588             mpz_set_si (q, -1);
1589         }
1590       else
1591         {
1592           /* q = 0, r = d */
1593           if (r)
1594             mpz_set (r, n);
1595           if (q)
1596             q->_mp_size = 0;
1597         }
1598       return 1;
1599     }
1600   else
1601     {
1602       mp_ptr np, qp;
1603       mp_size_t qn, rn;
1604       mpz_t tq, tr;
1605
1606       mpz_init_set (tr, n);
1607       np = tr->_mp_d;
1608
1609       qn = nn - dn + 1;
1610
1611       if (q)
1612         {
1613           mpz_init2 (tq, qn * GMP_LIMB_BITS);
1614           qp = tq->_mp_d;
1615         }
1616       else
1617         qp = NULL;
1618
1619       mpn_div_qr (qp, np, nn, d->_mp_d, dn);
1620
1621       if (qp)
1622         {
1623           qn -= (qp[qn-1] == 0);
1624
1625           tq->_mp_size = qs < 0 ? -qn : qn;
1626         }
1627       rn = mpn_normalized_size (np, dn);
1628       tr->_mp_size = ns < 0 ? - rn : rn;
1629
1630       if (mode == GMP_DIV_FLOOR && qs < 0 && rn != 0)
1631         {
1632           if (q)
1633             mpz_sub_ui (tq, tq, 1);
1634           if (r)
1635             mpz_add (tr, tr, d);
1636         }
1637       else if (mode == GMP_DIV_CEIL && qs >= 0 && rn != 0)
1638         {
1639           if (q)
1640             mpz_add_ui (tq, tq, 1);
1641           if (r)
1642             mpz_sub (tr, tr, d);
1643         }
1644
1645       if (q)
1646         {
1647           mpz_swap (tq, q);
1648           mpz_clear (tq);
1649         }
1650       if (r)
1651         mpz_swap (tr, r);
1652
1653       mpz_clear (tr);
1654
1655       return rn != 0;
1656     }
1657 }
1658
1659 void
1660 mpz_tdiv_q (mpz_t q, const mpz_t n, const mpz_t d)
1661 {
1662   mpz_div_qr (q, NULL, n, d, GMP_DIV_TRUNC);
1663 }
1664
1665 void
1666 mpz_tdiv_r (mpz_t r, const mpz_t n, const mpz_t d)
1667 {
1668   mpz_div_qr (NULL, r, n, d, GMP_DIV_TRUNC);
1669 }
1670
1671 static void
1672 mpz_div_q_2exp (mpz_t q, const mpz_t u, mp_bitcnt_t bit_index,
1673                 enum mpz_div_round_mode mode)
1674 {
1675   mp_size_t un, qn;
1676   mp_size_t limb_cnt;
1677   mp_ptr qp;
1678   int adjust;
1679
1680   un = u->_mp_size;
1681   if (un == 0)
1682     {
1683       q->_mp_size = 0;
1684       return;
1685     }
1686   limb_cnt = bit_index / GMP_LIMB_BITS;
1687   qn = GMP_ABS (un) - limb_cnt;
1688   bit_index %= GMP_LIMB_BITS;
1689
1690   if (mode == ((un > 0) ? GMP_DIV_CEIL : GMP_DIV_FLOOR)) /* un != 0 here. */
1691     /* Note: Below, the final indexing at limb_cnt is valid because at
1692        that point we have qn > 0. */
1693     adjust = (qn <= 0
1694               || !mpn_zero_p (u->_mp_d, limb_cnt)
1695               || (u->_mp_d[limb_cnt]
1696                   & (((mp_limb_t) 1 << bit_index) - 1)));
1697   else
1698     adjust = 0;
1699
1700   if (qn <= 0)
1701     qn = 0;
1702   else
1703     {
1704       qp = MPZ_REALLOC (q, qn);
1705
1706       if (bit_index != 0)
1707         {
1708           mpn_rshift (qp, u->_mp_d + limb_cnt, qn, bit_index);
1709           qn -= qp[qn - 1] == 0;
1710         }
1711       else
1712         {
1713           mpn_copyi (qp, u->_mp_d + limb_cnt, qn);
1714         }
1715     }
1716
1717   q->_mp_size = qn;
1718
1719   if (adjust)
1720     mpz_add_ui (q, q, 1);
1721   if (un < 0)
1722     mpz_neg (q, q);
1723 }
1724
1725 void
1726 mpz_fdiv_q_2exp (mpz_t r, const mpz_t u, mp_bitcnt_t cnt)
1727 {
1728   mpz_div_q_2exp (r, u, cnt, GMP_DIV_FLOOR);
1729 }
1730
1731 void
1732 mpz_tdiv_q_2exp (mpz_t r, const mpz_t u, mp_bitcnt_t cnt)
1733 {
1734   mpz_div_q_2exp (r, u, cnt, GMP_DIV_TRUNC);
1735 }
1736
1737
1738 /* Logical operations and bit manipulation. */
1739
1740 /* Numbers are treated as if represented in two's complement (and
1741    infinitely sign extended). For a negative values we get the two's
1742    complement from -x = ~x + 1, where ~ is bitwise complement.
1743    Negation transforms
1744
1745      xxxx10...0
1746
1747    into
1748
1749      yyyy10...0
1750
1751    where yyyy is the bitwise complement of xxxx. So least significant
1752    bits, up to and including the first one bit, are unchanged, and
1753    the more significant bits are all complemented.
1754
1755    To change a bit from zero to one in a negative number, subtract the
1756    corresponding power of two from the absolute value. This can never
1757    underflow. To change a bit from one to zero, add the corresponding
1758    power of two, and this might overflow. E.g., if x = -001111, the
1759    two's complement is 110001. Clearing the least significant bit, we
1760    get two's complement 110000, and -010000. */
1761
1762 int
1763 mpz_tstbit (const mpz_t d, mp_bitcnt_t bit_index)
1764 {
1765   mp_size_t limb_index;
1766   unsigned shift;
1767   mp_size_t ds;
1768   mp_size_t dn;
1769   mp_limb_t w;
1770   int bit;
1771
1772   ds = d->_mp_size;
1773   dn = GMP_ABS (ds);
1774   limb_index = bit_index / GMP_LIMB_BITS;
1775   if (limb_index >= dn)
1776     return ds < 0;
1777
1778   shift = bit_index % GMP_LIMB_BITS;
1779   w = d->_mp_d[limb_index];
1780   bit = (w >> shift) & 1;
1781
1782   if (ds < 0)
1783     {
1784       /* d < 0. Check if any of the bits below is set: If so, our bit
1785          must be complemented. */
1786       if (shift > 0 && (mp_limb_t) (w << (GMP_LIMB_BITS - shift)) > 0)
1787         return bit ^ 1;
1788       while (--limb_index >= 0)
1789         if (d->_mp_d[limb_index] > 0)
1790           return bit ^ 1;
1791     }
1792   return bit;
1793 }
1794
1795 static void
1796 mpz_abs_add_bit (mpz_t d, mp_bitcnt_t bit_index)
1797 {
1798   mp_size_t dn, limb_index;
1799   mp_limb_t bit;
1800   mp_ptr dp;
1801
1802   dn = GMP_ABS (d->_mp_size);
1803
1804   limb_index = bit_index / GMP_LIMB_BITS;
1805   bit = (mp_limb_t) 1 << (bit_index % GMP_LIMB_BITS);
1806
1807   if (limb_index >= dn)
1808     {
1809       mp_size_t i;
1810       /* The bit should be set outside of the end of the number.
1811          We have to increase the size of the number. */
1812       dp = MPZ_REALLOC (d, limb_index + 1);
1813
1814       dp[limb_index] = bit;
1815       for (i = dn; i < limb_index; i++)
1816         dp[i] = 0;
1817       dn = limb_index + 1;
1818     }
1819   else
1820     {
1821       mp_limb_t cy;
1822
1823       dp = d->_mp_d;
1824
1825       cy = mpn_add_1 (dp + limb_index, dp + limb_index, dn - limb_index, bit);
1826       if (cy > 0)
1827         {
1828           dp = MPZ_REALLOC (d, dn + 1);
1829           dp[dn++] = cy;
1830         }
1831     }
1832
1833   d->_mp_size = (d->_mp_size < 0) ? - dn : dn;
1834 }
1835
1836 static void
1837 mpz_abs_sub_bit (mpz_t d, mp_bitcnt_t bit_index)
1838 {
1839   mp_size_t dn, limb_index;
1840   mp_ptr dp;
1841   mp_limb_t bit;
1842
1843   dn = GMP_ABS (d->_mp_size);
1844   dp = d->_mp_d;
1845
1846   limb_index = bit_index / GMP_LIMB_BITS;
1847   bit = (mp_limb_t) 1 << (bit_index % GMP_LIMB_BITS);
1848
1849   assert (limb_index < dn);
1850
1851   gmp_assert_nocarry (mpn_sub_1 (dp + limb_index, dp + limb_index,
1852                                  dn - limb_index, bit));
1853   dn = mpn_normalized_size (dp, dn);
1854   d->_mp_size = (d->_mp_size < 0) ? - dn : dn;
1855 }
1856
1857 void
1858 mpz_setbit (mpz_t d, mp_bitcnt_t bit_index)
1859 {
1860   if (!mpz_tstbit (d, bit_index))
1861     {
1862       if (d->_mp_size >= 0)
1863         mpz_abs_add_bit (d, bit_index);
1864       else
1865         mpz_abs_sub_bit (d, bit_index);
1866     }
1867 }
1868
1869 void
1870 mpz_clrbit (mpz_t d, mp_bitcnt_t bit_index)
1871 {
1872   if (mpz_tstbit (d, bit_index))
1873     {
1874       if (d->_mp_size >= 0)
1875         mpz_abs_sub_bit (d, bit_index);
1876       else
1877         mpz_abs_add_bit (d, bit_index);
1878     }
1879 }
1880
1881 void
1882 mpz_com (mpz_t r, const mpz_t u)
1883 {
1884   mpz_add_ui (r, u, 1);
1885   mpz_neg (r, r);
1886 }
1887
1888 void
1889 mpz_and (mpz_t r, const mpz_t u, const mpz_t v)
1890 {
1891   mp_size_t un, vn, rn, i;
1892   mp_ptr up, vp, rp;
1893
1894   mp_limb_t ux, vx, rx;
1895   mp_limb_t uc, vc, rc;
1896   mp_limb_t ul, vl, rl;
1897
1898   un = GMP_ABS (u->_mp_size);
1899   vn = GMP_ABS (v->_mp_size);
1900   if (un < vn)
1901     {
1902       MPZ_SRCPTR_SWAP (u, v);
1903       MP_SIZE_T_SWAP (un, vn);
1904     }
1905   if (vn == 0)
1906     {
1907       r->_mp_size = 0;
1908       return;
1909     }
1910
1911   uc = u->_mp_size < 0;
1912   vc = v->_mp_size < 0;
1913   rc = uc & vc;
1914
1915   ux = -uc;
1916   vx = -vc;
1917   rx = -rc;
1918
1919   /* If the smaller input is positive, higher limbs don't matter. */
1920   rn = vx ? un : vn;
1921
1922   rp = MPZ_REALLOC (r, rn + (mp_size_t) rc);
1923
1924   up = u->_mp_d;
1925   vp = v->_mp_d;
1926
1927   i = 0;
1928   do
1929     {
1930       ul = (up[i] ^ ux) + uc;
1931       uc = ul < uc;
1932
1933       vl = (vp[i] ^ vx) + vc;
1934       vc = vl < vc;
1935
1936       rl = ( (ul & vl) ^ rx) + rc;
1937       rc = rl < rc;
1938       rp[i] = rl;
1939     }
1940   while (++i < vn);
1941   assert (vc == 0);
1942
1943   for (; i < rn; i++)
1944     {
1945       ul = (up[i] ^ ux) + uc;
1946       uc = ul < uc;
1947
1948       rl = ( (ul & vx) ^ rx) + rc;
1949       rc = rl < rc;
1950       rp[i] = rl;
1951     }
1952   if (rc)
1953     rp[rn++] = rc;
1954   else
1955     rn = mpn_normalized_size (rp, rn);
1956
1957   r->_mp_size = rx ? -rn : rn;
1958 }
1959
1960 void
1961 mpz_ior (mpz_t r, const mpz_t u, const mpz_t v)
1962 {
1963   mp_size_t un, vn, rn, i;
1964   mp_ptr up, vp, rp;
1965
1966   mp_limb_t ux, vx, rx;
1967   mp_limb_t uc, vc, rc;
1968   mp_limb_t ul, vl, rl;
1969
1970   un = GMP_ABS (u->_mp_size);
1971   vn = GMP_ABS (v->_mp_size);
1972   if (un < vn)
1973     {
1974       MPZ_SRCPTR_SWAP (u, v);
1975       MP_SIZE_T_SWAP (un, vn);
1976     }
1977   if (vn == 0)
1978     {
1979       mpz_set (r, u);
1980       return;
1981     }
1982
1983   uc = u->_mp_size < 0;
1984   vc = v->_mp_size < 0;
1985   rc = uc | vc;
1986
1987   ux = -uc;
1988   vx = -vc;
1989   rx = -rc;
1990
1991   /* If the smaller input is negative, by sign extension higher limbs
1992      don't matter. */
1993   rn = vx ? vn : un;
1994
1995   rp = MPZ_REALLOC (r, rn + (mp_size_t) rc);
1996
1997   up = u->_mp_d;
1998   vp = v->_mp_d;
1999
2000   i = 0;
2001   do
2002     {
2003       ul = (up[i] ^ ux) + uc;
2004       uc = ul < uc;
2005
2006       vl = (vp[i] ^ vx) + vc;
2007       vc = vl < vc;
2008
2009       rl = ( (ul | vl) ^ rx) + rc;
2010       rc = rl < rc;
2011       rp[i] = rl;
2012     }
2013   while (++i < vn);
2014   assert (vc == 0);
2015
2016   for (; i < rn; i++)
2017     {
2018       ul = (up[i] ^ ux) + uc;
2019       uc = ul < uc;
2020
2021       rl = ( (ul | vx) ^ rx) + rc;
2022       rc = rl < rc;
2023       rp[i] = rl;
2024     }
2025   if (rc)
2026     rp[rn++] = rc;
2027   else
2028     rn = mpn_normalized_size (rp, rn);
2029
2030   r->_mp_size = rx ? -rn : rn;
2031 }
2032
2033 void
2034 mpz_xor (mpz_t r, const mpz_t u, const mpz_t v)
2035 {
2036   mp_size_t un, vn, i;
2037   mp_ptr up, vp, rp;
2038
2039   mp_limb_t ux, vx, rx;
2040   mp_limb_t uc, vc, rc;
2041   mp_limb_t ul, vl, rl;
2042
2043   un = GMP_ABS (u->_mp_size);
2044   vn = GMP_ABS (v->_mp_size);
2045   if (un < vn)
2046     {
2047       MPZ_SRCPTR_SWAP (u, v);
2048       MP_SIZE_T_SWAP (un, vn);
2049     }
2050   if (vn == 0)
2051     {
2052       mpz_set (r, u);
2053       return;
2054     }
2055
2056   uc = u->_mp_size < 0;
2057   vc = v->_mp_size < 0;
2058   rc = uc ^ vc;
2059
2060   ux = -uc;
2061   vx = -vc;
2062   rx = -rc;
2063
2064   rp = MPZ_REALLOC (r, un + (mp_size_t) rc);
2065
2066   up = u->_mp_d;
2067   vp = v->_mp_d;
2068
2069   i = 0;
2070   do
2071     {
2072       ul = (up[i] ^ ux) + uc;
2073       uc = ul < uc;
2074
2075       vl = (vp[i] ^ vx) + vc;
2076       vc = vl < vc;
2077
2078       rl = (ul ^ vl ^ rx) + rc;
2079       rc = rl < rc;
2080       rp[i] = rl;
2081     }
2082   while (++i < vn);
2083   assert (vc == 0);
2084
2085   for (; i < un; i++)
2086     {
2087       ul = (up[i] ^ ux) + uc;
2088       uc = ul < uc;
2089
2090       rl = (ul ^ ux) + rc;
2091       rc = rl < rc;
2092       rp[i] = rl;
2093     }
2094   if (rc)
2095     rp[un++] = rc;
2096   else
2097     un = mpn_normalized_size (rp, un);
2098
2099   r->_mp_size = rx ? -un : un;
2100 }
2101
2102 static unsigned
2103 gmp_popcount_limb (mp_limb_t x)
2104 {
2105   unsigned c;
2106
2107   /* Do 16 bits at a time, to avoid limb-sized constants. */
2108   int LOCAL_SHIFT_BITS = 16;
2109   for (c = 0; x > 0;)
2110     {
2111       unsigned w = x - ((x >> 1) & 0x5555);
2112       w = ((w >> 2) & 0x3333) + (w & 0x3333);
2113       w =  (w >> 4) + w;
2114       w = ((w >> 8) & 0x000f) + (w & 0x000f);
2115       c += w;
2116       if (GMP_LIMB_BITS > LOCAL_SHIFT_BITS)
2117         x >>= LOCAL_SHIFT_BITS;
2118       else
2119         x = 0;
2120     }
2121   return c;
2122 }
2123
2124 static mp_bitcnt_t
2125 mpn_popcount (mp_srcptr p, mp_size_t n)
2126 {
2127   mp_size_t i;
2128   mp_bitcnt_t c;
2129
2130   for (c = 0, i = 0; i < n; i++)
2131     c += gmp_popcount_limb (p[i]);
2132
2133   return c;
2134 }
2135
2136 mp_bitcnt_t
2137 mpz_popcount (const mpz_t u)
2138 {
2139   mp_size_t un;
2140
2141   un = u->_mp_size;
2142
2143   if (un < 0)
2144     return ~(mp_bitcnt_t) 0;
2145
2146   return mpn_popcount (u->_mp_d, un);
2147 }
2148
2149
2150 mp_bitcnt_t
2151 mpz_scan1 (const mpz_t u, mp_bitcnt_t starting_bit)
2152 {
2153   mp_ptr up;
2154   mp_size_t us, un, i;
2155   mp_limb_t limb, ux;
2156
2157   us = u->_mp_size;
2158   un = GMP_ABS (us);
2159   i = starting_bit / GMP_LIMB_BITS;
2160
2161   /* Past the end there's no 1 bits for u>=0, or an immediate 1 bit
2162      for u<0. Notice this test picks up any u==0 too. */
2163   if (i >= un)
2164     return (us >= 0 ? ~(mp_bitcnt_t) 0 : starting_bit);
2165
2166   up = u->_mp_d;
2167   ux = 0;
2168   limb = up[i];
2169
2170   if (starting_bit != 0)
2171     {
2172       if (us < 0)
2173         {
2174           ux = mpn_zero_p (up, i);
2175           limb = ~ limb + ux;
2176           ux = - (mp_limb_t) (limb >= ux);
2177         }
2178
2179       /* Mask to 0 all bits before starting_bit, thus ignoring them. */
2180       limb &= GMP_LIMB_MAX << (starting_bit % GMP_LIMB_BITS);
2181     }
2182
2183   return mpn_common_scan (limb, i, up, un, ux);
2184 }
2185
2186
2187 /* MPZ base conversion. */
2188
2189 size_t
2190 mpz_sizeinbase (const mpz_t u, int base)
2191 {
2192   mp_size_t un;
2193   mp_srcptr up;
2194   mp_ptr tp;
2195   mp_bitcnt_t bits;
2196   struct gmp_div_inverse bi;
2197   size_t ndigits;
2198
2199   assert (base >= 2);
2200   assert (base <= 62);
2201
2202   un = GMP_ABS (u->_mp_size);
2203   if (un == 0)
2204     return 1;
2205
2206   up = u->_mp_d;
2207
2208   bits = (un - 1) * GMP_LIMB_BITS + mpn_limb_size_in_base_2 (up[un-1]);
2209   switch (base)
2210     {
2211     case 2:
2212       return bits;
2213     case 4:
2214       return (bits + 1) / 2;
2215     case 8:
2216       return (bits + 2) / 3;
2217     case 16:
2218       return (bits + 3) / 4;
2219     case 32:
2220       return (bits + 4) / 5;
2221       /* FIXME: Do something more clever for the common case of base
2222          10. */
2223     }
2224
2225   tp = gmp_xalloc_limbs (un);
2226   mpn_copyi (tp, up, un);
2227   mpn_div_qr_1_invert (&bi, base);
2228
2229   ndigits = 0;
2230   do
2231     {
2232       ndigits++;
2233       mpn_div_qr_1_preinv (tp, tp, un, &bi);
2234       un -= (tp[un-1] == 0);
2235     }
2236   while (un > 0);
2237
2238   gmp_free (tp);
2239   return ndigits;
2240 }
2241
2242
2243 static int
2244 gmp_detect_endian (void)
2245 {
2246   static const int i = 2;
2247   const unsigned char *p = (const unsigned char *) &i;
2248   return 1 - *p;
2249 }
2250
2251 /* Import and export. Does not support nails. */
2252 void
2253 mpz_import (mpz_t r, size_t count, int order, size_t size, int endian,
2254             size_t nails, const void *src)
2255 {
2256   const unsigned char *p;
2257   ptrdiff_t word_step;
2258   mp_ptr rp;
2259   mp_size_t rn;
2260
2261   /* The current (partial) limb. */
2262   mp_limb_t limb;
2263   /* The number of bytes already copied to this limb (starting from
2264      the low end). */
2265   size_t bytes;
2266   /* The index where the limb should be stored, when completed. */
2267   mp_size_t i;
2268
2269   if (nails != 0)
2270     gmp_die ("mpz_import: Nails not supported.");
2271
2272   assert (order == 1 || order == -1);
2273   assert (endian >= -1 && endian <= 1);
2274
2275   if (endian == 0)
2276     endian = gmp_detect_endian ();
2277
2278   p = (unsigned char *) src;
2279
2280   word_step = (order != endian) ? 2 * size : 0;
2281
2282   /* Process bytes from the least significant end, so point p at the
2283      least significant word. */
2284   if (order == 1)
2285     {
2286       p += size * (count - 1);
2287       word_step = - word_step;
2288     }
2289
2290   /* And at least significant byte of that word. */
2291   if (endian == 1)
2292     p += (size - 1);
2293
2294   rn = (size * count + sizeof(mp_limb_t) - 1) / sizeof(mp_limb_t);
2295   rp = MPZ_REALLOC (r, rn);
2296
2297   for (limb = 0, bytes = 0, i = 0; count > 0; count--, p += word_step)
2298     {
2299       size_t j;
2300       for (j = 0; j < size; j++, p -= (ptrdiff_t) endian)
2301         {
2302           limb |= (mp_limb_t) *p << (bytes++ * CHAR_BIT);
2303           if (bytes == sizeof(mp_limb_t))
2304             {
2305               rp[i++] = limb;
2306               bytes = 0;
2307               limb = 0;
2308             }
2309         }
2310     }
2311   assert (i + (bytes > 0) == rn);
2312   if (limb != 0)
2313     rp[i++] = limb;
2314   else
2315     i = mpn_normalized_size (rp, i);
2316
2317   r->_mp_size = i;
2318 }
2319
2320 void *
2321 mpz_export (void *r, size_t *countp, int order, size_t size, int endian,
2322             size_t nails, const mpz_t u)
2323 {
2324   size_t count;
2325   mp_size_t un;
2326
2327   if (nails != 0)
2328     gmp_die ("mpz_import: Nails not supported.");
2329
2330   assert (order == 1 || order == -1);
2331   assert (endian >= -1 && endian <= 1);
2332   assert (size > 0 || u->_mp_size == 0);
2333
2334   un = u->_mp_size;
2335   count = 0;
2336   if (un != 0)
2337     {
2338       size_t k;
2339       unsigned char *p;
2340       ptrdiff_t word_step;
2341       /* The current (partial) limb. */
2342       mp_limb_t limb;
2343       /* The number of bytes left to do in this limb. */
2344       size_t bytes;
2345       /* The index where the limb was read. */
2346       mp_size_t i;
2347
2348       un = GMP_ABS (un);
2349
2350       /* Count bytes in top limb. */
2351       limb = u->_mp_d[un-1];
2352       assert (limb != 0);
2353
2354       k = (GMP_LIMB_BITS <= CHAR_BIT);
2355       if (!k)
2356         {
2357           do {
2358             int LOCAL_CHAR_BIT = CHAR_BIT;
2359             k++; limb >>= LOCAL_CHAR_BIT;
2360           } while (limb != 0);
2361         }
2362       /* else limb = 0; */
2363
2364       count = (k + (un-1) * sizeof (mp_limb_t) + size - 1) / size;
2365
2366       if (!r)
2367         r = gmp_xalloc (count * size);
2368
2369       if (endian == 0)
2370         endian = gmp_detect_endian ();
2371
2372       p = (unsigned char *) r;
2373
2374       word_step = (order != endian) ? 2 * size : 0;
2375
2376       /* Process bytes from the least significant end, so point p at the
2377          least significant word. */
2378       if (order == 1)
2379         {
2380           p += size * (count - 1);
2381           word_step = - word_step;
2382         }
2383
2384       /* And at least significant byte of that word. */
2385       if (endian == 1)
2386         p += (size - 1);
2387
2388       for (bytes = 0, i = 0, k = 0; k < count; k++, p += word_step)
2389         {
2390           size_t j;
2391           for (j = 0; j < size; ++j, p -= (ptrdiff_t) endian)
2392             {
2393               if (sizeof (mp_limb_t) == 1)
2394                 {
2395                   if (i < un)
2396                     *p = u->_mp_d[i++];
2397                   else
2398                     *p = 0;
2399                 }
2400               else
2401                 {
2402                   int LOCAL_CHAR_BIT = CHAR_BIT;
2403                   if (bytes == 0)
2404                     {
2405                       if (i < un)
2406                         limb = u->_mp_d[i++];
2407                       bytes = sizeof (mp_limb_t);
2408                     }
2409                   *p = limb;
2410                   limb >>= LOCAL_CHAR_BIT;
2411                   bytes--;
2412                 }
2413             }
2414         }
2415       assert (i == un);
2416       assert (k == count);
2417     }
2418
2419   if (countp)
2420     *countp = count;
2421
2422   return r;
2423 }
2424
2425 #endif