hammer2/zlib/hammer2_zlib_adler32.c

*2d60b848STomohiro Kusumi/* adler32.c -- compute the Adler-32 checksum of a data stream
*2d60b848STomohiro Kusumi * Copyright (C) 1995-2011 Mark Adler
*2d60b848STomohiro Kusumi * For conditions of distribution and use, see copyright notice in zlib.h
*2d60b848STomohiro Kusumi */
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi/* @(#) $Id$ */
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi#include "hammer2_zlib_zutil.h"
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi#define local static
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi//local uLong adler32_combine_ (uLong adler1, uLong adler2, z_off64_t len2);
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi#define BASE 65521      /* largest prime smaller than 65536 */
*2d60b848STomohiro Kusumi#define NMAX 5552
*2d60b848STomohiro Kusumi/* NMAX is the largest n such that 255n(n+1)/2 + (n+1)(BASE-1) <= 2^32-1 */
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi#define DO1(buf,i)  {adler += (buf)[i]; sum2 += adler;}
*2d60b848STomohiro Kusumi#define DO2(buf,i)  DO1(buf,i); DO1(buf,i+1);
*2d60b848STomohiro Kusumi#define DO4(buf,i)  DO2(buf,i); DO2(buf,i+2);
*2d60b848STomohiro Kusumi#define DO8(buf,i)  DO4(buf,i); DO4(buf,i+4);
*2d60b848STomohiro Kusumi#define DO16(buf)   DO8(buf,0); DO8(buf,8);
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi/* use NO_DIVIDE if your processor does not do division in hardware --
*2d60b848STomohiro Kusumi   try it both ways to see which is faster */
*2d60b848STomohiro Kusumi#ifdef NO_DIVIDE
*2d60b848STomohiro Kusumi/* note that this assumes BASE is 65521, where 65536 % 65521 == 15
*2d60b848STomohiro Kusumi   (thank you to John Reiser for pointing this out) */
*2d60b848STomohiro Kusumi#  define CHOP(a) \
*2d60b848STomohiro Kusumi    do { \
*2d60b848STomohiro Kusumi        unsigned long tmp = a >> 16; \
*2d60b848STomohiro Kusumi        a &= 0xffffUL; \
*2d60b848STomohiro Kusumi        a += (tmp << 4) - tmp; \
*2d60b848STomohiro Kusumi    } while (0)
*2d60b848STomohiro Kusumi#  define MOD28(a) \
*2d60b848STomohiro Kusumi    do { \
*2d60b848STomohiro Kusumi        CHOP(a); \
*2d60b848STomohiro Kusumi        if (a >= BASE) a -= BASE; \
*2d60b848STomohiro Kusumi    } while (0)
*2d60b848STomohiro Kusumi#  define MOD(a) \
*2d60b848STomohiro Kusumi    do { \
*2d60b848STomohiro Kusumi        CHOP(a); \
*2d60b848STomohiro Kusumi        MOD28(a); \
*2d60b848STomohiro Kusumi    } while (0)
*2d60b848STomohiro Kusumi#  define MOD63(a) \
*2d60b848STomohiro Kusumi    do { /* this assumes a is not negative */ \
*2d60b848STomohiro Kusumi        z_off64_t tmp = a >> 32; \
*2d60b848STomohiro Kusumi        a &= 0xffffffffL; \
*2d60b848STomohiro Kusumi        a += (tmp << 8) - (tmp << 5) + tmp; \
*2d60b848STomohiro Kusumi        tmp = a >> 16; \
*2d60b848STomohiro Kusumi        a &= 0xffffL; \
*2d60b848STomohiro Kusumi        a += (tmp << 4) - tmp; \
*2d60b848STomohiro Kusumi        tmp = a >> 16; \
*2d60b848STomohiro Kusumi        a &= 0xffffL; \
*2d60b848STomohiro Kusumi        a += (tmp << 4) - tmp; \
*2d60b848STomohiro Kusumi        if (a >= BASE) a -= BASE; \
*2d60b848STomohiro Kusumi    } while (0)
*2d60b848STomohiro Kusumi#else
*2d60b848STomohiro Kusumi#  define MOD(a) a %= BASE
*2d60b848STomohiro Kusumi#  define MOD28(a) a %= BASE
*2d60b848STomohiro Kusumi#  define MOD63(a) a %= BASE
*2d60b848STomohiro Kusumi#endif
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumilocal uLong adler32_combine_(uLong adler1, uLong adler2, z_off64_t len2);
*2d60b848STomohiro KusumiuLong adler32_combine(uLong adler1, uLong adler2, z_off_t len2);
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi/* ========================================================================= */
*2d60b848STomohiro KusumiuLong
*2d60b848STomohiro Kusumiadler32(uLong adler, const Bytef *buf, uInt len)
*2d60b848STomohiro Kusumi{
*2d60b848STomohiro Kusumi    unsigned long sum2;
*2d60b848STomohiro Kusumi    unsigned n;
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi    /* split Adler-32 into component sums */
*2d60b848STomohiro Kusumi    sum2 = (adler >> 16) & 0xffff;
*2d60b848STomohiro Kusumi    adler &= 0xffff;
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi    /* in case user likes doing a byte at a time, keep it fast */
*2d60b848STomohiro Kusumi    if (len == 1) {
*2d60b848STomohiro Kusumi        adler += buf[0];
*2d60b848STomohiro Kusumi        if (adler >= BASE)
*2d60b848STomohiro Kusumi            adler -= BASE;
*2d60b848STomohiro Kusumi        sum2 += adler;
*2d60b848STomohiro Kusumi        if (sum2 >= BASE)
*2d60b848STomohiro Kusumi            sum2 -= BASE;
*2d60b848STomohiro Kusumi        return adler | (sum2 << 16);
*2d60b848STomohiro Kusumi    }
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi    /* initial Adler-32 value (deferred check for len == 1 speed) */
*2d60b848STomohiro Kusumi    if (buf == Z_NULL)
*2d60b848STomohiro Kusumi        return 1L;
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi    /* in case short lengths are provided, keep it somewhat fast */
*2d60b848STomohiro Kusumi    if (len < 16) {
*2d60b848STomohiro Kusumi        while (len--) {
*2d60b848STomohiro Kusumi            adler += *buf++;
*2d60b848STomohiro Kusumi            sum2 += adler;
*2d60b848STomohiro Kusumi        }
*2d60b848STomohiro Kusumi        if (adler >= BASE)
*2d60b848STomohiro Kusumi            adler -= BASE;
*2d60b848STomohiro Kusumi        MOD28(sum2);            /* only added so many BASE's */
*2d60b848STomohiro Kusumi        return adler | (sum2 << 16);
*2d60b848STomohiro Kusumi    }
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi    /* do length NMAX blocks -- requires just one modulo operation */
*2d60b848STomohiro Kusumi    while (len >= NMAX) {
*2d60b848STomohiro Kusumi        len -= NMAX;
*2d60b848STomohiro Kusumi        n = NMAX / 16;          /* NMAX is divisible by 16 */
*2d60b848STomohiro Kusumi        do {
*2d60b848STomohiro Kusumi            DO16(buf);          /* 16 sums unrolled */
*2d60b848STomohiro Kusumi            buf += 16;
*2d60b848STomohiro Kusumi        } while (--n);
*2d60b848STomohiro Kusumi        MOD(adler);
*2d60b848STomohiro Kusumi        MOD(sum2);
*2d60b848STomohiro Kusumi    }
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi    /* do remaining bytes (less than NMAX, still just one modulo) */
*2d60b848STomohiro Kusumi    if (len) {                  /* avoid modulos if none remaining */
*2d60b848STomohiro Kusumi        while (len >= 16) {
*2d60b848STomohiro Kusumi            len -= 16;
*2d60b848STomohiro Kusumi            DO16(buf);
*2d60b848STomohiro Kusumi            buf += 16;
*2d60b848STomohiro Kusumi        }
*2d60b848STomohiro Kusumi        while (len--) {
*2d60b848STomohiro Kusumi            adler += *buf++;
*2d60b848STomohiro Kusumi            sum2 += adler;
*2d60b848STomohiro Kusumi        }
*2d60b848STomohiro Kusumi        MOD(adler);
*2d60b848STomohiro Kusumi        MOD(sum2);
*2d60b848STomohiro Kusumi    }
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi    /* return recombined sums */
*2d60b848STomohiro Kusumi    return adler | (sum2 << 16);
*2d60b848STomohiro Kusumi}
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi/* ========================================================================= */
*2d60b848STomohiro Kusumilocal
*2d60b848STomohiro KusumiuLong
*2d60b848STomohiro Kusumiadler32_combine_(uLong adler1, uLong adler2, z_off64_t len2)
*2d60b848STomohiro Kusumi{
*2d60b848STomohiro Kusumi    unsigned long sum1;
*2d60b848STomohiro Kusumi    unsigned long sum2;
*2d60b848STomohiro Kusumi    unsigned rem;
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi    /* for negative len, return invalid adler32 as a clue for debugging */
*2d60b848STomohiro Kusumi    if (len2 < 0)
*2d60b848STomohiro Kusumi        return 0xffffffffUL;
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi    /* the derivation of this formula is left as an exercise for the reader */
*2d60b848STomohiro Kusumi    MOD63(len2);                /* assumes len2 >= 0 */
*2d60b848STomohiro Kusumi    rem = (unsigned)len2;
*2d60b848STomohiro Kusumi    sum1 = adler1 & 0xffff;
*2d60b848STomohiro Kusumi    sum2 = rem * sum1;
*2d60b848STomohiro Kusumi    MOD(sum2);
*2d60b848STomohiro Kusumi    sum1 += (adler2 & 0xffff) + BASE - 1;
*2d60b848STomohiro Kusumi    sum2 += ((adler1 >> 16) & 0xffff) + ((adler2 >> 16) & 0xffff) + BASE - rem;
*2d60b848STomohiro Kusumi    if (sum1 >= BASE) sum1 -= BASE;
*2d60b848STomohiro Kusumi    if (sum1 >= BASE) sum1 -= BASE;
*2d60b848STomohiro Kusumi    if (sum2 >= (BASE << 1)) sum2 -= (BASE << 1);
*2d60b848STomohiro Kusumi    if (sum2 >= BASE) sum2 -= BASE;
*2d60b848STomohiro Kusumi    return sum1 | (sum2 << 16);
*2d60b848STomohiro Kusumi}
*2d60b848STomohiro Kusumi
*2d60b848STomohiro Kusumi/* ========================================================================= */
*2d60b848STomohiro KusumiuLong
*2d60b848STomohiro Kusumiadler32_combine(uLong adler1, uLong adler2, z_off_t len2)
*2d60b848STomohiro Kusumi{
*2d60b848STomohiro Kusumi    return adler32_combine_(adler1, adler2, len2);
*2d60b848STomohiro Kusumi}
*2d60b848STomohiro Kusumi
*2d60b848STomohiro KusumiuLong
*2d60b848STomohiro Kusumiadler32_combine64(uLong adler1, uLong adler2, z_off64_t len2)
*2d60b848STomohiro Kusumi{
*2d60b848STomohiro Kusumi    return adler32_combine_(adler1, adler2, len2);
*2d60b848STomohiro Kusumi}