xref: /openbsd-src/lib/libc/stdlib/icdb.c (revision 0367d324a3b6fcca57f9f22216f64bc0f1e697f4)
1*0367d324Snicm /* $OpenBSD: icdb.c,v 1.8 2016/09/04 16:56:02 nicm Exp $ */
246d82e2eStedu /*
346d82e2eStedu  * Copyright (c) 2015 Ted Unangst <tedu@openbsd.org>
446d82e2eStedu  *
546d82e2eStedu  * Permission to use, copy, modify, and distribute this software for any
646d82e2eStedu  * purpose with or without fee is hereby granted, provided that the above
746d82e2eStedu  * copyright notice and this permission notice appear in all copies.
846d82e2eStedu  *
946d82e2eStedu  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
1046d82e2eStedu  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
1146d82e2eStedu  * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
1246d82e2eStedu  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
1346d82e2eStedu  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
1446d82e2eStedu  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
1546d82e2eStedu  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
1646d82e2eStedu  */
17*0367d324Snicm 
18*0367d324Snicm #include <errno.h>
1946d82e2eStedu #include <fcntl.h>
20*0367d324Snicm #include <icdb.h>
21*0367d324Snicm #include <stddef.h>
2246d82e2eStedu #include <stdint.h>
2346d82e2eStedu #include <stdio.h>
2446d82e2eStedu #include <stdlib.h>
2546d82e2eStedu #include <string.h>
2646d82e2eStedu #include <unistd.h>
2746d82e2eStedu 
2846d82e2eStedu #include <sys/mman.h>
2946d82e2eStedu #include <sys/stat.h>
3046d82e2eStedu 
3146d82e2eStedu #include <siphash.h>
3246d82e2eStedu 
3346d82e2eStedu /*
3446d82e2eStedu  * Creating a new icdb: icdb_new
3546d82e2eStedu  * Opening existing icdb: icdb_open
3646d82e2eStedu  *
3746d82e2eStedu  * Adding new entries: icdb_add
3846d82e2eStedu  * Adding entries does not update the disk or indices.
3946d82e2eStedu  *
4046d82e2eStedu  * Save to disk: icdb_save
4146d82e2eStedu  * Update indices: icdb_rehash
4246d82e2eStedu  * icdb_save will call rehash.
4346d82e2eStedu  *
4446d82e2eStedu  * Change an existing entry: icdb_update
4546d82e2eStedu  * Changing entries does write to disk.
4646d82e2eStedu  *
4746d82e2eStedu  * Find an entry: icdb_lookup
4846d82e2eStedu  * Looking up an entry is only defined when the indices are synced.
4946d82e2eStedu  *
5046d82e2eStedu  * Close and free resources: icdb_close
5146d82e2eStedu  */
5246d82e2eStedu 
5346d82e2eStedu /*
5446d82e2eStedu  * There are two major modes of operation.
5546d82e2eStedu  *
5646d82e2eStedu  * Existing databases use the mmap codepath. The entire database is mapped
5746d82e2eStedu  * into the address space for quick access. Individual entries may be updated,
5846d82e2eStedu  * but no new entries added.
5946d82e2eStedu  *
6046d82e2eStedu  * New databases use malloc backed memory instead. The database may be saved
6146d82e2eStedu  * with icdb_save. It should be saved to a new file to avoid corrupting any
6246d82e2eStedu  * open databases in other processes.
6346d82e2eStedu  */
6446d82e2eStedu 
6546d82e2eStedu /*
6646d82e2eStedu  * An icdb has the following format:
6746d82e2eStedu  *   struct icbinfo header
6846d82e2eStedu  *   indexes [ uint32_t * indexsize * nkeys ]
6946d82e2eStedu  *   entries [ entrysize * nentries ]
7046d82e2eStedu  *
7146d82e2eStedu  * To find an entry in the file, the user specifies which key to use.
7246d82e2eStedu  * The key is hashed and looked up in the index. The index contains the
7346d82e2eStedu  * position of the entry in the entries array. -1 identifies not found.
7446d82e2eStedu  * Chaining is done by rehashing the hash. All keys are fixed size byte arrays.
7546d82e2eStedu  */
7646d82e2eStedu 
7746d82e2eStedu /*
7846d82e2eStedu  * Header info for icdb. This struct is stored on disk.
7946d82e2eStedu  */
8046d82e2eStedu struct icdbinfo {
8146d82e2eStedu 	uint32_t magic;		/* magic */
82025678faStedu 	uint32_t version;	/* user specified version */
8346d82e2eStedu 	uint32_t nentries;	/* number of entries stored */
8446d82e2eStedu 	uint32_t entrysize;	/* size of each entry */
8546d82e2eStedu 	uint32_t indexsize;	/* number of entries in hash index */
8646d82e2eStedu 	uint32_t nkeys;		/* number of keys defined */
8746d82e2eStedu 	uint32_t keysize[8];	/* size of each key */
8846d82e2eStedu 	uint32_t keyoffset[8];	/* offset of each key in entry */
8946d82e2eStedu 	SIPHASH_KEY siphashkey;	/* random hash key */
9046d82e2eStedu };
9146d82e2eStedu 
9246d82e2eStedu /*
9346d82e2eStedu  * In memory representation with auxiliary data.
9446d82e2eStedu  * idxdata and entries will be written to disk after info.
9546d82e2eStedu  */
9646d82e2eStedu struct icdb {
9746d82e2eStedu 	struct icdbinfo *info;
9846d82e2eStedu 	void *idxdata[8];
9946d82e2eStedu 	void *entries;
10046d82e2eStedu 	size_t maplen;
10146d82e2eStedu 	uint32_t allocated;
10246d82e2eStedu 	int fd;
10346d82e2eStedu };
10446d82e2eStedu 
105f4e50008Sguenther static const uint32_t magic = 0x1ca9d0b7;
10646d82e2eStedu 
10746d82e2eStedu static uint32_t
roundup(uint32_t num)10846d82e2eStedu roundup(uint32_t num)
10946d82e2eStedu {
11046d82e2eStedu 	uint32_t r = 2;
11146d82e2eStedu 
11246d82e2eStedu 	while (r < num * 3 / 2)
11346d82e2eStedu 		r *= 2;
11446d82e2eStedu 	return r;
11546d82e2eStedu }
11646d82e2eStedu 
11746d82e2eStedu struct icdb *
icdb_new(uint32_t version,uint32_t nentries,uint32_t entrysize,uint32_t nkeys,const uint32_t * keysizes,const uint32_t * keyoffsets)118025678faStedu icdb_new(uint32_t version, uint32_t nentries, uint32_t entrysize,
11977abaea0Snicm     uint32_t nkeys, const uint32_t *keysizes, const uint32_t *keyoffsets)
12046d82e2eStedu {
12146d82e2eStedu 	struct icdb *db;
12246d82e2eStedu 	struct icdbinfo *info;
12346d82e2eStedu 	int i;
12446d82e2eStedu 
125*0367d324Snicm 	if (entrysize == 0 || entrysize > 1048576 || nkeys > 8) {
126*0367d324Snicm 		errno = EINVAL;
12746d82e2eStedu 		return NULL;
128*0367d324Snicm 	}
12946d82e2eStedu 
13046d82e2eStedu 	if (!(db = calloc(1, sizeof(*db))))
13146d82e2eStedu 		return NULL;
13246d82e2eStedu 	if (!(info = calloc(1, sizeof(*info)))) {
13346d82e2eStedu 		free(db);
13446d82e2eStedu 		return NULL;
13546d82e2eStedu 	}
13646d82e2eStedu 	db->info = info;
13746d82e2eStedu 	db->fd = -1;
13846d82e2eStedu 	info->magic = magic;
139025678faStedu 	info->version = version;
14046d82e2eStedu 	if (nentries)
14146d82e2eStedu 		if ((db->entries = reallocarray(NULL, nentries, entrysize)))
14246d82e2eStedu 			db->allocated = nentries;
14346d82e2eStedu 	info->entrysize = entrysize;
14446d82e2eStedu 	info->nkeys = nkeys;
14546d82e2eStedu 	for (i = 0; i < nkeys; i++) {
14646d82e2eStedu 		info->keysize[i] = keysizes[i];
14746d82e2eStedu 		info->keyoffset[i] = keyoffsets[i];
14846d82e2eStedu 	}
14946d82e2eStedu 	return db;
15046d82e2eStedu }
151076d2e27Sguenther DEF_WEAK(icdb_new);
15246d82e2eStedu 
15346d82e2eStedu struct icdb *
icdb_open(const char * name,int flags,uint32_t version)154025678faStedu icdb_open(const char *name, int flags, uint32_t version)
15546d82e2eStedu {
15646d82e2eStedu 	struct icdb *db = NULL;
15746d82e2eStedu 	struct icdbinfo *info;
15846d82e2eStedu 	struct stat sb;
15946d82e2eStedu 	uint8_t *ptr = MAP_FAILED;
16046d82e2eStedu 	uint32_t baseoff, indexsize, idxmask, idxlen;
161*0367d324Snicm 	int fd, i, saved_errno;
16246d82e2eStedu 
16346d82e2eStedu 	if ((fd = open(name, flags | O_CLOEXEC)) == -1)
16446d82e2eStedu 		return NULL;
16546d82e2eStedu 	if (fstat(fd, &sb) != 0)
16646d82e2eStedu 		goto fail;
167febce5fcStedu 	if (sb.st_size < sizeof(struct icdbinfo))
168febce5fcStedu 		goto fail;
16946d82e2eStedu 	ptr = mmap(NULL, sb.st_size, PROT_READ |
17046d82e2eStedu 	    ((flags & O_RDWR) ? PROT_WRITE : 0), MAP_SHARED, fd, 0);
17146d82e2eStedu 	if (ptr == MAP_FAILED)
17246d82e2eStedu 		goto fail;
17346d82e2eStedu 	info = (struct icdbinfo *)ptr;
174*0367d324Snicm 	if (info->magic != magic || info->version != version) {
175*0367d324Snicm 		errno = ENOENT;
17646d82e2eStedu 		goto fail;
177*0367d324Snicm 	}
17846d82e2eStedu 
17946d82e2eStedu 	if (!(db = calloc(1, sizeof(*db))))
18046d82e2eStedu 		goto fail;
18146d82e2eStedu 	db->info = info;
18246d82e2eStedu 
18346d82e2eStedu 	indexsize = info->indexsize;
18446d82e2eStedu 	idxmask = indexsize - 1;
18546d82e2eStedu 	idxlen = indexsize * sizeof(uint32_t);
18646d82e2eStedu 	baseoff = sizeof(*info) + idxlen * info->nkeys;
18746d82e2eStedu 
18846d82e2eStedu 	for (i = 0; i < info->nkeys; i++)
18946d82e2eStedu 		db->idxdata[i] = ptr + sizeof(*info) + i * idxlen;
19046d82e2eStedu 	db->entries = ptr + baseoff;
19146d82e2eStedu 	db->maplen = sb.st_size;
19246d82e2eStedu 	db->fd = fd;
19346d82e2eStedu 	return db;
19446d82e2eStedu 
19546d82e2eStedu fail:
196*0367d324Snicm 	saved_errno = errno;
19746d82e2eStedu 	if (ptr != MAP_FAILED)
19846d82e2eStedu 		munmap(ptr, sb.st_size);
19946d82e2eStedu 	if (fd != -1)
20046d82e2eStedu 		close(fd);
20146d82e2eStedu 	free(db);
202*0367d324Snicm 	errno = saved_errno;
20346d82e2eStedu 	return NULL;
20446d82e2eStedu }
205076d2e27Sguenther DEF_WEAK(icdb_open);
20646d82e2eStedu 
20746d82e2eStedu int
icdb_get(struct icdb * db,void * entry,uint32_t idx)20846d82e2eStedu icdb_get(struct icdb *db, void *entry, uint32_t idx)
20946d82e2eStedu {
21046d82e2eStedu 	uint32_t entrysize = db->info->entrysize;
21146d82e2eStedu 
21246d82e2eStedu 	memcpy(entry, (uint8_t *)db->entries + idx * entrysize, entrysize);
21346d82e2eStedu 	return 0;
21446d82e2eStedu }
215076d2e27Sguenther DEF_WEAK(icdb_get);
21646d82e2eStedu 
21746d82e2eStedu int
icdb_lookup(struct icdb * db,int keynum,const void * key,void * entry,uint32_t * idxp)218*0367d324Snicm icdb_lookup(struct icdb *db, int keynum, const void *key, void *entry,
219*0367d324Snicm     uint32_t *idxp)
22046d82e2eStedu {
22146d82e2eStedu 	struct icdbinfo *info = db->info;
22246d82e2eStedu 	uint32_t offset;
22346d82e2eStedu 	uint64_t hash;
22446d82e2eStedu 	uint32_t indexsize, idxmask, idxlen;
22546d82e2eStedu 	uint32_t *idxdata;
22646d82e2eStedu 
22746d82e2eStedu 	indexsize = info->indexsize;
22846d82e2eStedu 	idxmask = indexsize - 1;
22946d82e2eStedu 	idxlen = indexsize * sizeof(uint32_t);
23046d82e2eStedu 
23146d82e2eStedu 	idxdata = db->idxdata[keynum];
23246d82e2eStedu 
23346d82e2eStedu 	hash = SipHash24(&info->siphashkey, key, info->keysize[keynum]);
23446d82e2eStedu 	while ((offset = idxdata[hash & idxmask]) != -1) {
235*0367d324Snicm 		if (icdb_get(db, entry, offset) != 0) {
236*0367d324Snicm 			errno = ENOENT;
23746d82e2eStedu 			return -1;
238*0367d324Snicm 		}
23946d82e2eStedu 		if (memcmp((uint8_t *)entry + info->keyoffset[keynum], key,
24046d82e2eStedu 		    info->keysize[keynum]) == 0) {
24146d82e2eStedu 			if (idxp)
24246d82e2eStedu 				*idxp = offset;
24346d82e2eStedu 			return 0;
24446d82e2eStedu 		}
24546d82e2eStedu 		hash = SipHash24(&info->siphashkey, &hash, sizeof(hash));
24646d82e2eStedu 	}
24746d82e2eStedu 	return 1;
24846d82e2eStedu }
249076d2e27Sguenther DEF_WEAK(icdb_lookup);
25046d82e2eStedu 
25146d82e2eStedu int
icdb_nentries(struct icdb * db)25246d82e2eStedu icdb_nentries(struct icdb *db)
25346d82e2eStedu {
25446d82e2eStedu 	return db->info->nentries;
25546d82e2eStedu }
256076d2e27Sguenther DEF_WEAK(icdb_nentries);
25746d82e2eStedu 
25846d82e2eStedu const void *
icdb_entries(struct icdb * db)25946d82e2eStedu icdb_entries(struct icdb *db)
26046d82e2eStedu {
26146d82e2eStedu 	return db->entries;
26246d82e2eStedu }
263076d2e27Sguenther DEF_WEAK(icdb_entries);
26446d82e2eStedu 
26546d82e2eStedu int
icdb_update(struct icdb * db,const void * entry,int offset)26646d82e2eStedu icdb_update(struct icdb *db, const void *entry, int offset)
26746d82e2eStedu {
26846d82e2eStedu 	struct icdbinfo *info = db->info;
26946d82e2eStedu 	uint32_t entrysize = info->entrysize;
27046d82e2eStedu 	uint32_t baseoff;
27146d82e2eStedu 	uint32_t indexsize, idxmask, idxlen;
27246d82e2eStedu 
27346d82e2eStedu 	indexsize = info->indexsize;
27446d82e2eStedu 	idxmask = indexsize - 1;
27546d82e2eStedu 	idxlen = indexsize * sizeof(uint32_t);
27646d82e2eStedu 	baseoff = sizeof(*info) + idxlen * info->nkeys;
27746d82e2eStedu 
278*0367d324Snicm 	memcpy((uint8_t *)db->entries + offset * entrysize, entry, entrysize);
279*0367d324Snicm 	if (db->fd != -1) {
280*0367d324Snicm 		msync((uint8_t *)db->entries + offset * entrysize, entrysize,
281*0367d324Snicm 		    MS_SYNC);
282*0367d324Snicm 	}
28346d82e2eStedu 	return 0;
28446d82e2eStedu }
285076d2e27Sguenther DEF_WEAK(icdb_update);
28646d82e2eStedu 
28746d82e2eStedu int
icdb_add(struct icdb * db,const void * entry)28846d82e2eStedu icdb_add(struct icdb *db, const void *entry)
28946d82e2eStedu {
29046d82e2eStedu 	struct icdbinfo *info = db->info;
29146d82e2eStedu 	size_t entrysize = info->entrysize;
29246d82e2eStedu 
29346d82e2eStedu 	if (db->allocated == info->nentries) {
29446d82e2eStedu 		void *p;
29546d82e2eStedu 		size_t amt = db->allocated ? db->allocated * 2 : 63;
29646d82e2eStedu 		if (!(p = reallocarray(db->entries, amt, entrysize)))
29746d82e2eStedu 			return -1;
29846d82e2eStedu 		db->allocated = amt;
29946d82e2eStedu 		db->entries = p;
30046d82e2eStedu 	}
30146d82e2eStedu 	memcpy((uint8_t *)db->entries + info->nentries * entrysize,
30246d82e2eStedu 	    entry, entrysize);
30346d82e2eStedu 	info->nentries++;
30446d82e2eStedu 	return 0;
30546d82e2eStedu }
306076d2e27Sguenther DEF_WEAK(icdb_add);
30746d82e2eStedu 
30846d82e2eStedu int
icdb_rehash(struct icdb * db)30946d82e2eStedu icdb_rehash(struct icdb *db)
31046d82e2eStedu {
31146d82e2eStedu 	struct icdbinfo *info = db->info;
31246d82e2eStedu 	uint32_t entrysize = info->entrysize;
31346d82e2eStedu 	uint32_t indexsize, idxmask, idxlen;
31446d82e2eStedu 	int i, j;
31546d82e2eStedu 
31646d82e2eStedu 	indexsize = info->indexsize = roundup(info->nentries);
31746d82e2eStedu 	idxmask = indexsize - 1;
31846d82e2eStedu 	idxlen = sizeof(uint32_t) * indexsize;
31946d82e2eStedu 
32046d82e2eStedu 	arc4random_buf(&info->siphashkey, sizeof(info->siphashkey));
32146d82e2eStedu 
32246d82e2eStedu 	for (i = 0; i < info->nkeys; i++) {
32346d82e2eStedu 		uint32_t *idxdata = reallocarray(db->idxdata[i],
32446d82e2eStedu 		    indexsize, sizeof(uint32_t));
32546d82e2eStedu 		if (!idxdata)
32646d82e2eStedu 			return -1;
32746d82e2eStedu 		memset(idxdata, 0xff, idxlen);
32846d82e2eStedu 		db->idxdata[i] = idxdata;
32946d82e2eStedu 	}
33046d82e2eStedu 	for (j = 0; j < info->nentries; j++) {
33146d82e2eStedu 		for (i = 0; i < info->nkeys; i++) {
33246d82e2eStedu 			uint32_t *idxdata = db->idxdata[i];
33346d82e2eStedu 			uint64_t hash = SipHash24(&info->siphashkey,
33446d82e2eStedu 			    (uint8_t *)db->entries + j * entrysize +
33546d82e2eStedu 			    info->keyoffset[i], info->keysize[i]);
33646d82e2eStedu 			while (idxdata[hash & idxmask] != -1)
33746d82e2eStedu 				hash = SipHash24(&info->siphashkey, &hash, sizeof(hash));
33846d82e2eStedu 			idxdata[hash & idxmask] = j;
33946d82e2eStedu 		}
34046d82e2eStedu 	}
34146d82e2eStedu 	return 0;
34246d82e2eStedu }
343076d2e27Sguenther DEF_WEAK(icdb_rehash);
34446d82e2eStedu 
34546d82e2eStedu int
icdb_save(struct icdb * db,int fd)34646d82e2eStedu icdb_save(struct icdb *db, int fd)
34746d82e2eStedu {
34846d82e2eStedu 	struct icdbinfo *info = db->info;
34946d82e2eStedu 	uint32_t entrysize = info->entrysize;
35046d82e2eStedu 	uint32_t indexsize, idxlen;
35146d82e2eStedu 	int i;
35246d82e2eStedu 
35346d82e2eStedu 	if (icdb_rehash(db) != 0)
35446d82e2eStedu 		return -1;
35546d82e2eStedu 
35646d82e2eStedu 	indexsize = info->indexsize;
35746d82e2eStedu 	idxlen = sizeof(uint32_t) * indexsize;
35846d82e2eStedu 
35946d82e2eStedu 	if (ftruncate(fd, 0) != 0)
36046d82e2eStedu 		return -1;
36146d82e2eStedu 	if (write(fd, info, sizeof(*info)) != sizeof(*info))
36246d82e2eStedu 		return -1;
36346d82e2eStedu 	for (i = 0; i < info->nkeys; i++) {
36446d82e2eStedu 		if (write(fd, db->idxdata[i], idxlen) != idxlen)
36546d82e2eStedu 			return -1;
36646d82e2eStedu 	}
36746d82e2eStedu 	if (write(fd, db->entries, info->nentries * entrysize) !=
36846d82e2eStedu 	    info->nentries * entrysize)
36946d82e2eStedu 		return -1;
37046d82e2eStedu 	return 0;
37146d82e2eStedu }
372076d2e27Sguenther DEF_WEAK(icdb_save);
37346d82e2eStedu 
37446d82e2eStedu int
icdb_close(struct icdb * db)37546d82e2eStedu icdb_close(struct icdb *db)
37646d82e2eStedu {
37746d82e2eStedu 	int i;
37846d82e2eStedu 
37946d82e2eStedu 	if (db->fd == -1) {
38046d82e2eStedu 		for (i = 0; i < db->info->nkeys; i++)
38146d82e2eStedu 			free(db->idxdata[i]);
38246d82e2eStedu 		free(db->entries);
38346d82e2eStedu 		free(db->info);
38446d82e2eStedu 	} else {
38546d82e2eStedu 		munmap(db->info, db->maplen);
38646d82e2eStedu 		close(db->fd);
38746d82e2eStedu 	}
38846d82e2eStedu 	free(db);
38946d82e2eStedu 	return 0;
39046d82e2eStedu }
391076d2e27Sguenther DEF_WEAK(icdb_close);
392