tsan/rtl/tsan_dense_alloc.h

3cab2bb3Spatrick//===-- tsan_dense_alloc.h --------------------------------------*- C++ -*-===//
3cab2bb3Spatrick//
3cab2bb3Spatrick// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
3cab2bb3Spatrick// See https://llvm.org/LICENSE.txt for license information.
3cab2bb3Spatrick// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
3cab2bb3Spatrick//
3cab2bb3Spatrick//===----------------------------------------------------------------------===//
3cab2bb3Spatrick//
3cab2bb3Spatrick// This file is a part of ThreadSanitizer (TSan), a race detector.
3cab2bb3Spatrick//
3cab2bb3Spatrick// A DenseSlabAlloc is a freelist-based allocator of fixed-size objects.
3cab2bb3Spatrick// DenseSlabAllocCache is a thread-local cache for DenseSlabAlloc.
3cab2bb3Spatrick// The only difference with traditional slab allocators is that DenseSlabAlloc
3cab2bb3Spatrick// allocates/free indices of objects and provide a functionality to map
3cab2bb3Spatrick// the index onto the real pointer. The index is u32, that is, 2 times smaller
3cab2bb3Spatrick// than uptr (hense the Dense prefix).
3cab2bb3Spatrick//===----------------------------------------------------------------------===//
3cab2bb3Spatrick#ifndef TSAN_DENSE_ALLOC_H
3cab2bb3Spatrick#define TSAN_DENSE_ALLOC_H
3cab2bb3Spatrick
3cab2bb3Spatrick#include "sanitizer_common/sanitizer_common.h"
3cab2bb3Spatrick#include "tsan_defs.h"
3cab2bb3Spatrick
3cab2bb3Spatricknamespace __tsan {
3cab2bb3Spatrick
3cab2bb3Spatrickclass DenseSlabAllocCache {
3cab2bb3Spatrick  static const uptr kSize = 128;
3cab2bb3Spatrick  typedef u32 IndexT;
3cab2bb3Spatrick  uptr pos;
3cab2bb3Spatrick  IndexT cache[kSize];
d89ec533Spatrick  template <typename, uptr, uptr, u64>
d89ec533Spatrick  friend class DenseSlabAlloc;
3cab2bb3Spatrick};
3cab2bb3Spatrick
d89ec533Spatricktemplate <typename T, uptr kL1Size, uptr kL2Size, u64 kReserved = 0>
3cab2bb3Spatrickclass DenseSlabAlloc {
3cab2bb3Spatrick public:
3cab2bb3Spatrick  typedef DenseSlabAllocCache Cache;
3cab2bb3Spatrick  typedef typename Cache::IndexT IndexT;
3cab2bb3Spatrick
d89ec533Spatrick  static_assert((kL1Size & (kL1Size - 1)) == 0,
d89ec533Spatrick                "kL1Size must be a power-of-two");
d89ec533Spatrick  static_assert((kL2Size & (kL2Size - 1)) == 0,
d89ec533Spatrick                "kL2Size must be a power-of-two");
d89ec533Spatrick  static_assert((kL1Size * kL2Size) <= (1ull << (sizeof(IndexT) * 8)),
d89ec533Spatrick                "kL1Size/kL2Size are too large");
d89ec533Spatrick  static_assert(((kL1Size * kL2Size - 1) & kReserved) == 0,
d89ec533Spatrick                "reserved bits don't fit");
d89ec533Spatrick  static_assert(sizeof(T) > sizeof(IndexT),
d89ec533Spatrick                "it doesn't make sense to use dense alloc");
d89ec533Spatrick
*810390e3Srobert  DenseSlabAlloc(LinkerInitialized, const char *name) : name_(name) {}
3cab2bb3Spatrick
d89ec533Spatrick  explicit DenseSlabAlloc(const char *name)
d89ec533Spatrick      : DenseSlabAlloc(LINKER_INITIALIZED, name) {
d89ec533Spatrick    // It can be very large.
d89ec533Spatrick    // Don't page it in for linker initialized objects.
d89ec533Spatrick    internal_memset(map_, 0, sizeof(map_));
d89ec533Spatrick  }
d89ec533Spatrick
3cab2bb3Spatrick  ~DenseSlabAlloc() {
3cab2bb3Spatrick    for (uptr i = 0; i < kL1Size; i++) {
3cab2bb3Spatrick      if (map_[i] != 0)
3cab2bb3Spatrick        UnmapOrDie(map_[i], kL2Size * sizeof(T));
3cab2bb3Spatrick    }
3cab2bb3Spatrick  }
3cab2bb3Spatrick
3cab2bb3Spatrick  IndexT Alloc(Cache *c) {
3cab2bb3Spatrick    if (c->pos == 0)
3cab2bb3Spatrick      Refill(c);
3cab2bb3Spatrick    return c->cache[--c->pos];
3cab2bb3Spatrick  }
3cab2bb3Spatrick
3cab2bb3Spatrick  void Free(Cache *c, IndexT idx) {
3cab2bb3Spatrick    DCHECK_NE(idx, 0);
3cab2bb3Spatrick    if (c->pos == Cache::kSize)
3cab2bb3Spatrick      Drain(c);
3cab2bb3Spatrick    c->cache[c->pos++] = idx;
3cab2bb3Spatrick  }
3cab2bb3Spatrick
3cab2bb3Spatrick  T *Map(IndexT idx) {
3cab2bb3Spatrick    DCHECK_NE(idx, 0);
3cab2bb3Spatrick    DCHECK_LE(idx, kL1Size * kL2Size);
3cab2bb3Spatrick    return &map_[idx / kL2Size][idx % kL2Size];
3cab2bb3Spatrick  }
3cab2bb3Spatrick
3cab2bb3Spatrick  void FlushCache(Cache *c) {
*810390e3Srobert    while (c->pos) Drain(c);
3cab2bb3Spatrick  }
3cab2bb3Spatrick
3cab2bb3Spatrick  void InitCache(Cache *c) {
3cab2bb3Spatrick    c->pos = 0;
3cab2bb3Spatrick    internal_memset(c->cache, 0, sizeof(c->cache));
3cab2bb3Spatrick  }
3cab2bb3Spatrick
*810390e3Srobert  uptr AllocatedMemory() const {
*810390e3Srobert    return atomic_load_relaxed(&fillpos_) * kL2Size * sizeof(T);
*810390e3Srobert  }
*810390e3Srobert
*810390e3Srobert  template <typename Func>
*810390e3Srobert  void ForEach(Func func) {
*810390e3Srobert    Lock lock(&mtx_);
*810390e3Srobert    uptr fillpos = atomic_load_relaxed(&fillpos_);
*810390e3Srobert    for (uptr l1 = 0; l1 < fillpos; l1++) {
*810390e3Srobert      for (IndexT l2 = l1 == 0 ? 1 : 0; l2 < kL2Size; l2++) func(&map_[l1][l2]);
*810390e3Srobert    }
*810390e3Srobert  }
*810390e3Srobert
3cab2bb3Spatrick private:
3cab2bb3Spatrick  T *map_[kL1Size];
*810390e3Srobert  Mutex mtx_;
*810390e3Srobert  // The freelist is organized as a lock-free stack of batches of nodes.
*810390e3Srobert  // The stack itself uses Block::next links, while the batch within each
*810390e3Srobert  // stack node uses Block::batch links.
*810390e3Srobert  // Low 32-bits of freelist_ is the node index, top 32-bits is ABA-counter.
*810390e3Srobert  atomic_uint64_t freelist_ = {0};
*810390e3Srobert  atomic_uintptr_t fillpos_ = {0};
*810390e3Srobert  const char *const name_;
3cab2bb3Spatrick
*810390e3Srobert  struct Block {
*810390e3Srobert    IndexT next;
*810390e3Srobert    IndexT batch;
*810390e3Srobert  };
*810390e3Srobert
*810390e3Srobert  Block *MapBlock(IndexT idx) { return reinterpret_cast<Block *>(Map(idx)); }
*810390e3Srobert
*810390e3Srobert  static constexpr u64 kCounterInc = 1ull << 32;
*810390e3Srobert  static constexpr u64 kCounterMask = ~(kCounterInc - 1);
*810390e3Srobert
*810390e3Srobert  NOINLINE void Refill(Cache *c) {
*810390e3Srobert    // Pop 1 batch of nodes from the freelist.
*810390e3Srobert    IndexT idx;
*810390e3Srobert    u64 xchg;
*810390e3Srobert    u64 cmp = atomic_load(&freelist_, memory_order_acquire);
*810390e3Srobert    do {
*810390e3Srobert      idx = static_cast<IndexT>(cmp);
*810390e3Srobert      if (!idx)
*810390e3Srobert        return AllocSuperBlock(c);
*810390e3Srobert      Block *ptr = MapBlock(idx);
*810390e3Srobert      xchg = ptr->next | (cmp & kCounterMask);
*810390e3Srobert    } while (!atomic_compare_exchange_weak(&freelist_, &cmp, xchg,
*810390e3Srobert                                           memory_order_acq_rel));
*810390e3Srobert    // Unpack it into c->cache.
*810390e3Srobert    while (idx) {
*810390e3Srobert      c->cache[c->pos++] = idx;
*810390e3Srobert      idx = MapBlock(idx)->batch;
*810390e3Srobert    }
*810390e3Srobert  }
*810390e3Srobert
*810390e3Srobert  NOINLINE void Drain(Cache *c) {
*810390e3Srobert    // Build a batch of at most Cache::kSize / 2 nodes linked by Block::batch.
*810390e3Srobert    IndexT head_idx = 0;
*810390e3Srobert    for (uptr i = 0; i < Cache::kSize / 2 && c->pos; i++) {
*810390e3Srobert      IndexT idx = c->cache[--c->pos];
*810390e3Srobert      Block *ptr = MapBlock(idx);
*810390e3Srobert      ptr->batch = head_idx;
*810390e3Srobert      head_idx = idx;
*810390e3Srobert    }
*810390e3Srobert    // Push it onto the freelist stack.
*810390e3Srobert    Block *head = MapBlock(head_idx);
*810390e3Srobert    u64 xchg;
*810390e3Srobert    u64 cmp = atomic_load(&freelist_, memory_order_acquire);
*810390e3Srobert    do {
*810390e3Srobert      head->next = static_cast<IndexT>(cmp);
*810390e3Srobert      xchg = head_idx | (cmp & kCounterMask) + kCounterInc;
*810390e3Srobert    } while (!atomic_compare_exchange_weak(&freelist_, &cmp, xchg,
*810390e3Srobert                                           memory_order_acq_rel));
*810390e3Srobert  }
*810390e3Srobert
*810390e3Srobert  NOINLINE void AllocSuperBlock(Cache *c) {
*810390e3Srobert    Lock lock(&mtx_);
*810390e3Srobert    uptr fillpos = atomic_load_relaxed(&fillpos_);
*810390e3Srobert    if (fillpos == kL1Size) {
*810390e3Srobert      Printf("ThreadSanitizer: %s overflow (%zu*%zu). Dying.\n", name_, kL1Size,
*810390e3Srobert             kL2Size);
3cab2bb3Spatrick      Die();
3cab2bb3Spatrick    }
*810390e3Srobert    VPrintf(2, "ThreadSanitizer: growing %s: %zu out of %zu*%zu\n", name_,
*810390e3Srobert            fillpos, kL1Size, kL2Size);
3cab2bb3Spatrick    T *batch = (T *)MmapOrDie(kL2Size * sizeof(T), name_);
*810390e3Srobert    map_[fillpos] = batch;
3cab2bb3Spatrick    // Reserve 0 as invalid index.
*810390e3Srobert    for (IndexT i = fillpos ? 0 : 1; i < kL2Size; i++) {
3cab2bb3Spatrick      new (batch + i) T;
*810390e3Srobert      c->cache[c->pos++] = i + fillpos * kL2Size;
*810390e3Srobert      if (c->pos == Cache::kSize)
*810390e3Srobert        Drain(c);
3cab2bb3Spatrick    }
*810390e3Srobert    atomic_store_relaxed(&fillpos_, fillpos + 1);
*810390e3Srobert    CHECK(c->pos);
3cab2bb3Spatrick  }
3cab2bb3Spatrick};
3cab2bb3Spatrick
3cab2bb3Spatrick}  // namespace __tsan
3cab2bb3Spatrick
3cab2bb3Spatrick#endif  // TSAN_DENSE_ALLOC_H