docs/DesignDocs/AtomicDesign.rst

*76d0caaeSpatrick
*76d0caaeSpatrick====================
*76d0caaeSpatrick``<atomic>`` Design
*76d0caaeSpatrick====================
*76d0caaeSpatrick
*76d0caaeSpatrickThere were originally 3 designs under consideration. They differ in where most
*76d0caaeSpatrickof the implementation work is done. The functionality exposed to the customer
*76d0caaeSpatrickshould be identical (and conforming) for all three designs.
*76d0caaeSpatrick
*76d0caaeSpatrick
*76d0caaeSpatrickDesign A: Minimal work for the library
*76d0caaeSpatrick======================================
*76d0caaeSpatrickThe compiler supplies all of the intrinsics as described below. This list of
*76d0caaeSpatrickintrinsics roughly parallels the requirements of the C and C++ atomics proposals.
*76d0caaeSpatrickThe C and C++ library implementations simply drop through to these intrinsics.
*76d0caaeSpatrickAnything the platform does not support in hardware, the compiler
*76d0caaeSpatrickarranges for a (compiler-rt) library call to be made which will do the job with
*76d0caaeSpatricka mutex, and in this case ignoring the memory ordering parameter (effectively
*76d0caaeSpatrickimplementing ``memory_order_seq_cst``).
*76d0caaeSpatrick
*76d0caaeSpatrickUltimate efficiency is preferred over run time error checking. Undefined
*76d0caaeSpatrickbehavior is acceptable when the inputs do not conform as defined below.
*76d0caaeSpatrick
*76d0caaeSpatrick.. code-block:: cpp
*76d0caaeSpatrick
*76d0caaeSpatrick    // In every intrinsic signature below, type* atomic_obj may be a pointer to a
*76d0caaeSpatrick    // volatile-qualified type. Memory ordering values map to the following meanings:
*76d0caaeSpatrick    //  memory_order_relaxed == 0
*76d0caaeSpatrick    //  memory_order_consume == 1
*76d0caaeSpatrick    //  memory_order_acquire == 2
*76d0caaeSpatrick    //  memory_order_release == 3
*76d0caaeSpatrick    //  memory_order_acq_rel == 4
*76d0caaeSpatrick    //  memory_order_seq_cst == 5
*76d0caaeSpatrick
*76d0caaeSpatrick    // type must be trivially copyable
*76d0caaeSpatrick    // type represents a "type argument"
*76d0caaeSpatrick    bool __atomic_is_lock_free(type);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type must be trivially copyable
*76d0caaeSpatrick    // Behavior is defined for mem_ord = 0, 1, 2, 5
*76d0caaeSpatrick    type __atomic_load(const type* atomic_obj, int mem_ord);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type must be trivially copyable
*76d0caaeSpatrick    // Behavior is defined for mem_ord = 0, 3, 5
*76d0caaeSpatrick    void __atomic_store(type* atomic_obj, type desired, int mem_ord);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type must be trivially copyable
*76d0caaeSpatrick    // Behavior is defined for mem_ord = [0 ... 5]
*76d0caaeSpatrick    type __atomic_exchange(type* atomic_obj, type desired, int mem_ord);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type must be trivially copyable
*76d0caaeSpatrick    // Behavior is defined for mem_success = [0 ... 5],
*76d0caaeSpatrick    //   mem_failure <= mem_success
*76d0caaeSpatrick    //   mem_failure != 3
*76d0caaeSpatrick    //   mem_failure != 4
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong(type* atomic_obj,
*76d0caaeSpatrick                                        type* expected, type desired,
*76d0caaeSpatrick                                        int mem_success, int mem_failure);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type must be trivially copyable
*76d0caaeSpatrick    // Behavior is defined for mem_success = [0 ... 5],
*76d0caaeSpatrick    //   mem_failure <= mem_success
*76d0caaeSpatrick    //   mem_failure != 3
*76d0caaeSpatrick    //   mem_failure != 4
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak(type* atomic_obj,
*76d0caaeSpatrick                                        type* expected, type desired,
*76d0caaeSpatrick                                        int mem_success, int mem_failure);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type is one of: char, signed char, unsigned char, short, unsigned short, int,
*76d0caaeSpatrick    //      unsigned int, long, unsigned long, long long, unsigned long long,
*76d0caaeSpatrick    //      char16_t, char32_t, wchar_t
*76d0caaeSpatrick    // Behavior is defined for mem_ord = [0 ... 5]
*76d0caaeSpatrick    type __atomic_fetch_add(type* atomic_obj, type operand, int mem_ord);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type is one of: char, signed char, unsigned char, short, unsigned short, int,
*76d0caaeSpatrick    //      unsigned int, long, unsigned long, long long, unsigned long long,
*76d0caaeSpatrick    //      char16_t, char32_t, wchar_t
*76d0caaeSpatrick    // Behavior is defined for mem_ord = [0 ... 5]
*76d0caaeSpatrick    type __atomic_fetch_sub(type* atomic_obj, type operand, int mem_ord);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type is one of: char, signed char, unsigned char, short, unsigned short, int,
*76d0caaeSpatrick    //      unsigned int, long, unsigned long, long long, unsigned long long,
*76d0caaeSpatrick    //      char16_t, char32_t, wchar_t
*76d0caaeSpatrick    // Behavior is defined for mem_ord = [0 ... 5]
*76d0caaeSpatrick    type __atomic_fetch_and(type* atomic_obj, type operand, int mem_ord);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type is one of: char, signed char, unsigned char, short, unsigned short, int,
*76d0caaeSpatrick    //      unsigned int, long, unsigned long, long long, unsigned long long,
*76d0caaeSpatrick    //      char16_t, char32_t, wchar_t
*76d0caaeSpatrick    // Behavior is defined for mem_ord = [0 ... 5]
*76d0caaeSpatrick    type __atomic_fetch_or(type* atomic_obj, type operand, int mem_ord);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type is one of: char, signed char, unsigned char, short, unsigned short, int,
*76d0caaeSpatrick    //      unsigned int, long, unsigned long, long long, unsigned long long,
*76d0caaeSpatrick    //      char16_t, char32_t, wchar_t
*76d0caaeSpatrick    // Behavior is defined for mem_ord = [0 ... 5]
*76d0caaeSpatrick    type __atomic_fetch_xor(type* atomic_obj, type operand, int mem_ord);
*76d0caaeSpatrick
*76d0caaeSpatrick    // Behavior is defined for mem_ord = [0 ... 5]
*76d0caaeSpatrick    void* __atomic_fetch_add(void** atomic_obj, ptrdiff_t operand, int mem_ord);
*76d0caaeSpatrick    void* __atomic_fetch_sub(void** atomic_obj, ptrdiff_t operand, int mem_ord);
*76d0caaeSpatrick
*76d0caaeSpatrick    // Behavior is defined for mem_ord = [0 ... 5]
*76d0caaeSpatrick    void __atomic_thread_fence(int mem_ord);
*76d0caaeSpatrick    void __atomic_signal_fence(int mem_ord);
*76d0caaeSpatrick
*76d0caaeSpatrickIf desired the intrinsics taking a single ``mem_ord`` parameter can default
*76d0caaeSpatrickthis argument to 5.
*76d0caaeSpatrick
*76d0caaeSpatrickIf desired the intrinsics taking two ordering parameters can default ``mem_success``
*76d0caaeSpatrickto 5, and ``mem_failure`` to ``translate_memory_order(mem_success)`` where
*76d0caaeSpatrick``translate_memory_order(mem_success)`` is defined as:
*76d0caaeSpatrick
*76d0caaeSpatrick.. code-block:: cpp
*76d0caaeSpatrick
*76d0caaeSpatrick    int translate_memory_order(int o) {
*76d0caaeSpatrick        switch (o) {
*76d0caaeSpatrick        case 4:
*76d0caaeSpatrick            return 2;
*76d0caaeSpatrick        case 3:
*76d0caaeSpatrick            return 0;
*76d0caaeSpatrick        }
*76d0caaeSpatrick        return o;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrickBelow are representative C++ implementations of all of the operations. Their
*76d0caaeSpatrickpurpose is to document the desired semantics of each operation, assuming
*76d0caaeSpatrick``memory_order_seq_cst``. This is essentially the code that will be called
*76d0caaeSpatrickif the front end calls out to compiler-rt.
*76d0caaeSpatrick
*76d0caaeSpatrick.. code-block:: cpp
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    T __atomic_load(T const volatile* obj) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        return *obj;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    void __atomic_store(T volatile* obj, T desr) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        *obj = desr;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    T __atomic_exchange(T volatile* obj, T desr) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        T r = *obj;
*76d0caaeSpatrick        *obj = desr;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong(T volatile* obj, T* exp, T desr) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        if (std::memcmp(const_cast<T*>(obj), exp, sizeof(T)) == 0) // if (*obj == *exp)
*76d0caaeSpatrick        {
*76d0caaeSpatrick            std::memcpy(const_cast<T*>(obj), &desr, sizeof(T)); // *obj = desr;
*76d0caaeSpatrick            return true;
*76d0caaeSpatrick        }
*76d0caaeSpatrick        std::memcpy(exp, const_cast<T*>(obj), sizeof(T)); // *exp = *obj;
*76d0caaeSpatrick        return false;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    // May spuriously return false (even if *obj == *exp)
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak(T volatile* obj, T* exp, T desr) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        if (std::memcmp(const_cast<T*>(obj), exp, sizeof(T)) == 0) // if (*obj == *exp)
*76d0caaeSpatrick        {
*76d0caaeSpatrick            std::memcpy(const_cast<T*>(obj), &desr, sizeof(T)); // *obj = desr;
*76d0caaeSpatrick            return true;
*76d0caaeSpatrick        }
*76d0caaeSpatrick        std::memcpy(exp, const_cast<T*>(obj), sizeof(T)); // *exp = *obj;
*76d0caaeSpatrick        return false;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    T __atomic_fetch_add(T volatile* obj, T operand) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        T r = *obj;
*76d0caaeSpatrick        *obj += operand;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    T __atomic_fetch_sub(T volatile* obj, T operand) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        T r = *obj;
*76d0caaeSpatrick        *obj -= operand;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    T __atomic_fetch_and(T volatile* obj, T operand) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        T r = *obj;
*76d0caaeSpatrick        *obj &= operand;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    T __atomic_fetch_or(T volatile* obj, T operand) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        T r = *obj;
*76d0caaeSpatrick        *obj |= operand;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    T __atomic_fetch_xor(T volatile* obj, T operand) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        T r = *obj;
*76d0caaeSpatrick        *obj ^= operand;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    void* __atomic_fetch_add(void* volatile* obj, ptrdiff_t operand) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        void* r = *obj;
*76d0caaeSpatrick        (char*&)(*obj) += operand;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    void* __atomic_fetch_sub(void* volatile* obj, ptrdiff_t operand) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        void* r = *obj;
*76d0caaeSpatrick        (char*&)(*obj) -= operand;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    void __atomic_thread_fence() {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    void __atomic_signal_fence() {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick
*76d0caaeSpatrickDesign B: Something in between
*76d0caaeSpatrick==============================
*76d0caaeSpatrickThis is a variation of design A which puts the burden on the library to arrange
*76d0caaeSpatrickfor the correct manipulation of the run time memory ordering arguments, and only
*76d0caaeSpatrickcalls the compiler for well-defined memory orderings. I think of this design as
*76d0caaeSpatrickthe worst of A and C, instead of the best of A and C. But I offer it as an
*76d0caaeSpatrickoption in the spirit of completeness.
*76d0caaeSpatrick
*76d0caaeSpatrick.. code-block:: cpp
*76d0caaeSpatrick
*76d0caaeSpatrick    // type must be trivially copyable
*76d0caaeSpatrick    bool __atomic_is_lock_free(const type* atomic_obj);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type must be trivially copyable
*76d0caaeSpatrick    type __atomic_load_relaxed(const volatile type* atomic_obj);
*76d0caaeSpatrick    type __atomic_load_consume(const volatile type* atomic_obj);
*76d0caaeSpatrick    type __atomic_load_acquire(const volatile type* atomic_obj);
*76d0caaeSpatrick    type __atomic_load_seq_cst(const volatile type* atomic_obj);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type must be trivially copyable
*76d0caaeSpatrick    type __atomic_store_relaxed(volatile type* atomic_obj, type desired);
*76d0caaeSpatrick    type __atomic_store_release(volatile type* atomic_obj, type desired);
*76d0caaeSpatrick    type __atomic_store_seq_cst(volatile type* atomic_obj, type desired);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type must be trivially copyable
*76d0caaeSpatrick    type __atomic_exchange_relaxed(volatile type* atomic_obj, type desired);
*76d0caaeSpatrick    type __atomic_exchange_consume(volatile type* atomic_obj, type desired);
*76d0caaeSpatrick    type __atomic_exchange_acquire(volatile type* atomic_obj, type desired);
*76d0caaeSpatrick    type __atomic_exchange_release(volatile type* atomic_obj, type desired);
*76d0caaeSpatrick    type __atomic_exchange_acq_rel(volatile type* atomic_obj, type desired);
*76d0caaeSpatrick    type __atomic_exchange_seq_cst(volatile type* atomic_obj, type desired);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type must be trivially copyable
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_relaxed_relaxed(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_consume_relaxed(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_consume_consume(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_acquire_relaxed(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_acquire_consume(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_acquire_acquire(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_release_relaxed(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_release_consume(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_release_acquire(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_acq_rel_relaxed(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_acq_rel_consume(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_acq_rel_acquire(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_seq_cst_relaxed(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_seq_cst_consume(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_seq_cst_acquire(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_seq_cst_seq_cst(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type must be trivially copyable
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_relaxed_relaxed(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_consume_relaxed(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_consume_consume(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_acquire_relaxed(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_acquire_consume(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_acquire_acquire(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_release_relaxed(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_release_consume(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_release_acquire(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_acq_rel_relaxed(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_acq_rel_consume(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_acq_rel_acquire(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_seq_cst_relaxed(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_seq_cst_consume(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_seq_cst_acquire(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_seq_cst_seq_cst(volatile type* atomic_obj,
*76d0caaeSpatrick                                                        type* expected,
*76d0caaeSpatrick                                                        type desired);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type is one of: char, signed char, unsigned char, short, unsigned short, int,
*76d0caaeSpatrick    //      unsigned int, long, unsigned long, long long, unsigned long long,
*76d0caaeSpatrick    //      char16_t, char32_t, wchar_t
*76d0caaeSpatrick    type __atomic_fetch_add_relaxed(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_add_consume(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_add_acquire(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_add_release(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_add_acq_rel(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_add_seq_cst(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type is one of: char, signed char, unsigned char, short, unsigned short, int,
*76d0caaeSpatrick    //      unsigned int, long, unsigned long, long long, unsigned long long,
*76d0caaeSpatrick    //      char16_t, char32_t, wchar_t
*76d0caaeSpatrick    type __atomic_fetch_sub_relaxed(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_sub_consume(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_sub_acquire(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_sub_release(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_sub_acq_rel(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_sub_seq_cst(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type is one of: char, signed char, unsigned char, short, unsigned short, int,
*76d0caaeSpatrick    //      unsigned int, long, unsigned long, long long, unsigned long long,
*76d0caaeSpatrick    //      char16_t, char32_t, wchar_t
*76d0caaeSpatrick    type __atomic_fetch_and_relaxed(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_and_consume(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_and_acquire(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_and_release(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_and_acq_rel(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_and_seq_cst(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type is one of: char, signed char, unsigned char, short, unsigned short, int,
*76d0caaeSpatrick    //      unsigned int, long, unsigned long, long long, unsigned long long,
*76d0caaeSpatrick    //      char16_t, char32_t, wchar_t
*76d0caaeSpatrick    type __atomic_fetch_or_relaxed(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_or_consume(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_or_acquire(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_or_release(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_or_acq_rel(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_or_seq_cst(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick
*76d0caaeSpatrick    // type is one of: char, signed char, unsigned char, short, unsigned short, int,
*76d0caaeSpatrick    //      unsigned int, long, unsigned long, long long, unsigned long long,
*76d0caaeSpatrick    //      char16_t, char32_t, wchar_t
*76d0caaeSpatrick    type __atomic_fetch_xor_relaxed(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_xor_consume(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_xor_acquire(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_xor_release(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_xor_acq_rel(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick    type __atomic_fetch_xor_seq_cst(volatile type* atomic_obj, type operand);
*76d0caaeSpatrick
*76d0caaeSpatrick    void* __atomic_fetch_add_relaxed(void* volatile* atomic_obj, ptrdiff_t operand);
*76d0caaeSpatrick    void* __atomic_fetch_add_consume(void* volatile* atomic_obj, ptrdiff_t operand);
*76d0caaeSpatrick    void* __atomic_fetch_add_acquire(void* volatile* atomic_obj, ptrdiff_t operand);
*76d0caaeSpatrick    void* __atomic_fetch_add_release(void* volatile* atomic_obj, ptrdiff_t operand);
*76d0caaeSpatrick    void* __atomic_fetch_add_acq_rel(void* volatile* atomic_obj, ptrdiff_t operand);
*76d0caaeSpatrick    void* __atomic_fetch_add_seq_cst(void* volatile* atomic_obj, ptrdiff_t operand);
*76d0caaeSpatrick
*76d0caaeSpatrick    void* __atomic_fetch_sub_relaxed(void* volatile* atomic_obj, ptrdiff_t operand);
*76d0caaeSpatrick    void* __atomic_fetch_sub_consume(void* volatile* atomic_obj, ptrdiff_t operand);
*76d0caaeSpatrick    void* __atomic_fetch_sub_acquire(void* volatile* atomic_obj, ptrdiff_t operand);
*76d0caaeSpatrick    void* __atomic_fetch_sub_release(void* volatile* atomic_obj, ptrdiff_t operand);
*76d0caaeSpatrick    void* __atomic_fetch_sub_acq_rel(void* volatile* atomic_obj, ptrdiff_t operand);
*76d0caaeSpatrick    void* __atomic_fetch_sub_seq_cst(void* volatile* atomic_obj, ptrdiff_t operand);
*76d0caaeSpatrick
*76d0caaeSpatrick    void __atomic_thread_fence_relaxed();
*76d0caaeSpatrick    void __atomic_thread_fence_consume();
*76d0caaeSpatrick    void __atomic_thread_fence_acquire();
*76d0caaeSpatrick    void __atomic_thread_fence_release();
*76d0caaeSpatrick    void __atomic_thread_fence_acq_rel();
*76d0caaeSpatrick    void __atomic_thread_fence_seq_cst();
*76d0caaeSpatrick
*76d0caaeSpatrick    void __atomic_signal_fence_relaxed();
*76d0caaeSpatrick    void __atomic_signal_fence_consume();
*76d0caaeSpatrick    void __atomic_signal_fence_acquire();
*76d0caaeSpatrick    void __atomic_signal_fence_release();
*76d0caaeSpatrick    void __atomic_signal_fence_acq_rel();
*76d0caaeSpatrick    void __atomic_signal_fence_seq_cst();
*76d0caaeSpatrick
*76d0caaeSpatrickDesign C: Minimal work for the front end
*76d0caaeSpatrick========================================
*76d0caaeSpatrickThe ``<atomic>`` header is one of the most closely coupled headers to the compiler.
*76d0caaeSpatrickIdeally when you invoke any function from ``<atomic>``, it should result in highly
*76d0caaeSpatrickoptimized assembly being inserted directly into your application -- assembly that
*76d0caaeSpatrickis not otherwise representable by higher level C or C++ expressions. The design of
*76d0caaeSpatrickthe libc++ ``<atomic>`` header started with this goal in mind. A secondary, but
*76d0caaeSpatrickstill very important goal is that the compiler should have to do minimal work to
*76d0caaeSpatrickfacilitate the implementation of ``<atomic>``.  Without this second goal, then
*76d0caaeSpatrickpractically speaking, the libc++ ``<atomic>`` header would be doomed to be a
*76d0caaeSpatrickbarely supported, second class citizen on almost every platform.
*76d0caaeSpatrick
*76d0caaeSpatrickGoals:
*76d0caaeSpatrick
*76d0caaeSpatrick- Optimal code generation for atomic operations
*76d0caaeSpatrick- Minimal effort for the compiler to achieve goal 1 on any given platform
*76d0caaeSpatrick- Conformance to the C++0X draft standard
*76d0caaeSpatrick
*76d0caaeSpatrickThe purpose of this document is to inform compiler writers what they need to do
*76d0caaeSpatrickto enable a high performance libc++ ``<atomic>`` with minimal effort.
*76d0caaeSpatrick
*76d0caaeSpatrickThe minimal work that must be done for a conforming ``<atomic>``
*76d0caaeSpatrick----------------------------------------------------------------
*76d0caaeSpatrickThe only "atomic" operations that must actually be lock free in
*76d0caaeSpatrick``<atomic>`` are represented by the following compiler intrinsics:
*76d0caaeSpatrick
*76d0caaeSpatrick.. code-block:: cpp
*76d0caaeSpatrick
*76d0caaeSpatrick    __atomic_flag__ __atomic_exchange_seq_cst(__atomic_flag__ volatile* obj, __atomic_flag__ desr) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        __atomic_flag__ result = *obj;
*76d0caaeSpatrick        *obj = desr;
*76d0caaeSpatrick        return result;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    void __atomic_store_seq_cst(__atomic_flag__ volatile* obj, __atomic_flag__ desr) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        *obj = desr;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrickWhere:
*76d0caaeSpatrick
*76d0caaeSpatrick- If ``__has_feature(__atomic_flag)`` evaluates to 1 in the preprocessor then
*76d0caaeSpatrick  the compiler must define ``__atomic_flag__`` (e.g. as a typedef to ``int``).
*76d0caaeSpatrick- If ``__has_feature(__atomic_flag)`` evaluates to 0 in the preprocessor then
*76d0caaeSpatrick  the library defines ``__atomic_flag__`` as a typedef to ``bool``.
*76d0caaeSpatrick- To communicate that the above intrinsics are available, the compiler must
*76d0caaeSpatrick  arrange for ``__has_feature`` to return 1 when fed the intrinsic name
*76d0caaeSpatrick  appended with an '_' and the mangled type name of ``__atomic_flag__``.
*76d0caaeSpatrick
*76d0caaeSpatrickFor example if ``__atomic_flag__`` is ``unsigned int``:
*76d0caaeSpatrick
*76d0caaeSpatrick.. code-block:: cpp
*76d0caaeSpatrick
*76d0caaeSpatrick    // __has_feature(__atomic_flag) == 1
*76d0caaeSpatrick    // __has_feature(__atomic_exchange_seq_cst_j) == 1
*76d0caaeSpatrick    // __has_feature(__atomic_store_seq_cst_j) == 1
*76d0caaeSpatrick
*76d0caaeSpatrick    typedef unsigned int __atomic_flag__;
*76d0caaeSpatrick
*76d0caaeSpatrick    unsigned int __atomic_exchange_seq_cst(unsigned int volatile*, unsigned int) {
*76d0caaeSpatrick        // ...
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    void __atomic_store_seq_cst(unsigned int volatile*, unsigned int) {
*76d0caaeSpatrick        // ...
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrickThat's it! Compiler writers do the above and you've got a fully conforming
*76d0caaeSpatrick(though sub-par performance) ``<atomic>`` header!
*76d0caaeSpatrick
*76d0caaeSpatrick
*76d0caaeSpatrickRecommended work for a higher performance ``<atomic>``
*76d0caaeSpatrick------------------------------------------------------
*76d0caaeSpatrickIt would be good if the above intrinsics worked with all integral types plus
*76d0caaeSpatrick``void*``. Because this may not be possible to do in a lock-free manner for
*76d0caaeSpatrickall integral types on all platforms, a compiler must communicate each type that
*76d0caaeSpatrickan intrinsic works with. For example, if ``__atomic_exchange_seq_cst`` works
*76d0caaeSpatrickfor all types except for ``long long`` and ``unsigned long long`` then:
*76d0caaeSpatrick
*76d0caaeSpatrick.. code-block:: cpp
*76d0caaeSpatrick
*76d0caaeSpatrick    __has_feature(__atomic_exchange_seq_cst_b) == 1  // bool
*76d0caaeSpatrick    __has_feature(__atomic_exchange_seq_cst_c) == 1  // char
*76d0caaeSpatrick    __has_feature(__atomic_exchange_seq_cst_a) == 1  // signed char
*76d0caaeSpatrick    __has_feature(__atomic_exchange_seq_cst_h) == 1  // unsigned char
*76d0caaeSpatrick    __has_feature(__atomic_exchange_seq_cst_Ds) == 1 // char16_t
*76d0caaeSpatrick    __has_feature(__atomic_exchange_seq_cst_Di) == 1 // char32_t
*76d0caaeSpatrick    __has_feature(__atomic_exchange_seq_cst_w) == 1  // wchar_t
*76d0caaeSpatrick    __has_feature(__atomic_exchange_seq_cst_s) == 1  // short
*76d0caaeSpatrick    __has_feature(__atomic_exchange_seq_cst_t) == 1  // unsigned short
*76d0caaeSpatrick    __has_feature(__atomic_exchange_seq_cst_i) == 1  // int
*76d0caaeSpatrick    __has_feature(__atomic_exchange_seq_cst_j) == 1  // unsigned int
*76d0caaeSpatrick    __has_feature(__atomic_exchange_seq_cst_l) == 1  // long
*76d0caaeSpatrick    __has_feature(__atomic_exchange_seq_cst_m) == 1  // unsigned long
*76d0caaeSpatrick    __has_feature(__atomic_exchange_seq_cst_Pv) == 1 // void*
*76d0caaeSpatrick
*76d0caaeSpatrickNote that only the ``__has_feature`` flag is decorated with the argument
*76d0caaeSpatricktype. The name of the compiler intrinsic is not decorated, but instead works
*76d0caaeSpatricklike a C++ overloaded function.
*76d0caaeSpatrick
*76d0caaeSpatrickAdditionally, there are other intrinsics besides ``__atomic_exchange_seq_cst``
*76d0caaeSpatrickand ``__atomic_store_seq_cst``. They are optional. But if the compiler can
*76d0caaeSpatrickgenerate faster code than provided by the library, then clients will benefit
*76d0caaeSpatrickfrom the compiler writer's expertise and knowledge of the targeted platform.
*76d0caaeSpatrick
*76d0caaeSpatrickBelow is the complete list of *sequentially consistent* intrinsics, and
*76d0caaeSpatricktheir library implementations. Template syntax is used to indicate the desired
*76d0caaeSpatrickoverloading for integral and ``void*`` types. The template does not represent a
*76d0caaeSpatrickrequirement that the intrinsic operate on **any** type!
*76d0caaeSpatrick
*76d0caaeSpatrick.. code-block:: cpp
*76d0caaeSpatrick
*76d0caaeSpatrick    // T is one of:
*76d0caaeSpatrick    // bool, char, signed char, unsigned char, short, unsigned short,
*76d0caaeSpatrick    // int, unsigned int, long, unsigned long,
*76d0caaeSpatrick    // long long, unsigned long long, char16_t, char32_t, wchar_t, void*
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    T __atomic_load_seq_cst(T const volatile* obj) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        return *obj;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    void __atomic_store_seq_cst(T volatile* obj, T desr) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        *obj = desr;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    T __atomic_exchange_seq_cst(T volatile* obj, T desr) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        T r = *obj;
*76d0caaeSpatrick        *obj = desr;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    bool __atomic_compare_exchange_strong_seq_cst_seq_cst(T volatile* obj, T* exp, T desr) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        if (std::memcmp(const_cast<T*>(obj), exp, sizeof(T)) == 0) {
*76d0caaeSpatrick            std::memcpy(const_cast<T*>(obj), &desr, sizeof(T));
*76d0caaeSpatrick            return true;
*76d0caaeSpatrick        }
*76d0caaeSpatrick        std::memcpy(exp, const_cast<T*>(obj), sizeof(T));
*76d0caaeSpatrick        return false;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    bool __atomic_compare_exchange_weak_seq_cst_seq_cst(T volatile* obj, T* exp, T desr) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        if (std::memcmp(const_cast<T*>(obj), exp, sizeof(T)) == 0)
*76d0caaeSpatrick        {
*76d0caaeSpatrick            std::memcpy(const_cast<T*>(obj), &desr, sizeof(T));
*76d0caaeSpatrick            return true;
*76d0caaeSpatrick        }
*76d0caaeSpatrick        std::memcpy(exp, const_cast<T*>(obj), sizeof(T));
*76d0caaeSpatrick        return false;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    // T is one of:
*76d0caaeSpatrick    // char, signed char, unsigned char, short, unsigned short,
*76d0caaeSpatrick    // int, unsigned int, long, unsigned long,
*76d0caaeSpatrick    // long long, unsigned long long, char16_t, char32_t, wchar_t
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    T __atomic_fetch_add_seq_cst(T volatile* obj, T operand) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        T r = *obj;
*76d0caaeSpatrick        *obj += operand;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    T __atomic_fetch_sub_seq_cst(T volatile* obj, T operand) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        T r = *obj;
*76d0caaeSpatrick        *obj -= operand;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    T __atomic_fetch_and_seq_cst(T volatile* obj, T operand) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        T r = *obj;
*76d0caaeSpatrick        *obj &= operand;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    T __atomic_fetch_or_seq_cst(T volatile* obj, T operand) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        T r = *obj;
*76d0caaeSpatrick        *obj |= operand;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    template <class T>
*76d0caaeSpatrick    T __atomic_fetch_xor_seq_cst(T volatile* obj, T operand) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        T r = *obj;
*76d0caaeSpatrick        *obj ^= operand;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    void* __atomic_fetch_add_seq_cst(void* volatile* obj, ptrdiff_t operand) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        void* r = *obj;
*76d0caaeSpatrick        (char*&)(*obj) += operand;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    void* __atomic_fetch_sub_seq_cst(void* volatile* obj, ptrdiff_t operand) {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick        void* r = *obj;
*76d0caaeSpatrick        (char*&)(*obj) -= operand;
*76d0caaeSpatrick        return r;
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    void __atomic_thread_fence_seq_cst() {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrick    void __atomic_signal_fence_seq_cst() {
*76d0caaeSpatrick        unique_lock<mutex> _(some_mutex);
*76d0caaeSpatrick    }
*76d0caaeSpatrick
*76d0caaeSpatrickOne should consult the (currently draft) `C++ Standard <https://wg21.link/n3126>`_
*76d0caaeSpatrickfor the details of the definitions for these operations. For example,
*76d0caaeSpatrick``__atomic_compare_exchange_weak_seq_cst_seq_cst`` is allowed to fail
*76d0caaeSpatrickspuriously while ``__atomic_compare_exchange_strong_seq_cst_seq_cst`` is not.
*76d0caaeSpatrick
*76d0caaeSpatrickIf on your platform the lock-free definition of ``__atomic_compare_exchange_weak_seq_cst_seq_cst``
*76d0caaeSpatrickwould be the same as ``__atomic_compare_exchange_strong_seq_cst_seq_cst``, you may omit the
*76d0caaeSpatrick``__atomic_compare_exchange_weak_seq_cst_seq_cst`` intrinsic without a performance cost. The
*76d0caaeSpatricklibrary will prefer your implementation of ``__atomic_compare_exchange_strong_seq_cst_seq_cst``
*76d0caaeSpatrickover its own definition for implementing ``__atomic_compare_exchange_weak_seq_cst_seq_cst``.
*76d0caaeSpatrickThat is, the library will arrange for ``__atomic_compare_exchange_weak_seq_cst_seq_cst`` to call
*76d0caaeSpatrick``__atomic_compare_exchange_strong_seq_cst_seq_cst`` if you supply an intrinsic for the strong
*76d0caaeSpatrickversion but not the weak.
*76d0caaeSpatrick
*76d0caaeSpatrickTaking advantage of weaker memory synchronization
*76d0caaeSpatrick-------------------------------------------------
*76d0caaeSpatrickSo far, all of the intrinsics presented require a **sequentially consistent** memory ordering.
*76d0caaeSpatrickThat is, no loads or stores can move across the operation (just as if the library had locked
*76d0caaeSpatrickthat internal mutex). But ``<atomic>`` supports weaker memory ordering operations. In all,
*76d0caaeSpatrickthere are six memory orderings (listed here from strongest to weakest):
*76d0caaeSpatrick
*76d0caaeSpatrick.. code-block:: cpp
*76d0caaeSpatrick
*76d0caaeSpatrick    memory_order_seq_cst
*76d0caaeSpatrick    memory_order_acq_rel
*76d0caaeSpatrick    memory_order_release
*76d0caaeSpatrick    memory_order_acquire
*76d0caaeSpatrick    memory_order_consume
*76d0caaeSpatrick    memory_order_relaxed
*76d0caaeSpatrick
*76d0caaeSpatrick(See the `C++ Standard <https://wg21.link/n3126>`_ for the detailed definitions of each of these orderings).
*76d0caaeSpatrick
*76d0caaeSpatrickOn some platforms, the compiler vendor can offer some or even all of the above
*76d0caaeSpatrickintrinsics at one or more weaker levels of memory synchronization. This might
*76d0caaeSpatricklead for example to not issuing an ``mfence`` instruction on the x86.
*76d0caaeSpatrick
*76d0caaeSpatrickIf the compiler does not offer any given operation, at any given memory ordering
*76d0caaeSpatricklevel, the library will automatically attempt to call the next highest memory
*76d0caaeSpatrickordering operation. This continues up to ``seq_cst``, and if that doesn't
*76d0caaeSpatrickexist, then the library takes over and does the job with a ``mutex``. This
*76d0caaeSpatrickis a compile-time search and selection operation. At run time, the application
*76d0caaeSpatrickwill only see the few inlined assembly instructions for the selected intrinsic.
*76d0caaeSpatrick
*76d0caaeSpatrickEach intrinsic is appended with the 7-letter name of the memory ordering it
*76d0caaeSpatrickaddresses. For example a ``load`` with ``relaxed`` ordering is defined by:
*76d0caaeSpatrick
*76d0caaeSpatrick.. code-block:: cpp
*76d0caaeSpatrick
*76d0caaeSpatrick    T __atomic_load_relaxed(const volatile T* obj);
*76d0caaeSpatrick
*76d0caaeSpatrickAnd announced with:
*76d0caaeSpatrick
*76d0caaeSpatrick.. code-block:: cpp
*76d0caaeSpatrick
*76d0caaeSpatrick    __has_feature(__atomic_load_relaxed_b) == 1  // bool
*76d0caaeSpatrick    __has_feature(__atomic_load_relaxed_c) == 1  // char
*76d0caaeSpatrick    __has_feature(__atomic_load_relaxed_a) == 1  // signed char
*76d0caaeSpatrick    ...
*76d0caaeSpatrick
*76d0caaeSpatrickThe ``__atomic_compare_exchange_strong(weak)`` intrinsics are parameterized
*76d0caaeSpatrickon two memory orderings. The first ordering applies when the operation returns
*76d0caaeSpatrick``true`` and the second ordering applies when the operation returns ``false``.
*76d0caaeSpatrick
*76d0caaeSpatrickNot every memory ordering is appropriate for every operation. ``exchange``
*76d0caaeSpatrickand the ``fetch_XXX`` operations support all 6. But ``load`` only supports
*76d0caaeSpatrick``relaxed``, ``consume``, ``acquire`` and ``seq_cst``. ``store`` only supports
*76d0caaeSpatrick``relaxed``, ``release``, and ``seq_cst``. The ``compare_exchange`` operations
*76d0caaeSpatricksupport the following 16 combinations out of the possible 36:
*76d0caaeSpatrick
*76d0caaeSpatrick.. code-block:: cpp
*76d0caaeSpatrick
*76d0caaeSpatrick    relaxed_relaxed
*76d0caaeSpatrick    consume_relaxed
*76d0caaeSpatrick    consume_consume
*76d0caaeSpatrick    acquire_relaxed
*76d0caaeSpatrick    acquire_consume
*76d0caaeSpatrick    acquire_acquire
*76d0caaeSpatrick    release_relaxed
*76d0caaeSpatrick    release_consume
*76d0caaeSpatrick    release_acquire
*76d0caaeSpatrick    acq_rel_relaxed
*76d0caaeSpatrick    acq_rel_consume
*76d0caaeSpatrick    acq_rel_acquire
*76d0caaeSpatrick    seq_cst_relaxed
*76d0caaeSpatrick    seq_cst_consume
*76d0caaeSpatrick    seq_cst_acquire
*76d0caaeSpatrick    seq_cst_seq_cst
*76d0caaeSpatrick
*76d0caaeSpatrickAgain, the compiler supplies intrinsics only for the strongest orderings where
*76d0caaeSpatrickit can make a difference. The library takes care of calling the weakest
*76d0caaeSpatricksupplied intrinsic that is as strong or stronger than the customer asked for.
*76d0caaeSpatrick
*76d0caaeSpatrickNote about ABI
*76d0caaeSpatrick==============
*76d0caaeSpatrickWith any design, the (back end) compiler writer should note that the decision to
*76d0caaeSpatrickimplement lock-free operations on any given type (or not) is an ABI-binding decision.
*76d0caaeSpatrickOne can not change from treating a type as not lock free, to lock free (or vice-versa)
*76d0caaeSpatrickwithout breaking your ABI.
*76d0caaeSpatrick
*76d0caaeSpatrickFor example:
*76d0caaeSpatrick
*76d0caaeSpatrick**TU1.cpp**:
*76d0caaeSpatrick
*76d0caaeSpatrick.. code-block:: cpp
*76d0caaeSpatrick
*76d0caaeSpatrick    extern atomic<long long> A;
*76d0caaeSpatrick    int foo() { return A.compare_exchange_strong(w, x); }
*76d0caaeSpatrick
*76d0caaeSpatrick
*76d0caaeSpatrick**TU2.cpp**:
*76d0caaeSpatrick
*76d0caaeSpatrick.. code-block:: cpp
*76d0caaeSpatrick
*76d0caaeSpatrick    extern atomic<long long> A;
*76d0caaeSpatrick    void bar() { return A.compare_exchange_strong(y, z); }
*76d0caaeSpatrick
*76d0caaeSpatrickIf only **one** of these calls to ``compare_exchange_strong`` is implemented with
*76d0caaeSpatrickmutex-locked code, then that mutex-locked code will not be executed mutually
*76d0caaeSpatrickexclusively of the one implemented in a lock-free manner.