global__lock_8hpp_source.html

 #pragma once


 #include <new>

 #include <atomic>


 #include "ityr/common/util.hpp"

 #include "ityr/common/mpi_util.hpp"

 #include "ityr/common/mpi_rma.hpp"

 #include "ityr/common/topology.hpp"

 #include "ityr/common/profiler.hpp"

 #include "ityr/common/prof_events.hpp"


 namespace ityr::common {


 class global_lock {

 public:

   global_lock(int n_locks = 1)

     : n_locks_(n_locks),

       lock_win_(topology::mpicomm(), n_locks_, 0) {}


   bool trylock(topology::rank_t target_rank, int idx = 0) const {

     ITYR_PROFILER_RECORD(prof_event_global_lock_trylock, target_rank);


     ITYR_CHECK(idx < n_locks_);


     lock_t result = mpi_atomic_cas_value<lock_t>(1, 0, target_rank, get_disp(idx), lock_win_.win());


     ITYR_CHECK(0 <= result);

     ITYR_CHECK(result <= 2);

     return result == 0;

   }


   void lock(topology::rank_t target_rank, int idx = 0) const {

     ITYR_CHECK(idx < n_locks_);

     while (!trylock(target_rank, idx));

   }


   void priolock(topology::rank_t target_rank, int idx = 0) const {

     // Only one process can call this priority lock at the same time

     ITYR_PROFILER_RECORD(prof_event_global_lock_priolock, target_rank);


     ITYR_CHECK(idx < n_locks_);


     lock_t result = mpi_atomic_faa_value<lock_t>(1, target_rank, get_disp(idx), lock_win_.win());

     if (result == 0) {

       return;

     }


     // Wait until the previous lock holder releases the lock

     while (mpi_atomic_get_value<lock_t>(target_rank, get_disp(idx), lock_win_.win()) != 1);

   }


   void unlock(topology::rank_t target_rank, int idx = 0) const {

     ITYR_PROFILER_RECORD(prof_event_global_lock_unlock, target_rank);


     ITYR_CHECK(idx < n_locks_);


     mpi_atomic_faa_value<lock_t>(-1, target_rank, get_disp(idx), lock_win_.win());

   }


   bool is_locked(topology::rank_t target_rank, int idx = 0) const {

     ITYR_CHECK(idx < n_locks_);


     lock_t result = mpi_atomic_get_value<lock_t>(target_rank, get_disp(idx), lock_win_.win());

     return result > 0;

   }


 private:

   using lock_t = int;


   struct alignas(common::hardware_destructive_interference_size) lock_wrapper {

     template <typename... Args>

     lock_wrapper(Args&&... args) : value(std::forward<Args>(args)...) {}

     std::atomic<lock_t> value;

   };


   std::size_t get_disp(int idx) const {

     return idx * sizeof(lock_wrapper) + offsetof(lock_wrapper, value);

   }


   int                           n_locks_;

   mpi_win_manager<lock_wrapper> lock_win_;

 };


 ITYR_TEST_CASE("[ityr::common::global_lock] lock and unlock") {

   runtime_options opts;

   singleton_initializer<topology::instance> topo;


   ITYR_SUBCASE("single element") {

     global_lock lock;


     using value_t = std::size_t;

     mpi_win_manager<value_t> value_win(topology::mpicomm(), 1);


     ITYR_CHECK(value_win.local_buf()[0] == 0);


     mpi_barrier(topology::mpicomm());


     auto n_ranks = topology::n_ranks();


     std::size_t n_updates = 100;


     for (topology::rank_t target_rank = 0; target_rank < n_ranks; target_rank++) {

       for (std::size_t i = 0; i < n_updates; i++) {

         lock.lock(target_rank);


         auto v = common::mpi_get_value<value_t>(target_rank, 0, value_win.win());

         common::mpi_put_value<value_t>(v + 1, target_rank, 0, value_win.win());


         lock.unlock(target_rank);

       }


       mpi_barrier(topology::mpicomm());

     }


     ITYR_CHECK(value_win.local_buf()[0] == n_updates * n_ranks);

   }


   ITYR_SUBCASE("multiple elements") {

     int n_elems = 3;

     global_lock lock(n_elems);


     using value_t = std::size_t;

     mpi_win_manager<value_t> value_win(topology::mpicomm(), n_elems);


     for (int i = 0; i < n_elems; i++) {

       ITYR_CHECK(value_win.local_buf()[i] == 0);

     }


     auto n_ranks = topology::n_ranks();


     std::size_t n_updates = 1000;


     for (topology::rank_t target_rank = 0; target_rank < n_ranks; target_rank++) {

       for (std::size_t i = 0; i < n_updates; i++) {

         int idx = i % n_elems;

         lock.lock(target_rank, idx);


         auto v = common::mpi_get_value<value_t>(target_rank, idx * sizeof(value_t), value_win.win());

         common::mpi_put_value<value_t>(v + 1, target_rank, idx * sizeof(value_t), value_win.win());


         lock.unlock(target_rank, idx);

       }


       mpi_barrier(topology::mpicomm());

     }


     value_t sum = 0;

     for (int i = 0; i < n_elems; i++) {

       sum += value_win.local_buf()[i];

     }


     ITYR_CHECK(sum == n_updates * n_ranks);

   }

 }


 }

ityr::common::global_lock
Definition: global_lock.hpp:15

ityr::common::global_lock::priolock
void priolock(topology::rank_t target_rank, int idx=0) const
Definition: global_lock.hpp:38

ityr::common::global_lock::lock
void lock(topology::rank_t target_rank, int idx=0) const
Definition: global_lock.hpp:33

ityr::common::global_lock::unlock
void unlock(topology::rank_t target_rank, int idx=0) const
Definition: global_lock.hpp:53

ityr::common::global_lock::trylock
bool trylock(topology::rank_t target_rank, int idx=0) const
Definition: global_lock.hpp:21

ityr::common::global_lock::is_locked
bool is_locked(topology::rank_t target_rank, int idx=0) const
Definition: global_lock.hpp:61

ityr::common::global_lock::global_lock
global_lock(int n_locks=1)
Definition: global_lock.hpp:17

ityr::common::mpi_win_manager::win
MPI_Win win() const
Definition: mpi_rma.hpp:409

prof_events.hpp

util.hpp

ITYR_SUBCASE
#define ITYR_SUBCASE(name)
Definition: util.hpp:41

ITYR_CHECK
#define ITYR_CHECK(cond)
Definition: util.hpp:48

mpi_rma.hpp

mpi_util.hpp

ityr::common::topology::n_ranks
rank_t n_ranks()
Definition: topology.hpp:208

ityr::common::topology::rank_t
int rank_t
Definition: topology.hpp:12

ityr::common::topology::mpicomm
MPI_Comm mpicomm()
Definition: topology.hpp:206

ityr::common
Definition: allocator.hpp:16

ityr::common::args
va_list args
Definition: util.hpp:76

ityr::common::mpi_barrier
void mpi_barrier(MPI_Comm comm)
Definition: mpi_util.hpp:42

ityr::n_ranks
rank_t n_ranks()
Return the total number of processes.
Definition: ityr.hpp:107

profiler.hpp

ITYR_PROFILER_RECORD
#define ITYR_PROFILER_RECORD(event,...)
Definition: profiler.hpp:319

ityr::common::prof_event_global_lock_priolock
Definition: prof_events.hpp:94

ityr::common::prof_event_global_lock_trylock
Definition: prof_events.hpp:89

ityr::common::prof_event_global_lock_unlock
Definition: prof_events.hpp:99

topology.hpp