* add team-barrier implementation

add a team-barrier API and implementation in the IPC and RO conduit.
Clean up some of the logic in the RO Conduit to distinguish between
sync, sync_all, barrier, and barrier_all.

* add team_barrier_tests to functional tests
Этот коммит содержится в:
Edgar Gabriel
2025-03-24 11:23:03 -05:00
коммит произвёл GitHub
родитель e8ba20c5f5
Коммит bcbc42e78f
18 изменённых файлов: 271 добавлений и 14 удалений
+6
Просмотреть файл
@@ -580,6 +580,12 @@ __device__ void rocshmem_wg_barrier_all() {
rocshmem_ctx_wg_barrier_all(ROCSHMEM_CTX_DEFAULT);
}
__device__ void rocshmem_barrier(rocshmem_team_t team) {
GPU_DPRINTF("Function: rocshmem_barrier\n");
get_internal_ctx(ROCSHMEM_CTX_DEFAULT)->barrier(team);
}
__device__ void rocshmem_ctx_wg_sync_all(rocshmem_ctx_t ctx) {
GPU_DPRINTF("Function: rocshmem_ctx_sync_all\n");