Insert barrier after loading work items to LDS (#1551)

Этот коммит содержится в:
Wenkai Du
2025-02-18 10:17:27 -08:00
коммит произвёл GitHub
родитель 32dc7ef47c
Коммит baaa2ac64d
+1 -1
Просмотреть файл
@@ -560,8 +560,8 @@ __device__ __forceinline__ void ncclKernelMain(struct ncclDevKernelArgs const* a
default:
break;
}
__synclds();
loadWorkBatchToShmem(tid%WARP_SIZE, tn, args, batchIx);
__synclds();
// Check whether the last operation was aborted and make sure all threads exit
bool aborted = false;