Use send instead of sendWithBarrier. (#727)

[ROCm/rccl commit: efc42d9045]
Цей коміт міститься в:
Wen-Heng (Jack) Chung
2023-11-07 13:47:24 -06:00
зафіксовано GitHub
джерело cf60052394
коміт 270aa41f6b
+1 -1
Переглянути файл
@@ -312,7 +312,7 @@ __device__ __forceinline__ void mscclRunInterpreter(
NpKit::CollectGpuEventLDS(NPKIT_EVENT_MSCCL_SEND_ENTRY, thisNelem*sizeof(T), 0, NPKIT_GET_GPU_TIMESTAMP());
}
#endif
prims.sendWithBarrier(srcOffset, thisNelem); // LL.send is the only situation where there is no barrier at the end.
prims.send(srcOffset, thisNelem); // LL.send is the only situation where there is no barrier at the end.
#if defined(ENABLE_NPKIT) && defined(ENABLE_NPKIT_EVENT_MSCCL_SEND_EXIT)
if (tid == 0) {