Use less unroll for clique kernels (#313)

[ROCm/rccl commit: 41e47a36e7]
Этот коммит содержится в:
Wenkai Du
2021-01-15 17:48:10 -08:00
коммит произвёл GitHub
родитель d7ed44eb9a
Коммит 7f9c15b843
+1 -1
Просмотреть файл
@@ -67,7 +67,7 @@ __device__ void AllReduceCliqueSplitKernel(struct CollectiveArgs* args)
}
// Perform the reduction
#define ALL_REDUCE_CLIQUE_UNROLL 2
#define ALL_REDUCE_CLIQUE_UNROLL 1
ReduceOrCopyMulti<ALL_REDUCE_CLIQUE_UNROLL, FUNC, T, NUM_RANKS, NUM_RANKS, NUM_RANKS, NUM_RANKS>(
threadIdx.x, blockDim.x, NUM_RANKS, srcs, NUM_RANKS, dsts, blockN);
}