Remove extra work element copy (#465)

[ROCm/rccl commit: e05de8fd26]
Этот коммит содержится в:
Wenkai Du
2021-11-09 13:52:03 -08:00
коммит произвёл GitHub
родитель 096defc1cd
Коммит fc5f692f71
-4
Просмотреть файл
@@ -186,10 +186,6 @@ static ncclResult_t setupLaunch(struct ncclQueueInfo* eqInfo, int usingCudaGraph
// Except P2P or aggregation cases
struct ncclWork* work = channel->workFifo+((channel->workFifoTail-channel->workCount)%NCCL_MAX_OPS);
struct ncclWorkElem* elem = work->elems;
if (!usingCudaGraph) {
params->func = (void *)ncclKerns[0];
memcpy(&comm->args, elem, sizeof(struct ncclWorkElem));
}
if (elem->funcIndex != FUNC_INDEX_P2P && eqInfo->elemList->count() == 1) elem->active = 0;
}