Add device synchronization before destroying proxy thread. (#1631)

This commit ensures that GPU finishes all kernel before destroying
communicator thread.

[ROCm/rccl commit: 52654e2301]
Этот коммит содержится в:
Arm Patinyasakdikul
2025-04-10 10:44:16 -05:00
коммит произвёл GitHub
родитель 93ac2ea61e
Коммит f29d59aa00
+1
Просмотреть файл
@@ -1702,6 +1702,7 @@ void* ncclProxyService(void* _args) {
}
// Wait for all operations to complete and stop progress thread before freeing any resource
hipDeviceSynchronize();
if (ncclProxyProgressDestroy(proxyState) != ncclSuccess) {
WARN("[Proxy Service] proxyDestroy failed");
}