Sender rank's opCount maybe ahead by one if it finishes earlier

Этот коммит содержится в:
Wenkai Du
2020-06-11 13:02:45 +08:00
родитель fee1a20b74
Коммит a6d621176c
+1 -1
Просмотреть файл
@@ -113,7 +113,7 @@ class ncclPrimitives {
if (mismatch) {
// In non-LL, we use _threadfence_system before incrementing opCount, yet we are still waiting for credits here, so there must be a size mismatch
STORE(comm->fatalDevError, ncclDevAssertedMismatch);
} else if (conn && LOAD(conn->opCountRem) > opCount) {
} else if (conn && LOAD(conn->opCountRem) > opCount+1) {
mismatch += 1;
}
}