SWDEV-526208 - Fix miscalculation of coalesced tiled partition mask (#162)
[ROCm/clr commit: c4fa3ef927]
Этот коммит содержится в:
коммит произвёл
GitHub
родитель
9264e97cbb
Коммит
c83df8a653
@@ -390,7 +390,7 @@ class coalesced_group : public thread_group {
|
||||
int lanes_to_skip = ((thread_rank()) / tile_size) * tile_size;
|
||||
|
||||
for (unsigned int i = 0; i < warpSize; i++) {
|
||||
lane_mask active = coalesced_info.member_mask & (1 << i);
|
||||
lane_mask active = coalesced_info.member_mask & (static_cast<lane_mask>(1) << i);
|
||||
// Make sure the lane is active
|
||||
if (active) {
|
||||
if (lanes_to_skip <= 0 && tile_rank < tile_size) {
|
||||
|
||||
Ссылка в новой задаче
Block a user