Files
rocm-systems/tests/workloads/SQ/mi200/pmc_perf.csv
T
colramos-amd 62d130b458 Initial commit
2022-11-04 14:49:36 -05:00

111 KiB

1IndexKernelNamegpu-idqueue-idqueue-indexpidtidgrdwgrldsscrvgprsgprfbarsigobjSQ_INSTS_VALU_CVTSQ_INSTS_VMEM_WRSQ_INSTS_VMEM_RDSQ_INSTS_VMEMSQ_INSTS_SALUSQ_INSTS_VSKIPPEDSQ_INSTSSQ_INSTS_VALUGRBM_COUNTGRBM_GUI_ACTIVESQ_INSTS_VALU_ADD_F16SQ_INSTS_VALU_MUL_F16SQ_INSTS_VALU_FMA_F16SQ_INSTS_VALU_TRANS_F16SQ_INSTS_VALU_ADD_F32SQ_INSTS_VALU_MUL_F32SQ_INSTS_VALU_FMA_F32SQ_INSTS_VALU_TRANS_F32SQC_TC_DATA_WRITE_REQSQC_TC_DATA_ATOMIC_REQSQC_TC_STALLSQC_TC_REQSQC_DCACHE_REQ_READ_16SQC_ICACHE_REQSQC_ICACHE_HITSSQC_ICACHE_MISSESSQC_ICACHE_MISSES_DUPLICATESQC_DCACHE_INPUT_VALID_READYBSQC_DCACHE_ATOMICSQC_DCACHE_REQ_READ_8SQC_DCACHE_REQSQC_DCACHE_HITSSQC_DCACHE_MISSESSQC_DCACHE_MISSES_DUPLICATESQC_DCACHE_REQ_READ_1SQC_DCACHE_REQ_READ_2SQC_DCACHE_REQ_READ_4SQ_INSTS_VALU_ADD_F64SQ_INSTS_VALU_MUL_F64SQ_INSTS_VALU_FMA_F64SQ_INSTS_VALU_TRANS_F64SQ_INSTS_VALU_INT32SQ_INSTS_VALU_INT64SQ_INSTS_SMEMSQ_INSTS_FLATSQ_INSTS_LDSSQ_INSTS_GDSSQ_INSTS_EXP_GDSSQ_INSTS_BRANCHSQ_INSTS_SENDMSGSQ_WAVE_CYCLESSQ_WAIT_ANYSQ_WAIT_INST_ANYSQ_ACTIVE_INST_ANYSQ_CYCLESSQ_BUSY_CYCLESSQ_BUSY_CU_CYCLESSQ_ACTIVE_INST_VMEMSQ_ACTIVE_INST_LDSSQ_ACTIVE_INST_VALUSQ_ACTIVE_INST_SCASQ_ACTIVE_INST_EXP_GDSSQ_ACTIVE_INST_MISCSQ_ACTIVE_INST_FLATSQ_INST_CYCLES_VMEM_WRSQ_INST_CYCLES_VMEM_RDSQ_INST_CYCLES_SMEMSQ_INST_CYCLES_SALUSQ_THREAD_CYCLES_VALUSQ_IFETCHSQ_LDS_BANK_CONFLICTSQ_LDS_ADDR_CONFLICTSQ_LDS_UNALIGNED_STALLSQ_WAVESSQ_WAVES_EQ_64SQ_WAVES_LT_64SQ_WAVES_LT_48SQ_WAVES_LT_32SQ_WAVES_LT_16SQ_ITEMSSQ_LDS_MEM_VIOLATIONSSQ_LDS_ATOMIC_RETURNSQ_LDS_IDX_ACTIVESQ_WAVES_RESTOREDSQ_WAVES_SAVEDSQ_INSTS_SMEM_NORMSQ_INSTS_MFMASQ_INSTS_VALU_MFMA_I8SQ_INSTS_VALU_MFMA_F16SQ_INSTS_VALU_MFMA_BF16SQ_INSTS_VALU_MFMA_F32SQ_INSTS_VALU_MFMA_F64SQ_VALU_MFMA_BUSY_CYCLESSQ_INSTS_FLAT_LDS_ONLYSQ_INSTS_VALU_MFMA_MOPS_I8SQ_INSTS_VALU_MFMA_MOPS_F16SQ_INSTS_VALU_MFMA_MOPS_BF16SQ_INSTS_VALU_MFMA_MOPS_F32SQ_INSTS_VALU_MFMA_MOPS_F64SQC_TC_INST_REQSQC_TC_DATA_READ_REQDispatchNsBeginNsEndNsCompleteNs
20__amd_rocclr_fillBufferAligned.kd000137896137896335544322560043241600x00x7f6ef5c04280052428805242887340032025690112943718438627238627200000000000616047185924714901112351011313430524288367001636632342246558104857610485761048576000057671681048576367001652428800026214405242882464131151787362284355963924117248307354429867863880613600943718411010048031457285242885242880367001673400326039797764718592000524288524288000033554432000007340032000000000000039222415896002897487159069718709541590697210935515896147670838
31void benchmark_func<short, 256, 8u, 0u>(short, short*) [clone .kd]00213789613789632768256001224138880x00x7f6ef5c23f80004096409651203532826112337323373200000000000560081926202562001670005120564560512000001075235845124096000512512166729816151151992732256260520154115139499400261121024010244096040965125121671168819200051251200003276800000102400000000000005045615896152854722159069769359301590697694953015896152998919
42void benchmark_func<float, 256, 8u, 0u>(float, float*) [clone .kd]0051378961378964194304256001224143360x7f6ef8b5e3800x7f6ef5c23fc00052428852428813107204063232288358416466416466400000026214400004480917504912756035549076580065536638005616800655360000015073284587526553652428800065536655367692905947981683252118243735552131145612103761564023700288358419660801310725242880524288655361310721845493769175040006553665536000041943040000013107200000000000003925615896153048378159069770188101590697711097115896153397420
53void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 0u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0081378961378964194304256001624150400x7f6ef8b5e2000x7f6ef5c2400000524288524288117964805308416301465630989230989200000026214400006160111411211107075635234433980065536638005616800655360000015073284587526553652428800013107265536215432999500247661604274974980736249744823947573101367400301465612451840196608524288052428865536117964819293798411141120006553665536000041943040000013107200000000000005605615896153447629159069771448911590697732441115896153834960
64void benchmark_func<double, 256, 8u, 0u>(double, double*) [clone .kd]00111378961378964194304256001624154880x7f6ef8b5e0800x7f6ef5c240400052428852428813107204063232288358431041331041300000000000504091750491429656332562161000655366380056168006553600026214401507328458752655365242880006553665536226324128502459661723426103735552248114423791163082522900288358419660801310725242880524288655361310721845493769175040006553665536000041943040000013107200000000000004485615896153881659159069773496911590697753033215896154262361
75void benchmark_func<__half2, 256, 8u, 0u>(__half2, __half2*) [clone .kd]00141378961378964194304256001224159360x7f6ef63fdf000x7f6ef5c2408000524288524288196608045875203342336166213166213002621440000000056001048576104465156389569800400655366380056168006553600000150732845875265536524288000655366553684288826486418963138709042598401325680122002615776358003342336262144013107252428805242886553619660821390950410485760006553665536000041943040000013107200000000000005045615896154309379159069775548121590697764809215896154606783
86void benchmark_func<int, 256, 8u, 0u>(int, int*) [clone .kd]00171378961378964194304256001224163840x7f6ef63fdd800x7f6ef5c240c0005242885242881310720419430430146561649671649670000000000050409830409795825633529156180065536638005616800655360000019660804587526553652428800065536655367672198147756038250993193866624131368012091721563110000301465619660801310725242880524288655361310721929379849830400006553665536000041943040000013107200000000000004485615896154652682159069776735321590697776585315896154952865
97void benchmark_func<float, 256, 8u, 1u>(float, float*) [clone .kd]00201378961378964194304256001224170880x7f6ef63fdc000x7f6ef5c24100005242885242881966080511180835389441633131633130000006553600000560011141121111843023608653240013107212933656168065536655360000015073284587521310725242880006553665536924685374773077440215779452198413240641217402157709550035389443276800131072524288052428813107219660822649241611141120006553665536000041943040000026214400000000000005045615896155012234159069778055331590697789801315896155292758
108void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 1u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]00231378961378964194304256001624177920x7f6ef63fda800x7f6ef5c241400052428852428811796480609484835389443108583108580000007864320000672013107201307553563204623244001310721293365616800131072000001507328458752131072524288000131072655362224378935068101116618632255705602482672237418530765247003538944131072001966085242880524288131072117964822649241613107200006553665536000041943040000026214400000000000006165615896155337877159069779352931590697811433415896155735798
119void benchmark_func<double, 256, 8u, 1u>(double, double*) [clone .kd]00261378961378964194304256001624184960x7f6ef63fd9000x7f6ef5c241800052428852428813107205242880380108831034131034100000000000616011796481175728564172665514006553663800561680006553600786432015073284587526553652428800065536655362228751687397673514424537746530562495424239212430941883003801088196608013107252428805242886553613107224326963211796480006553665536000041943040000013107200000000000005605615896155780437159069781421741590697832233515896156162798
1210void benchmark_func<__half2, 256, 8u, 1u>(__half2, __half2*) [clone .kd]00291378961378964194304256001624192000x7f6ef63fd7800x7f6ef5c241c00052428852428819660805439488386662416613816613800786432000000006160124518412411745642984438280013107212933656168065536655360000015073284587521310725242880006553665536885772464697498836752594484966413238801219663157794010038666243276800131072524288052428813107219660824746393612451840006553665536000041943040000026214400000000000005605615896156208027159069783503351590697844425515896156498281
1311void benchmark_func<int, 256, 8u, 1u>(int, int*) [clone .kd]00321378961378964194304256001624199040x7f6ef63fd6000x7f6ef5c2420000524288524288131072056360964063232165356165356000000000006160124518412412745637946942270013107212933656168065536655360000030146564587521310725242880006553665536860344004781684033236824498073613213201215070157184820040632322621440131072524288052428813107213107226004684812451840006553665536000041943040000026214400000000000005605615896156544450159069784845751590697857817515896156833494
1412void benchmark_func<float, 256, 8u, 2u>(float, float*) [clone .kd]00351378961378964194304256001224206080x7f6ef8b5e4800x7f6ef5c2424000524288524288262144054394883932160164522164522000000104857600006160124518412415505649684382120013107212933656168065536655360000015073284587521310725242880006553665536932637154783961340443366498073613250081220964158115790039321603932160131072524288052428813107226214425165824012451840006553665536000041943040000026214400000000000005605615896156889362159069786176961590697871033615896157170166
1513void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 2u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]00381378961378964194304256001624213120x7f6ef8b5e3000x7f6ef5c2428000524288524288117964806619136406323230976630976600000013107200000728014417921437192563560462054001310721293365616800131072000001507328458752131072524288000131072655362304071685015437317415794760948482483376237934330809835004063232131072001966085242880524288131072117964826004684814417920006553665536000041943040000026214400000000000006725615896157216855159069787455361590697892441715896157593017
1614void benchmark_func<double, 256, 8u, 2u>(double, double*) [clone .kd]00411378961378964194304256001624220160x7f6ef8b5e1800x7f6ef5c242c000524288524288131072057671684325376309746309746000000000006720131072013063205643416489450065536638005616800065536001310720015073284587526553652428800065536655362169409467222201713954158551773442450800234698830425744004325376196608013107252428805242886553613107227682406413107200006553665536000041943040000013107200000000000006165615896157638536159069789490571590697912761715896158015647
1715void benchmark_func<__half2, 256, 8u, 2u>(__half2, __half2*) [clone .kd]00441378961378964194304256001624227200x7f6ef8b5e0000x7f6ef5c2430000524288524288196608059637764390912164524164524001310720000000006720137625613718845646565937090013107212933656168065536655360000015073284587521310725242880006553665536906286814815191337102816537395213176161212903156827860043909123276800131072524288052428813107219660828101836813762560006553665536000041943040000026214400000000000006165615896158061166159069791628171590697925561815896158394789
1816void benchmark_func<int, 256, 8u, 2u>(int, int*) [clone .kd]00471378961378964194304256001224234240x7f6ef63fde800x7f6ef5c2434000524288524288131072066191365111808163844163844000000000007280144179214376885641545052460013107212933656168065536655360000040632324587521310725242880006553665536871423584663534234477704602931213108801209056156567860051118082621440131072524288052428813107213107232715571214417920006553665536000041943040000026214400000000000006725615896158440518159069792888981590697938185815896158742851
1917void benchmark_func<float, 256, 8u, 3u>(float, float*) [clone .kd]00501378961378964194304256001224241280x7f6ef63fdd000x7f6ef5c243800052428852428826214405898240432537616350016350000000014417920000672013107201306447112420068941000131072129336561680655366553600000150732845875213107252428800065536655361023064694890887648023641537395213047681204258155926970043253763932160131072524288052428813107226214427682406413107200006553665536000041943040000026214400000000000006165615896158799180159069794156181590697950953915896159049774
2018void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 3u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]00531378961378964194304256001624248320x7f6ef63fdb800x7f6ef5c243c000524288524288117964807143424458752030879230879200000018350080000784015728641569271563454457291001310721293365616800131072000001507328458752131072524288000131072655362263047885015736016952829266191362477712236768830695265004587520131072001966085242880524288131072117964829360128015728640006553665536000041943040000026214400000000000007285615896159095933159069795420191590697972249915896159444495
2119void benchmark_func<double, 256, 8u, 3u>(double, double*) [clone .kd]00561378961378964194304256001624255360x7f6ef63fda000x7f6ef5c244000052428852428813107206291456484966430674030674000000000000672014417921439314023508788550065536638005616800065536001835008015073284587526553652428800065536655362178233586991355614220817057016322449168234514730374962004849664196608013107252428805242886553613107231037849614417920006553665536000041943040000013107200000000000006165615896159493694159069797504991590697993146015896159835947
2220void benchmark_func<__half2, 256, 8u, 3u>(__half2, __half2*) [clone .kd]00591378961378964194304256001224262400x7f6ef63fd8800x7f6ef5c2444000524288524288196608064225284915200164431164431001835008000000007280150732815029465638614746000013107212933656168065536655360000015073284587521310725242880006553665536886202384671683936005159589824013094561208156156278520049152003276800131072524288052428813107219660831457280015073280006553665536000041943040000026214400000000000006725615896159882186159069799805801590698007370015896160138290
2321void benchmark_func<int, 256, 8u, 3u>(int, int*) [clone .kd]00621378961378964194304256001224269440x7f6ef63fd7000x7f6ef5c24480005242885242881310720773324861603841640641640640000000000078401638400163382956450158421000131072129336561680655366553600000511180845875213107252428800065536655361031158234499682251041113707788813023761201463155455860061603842621440131072524288052428813107213107239426457616384000006553665536000041943040000026214400000000000007285615896160184299159069801101811590698020442115896160445983
2422void benchmark_func<float, 256, 8u, 4u>(float, float*) [clone .kd]00651378961378964194304256001224276480x7f6ef8b5e5800x7f6ef5c244c0005242885242882621440629145647185921630421630420000001835008000067201441792143827056377284896900131072129336561680655366553600000150732845875213107252428800065536655361035975444666960251160774576716813029201199465155286500047185923932160131072524288052428813107226214430198988814417920006553665536000041943040000026214400000000000006165615896160500122159069802386611590698033114115896160750626
2523void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 4u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]00681378961378964194304256001624286080x7f6ef8b5e4000x7f6ef5c2450000524288524288117964807667712511180831064431064400000023592960000840017039361700235563597627698001310721293365616800131072000001507328458752131072524288000131072655362234428414949416416680525371434242476472237324130745334005111808131072001966085242880524288131072117964832715571217039360006553665536000041943040000026214400000000000007845615896160802395159069803660211590698054426215896161153747
2624void benchmark_func<double, 256, 8u, 4u>(double, double*) [clone .kd]00711378961378964194304256001624293120x7f6ef8b5e2800x7f6ef5c2454000524288524288131072068157445373952308475308475000000000007840157286415686315642186832350065536638005616800065536002359296015073284587526553652428800065536655362187576956978477014274700562259202465816236113730576099005373952196608013107252428805242886553613107234393292815728640006553665536000041943040000013107200000000000007285615896161201046159069805706621590698075018315896161547048
2725void benchmark_func<__half2, 256, 8u, 4u>(__half2, __half2*) [clone .kd]00741378961378964194304256001224300160x7f6ef8b5e1000x7f6ef5c245800052428852428819660806946816543948816210516210500235929600000000728016384001634777037919011900013107212933656168065536655360000015073284587521310725242880006553665536876399554614685035070577642252813044481199931155273110054394883276800131072524288052428813107219660834812723216384000006553665536000041943040000026214400000000000006725615896161595407159069807745031590698086714315896161850952
2826void benchmark_func<int, 256, 8u, 4u>(int, int*) [clone .kd]0077137896137896419430425600824309760x7f6ef63fdf800x7f6ef5c245c00052428852428813107208781824720896016321516321500000000000840018350081830009041888926100013107212933656168065536655360000061603844587521310725242880006553665536922786124213514342017005812646413023681200267155055020072089602621440131072524288052428813107213107246137344018350080006553665536000041943040000026214400000000000007845615896161898691159069808909831590698098298315896162154765
2927void benchmark_func<float, 256, 8u, 5u>(float, float*) [clone .kd]00801378961378964194304256001224316800x7f6ef63fde000x7f6ef5c246000052428852428826214406684672511180816427116427100000022282240000784015073281502385112638444432600131072129336561680655366553600000150732845875213107252428800065536655361023981594698270649255069616038413028481201004155536750051118083932160131072524288052428813107226214432715571215073280006553665536000041943040000026214400000000000007285615896162208504159069810161041590698110906415896162465418
3028void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 5u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]00831378961378964194304256001624326400x7f6ef63fdc800x7f6ef5c246400052428852428811796480819200056360963067303067300000002883584000084001835008183139903677869811001310721293365616800131072000001507328458752131072524288000131072655362206986004826114716476974176677122450256234503530351557005636096131072001966085242880524288131072117964836071014418350080006553665536000041943040000026214400000000000007845615896162511927159069811341841590698131498515896162861899
3129void benchmark_func<double, 256, 8u, 5u>(double, double*) [clone .kd]00861378961378964194304256001224336000x7f6ef63fdb000x7f6ef5c2468000524288524288131072073400325898240309440309440000000000008400170393617002575640388639590065536638005616800065536002883584015073284587526553652428800065536655362172511096438629214611460967502082447568234311730356247005898240196608013107252428805242886553613107237748736017039360006553665536000041943040000013107200000000000007845615896162909538159069813383451590698151914515896163255320
3230void benchmark_func<__half2, 256, 8u, 5u>(__half2, __half2*) [clone .kd]00891378961378964194304256001224345600x7f6ef63fd9800x7f6ef5c246c000524288524288196608074711045963776163328163328002883584000000008400176947217647325652454419590013107212933656168065536655360000015073284587521310725242880006553665536910609354573458538379534694681613074881202838155344000059637763276800131072524288052428813107219660838168166417694720006553665536000041943040000026214400000000000007845615896163302379159069815433051590698163674615896163561883
3331void benchmark_func<int, 256, 8u, 5u>(int, int*) [clone .kd]0092137896137896419430425600824355200x7f6ef63fd8000x7f6ef5c24700005242885242881310720983040082575361633081633080000000000095202031616202553911267644416040013107212933656168065536655360000072089604587521310725242880006553665536847927984138940234228356917504013118881206031155690720082575362621440131072524288052428813107213107252848230420316160006553665536000041943040000026214400000000000008965615896163608972159069816615461590698175546615896163867447
3432void benchmark_func<float, 256, 8u, 6u>(float, float*) [clone .kd]00951378961378964194304256001224362240x7f6ef63fd6800x7f6ef5c2474000524288524288262144070778885505024163978163978000000262144000007840163840016334255648714501620013107212933656168065536655360000015073284587521310725242880006553665536974881674578650445148063655360013053441201826155534030055050243932160131072524288052428813107226214435232153616384000006553665536000041943040000026214400000000000007285615896163920555159069817879461590698188090615896164178160
3533void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 6u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]00981378961378964194304256001224371840x7f6ef8b5e5000x7f6ef5c247800052428852428811796480878182461603843087383087380000003407872000089601966080196296403376839333001310721293365616800131072000001507328458752131072524288000131072655362247400164816001616838800081920002461024235578430510167006160384131072001966085242880524288131072117964839426457619660800006553665536000041943040000026214400000000000008405615896164224629159069819052261590698208522715896164570601
3634void benchmark_func<double, 256, 8u, 6u>(double, double*) [clone .kd]001011378961378964194304256001224381440x7f6ef8b5e3800x7f6ef5c247c000524288524288131072079298566422528307376307376000000000008960183500818291435657204398220065536638005616800065536003407872015073284587526553652428800065536655362094686856062999214156419772744962452768235210830473435006422528196608013107252428805242886553613107241104179218350080006553665536000041943040000013107200000000000008405615896164619740159069821108271590698229050815896164964632
3735void benchmark_func<__half2, 256, 8u, 6u>(__half2, __half2*) [clone .kd]001041378961378964194304256001224391040x7f6ef8b5e2000x7f6ef5c24800005242885242881966080806092864880641638821638820034078720000000089601900544189499211249427337950013107212933656168065536655360000015073284587521310725242880006553665536877662814438399135911186747110413070001202902155470230064880643276800131072524288052428813107219660841523609619005440006553665536000041943040000026214400000000000008405615896165011331159069823145081590698240874815896165270925
3836void benchmark_func<int, 256, 8u, 6u>(int, int*) [clone .kd]00107137896137896419430425600824403200x7f6ef8b5e0800x7f6ef5c24840005242885242881310720108134409306112163203163203000000000001064022282242222179565133697231001310721293365616806553665536000008257536458752131072524288000655366553691501532392439244203399210223616130432811961481543470200930611226214401310725242880524288131072131072595591168222822400065536655360000419430400000262144000000000000010085615896165318714159069824317881590698252634915896165577048
3937void benchmark_func<float, 256, 8u, 7u>(float, float*) [clone .kd]001101378961378964194304256001224412800x7f6ef63fdf000x7f6ef5c2488000524288524288262144074711045898240162629162629000000301465600008400170393616992185653404387450013107212933656168065536655360000015073284587521310725242880006553665536958169204494307243927032694681613044721203072155655410058982403932160131072524288052428813107226214437748736017039360006553665536000041943040000026214400000000000007845615896165631267159069825597891590698265322915896165888151
4038void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 7u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]001131378961378964194304256001224422400x7f6ef63fdd800x7f6ef5c248c0005242885242881179648093061126684672306025306025000000393216000001008020971522092983564354441100001310721293365616800131072000001507328458752131072524288000131072655362270440514891877316940899087162882434808232912230195367006684672131072001966085242880524288131072117964842781900820971520006553665536000041943040000026214400000000000009525615896165938910159069826793091590698285883015896166303592
4139void benchmark_func<double, 256, 8u, 7u>(double, double*) [clone .kd]001161378961378964194304256001224432000x7f6ef63fdc000x7f6ef5c2490000524288524288131072083886086946816303553303553000000000008960196608019632165629548531520065536638005616800065536003932160015073284587526553652428800065536655362148278465910332014792574277987842434920233164130215579006946816196608013107252428805242886553613107244459622419660800006553665536000041943040000013107200000000000008405615896166350811159069828831501590698306363015896166701173
4240void benchmark_func<__half2, 256, 8u, 7u>(__half2, __half2*) [clone .kd]00119137896137896419430425600824441600x7f6ef63fda800x7f6ef5c2494000524288524288196608085852167012352163821163821003932160000000009520203161620256945650074461070013107212933656168065536655360000015073284587521310725242880006553665536838686824402772431845566799539213155121210223156359190070123523276800131072524288052428813107219660844879052820316160006553665536000041943040000026214400000000000008965615896166746932159069830890701590698318347115896167006506
4341void benchmark_func<int, 256, 8u, 7u>(int, int*) [clone .kd]001221378961378964194304256001224453760x7f6ef63fd9000x7f6ef5c2498000524288524288131072011927552103546881650991650990000000000011200242483224186265678935669400013107212933656168065536655360000093061124587521310725242880006553665536924694573788161343315652112721921301784119987415472205001035468826214401310725242880524288131072131072662700032242483200065536655360000419430400000262144000000000000010645615896167053265159069832077911590698330235115896167311190
4442void benchmark_func<float, 256, 8u, 8u>(float, float*) [clone .kd]001251378961378964194304256001224463360x7f6ef63fd7800x7f6ef5c249c000524288524288262144079953926291456162701162701000000340787200008960183500818297715668854417510013107212933656168065536655360000015073284587521310725242880006553665536878786884352486337013793734003212950321195120154545080062914563932160131072524288052428813107226214440265318418350080006553665536000041943040000026214400000000000008405615896167364778159069833349911590698342779115896167631912
4543void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 8u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]001281378961378964194304256001224475520x7f6ef63fd6000x7f6ef5c24a0000524288524288117964809830400720896030247130247100000044564480000106402228224222342711247504507930013107212933656168001310720000015073284587521310725242880001310726553622771949947349595171129328924057624381682331409301801150072089601310720019660852428805242881310721179648461373440222822400065536655360000419430400000262144000000000000010085615896167679441159069834521121590698363179215896168022694
4644void benchmark_func<double, 256, 8u, 8u>(double, double*) [clone .kd]001311378961378964194304256001224485120x7f6ef8b5e4800x7f6ef5c24a40005242885242881310720891289674711043028513028510000000000010080209715220918785658124502980065536638005616800065536004456448015073284587526553652428800065536655362132351425735844914755362183230722407528230123229813278007471104196608013107252428805242886553613107247815065620971520006553665536000041943040000013107200000000000009525615896168070303159069836551521590698383531315896168412765
4745void benchmark_func<__half2, 256, 8u, 8u>(__half2, __half2*) [clone .kd]00134137896137896419430425600824494720x7f6ef8b5e3000x7f6ef5c24a800052428852428819660809109504753664016292316292300445644800000000952021626882157259054378418620013107212933656168065536655360000015073284587521310725242880006553665536879098904206899937321211851968012944401190097153691580075366403276800131072524288052428813107219660848234496021626880006553665536000041943040000026214400000000000008965615896168459754159069838589931590698395163315896168716808
4846void benchmark_func<int, 256, 8u, 8u>(int, int*) [clone .kd]001371378961378964194304256001224506880x7f6ef8b5e1800x7f6ef5c24ac0005242885242881310720129761281140326416231116231100000000000117602621440261421856663987056500131072129336561680655366553600000103546884587521310725242880006553665536946182243425811748039339123207681295304119120915357980001140326426214401310725242880524288131072131072729808896262144000065536655360000419430400000262144000000000000011205615896168766317159069839756331590698406923415896169032451
4947void benchmark_func<float, 256, 8u, 9u>(float, float*) [clone .kd]001401378961378964194304256001224516480x7f6ef8b5e0000x7f6ef5c24b000052428852428826214408388608668467216183616183600000038010880000896019660801960801054418578350013107212933656168065536655360000015073284587521310725242880006553665536875824114153000938319154773324812976561193470154278190066846723932160131072524288052428813107226214442781900819660800006553665536000041943040000026214400000000000008405615896169086660159069841017141590698419323415896169335154
5048void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 9u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]001431378961378964194304256001224528640x7f6ef63fde800x7f6ef5c24b4000524288524288117964801035468877332483031043031040000004980736000011200235929623538255651654626350013107212933656168001310720000015073284587521310725242880001310726553621657228246639027160168391976486424275282322472300567910077332481310720019660852428805242881310721179648494927872235929600065536655360000419430400000262144000000000000010645615896169387023159069842178741590698439739515896169733896
5149void benchmark_func<double, 256, 8u, 9u>(double, double*) [clone .kd]001461378961378964194304256001224540800x7f6ef63fdd000x7f6ef5c24b800052428852428813107209437184799539230341030341000000000000106402228224222258756515967264400655366380056168000655360049807360150732845875265536524288000655366553621659752956294661151455508884736024315762329097301618220079953921966080131072524288052428865536131072511705088222822400065536655360000419430400000131072000000000000010085615896169779005159069844210751590698460123515896170132997
5250void benchmark_func<__half2, 256, 8u, 9u>(__half2, __half2*) [clone .kd]00149137896137896419430425600824552960x7f6ef63fdb800x7f6ef5c24bc000524288524288196608096337928060928164702164702004980736000000001064022937602287847112743444014100131072129336561680655366553600000150732845875213107252428800065536655369004320541492541395066969043968130628012020971552008700806092832768001310725242880524288131072196608515899392229376000065536655360000419430400000262144000000000000010085615896170179656159069846249151590698471963615896170441470
5351void benchmark_func<int, 256, 8u, 9u>(int, int*) [clone .kd]001521378961378964194304256001224567680x7f6ef63fda000x7f6ef5c24c000052428852428813107201402470412451840162489162489000000000001288027525122744019567630736786001310721293365616806553665536000001140326445875213107252428800065536655361002137963214290954701543133693441301048119766815453488001245184026214401310725242880524288131072131072796917760275251200065536655360000419430400000262144000000000000012325615896170488479159069847447561590698483995615896170746903
5452void benchmark_func<float, 256, 8u, 10u>(float, float*) [clone .kd]001551378961378964194304256001224577280x7f6ef63fd8800x7f6ef5c24c40005242885242882621440878182470778881626081626080000004194304000010080203161620259305673926262020013107212933656168065536655360000015073284587521310725242880006553665536888637644258064338156657812646412991441196001154721570070778883932160131072524288052428813107226214445298483220316160006553665536000041943040000026214400000000000009525615896170800392159069848717961590698496523715896171056406
5553void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 10u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]001581378961378964194304256001224589440x7f6ef63fd7000x7f6ef5c24c80005242885242881179648010878976825753630277230277200000055050240000112002490368248505956452087974100131072129336561680013107200000150732845875213107252428800013107265536221014538455256221651997641028915224287602322460300602570082575361310720019660852428805242881310721179648528482304249036800065536655360000419430400000262144000000000000010645615896171103865159069849893971590698516907715896171446787
5654void benchmark_func<double, 256, 8u, 10u>(double, double*) [clone .kd]001611378961378964194304256001224601600x7f6ef8b5e5800x7f6ef5c24cc00052428852428813107209961472851968030320130320100000000000112002359296235282656613045561200655366380056168000655360055050240150732845875265536524288000655366553620305469755216102138466947937164824237522316146300136500085196801966080131072524288052428865536131072545259520235929600065536655360000419430400000131072000000000000010645615896171493226159069851932371590698537419815896171836549
5755void benchmark_func<__half2, 256, 8u, 10u>(__half2, __half2*) [clone .kd]00164137896137896419430425600824613760x7f6ef8b5e4000x7f6ef5c24d0000524288524288196608010158080858521616316816316800550502400000000112002424832241756756653556241400131072129336561680655366553600000150732845875213107252428800065536655368998238141637150387769759568256130882412020441551124100858521632768001310725242880524288131072196608549453824242483200065536655360000419430400000262144000000000000010645615896171882488159069853981981590698549211815896172144822
5856void benchmark_func<int, 256, 8u, 10u>(int, int*) [clone .kd]001671378961378964194304256001224628480x7f6ef8b5e2800x7f6ef5c24d400052428852428813107201507328013500416168651168651000000000001400029491202939867112879950458900131072129336561680655366553600000124518404587521310725242880006553665536996779672784653757413510144179201353224125054016079803001350041626214401310725242880524288131072131072864026624294912000065536655360000419430400000262144000000000000013445615896172190931159069855159581590698561531915896172453785
5957void benchmark_func<float, 256, 8u, 11u>(float, float*) [clone .kd]001701378961378964194304256001224638080x7f6ef8b5e1000x7f6ef5c24d80005242885242882621440917504074711041626891626890000004587520000010080216268821575065658234447170013107212933656168065536655360000015073284587521310725242880006553665536966979294179403446384215851968012921201190970153980150074711043932160131072524288052428813107226214447815065621626880006553665536000041943040000026214400000000000009525615896172508674159069856484391590698574251915896172760628
6058void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 11u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]001731378961378964194304256001224650240x7f6ef63fdf800x7f6ef5c24dc000524288524288117964801140326487818243045673045670000006029312000011760262144026158780618087921400131072129336561680013107200000150732845875213107252428800013107265536214196449451313421582516671081344024102802307959298911900087818241310720019660852428805242881310721179648562036736262144000065536655360000419430400000262144000000000000011205615896172811207159069857655591590698594428015896173160559
6159void benchmark_func<double, 256, 8u, 11u>(double, double*) [clone .kd]001761378961378964194304256001224662400x7f6ef63fde000x7f6ef5c24e0000524288524288131072010485760904396830496530496500000000000112002490368248600356474685990500655366380056168000655360060293120150732845875265536524288000655366553620103879853998363137144499989593624270642316832299793400090439681966080131072524288052428865536131072578813952249036800065536655360000419430400000131072000000000000010645615896173206918159069859687601590698614764015896173553351
6260void benchmark_func<__half2, 256, 8u, 11u>(__half2, __half2*) [clone .kd]00179137896137896419430425600824674560x7f6ef63fdc800x7f6ef5c24e40005242885242881966080106823689109504162987162987006029312000000001176025559042548110569198603388001310721293365616806553665536000001507328458752131072524288000655366553687159750402864553678075110092544130522412023361549923900910950432768001310725242880524288131072196608583008256255590400065536655360000419430400000262144000000000000011205615896173599450159069861705211590698626444115896173858434
6361void benchmark_func<int, 256, 8u, 11u>(int, int*) [clone .kd]001821378961378964194304256001224689280x7f6ef63fdb000x7f6ef5c24e800052428852428813107201612185614548992176909176909000000000001456031457283136874569498621746001310721293365616806553665536000001350041645875213107252428800065536655361086893222642277766800049154664961414744130948516881146001454899226214401310725242880524288131072131072931135488314572800065536655360000419430400000262144000000000000014005615896173904913159069862886011590698639212115896174174257
6462void benchmark_func<float, 256, 8u, 12u>(float, float*) [clone .kd]001851378961378964194304256001224701440x7f6ef63fd9800x7f6ef5c24ec0005242885242882621440956825678643201610691610690000004980736000010080222822422219455650408722490013107212933656168065536655360000015073284587521310725242880006553665536801868694028517630988797891289612921041189225153570700078643203932160131072524288052428813107226214450331648022282240006553665536000041943040000026214400000000000009525615896174228026159069864242811590698651724215896174489590
6563void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 12u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]001881378961378964194304256001224716160x7f6ef63fd8000x7f6ef5c24f00005242885242881179648011927552930611230210830210800000065536000000128802752512274608057698845974000131072129336561680013107200000150732845875213107252428800013107265536225134773504645191633325261133772824177202315441300081010093061121310720019660852428805242881310721179648595591168275251200065536655360000419430400000262144000000000000012325615896174535339159069865414021590698672172215896174882701
6664void benchmark_func<double, 256, 8u, 12u>(double, double*) [clone .kd]001911378961378964194304256001224728320x7f6ef63fd6800x7f6ef5c24f40005242885242881310720110100489568256303920303920000000000001232026214402615527566718445646006553663800561680006553600655360001507328458752655365242880006553665536215015814462591031583364871042022424217202312869299499390095682561966080131072524288052428865536131072612368384262144000065536655360000419430400000131072000000000000011765615896174930920159069867463621590698692716315896175275602
6765void benchmark_func<__half2, 256, 8u, 12u>(__half2, __half2*) [clone .kd]00194137896137896419430425600824740480x7f6ef8b5e5000x7f6ef5c24f80005242885242881966080111411209633792161450161450006553600000000001176026869762681283566310865036001310721293365616806553665536000001507328458752131072524288000655366553684929768370242543728868210616832129023211865621530013600963379232768001310725242880524288131072196608616562688268697600065536655360000419430400000262144000000000000011205615896175321351159069869505231590698704380315896175580866
6866void benchmark_func<int, 256, 8u, 12u>(int, int*) [clone .kd]001971378961378964194304256001224757760x7f6ef8b5e3800x7f6ef5c24fc00052428852428813107201717043215597568182258182258000000000001512033423363330039111986475177001310721293365616806553665536000001454899245875213107252428800065536655361107611062221181472034220165150721456824134983317423709001559756826214401310725242880524288131072131072998244352334233600065536655360000419430400000262144000000000000014565615896175628145159069870665231590698717356415896175898898
6967void benchmark_func<float, 256, 8u, 13u>(float, float*) [clone .kd]002001378961378964194304256001224769920x7f6ef8b5e2000x7f6ef5c250000052428852428826214409961472825753616132616132600000053739520000112002359296235258256646762387200131072129336561680655366553600000150732845875213107252428800065536655369104916740800232409428239306112129343211875791534389600825753639321601310725242880524288131072262144528482304235929600065536655360000419430400000262144000000000000010645615896175966087159069872055641590698730012415896176205262
7068void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 13u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]002031378961378964194304256001224784640x7f6ef8b5e0800x7f6ef5c250400052428852428811796480124518409830400302864302864000000707788800001344028835842876338112694649793400131072129336561680013107200000150732845875213107252428800013107265536208456417493636271472307741186201623957522285705296102780098304001310720019660852428805242881310721179648629145600288358400065536655360000419430400000262144000000000000012885615896176251771159069873238041590698750348515896176605173
7169void benchmark_func<double, 256, 8u, 13u>(double, double*) [clone .kd]002061378961378964194304256001224799360x7f6ef63fdf000x7f6ef5c2508000524288524288131072011534336100925443014703014700000000000012880268697626799525664044400180065536638005616800065536007077888015073284587526553652428800065536655362221588784633515916487920710944512240608822999852981004800100925441966080131072524288052428865536131072645922816268697600065536655360000419430400000131072000000000000012325615896176653792159069875268451590698770748615896177000544
7270void benchmark_func<__half2, 256, 8u, 13u>(__half2, __half2*) [clone .kd]00209137896137896419430425600824814080x7f6ef63fdd800x7f6ef5c250c000524288524288196608011730944101580801620741620740070778880000000012880281804828109015680654605590013107212933656168065536655360000015073284587521310725242880006553665536939632363863645344185663111411201306760120317015526449001015808032768001310725242880524288131072196608650117120281804800065536655360000419430400000262144000000000000012325615896177045463159069877318061590698782684615896177304547
7371void benchmark_func<int, 256, 8u, 13u>(int, int*) [clone .kd]002121378961378964194304256001224831360x7f6ef63fdc000x7f6ef5c251000052428852428813107201821900816646144190896190896000000000001624035389443527020112131334420600013107212933656168065536655360000015597568458752131072524288000655366553610820613020046307705961751756364815328561423955183666320016646144262144013107252428805242881310721310721065353216353894400065536655360000419430400000262144000000000000015685615896177352586159069878502061590698796540615896177628350
7472void benchmark_func<float, 256, 8u, 14u>(float, float*) [clone .kd]002151378961378964194304256001224843520x7f6ef63fda800x7f6ef5c2514000524288524288262144010354688865075216290416290400000057671680000117602424832241700756838158041900131072129336561680655366553600000150732845875213107252428800065536655369237547240725499419506459699328129708011945201542145600865075239321601310725242880524288131072262144553648128242483200065536655360000419430400000262144000000000000011205615896177681409159069880084471590698810252715896177941623
7573void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 14u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]002181378961378964194304256001224858240x7f6ef63fd9000x7f6ef5c25180005242885242881179648012976128103546883016643016640000007602176000014000301465630058271127992450162001310721293365616800131072000001507328458752131072524288000131072655362218910085011610715938859712386304243252023235423005362900103546881310720019660852428805242881310721179648662700032301465600065536655360000419430400000262144000000000000013445615896177987142159069881262071590698830540815896178340554
7674void benchmark_func<double, 256, 8u, 14u>(double, double*) [clone .kd]002211378961378964194304256001224872960x7f6ef63fd7800x7f6ef5c251c000524288524288131072012058624106168322998402998400000000000013440281804828093605670434513060065536638005616800065536007602176015073284587526553652428800065536655362014305794642732614353445311468800239975222935352970874600106168321966080131072524288052428865536131072679477248281804800065536655360000419430400000131072000000000000012885615896178388093159069883294081590698850812815896178738225
7775void benchmark_func<__half2, 256, 8u, 14u>(__half2, __half2*) [clone .kd]002241378961378964194304256001224887680x7f6ef63fd6000x7f6ef5c2520000524288524288196608012255232106823681631341631340076021760000000013440294912029402285682595892470013107212933656168065536655360000015073284587521310725242880006553665536926262563828898442671864116654081303480119705415443357001068236832768001310725242880524288131072196608683671552294912000065536655360000419430400000262144000000000000012885615896178784094159069885314881590698862668915896179044618
7876void benchmark_func<int, 256, 8u, 14u>(int, int*) [clone .kd]002271378961378964194304256001224907520x7f6ef8b5e4800x7f6ef5c252400052428852428813107201926758417694720202408202408000000000001736037355523722767116117434496960013107212933656168065536655360000016646144458752131072524288000655366553611764012120188244788396531861222416202641507355194235500017694720262144013107252428805242881310721310721132462080373555200065536655360000419430400000262144000000000000016805615896179090867159069886500491590698877084915896179379691
7977void benchmark_func<float, 256, 8u, 15u>(float, float*) [clone .kd]002301378961378964194304256001224919680x7f6ef8b5e3000x7f6ef5c25280005242885242882621440107479049043968162438162438000000616038400001176025559042547270569115456357001310721293365616806553665536000001507328458752131072524288000655366553692954134386302964423129410092544130588811969661543503800904396839321601310725242880524288131072262144578813952255590400065536655360000419430400000262144000000000000011205615896179433070159069888026891590698889629015896179689324
8078void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 15u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]002331378961378964194304256001224934400x7f6ef8b5e1800x7f6ef5c252c000524288524288117964801350041610878976302444302444000000812646400001400031457283138001568628735828001310721293365616800131072000001507328458752131072524288000131072655362219055585081346615818150012910592241264023081862984420100108789761310720019660852428805242881310721179648696254464314572800065536655360000419430400000262144000000000000013445615896179740433159069889193301590698909981015896180088785
8179void benchmark_func<double, 256, 8u, 15u>(double, double*) [clone .kd]002361378961378964194304256001224949120x7f6ef8b5e0000x7f6ef5c2530000524288524288131072012582912111411203005443005440000000000014000294912029421295667036596370065536638005616800065536008126464015073284587526553652428800065536655362089335815139643714554405611993088238684822850592960194800111411201966080131072524288052428865536131072713031680294912000065536655360000419430400000131072000000000000013445615896180136684159069891222101590698930221115896180484036
8280void benchmark_func<__half2, 256, 8u, 15u>(__half2, __half2*) [clone .kd]002391378961378964194304256001224963840x7f6ef63fde800x7f6ef5c25340005242885242881966080128450561120665616350816350800812646400000000140003080192306964556103524420080013107212933656168065536655360000015073284587521310725242880006553665536974160863698144448244946121896961302464119833215418058001120665632768001310725242880524288131072196608717225984308019200065536655360000419430400000262144000000000000013445615896180530755159069893265311590698942173115896180792449
8381void benchmark_func<int, 256, 8u, 15u>(int, int*) [clone .kd]002421378961378964194304256001224983680x7f6ef63fdd000x7f6ef5c253800052428852428813107202031616018743296210378210378000000000001792039321603919187115142116667070013107212933656168065536655360000017694720458752131072524288000655366553613600472019836009965079111966080016881761578440203582860018743296262144013107252428805242881310721310721199570944393216000065536655360000419430400000262144000000000000017365615896180837518159069894455711590698957229215896181128682
8482void benchmark_func<float, 256, 8u, 16u>(float, float*) [clone .kd]002451378961378964194304256001224995840x7f6ef63fdb800x7f6ef5c253c0005242885242882621440111411209437184164116164116000000655360000001232026214402612439568152694903001310721293365616806553665536000001507328458752131072524288000655366553685673634387875043640037010485760128959211863391530045000943718439321601310725242880524288131072262144603979776262144000065536655360000419430400000262144000000000000011765615896181181940159069896042921590698969821215896181440315
8583void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 16u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0024813789613789641943042560012241013120x7f6ef63fda000x7f6ef5c254000052428852428811796480140247041140326430006630006600000086507520000145603276800326852908005878189001310721293365616800131072000001507328458752131072524288000131072655362207537524574294116157593113434880239812822958852972910100114032641310720019660852428805242881310721179648729808896327680000065536655360000419430400000262144000000000000014005615896181491504159069897223721590698990093315896181834146
8684void benchmark_func<double, 256, 8u, 16u>(double, double*) [clone .kd]0025113789613789641943042560012241027840x7f6ef63fd8800x7f6ef5c2544000524288524288131072013041664115998723007323007320000000000014560308019230738935670664477740065536638005616800065536008650752015073284587526553652428800065536655362039195675065022414081750312451840239132822887432965215600115998721966080131072524288052428865536131072742391808308019200065536655360000419430400000131072000000000000014005615896181880455159069899247731590699010429415896182233197
8785void benchmark_func<__half2, 256, 8u, 16u>(__half2, __half2*) [clone .kd]0025413789613789641943042560012241042560x7f6ef63fd7000x7f6ef5c254800052428852428819660801330380811730944162978162978008650752000000001400032112643202175080228665890013107212933656168065536655360000015073284587521310725242880006553665536970270073535966048953363127139841292144118724615320490001173094432768001310725242880524288131072196608750780416321126400065536655360000419430400000262144000000000000013445615896182280286159069901295741590699022445415896182547260
8886void benchmark_func<int, 256, 8u, 16u>(int, int*) [clone .kd]0025713789613789641943042560012241062400x7f6ef8b5e5800x7f6ef5c254c0005242885242881310720213647361979187221943021943000000000000184804128768411594356143618810610013107212933656168065536655360000018743296458752131072524288000655366553613706969117403001989573142070937617642081648021212659620019791872262144013107252428805242881310721310721266679808412876800065536655360000419430400000262144000000000000017925615896182593449159069902479741590699037789415896182892942
8987void benchmark_func<float, 256, 8u, 17u>(float, float*) [clone .kd]0026013789613789641943042560012241077120x7f6ef8b5e4000x7f6ef5c2550000524288524288262144011534336983040016227816227800000069468160000123202752512274402108698867197001310721293365616806553665536000001507328458752131072524288000655366553689788921381137604079618510878976128888811826371523775200983040039321601310725242880524288131072262144629145600275251200065536655360000419430400000262144000000000000011765615896182947201159069904098951590699050317515896183202145
9088void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 17u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0026313789613789641943042560016241094400x7f6ef8b5e2800x7f6ef5c25540005242885242881179648014548992119275522988602988600000009175040000015680340787233988341129342621423001310721293365616800131072000001507328458752131072524288000131072655362172924144505165715828158913959168240385622978912975399800119275521310720019660852428805242881310721179648763363328340787200065536655360000419430400000262144000000000000015125615896183248864159069905278151590699070781615896183592857
9189void benchmark_func<double, 256, 8u, 17u>(double, double*) [clone .kd]0026613789613789641943042560016241111680x7f6ef8b5e1000x7f6ef5c2558000524288524288131072013565952121241602997262997260000000000015120321126432030445669536565790065536638005616800065536009175040015073284587526553652428800065536655362133615144760051615278487012976128238540822845792958505600121241601966080131072524288052428865536131072775946240321126400065536655360000419430400000131072000000000000014565615896183638866159069907311761590699091117615896183986998
9290void benchmark_func<__half2, 256, 8u, 17u>(__half2, __half2*) [clone .kd]002691378961378964194304256008241128960x7f6ef63fdf800x7f6ef5c255c00052428852428819660801382809612255232164476164476009175040000000001512032768003267211561291062265000131072129336561680655366553600000150732845875213107252428800065536655361022316473452224054471135132382721304400120256915502678001225523232768001310725242880524288131072196608784334848327680000065536655360000419430400000262144000000000000014565615896184034137159069909346961590699103101715896184295291
9391void benchmark_func<int, 256, 8u, 17u>(int, int*) [clone .kd]0027213789613789641943042560012241151360x7f6ef63fde000x7f6ef5c2560000524288524288131072022413312208404482301242301240000000000019600432537643084611191601163180300131072129336561680655366553600000197918724587521310725242880006553665536145775746182658281057519662175795218398721727975222989610020840448262144013107252428805242881310721310721333788672432537600065536655360000419430400000262144000000000000019045615896184341360159069910546971590699119405715896184643233
9492void benchmark_func<float, 256, 8u, 18u>(float, float*) [clone .kd]0027513789613789641943042560012241166080x7f6ef63fdc800x7f6ef5c2564000524288524288262144011796480102236161629701629700000007340032000012880281804828102375681456178570013107212933656168065536655360000015073284587521310725242880006553665536921825463821383642696518112721921297368119143315353410001022361639321601310725242880524288131072262144654311424281804800065536655360000419430400000262144000000000000012325615896184696592159069912258971590699132029815896184948176
9593void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 18u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0027813789613789641943042560016241183360x7f6ef63fdb000x7f6ef5c25680005242885242881179648015073280124518402984082984080000009699328000016240353894435290921129906441973001310721293365616800131072000001507328458752131072524288000131072655362045322624529220914475659714483456237839222727432944048600124518401310720019660852428805242881310721179648796917760353894400065536655360000419430400000262144000000000000015685615896184993805159069913444581590699152317815896185335338
9694void benchmark_func<double, 256, 8u, 18u>(double, double*) [clone .kd]0028113789613789641943042560016241200640x7f6ef63fd9800x7f6ef5c256c000524288524288131072014221312127139842977042977040000000000015680340787234005455664956052390065536638005616800065536009699328015073284587526553652428800065536655362080950665128186514324724913565952238952822870572960571400127139841966080131072524288052428865536131072813694976340787200065536655360000419430400000131072000000000000015125615896185381437159069915479781590699172861915896185725769
9795void benchmark_func<__half2, 256, 8u, 18u>(__half2, __half2*) [clone .kd]0028413789613789641943042560012241217920x7f6ef63fd8000x7f6ef5c257000052428852428819660801435238412779520164180164180009699328000000001568034078723395789112125954455120013107212933656168065536655360000015073284587521310725242880006553665536983143373044700054104777137625601313208121295415664090001277952032768001310725242880524288131072196608817889280340787200065536655360000419430400000262144000000000000015125615896185770878159069917527791590699184893915896186033492
9896void benchmark_func<int, 256, 8u, 18u>(int, int*) [clone .kd]0028713789613789641943042560012241240320x7f6ef63fd6800x7f6ef5c257400052428852428813107202346188821889024239112239112000000000002072045219844504171581828874000300131072129336561680655366553600000208404484587521310725242880006553665536150260062178748641095786702280652819140481804554233181900021889024262144013107252428805242881310721310721400897536452198400065536655360000419430400000262144000000000000020165615896186085961159069918734191590699201918015896186408394
9997void benchmark_func<float, 256, 8u, 20u>(float, float*) [clone .kd]0029013789613789641943042560012241255040x7f6ef8b5e5000x7f6ef5c257800052428852428826214401258291211010048162726162726000000812646400001400030146563005927112156794422890013107212933656168065536655360000015073284587521310725242880006553665536931059913750043143546936120586241297344119084915351541001101004839321601310725242880524288131072262144704643072301465600065536655360000419430400000262144000000000000013445615896186461452159069920510201590699214654015896186720567
10098void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 20u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0029313789613789641943042560012241274880x7f6ef8b5e3800x7f6ef5c257c00052428852428811796480161218561350041629817629817600000010747904000017360380108837926195610474443255001310721293365616800131072000001507328458752131072524288000131072655361952121955597079712370936615532032238660822787812948034100135004161310720019660852428805242881310721179648864026624380108800065536655360000419430400000262144000000000000016805615896186767256159069921713401590699235198115896187112258
10199void benchmark_func<double, 256, 8u, 20u>(double, double*) [clone .kd]0029613789613789641943042560012241292160x7f6ef8b5e2000x7f6ef5c258000052428852428813107201526988813762560300247300247000000000001680036700163661773112940248154700655366380056168000655360010747904015073284587526553652428800065536655362000519815287980613255764714614528239420022847492959939400137625601966080131072524288052428865536131072880803840367001600065536655360000419430400000131072000000000000016245615896187160067159069923764611590699255838215896187508549
102100void benchmark_func<__half2, 256, 8u, 20u>(__half2, __half2*) [clone .kd]0029913789613789641943042560012241309440x7f6ef8b5e0800x7f6ef5c258400052428852428819660801540096013828096171087171087001074790400000000162403670016365722101866587521500131072129336561680655366553600000150732845875213107252428800065536655361016646752856132658292213148111361372056126280616311420001382809632768001310725242880524288131072196608884998144367001600065536655360000419430400000262144000000000000015685615896187554538159069925830221590699268414215896187822802
103101void benchmark_func<int, 256, 8u, 20u>(int, int*) [clone .kd]0030213789613789641943042560012241334400x7f6ef63fdf000x7f6ef5c2588000524288524288131072025559040239861762595302595300000000000021840491520048951541021547787944000131072129336561680655366553600000229376004587521310725242880006553665536160366026175606571179016892490368020800081966446253808390023986176262144013107252428805242881310721310721535115264491520000065536655360000419430400000262144000000000000021285615896187871491159069927068621590699286206315896188188884
104102void benchmark_func<float, 256, 8u, 22u>(float, float*) [clone .kd]0030513789613789641943042560012241349120x7f6ef63fdd800x7f6ef5c258c00052428852428826214401330380811796480161750161750000000891289600001456031457283135833611072510085090013107212933656168065536655360000015073284587521310725242880006553665536985555343175403053956448128450561297288119257015376486001179648039321601310725242880524288131072262144754974720314572800065536655360000419430400000262144000000000000014005615896188242713159069928988631590699299374315896188499877
105103void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 22u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0030813789613789641943042560012241368960x7f6ef63fdc000x7f6ef5c25900005242885242881179648017104896145489922958652958650000001179648000001792040632324053551013824903987001310721293365616800131072000001507328458752131072524288000131072655361965316726169097411826009016580608236816022618772926433300145489921310720019660852428805242881310721179648931135488406323200065536655360000419430400000262144000000000000017365615896188546386159069930193431590699319838415896188897488
106104void benchmark_func<double, 256, 8u, 22u>(double, double*) [clone .kd]0031113789613789641943042560012241388800x7f6ef63fda800x7f6ef5c259400052428852428813107201625292814811136296639296639000000000001792039321603921373561204345830400655366380056168000655360011796480015073284587526553652428800065536655362080802724435631814806085015663104238836022797592950076700148111361966080131072524288052428865536131072947912704393216000065536655360000419430400000131072000000000000017365615896188944067159069932251041590699340510415896189289429
107105void benchmark_func<__half2, 256, 8u, 22u>(__half2, __half2*) [clone .kd]0031413789613789641943042560012241408640x7f6ef63fd9000x7f6ef5c259800052428852428819660801644953614876672179253179253001179648000000000179203932160391761856145265742400013107212933656168065536655360000015073284587521310725242880006553665536987590702354459659354762158597121436568132651917123400001487667232768001310725242880524288131072196608952107008393216000065536655360000419430400000262144000000000000017365615896189335388159069934284641590699353406515896189606932
108106void benchmark_func<int, 256, 8u, 22u>(int, int*) [clone .kd]0031713789613789641943042560012241436160x7f6ef63fd7800x7f6ef5c259c00052428852428813107202765619226083328280653280653000000000002408053084165289673582105443357700131072129336561680655366553600000250347524587521310725242880006553665536184625413180516381395729432700083222475922128013275036930026083328262144013107252428805242881310721310721669332992530841600065536655360000419430400000262144000000000000023525615896189652231159069935579051590699372798515896189986804
109107void benchmark_func<float, 256, 8u, 24u>(float, float*) [clone .kd]0032013789613789641943042560012241453440x7f6ef63fd6000x7f6ef5c25a0000524288524288262144014090240125829121624861624860000009699328000015680334233633314781151212110096520013107212933656168065536655360000015073284587521310725242880006553665536980482622801299556403779136314881301632119422315414638001258291239321601310725242880524288131072262144805306368334233600065536655360000419430400000262144000000000000015125615896190040443159069937599861590699385518615896190305817
110108void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 24u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0032313789613789641943042560012241475840x7f6ef8b5e4800x7f6ef5c25a400052428852428811796480182190081559756829819429819400000012845056000019600432537643128645613325441768001310721293365616800131072000001507328458752131072524288000131072655362077474964298211714713619517629184236074422556622916318900155975681310720019660852428805242881310721179648998244352432537600065536655360000419430400000262144000000000000019045615896190352926159069938812661590699406414715896190699758
111109void benchmark_func<double, 256, 8u, 24u>(double, double*) [clone .kd]0032613789613789641943042560012241495680x7f6ef8b5e3000x7f6ef5c25a80005242885242881310720173015041585971229629829629800000000000190404194304418275211215197731551006553663800561680006553600128450560150732845875265536524288000655366553619678307942974665137096734167116802367848226446629302198001585971219660801310725242880524288655361310721015021568419430400065536655360000419430400000131072000000000000018485615896190746017159069941004671590699428110715896191096789
112110void benchmark_func<__half2, 256, 8u, 24u>(__half2, __half2*) [clone .kd]0032913789613789641943042560012241515520x7f6ef8b5e1800x7f6ef5c25ac000524288524288196608017498112159252481875721875720012845056000000001848041943044179332015828855294001310721293365616806553665536000001507328458752131072524288000655366553610511295020809365673952971690828814954241383662178249570015925248327680013107252428805242881310721966081019215872419430400065536655360000419430400000262144000000000000017925615896191142368159069943051071590699441550815896191417682
113111void benchmark_func<int, 256, 8u, 24u>(int, int*) [clone .kd]0033213789613789641943042560012241543040x7f6ef8b5e0000x7f6ef5c25b000052428852428813107202975334428180480300569300569000000000002520057016325678299652196687586300131072129336561680655366553600000271319044587521310725242880006553665536192765126171124121465547302909798424013602287313295226860028180480262144013107252428805242881310721310721803550720570163200065536655360000419430400000262144000000000000024645615896191467611159069944390281590699461998815896191817523
114112void benchmark_func<float, 256, 8u, 28u>(float, float*) [clone .kd]0033513789613789641943042560012241562880x7f6ef63fde800x7f6ef5c25b4000524288524288262144015663104141557761725981725980000001127219200001680037355523722649161527710098270013107212933656168065536655360000015073284587521310725242880006553665536979734072266990860099147152043521377760127626716463501001415577639321601310725242880524288131072262144905969664373555200065536655360000419430400000262144000000000000016245615896191871442159069946518291590699475310915896192130836
115113void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 28u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0033813789613789641943042560012241587840x7f6ef63fdd000x7f6ef5c25b8000524288524288117964802031616017694720299053299053000000149422080000218404849664483254911215074443850001310721293365616800131072000001507328458752131072524288000131072655361567624616602237471013751197263362390160226150329179118001769472013107200196608524288052428813107211796481132462080484966400065536655360000419430400000262144000000000000021285615896192176405159069947777491590699496207015896192523707
116114void benchmark_func<double, 256, 8u, 28u>(double, double*) [clone .kd]0034113789613789641943042560012241610240x7f6ef63fdb800x7f6ef5c25bc0005242885242881310720193986561795686429698329698300000000000212804718592470135311220823448421006553663800561680006553600149422080150732845875265536524288000655366553618637243159227766108335833188088322378192225871029176658001795686419660801310725242880524288655361310721149239296471859200065536655360000419430400000131072000000000000020725615896192570316159069949854301590699517039015896192917199
117115void benchmark_func<__half2, 256, 8u, 28u>(__half2, __half2*) [clone .kd]0034413789613789641943042560012241632640x7f6ef63fda000x7f6ef5c25c0000524288524288196608019595264180224002073442073440014942208000000002072047185924694144021059848256001310721293365616806553665536000001507328458752131072524288000655366553612076699820213266815482921900544016567761533994197728860018022400327680013107252428805242881310721966081153433600471859200065536655360000419430400000262144000000000000020165615896192963248159069951939101590699531679115896193253761
118116void benchmark_func<int, 256, 8u, 28u>(int, int*) [clone .kd]0034713789613789641943042560012241665280x7f6ef63fd8800x7f6ef5c25c400052428852428813107203394764832374784340272340272000000000002856064880646457240782364388360700131072129336561680655366553600000313262084587521310725242880006553665536235714018170451341853765963329228827203442606627336726020032374784262144013107252428805242881310721310722071986176648806400065536655360000419430400000262144000000000000028005615896193299140159069953411111590699554735115896193698791
119117void benchmark_func<float, 256, 8u, 32u>(float, float*) [clone .kd]0035013789613789641943042560012241685120x7f6ef63fd7000x7f6ef5c25c800052428852428826214401723596815728640184064184064000000128450560000190404128768411203756153181016216001310721293365616806553665536000001507328458752131072524288000655366553611546345118116738805694971677721614788241366866176245450015728640393216013107252428805242881310722621441006632960412876800065536655360000419430400000262144000000000000018485615896193734811159069956187121590699572991215896194007265
120118void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 32u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0035313789613789641943042560012241712640x7f6ef8b5e5800x7f6ef5c25cc00052428852428811796480223477761979187229625629625600000017039360000023520537395253544455618885875049001310721293365616800131072000001507328458752131072524288000131072655361587419196522040171698030218234882365160223875028909217001979187213107200196608524288052428813107211796481266679808537395200065536655360000419430400000262144000000000000022965615896194053234159069957550321590699593695315896194415855
121119void benchmark_func<double, 256, 8u, 32u>(double, double*) [clone .kd]0035613789613789641943042560012241737600x7f6ef8b5e4000x7f6ef5c25d0000524288524288131072021495808200540162969262969260000000000023520524288052251231121998655323000655366380056168000655360017039360015073284587526553652428800065536655361669942896760483778483468209059842427024229469729647207002005401619660801310725242880524288655361310721283457024524288000065536655360000419430400000131072000000000000022965615896194462874159069959617531590699614767315896194812767
122120void benchmark_func<__half2, 256, 8u, 32u>(__half2, __half2*) [clone .kd]0035913789613789641943042560012241762560x7f6ef8b5e2800x7f6ef5c25d40005242885242881966080216924162011955222616522616500170393600000000022960524288052216390206558752530013107212933656168065536655360000015073284587521310725242880006553665536150148428167057001123401362110259218042881694317218383360020119552327680013107252428805242881310721966081287651328524288000065536655360000419430400000262144000000000000022405615896194859256159069961731141590699630751415896195160369
123121void benchmark_func<int, 256, 8u, 32u>(int, int*) [clone .kd]0036213789613789641943042560012241797760x7f6ef8b5e1000x7f6ef5c25d800052428852428813107203814195236569088380800380800000000000003192072744967243505663179785735200131072129336561680655366553600000355205124587521310725242880006553665536268270400167621352140216733748659230451362932899379522430036569088262144013107252428805242881310721310722340421632727449600065536655360000419430400000262144000000000000031365615896195208638159069963310341590699656303515896195650308
124122void benchmark_func<float, 256, 8u, 40u>(float, float*) [clone .kd]0036513789613789641943042560012241822720x7f6ef63fdf800x7f6ef5c25dc00052428852428826214402038169618874368211734211734000000159907840000218404915200489598964198439847860013107212933656168065536655360000015073284587521310725242880006553665536137378046159374881015176141992294416932161582471204115620018874368393216013107252428805242881310722621441207959552491520000065536655360000419430400000262144000000000000021285615896195673607159069966100751590699673663515896195966401
125123void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 40u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0036813789613789641943042560012241855360x7f6ef63fde000x7f6ef5c25e00005242885242881179648026607616239861763075983075980000002123366400002856064225286395605173262544462610013107212933656168001310720000015073284587521310725242880001310726553619129828948851508116428989260177922468808235020430292477002398617613107200196608524288052428813107211796481535115264642252800065536655360000419430400000262144000000000000028005615896196013500159069967620751590699695551615896196419291
126124void benchmark_func<double, 256, 8u, 40u>(double, double*) [clone .kd]0037113789613789641943042560012241885440x7f6ef63fdc800x7f6ef5c25e400052428852428813107202569011224248320312320312320000000000002800062914566258412562901244202200655366380056168000655360021233664015073284587526553652428800065536655361699403985091843193921679251002882487960235480130375131002424832019660801310725242880524288655361310721551892480629145600065536655360000419430400000131072000000000000027445615896196429970159069969828761590699717343715896196841641
127125void benchmark_func<__half2, 256, 8u, 40u>(__half2, __half2*) [clone .kd]0037413789613789641943042560012241915520x7f6ef63fdb000x7f6ef5c25e800052428852428819660802588672024313856266809266809002123366400000000274406291456626300856293388658480013107212933656168065536655360000015073284587521310725242880006553665536167801597174008361251038652529689621304402019772260216780024313856327680013107252428805242881310721966081556086784629145600065536655360000419430400000262144000000000000026885615896196852121159069971985571590699735871715896197190253
128126void benchmark_func<int, 256, 8u, 40u>(int, int*) [clone .kd]0037713789613789641943042560012241958400x7f6ef63fd9800x7f6ef5c25ec00052428852428813107204659609645023232461203461203000000000003808088473608805795683897487268900131072129336561680655366553600000439746564587521310725242880006553665536337057310165446692745719054594073636951603577852462702390045023232262144013107252428805242881310721310722881486848884736000065536655360000419430400000262144000000000000037525615896197237312159069973830381590699766591815896197726911
129127void benchmark_func<float, 256, 8u, 48u>(float, float*) [clone .kd]0038013789613789641943042560012241985920x7f6ef63fd8000x7f6ef5c25f00005242885242882621440234618882202009624245424245400000019136512000025760570163256746631312231410047670013107212933656168065536655360000015073284587521310725242880006553665536171042245143023651336712082306867219417201836400237131090022020096393216013107252428805242881310722621441409286144570163200065536655360000419430400000262144000000000000025205615896197746791159069977121591590699786095915896198062044
130128void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 48u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0038313789613789641943042560012242023680x7f6ef63fd6800x7f6ef5c25f400052428852428811796480308019202818048033701033701000000025427968000032480747110474403751003055810132810013107212933656168001310720000015073284587521310725242880001310726553621221826441200076140806092302120962690264256505633075076002818048013107200196608524288052428813107211796481803550720747110400065536655360000419430400000262144000000000000031925615896198108773159069978855991590699809360015896198541543
131129void benchmark_func<double, 256, 8u, 48u>(double, double*) [clone .kd]0038613789613789641943042560012242058880x7f6ef8b5e5000x7f6ef5c25f80005242885242881310720298844162844262433265133265100000000000324807340032730273511443666444352006553663800561680006553600254279680150732845875265536524288000655366553618466782340840406114532825292945922640264251235832403086002844262419660801310725242880524288655361310721820327936734003200065536655360000419430400000131072000000000000031925615896198551723159069981323201590699834032115896198985293
132130void benchmark_func<__half2, 256, 8u, 48u>(__half2, __half2*) [clone .kd]0038913789613789641943042560012242094080x7f6ef8b5e3800x7f6ef5c25fc00052428852428819660803008102428508160307110307110002542796800000000319207340032730818456349678630330013107212933656168065536655360000015073284587521310725242880006553665536218185478191333031695609752949120024492242343038302665620028508160327680013107252428805242881310721966081824522240734003200065536655360000419430400000262144000000000000031365615896198995703159069984011211590699858688215896199361105
133131void benchmark_func<int, 256, 8u, 48u>(int, int*) [clone .kd]0039213789613789641943042560012242144640x7f6ef8b5e2000x7f6ef5c260000052428852428813107205498470453411840543444543444000000000004480010420224103741306748838869458001310721293365616806553665536000005236326445875213107252428800065536655363951046701838235032239297654329344434168842240465468426800534118402621440131072524288052428813107213107234183577601042022400065536655360000419430400000262144000000000000044245615896199410714159069986108821590699894480315896199955962
134132void benchmark_func<float, 256, 8u, 56u>(float, float*) [clone .kd]0039513789613789641943042560012242177280x7f6ef8b5e0800x7f6ef5c26040005242885242882621440266731522516582427192427192400000022282240000029120648806464595671452873910073380013107212933656168065536655360000015073284587521310725242880006553665536189844518147973931488327252621440021734322069694268000090025165824393216013107252428805242881310722621441610612736648806400065536655360000419430400000262144000000000000028565615896199975641159069990102431590699917760315896200311114
135133void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 56u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0039813789613789641943042560012242220160x7f6ef63fdf000x7f6ef5c260800052428852428811796480349962243237478436733836733800000029622272000037520851968084768792104597910129530013107212933656168001310720000015073284587521310725242880001310726553624265166536758756171486509344064002906768278811135935413003237478413107200196608524288052428813107211796482071986176851968000065536655360000419430400000262144000000000000036965615896200362163159069992011241590699942944415896200798223
136134void benchmark_func<double, 256, 8u, 56u>(double, double*) [clone .kd]0040113789613789641943042560012242260480x7f6ef63fdd800x7f6ef5c260c0005242885242881310720340787203263692836478936478900000000000369608388608834886811249069446677006553663800561680006553600296222720150732845875265536524288000655366553625535550738104942183761669334888962934168282004336270658003263692819660801310725242880524288655361310722088763392838860800065536655360000419430400000131072000000000000036405615896200808843159069994635241590699969344515896201255153
137135void benchmark_func<__half2, 256, 8u, 56u>(__half2, __half2*) [clone .kd]0040413789613789641943042560012242300800x7f6ef63fdc000x7f6ef5c261000052428852428819660803427532832702464347659347659002962227200000000364008388608834485957485388473180013107212933656168065536655360000015073284587521310725242880006553665536236775053199708861831186633368550427769842664804344189980032702464327680013107252428805242881310721966082092957696838860800065536655360000419430400000262144000000000000035845615896201265702159069997251251590699993712615896201670233
138136void benchmark_func<int, 256, 8u, 56u>(int, int*) [clone .kd]0040713789613789641943042560012242359040x7f6ef63fda800x7f6ef5c261400052428852428813107206337331261800448623555623555000000000005152011993088119389196752240850767001310721293365616806553665536000006075187245875213107252428800065536655364738949181856684639261012062717952499190448760596312565200618004482621440131072524288052428813107213107239552286721199308800065536655360000419430400000262144000000000000050965615896201699073159069999697661590700035488715896202303169
139137void benchmark_func<float, 256, 8u, 64u>(float, float*) [clone .kd]0041013789613789641943042560012242394240x7f6ef63fd9000x7f6ef5c26180005242885242882621440298188802831155230470530470500000025427968000032480727449672391281394404710082940013107212933656168065536655360000015073284587521310725242880006553665536207726774165119951618546512936012824312402317954298769050028311552393216013107252428805242881310722621441811939328727449600065536655360000419430400000262144000000000000031925615896202322559159070003950471590700058144815896202680481
140138void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 64u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0041313789613789641943042560012242442240x7f6ef63fd7800x7f6ef5c261c00052428852428811796480391905283656908839842039842000000033816576000041440956825695156531864607910061780013107212933656168001310720000015073284587521310725242880001310726553626932562432476448198248472386007043195072308411339756500003656908813107200196608524288052428813107211796482340421632956825600065536655360000419430400000262144000000000000040885615896202731210159070006052881590700085568915896203195239
141139void benchmark_func<double, 256, 8u, 64u>(double, double*) [clone .kd]0041613789613789641943042560012242487680x7f6ef63fd6000x7f6ef5c26200005242885242881310720382730243683123239183039183000000000000414409437184938473811351110437365006553663800561680006553600338165760150732845875265536524288000655366553627851251730692425210136892376832003138880302814039214528003683123219660801310725242880524288655361310722357198848943718400065536655360000419430400000131072000000000000040885615896203205869159070008902491590700113889015896203671239
142140void benchmark_func<__half2, 256, 8u, 64u>(__half2, __half2*) [clone .kd]0041913789613789641943042560012242533120x7f6ef8b5e4800x7f6ef5c262400052428852428819660803846963236896768388406388406003381657600000000403209437184938585458547378878830013107212933656168065536655360000015073284587521310725242880006553665536279933558204271642216265863787980830946002991075386649370036896768327680013107252428805242881310721966082361393152943718400065536655360000419430400000262144000000000000039765615896203682158159070011708901590700140753115896204135798
143141void benchmark_func<int, 256, 8u, 64u>(int, int*) [clone .kd]004221378961378964194304256008242555520x7f6ef8b5e3000x7f6ef5c262800052428852428847841280810024967117209671912871912800000000000201601605632016051872564384101308900131072129336561680655366553600000694681604587521310725242880002162688655365365309808291922237477195078839808575110456321337289680700711720964915200022282245242880524288131072478412845550141441605632000065536655360000419430400000262144000000000000019605615896204146258159070014393711590700189169215896204815513
144142void benchmark_func<float, 256, 8u, 80u>(float, float*) [clone .kd]0042513789613789641943042560012242598400x7f6ef8b5e1800x7f6ef5c262c0005242885242882621440361103363460300836554136554100000031719424000039200884736088010261744842510107640013107212933656168065536655360000015073284587521310725242880006553665536252967044166667072006487533565158429100002800894362302300034603008393216013107252428805242881310722621442214592512884736000065536655360000419430400000262144000000000000038645615896204835193159070019299331590700215553315896205268063
145143void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 80u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0042813789613789641943042560012242656640x7f6ef8b5e0000x7f6ef5c263000052428852428811796480476446724502323247003147003100000042205184000050400116654081160699311267059100745900131072129336561680013107200000157286445875213107252428800013107265536348399066291342862722099324705484837714483661209473714160045023232131072001966085242880524288131072117964828814868481166540800065536655360000419430400000262144000000000000049845615896205279273159070022156931590700251377415896205774282
146144void benchmark_func<double, 256, 8u, 80u>(double, double*) [clone .kd]0043113789613789641943042560012242712320x7f6ef63fde800x7f6ef5c26340005242885242881310720467271684528537647311147311100000000000504001146880011395339293782436877660065536638005616800065536004220518401572864458752655365242880006553665536344656706299456312685737314613734437830243674010474696090045285376196608013107252428805242886553613107228982640641146880000065536655360000419430400000131072000000000000049845615896205804831159070025494551590700284817615896206311710
147145void benchmark_func<__half2, 256, 8u, 80u>(__half2, __half2*) [clone .kd]004341378961378964194304256008242732160x7f6ef63fdd000x7f6ef5c26380005242885242884849664056229888463339524831214831210042205184000000001792014090240140859603459910064220013107212933656168065536655360000019005444587521310725242880002162688655363494509768727224220811153454067200386132837495534851018600463339524980736022282245242880524288131072484966429653729281409024000065536655360000419430400000262144000000000000017365615896206323339159070028856161590700318225715896206850948
148146void benchmark_func<int, 256, 8u, 80u>(int, int*) [clone .kd]004371378961378964194304256008242757120x7f6ef63fdb800x7f6ef5c263c000524288524288478412809777971287949312879498879498000000000002352019202048191945041127301102252900131072129336561680655366553600000862453764587521310725242880002162688655366755452958313150449679676795617024704012069262988968953800879493124915200022282245242880524288131072478412856287559681920204800065536655360000419430400000262144000000000000022965615896206861648159070032201771590700377713915896207632790
149147void benchmark_func<float, 256, 8u, 96u>(float, float*) [clone .kd]0044013789613789641943042560012242807680x7f6ef63fda000x7f6ef5c2640000524288524288262144042401792409600004272394272390000003801088000004480010420224103599058360775100842700131072129336561680655366553600000157286445875213107252428800065536655363191647551786645425928972542008576341682433071224277167100409600003932160131072524288052428813107226214426214400001042022400065536655360000419430400000262144000000000000044245615896207653170159070038180991590700408194015896208128759
150148void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 96u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0044313789613789641943042560012242876160x7f6ef63fd8800x7f6ef5c264400052428852428811796480559677445341184055093155093100000050593792000059920137625601366344247682169102564200131072129336561680013107200000157286445875213107252428800013107265536406480028274119243236246485544345644139684307645557494860053411840131072001966085242880524288131072117964834183577601376256000065536655360000419430400000262144000000000000059365615896208139119159070041168201590700446770115896208710797
151149void benchmark_func<double, 256, 8u, 96u>(double, double*) [clone .kd]0044613789613789641943042560012242942080x7f6ef63fd7000x7f6ef5c26480005242885242881310720551157765367398455292055292000000000000593601356595213482160389844734454480065536638005616800065536005059379201572864458752655365242880006553665536415407635271696473337120365452595244090164295664556205980053673984196608013107252428805242886553613107234351349761356595200065536655360000419430400000131072000000000000058805615896208721336159070045334611590700488354215896209289164
152150void benchmark_func<__half2, 256, 8u, 96u>(__half2, __half2*) [clone .kd]004491378961378964194304256008242969600x7f6ef8b5e5800x7f6ef5c264c00052428852428838010880625213445472256056365056365000505937920000000024640154664961545754311077410052600013107212933656168065536655360000019005444587521310725242880001638400655364145289238538358726826239260882944451007243941965682531600547225603932160017039365242880524288131072380108835022438401546649600065536655360000419430400000262144000000000000024085615896209300843159070049469021590700529410415896209848551
153151void benchmark_func<int, 256, 8u, 96u>(int, int*) [clone .kd]004521378961378964194304256008242999680x7f6ef8b5e4000x7f6ef5c2650000524288524288478412801145569281047265281041285104128500000000000268802234777622337039112101441008455001310721293365616806553665536000001030225924587521310725242880002162688655367927362978396259159637946611239424083399128216878106424920001047265284915200022282245242880524288131072478412867024977922234777600065536655360000419430400000262144000000000000026325615896209877721159070053536241590700601522615896210753961
154152void benchmark_func<float, 256, 8u, 128u>(float, float*) [clone .kd]004551378961378964194304256008243027200x7f6ef8b5e2800x7f6ef5c2654000524288524288478412808087142471041024720690720690000000673710080000246402025062420242026113778010202650013107212933656168065536655360000019005444587521310725242880002162688655365469985309024931237804048278708736578192856561047319834200710410244915200022282245242880524288131072478412845466255362025062400065536655360000419430400000262144000000000000024085615896210773461159070060555461590700650322815896211432866
155153void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 128u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0045813789613789641943042560012243054720x7f6ef8b5e1000x7f6ef5c265800052428852428858327040821166087117209672455372455300000067371008000025200204472322043739657975810070150013107212933656168001310720000019005444587521310725242880002228224655365441240599639512236777501779953920576839256662647339141800711720965963776022937605242880524288131072583270445550141442044723200065536655360000419430400000262144000000000000024645615896211444236159070065728281590700703794915896212132560
156154void benchmark_func<double, 256, 8u, 128u>(double, double*) [clone .kd]0046113789613789641943042560012243082240x7f6ef63fdf800x7f6ef5c265c000524288524288478412808080588871041024722160722160000000000002464019595264195862951128599443975006553663800561680006553600673710080190054445875265536524288000216268865536552225870987147733748678977864320057860245661464733119540071041024484966402228224524288052428865536478412845466255361959526400065536655360000419430400000131072000000000000024085615896212143570159070071016301590700756355115896212838965
157155void benchmark_func<__half2, 256, 8u, 128u>(__half2, __half2*) [clone .kd]004641378961378964194304256008243109760x7f6ef63fde000x7f6ef5c2660000524288524288484966408139571271499776724551724551006737100800000000252002038169620372652113917510250780013107212933656168065536655360000019005444587521310725242880002162688655365572768139034541338769837679233024580060856933937370893500714997764980736022282245242880524288131072484966445759856642038169600065536655360000419430400000262144000000000000024645615896212850264159070076275511590700807923315896213529859
158156void benchmark_func<int, 256, 8u, 128u>(int, int*) [clone .kd]004671378961378964194304256008243132160x7f6ef63fdc800x7f6ef5c26640005242885242888978432015649996813828096013700461370046000000000002016031522816315171405644411014613001310721293365616806553665536000001365770244587521310725242880004259840655361074120840961005638257801491522401281094833610814091140106697001382809609109504043253765242880524288131072897843288499814403152281600065536655360000419430400000262144000000000000019605615896213541079159070081422731590700901091615896214657144
159157void benchmark_func<float, 256, 8u, 256u>(float, float*) [clone .kd]004701378961378964194304256008243159680x7f6ef63fdb000x7f6ef5c2668000524288524288897843201563688961381498881370184137018400000013447987200002464038993920389861211137467101344600131072129336561680655366553600000190054445875213107252428800042598406553610751102411109549098120462761521090561096416010843347140535259001381498889109504043253765242880524288131072897843288415928323899392000065536655360000419430400000262144000000000000024085615896214678293159070090598761590700991363915896215784939
160158void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 256u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0047313789613789641943042560012243187200x7f6ef63fd9800x7f6ef5c266c000524288524288100270080157614080138280960137353213735320000001344798720000252003912499239116793112853210071160013107212933656168001310720000019005444587521310725242880004325376655361067303771115602568798346963153354240109980641085641814068673600138280960101580800439091252428805242881310721002700888499814403912499200065536655360000419430400000262144000000000000024645615896215796408159070099531591590701083812215896216935843
161159void benchmark_func<double, 256, 8u, 256u>(double, double*) [clone .kd]0047613789613789641943042560012243214720x7f6ef63fd8000x7f6ef5c267000052428852428889784320156303360138149888136959813695980000000000024640384696323846182956769459378900655366380056168000655360013447987201900544458752655365242880004259840655361069201789114402723802755546152043520109830881085231914054425200138149888904396804325376524288052428865536897843288415928323846963200065536655360000419430400000131072000000000000024085615896216946603159070108819621590701176068515896218086997
162160void benchmark_func<__half2, 256, 8u, 256u>(__half2, __half2*) [clone .kd]004791378961378964194304256008243242240x7f6ef63fd6800x7f6ef5c2674000524288524288904396801568931841386086401376486137648600134479872000000002520039059456390499271148334101008900131072129336561680655366553600000190054445875213107252428800042598406553610780833751108631028145869291526333441100424010880917140993823001386086409175040043253765242880524288131072904396888709529603905945600065536655360000419430400000262144000000000000024645615896218098687159070118120451590701267140815896219221492
163161void benchmark_func<int, 256, 8u, 256u>(int, int*) [clone .kd]004821378961378964194304256008243264640x7f6ef8b5e5000x7f6ef5c267800052428852428817367040030749491227249868826617622661762000000000002016060489728604839681125123101117800131072129336561680655366553600000270794752458752131072524288000845414465536212611234411815527917089162972990407682131825621186857274515807002724986881749811208519680524288052428813107217367040174399160326048972800065536655360000419430400000262144000000000000019605615896219232322159070127104481590701440949415896221186338
164162void benchmark_func<float, 256, 8u, 512u>(float, float*) [clone .kd]004851378961378964194304256008243292160x7f6ef8b5e3800x7f6ef5c267c0005242885242881736704003073638402723676162671023267102300000026869760000002464077266944772584605786391011655001310721293365616806553665536000001900544458752131072524288000845414465536211159169614954393516631380652989096962136063221225349275023332002723676161749811208519680524288052428813107217367040174315274247726694400065536655360000419430400000262144000000000000024085615896221204378159070145072541590701617206015896223130265
165163void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 512u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0048813789613789641943042560012243319680x7f6ef8b5e2000x7f6ef5c268000052428852428818415616030860902427249868826698862669886000000268697600000025200773980167738948611279921005431001310721293365616800131072000001900544458752131072524288000851968065536212585576315375041416719504693001548802134789621233274275176560002724986881854668808585216524288052428813107218415616174399160327739801600065536655360000419430400000262144000000000000024645615896223141185159070162615001590701798582615896225137790
166164void benchmark_func<double, 256, 8u, 512u>(double, double*) [clone .kd]0049113789613789641943042560012243347200x7f6ef8b5e0800x7f6ef5c268400052428852428817367040030729830427236761626710492671049000000000002464076218368762104921137760492429006553663800561680006553600268697600019005444587526553652428800084541446553621201529051503870061670921739298844160213585362122796627504075500272367616174325760851968052428805242886553617367040174315274247621836800065536655360000419430400000131072000000000000024085615896225148710159070180863061590701980119215896227128056
167165void benchmark_func<__half2, 256, 8u, 512u>(__half2, __half2*) [clone .kd]004941378961378964194304256008243374720x7f6ef63fdf000x7f6ef5c26880005242885242881743257603078881282728263682673475267347500268697600000000002520077332480773227715794631022721001310721293365616806553665536000001900544458752131072524288000845414465536213221014614978298016829931822994339842139044821257250275485214002728263681756364808519680524288052428813107217432576174608875527733248000065536655360000419430400000262144000000000000024645615896227139446159070198898321590702156343715896229078312
168166void benchmark_func<int, 256, 8u, 512u>(int, int*) [clone .kd]0049713789613789641943042560082400x7f6ef63fdd800x7f6ef5c268c0005242885242883414425606094848005409341445258589525858900000000000201601202585601202532001125305101029000131072129336561680655366553600000539230208458752131072524288000168427526553642293242311676395773469042606592642048420501844192212854337555300540934144342753280169082885242880524288131072341442563461978521612025856000065536655360000419430400000262144000000000000019605615896229088542159070216501581590702500680915896232708551