Files
rocm-systems/tests/workloads/dev1/mi200/SQ_LEVEL_WAVES.csv
T
colramos-amd 62d130b458 Initial commit
2022-11-04 14:49:36 -05:00

48 KiB

1IndexKernelNamegpu-idqueue-idqueue-indexpidtidgrdwgrldsscrvgprsgprfbarsigobjGRBM_COUNTGRBM_GUI_ACTIVECPC_ME1_BUSY_FOR_PACKET_DECODESQ_CYCLESSQ_WAVESSQ_WAVE_CYCLESSQ_BUSY_CYCLESSQ_LEVEL_WAVESSQ_ACCUM_PREV_HIRESDispatchNsBeginNsEndNsCompleteNs
20__amd_rocclr_fillBufferAligned.kd000229609229609335544322560043241600x00x7fbe34404280381263381263889030501125242882388955342962457097182608417704936968427177042307501431770508145304517705081565284
31void benchmark_func<short, 256, 8u, 0u>(short, short*) [clone .kd]00222960922960932768256001224138880x00x7fbe34423f8033603336033003826883251217286671614820692821217705086704565177050814530451770508684233817705086846922
42void benchmark_func<float, 256, 8u, 0u>(float, float*) [clone .kd]0052296092296094194304256001224143360x7fbe374123800x7fbe34423fc016583816583813145132671265536712132971218469028659102817705086889921177050868423381770508723401917705087236572
53void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 0u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0082296092296094194304256001624150400x7fbe374122000x7fbe34424000310165310165242352481328655362219799202376367088964900417705087280861177050872340191770508765994017705087662531
64void benchmark_func<double, 256, 8u, 0u>(double, double*) [clone .kd]00112296092296094194304256001624154880x7fbe374120800x7fbe34424040310242310242244062481944655362269919742375657090969367617705087702290177050876599401770508807834117705088080621
75void benchmark_func<__half2, 256, 8u, 0u>(__half2, __half2*) [clone .kd]00142296092296094194304256001224159360x7fbe34c6df000x7fbe3442408016612516612515134132900865536841316161220911033825391617705088120850177050880783411770508840122117705088403393
86void benchmark_func<int, 256, 8u, 0u>(int, int*) [clone .kd]00172296092296094194304256001224163840x7fbe34c6dd800x7fbe344240c016483416483413742131868065536731364131209232029428238017705088442192177050884012211770508872090217705088723075
97void benchmark_func<float, 256, 8u, 1u>(float, float*) [clone .kd]00202296092296094194304256001224170880x7fbe34c6dc000x7fbe3442410016435816435814715131487265536952655911206243038279066817705088776333177050887209021770508904282317705089045137
108void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 1u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]00232296092296094194304256001624177920x7fbe34c6da800x7fbe34424140309562309562244232476504655362280467322367471091391575217705089085186177050890428231770508947050417705089472616
119void benchmark_func<double, 256, 8u, 1u>(double, double*) [clone .kd]00262296092296094194304256001624184960x7fbe34c6d9000x7fbe34424180307173307173219882457392655362150271112351352086183771217705089511805177050894705041770508988586517705089887976
1210void benchmark_func<__half2, 256, 8u, 1u>(__half2, __half2*) [clone .kd]00292296092296094194304256001624192000x7fbe34c6d7800x7fbe344241c016455616455614994131645665536926001801208307037213258817705089927125177050898858651770509022090617705090223297
1311void benchmark_func<int, 256, 8u, 1u>(int, int*) [clone .kd]00322296092296094194304256001624199040x7fbe34c6d6000x7fbe3442420016496616496615399131973665536958638651214595038518235617705090263036177050902209061770509055418717705090556419
1412void benchmark_func<float, 256, 8u, 2u>(float, float*) [clone .kd]00352296092296094194304256001224206080x7fbe374124800x7fbe3442424016562816562815377132503265536839072061210207033736276417705090605538177050905541871770509087930817705090881611
1513void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 2u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]00382296092296094194304256001624213120x7fbe374123000x7fbe34424280309987309987240712479904655362268836452374159090926392017705090921880177050908793081770509129338917705091295050
1614void benchmark_func<double, 256, 8u, 2u>(double, double*) [clone .kd]00412296092296094194304256001624220160x7fbe374121800x7fbe344242c0309063309063218142472512655362219652442363589088959015217705091335869177050912933891770509167770917705091679250
1715void benchmark_func<__half2, 256, 8u, 2u>(__half2, __half2*) [clone .kd]00442296092296094194304256001624227200x7fbe374120000x7fbe3442430016463116463114216131705665536836818771214062033646053617705091718619177050916777091770509197531017705091976993
1816void benchmark_func<int, 256, 8u, 2u>(int, int*) [clone .kd]00472296092296094194304256001224234240x7fbe34c6de800x7fbe3442434016501916501915145132016065536914463171215671036752104817705092016992177050919753101770509226731117705092268976
1917void benchmark_func<float, 256, 8u, 3u>(float, float*) [clone .kd]00502296092296094194304256001224241280x7fbe34c6dd000x7fbe3442438016363916363914467130912065536878835471203538035325738417705092316344177050922673111770509256011217705092561788
2018void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 3u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]00532296092296094194304256001624248320x7fbe34c6db800x7fbe344243c0309723309723243012477792655362282833652371609091486289617705092602147177050925601121770509294187317705092943559
2119void benchmark_func<double, 256, 8u, 3u>(double, double*) [clone .kd]00562296092296094194304256001624255360x7fbe34c6da000x7fbe34424400307033307033227592456272655362196016372352822088013890017705092985248177050929418731770509332411417705093325719
2220void benchmark_func<__half2, 256, 8u, 3u>(__half2, __half2*) [clone .kd]00592296092296094194304256001224262400x7fbe34c6d8800x7fbe3442444016504116504114422132033665536882220191213142035462452017705093365658177050933241141770509361771417705093619412
2321void benchmark_func<int, 256, 8u, 3u>(int, int*) [clone .kd]00622296092296094194304256001224269440x7fbe34c6d7000x7fbe34424480163329163329150011306640655361066774051204086042843128017705093658911177050936177141770509391099517705093912604
2422void benchmark_func<float, 256, 8u, 4u>(float, float*) [clone .kd]00652296092296094194304256001224276480x7fbe374125800x7fbe344244c016326716326715758130614465536989068501202758039735968817705093959653177050939109951770509421947617705094221506
2523void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 4u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]00682296092296094194304256001624286080x7fbe374124000x7fbe34424500309007309007230452472064655362266942242367706090850657217705094262355177050942194761770509460427717705094605857
2624void benchmark_func<double, 256, 8u, 4u>(double, double*) [clone .kd]00712296092296094194304256001624293120x7fbe374122800x7fbe34424540306389306389216952451120655362138180252347253085700190817705094646686177050946042771770509498763817705094989297
2725void benchmark_func<__half2, 256, 8u, 4u>(__half2, __half2*) [clone .kd]00742296092296094194304256001224300160x7fbe374121000x7fbe3442458016190316190314760129523265536973866461191628039127868017705095029976177050949876381770509528363817705095285290
2826void benchmark_func<int, 256, 8u, 4u>(int, int*) [clone .kd]0077229609229609419430425600824309760x7fbe34c6df800x7fbe344245c016319716319714617130558465536909199101203451036541212817705095325729177050952836381770509557531917705095577032
2927void benchmark_func<float, 256, 8u, 5u>(float, float*) [clone .kd]00802296092296094194304256001224316800x7fbe34c6de000x7fbe34424600162819162819156501302560655361023460931199176041110450417705095624611177050955753191770509586812017705095869755
3028void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 5u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]00832296092296094194304256001624326400x7fbe34c6dc800x7fbe34424640306939306939241742455520655362212773502340420088683970817705095909424177050958681201770509625468117705096256345
3129void benchmark_func<double, 256, 8u, 5u>(double, double*) [clone .kd]00862296092296094194304256001224336000x7fbe34c6db000x7fbe34424680306145306145222922449168655362160941562340460086610626017705096297934177050962546811770509663788217705096639496
3230void benchmark_func<__half2, 256, 8u, 5u>(__half2, __half2*) [clone .kd]00892296092296094194304256001224345600x7fbe34c6d9800x7fbe344246c016281016281014509130248865536943442851198509037910422017705096679645177050966378821770509693260217705096934328
3331void benchmark_func<int, 256, 8u, 5u>(int, int*) [clone .kd]0092229609229609419430425600824355200x7fbe34c6d8000x7fbe3442470016270116270114523130161665536905979371199637036412104417705096974877177050969326021770509722492317705097226521
3432void benchmark_func<float, 256, 8u, 6u>(float, float*) [clone .kd]00952296092296094194304256001224362240x7fbe34c6d6800x7fbe3442474016413416413415690131308065536939499741202861037753107617705097274700177050972249231770509752524417705097526863
3533void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 6u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]00982296092296094194304256001224371840x7fbe374125000x7fbe34424780306815306815245172454528655362265666852352541090799804417705097567122177050975252441770509790588517705097907454
3634void benchmark_func<double, 256, 8u, 6u>(double, double*) [clone .kd]001012296092296094194304256001224381440x7fbe374123800x7fbe344247c0306268306268230382450152655362146603432346170086036942417705097947933177050979058851770509830380617705098305474
3735void benchmark_func<__half2, 256, 8u, 6u>(__half2, __half2*) [clone .kd]001042296092296094194304256001224391040x7fbe374122000x7fbe3442480016264916264914408130120065536853600881196434034317017617705098346213177050983038061770509860396717705098605726
3836void benchmark_func<int, 256, 8u, 6u>(int, int*) [clone .kd]00107229609229609419430425600824403200x7fbe374120800x7fbe3442484016321616321615179130573665536877138061201618035258162017705098646735177050986039671770509890732717705098909039
3937void benchmark_func<float, 256, 8u, 7u>(float, float*) [clone .kd]001102296092296094194304256001224412800x7fbe34c6df000x7fbe3442488016234916234914872129880065536962682861196763038679879217705098957687177050989073271770509920204817705099203651
4038void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 7u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]001132296092296094194304256001224422400x7fbe34c6dd800x7fbe344248c0304648304648234432437192655362135686632324376085600379617705099243980177050992020481770509958444917705099586092
4139void benchmark_func<double, 256, 8u, 7u>(double, double*) [clone .kd]001162296092296094194304256001224432000x7fbe34c6dc000x7fbe34424900302400302400209242419208655362119616692312297084957862017705099625151177050995844491770509996605017705099967772
4240void benchmark_func<__half2, 256, 8u, 7u>(__half2, __half2*) [clone .kd]00119229609229609419430425600824441600x7fbe34c6da800x7fbe3442494016339016339015302130712865536855248091201537034382767617705100008471177050999660501770510026349117705100265055
4341void benchmark_func<int, 256, 8u, 7u>(int, int*) [clone .kd]001222296092296094194304256001224453760x7fbe34c6d9000x7fbe3442498016326416326415437130612065536922254511195519037063084417705100305144177051002634911770510055901117705100560597
4442void benchmark_func<float, 256, 8u, 8u>(float, float*) [clone .kd]001252296092296094194304256001224463360x7fbe34c6d7800x7fbe344249c016194616194614516129557665536952098241190713038256937217705100608096177051005590111770510085805217705100859750
4543void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 8u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]001282296092296094194304256001224475520x7fbe34c6d6000x7fbe34424a00305858305858243782446872655362254264222340679090343548017705100900759177051008580521770510124173317705101243460
4644void benchmark_func<double, 256, 8u, 8u>(double, double*) [clone .kd]001312296092296094194304256001224485120x7fbe374124800x7fbe34424a40301950301950221352415608655362147867692312050086087455217705101284249177051012417331770510162317417705101624721
4745void benchmark_func<__half2, 256, 8u, 8u>(__half2, __half2*) [clone .kd]00134229609229609419430425600824494720x7fbe374123000x7fbe34424a8016228916228914670129832065536824020471193739033134810417705101665280177051016231741770510191917517705101920883
4846void benchmark_func<int, 256, 8u, 8u>(int, int*) [clone .kd]001372296092296094194304256001224506880x7fbe374121800x7fbe34424ac016363816363816770130911265536960529131198527038594787217705101961272177051019191751770510222397617705102225846
4947void benchmark_func<float, 256, 8u, 9u>(float, float*) [clone .kd]001402296092296094194304256001224516480x7fbe374120000x7fbe34424b0016230416230415238129844065536906595651195226036436770017705102274054177051022239761770510252253617705102524078
5048void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 9u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]001432296092296094194304256001224528640x7fbe34c6de800x7fbe34424b40303252303252229702426024655362158411422314125086509357617705102564847177051025225361770510290461717705102906228
5149void benchmark_func<double, 256, 8u, 9u>(double, double*) [clone .kd]001462296092296094194304256001224540800x7fbe34c6dd000x7fbe34424b80303952303952208092431624655362164312212318408086745657217705102946227177051029046171770510329005817705103291649
5250void benchmark_func<__half2, 256, 8u, 9u>(__half2, __half2*) [clone .kd]00149229609229609419430425600824552960x7fbe34c6db800x7fbe34424bc016280216280215015130242465536894790251198028035964952817705103331678177051032900581770510358509917705103586751
5351void benchmark_func<int, 256, 8u, 9u>(int, int*) [clone .kd]001522296092296094194304256001224567680x7fbe34c6da000x7fbe34424c00164999164999164331320000655361008212771211993040502907617705103627070177051035850991770510388654017705103888294
5452void benchmark_func<float, 256, 8u, 10u>(float, float*) [clone .kd]001552296092296094194304256001224577280x7fbe34c6d8800x7fbe34424c4016310016310014932130480865536940666271197106037799269217705103935413177051038865401770510418862017705104190336
5553void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 10u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]001582296092296094194304256001224589440x7fbe34c6d7000x7fbe34424c80301112301112231612408904655362156717372299808086441796417705104230695177051041886201770510456654117705104568197
5654void benchmark_func<double, 256, 8u, 10u>(double, double*) [clone .kd]001612296092296094194304256001224601600x7fbe374125800x7fbe34424cc0301782301782216012414264655362144458032308591085951440417705104608596177051045665411770510495054217705104952257
5755void benchmark_func<__half2, 256, 8u, 10u>(__half2, __half2*) [clone .kd]00164229609229609419430425600824613760x7fbe374124000x7fbe34424d0016260616260614746130085665536873280091196451035104296417705104992666177051049505421770510525134317705105252929
5856void benchmark_func<int, 256, 8u, 10u>(int, int*) [clone .kd]001672296092296094194304256001224628480x7fbe374122800x7fbe34424d40170036170036159881360296655361002766621256004040285381217705105293348177051052513431770510555934417705105561062
5957void benchmark_func<float, 256, 8u, 11u>(float, float*) [clone .kd]001702296092296094194304256001224638080x7fbe374121000x7fbe34424d8016270616270615641130165665536948550381193196038114672417705105609860177051055593441770510585710517705105858704
6058void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 11u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]001732296092296094194304256001224650240x7fbe34c6df800x7fbe34424dc0300682300682220962405464655362109523792299080084554236817705105899953177051058571051770510623726517705106239145
6159void benchmark_func<double, 256, 8u, 11u>(double, double*) [clone .kd]001762296092296094194304256001224662400x7fbe34c6de000x7fbe34424e00300150300150209632401208655362073244362293832083103054817705106279684177051062372651770510662446617705106626145
6260void benchmark_func<__half2, 256, 8u, 11u>(__half2, __half2*) [clone .kd]00179229609229609419430425600824674560x7fbe34c6dc800x7fbe34424e4016318816318815270130551265536886605201200099035638368417705106666304177051066244661770510692510717705106926737
6361void benchmark_func<int, 256, 8u, 11u>(int, int*) [clone .kd]001822296092296094194304256001224689280x7fbe34c6db000x7fbe34424e80176984176984172341415880655361105404381307857044389801617705106967236177051069251071770510723182817705107233520
6462void benchmark_func<float, 256, 8u, 12u>(float, float*) [clone .kd]001852296092296094194304256001224701440x7fbe34c6d9800x7fbe34424ec016270216270215277130162465536883599291192596035517971617705107280889177051072318281770510752894917705107530702
6563void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 12u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]001882296092296094194304256001224716160x7fbe34c6d8000x7fbe34424f00303138303138238542425112655362193457542319706087911396817705107570181177051075289491770510791471017705107916343
6664void benchmark_func<double, 256, 8u, 12u>(double, double*) [clone .kd]001912296092296094194304256001224728320x7fbe34c6d6800x7fbe34424f40301178301178225812409432655362108565102300482084515694017705107956902177051079147101770510829615117705108297833
6765void benchmark_func<__half2, 256, 8u, 12u>(__half2, __half2*) [clone .kd]00194229609229609419430425600824740480x7fbe374125000x7fbe34424f8016101616101615381128813665536909966521185572036572779217705108337672177051082961511770510859119117705108592986
6866void benchmark_func<int, 256, 8u, 12u>(int, int*) [clone .kd]001972296092296094194304256001224757760x7fbe374123800x7fbe34424fc0182776182776173241462216655361063074161351053042697132417705108632915177051085911911770510889999217705108901698
6967void benchmark_func<float, 256, 8u, 13u>(float, float*) [clone .kd]002002296092296094194304256001224769920x7fbe374122000x7fbe3442500016196616196615750129573665536874753651182769035163039617705108961827177051088999921770510919583317705109197421
7068void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 13u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]002032296092296094194304256001224784640x7fbe374120800x7fbe34425040300684300684211442405480655362087626242299625083678434017705109238380177051091958331770510957695417705109578621
7169void benchmark_func<double, 256, 8u, 13u>(double, double*) [clone .kd]002062296092296094194304256001224799360x7fbe34c6df000x7fbe34425080304284304284236862434280655362139795002316743085765106817705109618800177051095769541770510996671517705109968351
7270void benchmark_func<__half2, 256, 8u, 13u>(__half2, __half2*) [clone .kd]00209229609229609419430425600824814080x7fbe34c6dd800x7fbe344250c016356616356615500130853665536889005161199255035733871617705110008030177051099667151770511027567517705110277544
7371void benchmark_func<int, 256, 8u, 13u>(int, int*) [clone .kd]002122296092296094194304256001224831360x7fbe34c6dc000x7fbe34425100193521193521184171548176655361092761871435404043884822417705110317593177051102756751770511059199617705110593646
7472void benchmark_func<float, 256, 8u, 14u>(float, float*) [clone .kd]002152296092296094194304256001224843520x7fbe34c6da800x7fbe3442514016151116151114317129209665536837934371183047033690187617705110641284177051105919961770511089359717705110895268
7573void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 14u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]002182296092296094194304256001224858240x7fbe34c6d9000x7fbe34425180303427303427241212427424655362203339792315446088307206417705110936297177051108935971770511127551817705111277278
7674void benchmark_func<double, 256, 8u, 14u>(double, double*) [clone .kd]002212296092296094194304256001224872960x7fbe34c6d7800x7fbe344251c0301669301669223362413360655361937577972295441077676482017705111317477177051112755181770511165679917705111658369
7775void benchmark_func<__half2, 256, 8u, 14u>(__half2, __half2*) [clone .kd]002242296092296094194304256001224887680x7fbe34c6d6000x7fbe3442520016313216313215814130506465536950386991197595038188777617705111698048177051116567991770511195152017705111953211
7876void benchmark_func<int, 256, 8u, 14u>(int, int*) [clone .kd]002272296092296094194304256001224907520x7fbe374124800x7fbe34425240201967201967179601615744655361296602281505036052038569617705111992780177051119515201770511227632017705112277973
7977void benchmark_func<float, 256, 8u, 15u>(float, float*) [clone .kd]002302296092296094194304256001224919680x7fbe374123000x7fbe3442528016233616233615959129869665536934536161190100037555292417705112325832177051122763201770511257040117705112572056
8078void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 15u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]002332296092296094194304256001224934400x7fbe374121800x7fbe344252c0301634301634234782413080655362209706652309762088561845617705112613065177051125704011770511295984217705112961576
8179void benchmark_func<double, 256, 8u, 15u>(double, double*) [clone .kd]002362296092296094194304256001224949120x7fbe374120000x7fbe34425300299082299082209732392664655362098252742287308084102948817705113002365177051129598421770511334160317705113343326
8280void benchmark_func<__half2, 256, 8u, 15u>(__half2, __half2*) [clone .kd]002392296092296094194304256001224963840x7fbe34c6de800x7fbe3442534016333816333817143130671265536975607651194097039197225617705113383045177051133416031770511363728417705113638969
8381void benchmark_func<int, 256, 8u, 15u>(int, int*) [clone .kd]002422296092296094194304256001224983680x7fbe34c6dd000x7fbe34425380212062212062193321696504655361281622031580576051439447617705113679218177051136372841770511396368517705113965221
8482void benchmark_func<float, 256, 8u, 16u>(float, float*) [clone .kd]002452296092296094194304256001224995840x7fbe34c6db800x7fbe344253c016150016150014666129200865536872940501184373035090494417705114012580177051139636851770511426624517705114267993
8583void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 16u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0024822960922960941943042560012241013120x7fbe34c6da000x7fbe34425400299650299650233802397208655362107049062287346084455757217705114308002177051142662451770511465328617705114655013
8684void benchmark_func<double, 256, 8u, 16u>(double, double*) [clone .kd]0025122960922960941943042560012241027840x7fbe34c6d8800x7fbe34425440301088301088229722408712655362184299912302461087544797617705114695202177051146532861770511503360717705115035184
8785void benchmark_func<__half2, 256, 8u, 16u>(__half2, __half2*) [clone .kd]0025422960922960941943042560012241042560x7fbe34c6d7000x7fbe3442548016271616271616173130173665536990435771197113039791214017705115074653177051150336071770511532816817705115329836
8886void benchmark_func<int, 256, 8u, 16u>(int, int*) [clone .kd]0025722960922960941943042560012241062400x7fbe374125800x7fbe344254c0220639220639197941765120655361285586221648289051598363617705115370005177051153281681770511565904917705115660728
8987void benchmark_func<float, 256, 8u, 17u>(float, float*) [clone .kd]0026022960922960941943042560012241077120x7fbe374124000x7fbe3442550016086416086415304128692065536895544121184374035996169217705115709227177051156590491770511595280917705115954441
9088void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 17u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0026322960922960941943042560016241094400x7fbe374122800x7fbe34425540299107299107225462392864655362148989772289918086132618817705115994910177051159528091770511633409017705116335801
9189void benchmark_func<double, 256, 8u, 17u>(double, double*) [clone .kd]0026622960922960941943042560016241111680x7fbe374121000x7fbe34425580300940300940228312407528655362114177612295026084740014417705116376800177051163340901770511671761117705116719261
9290void benchmark_func<__half2, 256, 8u, 17u>(__half2, __half2*) [clone .kd]002692296092296094194304256008241128960x7fbe34c6df800x7fbe344255c0163791163791157401310336655361027003571208993041254894017705116759270177051167176111770511702129217705117022834
9391void benchmark_func<int, 256, 8u, 17u>(int, int*) [clone .kd]0027222960922960941943042560012241151360x7fbe34c6de000x7fbe34425600229790229790199481838328655361463891471727826058729954817705117062773177051170212921770511736817317705117369785
9492void benchmark_func<float, 256, 8u, 18u>(float, float*) [clone .kd]0027522960922960941943042560012241166080x7fbe34c6dc800x7fbe3442564016190116190115612129521665536939504551189186037753917217705117417744177051173681731770511767201417705117673607
9593void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 18u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0027822960922960941943042560016241183360x7fbe34c6db000x7fbe34425680297090297090210852376728655362010477752267844080593069617705117714146177051176720141770511805105517705118052718
9694void benchmark_func<double, 256, 8u, 18u>(double, double*) [clone .kd]0028122960922960941943042560016241200640x7fbe34c6d9800x7fbe344256c0299427299427224912395424655362140132462287950085778643617705118093117177051180510551770511844209617705118443908
9795void benchmark_func<__half2, 256, 8u, 18u>(__half2, __half2*) [clone .kd]0028422960922960941943042560012241217920x7fbe34c6d8000x7fbe3442570016488216488216738131906465536945065401211189037976359617705118484447177051184420961770511873729617705118738801
9896void benchmark_func<int, 256, 8u, 18u>(int, int*) [clone .kd]0028722960922960941943042560012241240320x7fbe34c6d6800x7fbe34425740240737240737211031925904655361511042871811582060616764817705118777400177051187372961770511908593717705119087632
9997void benchmark_func<float, 256, 8u, 20u>(float, float*) [clone .kd]0029022960922960941943042560012241255040x7fbe374125000x7fbe3442578016140016140015196129120865536962497851188433038673231617705119135421177051190859371770511938609817705119387754
10098void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 20u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0029322960922960941943042560012241274880x7fbe374123800x7fbe344257c0297753297753204392382032655361944373652269987077948218817705119429013177051193860981770511977425917705119775875
10199void benchmark_func<double, 256, 8u, 20u>(double, double*) [clone .kd]0029622960922960941943042560012241292160x7fbe374122000x7fbe34425800298452298452207952387624655362071760292280628083043933217705119816624177051197742591770512015490017705120156525
102100void benchmark_func<__half2, 256, 8u, 20u>(__half2, __half2*) [clone .kd]0029922960922960941943042560012241309440x7fbe374120800x7fbe3442584017131017131016484137048865536972472281262260039073583617705120197584177051201549001770512045634117705120458048
103101void benchmark_func<int, 256, 8u, 20u>(int, int*) [clone .kd]0030222960922960941943042560012241334400x7fbe34c6df000x7fbe34425880260352260352219312082824655361666137001965916066821221617705120498797177051204563411770512081154117705120813229
104102void benchmark_func<float, 256, 8u, 22u>(float, float*) [clone .kd]0030522960922960941943042560012241349120x7fbe34c6dd800x7fbe344258c016207316207315594129659265536996911851194157040049305617705120861668177051208115411770512111362217705121115311
105103void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 22u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0030822960922960941943042560012241368960x7fbe34c6dc000x7fbe34425900296535296535192812372288655361933185732261793077501530017705121156680177051211136221770512150018317705121501742
106104void benchmark_func<double, 256, 8u, 22u>(double, double*) [clone .kd]0031122960922960941943042560012241388800x7fbe34c6da800x7fbe34425940296783296783209452374272655362011226692263037080622732417705121542681177051215001831770512188194417705121883502
107105void benchmark_func<__half2, 256, 8u, 22u>(__half2, __half2*) [clone .kd]0031422960922960941943042560012241408640x7fbe34c6d9000x7fbe34425980180624180624170591445000655361039612201334548041759794817705121923861177051218819441770512218978517705122192044
108106void benchmark_func<int, 256, 8u, 22u>(int, int*) [clone .kd]0031722960922960941943042560012241436160x7fbe34c6d7800x7fbe344259c0282033282033236312256272655361810554272130146072596966017705122231383177051221897851770512256578617705122567395
109107void benchmark_func<float, 256, 8u, 24u>(float, float*) [clone .kd]0032022960922960941943042560012241453440x7fbe34c6d6000x7fbe34425a00163417163417172271307344655361001889891189989040249346817705122616454177051225657861770512286738717705122869147
110108void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 24u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0032322960922960941943042560012241475840x7fbe374124800x7fbe34425a40295608295608211302364872655362067518192259308082874744417705122910206177051228673871770512325138817705123253258
111109void benchmark_func<double, 256, 8u, 24u>(double, double*) [clone .kd]0032622960922960941943042560012241495680x7fbe374123000x7fbe34425a80295492295492210362363944655361959045802259274078535749617705123293607177051232513881770512363298817705123634638
112110void benchmark_func<__half2, 256, 8u, 24u>(__half2, __half2*) [clone .kd]0032922960922960941943042560012241515520x7fbe374121800x7fbe34425ac0187650187650180781501208655361092973641386923043893950417705123674617177051236329881770512395026917705123952190
113111void benchmark_func<int, 256, 8u, 24u>(int, int*) [clone .kd]0033222960922960941943042560012241543040x7fbe374120000x7fbe34425b00300632300632235372405064655361926302052290360077227788817705123993359177051239502691770512433315017705124334800
114112void benchmark_func<float, 256, 8u, 28u>(float, float*) [clone .kd]0033522960922960941943042560012241562880x7fbe34c6de800x7fbe34425b4017273017273016239138184865536990774381274736039805533617705124382819177051243331501770512464211117705124643743
115113void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 28u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0033822960922960941943042560012241587840x7fbe34c6dd000x7fbe34425b80300954300954192182407640655361381233052277040055424130417705124683662177051246421111770512502499217705125026583
116114void benchmark_func<double, 256, 8u, 28u>(double, double*) [clone .kd]0034122960922960941943042560012241610240x7fbe34c6db800x7fbe34425bc0296890296890194872375128655361914219982260455076742908017705125066652177051250249921770512540627317705125408023
117115void benchmark_func<__half2, 256, 8u, 28u>(__half2, __half2*) [clone .kd]0034422960922960941943042560012241632640x7fbe34c6da000x7fbe34425c00206274206274183921650200655361216680791537738048841846017705125448222177051254062731770512572963417705125731375
118116void benchmark_func<int, 256, 8u, 28u>(int, int*) [clone .kd]0034722960922960941943042560012241665280x7fbe34c6d8800x7fbe34425c40342009342009258782736080655362265710562617009090804965217705125770974177051257296341770512613875517705126164064
119117void benchmark_func<float, 256, 8u, 32u>(float, float*) [clone .kd]0035022960922960941943042560012241685120x7fbe34c6d7000x7fbe34425c80184465184465174991475728655361103833311363612044327844017705126191024177051261387551770512647075517705126472336
120118void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 32u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0035322960922960941943042560012241712640x7fbe374125800x7fbe34425cc0296110296110198642368888655361510893412236464060610808017705126512945177051264707551770512685651617705126858247
121119void benchmark_func<double, 256, 8u, 32u>(double, double*) [clone .kd]0035622960922960941943042560012241737600x7fbe374124000x7fbe34425d00298293298293202022386352655361596337582257555064029169617705126899276177051268565161770512724355717705127245317
122120void benchmark_func<__half2, 256, 8u, 32u>(__half2, __half2*) [clone .kd]0035922960922960941943042560012241762560x7fbe374122800x7fbe34425d40225369225369195741802960655361442569151693260057878006417705127285016177051272435571770512758723817705127588888
123121void benchmark_func<int, 256, 8u, 32u>(int, int*) [clone .kd]0036222960922960941943042560012241797760x7fbe374121000x7fbe34425d803822833822832815230582726553625851276529382870103580458417705127630277177051275872381770512802403917705128045157
124122void benchmark_func<float, 256, 8u, 40u>(float, float*) [clone .kd]0036522960922960941943042560012241822720x7fbe34c6df800x7fbe34425dc0212577212577189741700624655361231265801587500049426172017705128074826177051280240391770512835636017705128358029
125123void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 40u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0036822960922960941943042560012241855360x7fbe34c6de000x7fbe34425e00305893305893227312447152655361933678902328700077522826817705128398848177051283563601770512875092117705128771599
126124void benchmark_func<double, 256, 8u, 40u>(double, double*) [clone .kd]0037122960922960941943042560012241885440x7fbe34c6dc800x7fbe34425e40309188309188233452473512655361677064192335877067259252017705128791988177051287509211770512915172217705129169409
127125void benchmark_func<__half2, 256, 8u, 40u>(__half2, __half2*) [clone .kd]0037422960922960941943042560012241915520x7fbe34c6db000x7fbe34425e80266125266125216152129008655361850805222018299074209052817705129192418177051291517221770512951380317705129515370
128126void benchmark_func<int, 256, 8u, 40u>(int, int*) [clone .kd]0037722960922960941943042560012241958400x7fbe34c6d9800x7fbe34425ec04633654633653281737069286553633362899735798970133627986817705129554619177051295138031770513000180417705130018847
129127void benchmark_func<float, 256, 8u, 48u>(float, float*) [clone .kd]0038022960922960941943042560012241985920x7fbe34c6d8000x7fbe34425f00243765243765207461950128655361573175871841101063102310417705130052196177051300018041770513035972517705130361499
130128void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 48u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0038322960922960941943042560012242023680x7fbe34c6d6800x7fbe34425f40334611334611236462676896655362064709272559624082764470417705130401418177051303597251770513077300617705130819257
131129void benchmark_func<double, 256, 8u, 48u>(double, double*) [clone .kd]0038622960922960941943042560012242058880x7fbe374125000x7fbe34425f80330532330532239072644264655362011298552514099080628118017705130829467177051307730061770513120612717705131248566
132130void benchmark_func<__half2, 256, 8u, 48u>(__half2, __half2*) [clone .kd]0038922960922960941943042560012242094080x7fbe374123800x7fbe34425fc0307350307350236102458808655362004141542349004080342197217705131258526177051312061271770513162084817705131622387
133131void benchmark_func<int, 256, 8u, 48u>(int, int*) [clone .kd]0039222960922960941943042560012242144640x7fbe374122000x7fbe344260005428325428323557243426646553640007450242281830160206362417705131662976177051316208481770513216069017705132178243
134132void benchmark_func<float, 256, 8u, 56u>(float, float*) [clone .kd]0039522960922960941943042560012242177280x7fbe374120800x7fbe34426040272520272520219362180168655361800812532067857072207611217705132211162177051321606901770513253077017705132532384
135133void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 56u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0039822960922960941943042560012242220160x7fbe34c6df000x7fbe34426080367822367822283792942584655362377254342825705095268713617705132577933177051325307701770513296709217705132985653
136134void benchmark_func<double, 256, 8u, 56u>(double, double*) [clone .kd]0040122960922960941943042560012242260480x7fbe34c6dd800x7fbe344260c03674793674792924429398406553625795237728272060103358038817705133008672177051329670921770513340165317705133418842
137135void benchmark_func<__half2, 256, 8u, 56u>(__half2, __half2*) [clone .kd]0040422960922960941943042560012242300800x7fbe34c6dc000x7fbe34426100348153348153257522785232655362345017162674331093978548817705133442882177051334016531770513381621417705133834462
138136void benchmark_func<int, 256, 8u, 56u>(int, int*) [clone .kd]0040722960922960941943042560012242359040x7fbe34c6da800x7fbe344261406246096246094024649968806553647095419448781700188558206817705133858311177051338162141770513440741517705134427867
139137void benchmark_func<float, 256, 8u, 64u>(float, float*) [clone .kd]0041022960922960941943042560012242394240x7fbe34c6d9000x7fbe34426180304469304469235542435760655361912943332320826076694026817705134458586177051344074151770513480773617705134809387
140138void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 64u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0041322960922960941943042560012242442240x7fbe34c6d7800x7fbe344261c04005714005712750332045766553627323520430908360109473048417705134850126177051348077361770513526165717705135306605
141139void benchmark_func<double, 256, 8u, 64u>(double, double*) [clone .kd]0041622960922960941943042560012242487680x7fbe34c6d6000x7fbe344262003943173943172773731545446553628937599830430160115928405617705135317064177051352616571770513573717817705135780083
142140void benchmark_func<__half2, 256, 8u, 64u>(__half2, __half2*) [clone .kd]0041922960922960941943042560012242533120x7fbe374124800x7fbe344262403890393890392775131123206553627086848129949210108524342017705135790393177051357371781770513620598017705136247691
143141void benchmark_func<int, 256, 8u, 64u>(int, int*) [clone .kd]004222296092296094194304256008242555520x7fbe374123000x7fbe344262807197137197134489357577126553653348314156304140213567315217705136258251177051362059801770513688118117705136898805
144142void benchmark_func<float, 256, 8u, 80u>(float, float*) [clone .kd]0042522960922960941943042560012242598400x7fbe374121800x7fbe344262c03648043648042672929184406553625373185628019400101669063217705136931714177051368811811770513731190217705137330014
145143void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 80u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0042822960922960941943042560012242656640x7fbe374120000x7fbe344263004706624706623173137653046553634847478236563070139568432817705137354433177051373119021770513781334317705137830031
146144void benchmark_func<double, 256, 8u, 80u>(double, double*) [clone .kd]0043122960922960941943042560012242712320x7fbe34c6de800x7fbe344263404717354717353173837738886553634874426136677470139675815617705137855951177051378133431770513832582517705138372778
147145void benchmark_func<__half2, 256, 8u, 80u>(__half2, __half2*) [clone .kd]004342296092296094194304256008242732160x7fbe34c6dd000x7fbe344263804833844833843267338670806553635052051837534580140382247217705138383487177051383258251770513885430617705138896224
148146void benchmark_func<int, 256, 8u, 80u>(int, int*) [clone .kd]004372296092296094194304256008242757120x7fbe34c6db800x7fbe344263c08806028806025348270448246553667358264169285800269607205617705138906824177051388543061770513963446817705139676415
149147void benchmark_func<float, 256, 8u, 96u>(float, float*) [clone .kd]0044022960922960941943042560012242807680x7fbe34c6da000x7fbe344264004273634273632981634189126553631519403333015160126254770017705139694814177051396344681770514012166917705140163292
150148void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 96u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0044322960922960941943042560012242876160x7fbe34c6d8800x7fbe344264405512045512043563144096406553640218181342970490161051610017705140173812177051401216691770514069591117705140737608
151149void benchmark_func<double, 256, 8u, 96u>(double, double*) [clone .kd]0044622960922960941943042560012242942080x7fbe34c6d7000x7fbe344264805524505524503618744196086553641652289643091350166787706817705140748028177051406959111770514126807217705141286044
152150void benchmark_func<__half2, 256, 8u, 96u>(__half2, __half2*) [clone .kd]004492296092296094194304256008242969600x7fbe374125800x7fbe344264c05634495634493625245076006553641350248943908770165575385217705141309564177051412680721770514181959317705141836590
153151void benchmark_func<int, 256, 8u, 96u>(int, int*) [clone .kd]004522296092296094194304256008242999680x7fbe374124000x7fbe34426500104252210425226193083401846553680257118282208360321202746017705141861850177051418195931770514269079617705142714718
154152void benchmark_func<float, 256, 8u, 128u>(float, float*) [clone .kd]004552296092296094194304256008243027200x7fbe374122800x7fbe344265407212527212524516057700246553655159817156566300220813330017705142742378177051426907961770514334679717705143390841
155153void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 128u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0045822960922960941943042560012243054720x7fbe374121000x7fbe344265807227957227954456157823686553654163259156718560216827081617705143401761177051433467971770514404967917705144092564
156154void benchmark_func<double, 256, 8u, 128u>(double, double*) [clone .kd]0046122960922960941943042560012243082240x7fbe34c6df800x7fbe344265c07225847225844486857806806553654844963556664700219553958417705144102904177051440496211770514474786217705144791776
157155void benchmark_func<__half2, 256, 8u, 128u>(__half2, __half2*) [clone .kd]004642296092296094194304256008243109760x7fbe34c6de000x7fbe344266007270817270814571158166566553655227818356963650221085402817705144802426177051447478621770514543682317705145455650
158156void benchmark_func<int, 256, 8u, 128u>(int, int*) [clone .kd]004672296092296094194304256008243132160x7fbe34c6dc800x7fbe34426640137095913709597842910967680655361057064554108182610423000020017705145478759177051454368231770514652466617705146570132
159157void benchmark_func<float, 256, 8u, 256u>(float, float*) [clone .kd]004702296092296094194304256008243159680x7fbe34c6db000x7fbe34426680137113413711347795610969080655361082146997108504500433033012017705146589941177051465246661770514762242917705147686994
160158void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 256u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0047322960922960941943042560012243187200x7fbe34c6d9800x7fbe344266c0137571213757127774311005704655361064506926108644420425976979217705147698673177051476224291770514877651117705148841195
161159void benchmark_func<double, 256, 8u, 256u>(double, double*) [clone .kd]0047622960922960941943042560012243214720x7fbe34c6d8000x7fbe34426700137063313706337699610965072655361070389452108485950428329836017705148852074177051487765111770514991731417705149982126
162160void benchmark_func<__half2, 256, 8u, 256u>(__half2, __half2*) [clone .kd]004792296092296094194304256008243242240x7fbe34c6d6800x7fbe34426740137720613772067713911017656655361084930546108905440434146524817705149992916177051499173141770515104867717705151120567
163161void benchmark_func<int, 256, 8u, 256u>(int, int*) [clone .kd]004822296092296094194304256008243264640x7fbe374125000x7fbe344267802662992266299214260921303944655362128585524211870860851608343617705151131717177051510486771770515302548117705153090388
164162void benchmark_func<float, 256, 8u, 512u>(float, float*) [clone .kd]004852296092296094194304256008243292160x7fbe374123800x7fbe344267c02670670267067014258821365368655362126440678212282810850750394817705153108947177051530254811770515495972617705155029189
165163void benchmark_func<HIP_vector_type<float, 2u>, 256, 8u, 512u>(HIP_vector_type<float, 2u>, HIP_vector_type<float, 2u>*) [clone .kd]0048822960922960941943042560012243319680x7fbe374122000x7fbe344268002670846267084614340121366776655362132817250212448160853300949217705155040309177051549597261770515695765117705157022759
166164void benchmark_func<double, 256, 8u, 512u>(double, double*) [clone .kd]0049122960922960941943042560012243347200x7fbe374120800x7fbe344268402672408267240814332921379272655362121679110212378920848845708817705157033139177051569576511770515894693517705158987970
167165void benchmark_func<__half2, 256, 8u, 512u>(__half2, __half2*) [clone .kd]004942296092296094194304256008243374720x7fbe34c6df000x7fbe344268802673456267345614391421387656655362120709336212580840848458021617705158998950177051589469351770516086294017705160929781
168166void benchmark_func<int, 256, 8u, 512u>(int, int*) [clone .kd]0049722960922960941943042560082400x7fbe34c6dd800x7fbe344268c052569025256902274219420552246553642321080354193157101693017395617705160940141177051608629401770516448838817705164559200