Este sítio Web requer JavaScript.
Explorar
Ajuda
Iniciar sessão
AI
/
amd-strix-halo-vllm-toolboxes
Vigiar
2
Juntar aos favoritos
0
Derivar
0
Você já tinha feito uma derivação do repositório amd-strix-halo-vllm-toolboxes, anteriormente
Código
Questões
Pedidos de integração
Operações
Pacotes
Planeamentos
Lançamentos
Wiki
Trabalho
Ficheiros
0d8afba0935edd7ea5c6971294fa4ed0a6ec573d
amd-strix-halo-vllm-toolboxes
/
benchmarks
/
benchmark_results_rocm_attn
/
benchmark_results
T
Histórico
Donato Capitella
711de530f6
added ROCm/Triton attention comparison
2025-12-20 11:49:03 +00:00
..
google_gemma-3-12b-it_tp1_throughput.json
added ROCm/Triton attention comparison
2025-12-20 11:49:03 +00:00
meta-llama_Meta-Llama-3.1-8B-Instruct_tp1_throughput.json
added ROCm/Triton attention comparison
2025-12-20 11:49:03 +00:00
openai_gpt-oss-20b_tp1_throughput.json
added ROCm/Triton attention comparison
2025-12-20 11:49:03 +00:00
openai_gpt-oss-120b_tp1_throughput.json
added ROCm/Triton attention comparison
2025-12-20 11:49:03 +00:00
Qwen_Qwen3-14B-AWQ_tp1_throughput.json
added ROCm/Triton attention comparison
2025-12-20 11:49:03 +00:00