이 웹사이트는 JavaScript가 필요합니다.
탐색
도움말
로그인
AI
/
amd-strix-halo-vllm-toolboxes
구독
2
별점
0
포크
0
amd-strix-halo-vllm-toolboxes 이미 포크됨
코드
이슈
풀 리퀘스트
액션
패키지
프로젝트
릴리즈
위키
활동
파일
e726d406fa8346169ec8b63ca1102e13d1a393cb
amd-strix-halo-vllm-toolboxes
/
benchmarks
T
히스토리
Donato Capitella
e726d406fa
updated benchmarks, fix start-vllm
2026-02-23 19:39:19 +00:00
..
benchmark_results
updated benchmarks, fix start-vllm
2026-02-23 19:39:19 +00:00
benchmark_results_rocm
updated benchmarks, fix start-vllm
2026-02-23 19:39:19 +00:00
find_max_context.py
updated benchmarks, fix start-vllm
2026-02-23 19:39:19 +00:00
max_context_results.json
updating max context results
2026-02-02 11:56:26 +00:00
run_vllm_bench.py
feat: Configure ROCm attention via
--attention-backend
CLI argument, disable the Ray dashboard, and make eager mode configurable for cluster benchmarks.
2026-02-02 15:40:16 +00:00
vllm_cluster_bench.py
feat: Display environment variables and allow to choose between RoCE/Ethernet and show RCCL debug information
2026-02-22 20:07:34 +00:00