This website requires JavaScript.
Felfedezés
Súgó
Bejelentkezés
AI
/
amd-strix-halo-vllm-toolboxes
Figyelés
2
Csillagozás
0
Tükrözés
0
You've already forked amd-strix-halo-vllm-toolboxes
Kód
Hibajegyek
Egyesítési kérések
Actions
Packages
Projektek
Kiadások
Wiki
Tevékenység
55
Commit-ok
3
Ágak
0
Címkék
8ff52abf4ec6c3a6e56b3569e997f68aa0d31446
Commit gráf
3 Commit-ok
Szerző
SHA1
Üzenet
Dátum
Donato Capitella
8ff52abf4e
perf: Increase
max_num_seqs
for bus batch scaling and
OFF_NUM_PROMPTS
for steady-state throughput measurement on Strix Halo.
2026-02-02 22:36:15 +00:00
Donato Capitella
0109e6a19b
feat: Optimize model
max_num_seqs
and global benchmark parameters for Strix Halo, and centralize configurations in
models.py
.
2026-02-02 08:45:13 +00:00
Donato Capitella
ba503f6e61
feat: centralize model configurations and benchmark settings into a new
models.py
module and update Dockerfile and scripts to use it.
2026-02-01 21:17:15 +00:00