Ce site Web nécessite JavaScript.
Explorateur
Aide
Connexion
AI
/
amd-strix-halo-vllm-toolboxes
Suivre
2
Ajouter aux favoris
0
Bifurcation
0
Vous avez déjà forké amd-strix-halo-vllm-toolboxes
Code
Tickets
Demandes d'ajout
Actions
Paquets
Projets
Publications
Wiki
Activité
88
Révisions
3
Branches
0
Étiquette
main
Graphe des révisions
4 Révisions
Auteur
SHA1
Message
Date
Donato Capitella
16405e8943
config: Add VLLM_DISABLE_COMPILE_CACHE=1 to environment variables across VLLM scripts.
2026-03-09 14:07:43 +00:00
Donato Capitella
e726d406fa
updated benchmarks, fix start-vllm
2026-02-23 19:39:19 +00:00
Donato Capitella
0109e6a19b
feat: Optimize model
max_num_seqs
and global benchmark parameters for Strix Halo, and centralize configurations in
models.py
.
2026-02-02 08:45:13 +00:00
Donato Capitella
5e8b6bb545
updates
2025-12-20 11:37:06 +00:00