Este sítio Web requer JavaScript.
Explorar
Ajuda
Iniciar sessão
AI
/
amd-strix-halo-vllm-toolboxes
Vigiar
2
Juntar aos favoritos
0
Derivar
0
Você já tinha feito uma derivação do repositório amd-strix-halo-vllm-toolboxes, anteriormente
Código
Questões
Pedidos de integração
Operações
Pacotes
Planeamentos
Lançamentos
Wiki
Trabalho
45
Cometimentos
3
Ramos
0
Etiquetas
128ddade14f4ad9ded59d40069093679a910a748
Gráfico de cometimentos
5 Cometimentos
Autor(a)
SHA1
Mensagem
Data
Donato Capitella
128ddade14
fix: improve RDMA stability by configuring NCCL IB timeout and retry count.
2026-02-01 22:04:34 +00:00
Donato Capitella
965cd2c339
feat: Improve Ray node detection, enable cluster-wide vLLM cache clearing, and enforce eager mode for benchmarks.
2026-02-01 21:35:27 +00:00
Donato Capitella
ba503f6e61
feat: centralize model configurations and benchmark settings into a new
models.py
module and update Dockerfile and scripts to use it.
2026-02-01 21:17:15 +00:00
Donato Capitella
a1105a0b96
feat: Enhance vLLM benchmarking to compare Triton and ROCm attention, introduce a new script for cluster configuration, and update Dockerfile for new tools and dependencies.
2026-02-01 19:36:07 +00:00
Donato Capitella
e5cc96bf48
feat: Introduce vLLM cluster benchmarking and setup scripts, and expand the list of models for local benchmarks.
2026-02-01 15:43:56 +00:00