Для роботи цього сайту потрібен JavaScript.
Огляд
Довідка
Увійти
AI
/
amd-strix-halo-vllm-toolboxes
Стежити
2
В обрані
0
Форк
0
You've already forked amd-strix-halo-vllm-toolboxes
Код
Задачі
Запити на злиття
Дії
Пакети
Проєкти
Релізи
Вікі
Активність
46
Коміти
3
Гілки
0
Теги
c587981d73439fe1c839584c29c087909bf0d4a8
Графік комітів
6 Коміти
Автор
SHA1
Повідомлення
Дата
Donato Capitella
c587981d73
refactor: Centralize Ray/vLLM cluster management into a new
cluster_manager.py
module and refactor
start_vllm_cluster.py
to use it.
2026-02-01 22:19:34 +00:00
Donato Capitella
128ddade14
fix: improve RDMA stability by configuring NCCL IB timeout and retry count.
2026-02-01 22:04:34 +00:00
Donato Capitella
965cd2c339
feat: Improve Ray node detection, enable cluster-wide vLLM cache clearing, and enforce eager mode for benchmarks.
2026-02-01 21:35:27 +00:00
Donato Capitella
ba503f6e61
feat: centralize model configurations and benchmark settings into a new
models.py
module and update Dockerfile and scripts to use it.
2026-02-01 21:17:15 +00:00
Donato Capitella
a1105a0b96
feat: Enhance vLLM benchmarking to compare Triton and ROCm attention, introduce a new script for cluster configuration, and update Dockerfile for new tools and dependencies.
2026-02-01 19:36:07 +00:00
Donato Capitella
e5cc96bf48
feat: Introduce vLLM cluster benchmarking and setup scripts, and expand the list of models for local benchmarks.
2026-02-01 15:43:56 +00:00