Логотип
Огляд Довідка
Увійти
AI/amd-strix-halo-vllm-toolboxes
2
0
Форк 0
You've already forked amd-strix-halo-vllm-toolboxes
Код Задачі Запити на злиття Дії Пакети Проєкти Релізи Вікі Активність
46 Коміти 3 Гілки 0 Теги
c587981d73439fe1c839584c29c087909bf0d4a8
Графік комітів

6 Коміти

Автор SHA1 Повідомлення Дата
Donato Capitella c587981d73 refactor: Centralize Ray/vLLM cluster management into a new cluster_manager.py module and refactor start_vllm_cluster.py to use it. 2026-02-01 22:19:34 +00:00
Donato Capitella 128ddade14 fix: improve RDMA stability by configuring NCCL IB timeout and retry count. 2026-02-01 22:04:34 +00:00
Donato Capitella 965cd2c339 feat: Improve Ray node detection, enable cluster-wide vLLM cache clearing, and enforce eager mode for benchmarks. 2026-02-01 21:35:27 +00:00
Donato Capitella ba503f6e61 feat: centralize model configurations and benchmark settings into a new models.py module and update Dockerfile and scripts to use it. 2026-02-01 21:17:15 +00:00
Donato Capitella a1105a0b96 feat: Enhance vLLM benchmarking to compare Triton and ROCm attention, introduce a new script for cluster configuration, and update Dockerfile for new tools and dependencies. 2026-02-01 19:36:07 +00:00
Donato Capitella e5cc96bf48 feat: Introduce vLLM cluster benchmarking and setup scripts, and expand the list of models for local benchmarks. 2026-02-01 15:43:56 +00:00
© 2020 badstorm.xyz - : 1.26.2
Bahasa Indonesia Deutsch English Español Français Gaeilge Italiano Latviešu Magyar nyelv Nederlands Polski Português de Portugal Português do Brasil Suomi Svenska Türkçe Čeština Ελληνικά Български Русский Українська فارسی മലയാളം 日本語 简体中文 繁體中文(台灣) 繁體中文(香港) 한국어