Απαιτείται JavaScript για να εμφανιστεί αυτή η ιστοσελίδα.
Εξερεύνηση
Βοήθεια
Είσοδος
AI
/
amd-strix-halo-vllm-toolboxes
Παρακολούθηση
2
Αστέρι
0
Fork
0
Έχετε ήδη κάνει fork το amd-strix-halo-vllm-toolboxes
Κώδικας
Ζητήματα
Pull Requests
Δράσεις
Πακέτα
Έργα
Κυκλοφορίες
Wiki
Δραστηριότητα
79
Υποβολές
3
Κλάδοι
0
Ετικέτες
b035bcb482c2e12bf8a48ecabc660b6f9d55b76e
Γράφημα Υποβολών
7 Υποβολές
Συγγραφέας
SHA1
Μήνυμα
Ημερομηνία
Donato Capitella
b035bcb482
updated benchmarks including thunderbolt and configuratuion guides
2026-02-25 10:48:42 +00:00
Donato Capitella
e726d406fa
updated benchmarks, fix start-vllm
2026-02-23 19:39:19 +00:00
Donato Capitella
4d3b046870
feat: Add new benchmark results for various models and configurations, and update documentation UI with filtering for attention and tensor parallelism.
2026-02-02 21:30:17 +00:00
Donato Capitella
6f118ff936
feat: Update ROCm benchmark result paths, improve cluster node discovery and cache clearing, and refine cluster benchmark result directory.
2026-02-02 07:35:50 +00:00
Donato Capitella
a1105a0b96
feat: Enhance vLLM benchmarking to compare Triton and ROCm attention, introduce a new script for cluster configuration, and update Dockerfile for new tools and dependencies.
2026-02-01 19:36:07 +00:00
Donato Capitella
711de530f6
added ROCm/Triton attention comparison
2025-12-20 11:49:03 +00:00
Donato Capitella
5e8b6bb545
updates
2025-12-20 11:37:06 +00:00