SRS Labs публикует исследование AI-инфраструктуры

Наша R&D-команда опубликовала результаты по оптимизации инференса LLM — прирост пропускной способности в 3x.

Опубликовано: 18 ноября 2024 г.

SRS Labs опубликовал исследовательскую работу с новыми подходами к оптимизации инференса LLM.