TY  CONF
TI  ИНФРАСТРУКТУРНЫЙ УРОВЕНЬ ОПТИМИЗАЦИИ ИНФЕРЕНСА НЕЙРОННЫХ СЕТЕЙ: ПЛАТФОРМЫ ОБСЛУЖИВАНИЯ МОДЕЛЕЙ И РАСПРЕДЕЛЕННЫЕ ВЫЧИСЛЕНИЯ
KW  инференс нейронных сетей
KW  обслуживание моделей
KW  Triton Inference Server
KW  Ray Serve
KW  vLLM
KW  динамический батчинг
KW  PagedAttention
KW  автомасштабирование
KW  Kubernetes
KW  распределенные вычисления
JO  МОДЕЛИРОВАНИЕ ИНФОРМАЦИОННЫХ СИСТЕМ И ТЕХНОЛОГИЙ – 2026
AU  Мерзляков, Н.В.
AU  Семкин, А.А.
AU  Матвийчук, Б.С.
AU  Седых, Д.А.
AU  Дудник, С.П.
AU  Вытовтов, П.Д.
PY  2026
PB  Воронежский государственный лесотехнический университет имени Г.Ф. Морозова