TY CONF TI ИНФРАСТРУКТУРНЫЙ УРОВЕНЬ ОПТИМИЗАЦИИ ИНФЕРЕНСА НЕЙРОННЫХ СЕТЕЙ: ПЛАТФОРМЫ ОБСЛУЖИВАНИЯ МОДЕЛЕЙ И РАСПРЕДЕЛЕННЫЕ ВЫЧИСЛЕНИЯ KW инференс нейронных сетей KW обслуживание моделей KW Triton Inference Server KW Ray Serve KW vLLM KW динамический батчинг KW PagedAttention KW автомасштабирование KW Kubernetes KW распределенные вычисления JO МОДЕЛИРОВАНИЕ ИНФОРМАЦИОННЫХ СИСТЕМ И ТЕХНОЛОГИЙ – 2026 AU Мерзляков, Н.В. AU Семкин, А.А. AU Матвийчук, Б.С. AU Седых, Д.А. AU Дудник, С.П. AU Вытовтов, П.Д. PY 2026 PB Воронежский государственный лесотехнический университет имени Г.Ф. Морозова