[Перевод] Внутри vLLM: Анатомия системы инференса LLM с высокой пропускной способностью

18 октября 2025, 22:53 Habr.com

187

Привет! Этот пост — перевод очень хардовой статьи про внутренности vLLM и того, как устроен инференс LLM. Переводить было сложно из-за англицизмов и отсутствия устоявшегося перевода многих терминов, но это слишком классная статья, и она обязана быть на русском языке! А дальше — слово автору:

От paged attention, непрерывного батчинга, кэширования префиксов , specdec и т.д. — до мульти-GPU и мультинодового динамического сервинга LLM под нагрузкой.

В этом посте я постепенно представлю все основные системные компоненты и продвинутые функции, которые составляют современную систему инференса LLM с высокой пропускной способностью. И детально разберу, как внутри работает vLLM.

Другие новости

Врач рассказал, как действовать при травмах в летний сезон

Лекарства США стоят десятки тысяч долларов. Но при Альцгеймере не помогают

Диетолог Джутова объяснила, как похудеть без голодовок

Врач раскрыл россиянам причины резких перепадов настроения

Ветеринары предупредили о рисках перегрева у собак и кошек в жару

Житель Уссурийска стал одним из 7 тысяч спортсменов, покоривших фитнес-гонку в Шанхае

Реанимобиль с пациенткой попал в фатальное ДТП, появились первые кадры

Путин: Россия и КНР взаимодействуют в металлургии, биотехнологиях и фармацевтике

Ребенок попал в больницу из-за вылетевшего из-под газонокосилки камня

"Сильное кровотечение": в Петербурге авто блокировало проезд реанимации с пациентом

В Петербурге авто блокировало проезд реанимобилю с пациентом и попало на видео

В Крыму у крупного рогатого скота зафиксировали несколько случаев заболевания бруцеллёзом и лейкозом

Baza: Жертва «схемы Долиной» перенесла инсульт, пытаясь отстоять права на квартиру

Инсульт и слепота на один глаз: история очередной жертвы "схемы Долиной" из Петербурга

В трёх районах Крыма выявили случаи бруцеллеза и лейкоза у крупного рогатого скота

Пермяк отсудил у клиники 290 тыс. за сломанный зуб

Врачи Екатеринбурга спасли хоккеиста от тромба в легком

В Крыму вспышка опасной инфекции у коров: введены меры контроля

Врач Перминова: желание пить в одиночку без повода говорит об алкоголизме

Ракова: Лесотерапия, прогулки и рафтинг вошли в новый сезон «Московского долголетия»

День фармацевта: истории томских специалистов

Томская "Плавучая поликлиника" добралась до Могочина

От лишнего веса до здоровых дёсен

Врач Анна Косенкова: как избежать перегрева под солнцем

Психиатр из Тулы раскрыл признаки зарождающейся алкогольной зависимости

Здоровый расчет. Как будет развиваться медицина Москвы в ближайшие пять лет

ОРВИ во Владимирской области: спад на 12,8% за неделю

Алексей Учитель сообщил о выздоровлении матери Юлии Пересильд

В Волгограде врачи достали из желудка мужчины 217 монет и 11 гаек

Дарина Эрвин впервые появилась на публике после операции на позвоночнике

Волгоградские врачи удалили из желудка пациента 227 инородных предметов

Пятилетний мальчик оказался в реанимации после укуса гадюки в российском городе

В Котласе пятилетний мальчик попал в реанимацию после укуса гадюки

Пострадавший при атаке ВСУ в Курской области 18 мая скончался в больнице

Медики извлекли из желудка волгоградца более 200 металлических предметов

В Волгограде врачи спасли мужчину, который наелся монет, гаек и дверных петель

В Ялте ищут девушку, после удара которой восьмилетняя девочка попала в больницу

Собянин: В Москве сегодня самая большая продолжительность жизни

Воробьёв: поликлинику в Голицыно планируют сдать в 2028 году

Собянин: средняя продолжительность жизни в Москве достигла 80 лет

Врачи удалили арахис из лёгкого двухлетнего ребёнка под Екатеринбургом

Другие новости сегодня