VAST Data перестраивает архитектуру AI-инференса для эпохи агентов в сотрудничестве с NVIDIA

VAST Data перестраивает архитектуру AI-инференса для эпохи агентов в сотрудничестве с NVIDIA

Компания VAST Data, специализирующаяся на решениях для хранения данных, объявила о стратегическом партнерстве с NVIDIA, направленном на коренную перестройку архитектуры для выполнения задач искусственного интеллекта, известных как инференс. Ключевым элементом анонса стала интеграция операционной системы VAST AI Operating System с процессорами NVIDIA BlueField-4, что позволяет создать принципиально новую инфраструктуру, оптимизированную для работы сложных AI-агентов, требующих длительного контекста и множества взаимодействий.

Техническая суть инновации заключается в устранении традиционной многоуровневой архитектуры хранения. Операционная система VAST AI OS, работающая напрямую на DPU BlueField-4, организует единое, разделяемое в рамках кластера (pod-scale) хранилище типа «ключ-значение» (KV cache). Этот кэш обеспечивает детерминированный, то есть предсказуемый по времени, доступ к данным. Это критически важно для современных задач инференса, которые выходят за рамки простых запросов: работа с длинными контекстами (long-context), поддержание многоходовых диалогов (multi-turn) и координация множества взаимодействующих AI-агентов (multi-agent inference). Решение позволяет эффективно управлять состоянием и памятью таких сложных систем.

Данное партнерство знаменует переход от эпохи обучения гигантских моделей к фазе их массового и эффективного промышленного использования. Проблема масштабирования инференса, особенно для агентных архитектур, становится ключевым узким местом. Предлагаемая VAST Data и NVIDIA архитектура напрямую атакует эту проблему, предлагая аппаратно-программный стек, который должен обеспечить новый уровень производительности и предсказуемости для сложных AI-рабочих нагрузок. Успех этой инициативы может определить стандарты инфраструктуры для следующего поколения прикладных систем искусственного интеллекта.