OpenAI и Broadcom представили ASIC Jalapeño для масштабного инференса LLM в дата-центрах
OpenAI и Broadcom объявили о совместной разработке специализированного ASIC-чипа Jalapeño, оптимизированного для инференса больших языковых моделей и запланированного к развертыванию в дата-центрах в течение года. Решение создавалось под технологическую дорожную карту OpenAI и нацелено на повышение энергоэффективности. Компании также прямо увязали проект со снижением зависимости от сторонних поставщиков GPU, включая NVIDIA, и с курсом на вертикальную интеграцию. Фактические показатели производительности пока не раскрыты, а подробный технический отчет обещают представить через несколько месяцев.