OpenAI i Broadcom prezentują układ Jalapeño do inferencji LLM w centrach danych

OpenAI i Broadcom ogłosiły wspólny projekt dedykowanego układu ASIC o nazwie Jalapeño, zoptymalizowanego pod inferencję dużych modeli językowych, z planem wdrożenia w centrach danych jeszcze w tym roku. Chip został dostosowany do kierunku technologicznego OpenAI i ma poprawić efektywność energetyczną. Firmy wskazują, że celem jest ograniczenie zależności od zewnętrznych dostawców GPU, w tym NVIDIA, oraz wsparcie pionowej integracji. Na razie nie ma rzeczywistych danych wydajnościowych, a szczegółowy raport techniczny ma zostać opublikowany za kilka miesięcy.