OpenAI und Broadcom stellen „Jalapeño“-ASIC für LLM-Inferenz in großem Maßstab vor
OpenAI und Broadcom haben den Spezialchip „Jalapeño“ angekündigt, einen gemeinsam entwickelten ASIC, der für die Inferenz großer Sprachmodelle in Rechenzentren optimiert ist und noch innerhalb dieses Jahres dort ausgerollt werden soll. Der Chip ist auf OpenAIs technische Roadmap zugeschnitten und soll die Energieeffizienz verbessern sowie die Abhängigkeit von GPU-Anbietern Dritter reduzieren. Konkrete, gemessene Leistungsdaten liegen bislang nicht vor; ein detaillierter technischer Bericht soll in den kommenden Monaten veröffentlicht werden.