fbpx

AWS e Cerebras collaboreranno per portare nel cloud una nuova infrastruttura di inferenza AI basata su architettura disaggregata. Il sistema combinerà chip Trainium per l’elaborazione dei prompt e sistemi CS-3 per la generazione dei token. Obiettivo? Altissime prestazioni.