TriAttention: Innovazione nella Gestione della Memoria per i Modelli di Linguaggio
TriAttention, sviluppato da MIT, NVIDIA e Zhejiang University, migliora l'efficienza dei modelli di linguaggio riducendo il consumo di memoria e aumentando la velocità di elaborazione.