Accedi Iscriviti

Deep Learning

NVIDIA KVPress per l'ottimizzazione dei modelli linguistici a lungo contesto

Ottimizzazione dell'Inferenza LLM con NVIDIA KVPress

Scopri come NVIDIA KVPress ottimizza l'inferenza dei modelli linguistici a lungo contesto, migliorando l'efficienza e riducendo l'utilizzo di memoria.

NVIDIA rilascia AITune: toolkit open-source per l'ottimizzazione dei modelli PyTorch

NVIDIA ha rilasciato AITune, un toolkit open-source che ottimizza automaticamente le prestazioni dei modelli PyTorch, semplificando il deployment in produzione.

VimRAG: Il Nuovo Framework RAG Multimodale di Alibaba Tongyi Lab

Alibaba's Tongyi Lab ha presentato VimRAG, un framework RAG multimodale che utilizza un grafo di memoria per navigare contesti visivi complessi.

Illustrazione della distillazione della conoscenza in modelli AI

Distillazione della Conoscenza: Ottimizzare Modelli di Ensemble in un Singolo Modello AI

Scopri come la distillazione della conoscenza trasforma modelli di ensemble complessi in un singolo modello AI efficiente e deployable.

Glossario dei termini comuni dell'intelligenza artificiale

Glossario dei Termini Comuni dell'Intelligenza Artificiale

Un glossario completo dei termini più comuni nell'intelligenza artificiale, dalle LLM alle allucinazioni.

TriAttention KV Cache Compression

TriAttention: Ottimizzazione della Cache KV nei Modelli LLM

TriAttention, una nuova tecnica di compressione della cache KV, migliora l'efficienza dei modelli di linguaggio di grandi dimensioni, riducendo l'utilizzo di memoria e aumentando la velocità di elaborazione.

MiniMax M2.7: Il Modello AI Open-Source da 230 Miliardi di Parametri con Auto-Evoluzione

MiniMax ha rilasciato M2.7, un modello AI da 230 miliardi di parametri con capacità di auto-evoluzione, disponibile su Hugging Face.