MiniMax M2.7: Il Modello AI Auto-Evolutivo Open-Source

MiniMax ha rilasciato MiniMax M2.7, un modello open-source che si auto-evolve, raggiungendo il 56,22% su SWE-Pro e il 57,0% su Terminal Bench 2.

MiniMax M2.7: Il Modello AI Auto-Evolutivo Open-Source
MiniMax M2.7 modello AI auto-evolutivo

Il 18 marzo 2026, MiniMax ha annunciato il rilascio di MiniMax M2.7, il suo modello open-source più avanzato, caratterizzato da un meccanismo di auto-evoluzione che gli consente di migliorare autonomamente le proprie prestazioni. Questo modello rappresenta un passo significativo nell'evoluzione dei modelli di linguaggio di grandi dimensioni, introducendo un ciclo di sviluppo in cui il modello partecipa attivamente al proprio miglioramento.

Caratteristiche principali di MiniMax M2.7

MiniMax M2.7 è un modello di linguaggio con 230 miliardi di parametri, progettato per applicazioni complesse come l'ingegneria del software, l'uso di agenti e la produttività in ufficio. La sua architettura si basa su un modello di esperti a miscela sparsa (MoE), che mantiene bassi i costi di inferenza pur preservando la capacità di un modello di grandi dimensioni. Inoltre, utilizza l'attenzione causale multi-testa migliorata con Embedding Posizionali Rotatori (RoPE) e Normalizzazione RMS delle Chiavi e delle Query (QK RMSNorm) per garantire un addestramento stabile su larga scala.

Auto-evoluzione: un passo avanti nell'IA

Una delle innovazioni più significative di MiniMax M2.7 è la sua capacità di auto-evolversi. Durante il processo di sviluppo, il modello ha aggiornato autonomamente la propria memoria, costruito complesse abilità per esperimenti di apprendimento per rinforzo e migliorato il proprio processo di apprendimento basandosi sui risultati degli esperimenti. In un caso interno, una versione di M2.7 ha ottimizzato autonomamente uno scaffold di programmazione attraverso oltre 100 cicli, analizzando traiettorie di fallimento, modificando il codice, eseguendo valutazioni e decidendo se mantenere o annullare le modifiche, ottenendo un miglioramento delle prestazioni del 30%.

Prestazioni e benchmark

MiniMax M2.7 ha ottenuto risultati notevoli in vari benchmark. Su SWE-Pro, ha raggiunto il 56,22%, avvicinandosi al livello di Opus. Su Terminal Bench 2, ha ottenuto il 57,0%, dimostrando una profonda comprensione dei sistemi ingegneristici complessi. Inoltre, ha ottenuto un punteggio ELO di 1495 su GDPval-AA, il più alto tra i modelli open-source, e ha mantenuto un tasso di aderenza del 97% su oltre 40 abilità complesse, ciascuna superiore a 2.000 token.

Applicazioni e disponibilità

MiniMax M2.7 è progettato per assistere in attività complesse come l'ingegneria del software, l'uso di agenti e la produttività in ufficio. È disponibile su piattaforme come Hugging Face, consentendo agli sviluppatori di integrarlo facilmente nelle proprie applicazioni. Inoltre, MiniMax ha rilasciato OpenRoom, una demo interattiva che offre un'interazione AI all'interno di uno spazio GUI web con feedback visivo in tempo reale e interazioni con la scena, disponibile su openroom.ai.

Conclusione

Il rilascio di MiniMax M2.7 segna un avanzamento significativo nel campo dei modelli di linguaggio di grandi dimensioni, introducendo la capacità di auto-evoluzione che potrebbe rivoluzionare lo sviluppo e l'applicazione di modelli AI complessi. Con prestazioni elevate in vari benchmark e applicazioni pratiche in diversi settori, M2.7 rappresenta una risorsa preziosa per sviluppatori e professionisti del settore.

  • Auto-evoluzione dei modelli AI: MiniMax M2.7 introduce un ciclo di sviluppo in cui il modello partecipa attivamente al proprio miglioramento, aprendo nuove possibilità per l'ottimizzazione autonoma dei modelli di linguaggio.
  • Prestazioni elevate in benchmark chiave: Con il 56,22% su SWE-Pro e il 57,0% su Terminal Bench 2, M2.7 dimostra una profonda comprensione dei sistemi ingegneristici complessi.
  • Applicazioni pratiche in vari settori: M2.7 è progettato per assistere in attività complesse come l'ingegneria del software, l'uso di agenti e la produttività in ufficio, offrendo soluzioni avanzate per professionisti e sviluppatori.