DeepMind presenta un framework per misurare i progressi verso l'AGI

DeepMind ha introdotto un framework per misurare i progressi verso l'AGI e lanciato un hackathon su Kaggle per sviluppare valutazioni pertinenti.

DeepMind presenta un framework per misurare i progressi verso l'AGI
DeepMind Cognitive Framework

Il 17 marzo 2026, Google DeepMind ha presentato un nuovo framework per misurare i progressi verso l'Intelligenza Artificiale Generale (AGI), accompagnato dal lancio di un hackathon su Kaggle per sviluppare le valutazioni necessarie. Questo approccio mira a colmare il divario tra le attuali capacità dei sistemi AI e gli obiettivi di AGI, fornendo strumenti concreti per valutare le capacità cognitive dei modelli AI.

Il Framework Cognitivo di DeepMind

Il framework proposto da DeepMind si basa su decenni di ricerca in psicologia, neuroscienze e scienze cognitive, identificando dieci abilità cognitive chiave ritenute fondamentali per l'intelligenza generale:

  • Percezione: estrazione e elaborazione delle informazioni sensoriali dall'ambiente.
  • Generazione: produzione di output come testo, discorso e azioni.
  • Attenzione: focalizzazione delle risorse cognitive su ciò che è rilevante.
  • Apprendimento: acquisizione di nuove conoscenze attraverso esperienza e istruzione.
  • Memoria: immagazzinamento e recupero delle informazioni nel tempo.
  • Ragionamento: deduzione di conclusioni valide tramite inferenza logica.
  • Metacognizione: conoscenza e monitoraggio dei propri processi cognitivi.
  • Funzioni esecutive: pianificazione, inibizione e flessibilità cognitiva.
  • Risoluzione dei problemi: individuazione di soluzioni efficaci a problemi specifici.
  • Cognizione sociale: elaborazione e interpretazione delle informazioni sociali e risposta appropriata in situazioni sociali.

Per valutare queste abilità, DeepMind propone un protocollo in tre fasi:

  1. Valutazione delle AI: testare i sistemi AI su un ampio set di compiti cognitivi, utilizzando set di test separati per evitare contaminazioni dei dati.
  2. Baselines umane: raccogliere dati di riferimento da un campione rappresentativo di adulti per gli stessi compiti.
  3. Confronto delle performance: mappare le prestazioni dei sistemi AI rispetto alla distribuzione delle performance umane per ogni abilità.

Il Kaggle Hackathon: Un'Opportunità per la Comunità

Per tradurre questo framework in pratica, DeepMind ha collaborato con Kaggle per lanciare un hackathon intitolato "Measuring progress toward AGI: Cognitive abilities". L'obiettivo è coinvolgere la comunità nella progettazione di valutazioni per cinque abilità cognitive con il maggior divario di valutazione: apprendimento, metacognizione, attenzione, funzioni esecutive e cognizione sociale.

I partecipanti possono utilizzare la piattaforma Community Benchmarks di Kaggle per sviluppare e testare le loro valutazioni contro una serie di modelli all'avanguardia. Il montepremi totale ammonta a 200.000 dollari: 10.000 dollari per i primi due classificati in ciascuna delle cinque categorie e 25.000 dollari per i quattro migliori assoluti. Le iscrizioni sono aperte dal 17 marzo al 16 aprile, con i risultati previsti per il 1° giugno. Per partecipare, visita il sito web di Kaggle.

Implicazioni per la Ricerca e lo Sviluppo dell'AGI

Questo framework rappresenta un passo significativo nella standardizzazione delle valutazioni delle capacità cognitive dei sistemi AI, fornendo una base per confrontare modelli, valutare rischi e misurare i progressi verso l'AGI. La collaborazione con la comunità attraverso l'hackathon di Kaggle sottolinea l'importanza di un approccio collettivo nella definizione e nello sviluppo di metriche efficaci per l'AGI.

Per i ricercatori e gli sviluppatori, questo framework offre una guida per identificare aree di miglioramento e orientare le future direzioni di ricerca, promuovendo un avanzamento più mirato e misurabile nel campo dell'intelligenza artificiale generale.

Takeaways

  • Standardizzazione delle valutazioni: Il framework di DeepMind fornisce criteri chiari per misurare le capacità cognitive dei sistemi AI, facilitando confronti e progressi nel campo dell'AGI.
  • Coinvolgimento della comunità: L'hackathon su Kaggle incoraggia la partecipazione attiva dei ricercatori nella progettazione di valutazioni, promuovendo l'innovazione collaborativa.
  • Orientamento alla ricerca: Le dieci abilità cognitive identificate offrono una mappa per indirizzare gli sforzi di ricerca e sviluppo verso aree chiave per l'AGI.
  • Implicazioni etiche: La standardizzazione delle valutazioni può aiutare a identificare e mitigare i rischi associati allo sviluppo dell'AGI, promuovendo un progresso responsabile.
  • Monitoraggio dei progressi: Il framework consente di tracciare i miglioramenti nel tempo, fornendo una misura tangibile dei progressi verso l'AGI.

Per ulteriori dettagli, consulta l'articolo originale di DeepMind.