Arcee AI lancia Trinity: un LLM open source da 400 miliardi di parametri Arcee AI, una startup di 30 persone, ha sviluppato Trinity, un modello LLM open source da 400 miliardi di parametri, sfidando i colossi tecnologici.
LLM e la minaccia alla privacy online: la fine della pseudonimia I modelli di linguaggio di grandi dimensioni (LLM) stanno minacciando la privacy online, rendendo obsoleta la pseudonimia come misura di protezione.
Skillware: Middleware Deterministico per la Compressione dei Prompt LLM Scopri come Skillware, un middleware deterministico, può comprimere i prompt per LLM riducendo i costi e migliorando l'efficienza.
Ottimizzazione dell'Inferenza LLM con NVIDIA KVPress Scopri come NVIDIA KVPress ottimizza l'inferenza dei modelli linguistici a lungo contesto, migliorando l'efficienza e riducendo l'utilizzo di memoria.
Gemma 4: modelli open per reasoning e agenti Gemma 4 porta reasoning, agentic workflows, multimodalità e deployment flessibile su edge, workstation e cloud per casi d’uso enterprise.
Sycophancy nei LLM: come si misura e come si mitiga Analisi approfondita della sycophancy nei grandi modelli di linguaggio, metodi di misurazione e strategie di mitigazione per modelli più affidabili e etici.