Un ricercatore ricostruisce l'architettura di Claude Mythos con OpenMythos
Kye Gomez ha pubblicato su GitHub OpenMythos, una ricostruzione open-source dell'architettura di Claude Mythos, il modello più potente di Anthropic. Il repository ha raccolto oltre 10.000 stelle in poche settimane, nonostante contenga solo scaffolding teorico senza pesi addestrati.
Risposta Rapida
OpenMythos è una ricostruzione open-source dell'architettura di Claude Mythos, il modello più potente di Anthropic. È basato su ricerche pubbliche e ipotesi educate, senza legami con Anthropic. Il progetto ipotizza che Mythos sia un Recurrent-Depth Transformer, un'architettura che permette un ragionamento più profondo attraverso iterazioni multiple.
Le capacità uniche di Claude Mythos
Claude Mythos è stato sviluppato da Anthropic e mantenuto all'interno del progetto Glasswing, una coalizione di circa 40 partner tra cui Microsoft, Apple, Amazon e l'NSA. Questo modello ha dimostrato capacità eccezionali in cybersecurity, identificando 271 vulnerabilità in Firefox durante i test di Mozilla e completando con successo una simulazione di attacco su rete aziendale in 32 passaggi, un primato per un modello di intelligenza artificiale.
Nonostante queste capacità, Anthropic non ha mai rilasciato Mythos al pubblico, limitandone l'accesso ai soli partner del progetto Glasswing.
L'architettura ipotizzata di OpenMythos
OpenMythos suggerisce che Mythos potrebbe essere un Recurrent-Depth Transformer, noto anche come transformer a loop. A differenza dei modelli standard che impilano centinaia di strati unici, i modelli a loop utilizzano un numero inferiore di strati ma li eseguono più volte per passaggio diretto. Questo approccio permette un ragionamento più profondo in uno spazio latente continuo prima dell'emissione di qualsiasi token.
Questa architettura spiegherebbe le due qualità più strane di Mythos: la capacità di ragionare su problemi nuovi che altri modelli non riescono a risolvere e la sua memorizzazione disomogenea. Questi tratti sono coerenti con un'architettura a loop, che privilegia la composizione rispetto allo storage.
Le basi teoriche di OpenMythos
OpenMythos si basa su diversi lavori di ricerca pubblici. In particolare, cita il paper Parcae di aprile 2026, frutto della collaborazione tra l'Università della California a San Diego e Together AI, che ha risolto il problema di instabilità nei modelli a loop. Il repository integra anche tecniche come Multi-Latent Attention di DeepSeek per la compressione della memoria e un setup Mixture-of-Experts per gestire la vasta gamma di domini.
Tuttavia, OpenMythos manca dei pesi addestrati, quindi è essenzialmente una tecnica senza esecutore. Il codice definisce varianti di modello da 1 miliardo a 1 trilione di parametri, ma l'utente deve addestrarli da solo. Il file readme punta a uno script di addestramento da 3 miliardi di parametri su FineWeb-Edu e a un target di 30 miliardi di token regolato secondo Chinchilla, un'impresa che richiede centinaia di migliaia di dollari in costi di calcolo su GPU H100.
Il contesto di OpenMythos
OpenMythos rappresenta il secondo tentativo in un mese di esplorare le capacità di Mythos. Il primo è stato uno studio di Vidoc Security, che ha riprodotto alcune delle scoperte di vulnerabilità più allarmanti di Mythos utilizzando GPT-5.4 e Claude Opus 4.6 all'interno di un agente open-source, senza accesso a Glasswing e a un costo inferiore a 30 dollari per scansione. Questo studio ha dimostrato che non è necessario Mythos per trovare i bug che Mythos ha identificato.
OpenMythos e la riproduzione di Vidoc perseguono obiettivi diversi. Vidoc ha riprodotto i risultati di Mythos utilizzando modelli esistenti, mentre OpenMythos cerca di riprodurre l'architettura stessa che produce quei risultati. Insieme, questi progetti suggeriscono che il vantaggio competitivo di Mythos potrebbe essere inferiore a quanto il marketing di Anthropic abbia suggerito.
Le implicazioni di OpenMythos
OpenMythos dimostra che la letteratura di ricerca contiene già la maggior parte dei componenti necessari per costruire un modello di classe Mythos. Tecniche come i transformer a loop, Mixture of Experts, Multi-Latent Attention e Adaptive Computation Time, insieme alla soluzione di stabilità di Parcae, non sono proprietarie. Il repository è, più che altro, un inventario di ciò che è pubblicamente noto su come costruire un modello simile a Mythos.
Il repository è sotto licenza MIT e ha già 2.700 fork. Lo script di addestramento è disponibile, in attesa di qualcuno con un cluster di GPU e una tesi da dimostrare.
Il futuro di OpenMythos e le sfide tecnologiche
OpenMythos rappresenta un punto di partenza piuttosto che un prodotto finito. Il progetto richiede risorse computazionali significative per addestrare modelli di dimensioni comparabili a Mythos. Secondo le stime del repository, un modello da 3 miliardi di parametri su FineWeb-Edu con 30 miliardi di token richiederebbe centinaia di migliaia di dollari in costi di calcolo su GPU H100. Questo ostacolo economico potrebbe limitare temporaneamente la capacità di altri ricercatori di replicare completamente l'architettura proposta.
Tuttavia, il codice open-source potrebbe attrarre contributi da parte di università, istituti di ricerca e aziende tecnologiche con accesso a cluster di GPU. La licenza MIT consente una vasta riutilizzazione, e la comunità potrebbe collaborare per ottimizzare gli script di addestramento o esplorare alternative più economiche.
Un'altra sfida è la mancanza di dati specifici su cui Mythos è stato addestrato. FineWeb-Edu è una scelta ragionevole, ma il dataset originale di Anthropic potrebbe contenere elementi unici che influenzano le capacità del modello. Senza accesso a questi dati, qualsiasi replica potrebbe ottenere risultati diversi.
Implicazioni per l'industria dell'IA
La pubblicazione di OpenMythos solleva domande sul vantaggio competitivo dei modelli di ultima generazione come Mythos. Se l'architettura può essere ricostruita utilizzando tecniche pubbliche, il valore intellettuale di Anthropic potrebbe essere meno esclusivo di quanto inizialmente pensato. Questo potrebbe spingere altre aziende a investire nella ricerca di architetture alternative o a collaborare per standardizzare i metodi di sviluppo dei modelli.
Inoltre, il progetto dimostra l'importanza della trasparenza nella ricerca sull'IA. Mentre Anthropic ha scelto di mantenere Mythos all'interno di Project Glasswing, l'iniziativa open-source mostra che la comunità può avanzare comunque, anche senza accesso diretto ai modelli proprietari. Questo potrebbe influenzare le future politiche di condivisione dei modelli da parte delle grandi aziende tecnologiche.
Rischi e considerazioni etiche
La capacità di Mythos di identificare vulnerabilità critiche solleva preoccupazioni sulla sicurezza. Se modelli simili diventano più accessibili, potrebbero essere utilizzati sia per scopi difensivi che offensivi. Questo sottolinea l'importanza di sviluppare linee guida etiche e meccanismi di controllo per l'uso di tali tecnologie.
OpenMythos stesso non è esente da rischi. Sebbene il repository sia teorico, la diffusione di tecniche avanzate potrebbe accelerare lo sviluppo di modelli potenti da parte di attori non regolamentati. La comunità open-source dovrebbe considerare come bilanciare l'innovazione con la sicurezza e l'etica.
Domande aperte e direzioni future
Rimangono numerose domande sull'efficacia di OpenMythos. L'architettura a loop è solo una delle ipotesi di Gomez, e la vera struttura di Mythos potrebbe differire significativamente. Inoltre, la capacità di un modello di ragionamento profondo dipende non solo dall'architettura, ma anche dai dati di addestramento e dalle tecniche di ottimizzazione.
Future ricerche potrebbero esplorare altre architetture o combinare tecniche diverse per superare le limitazioni attuali. La collaborazione tra ricercatori accademici e industriali potrebbe accelerare lo sviluppo di modelli avanzati, rendendo l'IA più accessibile e comprensibile.
OpenMythos rappresenta un passo significativo verso la demistificazione dei modelli di IA avanzata. Sebbene il progetto sia ancora nelle sue fasi iniziali, dimostra che la comunità open-source può fare progressi sostanziali anche senza accesso ai modelli proprietari. Le implicazioni per l'industria dell'IA, la sicurezza informatica e l'etica della tecnologia sono ampie e richiedono un'attenta considerazione. Mentre il futuro di OpenMythos rimane incerto, il suo impatto sulla ricerca e lo sviluppo dell'IA è già evidente.
Nota Editoriale e Disclaimer
Le guide e i contenuti pubblicati su GoYou sono frutto di attività di ricerca e analisi indipendente, a scopo informativo, educativo e di approfondimento.
GoYou non costituisce una testata giornalistica né un prodotto editoriale ai sensi della Legge n. 62/2001 e non svolge attività di informazione in tempo reale.
Il progetto GoYou non fornisce consulenza professionale, tecnica, legale o finanziaria e declina ogni responsabilità per l’uso improprio delle informazioni pubblicate.
Nel settore Crypto, ogni investimento comporta rischi: si invita il lettore a informarsi sempre in modo autonomo prima di assumere qualsiasi decisione.