Recentemente, Anthropic ha annunciato il lancio di due nuovi modelli e una nuova capacità sperimentale chiamata computer use, che consente a Claude 3.5 Sonnet di generare azioni informatiche per svolgere compiti complessi. Questa innovazione rappresenta un significativo passo avanti nella capacità delle intelligenze artificiali di interagire con le interfacce utente in modo simile agli esseri umani.
Anthropic ha addestrato Claude a interpretare visivamente lo schermo, permettendo agli sviluppatori di usarlo per compilare moduli, navigare su siti o utilizzare software. È come avere un’IA che lavora per te, senza stancarsi e con meno errori umani. La funzionalità è in beta perché ha problemi con lo scorrimento e lo zoom. Anthropic monitora la situazione, conservando screenshot per 30 giorni ed eseguendo controlli di sicurezza per rilevare comportamenti discutibili.
“Claude è tornato, molto meglio. Ti prende e basta, risponde come se capisse davvero l’intento invece di una risposta morta e senza vita”, ha detto
NextGenAIUser in un post su Reddit.
I nuovi modelli
Claude 3.5 Sonnet: Questo modello aggiornato è progettato per eccellere in compiti di ingegneria software, offrendo miglioramenti in termini di ragionamento e capacità di problem-solving creativo. È in grado di comprendere il contesto in modo più sfumato, facilitando interazioni più naturali e fluide con gli utenti.
Claude 3.5 Haiku: Questo modello è il più veloce e conveniente della serie, superando le prestazioni del suo predecessore in tutte le categorie, rendendolo ideale per casi d’uso ad alto volume come la generazione di codice e test.
Capacità di “computer use”
La nuova funzione computer use consente a Claude 3.5 Sonnet di eseguire azioni su computer, come muovere il cursore, cliccare pulsanti e digitare testo basandosi su ciò che vede sullo schermo. Questa capacità è attualmente in beta pubblica e offre agli sviluppatori la possibilità di costruire prodotti che integrano queste funzioni.
Applicazioni pratiche
Anthropic si distingue per la sua unicità. “La versione aggiornata di Claude 3.5 Sonnet, con la nuova capacità di utilizzo del computer, mantiene il livello di sicurezza AI 2, quindi non richiede misure aggiuntive”, afferma il team.
Il modello economico Claude 3.5 Haiku è potente quanto Claude 3 Opus, ma opera con costi e latenza ridotti, garantendo accessibilità senza compromettere le prestazioni.
Con un punteggio SWE-bench del 40,6%, supera modelli più costosi, permettendo agli sviluppatori con budget limitati di mantenere alta la qualità. La paranoia aziendale è comprensibile. Microsoft ha introdotto “Recall”, che consentiva a Copilot+ di fare screenshot degli utenti, sollevando preoccupazioni e costringendo Microsoft a rivedere i piani. Anthropic promette un approccio alternativo.
Aziende come Replit stanno integrando Claude per automatizzare valutazioni e semplificare i flussi di lavoro web. I pionieri esplorano come Claude possa gestire attività complesse. Claude 3.5 Haiku sarà disponibile a novembre. Asana, Canva e Replit stanno cercando di automatizzare flussi di lavoro complessi.
Ad esempio, Replit utilizza Claude 3.5 Sonnet per sviluppare funzionalità chiave. Con Claude 3.5 Sonnet e la capacità di utilizzo del computer, Anthropic ridefinisce l’interazione IA-utente, migliorando l’efficienza e aprendo nuove possibilità per applicazioni AI intuitive e collaborative.