Questo momento non potrebbe essere più opportuno per Google: Annunciando un paradigma completamente nuovo per l’intelligenza artificiale Coincide grossomodo con la profonda crisi in cui si trova il suo concorrente OpenAI. La stessa Google definisce il modello, chiamato Gemini, “il più grande progetto scientifico e ingegneristico” della sua storia e “il modello generale di intelligenza artificiale più avanzato fino ad oggi”.
Le parole d’ordine sono accompagnate dai necessari benchmark, poiché Gemini viene paragonato a GPT-4 di OpenAI. Ciò che GPT-4 sta a ChatGPT, Gemini sta al chatbot di Google Bard: il motore AI che rende tutto questo possibile. Per i consumatori, il chatbot Bard ad alte prestazioni sarà la manifestazione più visibile di Gemini, ma il modello AI sarà al centro di molte delle applicazioni AI di Google.
Gemini è stato riprogettato da zero, dando priorità alla multimodalità: la capacità di questo modello di gestire diversi tipi di informazioni. Ad esempio, Gemini deve essere in grado di produrre, comprendere, utilizzare e integrare immagini, suoni, video e linguaggio di programmazione molto meglio rispetto al modello precedente.
Gemini supera i modelli esistenti in 30 dei 32 benchmark accademici nella ricerca e nello sviluppo di modelli linguistici. Google sostiene. Ciò include, ad esempio, la comprensione di immagini, audio, video e ragionamento matematico. Le differenze con GPT-4 non sono significative.
Il vecchio approccio alla creazione di modelli multimodali consisteva nell’addestrare componenti separati per svolgere compiti diversi. Vengono quindi combinati per simulare un’altra funzione. Google riconosce che questi modelli sono bravi a svolgere compiti specifici, come descrivere le immagini, ma hanno difficoltà a gestire il pensiero concettuale e complesso. Da un precedente test comparativo di De Volkskrant È successo anche questo: nell’annotare immagini difficili, come i cartoni animati, Bard faceva molti più errori di ChatGPT.
Con l’aggiornamento del software Bard questo arretrato verrà recuperato, promette Google. “Compiti come la comprensione, il riassunto, il pensiero, il brainstorming, la scrittura e la pianificazione sono migliorati notevolmente.” Queste accuse non sono state ancora confermate da esperti o giornalisti indipendenti.
Il modello è disponibile in tre versioni: Nano (adatto agli smartphone Pixel di Google), Pro e il modello più avanzato Ultra, che sarà disponibile solo in seguito. Bard with Gemini Pro è ora disponibile in inglese in oltre 170 paesi, ma non ancora nei Paesi Bassi. Google non può determinare quando sarà il turno dei Paesi Bassi.
Lawrence Verhagen