L'intelligenza artificiale sviluppa il talento in matematica – Consiglio norvegese per i rifugiati

21.269 è un numero primo, ovvero è divisibile solo per 1 e per se stesso? Se c'è una cosa in cui i computer sono bravi, è l'aritmetica. Secondo ChatGPT, 21.269 non è un numero primo“Perché è divisibile per 13.” In effetti, 21.269 è un numero primo, qualcosa che qualsiasi sistema di algebra informatica può dirti in una frazione di secondo.

Un chatbot commette molti errori come questo. “Chat-GPT è solo una scommessa”, afferma in una videochiamata il matematico Johan Komlin dell'Università di Utrecht. ChatGPT non è quindi una calcolatrice, ma un modello linguistico addestrato su un ampio database di testi. Manca di logica formale. Comlin: “Tutta la conoscenza che ChatGPT ha sull'aritmetica si basa su esempi di somme incluse nella sua formazione. Da ciò si deduce come si aspetta che proceda il processo aritmetico. Se fossi una chatbox, penserei anche che 21.269 non lo è un numero primo, dopo tutto, ci sono meno numeri primi a cinque cifre rispetto ai numeri non primi a cinque cifre.

Se esiste un numero infinito di numeri primi (sì) è una domanda che ChatGPT può gestire meglio. Ha chiaramente incontrato questa domanda nella sua formazione e può fornire con precisione prove antiche risalenti a Euclide, trecento anni prima di Cristo. La domanda è molto più difficile: esiste un numero infinito di numeri primi gemelli? ChatGPT non è ancora in grado di fornire una risposta. Ciò non sorprende, perché il problema dei numeri primi gemelli rimane irrisolto. ChatGPT si limita a parlarci dei numeri primi gemelli (coppie di numeri primi con una differenza di 2, come 3 e 5, o 11 e 13) e quali progressi sono stati fatti verso la dimostrazione negli ultimi decenni.

ChatGPT non va oltre a dirci cosa sono i numeri primi gemelli

Cosa succede se chiedi a ChatGPT se può risolvere da solo il problema del gemello iniziale? “Sarebbe fantastico se potessi farlo! Sfortunatamente, trovare la prova di un problema come la congettura dei gemelli è molto complesso, non solo richiede una conoscenza approfondita della teoria dei numeri, ma spesso richiede anche nuove intuizioni e tecniche matematiche non sono ancora stati scoperti.” (…) Come intelligenza artificiale, posso analizzare e spiegare concetti e tecniche matematiche, ma in realtà, lo sviluppo di nuove idee e intuizioni matematiche è ancora al di là delle mie capacità.

Un dettaglio interessante è la parola “ancora” in quest'ultima frase. Verrà un momento in cui l’intelligenza artificiale avrà la creatività dell’intelligenza umana? Lo stesso ChatGPT mantiene sicuramente aperta questa opzione.

Milioni di problemi di ingegneria

Quest’anno è stato fatto un grande passo. DeepMind, noto per AlphaGo, AlphaZero e AlphaFold, tra gli altri, ha lanciato due sistemi di intelligenza artificiale sviluppati per risolvere problemi matematici complessi: AlphaProof E Geometria alfa. L'uso dei computer nella ricerca matematica non è nuovo (vedi riquadro). La novità è che i nuovi strumenti di DeepMind non sono “ausiliari”, ma risolvono da soli i problemi matematici dall'inizio alla fine. Combina le competenze linguistiche che conosciamo da ChatGPT con un “sistema di inferenza formale”.

AlphaGeometry è progettato specificamente per la geometria euclidea, che è la classica geometria 2D. Questa IA è stata addestrata utilizzando milioni di problemi di ingegneria, generati automaticamente. Se la strategia risolutiva non funzionava, il sistema cercava un'altra strategia, ad esempio: “Aggiungi una linea ausiliaria lì” o “Taglia quell'angolo a metà”. AlphaGeometry sta migliorando e diventando più veloce nel prevedere quali strutture portano alla soluzione corretta. La nuova versione, AlphaGeometry 2, è addirittura migliore della precedente.

AlphaProof è più generale e non è stato sviluppato per un'area speciale, come AlphaGeometry. Attualmente, AlphaProof sembra essere in grado di gestire principalmente l'algebra e la teoria dei numeri. Komlin: “ChatGPT inizia a inventare cose e non ha idea di quando sta imbrogliando. Alpha-Proof può pensare in modo logico. AlphaProof è in grado di farlo perché utilizza il linguaggio di programmazione Lean può scrivere dati e dimostrarli senza intervento umano, dice Comlin, che fa parte della comunità Lean “C’è un’interazione tra l’intelligenza artificiale, che cerca di essere creativa, e Lean, che non è creativa, ma conosce le regole della matematica in modo molto preciso”.

Se dai un problema ad AlphaProof, cercherà una soluzione o un indizio. La risposta, o la motivazione, è data in un linguaggio snello. Lean valuta questo e identifica i passaggi legali come prova. Ciò impedisce all'IA di imbrogliare. Se viene effettuata una mossa illegale o la strada risulta essere un vicolo cieco, Lean fornirà un feedback. Quindi AlphaProof prova qualcosa di diverso. Nei problemi difficili è raro che si imbocchi immediatamente la strada giusta. Puoi vederlo chiaramente quando traduci una soluzione scritta in Lean back in un linguaggio normale. Comlin: “Spesso si vedono tutti i tipi di deviazioni che non sono rilevanti per l'argomento e queste non vengono filtrate. Si ha la sensazione che AlphaProof stia consegnando il proprio foglio di scarto.

L'estate scorsa è stata condotta una prova del fuoco sia per AlphaProof che per Alpha-Geometry 2. Sono stati presentati i sei problemi delle Olimpiadi matematiche internazionali (IMO) senza limiti di tempo. Questa Olimpiade è una delle competizioni matematiche più prestigiose per gli studenti delle scuole superiori e si tiene ogni anno a luglio. In due sessioni di quattro ore e mezza ciascuna, ai partecipanti, che si sono qualificati dopo varie prove preliminari, vengono poste sei domande molto impegnative relative alla teoria dei numeri, all'algebra, alla geometria e alla combinatoria.

AlphaGeometry 2 ha risolto il problema della geometria in soli diciannove secondi. Una persona ha bisogno solo di questo tempo per leggere il compito: “Lei è Δ”. ABC triangolo con |Papà| Aria condizionata | aC|. Sia ω la circonferenza inscritta del triangolo ABCE lo è IO centro ω. Lei X Punto, diverso da Cin linea a.C. In modo che la linea passi X È parallelo a condizionatatangente a ω. Allo stesso modo, lei Y Punto, diverso da perin linea a.C. In modo che la linea passi Y È parallelo a Papàtangente a ω. Font Amnesty International Interseca il cerchio dato del triangolo ABC Ancora una volta in P ≠ UN. Punti medi di segmenti di linea condizionata E Papà Diciamo che è chiaro tuo E A. Dimostralo ∠uccidendo +∠YPX = 180 gradi.”

AlphaProof ha risolto con successo tre problemi di algebra e teoria dei numeri. Il problema finale del torneo, relativo alle cosiddette “funzioni dell'acqua” (non è un concetto presente in matematica; è stato progettato appositamente per l'IMO), è stato particolarmente complesso: su un totale di 609 olimpionici, solo cinque sono riusciti a risolverlo. Quel problema. Nessun risultato è piccolo per AlphaProof.

Ma AlphaProof non è affatto perfetto. AlphaProof non è stato in grado di risolvere i due problemi combinatori – un campo che si occupa del conteggio intelligente delle probabilità – e il problema della teoria dei numeri è stato risolto solo dopo tre giorni interi di sudorazione artificiale.

Una sciocchezza allucinogena

A settembre, OpenAI, proprietaria di ChatGPT, ha introdotto anche una nuova IA chiamata o1. Come i due sistemi DeepMind, o1 afferma di essere in grado di “ragionare” e “ragionare”. Suddivide i passaggi difficili in passaggi più semplici e prova un approccio diverso se l'approccio attuale non funziona.

Terence Tao, uno dei migliori matematici del mondo, dell'Università della California, lo ha messo alla prova. Per un dato problema, che potrebbe essere risolto applicando il Teorema di Cramer, ChatGPT è stata in grado di definire solo alcuni concetti rilevanti. “Ma i dettagli erano sciocchezze allucinatorie”, ha scritto Tao su Mastodon. D'altra parte, Q1 “Una risposta completamente soddisfacente”.

o1 ebbe meno successo quando il matematico ungherese Paul Erdös gli presentò un problema sul tau. Il problema in questione non è stato risolto fino a poco tempo fa. Tao ha recentemente risolto il problema. Il 2 settembre Ha pubblicato la sua soluzione sul server di prestampa arXiv. Diede a Tao parte della soluzione e chiese l'oggetto mancante. L’eminente matematico descrive la sua risposta come “un po’ deludente”, perché o1 non è andato oltre il semplice suggerimento di una strategia già esistente; Le variabili creative sono state omesse.

L'intuizione, la creatività e l'ingegno – qualità tipicamente umane – sono indispensabili per arrivare a nuove intuizioni matematiche. Sistemi come AlphaProof e o1 risolveranno un problema aperto come quello dei numeri primi gemelli? Molti matematici sono cauti nel predire il futuro. Attualmente, Tao descrive la creazione di strategie creative attraverso l’intelligenza artificiale come “molto debole”.

Ci sono anche degli ottimisti. Christian Szegedy, il matematico e informatico che lavora nella società xAI di Elon Musk, è brutalmente onesto. Szegedi ha predetto che l’intelligenza artificiale risolverà un grosso problema aperto che i matematici non sanno come risolvere prima del 2030. Comlin, come la maggior parte dei matematici, non osa arrivare a tanto. “Ma non direi nemmeno che ciò non accadrà mai. Il limite potrebbe non essere stato ancora raggiunto.”



"Fanatico della musica. Risolutore di problemi professionale. Lettore. Ninja televisivo pluripremiato."

We will be happy to hear your thoughts

Leave a reply

TGcomnews24