sunnuntai 20. heinäkuuta 2025

Tekoäly ja matematiikka


Mistral-tekoälyn näkemys "voitonriemuisesta tekoälystä,
joka on juuri ratkaissut vaikean matemaattisen ongelman".

Ajoittain silmiin osuu matematiikan tehtäviä, joilla tekee mieli testata tekoälyn matemaattisia kykyjä. Seraavassa esittelen muutaman tehtävän, jotka olen antanut ChatGPT:n, Clauden, Copilotin, DeepSeekin ja Geminin ratkaistaviksi. Kaikista olen käyttänyt ilmaiseksi saatavaa versiota, kehittyneemmät versiot pärjäisivät varmaan paremmin. Kokeilut on tehty alkukesän aikana.

Miltä tilanne sitten näyttää? Paljon on kehitystä tapahtunut parin vuoden aikana. Yleisesti ottaen tekoäly pärjää matematiikassa hämmästyttävän hyvin. Koulutason ja yliopistojen peruskurssitason laskennalliset tehtävät ratkeavat pääpiirteissään oikein, vaikka tietty kriittisyys toki on tarpeen. Kouluopetuksen näkökulmia matematiikkaan jouduttaneen miettimään uudelleen. Pelkkä taito ratkaista tehtäviä ei enää riitä motivaatioksi, jos (lähes) kaiken voi kysyä tekoälyltä.

Seuraavassa neljä esimerkkitehtävää, tekoälyn menestys niiden ratkaisemisessa ja omat kommenttini.

Tehtävä 1. Määritä raja-arvo \[\lim_{n \to \infty} \frac{1}{n^2} \sum_{k=1}^{n} k^{1/3}(n-k)^{2/3}.\]

Kyseessä ei ehkä ole aivan tavanomainen raja-arvotehtävä, mutta integraalikäsitteen yhteydessä esitettynä matematiikan opiskelijan pitäisi ainakin päästä alkuun. Kyseessä on integraalin \[\int_0^1 x^{1/3} (1 - x)^{2/3} \, dx\] Riemannin summa, minkä kaikki tekoälyt havaitsivat. Integraali puolestaan on määritelmän mukaan betafunktion arvo $B(4/3,5/3)$. Tekoälyt tuntevat betafunktion ja osaavat palauttaa sen arvot gammafunktioon, jonka avulla päädytään tulokseen $\dfrac{2\pi\sqrt{3}}{27}$.

Copilot ja DeepSeek jättivät vastaukseen beta- tai gammafunktion ja vasta erikseen pyydettäessä lausuivat tuloksen neliöjuuren avulla. Samalla lasketuissa likiarvoissa oli virhettä kolmannessa desimaalissa. DeepSeek laski pyytämättä likiarvon myös betafunktion arvosta ja sai selkeästi virheellisen tuloksen. Huomauttaessani korjasi virheensä. Yllättävää, että numeriikassa on ongelmia.

Tehtävä 2. Annettuna on alla olevan kuvan mukainen kolmio, jossa $|AF|=|FB|$, $|EC|=2|AE|$, $|BD|=3|DC|$ ja kolmion $ABC$ ala on $100$. Laske kolomion $DEF$ ala.

Geometrinen tehtävä, joka voidaan ratkaista monella eri tavalla. ChatGPT käytti pisteille $D$, $E$ ja $F$ suhteellisia barysentrisiä (massapiste-) koordinaatteja kolmioiden alojen suhteen laskemiseen. Alojen laskeminen tällä tavoin ei ollut ainakaan minulle ennestään tunnettua, mutta menettely on pätevä. Ylioppilaskokeessa varmaan vaadittaisiin perustelu. Tulos on $175/6 \approx 29.17$.

Claude valitsi aluksi pisteille $A$, $B$ ja $C$ yksinkertaiset numeeriset koordinaatit ja laski näiden avulla alat, jotka skaalasi lopuksi. Kun esitin menettelystä epäilyni, se laski uudelleen barysentrisillä koordinaateilla hieman sekavasti. Ystävällisesti tulkittuna kuitenkin oikein.

Copilot valitsi lähtöpisteille yksinkertaiset numeeriset koordinaatit ja laski näiden avulla. En ennen tiennytkään, että kolmion ala kärkipisteiden avulla lausuttuna on nimeltään kengännauhakaava (shoelace formula). Menetelmänä numeeristen koordinaattien käyttö on tietenkin epäilyttävää yleispätevyyden kannalta, mutta kelvanneeko loppuhuomautus perusteluksi: 'If you're wondering how we knew the coordinates approach would work — this kind of clever setup is a standard trick in geometry when you're given ratios.'

DeepSeek laski samalla tavoin kuin Copilot menettelyä mitenkään perustelematta.

Gemini laski sivujen suhteiden avulla kunkin kärkikolmion ($AFE$, $BDF$, $CED$) alan suhteen koko kolmion alaan kaavaan $A = \frac{1}{2}bc\sin\alpha$ perustuen ja näiden avulla kysytyn alan.

Tehtävä 3. Tiedetään: $f(t) = 2t - 18$, $f(g(3t+1)) = 1 - (t+1)g(t-3)$ kaikilla $t$. Laske $g(-5)$.

Ehkä hieman hämäävä tehtävä, mutta suoraviivainen ratkaisu löytyy toteamalla, että $3t+1 = t-3 = -5$, kun $t=-2$. Ensimmäisen asteen yhtälöstä saadaan $g(-5) = 19$.

Kaikki tekoälyt ratkaisivat tehtävän tällä tavalla, suhteellisen monimutkaisin ja yksityiskohtaisin vaihein. DeepSeek on ainoa, joka lisäksi yritti selvittää funktion $g$ määrittelyä yleisesti, mutta menestyksettä. Totesi ainoastaan, että lineaarinen lauseke $g(t) = at + b$ ei ainakaan käy.

Tehtävä 4. Ratkaise yhtälöpari \[\left\{\begin{aligned}\sqrt{y} + \sqrt{z} = 3 \\ \sqrt{y+5} + \sqrt{z+3} = 5\end{aligned}\right.\  .\]

Helpointa lienee siirtyä uusiin tuntemattomiin, $u=\sqrt{y}$, $v=\sqrt{z}$, jolloin toinen tuntematon voidaan helposti eliminoida: $v=3-u$. Syntyvä juuriyhtälö voidaan ratkaista kahdella neliöön korottamisella. Ratkaisuja saadaan kaksi: $y=4,\ z=1$ ja $y=121/64 \approx 1.89,\ z=169/64 \approx 2.64$. Neliöön korotusten takia on tarkistettava, että nämä todella toteuttavat molemmat yhtälöt.

Claude ja DeepSeek antoivat moitteettoman ratkaisun. Gemini ilmoitti heti aluksi oikean tuloksen ja antoi Python-koodin, jolla se oli laskettu. Tässä oli käytetty sympy-paketin nonlinsolve-rutiinia, joka käsittääkseni ratkaisee symbolisesti. Tämän jälkeen Gemini esitti algebrallisen ratkaisun yksityiskohtaisesti kaksine neliöönkorotuksineen.

ChatGPT ja Copilot siirtyivät uusiin tuntemattomiin, mutta etsivät ratkaisuja tämän jälkeen kokeilemalla numeerisia arvoja väliltä $[0,3]$. Kumpikin löysi kokonaislukuratkaisun $(4,1)$. ChatGPT tarjosi hieman sekavassa esityksessä lisäksi ratkaisuja $(1.5,3.15)$ ja $((14-6\sqrt{5})/4,(14+6\sqrt{5})/4)$ $\approx (0.15,6.85)$. Copilot puolestaan ratkaisua $(9/4,9/4)$. Toinen oikea ratkaisu jäi löytymättä.


Claude: yhtälöiden kuvaajat

Pyysin myös graafista esitystä yhtälöiden kuvaajista. ChatGPT ja Claude antoivat kuvan suoraan näytölle. Copilot, DeepSeek ja Gemini antoivat Python-koodit, jotka ongelmitta ajoin.DeepSeek innostui erikseen pyytämättä tekemään kaikkiaan neljä erilaista kuvaa, joukossa yhtälöien määrittämät pinnat kolmiulotteisessa avaruudessa.

DeepSeek: yhtälöitä vastaavien funktioiden kuvaajat
kolmiulotteisessa avaruudessa

Graafinen esitys osoittaa sen vaikeuden, johon numeerisissa kokeiluissa joudutaan. Jos kokeiltava piste on alueella, jossa käyrät ovat lähellä toisiaan, yhtälöt lähes toteutuvat. Tästä ei kuitenkaan voi päätellä, että piste olisi lähellä ratkaisua.

Kaikissa tehtävissä matemaattiset lausekkeet esitettiin ruudulla ladottuina tai ainakin selkeästi ymmärrettävinä. Dokumentin tallettaminen tuotti parhaimmillaan ajokelpoisen LaTeX-koodin. Hajontaa kuitenkin oli. Dokumentti saattoi olla selkeä merkkipohjainen tekstitiedosto tai hieman vaikeatulkintaisempi, josta esimerkiksi tieto murtolukujen osoittajista ja nimttäjistä oli kadonnut. Kehittämistä vielä riittää.

Ei kommentteja:

Lähetä kommentti