maanantai 17. maaliskuuta 2025

Tekoäly sarjoja summaamassa


Kysyin tekoälyltä (ChatGPT:n ilmaisversio 3.3.2025), mikä mahtaisi olla sarjan \[\sum_{n=1}^\infty \frac{1}{n^2}\] summa. Tämänhän se tietysti osasi: $\dfrac{\pi^2}{6} = 1.644934066\dots$. Tulos esiintyy varmasti niin monessa tekoälyn koulutukseen sisältyvässä dokumentissa, että sen löytäminen ei hämmästytä. Mielenkiintoisempaa on kysyä, miten tämän voi osoittaa.

Oppikirjoissa tulos yleensä johdetaan Fourier'n sarjojen avulla. Tämän tien myös ChatGPT valitsee ja laskee parillisen funktion $x^2$ kosinisarjan kertoimet aivan oikein: \[x^2 = \frac{\pi^2}{3}+4\sum_{n=1}^\infty \frac{(-1)^n}{n^2}\cos(nx).\] Matkalla on pientä sekoilua vakiotermin laskemisessa: antaako kertoimen integraalilauseke suoraan vakiotermin vai sen puolikkaan. Tämä ei ole yllättävää: oppikirjoissakin merkitään vakiotermiä toisinaan $a_0$, toisinaan $a_0/2$. Lopputuloksen ChatGPT kuitenkin saa oikein.

Loppu ei sitten menekään kunnialla. Kosinisarja lasketaan arvolla $x=0$, jolloin saadaan \[0 = \frac{\pi^2}{3}+4\sum_{n=1}^\infty \frac{(-1)^n}{n^2},\] ja väitetään tarkemmin perustelematta, että tästä tekijän $(-1)^n$ vuorottelun takia seuraa haluttu tulos \[\sum_{n=1}^\infty \frac{1}{n^2} =  \frac{\pi^2}{6}.\] Tässä on tehty jotakin, mitä en ymmärrä ja mikä ilmeisestikään ei ole perusteltavissa. Sijoittamalla $x=\pi$ saataisiin haluttu tulos. Sijoitus $x=0$ taas antaa tuloksen \[\sum_{n=1}^\infty \frac{(-1)^n}{n^2} =  -\frac{\pi^2}{12}.\]

Kysyin samaa myös Claude-tekoälyltä (3.3.2025), joka käytti Fourier'n sinisarjaa funktiolle $x(\pi-x)$, mutta laski kertoimet väärin. Suhteellisen monimutkaisessa laskussa päästiin virheen jälkeen takaisin selville vesille vetoamalla tarkemmin määrittelemättömiin 'vuorottelevien sarjojen tunnettuihin ominaisuuksiin'. En ymmärrä, mihin tässä viitataan. Oikeaan lopputulokseen kuitenkin päästiin.

Uusin tulokas, kiinalainen DeepSeek-tekoäly johtaa tuloksen muodostamalla Fourier'n sarjan funktiolle $x^2$, kuten ChatGPT:kin, mutta sarja lasketaan arvolla $x=\pi$, kuten pitääkin. Esitys on moitteeton (15.3.2025).

Kaikissa tapauksessa esitys on selkeää ja ensi näkemältä luotettavan näköistä. Tarkemmin katsottaessa ChatGPT:ltä ja Claudelta paljastuu virheitä. Syntyy tunne, että tekoälyn koulutukseen on sisältynyt matemaattisia tekstejä, joista sitten valitaan sopivan näköisiä niiden logiikkaa ymmärtämättä. Tätä käsittääkseni kielimallit tekevätkin: ymmärrystä niillä ei ole, mutta tietyn kontekstin tyyliä ne apinoivat varsin hyvin. Inhimillisessä keskustelussa tämä ehkä riittääkin. Mahtavatko meidän ihmisten puheetkaan aina kovin loogisia olla.

Sarjan summaa koskeva tulos on alunperin Eulerilta vuodelta 1735 (alkuperäinen julkaisu aloituskuvassa). Fourier'n sarjat ovat peräisin vasta 1800-luvun alkupuolelta, joten Euler johti tuloksensa muulla tavoin. Kysyin ChatGPT:ltä ja Claudelta, miten Euler johti tuloksen; DeepSeek antoi tämän pyytämättä. ChatGPT ja Claude löytävät oikean viitteen, Leonhard Eulerin latinankielisen artikkelin De Summis Serierum Reciprocarum Pietarin tiedeakatemian julkaisusarjassa (Commentarii Academiae Scientiarum Imperialis Petropolitanae 7 (1740), sivut 123-134). Annetusta viitteestä on ainoastaan jäänyt pois attribuutti imperialis/keisarillinen. DeepSeek antaa artikkelin nimen ja sen sijainnin Eulerin kootuissa teoksissa (Opera omnia), mutta ei viitettä alkuperäisjulkaisuun.

Kaikki esittävät varsin hyvän tiivistelmän Eulerin artikkelista, joka on itse asiassa laajempi. Siinä summataan eräitä muitakin sarjoja, esimerkiksi $\displaystyle\sum_{n=1}^\infty \dfrac{1}{n^{10}} =  \dfrac{\pi^{10}}{93555}$. Lähtökohtana on sinifunktion Taylorin sarja \[\sin(x) = x - \tfrac{1}{6}x^3 + \tfrac{1}{120}x^5 - \tfrac{1}{5040}x^7 + \dots\] ja tästä saatu sarja  \[\frac{\sin(x)}{x} = 1 - \tfrac{1}{6}x^2 + \tfrac{1}{120}x^4 - \tfrac{1}{5040}x^6 + \dots.\] Funktion $\dfrac{\sin(x)}{x}$ nollakohdat ovat $\pm n\pi$, $n = 1,2,3,\dots$ ja funktiolla \[\prod_{n=1}^\infty (1-\frac{x^2}{n^2\pi^2})\] on ilmeisesti samat nollakohdat (kyseessä on äärettömän monen tekijän tulo). Sarjalla ja tulolla on sama vakiotermi, $=1$. Jos jahdella polynomilla on samat nollakohdat ja samat vakiotermit, polynomit ovat identtiset, ts. samankorkuisten potenssien kertoimet ovat samat. Olettaen, että vastaava pätee kuvatun kaltaisille 'äärettömän monen termin polynomeille', voidaan verrata toisen asteen termien kertoimia. Sarjassa kerroin on $-\frac{1}{6}$. Suorittamalla kertolaskut tulossa saadaan toisen asteen termin kertoimeksi \[-\sum_{n=1}^\infty \frac{1}{n^2\pi^2}.\] Nämä ovat yhtä suuret, mistä seuraa haluttu tulos.

Päättely ei ole nykyisten matemaattisten vaatimusten mukainen, mistä ChatGPT ja Claude huomauttavat. DeepSeek esittää sen yhtä hyväksyttävänä todistuksena kuin Fourier'n sarjojen käytön. Nykyisenkaltaisia suppenemiskäsitteitä ei 1700-luvulla vielä ollut, mutta Eulerin idea oli merkittävä ja osoitti hyvää intuitiota. Oheiset kuvat (jollaisten piirtäminen olisi Eulerin aikana ollut tavattoman työlästä) antavat kuvan siitä, miten em. sarja ja tulo suppenevat kohden funktiota $\dfrac{\sin(x)}{x}$.

Sarjan osasumman (sininen) ja päättymättömän tulon osatulon (punainen katkoviiva) kuvaajat,
kun näiden muodostaman polynomin asteluku on 10 (vasemmalla) tai 20 (oikealla).

Tekoälyn kehittyessä sen käyttö myös matematiikassa pohdituttaa. Ainakin toistaiseksi näyttää slltä, että tekoälyn kyky loogiseen ajatteluun (tai sen simulointiin) on rajallinen. Matemaattisten laskentaohjelmien kytkeminen mukaan saattaa olla askel eteenpäin. Muunlaisia hyötyjä varmasti löytyy, esimerkkinä tiivistelmien tekeminen. Tällöinkin käyttäjän tulee olla kriittinen.

Mielenkiintoista olisi tietää, miten edellä kuvatut vastaukset oikeastaan ovat syntyneet. Ovatko tekstit peräisin lähes sellaisinaan joistakin tekoälyn koulutukseen kuuluneista lähteistä? Vai onko kombinoitu useiden lähteiden ideoita (tai fraaseja)? Vai jotakin muuta?  


2 kommenttia:

  1. Kukapa kissan hännän nostaisi ellei kissa itse: https://matematiikkalehtisolmu.fi/2019/1/basel.pdf

    VastaaPoista
  2. Törmäsin joku vuosi sitten Baselin ongelman geometriseen ratkaisuun, joka oli mielestäni niin kaunis että ajattelin lähettää sen tänne: https://www.youtube.com/watch?v=d-o3eB9sfls

    VastaaPoista