Processing math: 100%

sunnuntai 6. huhtikuuta 2025

Umpimähkäinen todennäköisyys

ChatGPT: "Taikuri heittelee punaisia ja sinisiä
palloja umpimähkäisesti uurnaan"


Uurnaan on pantu umpimähkäisesti sinisiä ja punaisia palloja, yhteensä 100 kappaletta. Uurnasta nostetaan umpimähkään yksi pallo, ja se osoittautuu punaiseksi. Sitten nostetaan umpimähkään toinen pallo. Kumpi on todennäköisempää: että se on punainen vai että se on sininen? Vai ovatko mahdollisuudet yhtä suuret?

Intuitio ehkä sanoisi, että mahdollisuudet ovat yhtä suuret. Tai että sininen on todennäköisempi, koska yksi punainen jo otettiin pois uurnasta.

Tilannetta kuitenkin kannattaa tutkia tarkemmin. Menettelynä voi olla simulointi, toisin sanoen kirjoitetaan koodi, joka ensin luo umpimähkäisen pallokokoelman ja sitten nostaa sieltä peräkkäin kaksi palloa. Koodia sitten ajetaan vaikkapa tuhat tai miljoona kertaa ja kirjataan tulokset.

Koodaamaan ryhtyminen kuitenkin nostaa esiin tilanteessa olevan ongelman: Mitä oikeastaan tarkoittaa, että uurnaan pannaan sinisiä ja punaisia palloja umpimähkäisesti? Voisi ajatella, että ensin arvotaan tasaisesta jakaumasta kokonaisluku väliltä [0,100] ja uurnaan pannaan tämän luvun mukainen määrä punaisia palloja. Loput sadasta pallosta ovat sitten sinisiä. Toisena vaihtoehtona voisi olla, että palloja heitellään uurnaan yksitellen ja heitettäessä pallo maalataan yhtä suurella todennäköisyydellä joko punaiseksi tai siniseksi. Kumpikin tapa tuottaa pallokokoelman, jota varmaankin voi sanoa umpimähkäiseksi. Ehkä muitakin yhtä luontevia tapoja voisi löytyä.

Vaikuttaako umpimähkäisyyden luomisen tapa sitten nostettavan pallon värin todennäköisyyteen? Lukija voi tutkia asiaa koodaamalla oman simulaationsa. Todennäköisyyden laskeminen teoreettisesti on tietenkin myös mahdollista. 

Jos umpimähkäisyys luodaan arpomalla punaisten pallojen lukumäärä, on todennäköisempää, että punaisen pallon jälkeen nostettu toinen pallo on myös punainen. Simulointi antaa todennäköisyydeksi noin 2/3, mikä vastaa teoreettisesti laskettua. Jos sen sijaan pallojen väri arvotaan yksi kerrallaan, molemmat värit ovat yhtä todennäköisiä.

Tulos ehkä tuntuu hieman yllättävältä. On kuitenkin selvää, että tilanteet ovat erilaiset: Edellisessä vaihtoehdossa on yhtä todennäköista saada pallokokoelma, jossa kumpaakin väriä on yhtä paljon, kuin saada kokoelma, jossa kaikki pallot ovat samanvärisiä. Jälkimmäisessä vaihtoehdossa yksivärinen pallokokoelma on erittäin epätodennäköinen, mutta hyvin tavallista on, että kumpaakin väriä on lähes sama määrä. Edellisessä vaihtoehdossa ensin nostettu punainen pallo on jonkinlainen — tosin heikko — indikaatio siitä, että punaisia palloja on enemmän.

Todennäköisyyslaskenta on ala, jossa arkipäivän intuitio vie herkästi harhaan. Sana umpimähkään on myös vaarallinen. Eräs kollegani sanoi kerran, että yksiulotteisessa tapauksessa umpimähkäinen tarkoittaa tasaisesti jakautunutta satunnaissuuretta, useampiulotteisessa tapauksessa se voi tarkoittaa mitä tahansa. Jos todennäköisyyslaskennan tehtävässä heitetään tikkoja umpimähkäisesti tauluun, olisikin ehkä parempi puhua osumien jakautumisesta joko tasaisesti tai muulla tavoin tikkataulun alueelle. Satunnaisen heittäjän umpimähkään viskomista tikoista osa varmasti menee taulun ulkopuolelle, kun taas hyvän heittäjän tikat kasautuvat taulun keskiosaan, vaikka näidenkin osumisessa on satunnaisuutta/umpimähkäisyyttä.

 ---

Virikkeenä tämän jutun kirjoittamiseen oli Erica Klarreichin artikkeli Daniel Littin todennäköisyysprobleemoista Quanta Magazine -lehdessä elokuussa 2024: Perplexing the Web, One Probability Puzzle at a Time. Simuloinnit tein laskentaohjelma Mathematicalla. Lisäksi kävin ongelmasta keskustelun tekoälyn (ChatGPT) kanssa: täysin relevanttia päättelyä, järkeviä näkökohtia umpimähkäisyydestä ja bayesiläisestä todennäköisyyslaskennasta.


maanantai 17. maaliskuuta 2025

Tekoäly sarjoja summaamassa


Kysyin tekoälyltä (ChatGPT:n ilmaisversio 3.3.2025), mikä mahtaisi olla sarjan n=11n2

summa. Tämänhän se tietysti osasi: π26=1.644934066. Tulos esiintyy varmasti niin monessa tekoälyn koulutukseen sisältyvässä dokumentissa, että sen löytäminen ei hämmästytä. Mielenkiintoisempaa on kysyä, miten tämän voi osoittaa.

Oppikirjoissa tulos yleensä johdetaan Fourier'n sarjojen avulla. Tämän tien myös ChatGPT valitsee ja laskee parillisen funktion x2 kosinisarjan kertoimet aivan oikein: x2=π23+4n=1(1)nn2cos(nx).

Matkalla on pientä sekoilua vakiotermin laskemisessa: antaako kertoimen integraalilauseke suoraan vakiotermin vai sen puolikkaan. Tämä ei ole yllättävää: oppikirjoissakin merkitään vakiotermiä toisinaan a0, toisinaan a0/2. Lopputuloksen ChatGPT kuitenkin saa oikein.

Loppu ei sitten menekään kunnialla. Kosinisarja lasketaan arvolla x=0, jolloin saadaan 0=π23+4n=1(1)nn2,

ja väitetään tarkemmin perustelematta, että tästä tekijän (1)n vuorottelun takia seuraa haluttu tulos n=11n2=π26.
Tässä on tehty jotakin, mitä en ymmärrä ja mikä ilmeisestikään ei ole perusteltavissa. Sijoittamalla x=π saataisiin haluttu tulos. Sijoitus x=0 taas antaa tuloksen n=1(1)nn2=π212.

Kysyin samaa myös Claude-tekoälyltä (3.3.2025), joka käytti Fourier'n sinisarjaa funktiolle x(πx), mutta laski kertoimet väärin. Suhteellisen monimutkaisessa laskussa päästiin virheen jälkeen takaisin selville vesille vetoamalla tarkemmin määrittelemättömiin 'vuorottelevien sarjojen tunnettuihin ominaisuuksiin'. En ymmärrä, mihin tässä viitataan. Oikeaan lopputulokseen kuitenkin päästiin.

Uusin tulokas, kiinalainen DeepSeek-tekoäly johtaa tuloksen muodostamalla Fourier'n sarjan funktiolle x2, kuten ChatGPT:kin, mutta sarja lasketaan arvolla x=π, kuten pitääkin. Esitys on moitteeton (15.3.2025).

Kaikissa tapauksessa esitys on selkeää ja ensi näkemältä luotettavan näköistä. Tarkemmin katsottaessa ChatGPT:ltä ja Claudelta paljastuu virheitä. Syntyy tunne, että tekoälyn koulutukseen on sisältynyt matemaattisia tekstejä, joista sitten valitaan sopivan näköisiä niiden logiikkaa ymmärtämättä. Tätä käsittääkseni kielimallit tekevätkin: ymmärrystä niillä ei ole, mutta tietyn kontekstin tyyliä ne apinoivat varsin hyvin. Inhimillisessä keskustelussa tämä ehkä riittääkin. Mahtavatko meidän ihmisten puheetkaan aina kovin loogisia olla.

Sarjan summaa koskeva tulos on alunperin Eulerilta vuodelta 1735 (alkuperäinen julkaisu aloituskuvassa). Fourier'n sarjat ovat peräisin vasta 1800-luvun alkupuolelta, joten Euler johti tuloksensa muulla tavoin. Kysyin ChatGPT:ltä ja Claudelta, miten Euler johti tuloksen; DeepSeek antoi tämän pyytämättä. ChatGPT ja Claude löytävät oikean viitteen, Leonhard Eulerin latinankielisen artikkelin De Summis Serierum Reciprocarum Pietarin tiedeakatemian julkaisusarjassa (Commentarii Academiae Scientiarum Imperialis Petropolitanae 7 (1740), sivut 123-134). Annetusta viitteestä on ainoastaan jäänyt pois attribuutti imperialis/keisarillinen. DeepSeek antaa artikkelin nimen ja sen sijainnin Eulerin kootuissa teoksissa (Opera omnia), mutta ei viitettä alkuperäisjulkaisuun.

Kaikki esittävät varsin hyvän tiivistelmän Eulerin artikkelista, joka on itse asiassa laajempi. Siinä summataan eräitä muitakin sarjoja, esimerkiksi n=11n10=π1093555. Lähtökohtana on sinifunktion Taylorin sarja sin(x)=x16x3+1120x515040x7+

ja tästä saatu sarja  sin(x)x=116x2+1120x415040x6+.
Funktion sin(x)x nollakohdat ovat ±nπ, n=1,2,3, ja funktiolla n=1(1x2n2π2)
on ilmeisesti samat nollakohdat (kyseessä on äärettömän monen tekijän tulo). Sarjalla ja tulolla on sama vakiotermi, =1. Jos jahdella polynomilla on samat nollakohdat ja samat vakiotermit, polynomit ovat identtiset, ts. samankorkuisten potenssien kertoimet ovat samat. Olettaen, että vastaava pätee kuvatun kaltaisille 'äärettömän monen termin polynomeille', voidaan verrata toisen asteen termien kertoimia. Sarjassa kerroin on 16. Suorittamalla kertolaskut tulossa saadaan toisen asteen termin kertoimeksi n=11n2π2.
Nämä ovat yhtä suuret, mistä seuraa haluttu tulos.

Päättely ei ole nykyisten matemaattisten vaatimusten mukainen, mistä ChatGPT ja Claude huomauttavat. DeepSeek esittää sen yhtä hyväksyttävänä todistuksena kuin Fourier'n sarjojen käytön. Nykyisenkaltaisia suppenemiskäsitteitä ei 1700-luvulla vielä ollut, mutta Eulerin idea oli merkittävä ja osoitti hyvää intuitiota. Oheiset kuvat (jollaisten piirtäminen olisi Eulerin aikana ollut tavattoman työlästä) antavat kuvan siitä, miten em. sarja ja tulo suppenevat kohden funktiota sin(x)x.

Sarjan osasumman (sininen) ja päättymättömän tulon osatulon (punainen katkoviiva) kuvaajat,
kun näiden muodostaman polynomin asteluku on 10 (vasemmalla) tai 20 (oikealla).

Tekoälyn kehittyessä sen käyttö myös matematiikassa pohdituttaa. Ainakin toistaiseksi näyttää slltä, että tekoälyn kyky loogiseen ajatteluun (tai sen simulointiin) on rajallinen. Matemaattisten laskentaohjelmien kytkeminen mukaan saattaa olla askel eteenpäin. Muunlaisia hyötyjä varmasti löytyy, esimerkkinä tiivistelmien tekeminen. Tällöinkin käyttäjän tulee olla kriittinen.

Mielenkiintoista olisi tietää, miten edellä kuvatut vastaukset oikeastaan ovat syntyneet. Ovatko tekstit peräisin lähes sellaisinaan joistakin tekoälyn koulutukseen kuuluneista lähteistä? Vai onko kombinoitu useiden lähteiden ideoita (tai fraaseja)? Vai jotakin muuta?  


sunnuntai 23. helmikuuta 2025

Kehlmannin Gauss ja Humboldt

,
KehlmannGaussHumboldt

Kehlmannin kuva: Martin Kraft, MKr343518 Daniel Kehlmann (Frankfurter Buchmesse 2023), CC BY-SA 4.0

Luin jokin aika sitten Daniel Kehlmannin kirjan Maailman mittaajat. Kirja kertoo kahdesta 1700- ja 1800-lukujen vaihteen aikana eläneestä tiedemiehestä: Carl Friedrich Gauss (1777–1855) on merkittävä saksalainen matemaatikko ja Alexander von Humboldt (1769–1859) preussilainen luonnontieteilijä ja tutkimusmatkailija. Kirjoittaja Daniel Kehlmann on vuonna 1975 Münchenissä syntynyt saksalais-itävaltalainen moneen kertaan palkittu kirjailija. Saksankielinen alkuteos Die Vermessung der Welt on ilmestynyt 2005. Kirjasta on myös tehty elokuva vuonna 2012, mutta sitä ei liene esitetty Suomessa.


Gauss oli matemaatikko, tähtitieteilijä, geodeetti ja fyysikko, joka suurimman osan elämästään toimi professorina Göttingenissä. Gaussin ansiot ovat moninaiset, enkä puutu niihin lähemmin; Wikipedia-artikkeli on hyvä lähde. Gauss pysytteli paljolti aloillaan eikä matkustanut kovin paljoa. Ehkä merkittävin hänen töistään on latinaksi kirjoitettu Disquisitiones arithmeticae (aritmeettisia tutkimuksia), joka julkaistiin vuonna 1801 Gaussin ollessa 24-vuotias. Hän julkaisi säästeliäästi vaatien töiltään täydellisyyttä, tunnuslauseena 'Pauca sed matura' (vähän mutta kypsää).

Humboldt oli monialainen maantieteilijä ja luonnontutkija (kasvitiedettä, eläintiedettä, geologiaa, magnetismia, klimatologiaa jne.), joka teki laajoja tutkimusmatkoja mm. Etelä-Amerikkaan ja vanhempana Venäjälle. Matkoillaan hän teki laajat muistiinpanot, joiden pohjalta syntyi viisivolyyminen kokoomateos kaikkeudesta Kosmos (1845-1862). Wikipedia (varsinkin englannin- tai saksankielinen) on hyvä lähde tarkempiin tietoihin.

Kehlmann kuvaa Humboldtin ja Gaussin elämänvaiheet pääpiirteissään, mutta kyseessä ei ole elämäkerta, vaikka syntyykin kiusaus lukea sitä sellaisena. Kuvaukset päähenkilöiden luonteesta ja monista tapahtumistakin ovat fiktiota. Luonteeltaan kirja on romaani, jossa kirjailijalla on vapautensa muunnella totuutta ja luoda kohtauksia, jotka saattavat jopa olla ristiriidassa historiallisten faktojen kanssa. Tämä on ymmärrettävämpää, kun kohteena on vaikkapa antiikin ajan sotapäällikkö, jonka elämästä yleensäkin on niukasti tietoja. Sen sijaan Humboldtin ja Gaussin kaltaisista henkilöistä tiedetään paljon enemmän, ja lukija herkästi olettaa faktojen olevan kohdallaan. Kehlmannin ideana lienee ollut kuvata henkilöt vastakohtina: toinen ulospäin suuntautunut, maailmaa kiertänyt, moniin asioihin paneutunut, toinen paikallaan pysyvä, sisäänpäin kääntynyt, äreä ja tieteeseensä uponnut. Kummassakin kuitenkin saksalaista jäykkyyttä ja jääräpäisyyttä.

Kehlmannin kirja herättikin varsinkin Saksassa kriittistä keskustelua. Millainen voi ja saa historiallinen romaani olla?

Hollantilainen Utrechtin yliopiston matematiikan emeritusprofessori Frans Oort on American Mathematical Societyn Notices-lehdessä (June/July 2008) listannut virheitä ja epätarkkuuksia sekä kritisoinut kirjaa lähinnä Gaussin kohteluun närkästyneenä: "Lukijat pitävät itsestäänselvyytenä, että romaani on huolellisesti tutkittu, joten historialliset faktat ovat oikein ja psykologiset kuvaukset kohtuullisen tarkkoja. Ei kuitenkaan näin tässä romaanissa, ja suosittelen vahvasti tarkistamaan luotettavista lähteistä ennen romaanin faktatiedon käyttöä." (Käännös minun.)

Kokonaan toisenlainen näkökulma aukeaa Kiiltomato-sivuston Satu Taskisen arviosta: "Mistä juurista kasvaa uuden ajan ajattelu? Kaikki muodikkaat trendimme, arvomme, tekniikkamme, uskomme, eurooppalaisuutemme? Tässä on kirjan ydin. Aika kulkee, kohtaamme tulevaisuuden joka hetki. Otamme huomiselle suuntaa nykyhetkestä. Kehlmannin romaani on hurmaava kutsu ottaa nykyhetken kartoittamiseen selventävää etäisyyttä menneisyydestä käsin."

Onko tässä näkyvissä ero eksaktikon ja humanistin välillä? Vai tosikon ja taiteilijan?


keskiviikko 5. helmikuuta 2025

Matemaattinen seinäkalenteri


Tilasin edellisen vuoden tapaan American Mathematical Societylta seinäkalenterin nimeltään Your Daily Epsilon of Math, tekijöinä Rebecca Rapoport ja Dean Chung. Jokaiselle päivälle on matematiikan tehtävä, joka ei ole aivan tavanomainen: vastaus on tiedossa, se on melkein kaikissa tehtävissä kyseisen päivän numero. Jokaiselle kuukaudelle on jonkinlainen fraktaalikuvio. Kalenterista näyttäisi olevan muodostumassa perinne, ensimmäinen ilmestyi vuodeksi 2018.

Voi tietenkin kysyä, mikä idea on tehtävissä, joiden vastaus tiedetään. Minusta idea on hyvä. Ei matematiikan opiskelussa tärkeintä ole vastauksen löytäminen, vaan käsitteiden, ajatusmallien ja menetelmien oppiminen. Kun vastaus on tiedossa, ongelmaksi tuleekin, miten ja millä erilaisilla tavoilla siihen päästään. Tätä myös kalenterin tekijät korostavat. Kyseessä on tavanomaisesta poikkeava näkökulma matematiikkaan.

Tehtävien taso vaihtelee. Helpoimmista voi suoriutua peruskoulun yläasteen tiedoilla, toisessa päässä on tehtäviä, joihin yliopisto-opiskelija tai matematiikan ammattilainenkin saattaa tarvita lisätietoja. Tehtävissä saattaa esiintyä ennestään tuntemattomia käsitteitä, mutta useinhan Google auttaa, ja oma tietämys laajenee. Sopivimpana taustana pitäisin lukiotason tietoja ja taitoja.

Helpoimmista tehtävistä olkoon esimerkkinä seuraava:

Zia used x five dollars bill to bye books. He could have used 21 fewer 20 dollar bills instead.

Englantia tulee luonnollisesti ymmärtää, ja jos ei muuta sanota, vastaus on muuttujan x arvo. Kyseessä on varsin yksinkertainen yhtälö. Vai löytyisikö jokin muu tapa päätellä asia? Tehtävä on tammikuun 28. päivältä, joten vastaus on 28.

Minulle itselleni antoi pohdittavaa 24. päivän tehtävä:

How many digits are in the largest left-truncatable prime?

En tuntenut käsitettä ennestään, mutta Wikipedia-artikkeli löytyi, ei tosin suomenkielistä. Kyseessä on alkuluku, joka säilyy alkulukuna, kun vasemmalta poistetaan yksi numero kerrallaan. Esimerkiksi 9137 on tällainen, koska 9137, 137, 37 ja 7 ovat alkulukuja. Wikipedia artikkeli kertoo myös, että suurin tällainen luku on 357686312646216567629137, jossa todellakin on 24 numeroa.

Mutta miten osoittaa, että tämä on suurin luku? Tai miten ylipäätään löytää se? Ohjelmointitaitoiselle henkilölle ei ole kovin vaikeaa kirjoittaa ohjelmaa, joka rakentaa luvun lähtien yksinumeroisista alkuluvuista 2, 3, 5 ja 7. Eteen lisätään vuorollaan jokainen numero ja saaduista kaksinumeroisista luvuista jätetään jäljelle vain alkuluvut. Askelta toistetaan niin kauan kuin se on mahdollista. Edellytyksenä on, että käytettävissä on menettely tarkastaa, onko kyseessä alkuluku. Tarinan ei tarvitse päättyä tähän. Pohdiskelua voi jatkaa esimerkiksi Wikipedia-artikkelin ja sen viitteiden avulla.

Esimerkkinä geometrisista tehtävistä olkoon seuraava kuva, joka ei muuta määrittelyä kaivanne.


Kalenteri tarjoaa lähinnä matemaattista huvia kiinnostuneelle henkilölle. Tällaisena sen voisi kuvitella olevan sopivaa materiaalia vaikkapa harrastajien tai koululaisten kerhoon. Kiinnostavia, ei liian vaikeita pohdittavia, avoimia eikä perille välttämättä tarvitse tai voi päästä. Eikä henkenä ole ylioppilaskirjoituksiin valmistautuminen (vaikka siinäkin voi olla hyödyksi).

Kokonaisuutena tehtäviä ei käsittääkseni ole julkaistu kalenterin ulkopuolella. Näyttäisi kuitenkin, että tehtäviä julkaistaan yksi kerrallaan Facebookin tunnuksella Einstein's Workshop. Tämän vuoden helmi- ja joukukuun tehtävät löytyvät myös kalenterin esittelysivulta.


perjantai 31. tammikuuta 2025

Saatteeksi


Ryhdyin muinaisella 60-luvulla opiskelemaan Helsingin yliopistossa niin sanottuja eksakteja tieteitä (matematiikkaa, fysiikkaa, ...). Tämä on vaikuttanut ajatteluun siinä määrin, että voinen kutsua itseäni eksaktikoksi blogin kuvailurivin mukaisesti.

Eläkkeelle jäin Teknillisen korkeakoulun (Aalto-yliopiston edeltäjän) matematiikan lehtorin virasta lähes 20 vuotta sitten, joten työelämä alkaa unohtua, ja paljon se on 20 vuodessa muuttunutkin. Työelämän ulkopuolella oleminen on jollakin tavoin vapauttavaa. Aikaa on asioiden pohdiskeluun. Näkemyksissään voi assosioida vapaammin eikä tarvitse keskittyä kiireellisiin asioihin tärkeiden sijasta. Samanlaista vastuutakaan ei enää ole, kun ei ole pelkoa joutua toteuttamaan ajatuksiaan. Toisaalta asioita voi katsella rauhallisesti hieman etäämmältä ja ehkä löytää näkökulmia, joita hektisemmässä tilanteessa ei huomaisi. Ulkopuolisen katselukulmasta blogin nimikin.

Onhan blogin nimellä geometrinenkin merkitys, enkä matematiikkaa aiokaan unohtaa, vaikka tarkoitus on pohtia muunkinlaisia maailman menoon liittyviä asioita. Vanhan nyt jo suljetun matematiikkablogini tapaan tarjoan kommentointimahdollisuuden. Olisi kiva, jos asioista voisi keskustelua syntyä, mutta blogin kommentit tuskin ovat kovin hedelmällinen ympäristö. Parempi lienee esimerkiksi Facebook, jossa aion uusista postauksista ilmoittaa niin omalla sivullani kuin Facebookin matematiikkaryhmässäkin.

Jos siis juttuni herättävät ajatuksia, kuulen niistä mielelläni.

Pyysin tekoälyä luomaan postaukseen kuvan aiheena "blogi" ja kuvailutekstinä tämän blogin otsikkoon kirjattu, lisämääreenä "piirroskuva tai karikatyyri". Yllä on DALL·E:n näkemys. Tekoälyllä ei ole tekijänoikeutta tuotoksiinsa, joten niiden käyttö on ongelmatonta. Jään kuitenkin miettimään, mistä tekoäly on oppinsa saanut. Onko taustalla jokin tai varmaankin useampia tekijänoikeuden alaisia kuvia, joita tekoälyn opettamisessa on käytetty? Saavatko näiden tekijät tai pitäisikö heidän saada jonkinlainen korvaus?

Syötin kuvan myös Googlen kuvahakuun. Samanlaista tai lähellä olevaa ei löytynyt, mutta suuri määrä vastaavanlaisia tekoälyn tuottamia kuvia.