Todennäköisyyttä tyhmälle

Selittäkääpä joku minulle yksi juttu todennäköisyyslaskennasta: kuinka lasketaan todennäköisyys sille, että joku tietty tapahtuma tapahtuu n:n yrityksen aikana?

Esimerkiksi siis tilanne, jossa pussissa on yksi punainen ja yhdeksän valkoista palloa. Mikä on todennäköisyys nostaa punainen pallo, jos nostaa n kertaa ja pallot palautetaan joka kerta pussiin?

Osaan laskea sen takaperin, eli laskemalla todennäköisyyden nostaa valkoinen pallo (9/10) ja siitä sitten kertomalla jokaista yritystä kohden. Esimerkiksi kahdella nostolla todennäköisyys on 19% (0,9 * 0,9 = 0,81). Näin ollen todennäköisyys siis kasvaa ja lähestyy yhtä, mutta ei saavuta sitä koskaan (eikä kuulukaan tietysti saavuttaa).

Asia siis selvä, mutta jotenkin hämää, kun en keksi miten samaan tulokseen pääsee ”suoraan”. Vai pääseekö edes?

18 kommenttia

  1. No mullahan on taustana lyhyt matikka, mutta juuri noin me laskimme todennäköisyyksiä tunnilla. Muistan vieläkin (mikä on ihan hyvä suoritus, ottaen huomioon että ko. kurssi oli lukion ensimmäisellä luokalla), kuinka hoin itselleni että ”ja kerrotaan, tai plussataan”, mutta se ei taida liittyä tähän.
    Eli en tiedä parempaakaan keinoa laskea tilanteen todennäköisyyttä.

  2. Matikkaa on viimeksi tullut luettua lukiossa, mutta muistanpa vähän myöhemmin laskelleeni joihinkin lautapeleihin vastaavia todennäköisyyksiä logaritmien avulla.
    Tämä ei nyt ole suoraan tuo mitä hait, mutta yällä kaavalla saa laskettua sen, kuinka monta yritystä tarvitaan, että päästään tiettyyn prosenttiin.
    n = log(1 – x) * (1 – p)
    Missä x on tapahtuman todennäköisyys (prosentteina) ja p on haluttu todennäköisyys (prosentteina).

  3. Hitusen verran logiikkaa lukeneena kyseenalaistaisin koko kysymyksenasettelun.
    Eiväthän ne pallot ”tiedä” kuinka monta aiempaa nostoa on tehty tai kuinka monta tullaan myöhemmin tekemään.
    Eli aiemmat (tai tulevat) nostot eivät vaikuta millään tavalla parhaillaan tehtävään nostoon. Todennäköisyys punaisen pallon nostamiseen yhdellä tai tuhannella nostolla on aina sama, yksi kymmenestä.
    Todennäköisyys määräytyy vain pussissa nostoa suoritettaessa olevien eriväristen pallojen lukumäärän mukaan.
    Asian havainnollistamiseksi kuvitellaan kaksi tilannetta:
    A) Pussissa on yksi punainen ja yhdeksän valkoista palloa. Tehdään kaksi nostoa joiden välillä nostettu pallo pannaan takaisin.
    B) Pussissa on kaksi punaista ja 18 valkoista palloa. Tehdään yksi nosto.
    Jos merkinnässä kaavailtu kertolasku pitäisi paikkansa, todennäköisyys punaisen pallon nostamiseen olisi vaihtoehdossa A suurempi kuin vaihtoehdossa B. Näin ei kuitenkaan ole, vaan todennäköisyys punaisen pallon nostamiseen on tilanteissa A ja B yhtä suuri, 10%.

  4. Ensin sun pitää etsiä kaikki mahdolliset kombinaatiot, jossa tapahtuma esiintyy ja näiden kombinaatioiden todennäköisyydet. Sen jälkeen ne vain summataan.
    Tämän takia tuo ”millä todennäköisyydellä vähintään yhdellä nostolla tulee punainen pallo, kun yritetään” on helppo laskea tavallaan väärinpäin, koska negaatiossa kombinaatioita on huomattavan paljon vähemmän (eli tasan yksi).

  5. Jepjep, ymmärrän kyllä uhkapelurin harhan, eikä niillä palloilla todellakaan ole muistia. Jokaisella yksittäisellä nostolla on siis aina sama todennäköisyys. Mutta tässä olikin tarkoitus ajatella kokonaisuutta.
    Otetaanpa esimerkki lotosta (koska sitä tässä alunperin ajattelin; palloesimerkki oli sikäli vähän tyhmä). Yksittäisen rivin todennäköisyys on se yksi 15 miljoonasta tai mitä se nyt on. Vaan entäs jos lottoaa kahdesti?
    Tai vaikka lastenhankinta. Todennäköisyys saada jompaakumpaa sukupuolta oleva lapsi on se (suunnilleen) 50%. Silti todennäköisyys sille, että perheen molemmat lapset olisivat samaa sukupuolta on 25%, vaikka yhden pojan jälkeen toisen pojan mahdollisuus on edelleen 50%.
    Eli siis kun niitä pallonnostoja toistetaan, todennäköisyys saada punainen pallo tavallaan kasvaa. Ei siinä yksittäisessä nostossa, vaan verrattuna pienempään määrään nostoja. No niin! Näin pitkään piti kirjoittaa, ennen kuin pääsin asiaan kiinni.

  6. Edelleen olen sitä mieltä, että todennäköisyys ei kasva – mitään ”kokonaisuutta” ei ole olemassakaan.
    Jos osallistut kahdella eri rivillä *saman viikon* lottoarvontaan, voiton todennäköisyys kaksinkertaistuu. Jos osallistut kahteen peräkkäiseen lottoarvontaan yhdellä rivillä per arvonta, ei todennäköisyys muutu miksikään.
    Tätä ”todennäköisyys sille, että perheen molemmat lapset olisivat samaa sukupuolta on 25%” en ymmärrä alkuunkaan.
    Tässähän ovat vaihtoehdot kaksilapsiselle perheelle (T = tyttö, P = poika):
    TP
    TT
    PT
    PP
    Eli todennäköisyys sille, että perheen molemmat lapset olisivat samaa sukupuolta on 50% (tapaukset TT, PP).
    Jos kysytään mikä on todennäköisyys sille, että molemmat lapset ovat poikia, on vastaus tietysti 25% (tapaus PP).
    Pitää olla tarkka siitä, mitä kysytään. Oletetaan, että perheeseen syntyy poika ja toinen on tulossa. Jos kysymys kuuluu ”mikä on todennäköisyys sille että molemmat lapset ovat poikia” on vastaus siis 25%.
    Mutta jos kysymys kuuluu ”mikä on todennäköisyys sille, että seuraava lapsi on poika” on vastaus 50%. Kummassakaan tapauksessa ensiksi syntyneen sukupuoli ei vaikuta toiseksi syntyvän sukupuoleen.
    Takaisin pallojen pariin: Kun nostoja jatketaan todennäköisyys saada punainen pallo kasvaa vain, jos valkoisten pallojen määrä vähenee tai punaisten määrä nousee. Niin epäintuitiiviselta kuin se voi tuntuakin.
    Eli kuten Wikipedia sanoo: ”If two events A and B are independent, then the conditional probability of A given B is the same as the ”unconditional” (or ”marginal”) probability of A”
    http://en.wikipedia.org/wiki/Conditional_probability

  7. Vielä lottoarvonnasta: kuten sanottua, jos osallistut kahdella rivillä samaan arvontaan, voiton todennäköisyys kasvaa. On olennaista huomata, että tämä ei ole analoginen alkuperäisen esimerkin kanssa.
    Tilannetta voisi verrata siihen, että pussista nostetaan yksi pallo, jota ei laiteta takaisin pussiin. Silloinhan todennäköisyys saada toisella nostolla punainen pallo on suurempi, koska pussissa on vähemmän palloja.
    Sen vuoksi tapahtumat eivät ole tilastollisesti riippumattomia, ja vaikuttavat toistensa todennäköisyyteen.
    Lottorivejä on olemassa rajattu määrä. Jos lottoat tarpeeksi monta riviä yhteen arvontaan, voitat taatusti päävoitoiton.
    Jos nostat pussista kymmenen palloa (laittamatta yhtään takaisin), saat 100% varmuudella punaisen pallon.
    Mutta jos lottoat yhden rivin per viikko (tai laitat nostamasi pallon takaisin pussiin), todennäköisyys pysyy samana, viikosta tai nostosta toiseen.

  8. Ah, sattui lipsahdus. Siis tarkoitin, että todennäköisyys sille, että molemmat lapset ovat esim. poikia, on se 25%.
    Edelleen ymmärrän kyllä, että yksittäisen yrityksen todennäköisyys ei kasva. Verrataan kuitenkin tilannetta A tilanteeseen B:
    A) Lototaan kerran yhdellä rivillä. Todennäköisyys voittaa on 1/15 000 000.
    B) Lototaan 15 000 000 kertaa yhdellä rivillä. Todennäköisyys, että näiden kertojen aikana voitto osuu kohdalle on suurempi kuin 1/15 000 000.
    Tätä haen. Tämä on se kokonaisuus, josta on kyse. Jos tehdään sata nostoa kymmenen pallon pussista, on hyvin epätodennäköistä olla nostamatta sitä punaista palloa edes kerran, vaikka todennäköisyys jokaisella nostolla onkin vain se 1/10.

  9. Mihin perustuu tuo ”Todennäköisyys, että näiden kertojen aikana voitto osuu kohdalle on suurempi”? Intuitioon? Matematiikkaan tai todennäköisyyslaskentaan se ei voi perustua.
    Uhkaa mennä jankkaamiseksi, joten kannattaa varmaan lopetella, mutta kyllä voiton todennäköisyys tilanteissa A ja B on aivan yhtä suuri: 1/15 000 000.
    Kyse on ihan klassisesta uhkapelaajan harhasta.
    ”In any case, if I get heads four times in a row, the probability of getting a heads on the next flip is still 50/50, just as it was on the previous flips. The fact that the previous flips all came up heads does not make it more likely that the next flip will come up tails. The first example above is an instance of this sort of Gambler’s Fallacy.”
    http://www.cuyamaca.net/bruce.thompson/Fallacies/gamblers.asp

  10. Jepjep, ei etene, joten tämä olkoon viimeinen:
    Kyse ei ole yksittäisen yrityksen todennäköisyydestä (joka ei koskaan muutu), vaan siitä, että koko sen sarjan aikana joku yrityksistä onnistuu. Siis todennäköisyys saada sen koko sarjan aikana edes yksi osuma.
    Otetaanpas sitä matematiikkaa. Todennäköisyys olla voittamatta lotossa on 15380936/15380937. Jos pelataan kaksi kierrosta, todennäköisyys ettei kummallakaan tule voittoa on tuo potenssiin kaksi. Todennäköisyys, että voitto tulee, on vastakkainen tämän tapahtuman todennäköisyydelle.
    Lottoamalla miljoona kertaa yhdellä rivillä, todennäköisyys olla voittamatta on 0,999999935^1 000 000, eli 93,7%. Todennäköisyys, että miljoonalla kierroksella tulee voitto on siis 6,3%.
    Sama niillä sadalla nostolla pallopussista. Itse asiassa jo seitsemällä nostolla todennäköisyys onnistua kerran on parempi kuin 50%. Jokaisen yksittäisen noston todennäköisyys on edelleen 1/10, mutta jos nostetaan seitsemän kertaa peräkkäin, todennäköisyys että joku seitsemästä nostosta onnistuu, on 52,2%.

  11. Kyllä Mikko on tässä ihan oikeassa, en tiedä onko tässä kommunikaatiokatkos vai ihan puhtaasti väärin ymmärretty tuo uhkapelaajan harha vai mistä kiikastaa.
    Ja helpointa tuo on laskea ihan vaan toteamalla että P(punainen) = 1 – P(kaikki valkoisia) ja siitä sitten lasketaan tuon P(kaikki valkoisia) todennäköisyys, koskapa se on niin suunnattoman helppoa, kuten Tommy jo kirjoittikin.
    Todennäköisyyslaskenta rupeaa menemään varsin mielenkiintoiseksi siinä vaiheessa kun otetaan ehdollisuudet ja kombinaatiot mukaan, mutta onneksi lautapeleissä on yleensä sen verran muiden pelaajien tuomaa kaaosta, että kukaan ei tuohon ryhdykään. Analyysihalvausta on joissain peleissä jo nyt ihan tarpeeksi…
    Ja sitten on tietysti syntymäpäiväparadoksi.. Sekin varsin hauska ilmiö ja hämmentää yleensä helposti jo vähän todennäköisyyksiä tuntevankin ihmisen!

  12. Lienee varmaan syytä lopettaa kommentointi, mutta vielä kerran pitää kysyä mihin tuo ”todennäköisyys ettei kummallakaan tule voittoa on tuo potenssiin kaksi” perustuu?
    Ehkä tämä selventää asiaa:
    Todennäköisyys että kolikkoa heittämällä tulee joko kruuna tai klaava on 100%. Todennäköisyys saada yhdellä rivillä lotossa täysosuma on 1/15 000 000.
    Jos henkilö A ensin heittää kolikkoa ja sitten pelaa yhden lottorivin, onko hänellä parempi mahdollisuus saada loton täysosuma kuin henkilöllä B joka ei heitä kolikkoa, vaan pelaa vain yhden lottorivin?
    Vastaus on ilmiselvästi ei. Tapahtumien todennäköisyydet eivät vaikuta toisiinsa. Mitään potenssia, kertolaskua tai yhteenlaskua ei voi suorittaa, koska kyse on erillisistä tapahtumista.
    Aivan sama pätee silloin, jos henkilö pelaa tällä viikolla yhden lottorivin ja ensi viikolla toisen. Todennäköisyys päävoiton saamiseen ei kasva. Mitään kokonaisuutta tai ”sarjaa” ei ole, vaan kyse on erillisistä tapahtumista.
    Ihmismielellä toki on taipumusta yhdistää asioita, jotka eivät todellisuudessa liity toisiinsa millään tavalla: ”löysin aamulla nelilehtisen apilan, nyt minulla on entistä parempi mahdollisuus voittaa ruletissa”.

  13. Uhh, mitenhän tämän nyt sitten selittäisi…
    Kolikonheitossa mahdollisuus saada kruuna on 50%, eikö totta?
    Oletko sitä mieltä, että heitettäessä 10 kertaa, tuo todennäköisyys saada kruuna (edes kerran) on edelleen 50%?
    Koitapa huviksesi, että onko näin. Esim. teet 10 tuollaista 10 toiston sarjaa ja käykö edes osapuilleen niin, että vain 50% (eli 5kpl) kerroista saat sen kruunan yhdellä noista 10 heitosta?
    Uskallanpa väittää, että saat joka kerta vähintään yhden kruunan. Todennäköisyys sille, että sitä kruunaa ei tule ei ole suinkaan 50% vaan (1/2)^10 joka on 1/1024, eli alle yhden promillen.
    Jos on kaksi erillistä 50% todennäköisyydellä toteutuvaa tapahtumaa, niin todennäköisyys, että kumpikaan ei toteudu on 25%. Nimenomaan siksi, että ne ovat erillisiä mitenkään toisiinsa liittymättömiä, kuten esim. lotto, ruletti, kolikonheitto jne.

  14. Aah, todennäköisyyslaskennasta syntyy aina yhtä herkullisia vääntöjä.
    Ongelmanahan tässä on, että alkuperäinen lause on epätäsmällisesti muotoiltu:
    ”Mikä on todennäköisyys nostaa punainen pallo, jos nostaa n kertaa ja pallot palautetaan joka kerta pussiin?”
    Kun sen pitäisi olla:
    ”Mikä on todennäköisyys nostaa vähintään kerran punainen pallo, jos nostaa n kertaa ja pallot palautetaan joka kerta pussiin?”
    Ekaan ”oikein” vastaus on varmaan se 1/10, mitä Tuomas on yrittänyt myydä, vaikka Mikko tarkoitti alusta lähtien selvästikin jälkimmäistä lausetta.

  15. 34 henkeä haki koulutukseen ja heistä valittiin haastattelujen perusteella 20. Valitsijoita oli 4. Jokainen valitsija vakuuttaa, että kaikki tekivät itsenäiset valinnat ja jokaisella oli sama nimilista valituista. Valittuja ei pantu paremmuusjärjestykseen. Näin siis periaatteesssa valittiin myös 14 rannalle jäänyttä, joista myös kaikki 4 valitsijaa olivat siis yhtä mieltä.
    Valitsijat vakuuttavat, että hakijat ovat olleet hyvin tasaväkisiä ja valinta on ollut vaikea. Siis kuin eri väriset pallot pussissa. Voinen siis kysyä todennäköisyyttä, että neljä henkilöä nostaisi pussista juuri nuo samat pallot omaan koppaansa? Ja mikä sen todennäköisyys on?
    (Todellisuudessa hakijat eivät ole samankokoisia palloja, vaan niillä on erilaisia ominaisuuksia, joista valitsijat tietävät eri määrän ja joita valitsijat arvottavat eri kriteerein. Huolestuttavaa, jos valitsijat eivät ole näitä aukipuhuneet ja paljonko kukakin ehdotuksessaan mitäkin kriteeriä painottaa. )

  16. 34 pallosta voi poimia 20 palloa 1 391 975 640 tavalla, mikäli järjestyksellä ei ole väliä. Todennäköisyys sille, että neljä ihmistä noukkisi juuri samat 20 palloa on tuo potenssiin kolme (1 * 1/1391975640 * 1/1391975640 * 1/1391975640), eli todella pieni. Käytännössä niin ei tapahdu. (Todennäköisyys, että jokainen valitsee samat 14 pois jäävää, on tismalleen sama.)

    Tässä yksinkertaisimmat selitykset ovat:

    1) Hakijat eivät todellakaan olleet hyvin tasaväkisiä, vaan parhaimmisto erottui selvästi. Jos vaikka 19 parasta on selvä juttu, todennäköisyys sille, että kaikki valitsevat saman 20. hakijan on jo huomattavasti tolkullisempi.

    2) Valitsijat eivät todellisuudessa tehneet valintoja itsenäisesti.

    On toki mahdollista, että noin käy ja käytännössä todennäköisyys on monta kertaluokkaa suurempi, koska vaikka 20 parhaan lista ei olisikaan ilmeinen, hakijoista erottuu varmasti tietty parhaimmisto, joista valitsijat ovat yksimielisiä. Osa hakijoista on selvästi isompia palloja. Veikataan siis, että kyseessä on yhdistelmä ratkaisua 1 ja sattumaa.

  17. Mikko Saari kiitos kun selvitit miten toi potenssi juttu toimii

Kommentointi ei ole käytössä.