Voiko tekoälyn avulla ennustaa SM-liigan tuloksia?

Löytyykö täältä muita lätkäfaneja?

SM-liiga käy tällä hetkellä kuumana ja vaikka hallille ei pääsekään samalla tavalla tunnelmaa seuraamaan, on aihetta silti mielenkiintoista pitää silmällä. FabricAI:n kotikaupunki Tampere on tunnettu kiekkokaupunki, eikä tämä tunteita herättävä laji ole meillekään sen vieraampi.

Nyt ei kuitenkaan ole kyse siitä, mitä joukkueita FabricAI:lla kannustetaan – vaan siitä, miten tekoälyä voidaan hyödyntää kiekkotulosten ennustamisessa.

Artikkelisarjan toisessa osassa pureudutaan jälleen tekoälyn käytännön sovelluksiin. Tutkimme SM-liigan tuloksia tekoälyn avulla, selvittääksemme osaako tekoäly ennustaa tulevien pelien tuloksia. Jos tulokset ovat lupaavia, niitä voisi hyödyntää esimerkiksi pitkävedossa.

Mistä lähdettiin liikkeelle?

FabricAI:lle tuttuun tapaan halusimme rakentaa mallin, joka on käyttökelpoinen ja tuottaa järkeenkäyviä sekä onnistuneita ratkaisuja. Mallia lähti rakentamaan FabricAI:n tekoälyn isä Juhani Tolvanen, pienenä taka-ajatuksenaan mahdollisuus hyödyntää kyseisiä tuloksia pitkävetoon.

Prosessi aloitettiin tutkimalla, onko ottelun tulosta mahdollista ennustaa molempien joukkueiden aikaisempien otteluiden perusteella. Juhani rakensi mallin vuoden 2018 loppupuolella, mutta datan piirteet eivät juuri eroa nykypäivästä.

Itse mallin rakentaminen ja datan manipulointi ovat huomattavasti monimuotoisempia ja yksityiskohtaisempia prosesseja.

Tällä kertaa pidetään asia kuitenkin yksinkertaisena ja keskitytään vain pintapuoliseen prosessiin sekä ennen kaikkea tekoälyn löydöksiin.

Ottelun tulosta siis pyrittiin ennustamaan joukkueiden aikaisempien suoritusten perusteella ja löytämään mahdollisia korrelaatioita. Kyseisiä korrelaatioita oli esimerkiksi voitto: Kuka voittaa? Koti? Vieras? Entä ketä vastaan?

Asian selvittämiseksi tehtiin seuraavat toimenpiteet:

  • Ladataan data, missä on mukana 17 eri joukkuetta viimeisen viiden kauden ajalta.
  • Syötetään mukaan viiden vuoden historiatiedot.
  • Katsotaan, oppiiko tekoäly ennustamaan voittajan.

Syötetyissä tiedoissa oli yhteensä 2190 eri ottelua ja 17 eri joukkuetta. Kyseinen data on hankittu Veikkauksen verkkosivuilta.

Näillä tiedoilla lähdettiin manipuloimaan dataa.

Koska tarkoituksena oli kokeilla, voidaanko edellistä peliä käyttää ennustamaan seuraavaa peliä, manipuloitiin dataa sen mukaisesti.

Mukaan hankittiin molempien joukkueiden edelliset pelit. Eli jos kyseinen peli oli jo loppukaudella, oli edellisissä peleissä mukana kaikki sitä edeltävät kauden pelit. Lisäksi poistetiin kausien ensimmäiset pelit, joita oli 40 kappaletta, sillä niissä ei ollut riittävästi dataa käyttötarkoitukseemme. Jäljelle jäi siis 2150 ottelua tutkittavaksi.

Datan venyttämisen ja rikastamisen jälkeen päästiinkin tekoälygurumme lempiosuuteen – koneoppimiseen.

  • Data muutettiin pelkiksi numeroiksi, jolloin se on mahdollista syöttää suoraan koneoppimisen malliin ja kouluttaa sitä.
  • Tutkittavia sarakkeita oli kolme: koti voittaa, vieras voittaa sekä tasapeli.
  • Otetaan erikseen testidata, mitä ei näytetä koneelle,
  • Sekä koulutusdata, jonka avulla konetta koulutetaan.

Malli siis ennusti todennäköisyyksiä näille kolmelle mahdollisuudelle kerätyn datan perusteella.

Tulokset olivat lupaavia

Tekoäly onnistui löytämään yhteyksiä tekijöiden välillä sekä ennustamaan otteluiden tuloksia. Tekoäly onnistui luomaan esimerkiksi ennusteen, jonka mukaan 72 % varmuudella JYP voittaa Kärpät kotipelissään vuonna 2018 ja näin oli myös käynyt.

Vaikka edellisten pelien maalien vertailu tuottikin melko lupaavia tuloksia, tarvitaan enemmän dataa, jotta voidaan rakentaa vielä uskottavampia ratkaisuja.

Otetaan mukaan maalivedot ja joukkuekokoonpanot. Vedoista tutkitaan niiden määrää sekä sitä mikä veto meni kohti maalia, mikä ei mennyt vai kenties blokattiinko veto.

Uuden datan perusteella rakennettiin malli, joka ottaa huomioon seuraavat piirteet:

  • Kausi
  • Kotijoukkue
  • Vierasjoukkue
  • Pelaajat koti- ja vierasjoukkueissa
  • Molempien joukkueiden viiden edellisen pelin tulokset ja vedot
  • Yleisiä tietoja pelistä

Kuten huomataan, uudessa mallissa on huomattavasti suurempi määrä tekijöitä mukana. Uuden monimutkaisemman datan tarkoituksena on saavuttaa entistä parempia tuloksia.

Kuitenkin uusi malli oli melko hidas kouluttaa ja siinä esiintyi ylisovittamista, joten täysin mutkatonta parempien tulosten saavuttaminen ei ollut.

Uuden mallin tulokset olivat kuitenkin rohkaisevia.

Uhkapeli on aina uhkapeli, eikä tuloksia voi ikinä luvata. Sen mielessä pitäen, koneoppimisen avulla olisi silti mahdollista saavuttaa lupaavia tuottoja ja tulokset olivat ajoittain melko onnistuneita.

Jos jokaisessa pelissä olisi pelattu tekoälyn suositusten mukaisesti ja euron panoksella neljän vuoden ajan, lopputuloksena olisi 17,40 euron voitto.

Ja jos pitkäveto ei kuitenkaan ole oma juttu, ainakin voisi tehdä vaikutuksen työpaikan kahvihuoneessa veikkaamalla usein tulevan pelin tulokset lähelle oikeaa!

Pitäisikö tässä sitten pistää pillit pussin ja keskittyä vain uhkapelaamaan tekoälyn avulla?

Uraa SM-liigan tulosten ennustamisesta ei meille kuitenkaan taida tulla, mutta tekoälyn käytännön sovelluksia on aina mielenkiintoista tutkia ja tuoda esiin muille aiheesta kiinnostuneille.

Kuitenkin liigatulosten ennustamisen sijaan FabricAI:lla keskitytään ensisijaisesti ratkaisuihin, jotka oikeasti toimivat tehokkaasti ja ovat luotettavia. FabricAI:n automatisoidun ostolaskujen tiliöinnin avulla voidaan käsitellä yli 95 % ostolaskuista automaattisesti.

Tässä ei ole kyse uhkapelistä, vaan luotettavasta ratkaisusta, joka tuottaa huomattavaa lisäarvoa – todistetusti joka kerta.

Modernin tilitoimiston tunnusmerkit täyttää vain harvat tilitoimistot