Blogi

20.4.2021 10.46

Hyväksi luultu data uhkaa tekoälyn onnistumista

  • Asiakasdata ja CRM
  • Data-alustat ja raportointi
  • Datan hallinta ja laatu

Tekoälykeskustelu on hyvin teknologia- ja algoritmikeskeistä. Tämä on sinänsä ymmärrettävää, koska algoritmien rakentaminen päätöksenteon tueksi on paitsi uutta myös erittäin vaativaa.

Tästä syntyy usein harha, että tekoälyhankkeen epäonnistuminen johtuisi algoritmien kehittymättömyydestä ja sopimattomuudesta kyseisen yrityksen tai toimialan tarpeisiin. Todellisuudessa hankkeet kompastuvat usein hyväksi luultuun tai väärin valittuun dataan. Tätä näkemystä tukee esimerkiksi Secondmindin tuore tutkimus.

Ihmiset ymmärtävät, että heidän saamansa data voi olla virheellistä, ja ihmiset osaavat korjata huonon datan aiheuttamia vääriä johtopäätöksiä. Tekoäly ei, ellei sitä varta vasten opeteta.

Jos tekoäly näkee yhden kuvan appelsiinimehujään syömisestä, se ei ymmärrä siitä, että on olemassa ääretön määrä tilanteita, joissa keltaisen lumen syöminen ei ole hyvä idea. Niistä ei vain ole kuvia eli dataa. Näin tekoäly oppii pitämään keltaista lunta mehujäänä.

Suurin uhka tekoälyprojektin onnistumiselle on hyväksi luultu data

 Tekoäly oppii datan perusteella. Kun tekoäly opetetaan tekemään päätöksiä huonolla datalla, se tekee järjestelmällisesti ja johdonmukaisesti huonoja päätöksiä. Suurin uhka tekoälyprojektin onnistumiselle on hyväksi luultu data. Tekoälysovelluksia voidaan käyttää myös korjaamaan dataa, mutta jos tekoäly asetetaan ensin korjaamaan dataa ja sitten toinen tekoäly tekemään johtopäätöksiä sen perusteella, riskit kasvavat.

Datan laatuvaatimukset riippuvat paljon myös tekoälyn tekemien päätösten riskitasosta. Jos riskejä on varaa ottaa, huonompikin data kelpaa.

Onnistuneiden tekoälyhankkeiden taustalla on harvoin pisimmälle viilattu algoritmi, vaan tekoälyn harkittu ja jatkuva opettaminen. Tekoälyn opetuksessa on käytetty oppimisen kannalta olennaista dataa ja pohdittu tarkkaan, miten oppimista mitataan. Datan olennaisuus tarkoittaa kolmea asiaa: sopiiko data kyseiseen käyttötarkoitukseen, voiko dataa käyttää kyseisessä kontekstissa ja onko datan laatu riittävän hyvä.

Huonolla datalla syötettynä tekoälystä tulee tekoääliö

Opettamiseen käytettävän datan laatu on ratkaiseva tekijä. Siinä olevat virheet ja vinoumat siirtyvät tekoälyn käyttäytymiseen. Käyttötarkoituksen määrittää tekoälyn opettamisen tavoite. Toisin sanoen, oppiiko se päättelemään oikeita asioita annetulla datalla. Sopivuus kyseiseen kontekstiin määritellään yleensä yrityksen linjausten, kyseisen datan käyttöä koskevilla sopimuksilla, tai laeilla. Datan laadun hyvyys on arkipäiväinen, helposti ratkaistava ongelma. Samaan aikaan se on useimpien organisaatioiden suurin este tekoälyprojektien onnistumiselle.

Miksi sitten data ei ole laadullisesti kunnossa? Hassua kyllä, useimpien organisaatioiden johto ei edes tiedä, että heidän datansa ei ole kunnossa. Datan kunnossapito ei ole varsinaisesti niin vaikea ongelma, että sen pitäisi vaatia johdon huomiota. Se vaatii kuitenkin resursseja, ja varsinkaan ennen tekoälyä ei vaikuttanut kovin tarpeelliselta, joten muut johdon tärkeäksi määrittämät asiat ajavat ohi oikealta ja vasemmalta.

Data on mahdollista saada kuntoon, kun se on ymmärretty, kuvattu ja vastuutettu. Tilanne ei saa muuttua, vaikka joku henkilö poistuu organisaatiosta. Datan kunnossa pitäminen ei ole sinänsä vaikeaa, mutta vaatii resursseja ja kuormittaa usein jo muutenkin kiireisiä ihmisiä. Se on vain jäänyt tekemättä.

 Jos data ei ole kunnossa, on oikeastaan turhaa edes haaveilla onnistuneista digitalisaatioprojekteista. Vasta kun data on kunnossa, on aika siirtyä pohtimaan seuraavan tekstin aihepiiriä, tekoälyn hyötyjen tunnistamista. Huonolla datalla syötettynä tekoälystä tulee tekoääliö.

AIGA, (Artificial Intelligence Governance and Auditing)

Tämä kirjoitus liittyy AIGA-hankkeeseen (Artificial Intelligence Governance and Auditing). AIGA-hankkeen tarkoituksena on lisätä suomalaisten yritysten kansainvälistä kilpailukykyä ja osaamista keinoälyn luotettavassa ja hallitussa skaalamisessa ja organisaation laajuisessa hyödyntämisessä.

AIGA-hankkeessa tutkitaan ja kehitetään tutkimus- ja yritysyhteistyössä tekoälyn hallintamalleja ja -mekanismeja sekä näiden kaupallistamista ja viemistä kansainvälisille markkinoille. Kaksivuotisen hankkeen päärahoittaja on Business Finland.


Kea Kangas-Lång

Kirjoittaja on työskennellyt IT-arkkitehtuurirooleissa yli 15 vuotta sekä yksityisellä että julkisella sektorilla. Hänen intohimonaan on master datan kehittäminen liiketoiminnan tueksi ja edistämiseksi. Master datan ohella hänellä on vahva kokemus kokonaisarkkitehtuurien ja hankearkkitehtuurien kehittämisestä sekä tietosuojasta.

Katso profiilini


Tero Laatikainen

Kirjoittaja on Loihde Advisory Oy:n Palvelualueiden kehityksen johtaja. Hän on myös pitkän linjan MDM-konsultti ja -kouluttaja.

Katso profiilini

Pidätkö lukemastasi? Tilaa blogitekstimme meiliisi.