Katsooko tekoäly vain menneisyyteen?
Viime aikoina eteeni on tullut mielenkiintoinen argumentti: ChatGPT katsoo vain menneisyyteen, mutta ihminen voi katsoa tulevaisuuteen. Ajatus juontaa juurensa siihen, että tekoäly koulutetaan vanhalla datalla ja esimerkiksi ChatGPT:n tietämys maailmasta rajoittuu koulutusaineiston viimeiseen päivämäärään asti. Tämä ei kuitenkaan yksiselitteisesti tarkoita sitä, että tekoäly katsoo vain menneisyyteen. Koneoppiminen katsoo aina kohti tuntematonta Koneoppimisen perusperiaate on ollut aina kouluttaa tekoäly vanhalla datalla ja testata sitä uudella, ennennäkemättömällä, datalla. Näin on voitu varmistaa, että tekoäly toimii halutulla tavalla myös kohdatessaan täysin uutta dataa. Koneoppiminen tähtää siihen, että tekoäly toimii myös uuden datan kanssa Ennen suuria kielimalleja kieliteknologiset koneoppimismallit kärsivät usein siitä, etteivät ne toimineet hyvin täysin uudenlaisella datalla. Esimerkiksi tuotearvioilla koulutettu tekoäly ei onnistunut kovinkaan hyvin tunnistamaan positiivisia ja negatiivisia ilmauksia kaunokirjallisessa tekstissä. Nämä rajoitteet ovat kuitenkin poistuneet suurten kielimallien myötä, sillä suuret kielimallit kykenevät yleistämään oppimaansa monta erilaista tehtävää varten. Miksi ihminen katsoisi sen enempää tulevaisuuteen? Kun me ihmiset kohtaamme jotain uutta, meidän on usein toimittava vanhan tiedon varassa. Meidänkin ”koulutusdatamme” päättyy aina nykyhetkeen. Jos kadulla meitä vastaan kävelee talutushihnassa oleva tunnistamaton karvainen möykky, oletamme loogisesti, että kyseessä on koira. Tämä oletus pohjaa vanhaan tietoon. Jos kyseessä onkin jokin meille täysin vieras eläinlaji, hämmästymme kohtaamista. Tekoälykin pohjaa olemassa olevaan tietoon kohdatessaan uusia asioita. Erotuksena ihmiseen on se, että tällä hetkellä meillä ei ole käytössä tekoälytyökaluja, jotka voisivat dynaamisesti oppia kokemuksistaan ja päivittää itseään. Tekoäly tulee täten aina ajattelemaan, että karvainen möykky on koira, kunnes sen koulutusaineistoon lisätään tieto siitä, että nyt on löytynyt täysin uusi lemmikiksi sopiva eläinlaji. Ihminen oppisi tämän välittömästi. Tulevaisuuden ennakointi on päättelyä Siinnä missä ihminenkin ennakoi tulevaa päättelyn avulla soveltaen esimerkiksi skenaariotyöskentelyä, tekoälykin voi ennakoida tulevaa päättelemällä. Suuret kielimallit osaavat jo päätellä ja suorittaa ajatusta vaativia töitä. Tekoäly voi siis katsoa tulevaisuuteen, mikäli sitä ohjataan oikein kehotteilla tekemään ennakointia. Monet tekoälytyökalut kuten ChatGPT ja Perplexity osaavat myös hakea lisää tietoa verkosta, jolloin ne voivat pohjata päättelynsä tuoreeseen tietoon.
Voidaanko tekoälyä käyttää muutoksen ennustamiseen MLPESTEL-mallilla?
Khalid Alnajjar ja Mika Hämäläinen tutkivat MBA-tutkinnon opinnäytetyössään tekoälyn kykyä ennustaa muutoksia yritysten toimintaympäristössä. Tätä tehtävää varten he hyödynsivät suurta kielimallia ja kehittivät uuden teoreettisen viitekehyksen nimeltä MLPESTEL. Paradigman muutos, joka mahdollisti ennustamisen Perinteisesti koneoppimisen tekniikat ovat perustuneet kaavojen oppimiseen datasta yksittäisiä tehtäviä varten. Tämän vuoksi tällaiset mallit ovat pystyneet tekemään ennusteita vain hyvin rajatuilla sovellusalueilla, kuten säätietojen tai taloudellisten trendien ennustamisessa. Kuitenkin suurten kielimallien aikakauden myötä tekoälylle on muodostunut kyky tehdä päättelyä myös kapeiden aihealueiden ulkopuolella sekä tekstuaalisen datan, eikä vain numeerisen datan, pohjalta. Tarve uudelle viitekehykselle Vaikka suuret kielimallit, kuten ChatGPT, omaavat uskomattomia kykyjä päättellä ja käsitellä erilaistia kehotteita, ne eivät pysty ennustamaan muutosta pelkän yksittäisen kehotteen avulla. Suuret kielimallit osaavat päätellä, mutta niiden on saatava käyttöönsä tarvittavat työkalut – aivan kuten me ihmistenkin. Lisäksi näin monimutkainen tehtävä on jaettava pienempiin osaongelmiin. MLPESTEL-viitekehys (Alnajjar & Hämäläinen, 2024) Tutkijat kehittivät uuden viitekehyksen nimeltä MLPESTEL, joka ammentaa inspiraationsa perinteisesti liiketaloustieteessä käytetystä PESTEL-mallista sekä ekologisten järjestelmien teoriasta (EST), jota yleensä hyödynnetään lapsen sosiaalisen kehityksen ymmärtämisessä. PESTEL on keskeinen tutkimuksen liiketoiminnallisen sovellusalueen kannalta, kun taas EST:tä käytettiin jakamaan jokainen PESTEL-kategoria neljään eri alajärjestelmään: mikro-, ekso-, meso- ja makrotasoon. Lopputuloksena syntynyt viitekehys oli ihmiselle varsin monimutkainen analysoitavaksi, mutta ei lainkaan liian vaativa suurelle kielimallille, joka pystyy helposti toimimaan tällaisella monimutkaisuuden tasolla. Tekoälypohjaisen ennustamisen ensimmäiset tulokset Tutkijat tutkivat menetelmänsä käyttökelpoisuutta analysoimalla suuren kielimallin ennustuskykyä MLPESTEL-viitekehyksen avulla kahden kansainvälisen yrityksen, Nokian ja Teslan, kohdalla. Menetelmä onnistui ennustamaan oikein 5G-teknologian tuoman mahdollisuuden Nokialle sekä maailmanlaajuisen sirupulan aiheuttamat haasteet, jotka vaikuttivat Teslaan. Opinnäytetyössä saadut tulokset ovat lupaavia ja toimivat todisteena konseptin toimivuudesta. Suuret kielimallit (LLM) ovat saavuttaneet kypsyystason, jossa niitä voidaan hyödyntää ennustamistehtävissä. MLPESTEL-viitekehys on laajentanut teoreettisia mahdollisuuksia liiketoimintaympäristön muutosten ennustamiseen. Tämä tutkimus on avannut tietä tuleville tutkimuksille suurten kielimallien ohjaamasta ennustamisesta ja tulevaisuuden tutkimuksesta. Tulokset toimivat ponnahduslautana laajemman ennakointialustan kehittämiselle Metropoliassa.
Suomen sukukielten tekoälytutkimusta esiteltiin Metropoliassa
Metropoliassa järjestettiin The 9th International Workshop on Computational Linguistics for Uralic Languages -tapahtuma, eli tuttavallisemmin IWCLUL. Tapahtuma kokosi Arabian kampukselle suuren joukon kansainvälisiä tutkijoita, jotka tulivat esittelemään omaa kieliteknologista tutkimustaan, joka liittyi Uralilaisiin, eli suomensukuisiin, kieliin. Haasteena uhanalaisuus Uralilaisista kielistä vain suomi, viro ja unkari ovat isoja kieliä, joilla on oman valtion virallinen tuki. Muut uralilaiset kielet ovat enemmän tai vähemmän uhanalaisia. Puhujamäärät vaihtelevat niittymarin 360 000 ja ersän 300 000 puhujasta aina koltansaamen 300 ja uumajansaamen 5 puhujaan. Osalla kielistä ei ole enää äidinkielisiä puhujia jäljellä. Toivoa ei kuitenkaan ole menetetty näidenkään kielten osalta, kuten Liivi-instituutin johtaja Valts Ernštreits tapaa todeta: “aina kun viimeisen liivin puhujan uskotaan kuolleen, uusi viimeinen puhuja ilmestyy jostai pirtistä”. Jack Rueter muistutti populaarikulttuurin merkityksestä myös uhanalaisten kielten kontekstissa Moderni kieliteknologia vaatii paljon dataa, mikä osaltaan hankaloittaa pienten kielten tekoälykehitystä. Dataa on usein niukasti jos ollenkaan ja siinä on paljon variaatiota. Oikeinkirjoitussäännöt eivät usein ole yhtä selkeästi määriteltyjä ja puhujakunnan selkärankaan iskostettuja kuin valtakielten kohdalla. Suuret kielimallit puhuttivat Suuret kielimallit kuten ChatGPT eivät tällä hetkellä puhu yhtäkään pientä uralilaista kieltä, mutta tutkijat olivat keksineet tapoja saada kielimalleilta vastauksia ulos muotoilemalla kehotteen oikealla tavalla. Oman esitelmäni lisäksi myös Flammie Pirinen ja Niko Partanen raportoivat tutkimuksensa tuloksia. IWCLUL järjestettiin talkoovoimin. Kuvassa Lev Kharlashkin on kutsumassa seuraavan puhujan paikalle Suurten kielimallien ongelma myös suomen, viron ja unkarin kohdalla on se, että ne jakavat sanat pienempiin osiin, tokeneihin, englannin kielen perusteella. Tähän Iaroslav Chelombitkolla ja Aleksei Dorkinilla oli esittää ratkaisuehdotuksia. Metropolian arvot esillä Myös Metropoliassa tehty työ kestävän kehityksen ja tekoälyn saralla oli esillä tapahtumassa. Melany Macías esitteli tutkimustamme, jossa tekoäly oppii ennustamaan kestävän kehityksen tavoitteita suomeksi englanninkielisen datan perusteella. Melany Macías esitteli kestävän kehityksen tavoitteiden ennustamisen tarkkuutta