Tekoälytutkimusta NAACL-konferenssissa

Tekoälytutkimukseen erikoistunut NAACL-konferenssi järjestettiin Albuquerquessa, Breakin Bad -sarjan kotikaupungissa. Konferenssin pääteemana on kieliteknologia, ja se järjestetään vuosittain – useimmiten Pohjois-Amerikassa.

Breaking Bad -hahmot ikuistettuina konferenssipaikalla

Kielimallien arviointi puhutti

Konferenssissa oli esillä useita artikkeleita, jotka käsittelivät kielimallien arviointia, eli evaluaatiota. Arviointi on jo pitkään ollut kieliteknologisen tutkimuksen Akileen kantapää – monimutkaiset ongelma redusoituvat yksittäisiin numeerisiin keskiarvoihin. Esimerkiksi konekäännöstutkimuksen lopputulos voi olla 50 BLEU-pistettä – ei mitään sen syvällisempää.

Yhdysvaltojen poliittinen kehitys näkyi osallistujamäärässä

NAACL-konferenssi ei tarjonnut arvioinnin suhteen mitään mullistavaa. Tästä hyvänä esimerkkinä mainittakoon konferenssin parhaaksi artikkeliksi valikoitunut tutkimus, joka tuotti uuden datasetin, jonka avulla suuria kielimalleja voidaan arvioida. Tässäkin pyrkimyksenä oli tuottaa numeerisia arvoja.

Vinoumat esillä

Moni artikkeli tutki suurten kielimallien vinoumia ja turvallisuutta. Suuret kielimallit on koulutettu datalla, ja data on aina vinoutunutta. Täten ei ole ihmekään, että suurissa kielimalleissa esiintyy vinoumia. Tärkeää on, että tunnistamme erilaisia vinoumia tutkimuksen kautta, jotta tiedämme, milloin malleihin kannattaa luottaa.

Postereilla oli kävijöitä tavallista vähemmän

Vinoumista voit lukea esimerkiksi seuraavista artikkeleista: Uncovering Bias in Large Vision-Language Models at Scale with Counterfactuals, LLMs Are Biased Towards Output Formats! Systematically Evaluating and Mitigating Output Format Bias of LLMs ja Unmasking Implicit Bias: Evaluating Persona-Prompted LLM Responses in Power-Disparate Social Scenarios.

Turvallisuudesta puolestaan seuraavista: SafetyQuizzer: Timely and Dynamic Evaluation on the Safety of LLMs, SafeQuant: LLM Safety Analysis via Quantized Gradient Inspection ja RAG LLMs are Not Safer: A Safety Analysis of Retrieval-Augmented Generation for Large Language Models.

Kieliteknologian rooli

Mielenkiintoisin tutkimus oli siirtynyt pois kieliteknologian fokuksesta, eli uusien laskennallisten mallien kehittämisestä. Konferenssissa esitellyt uudet mallit olivat kuin tuulahdus menneisyydestä, ajalta ennen suuria kielimalleja. Tekoälyn kehitys on siirtynyt akateemisesta maailmasta yhä vahvemmin suurten yritysten käsiin, joten akateemikot voivat enää lähinnä katsoa vierestä ja tutkia olemassa olevia malleja.

Kommentit

25.07.2025 Klo: 20:07 Finan sanoi

"I wanted to thank you for this great read!! I definitely enjoying every little bit of it I have you bookmarked to check out new stuff you post… "

16.06.2025 Klo: 08:28 drover sointeru sanoi

"I have not checked in here for a while, but the last several posts are good quality so I guess I will add you to my daily bloglist. You deserve it my friend :) "

Kommentoi