A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä
Eduskunnan täysistunnon puheenaiheet 1999-2014: miten käsitellä LDA-aihemalleja?
Tekijät: Petri Loukasmäki, Kimmo Makkonen
Kustantaja: Valtiotieteellinen yhdistys
Julkaisuvuosi: 2019
Journal: Politiikka
Vuosikerta: 61
Numero: 2
Aloitussivu: 127
Lopetussivu: 159
Verkko-osoite: https://journal.fi/politiikka/article/view/77163
Rinnakkaistallenteen osoite: https://research.utu.fi/converis/portal/detail/Publication/42821980
Latent Dirichlet Allocation (LDA) on yksi käytetyimmistä laskennallisista tekoälypohjaisista metodeista, joita kutsutaan aihemalleiksi (topic models). Esitämme ja analysoimme eduskunnan täysistuntokeskusteluista laskemiamme LDA-malleja ja arvioimme, mikä aihemäärä olisi mielekäs puheiden sisällön eksploratiiviseen analyysiin. Uutena metodisena sovelluksena analysoimme LDA-aiheiden samanaikaista esiintymistä eri puheissa osuuskorrelaatiokertoimilla. Niiden avulla LDA-mallin tuottamia aiheita voidaan käsitellä samaan tapaan kuin kahdessa saman kaltaisessa metodissa, dynaamisissa aihemalleissa ja korreloituneissa aihemalleissa (correlated topic models ja dynamic topic models), kun aineistoon sisältyy tieto puheiden ajankohdasta ja voidaan olettaa, että sanasto on pysynyt pääpiirteissään muuttumattomana analysoitavalla ajanjaksolla. Lisäksi esitämme luokituksen, jonka avulla ihmisarvioijat voivat analysoida LDA:n tuottamien aiheiden laatua. Tapausesimerkkinä esitämme korrelaatioanalyysin kuntien ja valtion suhdetta käsittelevän aiheen sekä demokratia-aiheen ja budjetti-aiheen yhteyksistä. Täysistuntokeskusteluissa on havaittavissa huomattava muutos ennen ja jälkeen vuoden 2011 eduskuntavaaleja: aiemmin keskustelu käsitteli rahaa ja valtionosuuksia, kun taas Kataisen hallituksen kuntauudistushankkeen aikana debatti käsitteli demokratiaa.
Ladattava julkaisu This is an electronic reprint of the original article. |