A1 Refereed original research article in a scientific journal

Eduskunnan täysistunnon puheenaiheet 1999-2014: miten käsitellä LDA-aihemalleja?




AuthorsPetri Loukasmäki, Kimmo Makkonen

PublisherValtiotieteellinen yhdistys

Publication year2019

JournalPolitiikka

Volume61

Issue2

First page 127

Last page159

Web address https://journal.fi/politiikka/article/view/77163(external)

Self-archived copy’s web addresshttps://research.utu.fi/converis/portal/detail/Publication/42821980(external)


Abstract

Latent Dirichlet Allocation (LDA) on yksi käytetyimmistä laskennallisista tekoälypohjaisista metodeista, joita kutsutaan aihemalleiksi (topic models). Esitämme ja analysoimme eduskunnan täysistuntokeskusteluista laskemiamme LDA-malleja ja arvioimme, mikä aihemäärä olisi mielekäs puheiden sisällön eksploratiiviseen analyysiin. Uutena metodisena sovelluksena analysoimme LDA-aiheiden samanaikaista esiintymistä eri puheissa osuuskorrelaatiokertoimilla. Niiden avulla LDA-mallin tuottamia aiheita voidaan käsitellä samaan tapaan kuin kahdessa saman kaltaisessa metodissa, dynaamisissa aihemalleissa ja korreloituneissa aihemalleissa (correlated topic models ja dynamic topic models), kun aineistoon sisältyy tieto puheiden ajankohdasta ja voidaan olettaa, että sanasto on pysynyt pääpiirteissään muuttumattomana analysoitavalla ajanjaksolla. Lisäksi esitämme luokituksen, jonka avulla ihmisarvioijat voivat analysoida LDA:n tuottamien aiheiden laatua. Tapausesimerkkinä esitämme korrelaatioanalyysin kuntien ja valtion suhdetta käsittelevän aiheen sekä demokratia-aiheen ja budjetti-aiheen yhteyksistä. Täysistuntokeskusteluissa on havaittavissa huomattava muutos ennen ja jälkeen vuoden 2011 eduskuntavaaleja: aiemmin keskustelu käsitteli rahaa ja valtionosuuksia, kun taas Kataisen hallituksen kuntauudistushankkeen aikana debatti käsitteli demokratiaa.


Downloadable publication

This is an electronic reprint of the original article.
This reprint may differ from the original in pagination and typographic detail. Please cite the original version.





Last updated on 2024-26-11 at 13:27