Veronika Laippala
mavela@utu.fi +358 29 450 3330 +358 50 328 9739 Arcanuminkuja 1 Turku |
Asiantuntijuusalueet
Computational linguistics; text linguistics; corpus linguistics; digital discourse analysis.
Computational linguistics; text linguistics; corpus linguistics; digital discourse analysis.
Biografia
I am a linguist who likes computers. My main research topics include language variation across different communicative situations and the development of automatic tools so that we could better benefit from large, web-crawled corpora.
My ongoing projects include "A piece of news, an opinion or something else? Different texts and their detection from the multilingual Internet" funded by Emil Aaltonen foundation and "Massively multilingual modeling of registers in web-scale data" funded by Academy of Finland.
For more information, please have a look at our lab website at https://turkunlp.github.io/
Julkaisut
- Building the Penitentiary Document Corpus (PeDoCo) for NLP: Balancing Data Complexity and Uniform Data Structure (2025)
- Digital Humanities in the Nordic and Baltic Countries Publications
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - From keywords to key embeddings – contrasting French and Swedish web registers using multilingual deep learning (2025)
- Corpus Linguistics and Linguistic Theory
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä ) - Perspectives on Forests and Forestry in Finnish Online Discussions - A Topic Modeling Approach to Suomi24 (2025) Proceedings of the 1st Workshop on Ecology, Environment, and Natural Language Processing (NLP4Ecology2025) Peura, Telma; Krizsán, Attila; Kuusalu, Salla-Riikka; Laippala, Veronika
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - Automated Emotion Annotation of Finnish Parliamentary Speeches Using GPT-4 (2024)
- LREC Proceedings
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - Building Question-Answer Data Using Web Register Identification (2024)
- LREC Proceedings
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - From Discrete to Continuous Classes: A Situational Analysis of Multilingual Web Registers with LLM Annotations (2024) Proceedings of the 4th International Conference on Natural Language Processing for Digital Humanities Henriksson, Erik; Myntti, Amanda; Hellström, Saara; Erten-Johansson, Selcen; Eskelinen, Anni; Repo, Liina; Laippala, Veronika
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - Health crisis communication in Finnish news media: Evaluative images of the Covid-19 pandemic in digital news headlines (2024)
- Nordicom Review
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä ) - Improving Latin Dependency Parsing by Combining Treebanks and Predictions (2024) Proceedings of the 4th International Conference on Natural Language Processing for Digital Humanities Kupari, Hanna-Mari Kristiina; Henriksson, Erik; Laippala, Veronika; Kanerva, Jenna
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - Intersecting Register and Genre: Understanding the Contents of Web-Crawled Corpora (2024) Proceedings of the 4th International Conference on Natural Language Processing for Digital Humanities Myntti, Amanda; Repo, Liina; Freyermuth, Elian; Kanner, Antti; Laippala, Veronika; Henriksson, Erik
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - Introduction (2024) Linguistics across Disciplinary Borders : the March of Data Coats Steven, Laippala Veronika
(A3 Vertaisarvioitu kirjan tai muun kokoomateoksen osa) - Linguistics across Disciplinary Borders : the March of Data (2024) Coats Steven, Laippala, Veronika
(C2 Toimitustyö tieteelliselle kokoomateokselle) - Linguistic variation beyond the Indo-European web: Analyzing Turkish web registers in TurCORE (2024)
- Register studies
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä ) - The Topical Landscape of Web Registers : Exploring the Interplay of Registers and Topicality in a Web-scale Corpus (2024) Linguistics across Disciplinary Borders : The March of Data Skantsi Valtteri, Laippala Veronika, Kyröläinen Aki
(A3 Vertaisarvioitu kirjan tai muun kokoomateoksen osa) - Towards Automatic Register Classification in Unrestricted Databases of Historical English (2024) Linguistics across Disciplinary Borders : the March of Data Repo Liina, Hashimoto Brett, Liimatta Aatu, Saario Lassi, Säily Tanja, Tiihonen Iiro, Tolonen Mikko, Laippala Veronika
(A3 Vertaisarvioitu kirjan tai muun kokoomateoksen osa) - Analyzing the unrestricted web: The finnish corpus of online registers (2023)
- Nordic Journal of Linguistics
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä ) - FinGPT: Large Generative Models for a Small Language (2023) Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing Luukkonen Risto, Komulainen Ville, Luoma Jouni, Eskelinen Anni, Kanerva Jenna, Kupari Hanna-Mari, Ginter Filip, Laippala Veronika, Muennighoff Niklas, Piktus Aleksandra, Wang Thomas, Tazi Nouamane, Scao Le Teven, Wolf Thomas, Suominen Osma, Sairanen Samuli, Merioksa Mikko, Heinonen Jyrki, Vahtola Aija, Antao Samuel, Pyysalo Sampo
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - Helsingin kielilukion vierailu uusiin Arcanumin tiloihin (2023)
- Leala-tutkimuskeskuksen blogi
(D1 Artikkeli ammattilehdessä) - In search of founding era registers: automatic modeling of registers from the corpus of Founding Era American English (2023)
- Digital Scholarship in the Humanities
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä ) - Predictive keywords: Using machine learning to explain document characteristics (2023)
- Frontiers in Artificial Intelligence
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä ) - Toxicity Detection in Finnish Using Machine Translation (2023)
- NEALT proceedings series
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa)