Erik Henriksson
erik.henriksson@utu.fi |
Julkaisut
- Analyzing register variation in web texts through automatic segmentation (2025) Proceedings of the 5th International Conference on Natural Language Processing for Digital Humanities Henriksson, Erik; Hellström, Saara; Laippala, Veronika
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - An Expanded Massive Multilingual Dataset for High-Performance Language Technologies (HPLT) (2025)
- Annual Meeting of the Association for Computational Linguistics
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - FinerWeb-10BT: Refining Web Data with LLM-Based Line-Level Filtering (2025)
- NEALT proceedings series
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - Register Always Matters: Analysis of LLM Pretraining Data Through the Lens of Language Variation (2025) Proceedings of the Second Conference on Language Modeling, COLM 2025 Myntti, Amanda; Henriksson, Erik; Laippala,Veronika; Pyysalo, Sampo
(D3 Artikkeli ammatillisessa konferenssijulkaisussa ) - Building Question-Answer Data Using Web Register Identification (2024)
- LREC Proceedings
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - From Discrete to Continuous Classes: A Situational Analysis of Multilingual Web Registers with LLM Annotations (2024) Proceedings of the 4th International Conference on Natural Language Processing for Digital Humanities Henriksson, Erik; Myntti, Amanda; Hellström, Saara; Erten-Johansson, Selcen; Eskelinen, Anni; Repo, Liina; Laippala, Veronika
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - Improving Latin Dependency Parsing by Combining Treebanks and Predictions (2024) Proceedings of the 4th International Conference on Natural Language Processing for Digital Humanities Kupari, Hanna-Mari Kristiina; Henriksson, Erik; Laippala, Veronika; Kanerva, Jenna
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - Intersecting Register and Genre: Understanding the Contents of Web-Crawled Corpora (2024) Proceedings of the 4th International Conference on Natural Language Processing for Digital Humanities Myntti, Amanda; Repo, Liina; Freyermuth, Elian; Kanner, Antti; Laippala, Veronika; Henriksson, Erik
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - PapyGreek Search: Exploring the Language of Greek Papyri (2024) Digital Papyrology III Henriksson, Erik; Vierros, Marja
(A3 Vertaisarvioitu kirjan tai muun kokoomateoksen osa) - Phonological Variation in Greek Papyri: Two Case Studies Using PapyGreek Search (2024) Digital Papyrology III Henriksson, Erik; Dahlgren, Sonja; Vierros, Marja
(A3 Vertaisarvioitu kirjan tai muun kokoomateoksen osa)