Otto Tarkka
MA
ohitar@utu.fi Työhuone: 451A ORCID-tunniste: https://orcid.org/0000-0001-8200-0319 |
kieliteknologia; kielitiede; digitaalinen kielentutkimus; korpusavusteinen diskurssintutkimus
turkunlp.org
Aloitin opinnot Turun yliopistossa vuonna 2016 pääaineenani englannin kieli ja valmistuin kandidaatiksi kolme vuotta myöhemmin. Kandidaatintutkielmani oli korpustutkimus englannin oppijoiden kielenkäytöstä. Kandin jälkeen päädyin sattumalta automaattisen tekstiprosessoinnnin kurssille. Innostuin aiheesta välittömästi ja päätin pian tehdä maisterini digitaalisen kielentutkimuksen oppiaineeseen. Maisterintutkielmassani käsittelini topiikkimallinnusta ja korona-ajan tviittejä. Jo opintojeni aikana työskentelin yhdessä TurkuNLP-työryhmän kanssa ja tällä hetkellä valmistelen väitöskirjaani.
Olen väitöskirjatutkija ja teen tällä hetkellä tutkimusta GreenNLP-hankkeessa osana TurkuNLP-työryhmää. Minua kiinnostavat koneoppiminen, suuret kielimallit ja niiden hyödyntäminen korpustutkimuksessa.
- Automated Emotion Annotation of Finnish Parliamentary Speeches Using GPT-4 (2024)
- LREC Proceedings
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - Towards diverse and contextually anchored paraphrase modeling: A dataset and baselines for Finnish (2023)
- Natural Language Engineering
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä ) - Mistä koronapandemian aikana keskustellaan sosiaalisessa mediassa? (2022) Saarni Jenna, Tarkka Otto
(E1 Yleistajuinen artikkeli lehdessä) - Textual Paraphrase Dataset for Deep Language Modelling (2022) European Language Grid: A Language Technology Platform for Multilingual Europe Kanerva Jenna, Ginter Filip, Chang Li-Hsin, Skantsi Valtteri, Kilpeläinen Jemina, Kupari Hanna-Mari, Piirto Aurora, Saarni Jenna, Sevón Maija, Tarkka Otto
(A3 Vertaisarvioitu kirjan tai muun kokoomateoksen osa) - Finnish Paraphrase Corpus (2021)
- Linköping Electronic Conference Proceedings
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa)