Otto Tarkka
 MA


ohitar@utu.fi



Työhuone451A


ORCID-tunnistehttps://orcid.org/0000-0001-8200-0319

TurkuNLP




Asiantuntijuusalueet
kieliteknologia; kielitiede; digitaalinen kielentutkimus; korpusavusteinen diskurssintutkimus

Tutkimusyhteisö tai tutkimusaihe
turkunlp.org

Biografia

Aloitin opinnot Turun yliopistossa vuonna 2016 pääaineenani englannin kieli ja valmistuin kandidaatiksi kolme vuotta myöhemmin. Kandidaatintutkielmani oli korpustutkimus englannin oppijoiden kielenkäytöstä. Kandin jälkeen päädyin sattumalta automaattisen tekstiprosessoinnnin kurssille. Innostuin aiheesta välittömästi ja päätin pian tehdä maisterini digitaalisen kielentutkimuksen oppiaineeseen. Maisterintutkielmassani käsittelini topiikkimallinnusta ja korona-ajan tviittejä. Jo opintojeni aikana työskentelin yhdessä TurkuNLP-työryhmän kanssa ja tällä hetkellä valmistelen väitöskirjaani.



Tutkimus

Olen väitöskirjatutkija ja teen tällä hetkellä tutkimusta GreenNLP-hankkeessa osana TurkuNLP-työryhmää. Minua kiinnostavat koneoppiminen, suuret kielimallit ja niiden hyödyntäminen korpustutkimuksessa.



Julkaisut

  • Automated Emotion Annotation of Finnish Parliamentary Speeches Using GPT-4  (2024)  
    • LREC Proceedings
    Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024) : ParlaCLARIN IV Workshop on Creating, Analysing, and Increasing Accessibility of Parliamentary Corpora Tarkka, Otto; Koljonen, Jaakko; Korhonen, Markus; Laine, Juuso; Martiskainen, Kristian; Elo, Kimmo; Laippala, Veronika
    (
    A4 Vertaisarvioitu artikkeli konferenssijulkaisussa)


  • Towards diverse and contextually anchored paraphrase modeling: A dataset and baselines for Finnish  (2023)  
    • Natural Language Engineering
     Kanerva Jenna, Ginter Filip, Chang Li-Hsin, Rastas Iiro, Skantsi Valtteri, Kilpeläinen Jemina, Kupari Hanna-Mari, Piirto Aurora, Saarni Jenna, Sevón Maija, Tarkka Otto
    (
    A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )


  • Mistä koronapandemian aikana keskustellaan sosiaalisessa mediassa?  (2022)   Saarni Jenna, Tarkka Otto
    (
    E1 Yleistajuinen artikkeli lehdessä)


  • Textual Paraphrase Dataset for Deep Language Modelling  (2022)  European Language Grid: A Language Technology Platform for Multilingual Europe Kanerva Jenna, Ginter Filip, Chang Li-Hsin, Skantsi Valtteri, Kilpeläinen Jemina, Kupari Hanna-Mari, Piirto Aurora, Saarni Jenna, Sevón Maija, Tarkka Otto
    (
    A3 Vertaisarvioitu kirjan tai muun kokoomateoksen osa)


  • Finnish Paraphrase Corpus  (2021)  
    • Linköping Electronic Conference Proceedings
    Proceedings of the 23rd Nordic Conference on Computational Linguistics (NoDaLiDa 2021) Kanerva Jenna, Ginter Filip, Chang Li-Hsin, Rastas Iiro, Skantsi Valtteri, Kilpeläinen Jemina, Kupari Hanna-Mari, Saarni Jenna, Sevón Maija, Tarkka Otto
    (
    A4 Vertaisarvioitu artikkeli konferenssijulkaisussa)



Last updated on 2024-09-11 at 14:44