Hanna-Mari Kupari
filosofian maisteri - Master of Arts
hmknie@utu.fi Arcanuminkuja 1 Turku Työhuone: A390 ORCID-tunniste: https://orcid.org/0000-0003-2515-5861 |
digitaalinen kielentutkimus, keskiajan latina; korpuslingvistiikka; TEI-xml; automaattinen morfosyntaktinen jäsentäminen
Korpuslingvistiikan metodien kehittäminen keskiajan latinan tutkimuksessa
Olen digitaalisen kielentutkimuksen väitöskirjatutkija Turun yliopistossa Emil Aaltosen säätiön rahoituksella. Yhdistän työssäni keskiaikaiset aineistot uusimpiin nykyaikasiin koneoppimismallintamisen menetelmiin. Maisterin tutkintoni olen suorittanut klassillisesta filologiasta pääaineenani latinalainen filologia. Erityisesti olen kiinnostunut kieliopin tutkimuksesta, määrällisistä menetelmistä ja paikallishistorian näkökulmista.
Akateemisen työni ohella julkaisen aktiivisesti yleistajuista tiedeviestintää. Olen ollut usean lukuvuoden ajan laitoksen yhteiskunnallisen vuorovaikutuksen ja viestinnän (YVV) työryhmän jäsen. Lisäksi olen mukana Tohtoriverkosto ry:n toiminnassa ja osallistun aktiivisesti sen ohjelman suunnitteluun ja toteutukseen.
Nykyaikaiset menetelmät keskiaikaisille lähteille
Väitöskirjassani, joka kuuluu digitaalisten ihmistieteiden alaan, tutkin keskiaikaisia apostolisia rikosoikeudellisia penitentiariaattiasiakirjoja sekä Registrum Ecclesiae Aboensiksen kopiokirjaa hyödyntäen korpuslingvistiikan menetelmiä. Tutkimukseni keskiössä on keskiajan latinan kielenkäyttö ja kielellinen vaihtelu (rekisterianalyysi), jota tarkastelen metatiedoilla täydennettyjen ja morfosyntaktisesti annotoitujen tekstikorpusten avulla. Edistän avointa tiedettä julkaisemalla kaiken käyttämäni koodin, datan ja tutkimustulokset avoimesti julkaisujeni rinnalla.
Toimin TurkuNLP- ja TUCEMEMS-tutkimusryhmien jäsenenä.
Apurahat
Tutkimustyölleni ole saanut tukea Emil Aaltosen säätiön apurahasta (2022–2024), Turun Yliopistosäätiön matka-apurahasta (2023), Turun yliopiston tutkimusapurahoista (2022, 2021), Suomen Kulttuurirahaston Varsinais-Suomen aluerahaston apurahasta (2021) sekä Uskelan Opintorahastosäätiön apurahasta (2020). Lisäksi olen saanut Turun Yliopistosäätiön Villa Tammekann -apurahoja tutkimusvierailuihin Tarttoon, Viroon (2023, 2024, 2025).
Vuonna 2024 minulle myönnettiin Otto A. Malmin liikkuvuusapuraha sekä Kordelinin säätiön päätoiminen työskentelyapuraha. Tammikuussa ja joulukuussa 2024 työskentelin Suomen Rooman-instituutissa, jakson aikana vierailin penitentiariaattiarkistossa ja kirjastoissa. Vuodelle 2025 minulle myönnettiin Villa Lanten ystävät - Villa Lantes vänner ry. apuraha.
Tutkimusvierailut
Syksyllä 2024 vierailin Harvardin yliopiston historian laitoksella keskustelemassa digimenetelmien ajankohtaisesta tutkimuksesta sekä esittelemässä omaa työtäni parserien kehittämisen parissa. Talvella 2024 esittelin tutkimustani Rooman Amerikan akatemiassa osana Circolo Gianicolense -seminaaria. Keväällä 2025 sain kutsun esittelemään työtäni Zürichin yliopistossa järjestettävään Junge Zürcher Mediävistik -seminaariin.
Opetuskokemus
Tarton yliopisto, Viro
- Pidin luennon "From Manuscripts and Edited Publications to XML" kandidaatti- ja maisteritason opiskelijoille osana Paberilt arvutisse -luentokurssia
- Käytännön työpaja: Automatic morpho-syntactic annotation of large language corpora using the Universal Dependencies framework (kevät 2024). Viiden tapaamisen työpaja opiskelijoille ja henkilökunnalle, jossa käsiteltiin teoriaa, terminologiaa, jäsennystyökaluja ja käytännön puupankkien luomista
- Luento Digital Resources -kurssilla klassillisessa filologiassa: Treebanks and automatic linguistic annotation for Classical Languages (kevät 2024)
Turun yliopisto, Suomi
- Digital Interaction -luentosarja (kevät 2024): Yksi luento: Tietokoneavusteiset menetelmät kieliopin jäsentämiseen
- Korpuslingvistiikka ja kieliteknologia (syksy 2023, viisi luento ja 2024, kuusi luentoa): Aiheina opiskelijaprojektit, eettiset kysymykset ja suurten kielimallien käyttö, automaattinen nimientunnistus, sentimenttianalyysi, automaattinen morfosyntaktinen jäsennys, kielen esittäminen vektoreina sekä ohjattu ja ohjaamaton koneoppiminen
- Linguistic Landscapes -kurssilla yksi luento (kevät 2023). Historiallisten kirjallisten lähteiden näkökulmia kielimaisemiin Turussa, yhdessä professori Marko Lambergin kanssa
- Building the Penitentiary Document Corpus (PeDoCo) for NLP: Balancing Data Complexity and Uniform Data Structure (2025)
- Digital Humanities in the Nordic and Baltic Countries Publications
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - Ad fontes - digitaalisten resurssien ääreltä Vatikaanin arkiston alkuperäislähteiden pariin (2024)
- Fenestra Finnorum - Näköaloja Villa Lantesta
(E1 Yleistajuinen artikkeli lehdessä) - Avointa tiedettä Vatikaanin arkistoissa osa 1: Pohdintoja keskiaikaisten kirkollisten anomusten avoimuudesta (2024)
- Avointiede.fi
(D1 Artikkeli ammattilehdessä) - Avointa tiedettä Vatikaanin arkistoissa osa 2: Muinaiset aineistot – nykyajan tekijänoikeudet (2024)
- Avointiede.fi
(E1 Yleistajuinen artikkeli lehdessä) - Avoin tiede ja tutkimusinfra (2024)
- Hiiskuttua: Turun yliopiston humanistisen tiedekunnan verkkolehti
(D1 Artikkeli ammattilehdessä) - Improving Latin Dependency Parsing by Combining Treebanks and Predictions (2024) Proceedings of the 4th International Conference on Natural Language Processing for Digital Humanities Kupari, Hanna-Mari Kristiina; Henriksson, Erik; Laippala, Veronika; Kanerva, Jenna
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - Pääkirjoitus: Hiiskutun teemakokonaisuudet käynnistyvät kielen oppimisen teemalla (2024)
- Hiiskuttua: Turun yliopiston humanistisen tiedekunnan verkkolehti
(D1 Artikkeli ammattilehdessä) - Pääkirjoitus: Kielen opettamisen ajankohtaiset ilmiöt (2024)
- Hiiskuttua: Turun yliopiston humanistisen tiedekunnan verkkolehti
(D1 Artikkeli ammattilehdessä) - FinGPT: Large Generative Models for a Small Language (2023) Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing Luukkonen Risto, Komulainen Ville, Luoma Jouni, Eskelinen Anni, Kanerva Jenna, Kupari Hanna-Mari, Ginter Filip, Laippala Veronika, Muennighoff Niklas, Piktus Aleksandra, Wang Thomas, Tazi Nouamane, Scao Le Teven, Wolf Thomas, Suominen Osma, Sairanen Samuli, Merioksa Mikko, Heinonen Jyrki, Vahtola Aija, Antao Samuel, Pyysalo Sampo
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - Hiiskuttua-lehden uudet päätoimittajat esittäytyvät (2023)
- Hiiskuttua: Turun yliopiston humanistisen tiedekunnan verkkolehti
(D1 Artikkeli ammattilehdessä) - Keskiajan myytit erilaisten linssien läpi tarkasteltuna – populaarikulttuuri kohtaa penitentiariaattiasiakirjat (2023)
- Kulttuurihistorian seura : blogi
(E1 Yleistajuinen artikkeli lehdessä) - Kohti suomenkielisiä keskustelumalleja: tule kehittämään tekoälyä (2023)
- Hiiskuttua: Turun yliopiston humanistisen tiedekunnan verkkolehti
(D1 Artikkeli ammattilehdessä) - Our everyday surroundings in Turku brought to life with narratives from the Middle Ages (2023)
- Elävää tiedettä
(E1 Yleistajuinen artikkeli lehdessä) - Towards diverse and contextually anchored paraphrase modeling: A dataset and baselines for Finnish (2023)
- Natural Language Engineering
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä ) - Salolaiset myöhäiskeskiaikaiset anomukset Vatikaanin arkistossa (2022)
- Hakastarolainen
(E1 Yleistajuinen artikkeli lehdessä) - Textual Paraphrase Dataset for Deep Language Modelling (2022) European Language Grid: A Language Technology Platform for Multilingual Europe Kanerva Jenna, Ginter Filip, Chang Li-Hsin, Skantsi Valtteri, Kilpeläinen Jemina, Kupari Hanna-Mari, Piirto Aurora, Saarni Jenna, Sevón Maija, Tarkka Otto
(A3 Vertaisarvioitu kirjan tai muun kokoomateoksen osa) - Väkivaltakuolemien sanoittaminen Turun hiippakunnan asiakirjoissa 1450–1517 (2022)
- Kalmistopiiri
(D1 Artikkeli ammattilehdessä) - Vertaisarvioidun artikkelin kirjoittamisen ensimmäiset askeleet seurana Belcherin opas (2022)
- Kielingua
(D1 Artikkeli ammattilehdessä) - Finnish Paraphrase Corpus (2021)
- Linköping Electronic Conference Proceedings
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa) - Väkivallan ja kuoleman ilmaukset keskiaikaisessa penitentiariaattiaineistossa (2020)
- Kalmistopiiri
(D1 Artikkeli ammattilehdessä)