A4 Article in conference proceedings
Suomen viittomakielten korpusta rakentamassa (2019)
Salonen, J., Puupponen, A., Takkinen, R., & Jantunen, T. (2019). Suomen viittomakielten korpusta rakentamassa. In J. H. Jantunen, S. Brunni, N. Kunnas, S. Palviainen, & K. Västi (Eds.), Proceedings of the Research data and humanities (RDHum) 2019 conference : data, methods and tools (pp. 83-98). Oulun yliopisto. Studia Humaniora Ouluensia, 17. http://urn.fi/urn:isbn:9789526223216
JYU authors or editors
Publication details
All authors or editors: Salonen, Juhana; Puupponen, Anna; Takkinen, Ritva; Jantunen, Tommi
Parent publication: Proceedings of the Research data and humanities (RDHum) 2019 conference : data, methods and tools
Parent publication editors: Jantunen, Jarmo Harri; Brunni, Sisko; Kunnas, Niina; Palviainen, Santeri; Västi, Katja
Conference:
- Research Data and Humanities Conference
Place and date of conference: Oulu, Suomi, 14.-16.2019
ISBN: 978-952-62-2320-9
eISBN: 978-952-62-2321-6
Journal or series: Studia Humaniora Ouluensia
ISSN: 1796-4725
eISSN: 1796-4725
Publication year: 2019
Number in series: 17
Pages range: 83-98
Number of pages in the book: 233
Publisher: Oulun yliopisto
Place of Publication: Oulu
Publication country: Finland
Publication language: Finnish
Persistent website address: http://urn.fi/urn:isbn:9789526223216
Publication open access: Openly available
Publication channel open access: Open Access channel
Publication is parallel published (JYX): https://jyx.jyu.fi/handle/123456789/67255
Abstract
Neljän vuoden mittainen Suomen viittomakielten korpusprojekti käynnistyi Jyväskylän yliopiston viittomakielen keskuksessa vuonna 2014. Projektin aikana kuvattiin keskusteluja ja elisitoituja kertomuksia 91 suomalaista viittomakieltä ja 12 suomenruotsalaista viittomakieltä äidinkielenään käyttävältä, eri puolilla Suomea asuvalta henkilöltä viittomakielisen kuuron projektitutkijan opastuksella. Videomateriaalia kerättiin yhteensä noin 560 tunnin edestä (seitsemästä kamerakulmasta nauhoitetut materiaalit yhteenlaskettuna).
Aineistonkeruun ja editoinnin jälkeen yhteensä 22 suomalaista viittomakieltä äidinkielenään käyttävän kielenoppaan videoaineistoihin on tehty perustason annotaatiot viittoma- ja virketasolla. Annotointivaihe eteni viittomien tunnistamisella, niiden merkitysten erottamisella ja viitotun tekstin ilmauskokonaisuuksien kääntämisellä suomen kielelle. Perusannotointi toteutettiin ELAN-ohjelmalla, jossa viittomia identifioidaan ajallisesti videoon yhteydessä olevien glossien avulla. Annotoinnissa käytettiin lisäksi Suomen Signbank -leksikkotietokantaa, johon ELAN-ohjelman glossit yhdistyvät verkkoyhteyden avulla. Laaja multimodaalinen aineistokokonaisuus täydennettiin metatiedoilla aineiston eri osa-alueista, kuten aineistokokonaisuuden yleisluonteesta, aineistonkeruussa läsnä olleista henkilöistä, videoiden sisällöistä ja video- ja annotaatiotiedostojen muodoista IMDI (ISLE Meta Data Initiative) -standardin mukaisesti. Annotoitu aineisto säilytetään ensisijaisesti Jyväskylän yliopistossa, minkä lisäksi se siirretään maaliskuun 2019 aikana FIN-CLARIN-konsortion Kielipankkiin pitkäaikaissäilytettäväksi sekä julkaistavaksi kielenoppaiden tutkimussuostumusten ja tietosuoja-asetusten mukaisesti. Kielipankissa julkaistava korpusaineisto sisältää noin 14 tunnin edestä kuudesta kamerakulmasta kuvattua videomateriaalia 21 kielenoppaalta sekä videoihin linkitetyt annotaatiotiedostot ja IMDI-kuvaukset.
Suomen viittomakielten korpuksen luonti kehittää molempien viittomakielten kielellisten ja kulttuuristen piirteiden tutkimusta sekä opetusta. Jyväskylänyliopiston viittomakielen keskuksessa korpusaineiston pohjalta on tehty tähän mennessä useita suomalaiseen viittomakieleen keskittyviä tutkimuksia, minkä lisäksi aineistoa on käytetty myös viittomakieliä vertailevassa tutkimuksessa. Kerätty videoaineisto on ainutlaatuinen kokoelma Suomen viittomakielillä tuotettua kerrontaa ja keskusteluja: materiaali sisältää eri-ikäisten ja eri alueilta tulevien henkilöiden viittomista erilaisissa viestintätilanteissa. Systemaattisen annotoinnin myötä aineisto tulee olemaan merkittävä resurssi tutkimuksen lisäksi viittomakielten opetuksessa, viittomakieliä koskevassa koulutuksessa sekä kielisuunnittelussa.
Keywords: sign language; Finnish Sign Language; Finland-Swedish Sign Language; research material; corpora; visual recordings; metadata; annotation; data protection
Contributing organizations
Ministry reporting: Yes
VIRTA submission year: 2019
JUFO rating: 1
Parent publication with JYU authors: