G5 Artikkeliväitöskirja
On modeling multivariate abundance data with generalized linear latent variable models (2020)
Niku, J. (2020). On modeling multivariate abundance data with generalized linear latent variable models [Doctoral dissertation]. Jyväskylän yliopisto. JYU Dissertations, 192. http://urn.fi/URN:ISBN:978-951-39-8062-7
JYU-tekijät tai -toimittajat
Julkaisun tiedot
Julkaisun kaikki tekijät tai toimittajat: Niku, Jenni
eISBN: 978-951-39-8062-7
Lehti tai sarja: JYU Dissertations
eISSN: 2489-9003
Julkaisuvuosi: 2020
Sarjan numero: 192
Kustantaja: Jyväskylän yliopisto
Kustannuspaikka: Jyväskylä
Julkaisumaa: Suomi
Julkaisun kieli: englanti
Pysyvä verkko-osoite: http://urn.fi/URN:ISBN:978-951-39-8062-7
Julkaisun avoin saatavuus: Avoimesti saatavilla
Julkaisukanavan avoin saatavuus: Kokonaan avoin julkaisukanava
Tiivistelmä
Moniulotteinen runsausdata koostuu tyypillisesti useilta paikoilta tehdyistä eläintai kasvilajien havainnoista. Tällaiset aineistot ovat yleisiä ekologiassa, kun tutkitaan eläin-, kasvi- tai eliöyhteisöjä, niiden vuorovaikutusta keskenään tai vuorovaikutusta suhteessa ympäristöön. Perinteisesti moniulotteista runsausdataa analysoidaan käyttäen algoritmeihin perustuvia menetelmiä, kuten pääkoordinaattianalyysia, korrespondenssianalyysia ja ei-metristä moniulotteista skaalausta. Menetelmien tavoitteena on tiivistää aineiston pääpiirteet muutamaan muuttujaan, jotka on helppo esittää visuaalisesti johtopäätösten tekemiseksi. Algoritmisten menetelmien heikkoutena on se, että tulosten luotettavuutta on vaikea arvioida. Tilastollisten ja laskennallisesti tehokkaiden menetelmien kehityttyä, malliperusteiset menetelmät ovat kasvattaneet suosiotaan moniulotteisien runsausdatojen analysoinnissa. Malliperusteiset menetelmät mahdollistavat aineiston rakenteiden, kuten lajien välisten korrelaatioiden sekä ympäristömuuttujien ja lajipiirteiden vaikutusten, tarkan mallintamisen. Aineistolle tyypilliset ominaisuudet voidaan ottaa huomioon esimerkiksi tilastollisten jakaumien avulla. Lisäksi mallipohjaiset menetelmät tarjoavat työkaluja tilastolliseen päättelyyn ja mallinvalintaan. Näiden ominaisuuksien seurauksena malliperusteiset menetelmät antavat luotettavampia tuloksia kuin algoritmeihin perustuvat menetelmät. Tässä väitöskirjassa tutkitaan yleistettyjen lineaaristen latenttimuuttujamallien käyttöä moniulotteisen runsausdatan analysoinnissa. Yleistettyjen lineaaristen latenttimuuttujamallien sovittaminen on laskennallisesti erittäin raskasta, kun runsausdatojen lajimäärät ovat kovin suuria. Siksi tässä työssä kehitetään laskennallisesti tehokkaita algoritmeja mallin parametrien estimoimiseksi. Laskennallinen tehokkuus saavutetaan hyödyntämällä suljetun muodon approksimaatioita marginaaliselle uskottavuusfunktiolle sekä käyttämällä automaattisia differentiointityökaluja algoritmien implementoinnissa. Laskennallista tehokkuutta ja tarkkuutta tutkitaan simulointikokeiden avulla. Menetelmien soveltuvuutta ordinaatiomenetelmänä, lajien välisten korrelaatioiden mittaamisessa, ympäristömuuttujien, lajipiirteiden ja niiden välisten interaktioiden vaikutusten tutkimisessa ja testaamisessa havainnollistetaan useiden esimerkkien avulla. Mallin sovittamiseen kehitetyt algoritmit sekä työkaluja mallien diagnostiikkaan, testaukseen ja visualisointiin on koottu R pakettiin gllvm.
YSO-asiasanat: tilastolliset mallit; monimuuttujamenetelmät; lineaariset mallit; approksimointi; ekologia; eliöyhteisöt; biodiversiteetti
Vapaat asiasanat: Community analysis; ecological data; fourth-corner models; generalized linear models; joint modeling; Laplace approximation; latent variables; multivariate analysis; ordination; species interactions; variational approximation
Liittyvät organisaatiot
OKM-raportointi: Kyllä
Raportointivuosi: 2020