G5 Artikkeliväitöskirja
On modeling multivariate abundance data with generalized linear latent variable models (2020)


Niku, Jenni (2020). On modeling multivariate abundance data with generalized linear latent variable models. JYU Dissertations, 192. Jyväskylä: Jyväskylän yliopisto. http://urn.fi/URN:ISBN:978-951-39-8062-7


JYU-tekijät tai -toimittajat


Julkaisun tiedot

Julkaisun kaikki tekijät tai toimittajat: Niku, Jenni

eISBN: 978-951-39-8062-7

Lehti tai sarja: JYU Dissertations

eISSN: 2489-9003

Julkaisuvuosi: 2020

Sarjan numero: 192

Kustantaja: Jyväskylän yliopisto

Kustannuspaikka: Jyväskylä

Julkaisumaa: Suomi

Julkaisun kieli: englanti

Pysyvä verkko-osoite: http://urn.fi/URN:ISBN:978-951-39-8062-7

Avoin saatavuus: Open access -julkaisukanavassa ilmestynyt julkaisu


Tiivistelmä

Moniulotteinen runsausdata koostuu tyypillisesti useilta paikoilta tehdyistä eläintai kasvilajien havainnoista. Tällaiset aineistot ovat yleisiä ekologiassa, kun tutkitaan eläin-, kasvi- tai eliöyhteisöjä, niiden vuorovaikutusta keskenään tai vuorovaikutusta suhteessa ympäristöön. Perinteisesti moniulotteista runsausdataa analysoidaan käyttäen algoritmeihin perustuvia menetelmiä, kuten pääkoordinaattianalyysia, korrespondenssianalyysia ja ei-metristä moniulotteista skaalausta. Menetelmien tavoitteena on tiivistää aineiston pääpiirteet muutamaan muuttujaan, jotka on helppo esittää visuaalisesti johtopäätösten tekemiseksi. Algoritmisten menetelmien heikkoutena on se, että tulosten luotettavuutta on vaikea arvioida. Tilastollisten ja laskennallisesti tehokkaiden menetelmien kehityttyä, malliperusteiset menetelmät ovat kasvattaneet suosiotaan moniulotteisien runsausdatojen analysoinnissa. Malliperusteiset menetelmät mahdollistavat aineiston rakenteiden, kuten lajien välisten korrelaatioiden sekä ympäristömuuttujien ja lajipiirteiden vaikutusten, tarkan mallintamisen. Aineistolle tyypilliset ominaisuudet voidaan ottaa huomioon esimerkiksi tilastollisten jakaumien avulla. Lisäksi mallipohjaiset menetelmät tarjoavat työkaluja tilastolliseen päättelyyn ja mallinvalintaan. Näiden ominaisuuksien seurauksena malliperusteiset menetelmät antavat luotettavampia tuloksia kuin algoritmeihin perustuvat menetelmät. Tässä väitöskirjassa tutkitaan yleistettyjen lineaaristen latenttimuuttujamallien käyttöä moniulotteisen runsausdatan analysoinnissa. Yleistettyjen lineaaristen latenttimuuttujamallien sovittaminen on laskennallisesti erittäin raskasta, kun runsausdatojen lajimäärät ovat kovin suuria. Siksi tässä työssä kehitetään laskennallisesti tehokkaita algoritmeja mallin parametrien estimoimiseksi. Laskennallinen tehokkuus saavutetaan hyödyntämällä suljetun muodon approksimaatioita marginaaliselle uskottavuusfunktiolle sekä käyttämällä automaattisia differentiointityökaluja algoritmien implementoinnissa. Laskennallista tehokkuutta ja tarkkuutta tutkitaan simulointikokeiden avulla. Menetelmien soveltuvuutta ordinaatiomenetelmänä, lajien välisten korrelaatioiden mittaamisessa, ympäristömuuttujien, lajipiirteiden ja niiden välisten interaktioiden vaikutusten tutkimisessa ja testaamisessa havainnollistetaan useiden esimerkkien avulla. Mallin sovittamiseen kehitetyt algoritmit sekä työkaluja mallien diagnostiikkaan, testaukseen ja visualisointiin on koottu R pakettiin gllvm.


YSO-asiasanat: tilastolliset mallit; monimuuttujamenetelmät; lineaariset mallit; approksimointi; ekologia; eliöyhteisöt; biodiversiteetti

Vapaat asiasanat: Community analysis; ecological data; fourth-corner models; generalized linear models; joint modeling; Laplace approximation; latent variables; multivariate analysis; ordination; species interactions; variational approximation


Liittyvät organisaatiot


OKM-raportointi: Kyllä

Raportointivuosi: 2020


Viimeisin päivitys 2020-09-07 klo 23:12