A1 Alkuperäisartikkeli tieteellisessä aikakauslehdessä
Sima – an Open-source Simulation Framework for Realistic Large-scale Individual-level Data Generation (2021)
Tikka, S., Hakanen, J., Saarela, M., & Karvanen, J. (2021). Sima – an Open-source Simulation Framework for Realistic Large-scale Individual-level Data Generation. International Journal of Microsimulation, 14(3), 27-53. https://doi.org/10.34196/IJM.00240
JYU-tekijät tai -toimittajat
Julkaisun tiedot
Julkaisun kaikki tekijät tai toimittajat: Tikka, Santtu; Hakanen, Jussi; Saarela, Mirka; Karvanen, Juha
Lehti tai sarja: International Journal of Microsimulation
eISSN: 1747-5864
Julkaisuvuosi: 2021
Ilmestymispäivä: 31.12.2021
Volyymi: 14
Lehden numero: 3
Artikkelin sivunumerot: 27-53
Kustantaja: International Microsimulation Association
Julkaisumaa: Britannia
Julkaisun kieli: englanti
DOI: https://doi.org/10.34196/IJM.00240
Julkaisun avoin saatavuus: Avoimesti saatavilla
Julkaisukanavan avoin saatavuus: Kokonaan avoin julkaisukanava
Julkaisu on rinnakkaistallennettu (JYX): https://jyx.jyu.fi/handle/123456789/80356
Tiivistelmä
We propose a framework for realistic data generation and the simulation of complex systems and demonstrate its capabilities in a health domain example. The main use cases of the framework are predicting the development of variables of interest, evaluating the impact of interventions and policy decisions, and supporting statistical method development. We present the fundamentals of the framework by using rigorous mathematical definitions. The framework supports calibration to a real population as well as various manipulations and data collection processes. The freely available open-source implementation in R embraces efficient data structures, parallel computing, and fast random number generation, hence ensuring reproducibility and scalability. With the framework, it is possible to run daily-level simulations for populations of millions of individuals for decades of simulated time. An example using the occurrence of stroke, type 2 diabetes, and mortality illustrates the usage of the framework in the Finnish context. In the example, we demonstrate the data collection functionality by studying the impact of nonparticipation on the estimated risk models and interventions related to controlling excessive salt consumption.
YSO-asiasanat: tilastomenetelmät; matemaattiset mallit; tietojärjestelmät; tietorakenteet; tietojenkäsittely; terveysala; simulointi; ennusteet; lähdekoodit; avoin lähdekoodi
Liittyvät organisaatiot
Hankkeet, joissa julkaisu on tehty
- Yliopistojen profiloitumisen vahvistaminen kilpaillulla rahoituksella. Profilointitoimet JYU:ssä, 3. kierros
- Hämäläinen, Keijo
- Suomen Akatemia
OKM-raportointi: Kyllä
Raportointivuosi: 2022
JUFO-taso: 1
- Tilastotiede (Matematiikan ja tilastotieteen laitos MATHS) TIL
- Resurssiviisausyhteisö (Jyväskylän yliopisto JYU) JYU.Wisdom
- Koulutusteknologia ja kognitiotiede (Informaatioteknologian tiedekunta IT) LEACS
- Human and Machine based Intelligence in Learning (Informaatioteknologian tiedekunta IT) HUMBLE
- Laskennallinen tiede (Informaatioteknologian tiedekunta IT) LASK
- Multiobjective Optimization Group (Informaatioteknologian tiedekunta IT) MOG