Väljakutse 1
Suurandmed: analüüs ja nüüd ülekandminelinnade õhusaaste
Väljakutse pealkiri ja üldised faktid
Suur idee: Teadlikkus õhusaasteainete kohta linnades
elanikkonna jaoks
Väljakutse tüüp: (4 nädalat)
Väljakutse omanik: kohalik turismiinfokeskus
Moderaator: Faktorija: Evaldas Vaiciukynas
Juhendaja kontaktandmed: Evaldas.Vaiciukynas@ktu.lt
Väljakutse on seotud teemaga Big Data
Kontekst ja asjakohasus: üldiselt seoses säästva arengu eesmärgiga / konkreetselt kutsealase rakendusvaldkonnaga.
Maailma Terviseorganisatsioon on teinud tööd selle nimel, et tagada, et kodumajapidamiste ja keskkonna saastatuse ja haiguste koormuse tervisealased näitajad oleksid lisatud säästva arengu eesmärkide näitajate ametlikku süsteemi.
Välisõhu ja kodumajapidamiste õhusaastega seotud SDG eesmärgid on järgmised:
SDG 3 - õhusaaste põhjustatud surmajuhtumite ja haigestumiste oluline vähendamine;
SDG 11 - vähendada linnade keskkonnamõju õhukvaliteedi parandamise kaudu.
Aruanne SDG 11 kohta sisaldab andmeid iga-aastase õhusaaste kohta linnades. Sellest hoolimata oleks linnakodanikele kasulikud üksikasjalikumad andmed (näiteks päevastatistika), et jälgida kohalikku olukorda ning kavandada tegevusi või reiside tegemist.
Väljakutse variandid
Maailma õhukvaliteedi indeksi projekt avaldab uue spetsiaalse andmekogumi "Worldwide COVID-19 dataset", mida ajakohastatakse 3 korda päevas ja mis hõlmab umbes 380 suuremat linna maailmas alates jaanuarist 2022 kuni praeguseni. Andmed sisaldavad igapäevast statistikat peamiste õhusaasteainete liikide (so2, pm25, pm10, co, o3) ning meteoroloogiliste tegurite (temperatuur, niiskus, rõhk, tuule kiirus, kaste) kohta.
Variant 1: ohtlike saastemustrite leidmine. Analüütiline armatuurlaud, mis võtab visuaalselt kokku õhusaaste ajaloolised suundumused valitud linnas. Lahendus peaks aitama vastata, millistel kuudel aastas ja millistel nädalapäevadel on kõige suuremad saasteainete tasemed.
Variant 2: saaste prognoosimine nädalaks ette. Analüütiline armatuurlaud, mis võimaldab saada õhusaaste prognoosi valitud linnas. Lahendus peaks võimaldama mitmemõõtmelise ajasarja mudeli (neurovõrk, ARIMAX, prohvet) treenimist varasemate andmete põhjal. Kuna saastetasemed sõltuvad ka meteoroloogilistest teguritest, on oluline nende tegurite prognooside kaasamine.
Äripartner tööstuses või teadusvaldkonnas
Kohalikud turismiinfokeskused, reisibürood, erinevad keskkonnaorganisatsioonid.
Õppijate eeldused
Funktsionaalsed nõuded
Tarkvara: Andmeanalüüsi tarkvara
Riistvara: EI KOHALDATA
Tööruum: Teaduslaborid
Mõju
Aruanne SDG11 kohta sisaldab andmeid iga-aastase õhusaaste kohta linnades. Sellest hoolimata oleks linnakodanikele kasulikud üksikasjalikumad andmed (näiteks päevastatistika), et jälgida kohalikku olukorda ning kavandada tegevusi või reiside tegemist.
Avatud probleemid ja küsimused
Andmete allalaadimine võib võtta mitu minutit, seega peaks lahendus arvestama kompromissi kõige värskemate andmete ja nende liiga sagedase allalaadimise vahel. Selle probleemi lahendamiseks võiks kaaluda mõningast vahemälu, viimase allalaadimise ajatemplit ja taustal toimuvat asünkroonset allalaadimist. Samasugused probleemid seoses aeglase tööajaga võivad tekkida ka ajasarjade prognoosimise meetodite kasutamisel ülesande 2. variandis.
Teine küsimus on väljakutse lahenduse ulatus - kas seda tuleks teha ainult konkreetse riigi/linna kohta või kõigi andmetes olevate riikide/linnade kohta? Kas lahenduses tuleks kasutada ainult õhukvaliteedi koondindeksit või ka selle komponente?