Kuidas mõistab tehisaru ruumiandmeid?
Tehisaru jaoks tuleb andmed teha masinloetavaks. Tehisaru ei näe pilti samamoodi nagu inimsilm, mis on võimeline pildilt objekte ära tundma nende värvi, kuju või konteksti järgi. Mudeli jaoks on pilt kindlas järjestuses pikslite kogumik. Igal pikslil on oma väärtus, nt värvikood. Mudel õpib ära, et teatud piksliväärtused koos moodustavad objekti, näiteks liiklusmärgi. Pildi asemel võib mudel olla treenitud lugema ka videot. Kas oled mõelnud, kuidas su auto teab, mis kiiruspiirang teel kehtib? Kui navigatsioonirakendused (nt Waze) teavad asukoha koordinaatide järgi, mis on iga teelõigu kiiruspiirang, siis paljudel uuematel automudelitel on sisse ehitatud liiklusmärgi tuvastamise juhiabisüsteem (TSR), mis põhineb masinõppel. Sellisel juhul salvestab kaamera eesolevat trajektoori, masinõppemudel analüüsib sõidu ajal tee ääres olevaid märke ja informeerib juhti piirangutest ja ohtudest. Selline süsteem on tundlikum, sest toimib reaalajas ja on suuteline sõidu ajal “lugema” ka näiteks ajutisi kiiruspiirangu märke, mida kaardil ei ole. Sarnase tehnoloogia abil õpetatakse välja ka isesõitvaid autosid ja pakiroboteid.
Lisaks pildile või videole loeb mudel ruumiandmeid ka vektor- või tabelkujul süsteemselt. Mudel õpib treenimise käigus ära reeglid, mis kehtivad otsitavate objektide puhul, näiteks et veekogudel on metaandmetes alati atribuut nimega “kalda tüüp”. Kui otsitakse näiteks rabalaukaid, siis on kaldatüübi atribuut mudeli jaoks üks paljudest märguannetest, et tegemist võib olla otsitava objektiga. Lisaks vaatab mudel nt maapinna reljeefi ja objekti pikslite värvust ortofotol ning teeb lõpuks otsuse objekt tuvastada või vahele jätta. Mitme teguri koosmõjul võib mudel tuvastada ka reeglipärase paigutusega objektide kogumikke, näiteks akende rivi hoone fassaadil.
Kuidas mudel õpib?
Mudeli otsused on tihedalt seotud sellega, millistel andmetel see on treenitud, st milliseid andmeid mudel lugeda oskab. Näiteks üksnes satelliidifotodel treenitud mudel ei oska samu objekte ortofotodelt tuvastada, sest piltide eraldusvõime (pikslite suurus) on niivõrd erinev. Kui kasside või inimeste tuvastamine piltidelt on maailmas lahendatud, siis näiteks aerofotost kaardi tegemisele ei ole seni veel universaalset valmislahendust, sest eri riikide või isegi piirkondade maastikud on erinevad, samuti ruumiandmed, millelt objekte tuvastatakse. Paralleelselt võib eksisteerida sadu hooneid tuvastavaid masinõppemudeleid, sest mudel, mis peab hooneteks Manhattani pilvelõhkujaid, ei oska midagi arvata talukompleksist Saaremaal.
Selleks, et tehisaru oskaks andmetelt, näiteks piltidelt, tuvastada soovitud objekte, tuleb mudelit treenida. Masinõppe rakendamise iroonia on selles, et automatiseeritud töövoogude välja töötamine nõuab tavaliselt tohutut ressurssi mudeli välja õpetamise etapis. Vaja on toota suur hulk andmeid nii treenimiseks, testimiseks kui valideerimiseks ning mudelit vastavalt tulemustele analüüsida ja häälestada kuni saavutatakse soovitud kvaliteet. Sellepärast on mõistlik masinõppe kasutusvajadus enne treenima asumist hoolikalt läbi mõelda. Kõige paremini sobib masinõpe nendele töölõikudele, mis on töötluse poolest andmemahukad, samas rutiinsed ja selge skoobiga. Mudelite analüüsi ja häälestamisega tegelevad tavaliselt masinõppeinsenerid ja andmeteadlased.
Milleks seda vaja on?
MaRu uuendab kaarte lausaliselt ¼ Eesti kohta aastas, sest just nii suurel territooriumil jõuab MaRu ühe hooaja jooksul kaardistuslende teha. See uuendustsükkel peaks tagama värsked andmed igas Eesti paigas. Reaalsuses on kaardi uuendamine nii aja- ja töömahukas protsess, et olemasolevad kaardistajad ei jõua veerandit Eesti territooriumist igal aastal täielikult uuendada. Vaja oleks kas rohkem kaardistajaid või optimaalsemaid tööprotsesse. Masinõpe võimaldab kaardistajate tööd lihtsustada, söötes neile ette muudatusi uuritaval territooriumil. Nii saavad kaardistajad muudatuste otsimise asemel tegeleda kaardi uuendamisega ja nende töö kiireneb märkimisväärselt. See aga eeldab, et mudelid on piisavalt hästi treenitud, st usaldusväärsed.
Oluline on mõista ka seda, et tehisaru ei tooda ise kaarti. Ükski mudel ei tee muudatusi kaardistaja eest ära ega avalikusta ise andmeid. Inimkontroll on ja jääb oluliseks komponendiks kaardistamise töövoos, sest ükski mudel ei ole 100% täpne. Kaardistaja vaatab üle mudeli esitatud andmed ja teeb iga objekti kohta otsuse, kas tegemist on õigete andmetega või nö valepositiivsete tulemustega, mis on vaja välja praakida.
Mida oleme MaRus juba teinud?
MaRus on toimiv päikeseparkide tuvastamise mudel. Kohe, kui valmivad uued ülelennu pildid, saab need ette sööta süvaõppel põhinevale mudelile, mis on treenitud päikeseparke ortofotodelt tuvastama. Mudeli jooksutamise tulemuseks on uus kaardikiht kõikide objektidega, mida mudel peab päikeseparkideks. Tulemusi võrreldakse seejärel varasemate juba kontrollitud tulemustega ja nii on võimalik näha, mis on vahepeal muutunud, ilma, et kaardistajad peaksid selleks kogu Eesti territooriumi visuaalselt läbi töötama.
Ometi, on tavaline, et mudeli treenimise käigus tuleb ette takistusi. Näiteks oli päikesepaneelide mudeli treenimisel ootamatu see, et mudelit tuli õpetada eristama päikeseparke kasvuhoonetest. Inimese jaoks imelihtne, kuid mudeli jaoks olid need üllatavalt sarnased objektid.
Tulevikuplaanid
MaRu on saanud rahastust Riigikantselei innovatsioonifondist süvaõppe võimaluste katsetamiseks kaarditootmise protsessis. Süvaõpe on üks masinõppe vorme, milles kasutatakse tehisnärvivõrke. Süvaõppe puhul ei anna masinõppeinsener mudelile ette reegleid, mille abil objekte tuvastada, vaid mudel loob suure andmemahu analüüsi käigus reeglid ja seosed ise. Sellise lahendusega on inimesel võimalik mudelit mõjutada treeningandmete ja mudeli arhitektuuri parameetrite valikuga, kuid tehisnärvivõrk õpib ise.
Projekt algab käesoleval aastal ning selle fookuses on vooluveekogude, teede ja hoonete automaatne tuvastamine MaRu andmetelt (nt ortofotod, LIDARi punktipilv, kaldpildid, registrid). Lisaks uuritakse projekti käigus, kas ja milliste meetmetega on võimalik täiendavalt määrata hoonete korruste arvu ja ligipääsu asukohta.
Autor: Ann Rehemaa, Maa- ja Ruumiameti Ruumiandmete büroo peaspetsialist
Loomise kuupäev: 10.07.2025