Skip to main content

Tegemist on mugandatud ja täiendatud versiooniga analüüsist, mis ilmus raamatus „Riigikogu valimised 2019“ (toim. Martin Mölder). Selle töö koostamise varjus võttis kuju mõte taolistest analüüsidest, mida projekti “Arengud ja vastuolud Eesti poliitilisel maastikul 2011-2023 läbi tekstiliste suurandmete analüüsi” raames on kavandatud.

Mis on need üldised teemad, mis torkavad silma, kui analüüsida erakondade valimisprogramme 2019. aasta riigikogu valimistel? Mis teemad on omased mõnele kindlale erakonnale ning kuidas erinevad erakonnad üksteisest? Järgnev analüüs annab põgusa vastuse nendele küsimustele läbi statistilise tekstianalüüsi, mille tulemusena kerkivad erakondade valimisprogrammidest esile järgnevad teemad:

  1. Kohalik, regionaalne
  2. Tervishoid ja sotsiaalne kaitse
  3. Julgeolek
  4. Eesti globaalses maailmas
  5. Lapsed ja pere
  6. Riigivalitsemine
  7. Loodus ja loodusvarad
  8. Koolid ja haridus
  9. Ettevõtlus

Praktiliselt kõik nendest teemadest on olemas iga erakonna programmis (mõne tähelepanuväärse erandiga), kuid on märgata olulisi erinevusi nende osakaalus. Need teemad kujutavad endast mõningaid meie poliitilise ruumi pidepunkte. Kuid mis nähtus see „poliitiline ruum“ üldse on, kuidas me peaks sellele lähenema ja kuidas sellest mõtlema? Alustame sellest.

Poliitilise ruumi mõiste ja selle tähtsus politoloogias

Poliitiline ruum kui metafoor koorub meie enda vahetust kogemusest füüsilises ruumis. Me tajume oma keha ümbritsevast maailmast eraldatuna ning eristame selgelt suundi enda ümber – ees ja taga, üleval ja all, vasakul ja paremal. Taolised esmased tajumehhanismid on nii tugevad ja olemuslikud, et nad mõjutavad ja struktureerivad ka seda, kuidas me paljudest teistest asjadest mõtleme. Ruumist saab kontseptuaalne metafoor (Lakoff ja Johnson 1980), mis mõjutab aja (tulevik on ees ja minevik meie selja taga), väärtuse (head asjad on üleval pool ja halvad pigem allpool) aga ka poliitika mõtestamist. Niimoodi on terminitest „vasak“ ja „parem“, mis viitavad meie keha ühele ja teisele poolele, saanud poliitilised käibefraasid, mis aitavad anda sisu muidu väga kaugetele ja keerulistele nähtusele nagu näiteks majanduspoliitika.

„Vasak“ ja „parem“ sisenesid poliitilisse kõnepruuki Prantsuse revolutsiooni ajal, kui nendega tähistati esinduskogus ühel või teisel pool istuvaid saadikuid (Gauchet 1996). Neid kasutati poliitiliste gruppide eristamiseks analoogselt sellistele terminitele nagu vabariiklased või demokraadid, liberaalid või konservatiivid. Politoloogias ning tänapäeva poliitilises kõnepruugis tekkis nendele konkreetsem ruumiline tähendus aga alles 20. sajandi keskel. Politoloogia klassik, Anthony Downs (1957), tõi poliitikateadusesse terminid „vasak“ ja „parem“ kui ideoloogilise ruumi ainsa või peamise mõõtme kaks otspunkti. Vasak ja parem ei ole selles tähenduses enam eraldi seisvad kategooriad, vaid suunad poliitilise ruumi joonel, millel erakonnad saavad paikneda nagu punktid ja mille vahel on võimalik arvutada kaugust.

Taolist poliitilist ruumi pole võimalik otseselt vaadelda, kuid ta peegeldub poliitikute sõnades ja tegudes. Selle kohta võivad anda tunnistust erakondade hääletusmustrid, aga ka poliitikute kõned ja kommentaarid. Kui tahta kõikide erakondade puhul samaväärselt riikide ja aja lõikes hinnata, millises punktis poliitilises ruumis erakonnad paiknevad ja kui suur on nendevaheline kaugus selles ruumis, siis üheks peamiseks ja olulisemaks informatsiooniallikaks oleks erakondade valimisprogrammid.

Valimisprogrammide olemus ja nende analüüs

Iga erakonna poliitilistest eelistustest või suundadest kõige parema aga kindlasti mitte tervikliku või täiusliku ülevaate annab just erakonna valimisprogramm. See on tavaliselt iga erakonna kõige esmasem poliitiline dokument teatud konkreetseid valimisi silmas pidades ning proovib hõlmata erakonna kogu poliitilist profiili. Loomulikult on igas programmis alati rohkem sisu ja ettepanekuid, kui võiks realistlikult isegi selle partei ainuvalitsuse ajal poliitikateks saada, rääkimata siis veel koalitsioonivalitsustest, mis paratamatult sunnivad erakondi kompromisse tegema. Kuid poliitilise suuna näitavad nad kätte ilmselt küll.

Üks võimalus neid programme analüüsida on nad korduvalt ja tähelepanelikult läbi lugeda ning proovida seejärel hinnata, kuidas nad omavahel suhestuvad ja milliste teemade poolest eristuvad. See oleks aga väga pikk ja keeruline protsess, mis kõigele lisaks oleks ka olemuslikult vaidlustatav, kuna programmide hindamine ja eristamine on niimoodi paratamatult midagi, mis toimub vähemalt teatud määral varjatult analüütiku peas. Kaasaegsed statistilise tekstianalüüsi meetodid võimaldavad meil aga samuti tekste analüüsida ning teha seda objektiivselt ja läbipaistvalt.

Teemade modelleerimine (topic modeling) on üks kvantitatiivse tekstianalüüsi meetod, mis proovib statistiliselt rekonstrueerida tekstiloomeprotsessi ning on seeläbi võimeline ka ainult sõnade esinemise sagedusele tuginedes andma intuitiivseid ja tähenduslikke tulemusi, mis korjavad suurtest tekstihulkadest välja paljale silmale nähtamatuks jäävad regulaarsused. Oma algses vormis Blei jt. 2003) on tegemist meetodiga, mis eeldab, et ühes tekstikogumis olevad dokumendid koosnevad teatud arvust teemadest. Teemat on siinkohal mõistetud kui kõrge tõenäosusega koos esinevaid sõnu. On eeldatud, et iga analüüsitud dokument on segu erinevatest teemadest ning iga teema segu erinevatest sõnadest.

Piltlikult võib seda mudelit iseloomustada järgnevalt. Analüüsi teostav algoritm valib iga dokumendi puhul iga teema jaoks teatud proportsiooni ning vastavalt sellele igast teemast selle dokumendi jaoks sõnad lähtuvalt nende esinemistõenäosusest teemades. Sedaviisi liigub mudel „edasi-tagasi“ tekstide ja teemadesse kuuluvate sõnade tõenäosuste ja dokumentide teemadejaotuse vahel, uuendades viimaseid nii kaua, kuni jõutakse piisavalt lähedale sellele sõnade kogumikule, millest üks või teine dokument reaalselt koosnes.

Sõnad, mis esinevad kõrge tõenäosusega ühes teemas aga mitte ühesegi teises, on teemat kõige paremini defineerivad sõnad ning on taolise analüüsi tulemuste tõlgendamise keskmes. Enamasti on sellistel sõnakogumikel intuitiivselt tajutav ühine tähendusmõõde. Teemade modelleerimise üks olulisem eesmärk ongi selliste sõnakogumike tuvastamine suurest tekstihulgast ning allpool esitatud analüüs teostab just seda.

Käesolev analüüs tugineb algse teemade modelleerimise mudeli edasiarendusel, mille nimi on strukturaalne teemade modelleerimine (Roberts jt. 2014), mille peamine täiendus seisneb selles, et ta võimaldab analüüsida teemade omavahelisi seoseid ning mis veel olulisem, kuidas üks või teine teema, selle osakaal dokumendis või muutumine ajas, sõltub dokumendi omadustest, nt. selle autorist. Antud kontekstis võimaldab selline mudel testida, kas ja millisel määral on valimisprogrammidest kooruvad teemad seotud ühe või teise erakonnaga ning seega tuvastada mitte ainult millised peamised teemad valimisprogrammides sisalduvad, vaid ka seda, mis on ühe või teise valimisprogrammi ning selle autoriks oleva erakonna „toon“.

Valimisprogrammid 2019. aasta valimistel

Kõik valimisprogrammid on analüüsile eelnevalt salvestatud tekstiformaadis ning nendest on eemaldatud programmilise sisu mõttes ebaolulised osad nagu näiteks sisukorrad või lisad, mis otseselt ei tutvusta erakonna poliitilisi seisukohti nendeks valimisteks. Iga erakonna programm koosneb alaosadest, mis puudutavad väga erinevaid teemasid. Alljärgneva analüüsi läbi viimiseks on igat programmi alaosa käsitletud eraldi dokumendina (millest on eemaldatud viited erakonna enda nimele) ning niimoodi on analüüsitud kokku 303-e erinevat tekstilõiku.

Tekstide analüüsile eelnevaks töötlemiseks on kasutatud eesti keele töötlemiseks loodud tarkvara estnltk 1.4.1 (Orasmaa jt. 2016) ning üldiselt on järgitud tekstide eeltöötlemise ning teemade modelleerimise standardprotseduure (Banks jt. 2018). Tekstides sisalduvad sõnad on teemade modelleerimiseks viidud algvormidesse (lemmatiseeritud), mis tagab selle, et ühe sõna erinevad vormid saaksid analüüsis käsitletud sama sõnana. Estnltk poolt tuvastatud sõnatüüpidest on analüüsi kaasatud kõik peale sidesõnade ja lausemärkide. Kõik suured tähed on asendatud väikeste tähtetega. Kui keele analüüsi tarkvara tuvastas ühe sõna puhul mitu võimalikku algvormi, siis on neist siin analüüsis kasutatud ainult esimest. Kõik arvud ja kirjavahemärgid ning vähem kui kolmetähelised sõnad on samuti enne analüüsi eemaldatud. Niimoodi on kõikide valimisprogrammide alaosad taandatud üksnes nende sõnade algvormidele, mis kõige tõenäolisemalt tähenduslikku sisu kannavad.

Tabel 1. Analüüsiks eeltöödeldud programmide alaosade arv ja pikkus
Programmiosade arv Sõnade arv
Eesti 200 50 13037
EKRE 14 2936
Elurikkuse Erakond 20 2774
Isamaa 24 8906
Keskerakond 36 8498
Reformierakond 50 10770
Rohelised 44 10268
Sotsiaaldemokraadid 22 10461
Vabaerakond 43 10272

Programmide alaosadeks jaotamisel on kasutatud nii palju kui võimalik valimisprogrammide enda alajaotusi. Näeme, et valimisprogrammid erinevad üksteisest märgatavalt oma pikkuse ja liigendatuse poolest. Kõige lühemad programmid olid EKRE-l ja Elurikkuse Erakonnal, samas kui kõige pikem programm oli Eesti 200-l. Keskmine pikkus on natuke enam kui kaheksa ja pool tuhat sõna.

Teemade analüüsiks on kasutatud mudelit, millel paluti eristada üheksat teemat. Et vältida sõnu, mis on ühe või teise programmi jaoks väga spetsiifilised ja mis ei kordu paljude programmiosade lõikes, on analüüsist välja jäetud sõnad, mis esinesid vähem kui üheksas programmilõigus. Seega oli analüüsi kaasatud kokku 1079 erinevat sõna 303-st dokumendist. Teemade arv on ainus suurus, mis sellise mudeli puhul tuleb analüütikul eelnevalt määratleda ning siinkohal ei ole kindlaid statistilisi kriteeriume või reegleid, mis ütleksid, mitu teemat tuleb valida. Lõplik teemade arv peaks sõltuma erinevate mudelite katsetamisest ning määratletud teemade tõlgendatavusest (vaata Banks jt. 2018).

Käesoleva analüüsi puhul sai valitud 9 teema eristamine, kuna nii joonistusid välja teemad, millest praktiliselt kõiki oli võimalik sisuliselt tõlgendada. Väiksemate teemade arvu puhul sulandusid mõned neist kokku ning suurema teemade arvu puhul hakkas üha enam esinema teemasid, mida ei olnud võimalik sisuliselt tõlgendada. Mis olid need üheksa teemat, mis valimisprogrammidest vastu kumasid ning kuidas nad olid seotud erinevate erakondadega?

Joonis 1. Valimisprogrammide 9 teemat

Joonisel 1 välja toodud sõnapilved iseloomustavad mudeli poolt tuvastatud üheksat teemat. Mida suuremana on sõna kuvatud, seda iseäralikum sellele teemale ta oli. Pealkirjad, mis neile on antud, on esmapilgutõlgendus neid sõnu kokku siduvast ühisest joonest. Kui inimese asemel peaks valimisprogramme lugema arvuti ning kui temalt küsida, mis oli 2019. aasta Riigikogu valimiste 9 põhiteemat, siis oleksid need just sellised.

Lisaks teemade piiritlemisele testis mudel ka iga erakonna seost vastavate teemadega. Seda, millisele erakonnale üks või teine tekstilõik kuulus, kasutati teema proportsiooni ennustamiseks. Kui mõni teema on iseloomulik mõnele erakonnale, siis näitab mudel, et selle teema osakaal erakonna programmilõikudes on suurem. Kuna analüüsitud tekstilõike on statistilises mõttes siiski üpriski vähe, on taolised seosed erakondadega vägagi tinglikud ning neid tasub võtta teatud mõistliku skepsisega. Kuid üldisi tendentse ja suundi nad siiski näitavad. Iga teema seos erakondadega on välja toodud joonisel 2.

Joonis 2. Teemade jaotus erakonniti

Esimene teema („kohalik, regionaalne“) koondab endas sõnu, mille ühiseks nimetajaks on kohalik elu ja regionaalne poliitika. Sellele viitavad sõnad nagu „kohalik“, „regionaalne“, „maapiirkond“, „maaelu“ ja „omavalitsus“. See teema puudutab ka kohalikku arengut („rajama“/“rajamine“, „töökoht“), maaelu jätkusuutlikkust („kättesaadav“, „kaasajastamine“) ning ligipääsetavust („ühistransport“). Kõige enam on see teema esindatud Keskerakonna ja Sotsiaaldemokraatide programmis ning kõige vähem Reformierakonna programmis. See on ka ainus teema, kus vahe kahe kõige suurema erakonna vahel on märkimisväärne – ühele on kohalik areng ja poliitika vähemalt programmimahtu arvestades vägagi oluline, teisele aga peaaegu üldse mitte.

Teise teemana joonistus välja omavahel seotud sõnade kogum, mis viitab ennekõike sotsiaalpoliitikale („tervishoid ja sotsiaalne kaitse“). See koondab endas sõnu, mis viitavad riigi sotsiaalset kaitset loovale rollile väga erinevates aspektides – „patsient“, „tervishoid“, „pension“, „hooldekodu“, „sotsiaalmaks“, „erivajadus“, „solidaarne“ jne. Kõik need sõnad puudutavad teemasid, mille ühiseks nimetajaks on riigi abistav roll juhul, kui inimesed on haigestunud või jäänud vanaks ning vajavad täiendavat hoolt. Antud teema on lähtuvalt mudelist suurema osakaaluga traditsiooniliselt vasakpoolsete erakondade programmides nagu Keskerakond ja Sotsid. Kõige suurem osakaal on sellel aga hoopis EKRE valimisprogrammis ning märkimisväärse osakaaluga on see teema olemas ka Vabaerakonna programmis. Kõige väiksem osakaal selle teema puhul oli Eesti 200, Elurikkuse Erakonna ja Roheliste programmides.

Kolmanda teemana kerkis esile julgeoleku temaatika, mis sisaldas endas selliseid termineid nagu „riigikaitse“, „julgeolek“, „kaitsevägi“, „turvalisus“, „kaitsevõime“. Väga tugevalt on selles teemas ka sees julgeoleku rahvusvaheline mõõde („üro“, „nato“, „euroopa“, „liikmesriik“, „venemaa“). On näha, et osad terminid („politsei“) puudutavad ka siseriikliku julgeolekut ning selle teema alla lähevad ka üldised globaalset julgeolekut ohustavad nähtused („ränne“, „kliimamuutus“). Kõige rohkem on see temaatika esil EKRE valimisprogrammis (lisaks üldisele valimisprogrammile oli EKRE-l eraldi just julgeolekut puudutav programm). Antud teema oli tugevalt esil ka Reformierakonna programmis ning mõnevõrra vähem Isamaa, Keskerakonna ja Sotside programmis. Teiste erakondade puhul oli see teema märgatavalt vähem oluline.

Neljanda teemana eristas mudel sõnade gruppi, mis oli valdavalt populaarne üksnes Eesti 200 programmis ning palju vähem teiste erakondade programmides. Seetõttu võib seda teemat pidada ennekõike Eesti 200 jaoks spetsiifiliseks teemaks või kõnepruugiks, mida teiste erakondade programmides oli palju vähem. Eesti 200 valimisplatvorm oleks nagu väga teistmoodi kirjutatud. Seda teemat iseloomustevad sellised üldised sõnad nagu „globaalne“, „sajand“, „Eestimaa“, „maailm“, aga ka majandusele viitavad sõnad nagu „ettevõtluskeskkond“, „majandus“, tööjõud“. Seega sai see teema nimetatud „Eesti globaalses maailmas“.

Viienda teemana näeme sõnadegruppi, mis käsitleb lapsi, lastekasvatamist ja peresid („lapsed ja pere“). Seda teemat defineerivad sellised sõnad nagu „laps“, „pere“, „rahaline“, „perekond“, „huviring“, „kindlustunne“, „õpetaja“, „kodulähedane“, „lasteaed“, „riigipoolne“. On näha, et see puudutab laste kasvatamist, nende arengut ja vaba aja sisustamist aga ka riigipoolset tuge perekondadele nendes tegevustes. On märkimisväärne välja tuua, et see teema on samaväärselt tähelepanu all kõikide erakondade programmides peale ühe – Elurikkuse Erakonna programmist paistab see temaatika suhteliselt puudu olevat.

Kuuendaks eristas algoritm riigivalitsemise temaatikasse kuuluva ning sagedamini koos esineva sõnade grupi. Sellesse kuuluvad sellised terminid nagu „riigikogu“, „riigivalitsemine“, „riigiasutus“, „ministeerium“, „komisjon“, „bürokraatia“. Teema tonaalsus ei ole selge, tegemist on pelgalt avalikule sektorile ja selle tegevusele viitavate terminitega ning ei ole palju selliseid, mis annaksid sellele valdkonnale hinnangu või mis viitaksid väga selgelt ümberkorralduste vajadusele avalikus sektoris. Tegemist paistab olevat riigivalitsemise temaatikaga oma kõige tavapärasemas tähenduses. See temaatika on tugevalt seotud Vabaerakonna valimisprogrammiga ning kõige nõrgemalt Keskerakonna ja Sotsiaaldemokraatide programmidega.

Seitsmenda teemana kerkis esile loodust ja loodusvarasid puudutab sõnade kogum. Siin me näeme termineid, mis viitavad nii loodusvaradele („mets“, „loodusvara“, „puit“, „toit“, „maavara“, „vesi“, „põlevkivi“) kui ka nende kasutamisele („majandamine“, „säästev“, „kaevandamine“, „energiatootmine“) ja selle kasutamise tulemile („energia“, „elekter“). On näha, et tooni annavad keskkonnamõjude suhtes tundlikud terminid („keskkonnamõju“, „kliimamuutused“, „keskkonnasõbralik“, „säästev“). Ühesõnaga, tegemist on teemaga, mis puudutab loodusvarade säästlikku ja jätkusuutlikku kasutamist ning keskkonnakaitset. Sellel teemal paistab silma ennekõike Elurikkuse Erakonna valimisprogramm, kuid samas on see temaatika märgatavalt sees ka Roheliste ja Vabaerakonna programmides. Teised erakonnad pööravad sellele palju vähem tähelepanu ning kõige vähem pälvib see teema kajastust Isamaa valimisprogrammis.

Kaheksas teema puudutas koole ja haridust. See sisaldas selliseid termineid nagu „õppija“, „õppekava“, „kutseharidus“, „kõrgharidus“, „haridus“, „gümnaasium“, „põhikool“, „lasteaed“, kattes seega kõik peamised haridusastmed. On ka näha, et esile kerkisid terminid, mis puudutasid teatud nõrku kohti selles süsteemis ning õppe laadi – „eestikeelne“, „emakeel“, „erivajadus“, „elukestev“. Tegemist on seega teemaga, mis paistab puudutavat hariduse temaatikat erinevates tahkudes ja astmetes. Samuti on tegemist teemaga, mis on esindatud peaaegu samaväärselt kõikide erakondade programmides ning ei erista selgelt mõnda üksikut erakonda teistest.

Viimase, üheksanda teemana, tuli esile sõnade grupp, mis puudutas ettevõtlust (teemale iseloomulikud terminid olid näiteks „erasektor“, „kapital“, „konkurentsivõime“, „ettevõtja“, „investeering“, „majanduskasv“, „eksport“). Tegemist on väga erinevate terminitega selles ühes valdkonnas, puudutades nii ettevõtjate tegevust, selleks vajalikku infrastruktuuri, aga ka ettevõtluse väljundit. See teema kujutab endast mitmekülgset ning terviklikku käsitlust ettevõtlusest. Kui vaadata seoseid erakondadega, siis tuleb sisse selge vahe võimuerakondade (Keskerakond, Reformierakond, Isamaa, Sotsid) ja teiste vahel. Märkimisväärselt puudu on see temaatika EKRE, Elurikkuse Erakonna ja Vabaerakonna programmidest.

Valimisprogrammide üldised erinevused

Lisaks on siinkohal analüüsitud valimisprogramme lähtuvalt nende üldisest omavahelisest erinevusest. Viimase aja uuendused tekstianalüüsis ja arvutiteaduses on võimaldanud luua ulatuslikke tekstimudeleid (word2vec), kus iga keeles esinev sõna on kujutatud vektorina keerukas tähendusruumis lähtuvalt sellest, milliste teiste sõnadega seda koos kasutatakse (Mikolov jt. 2013). Taolised mudelid kujutavad vägagi intuitiivselt sõnade omavahelisi seoseid keeles ning seeläbi ka nende tähendusi. Kahe sõna kaugus sellises mudeli näitab kui erinevad nad on oma tähenduselt ning seeläbi on võimalik sõna-sõna kaupa hinnata kui erinevad on kaks teksti üksteisest (Kusner jt. 2015). Kui me hindaks valimisprogramme niimoodi tervikuna, siis kuidas nad erinesid üksteisest?

Järgnevalt on kuvatud niimoodi analüüsitud programmide vahelised erinevused kahe-mõõtmelises ruumis. See on küll lihtsustus, kuid niimoodi on võimalik paremini hinnata kauguste tervikpilti ja selle võimalikku sisu. Teatud osa informatsiooni läheb kaduma, kuid meil on võimalik paremini aru saada, kuidas erakonnad üksteise suhtes paiknevad.

Joonis 3. Programmide üldised erinevused

Taoline mudel ja selle lihtsustus ei ütle meile, mida see ruum tähendab ning selle sisu tuleb meil tõlgendada vaadates erakondade suhtelist paiknemist selles. Me näeme, et selles ruumis eristuvad ühes suunas EKRE ja teises suunas Elurikkuse Erakond. Kusjuures EKRE eristub selles samas suunas, kus paiknevad ka Sotsiaaldemokraadid ja Keskerakond ning Elurikkuse Erakond eristub samas suunas, kus eristusid Vabaerakond ja Rohelised. Eelnevast analüüsist nägime, et viimaseid kolme sidus kokku suhteliselt suurem tähelepanu looduse ja keskkonna temaatikale, mis annab seega alust arvata, et vertikaalne mõõde sellel joonisel kuvab just seda. EKRE-t, Sotsiaaldemokraate ja Keskerakond seob aga eelnevast analüüsist lähtuvalt mõnevõrra suurem tähelepanu sotsiaalsele kaitsele ja kohaliku tasandi problemaatikale. Seega võiks tinglikult öelda, et horisontaalse mõõtme näol on seega tegemist tinglikult sotsiaalse kaitse/kohaliku poliitika mõõtmega.

Kokkuvõte

Valimisprogramm on paljuski väga vastuoluline kirjandusžanr. Ühest küljest peaks see olema nagu esindusdemokraatia nurgakivi, mille põhjal kodanikkond saab teada, millises suunas erakonnad tahavad riiki juhtida ning mille põhjal nad saavad teha oma otsuse. Samas on tegemist dokumendiga, mida väga vähesed valijad tervikuna loevad. Ning isegi kui nad neid loeksid, ei oleks nad võimelised nendes sisalduvate lubaduste tegelikku olemust ja võimalikku mõju tulevikus hindama, kuna tegemist on sageli väga keerulisi ja ennustamatuid protsesse puudutavate seisukohtadega. Ei ole olemas ühtegi inimest, kes oleks võimeline hindama kõike, mis ühes valimisprogrammis sisaldub. Veelgi enam, temas sisaldub palju rohkem, kui eales oleks võimalik ellu viia – nii rahaliselt kui ka poliitiliselt. Tegemist on korraga nii hädavajaliku dokumendiga, kui ka dokumendiga, mida keegi ei loe ja pole võimeline mõistma ning mis on oma tervikus teostamatu.

Kui üldse midagi, siis on valimisprogramm ennekõike assortii lubadustest, mida üks või teine erakond on nõus kaaluma ja välja käima, kuid mis ilmtingimata ei pea realiseeruma. See, mille eest üks või teine erakond lõppkokkuvõttes seisab, tuleb ehk paremini ilmsiks tema poolt ellu viidud poliitikate tulemusena. Ning valimisprogrammide üksikute detailide asemel on valijate jaoks ehk olulisemad need lihtsustatud üldised suunad, mille poole nad näitavad.

Eelnevalt tehtud analüüs pakub ühe võimaliku ülevaate nendest tuultest, mis valimisprogrammides puhuvad ning sellest, kuidas üks või teine erakond nendes välja paistab. Küllap programmide sisu puudutavaid analüüse tuleb veel ja tuleb palju põhjalikemaid. Statistiline tekstianalüüs on üks esimesi võimalusi, mis võimaldab efektiivselt üldisi kokkuvõtteid teha. Mida me näeme? On teemasid, mis on kõikide erakondade jaoks samaväärselt olulised ja on teemasid, mis eristavad. Esimeste hulka kuuluvad koolide ja hariduse temaatika ning lapsed ja pere. Viimane neist kahest on märkimisväärselt alaesindatud ainult Elurikkuse Erakonna programmis. Eristavaid teemasid on aga palju enam.

Poliitiline konkurents Eestis on struktureeritud ennekõike ümber Keskerakonna ja Reformierakonna ning nende kahe kõige suurem erinevus tuleb välja kohaliku elu küsimustes. Keskerakonnale on need väga olulised, Reformierakonnale eriti mitte. EKRE oma valimisprogrammis paistab silma ennekõike kaitse küsimustes selle sõna kõige laiemas tähenduses. Nende programm rõhutas sotsiaalse kaitse temaatikat kõige enam ning samuti paistsid nad silma riikliku julgeoleku temaatikas. Ettevõtlus ja äri oli teema, mis oli oluline ennekõike võimuerakondadele, st. erakondadele, kes on suuremad ja olnud valitsuses. Keskkonna ja looduse temaatikal paistsid silma loomulikult Rohelised, aga ka Vabaerakond ja ennekõike Elurikkuse Erakond. Väga selgelt erines ka Eesti 200 valimisprogramm, mis oma sisult suuresti moodustas ühe eraldiseisva teema.

Kirjeldatud analüüsi läks sisendina sisse 9 erakonna 303 programmilõiku ja üks number – 9 teemat, mida paluti algoritmil eristada. Kõik eelpool kirjeldatu on selle vägagi põgusa sisendi tulemus. Nende tulemuste tähenduslikkus ja tõlgendatavus on tunnistuseks nende valiidsusele. Loodetavasti aitab taoline lihtsustus paremini mõista, mis nendel valimistel kogu poliitilise müra ja kampaania taustal tegelikult laual oli. Samuti võiks see olla heaks võrdlusmomendiks teistele sarnastele analüüsidele, mida Eesti poliitikamaastiku kohta on võimalik teha, aga ka nendest valimistest sündinud Riigikogu tulevasele tegevusele.

Kasutatud kirjandus

Banks, G.C., Woznyj, H.M. ja Wesslen, R.S. (2018). „A Review of Best Practice Recommendations for Text Analysis in R (and a User-Friendly App)“. Journal of Business and Psychology,  33(4), lk. 445-459.

Blei, D.M., Ng, A.Y. ja Jordan, M.I., (2003). „Latent dirichlet allocation“. Journal of machine Learning research, 3(1), lk. 993-1022.

Downs, A. (1957). An Economic Theory of Democracy. New York: Harper and Row Publishers.

Gauchet, M. (1996). „Left and Right“. Raamatus P. Nora (toim.), Realms of Memory. Rethinking the French Past. Volume 1: Conflicts and Divisions. Colombia University Press.

Kusner, M., Sun, Y., Kolkin, N. ja Weinberger, K., (2015). „From word embeddings to document distances“. International Conference on Machine Learning, lk. 957-966.

Lakoff, G., ja Johnson, M. (1980). Metaphors We Live By. Chicago: University of Chicago Press.

Mikolov, T., Sutskever, I., Chen, K., Corrado, G.S. ja Dean, J., (2013). „Distributed representations of words and phrases and their compositionality“. Advances in Neural Information Processing Systems, lk. 3111-3119.

Orasmaa, S., Petmanson, T., Tkachenko, A., Laur, S. ja Kaalep, H.-J. (2016). „EstNLTK – NLP Toolkit for Estonian“. Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016). European Language Resources Association (ELRA).

Roberts, M., Stewart, B., Tingley, D., Lucas, C., Leder-Luis, J., Gadarian, S. K. ja Rand, D. (2014). “Structural Topic Models for Open-Ended Survey Responses”. American Journal of Political Science, 58(4), lk. 1064–1082.

Foto: Riigikogu fotoarhiiv