Mitä Sipilä oikeastaan sanoi tv-puheessaan?

19.10.2015 - Lukuaika 4 minuuttia
- Mediat ja teknologia Suomalainen yhteiskunta
Kimmo Elo - Dosentti - Turun yliopisto, Politiikan tutkimuksen laitos - Åbo Akademi, Saksan laitos

Sipilän puheen analysointi digitaalisin menetelmin näyttää esimerkiksi, että talouden sanasto ei dominoinutkaan sitä ja kansallisuutta korostavat termit jakautuvat tasaisesti koko puheen ajalle. Digimenetelmät tuovat oivan lisän retoriikankin tutkimukseen.

Pääministeri Juha Sipilä lähestyi kansalaisia 16. syyskuuta YLE:n välittämässä tv-puheessa. Tiedossa oli, että puhe tulisi keskittymään Suomen huonoon taloustilanteeseen ja Euroopan pakolaiskriisiin.

Puhetta on jälkikäteen arvioitu ja ruodittu myös tutkijoiden toimesta. Analyysien keskiössä on ollut puheen retorinen puoli. Mutta millaisena Sipilän puhe näyttäytyy, kun analysoimme sitä digitaalisen tutkimuksen menetelmin?

Elo_kuvio-1
Kuva 1: Sipilän puheen termien käytön jakauma (vasen kuvio) ja keskeisten termien muodostama sanapilvi (oikea kuvio).

Sipilän puhe kesti 15 minuuttia. Siinä ajassa hän sanoi miltei 1300 sanaa. Sipilä käytti 570 yksittäistä sanaa, joista 466 voidaan luokitella semanttisesti merkityksellisiksi. Keskimäärin yhtä sanaa käytetään 1,6 kertaa, mutta käyttö ei jakaudu tasaisesti (Kuva 1).

Kymmenen eniten käytettyä termiä olivat: TEHDÄ (21 kertaa), HALLITUS (15), SUOMI (15), VOIDA (13), SUOMALAINEN (11), TYÖ (10), PÄÄTÖS (9), OSA (7), YRITYS (7) ja IHMINEN (6). Yhteensä nämä esiintyvät tekstissä yhteensä 114 kertaa. Ne muodostivat vajaat kymmenen prosenttia puheen sisällöstä ja noin neljänneksen semanttisesti relevantista terminologiasta.

Puhetta ei dominoi talouden sanasto.

Kiinnostavaa on, että Sipilä puhetta ei näyttäisikään dominoivan talouden sanasto. Toki mukana ovat termit ”työ” ja ”yritys”, mutta esimerkiksi ”talous” mainitaan puheessa vain viisi kertaa ja julkisen talouskeskustelun perustermit ”kilpailukyky” ja ”hyvinvointi” kummatkin kolme kertaa. Talous-termin johdannaisista puheessa esiintyvät vain ”taloustilanne” ja ”talouskasvu”.

Elo_kuvio-2

Kuva 2: Kymmenen yleisimmän termin jakautuminen puheen aikana.

Tutkimukset ovat osoittaneet, että tekstissä usein toistuvat termit ovat vahvasti sidoksissa tekstin teemoihin. Analysoimalla käsitteiden sijoittumista tekstin sisällä voidaan havainnoida ja analysoida tekstiin sisältyviä temaattisia polkuja.

Kun tarkastellaan Sipilän puhetta kymmenen käytetyimmän termin kautta, huomataan puheen rytmittyvän alateemojen ympärille. Ensimmäiseen, (institutionaalista) päätöksentekoa korostavaan ryhmään kuuluvat käsitteet HALLITUS, PÄÄTÖS ja TEHDÄ.

Toisen, puheen sosiaalista viitekehystä määrittävään ryhmään lukeutuvat SUOMI, SUOMALAINEN ja IHMINEN. Termien SUOMI ja SUOMALAISET tasainen käyttö pitkin puhetta kiinnittää puheen vahvasti kansalliseen kontekstiin.

Viimeiseen, taloutta korostavaan ryhmään sijoittuvat käsitteet TYÖ ja YRITYS.

Yhdistävänä teemana on tekeminen.

Yhdistävänä teemana on tekeminen. Käsite ”TEHDÄ” ei ainoastaan ole yleisin tekstissä käytetty käsite, vaan se myös jakaantuu tasaisesti lähes koko puheen ajalle. Punaisena lankana näyttäisi siis olevan ”tarttuminen toimeen”, mikä linkittää puheen Sipilän muissa yhteyksissä lanseeraamaan ”Tekemättä ei voi jättää”-ajatukseen.

Elo_kuvio-3

Kuva 3: Termiryhmien läheisyys pääministeri Sipilän puheessa.

Edellä kuvattujen semanttisten ryhmien asettaminen puheen aikajanalle näyttää, että puheen ensimmäisten kolmen minuutin jaksoa dominoi sosiaaliseen viiteryhmään liittyvä puhunta.

Seuraava noin kymmenen minuutin jakso alkaa vahvasti institutionaalista päätöksentekoa korostavalla puhunnalla, joka laajenee keskijaksossa institutionaalista ja taloudellista teemaa limittäväksi puhunnaksi, palatakseen jakson lopussa lopussa jälleen institutionaaliseen näkökulmaan.

Puheen lopussa institutionaalinen ja taloudellinen puhunta painuvat taka-alalle, sosiaaliseen viiteryhmään liittyvän puhunnan painottuessa uudestaan.

Elo_kuvio-4

Kuva 4: Pääministeri Sipilän puhe verkostona.

Tekstien sisäisen rakenteen hahmottamisessa ja analysoinnissa auttaa sen tarkastelu verkostona. Pääministeri Sipilän puheen visualisointi kollokaatioverkostona eli verkostona, joka visualisoi eri sanojen yhteisesiintymiä, vahvistaa käsitystä, että teksti rakentuu muutamien keskeisten teemojen ympärille, joita yhdistäviin avaintermeihin kuuluvat esimerkiksi SUOMI, HALLITUS, TEHDÄ, YRITYS ja PÄÄTÖS.

Näin lyhyessä puheessa valtaosa sanojen yhteisesiintymisistä näyttäytyy vain kerran. Kollokaatioista SUOMALAINEN ja TYÖ, SUOMI ja NOUSTA sekä HALLITUS ja RYHTYÄ toistuvat tekstissä vähintään kahdesti.

Puheen eri teemat voidaan identifioida graafista ydinverkoston ulkopuolelle sijoittuvina aliverkostoina, jotka rakentuvat keskuskäsitteiden ympärille. Samaan aliverkostoon kuuluvat käsitteet esiintyvät vain rajallisesti (jos lainkaan) muun verkoston yhteydessä.

Aliverkostot kytkeytyvät ydinkäsitteistöön pääsääntöisesti yhden käsitteen välityksellä. Esimerkiksi termin UUDISTAMINEN ympärille rakentuva aliverkosto kytkeytyy ydinverkostoon HYVINVOINTI-käsitteen kautta. Yhdessä aliverkon muiden käsitteiden, kuten RAHAKIRSTU, POHJATON ja TARVE, kanssa tarkasteltuna kyse näyttäisi olevan puhunnasta, joka pyrkii osoittamaan, että hyvinvointivaltiota tulee uudistaa kiristyvän julkisen talouden olosuhteissa.

Digitaalisin tutkimusmenetelmin tehty analyysi pääministeri Sipilän puheesta osoittaa sen retoriikan rakentuvan tekemisen ja päätöksenteon ympärille – siis ”tekemättä ei voi olla” -ajatuksen, jota Sipilä on muissakin yhteyksissä tuonut esille.

Tulokset ovat pääpiirteissään samankaltaisia kuin puheen sisällöstä julkisuudessa esitetyt muut analyysit. Ne kuitenkin osoittavat, että tietokoneavusteisilla menetelmillä voidaan varsin luotettavasti eritellä tekstiaineistojen sisältöjä ja esittää tietoa uusilla tavoilla.

Tietokoneavusteiset tutkimusmenetelmät tulisikin nähdä oivallisena lisänä tutkimustyön ”työkalupakkiin” myös tietojenkäsittelytieteiden ulkopuolella: digimenetelmin voidaan tehdä löytöretkiä suuriin aineistoihin ja mahdollisesti löytää seikkoja, jotka toimivat lähtökohtina uusille kysymyksille.

 
 

Kimmo Elo

Dosentti - Turun yliopisto, Politiikan tutkimuksen laitos - Åbo Akademi, Saksan laitos
 

Kommentit (2 kpl)

 • Youmedia.se - 21.10.2015 | 20:23 -

  Kun tällainen kontekstuaalinen ja muukin tekstuaalinen analyysi kiinnostaa, niin kysynpä että millä softalla/alustalla tämä analyysi on toteutettu ja onko open sourcea.

  Missä voin tutustua toimialan käytetyimpiin tekstidatan analyysiohjelmiin?

   

  Samaa mieltä?

  2
  0
 • Uutistamo-tiimi - 22.10.2015 | 12:28 -

  Tässä Kimmo Elon vastaus tiedusteluun
  —-

  Analyysi on toteutettu seuraavilla softilla:

  1) Tekstin valmistelu analyysiä varten (mm. sanojen palauttaminen perusmuotoon jne.): TreeTagger (http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/). Lisäksi käytettiin jonkin verra bash-skriptejä sekä Python-ohjelmointikieltä tekstitiedoston muokkaamiseksi analyysiohjelmien lukemaan muotoon.

  2) Data-analyysi on tehty R-tilasto-ohjelmistolla (www.r-project.org), johon on tarjolla varsin tehokkaat sisällönanalyysikirjastot.

  3) Verkostoanalyysi on tehty Cytoscape-ohjelmistolla (www.cytoscape.org)

  Olen itse linux-käyttäjä, mutta kaikki em. ohjelmistot toimivat myös winkkarissa. Ne ovat myös open sourcea

  Tutustumisen digitaalisten ihmistieteiden tarjoamiin ja käyttämiin tekstidatan anaysointivälineisiin voi aloittaa vaikka seuraavasta osoitteesta:

  http://dirtdirectory.org/

  josta löytyy laajasti tietoa digitaalisista tutkimusvälineistä.

  Ystävällisesti,
  Kimmo Elo

   

  Samaa mieltä?

  3
  0

Uutistamo

Kirjaudu tai luo tunnus Uutistamoon
Twitter- tai Facebook-tunnuksillasi

Facebook Twitter

Uutistamo ei lähetä viestejä Facebookiin tai Twitteriin puolestasi.