V roce 2018 společnost SC&C provedla online průzkum k 100. výročí vzniku Československa. Jedna z otázek byla otevřená a zněla: „Co byste popřáli státu k narozeninám?“. Otevřené otázky obvykle přinášejí různé a rozsáhlé odpovědi, což ztěžuje jejich zpracování. Klasický přístup by zahrnoval ruční čtení všech odpovědí a následné roztřídění do několika kategorií. Dnes už ale existují nástroje pro automatickou analýzu textu, které tento proces výrazně usnadňují.
Automatická analýza textu umožňuje extrakci klíčových slov z odpovědí respondentů. Tato klíčová slova charakterizují obsah odpovědí a na jejich základě lze respondenty rozdělit do skupin (klastrů) podle podobnosti jejich odpovědí. V tomto případě byla analyzována otázka „Co byste popřáli státu k narozeninám?“, což nám poskytlo zajímavý pohled na názory lidí.
Prvních sto nejčastějších dvouslovných výrazů bylo zobrazeno pomocí bublinového grafu (obrázek 1). Čím větší je bublina, tím častěji se dané slovo v odpovědích objevuje. Mezi časté výrazy patřily „dobrá politika“, „poctivá vláda“, „lepší prezident“ a další.
Součástí analýzy textu je také identifikace entit, například jmen osob nebo názvů politických stran. Tyto entity byly zobrazeny pomocí word cloudu (obrázek 2), kde velikost textu odpovídá četnosti jejich výskytu. Z analýzy vyplynulo, že respondenti často zmiňovali jména známých politiků jako Zeman, Babiš nebo Masaryk, a také názvy politických stran.
Další částí analýzy bylo rozdělení respondentů do čtyř klastrů podle podobnosti jejich odpovědí. Následně jsme zkoumali, jaká slova dominují v jednotlivých klastrech (viz obrázky 3, 4 a 5). V prvním klastru převažovaly odpovědi s přáním lepšího prezidenta, ve druhém lepších politiků a ve třetím lepší vlády.
Závěrem této textové analýzy můžeme říci, že nám umožnila úspěšně rozdělit odpovědi respondentů do klastrů a zjistit, jaké výrazy v nich převládají. Tento postup lze dále rozšířit o analýzu klastrů ve vztahu k demografickým proměnným, jako je věk, pohlaví, vzdělání nebo region.
Automatická analýza textu se tak ukázala jako velmi účinný nástroj pro zpracování otevřených otázek a nabízí mnoho možností pro detailní analýzu odpovědí respondentů.
Pomůžeme vám s analýzou i vašich dat. Kontaktujte našeho odborníka pro analýzu textu a domluvte si nezávaznou konzultaci. Rádi vám zodpovíme všechny vaše dotazy a najdeme vhodné řešení.