Analýza odpovědí respondentů v otevřených otázkách

Analýza odpovědí respondentů

V roce 2018 společnost SC&C provedla online průzkum k 100. výročí vzniku Československa. Jedna z otázek byla otevřená a zněla: „Co byste popřáli státu k narozeninám?“. Otevřené otázky obvykle přinášejí různé a rozsáhlé odpovědi, což ztěžuje jejich zpracování. Klasický přístup by zahrnoval ruční čtení všech odpovědí a následné roztřídění do několika kategorií. Dnes už ale existují nástroje pro automatickou analýzu textu, které tento proces výrazně usnadňují.

Extrakce klíčových slov

Automatická analýza textu umožňuje extrakci klíčových slov z odpovědí respondentů. Tato klíčová slova charakterizují obsah odpovědí a na jejich základě lze respondenty rozdělit do skupin (klastrů) podle podobnosti jejich odpovědí. V tomto případě byla analyzována otázka „Co byste popřáli státu k narozeninám?“, což nám poskytlo zajímavý pohled na názory lidí.

Prvních sto nejčastějších dvouslovných výrazů bylo zobrazeno pomocí bublinového grafu (obrázek 1). Čím větší je bublina, tím častěji se dané slovo v odpovědích objevuje. Mezi časté výrazy patřily „dobrá politika“, „poctivá vláda“, „lepší prezident“ a další.

Identifikace entit

Součástí analýzy textu je také identifikace entit, například jmen osob nebo názvů politických stran. Tyto entity byly zobrazeny pomocí word cloudu (obrázek 2), kde velikost textu odpovídá četnosti jejich výskytu. Z analýzy vyplynulo, že respondenti často zmiňovali jména známých politiků jako Zeman, Babiš nebo Masaryk, a také názvy politických stran.

Rozdělení do klastrů

Další částí analýzy bylo rozdělení respondentů do čtyř klastrů podle podobnosti jejich odpovědí. Následně jsme zkoumali, jaká slova dominují v jednotlivých klastrech (viz obrázky 3, 45). V prvním klastru převažovaly odpovědi s přáním lepšího prezidenta, ve druhém lepších politiků a ve třetím lepší vlády.

Závěrem této textové analýzy můžeme říci, že nám umožnila úspěšně rozdělit odpovědi respondentů do klastrů a zjistit, jaké výrazy v nich převládají. Tento postup lze dále rozšířit o analýzu klastrů ve vztahu k demografickým proměnným, jako je věk, pohlaví, vzdělání nebo region.

Automatická analýza textu se tak ukázala jako velmi účinný nástroj pro zpracování otevřených otázek a nabízí mnoho možností pro detailní analýzu odpovědí respondentů.


Pomůžeme vám s analýzou i vašich dat. Kontaktujte našeho odborníka pro analýzu textu a domluvte si nezávaznou konzultaci. Rádi vám zodpovíme všechny vaše dotazy a najdeme vhodné řešení.

Text analytics - konzultace
společnost ACREA
ACREA CR je českou analytickou společností s tradicí od roku 1998. Poskytuje analytické, statistické a dataminingové služby, školení a software z řady IBM SPSS a Predictive Solutions. Název firmy je zkratkou pro Analytical CREAtivity, která vyjadřuje, že každý analytický projekt je pro nás unikátní a ke každému přistupujeme individuálně.
Komentáře

Přidat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Vaše osobní údaje budou použity pouze pro účely zpracování tohoto komentáře. Zásady zpracování osobních údajů