Pohled lidí a pohled statistiky

Nezřídka se můžeme setkat s přesvědčením, že aplikovaný sociologický výzkum, a to jak v akademické, tak i v komerční sféře, je primárně datově založen na výpovědích svých respondentů, na jejich postojích a názorech zjišťovaných prostřednictvím dotazníkových šetření, hloubkových rozhovorů či diskusních skupin, které jsou v odborném slangu kategorizována jako „měkká data“.

Autor/Autoři
  • Martin Volek Project Director
Get in touch

Publikováno v Marketing & komunikace, prosinec 2022 

„Měkká“ a  „tvrdá data“

„Měkká data“ jsou v tomto slangu stavěna do protikladu k „tvrdým datům“. Zatímco měkká data by měla představovat subjektivní výpověď o světu, jejíž validita a reliabilita (pravdivost a platnost), jsou spíše diskutabilní a měla by tak být brána „s rezervou“, tvrdá data by měla zrcadlit svět „takový jaký je“, s vysokou mírou pravdivosti a spolehlivosti. Jako „měkká data“ bývají prezentovány výsledky dotazníkových šetření, jako „tvrdá data“ pak různé statistické údaje.

„Tvrdá data“ bývají „měkčí“ než se zdá

Vymezení dichotomie „měkkých“ a „tvrdých“ dat je však ne zcela přesné. Jedná se spíše o teoretický koncept než o nástroj pro přesnou kategorizaci dat; v praxi není hranice mezi těmito kategoriemi příliš zřetelná a většina používaných ukazatelů se pohybuje na pomyslné ose mezi nimi. Námitky je možné vznést zejména proti kategorii „tvrdých dat“, neboť i u nich, podobně jako u dat „měkkých“, zpravidla záleží na způsobu zjišťování a na způsobu konstrukce daného ukazatele.

„Měkká data“ z dotazníkových šetření

Příkladem mohou být různé způsoby zjišťování tržeb v maloobchodě. Zjišťováním produkujícím ryze „měkká“ data může být výběrové dotazníkové šetření mezi spotřebiteli. Toto šetření je založeno na subjektivních vzpomínkách respondentů, u kterých můžeme předpokládat velkou míru nepřesnosti. Navíc toto šetření bude provedeno na omezeném vzorku respondentů, který bude limitovaný svou velikostí, dostupností různých sociodemografických skupin k dotazování a ochotou se šetření účastnit. Krokem k posílení „tvrdosti“ takto sbíraných „měkkých dat“ by mohly být deníčky, do kterých respondenti zaznamenávají všechny své útraty v maloobchodě. V praxi je však nemožné zajistit, aby účastníci šetření zaznamenávali opravdu všechny své výdaje. I za podpory moderních technologií bude vždy docházet k tomu, že respondenti z různých důvodů opomenou zaznamenat do deníčku některé výdaje. Zároveň je třeba mít na paměti, že zaznamenávat své útraty bude vždy ochotná jen část spotřebitelů a některé sociodemografické skupiny tak nebudou ve vzorku zastoupeny vůbec.

Zdánlivě „tvrdá data“ z reportingu firem

Jinou metodou měření objemu tržeb maloobchodu by mohly být informace poskytované přímo obchody, neboť pokud by se podařilo získat údaje od všech obchodů, mohla by tato data být považována za „tvrdá“, tedy shodná s realitou. Toto řešení však naráží na míru ochoty aktérů tyto citlivé obchodní informace poskytovat. Chybějící data tak bude nutné doplnit metodou kvalifikovaného odhadu. I samotná data poskytovaná firmami mohou být zatížena chybou, ke které může dojít v interních systémech firmy či v průběhu zadávání údajů do reportovacího systému. Tento reporting také nepokrývá tzv. „šedou ekonomiku“, kterou by do dat o objemu maloobchodu bylo správné rovněž zahrnout. 

Propojování různých zdrojů dat

Pro získání komplexního pohledu tak bývá vhodné různé zdroje dat propojovat a navzájem je doplňovat. Výpovědi respondentů mohou být vhodnou oporou pro odhad těch tržeb z maloobchodu, které nejsou prodejci reportovány. A naopak, informace od prodejců mohou být vhodným nástrojem pro správné pochopení zkreslení, které je v datech poskytovaných spotřebiteli obsaženo.
Příkladem efektivního propojení různých typů zdrojů dat do komplexního obrazu může být dlouhodobá studie Ipsos Customer Sentiment Tracker monitorující spotřební náladu v České republice. Studie porovnává a propojuje data získaná dotazníkovým šetřením s daty převzatými ze statistik Českého statistického úřadu (ČSÚ) a České národní banky (ČNB), tedy „měkká“ a (zdánlivě) „tvrdá data“. 

Vnímaná a „skutečná“ změna cenové hladiny

V průběhu analýzy dat bylo porovnáváno vnímání změny cen jednotlivých kategorií ze strany respondentů s údaji o meziroční změně spotřebitelských cen publikovaných ČSÚ. Kvadrant vpravo nahoře na obrázku 1 zobrazuje kritické kategorie, kde jsou ceny vnímány jako výrazně vyšší, a zároveň výrazně vyšší „skutečně“ jsou. Jedná se zejména o kategorii Bydlení, voda, energie, paliva, dále Potraviny a nápoje a také Stravování a ubytování
Zároveň jsou identifikovány ty kategorie, kde je mezi vnímaným a „reálným“ navýšením cen rozdíl, který umožňuje aktérům působícím v těchto sektorech přizpůsobit svou komunikaci vůči spotřebitelům. Sektor vlevo dole, kde vnímaná i „skutečná“ inflace jsou nízké, pak nabízí příležitost pro úpravu cenové politiky, nebo ujištění zákazníků a „stále nízkýchcenách.

 

Porovnání vnímání změn spotřebitelských cen s údaji ČSÚ

Na horizontální ose je vyneseno subjektivní vnímání navýšení cen spotřebiteli, kde na pravé straně jsou kategorie výrobků a služeb, jejichž ceny se podle spotřebitelů navýšily výrazněji; na levé straně pak ty, které se podle spotřebitelů navýšily méně výrazně. Na vertikální ose jsou pak vyneseny údaje o meziroční změně spotřebitelských cen podle údajů ČSÚ, kde nahoře jsou kategorie s vyšším navýšením a dole kategorie s navýšením nižším. Na základě celkových hodnot jsou pak vytvořeny čtyři kvadranty podle míry navýšení, jak je vnímané spotřebiteli a jak je reportováno ČSÚ.

 

Zdánlivě „tvrdá“ data

Data o meziroční změně spotřebitelských cen publikovaných ČSÚ jsou příkladem „tvrdých dat“, jejichž hodnota je silně ovlivněna způsobem, kterým jsou konstruována. Tato data jsou založena na sledování změn cen v rámci definovaného spotřebního koše, tedy na sledování změn cen desítek vybraných položek, kde každá položka symbolizuje určitou kategorii výrobků nebo služeb. Záleží tak na tom, jaké konkrétní položky jsou do kalkulace vybrány, neboť i v rámci určité kategorie mohou mít různé produkty různou dynamiku. Příkladem může být položka „dámská halenka [1 kus]“, která v prosinci 2001 měla hodnotu 941 Kč, v prosinci 2011 měla hodnou 665 Kč a v prosinci 2021 hodnotu 775 Kč. Jiným případem mohou být ceny energií, které jsou počítány z aktuálních ceníků prodejců energií zveřejněných na internetových stránkách a nezohledňují tak, za jaké ceny mají domácnosti dodávky energií aktuálně nasmlouvány a za jaké ceny tedy domácnosti energie kupují. I přes nedokonalou „tvrdost“ těchto dat jsou však informace poskytované ČSÚ díky své robustní metodice a poctivému přístupu důvěryhodné – jen je třeba mít na paměti, že realitu indikují, avšak nezrcadlí.

Porovnání a kombinace dat o spotřebitelském vnímání cen s indikátory tohoto nárůstu není jen připomenutí si toho, jak subjektivní jsou „měkká data“ a jak se mohou lišit od „tvrdých“, či lépe „tvrdších“, dat. Umožňuje rovněž nalezení nových poznatků, například identifikace kategorií zboží a služeb, ve kterých jsou respondenti na navyšování cen citlivější a kde jsou naopak citliví méně.

Subjektivní vnímání potvrzené „tvrdými daty“

Jiným případem propojení dat, o které studie Customer Sentiment Tracker usiluje, jsou informace o vnímání vlastní finanční situace respondentů, které jsou získávány výše zmíněným dotazníkovým šetřením, s údaji o dynamice reálných platů a mezd, změnách výše nominálních a reálných vkladů domácností v bankách a dynamice maloobchodních tržeb, které jsou čerpány od ČSÚ a ČNB.

Toto propojení dat poskytuje novou dimenzi významu subjektivního pohledu respondentů. Ti současnou finanční situaci své domácnosti v druhém a třetím čtvrtletní 2022 hodnotili vesměs negativně. Toto negativní vnímání by bylo možné interpretovat jako projev obecného českého negativismu, kdyby však data od ČSÚ a ČNB neukazovala výrazný pokles reálných platů a mezd, reálných vkladů v bankách a reálných tržeb v maloobchodu. Tedy, že spotřebitelé si toho za svou výplatu koupí méně než před rokem a i přesto, že čerpají ze svých úspory, jejich životní standard v průběhu roku 2022 klesá.

O výzkumu:
Ipsos Consumer Sentiment Tracker je kontinuální výzkum zaměřený na spotřební náladu obyvatel České republiky. Sběr dat je realizován na kvartální bázi, první vlna byla realizována v posledním týdnu června 2022, druhá v posledním týdnu září 2022. Výsledky výzkumu jsou reprezentativní na on-line populaci České republiky ve věku 18 až 65 let. První vlny se účastnilo 500 respondentů, druhé 1 000 respondentů.

Více o studii Consumer Sentiment Tracker se dozvíte zde.

Autor/Autoři
  • Martin Volek Project Director

Společnost