Návod
Zber a príprava dát pre analytika
Zber správnych dát je prvý a najdôležitejší krok pri akejkoľvek analýze. Pre presné predikcie je nevyhnutné mať k dispozícii kvalitné historické dáta. Čím viac dát máte, tým presnejšie môžu byť modely. Ak však chcete napríklad uviesť na trh nový produkt, často chýbajú historické dáta, preto je potrebné vykonať prieskum trhu, aby sme získali informácie o preferenciách zákazníkov, konkurencii a ďalších relevantných faktoroch. V mnohých prípadoch je najlepší prístup kombináciou oboch spomínaných možností. Môžeme využiť existujúce dáta na vytvorenie základného modelu a následne doplniť nové dáta, aby sme model vylepšili. Ak nemáte dostatok vlastných dát, môžete zvážiť nákup externých dát od špecializovaných spoločností. Tieto dáta môžu poskytnúť ďalšie pohľady na trh a zákazníkov. Výber správnej stratégie závisí od niekoľkých nižšie uvedených faktorov:
Ciele analýzy: Na aké otázky chcete analýzou odpovedať? Aké rozhodnutia chcete na základe analýzy urobiť? Čím konkrétnejší cieľ, tým lepšie viete, aké dáta potrebujete.
Dostupné zdroje: Aké dáta máte k dispozícii?
Časový rámec: Ako rýchlo potrebujete výsledky?
Náklady: Koľko ste ochotní investovať do zberu a analýzy dát?
***
Identifikácia relevantných dát
Prejdite si všetky dostupné zdroje, databázy, tabuľky, súbory. Aké dáta vám chýbajú? Spíšte si zoznam dát, ktoré nemáte a predpokladáte, že bude potrebné ich získať.
***
Zber a triedenie firemných dát
Interné zdroje: Databázy: CRM systémy, ERP systémy, databázy o zákazníkoch, historické údaje o predaji, atď. Súbory: Excelovské tabuľky, CSV súbory, PDF dokumenty. Webová analytika: Google Analytics, Facebook Insights.
Externé zdroje: Verejné databázy: Štatistický úrad, databázy firiem, atď. API: Rozhrania pre získavanie dát z externých systémov (napr. sociálne siete). Web scraping: Automatické získavanie dát z webových stránok (vyžaduje extra služby ako napríklad zite.com)
Zber nových dát: V prípade, že chýbajú relevantné historické dáta alebo chcete získať odpovede na úplne nové otázky, je potrebné vykonať zber nových dát. To môže zahŕňať rôzne metódy, od prieskumov a dotazníkov až po sledovanie správania zákazníkov.
***
Úprava dát
Vo všeobecnosti platí, že základné úpravy dát robí klient a zložitejšiu transformáciu analytik. Klient by sa mal uistiť, že dáta sú uložené v zrozumiteľnom formáte (napr. Excel, CSV) a majú logickú štruktúru. Mal by identifikovať a odstrániť zrejmé chyby v dátach, ako sú preklepy alebo nesprávne formátované hodnoty, prípadne zviditeľniť chýbajúce údaje. Taktiež by mal vytvoriť kľúč, čiže zoznam všetkých použitých kódov, skratiek a definícií, aby analytik porozumel významu jednotlivých stĺpcov. Analytik by následne mal skontrolovať kvalitu dát pomocou štatistických metód, odstrániť duplicity, vybrať vhodnú metódu na doplnenie chýbajúcich údajov. Následne musí vedieť vytvoriť nové premenné, zhrnúť dáta, normalizovať ich a pripraviť ich pre ďalšiu analýzu.
***
Odovzdanie dát analytikovi
Zvoľte vhodný formát pre odovzdanie dát (napr. Excel, CSV). Dokumentácia: Priložte podrobný popis dát, použitých transformácií ako aj význam jednotlivých stĺpcov.