ÚVOD / Studijní obory / Sylaby / Analýza dat a jejich vizualizace

Analýza dat a jejich vizualizace

Cílem předmětu je naučit studenty používat současné techniky a metody datových analýz a vizualizací dat; chápat význam a postavení tzv. Data Science v rozhodovacích procesech společností. Nedílnou součástí předmětu je i představení moderních technologií, architektur a řešení datových úložišť (zejména ve spojitosti s tzv. Big data) a vlastních typů dat v celé jejich rozmanitosti. Studenti se také naučí pracovat s v současnosti nejpoužívanějšími nástroji a produkty pro analýzy a vizualizace dat včetně jejich praktického použití na seminářích při řešení konkrétních use-cases.

Sylabus předmětu

1. Význam dat, jejich využití, interpretace a prezentace v operativních a rozhodovacích procesech společností a jejich použití pro operativní, taktické a strategické rozhodování; pojem Big data a evoluce příslušných technologií a metod řešení
2. Typy dat, nestrukturovaná data, datová kvalita, Governance a bezpečnost, změny ve způsobu zpracování velkých objemů dat oproti klasickým Business Intelligence metodám
3. Principy získávání znalostí z dat (Knowledge discovery), postavení tzv. Data Science v projektech a při řešení praktických otázek Businessu
4. Moderní architektury řešení datových úložišť, datové sklady, Data marts, data lakes, ODS platformy, Big data řešení a další
5. Technologie a architektura ekosystému Hadoop - MapReduce, Hadoop, HDFS, YARN, Spark, HBase, Hive, Pig, Sqoop, Flume a další
6. NoSQL, grafové databáze a databáze dokumentového typu, CAP teorém vs. ACID konzistence atp.
7. Analýzy a vizualizace velkých datových objemů za pomoci JavaScript API D3 a jazyka R
8. Webová analytika a vizualizace, význam, charakteristiky a metriky, používané nástroje a technologie
9. Metody analýz a vizualizace vícedimenzionálních geografických a prostorových dat
10. Analýzy dat sociálních sítí a kognitivní analýzy, analýzy sentimentu
11. Metody analýz textů nebo mluveného slova, používané algoritmy a vizualizace
12. Použití grafových analýz a algoritmů – technologie, nástroje a konkrétní použití
13. Zpracování dat a jejich analýzy v reálném čase, zpracování datových proudů (data streams), metody CQRS a tzv. Complex event processing, používané nástroje a architektury řešení
14. Ukázky typických případů použití (use-cases) - Analýza podvodného jednání (Fraud analytics), Predikce odchodů (Churn analysis), Monetizace dat (Data Monetization), Lokační analýzy (Location analytics), Analýzy preferencí zákazníka (Affinity analysis) a další
15. Nejpoužívanější nástroje a platformy pro analýzu a vizualizaci dat, jejich porovnání, plusy a minusy, použití v závislosti na požadovaných úlohách, typu a objemu dat, zasazení analytických nástrojů do celkové architektury společnosti

Organizace výuky

Prezenční forma

Výuka probíhá ve 12 přednáškách po 1,5 hodině a 12 seminářích po 3 hodinách.

Doporučená literatura

  • WHITE, Tom. Hadoop: the definitive guide. Third edition. Beijing: O'Reilly, 2012. ISBN 1449311520.
  • HOWSON, Cindi. Successful business intelligence: unlock the value of BI & big data. Second edition. New York: McGraw-Hill Education, 2014. ISBN 007180918x.
  • BRUCE, Peter C. Introductory statistics and analytics: a resampling perspective. Hoboken, New Jersey: Wiley, 2014. ISBN 978-1118881354.
  • MARZ, Nathan a James WARREN. Big data: principles and best practices of scalable real-time data systems. Shelter Island, NY: Manning, 2015. ISBN 978-1-617290-34-3. 
  • GRUS, Joel. Data science from scratch: first principles with Python. Sebastopol, CA: O'Reilly, 2015. ISBN 149190142X. 
  • FRANKS, Bill. The analytics revolution: how to improve your business by making analytics operational in the big data era. Hoboken, New Jersey: Wiley, 2014. ISBN 9781118873670