Big Data



Référence de la formation

KDS009

Niveau

Débutant
 

Nombre de jours

16 heures (4 heures/jour)

Prix

1.390,50 € HT

Lieu de la formation

V: v-learning, classe virtuelle



Pre-requis

Un niveau d'anglais business moyen est requise car la formation sera
dispensée en anglais.

Public

Chefs de projet, chefs de produit et Managers, Développeurs et
Architectes qui veulent connaître le Big Data.

Objectifs de la formation

Aujourd'hui, les entreprises ont la capacité de collecter une grande
quantité de données. Le traitement d'une grande quantité de données
nécessite de nouvelles technologies capables de collecter, de nettoyer,
de traiter et de stocker efficacement une quantité importante
d'informations.
De nombreuses entreprises sont parvenues à la conclusion que le fait
de ne pas utiliser ces données collectées entraîne en réalité une perte
importante d’argent. Le marché du Big Data devrait dépasser les 200
milliards de dollars cette année.
Ce cours fournit la base de l'environnement, de l'architecture, du
processus et des outils disponibles Big Data et NoSQL DB. Le cours
présentera également les méthodologies Big Data et les
recommandations de déploiement.

Contenu du cours

Table 1: KDS009 - Course Contents
Chapter Description
Introduction • Definition: Big Data, NoSQL
• The need for Big Data technology
• Tradition technologies Vs Big Data technologies
• Big Data project requirements
• Big Data Project workflow
Big Data
Architecture
• Big Data project definitions
• Data sources & development resources
• Big Data technologies evaluation
− The need for POC
Data Collection
& Ingestion
• Streaming Concept
− Rest API
• Apache Kafka
− AWS Kinesis, Azure Event Hub
• Apache Flume
• ELK package
− Logz.io
Hadoop – Introduction • What is Hadoop?
• Hadoop Architecture
• Hadoop File System (HDFS)
− Architecture
− NameNode & DataNode
• Hadoop MapReduce
• Apache YARN
• Apache Oozie, ZooKeeper
• Project non-functional support
− Sentry, Tez, Ambri, Knox, Falcon
Project decision – Hadoop deployment • Hadoop Distribution
− Examples: Cloudera, Hortonworks
• Hadoop as a service
• Can Big Data project switch environments?
• Hadoop deployment requirements
• Hadoop Performance Best Practices
Hadoop project POC • POC environment
• Using Apache Pig! & Apache Sqoop for POC
Large-scale data processing framework • Apache Storm
• Apache Spark
− Concept & Architecture
− Programming with Spark
− Spark Streaming
− Spark SQL
− MLlib
− GraphX
Project development cycle & deployment – Spark • Big Data – Development methodologies
− Waterfall Vs Agile
• ETL development cycle & deployment
• Tests Cycle
Big Data DB types • Key-Values Stores
− Redis
• Column Family Stores (Wide Column Stores)
− Apache HBase
− Apache Cassandra
• Document Databases
− MongoDB
• Graph Databases
 – Mathematical Graph as a DB
Big Data & RDBMS • Product logic
• Apache Hive
− Architecture – Batch Processing
• Apache Impala
− Massively Parallel Processing (MPP)
Big Data Northbound Interfaces • Big Data to OLAP
• BI Visualization
• Scaling BI over Big Data
Big Data – system ATP • Big Data – system ATP
The End • Trends & Conclusions
• Q&A
• Course’s Evaluation

Dates


12 Oct 2020 au 02 Nov 2020


12 Oct 2020 au 02 Nov 2020


16 Nov 2020 au 07 Déc 2020


14 Déc 2020 au 11 Jan 2021


NOTE :
ATTENTION CETTE FORMATION EST SUR MESURE
CE COURS EST REALISABLE TOUTE L'ANNEE AVEC UN MINIMUM DE 5 PARTICIPANTS


Des questions ?

+33 (0) 950 20 91 64


Inscription ou Demande de devis