Big Data: modélisation, technologie et architecture



Référence de la formation

KDS008

Niveau

  • Débutant
  • Intermédiaire

Nombre de jours

24 heures (4H/jour)

Prix

2.049,00 € HT

Lieu de la formation

V: v-learning, classe virtuelle



Pre-requis

Un niveau d'anglais business moyen est requise car la formation sera dispensée en anglais.

Public

Développeurs, architectes, chefs de produit et responsables souhaitant en savoir davantage sur le Big Data.

Objectifs de la formation

Aujourd'hui, les entreprises ont la capacité de collecter une grande quantité de données. Le traitement d'une grande quantité de données nécessite de nouvelles technologies capables de collecter, de nettoyer, de traiter et de stocker efficacement une quantité importante d'informations. De nombreuses entreprises sont parvenues à la conclusion que le fait de ne pas utiliser ces données collectées entraîne en réalité une perte importante d’argent. Le marché du Big Data devrait dépasser les 200 milliards de dollars cette année. Ce cours fournit la base de l'environnement, de l'architecture, du processus et des outils disponibles Big Data et NoSQL DB. Le cours présentera également les méthodologies Big Data et les recommandations de déploiement.

Contenu du cours

Table 1: KDS008 - Course Contents
Chapter Description
Introduction • Definition: Big Data, NoSQL
• The need for Big Data technology
• Tradition technologies Vs Big Data technologies
Big Data
Architecture
• Big Data Architecture
Data Collection
& Ingestion
• Streaming Concept
− Rest API
• Apache Kafka
− AWS Kinesis, Azure Event Hub
• Apache Flume
• Log Stash
• Commercial solutions – Splunk, Logz.io
Hadoop • What is Hadoop?
• Hadoop Architecture
• Hadoop File System (HDFS)
− Architecture
− NameNode & DataNode
• Hadoop MapReduce
• Apache YARN
• Apache Oozie, Sentry, Tez, HCatalog, ZooKeeper, Ambri, Knox, Falcon
• Hadoop Distribution
− Examples: Cloudera, Hortonworks
• Hadoop Performance Best Practices
Apache Pig • Apache Pig
Apache Storm • Apache Storm
Apache Spark • Concept & Architecture
• Programming with Spark
• Spark Streaming
• Spark SQL, Datasets, and DataFrames
• MLlib
• GraphX
Big Data DB types • Big Data DB types
Key-Values
Stores
• Redis
Column Family Stores (Wide Column Stores) • Apache HBase
• Apache Cassandra
Document Databases • MongoDB
− Architecture & Data Model
− JSON query
− Performance Best Practices
Graph Databases • Mathematical Graph as a DB
• Architecture and components
‘SQL’ over Hadoop • Apache Pig!
• Apache Sqoop
• Apache Hive
− Architecture – Batch Processing
− Apache Impala
− Massively Parallel Processing (MPP)
Big Data Deployment • Local Data Center
• Hosting Services
− AWS, Azure, Google
• Pros and Cons
Big Data Northbound Interfaces • Big Data to OLAP
• BI Visualization
• Scaling BI over Big Data
The End • Trends & Conclusions
• Q&A
• Course’s Evaluation

Dates


16 Nov 2020 au 25 Nov 2020


16 Nov 2020 au 25 Nov 2020


NOTE :
ATTENTION CETTE FORMATION EST SUR MESURE
CE COURS EST REALISABLE TOUTE L'ANNEE AVEC UN MINIMUM DE 5 PARTICIPANTS


Des questions ?

+33 (0) 950 20 91 64


Inscription ou Demande de devis