Vous êtes ici : Accueil > Formations > Big Data avec Apache Spark : Initiation

Formation Big Data avec Apache Spark : Initiation

Comprendre les bases de la big Data sous Spark et avec Scala
Présentation
Plan détaillé
Ressources
Discussion
Avis (5)

Description de la formation

Spark est actuellement le projet open source le plus actif sous la plate-forme Apache Software Foundation (ASF). Il est aussi l'un des projets open source de big data le plus actif.

Spark permet aux développeurs de créer un traitement de données complexe en plusieurs étapes routines, fournissant une API de haut niveau et un cadre tolérant aux pannes qui permet aux programmeurs à se concentrer sur la logique plutôt que sur les problèmes d'infrastructure ou d'environnement comme une défaillance matérielle par exemple.

Dans cette formation vous allez vous familiariser avec les principes fondamentaux de Spark en utilisant le langage ScalaSpark est écrit en Scala. Il fonctionne en Java virtuel machines (JVM). 

Vous allez maitriser l’utilisation MapReduce avec Spark qui est une alternative à l'utilisation traditionnelle MapReduce sur Hadoop. 

L’utilisation de MapReduce avec Hadoop a été jugé inadaptée aux requêtes interactives ou temps réel, avec une faible latence applications. Un inconvénient majeur de l'implémentation MapReduce de Hadoop était sa persistance des données intermédiaires sur le disque entre le Map et le Reduce en phases de traitement. 

Dans cette formation vous allez apprendre à implémenter une structure distribuée, tolérante aux pannes et in-memory appelée Resilient Distributed Dataset (RDD). Vous allez également apprendre à traiter les données non structurées.

Dans le chapitre de Spark SQL les notions des DataFrame et DataSet ne seront plus un secret pour vous.  

Vous avez surement entendu parler du traitement des données qui arrivent en temps réel, ce qu’on appelle le Streaming. Un chapitre bien détaillé vous attend afin que vous puissiez monter en compétence rapidement avec Spark Streaming.

Objectifs

Maîtriser les concepts fondamentaux d’Apache Spark

Faire de la programmation parallèle avec Spark et Scala

Exploiter des données avec Spark SQL (utilisation de SQL)

Développer des applications avec Spark Streaming

Prérequis

Bonnes connaissances de la programmation orienté objet

Connaissances des commandes Linux/Unix

Public concerné

Développeurs

Chef de projet

Architectes

Personnes souhaitant acquérir une connaissance rapide et brève sur le monde Spark et le Big Data

Formateur : Aimad TAHI
Date de mise en ligne : 21-05-2018

Evaluations


4.7
(15 votes)
5
10
4
5
3
0
2
0
1
0

Ce qu'ils disent de cette formation


  • Très belle présentation

    Il y a 1 mois et 28 jours
  • Très bonne formation avec une bonne approche technique de Spark.

    Il y a 2 mois et 28 jours
  • Très bonne formation. Concis et clair, le formateur est excellent.

    Il y a 4 mois et 21 jours
  • c'est très bien

    Il y a 4 mois et 22 jours
  • Très bonne formation!!!! Merci Aimad

    Il y a 5 mois et 19 jours
Ceci peut aussi vous intéresser