Apprendre le Big Data par la pratique

Vous êtes développeur et vous souhaitez souhaitez ajouter le Big Data à vos compétences ?

Cette formation en trois jours est faite pour vous, elle vous donnera le recul nécessaire pour comprendre comment ces technologies sont apparues et vous initiera aux derniers outils de stockage et de traitement distribués.

Après avoir analyser l'origine, les usages et les impacts du phénomène Big Data, nous étudierons les systèmes de stockage distribué avec NoSQL, les systèmes de traitement distribués de première génération avec l'écosystème Hadoop, les systèmes de de traitement distribués de dernière génération avec l'écosystème Spark et les algorithmes de Machine Learning. A chaque fois des exercices pratiques sur des clusters de machines avec des datasets significatifs permettront d'assimiler par la pratique les concepts présentés.

Présentation

  • objectifs

    Vous souhaitez vous initier par la pratique aux briques techniques qui concourent aux solutions Big Data actuelles.

  • programme

    1ère demi journée

    • Définition, usages et impacts du Big Data

    2ème demi journée

    • Solutions de stockage pour le Big Data
    • Systèmes clé valeur : Redis
    • Systèmes orientés documents : MongoDB
    • Systèmes à famille de colonnes : Cassandra
    • Systèmes orientés graphe : Neo4j

    3ème demi journée

    • Première génération de solutions de calculs distribués pour le Big Data
    • Hadoop et HDFS
    • Pig, Hive, Impala

    4ème demi journée

    • Deuxième génération de solutions de calculs distribués pour le Big Data
    • Spark
    • Spark SQL

    5ème demi journée

    • Le Machine Learning
    • Spark MLLib
    • L’écosystème de Spark
    • Spark Streaming

    6ème demi journée

    • Comment initialiser une démarche Big Data ?
    • Évaluation de la formation
    • Questionnaire de fin de formation
  • méthode pédagogique

    Cette formation alterne les parties théoriques avec des exercices pratiques sur des clusters de cinq machines (un par participant) et des datasets de tailles significatives, des échanges sous la forme d’ateliers, des analyses de cas et des retours d’expérience du formateur.

  • public ciblé

    Architectes et développeurs

  • pré-requis

    • Les exercices utilisent les langages propres à chaque système étudié. Il n’est bien sûr pas nécessaire de les connaître préalablement. Par contre, une culture de la programmation et la capacité à transposer ses concepts dans ces nouveaux environnements est nécessaire. La connaissance de Python ou Scala est un plus.

    • Les environnements des exercices sont sur le cloud, il suffit d’un navigateur pour y accéder. Si vous ne pouvez pas venir avec votre machine, merci de nous prévenir au préalable pour que nous trouvions une solution.

  • Sessions France

    Dates

    • 3 jours
    • sur demande

    Prix

    - sur devis (1)

    (1) plateaux repas inclus.

    Lieu

    33 avenue des Champs Elysées,
    75008 Paris

  • Sessions Maroc

    Dates

    • 3 jours
    • sur demande

    Prix

    - sur devis (1)

    (1) plateaux repas inclus.

    Lieu

    119 boulevard Emile Zola,
    20300 Casablaca

Nos experts

  • FrancoisR
    François REYNALD
    MANAGER BIG DATA

    Diplômé de l'École Centrale de Lyon, François a développé depuis 30 ans une expertise en qualité, en management de projets informatiques et en ingénierie logicielle après avoir débuté dans l’intelligence artificielle. Il est le responsable de l’offre Big Data chez Neoxia. A ce titre, il en a défini le contenu et les axes prioritaires. Il est en support des projets de Neoxia sur les choix de solutions Big Data et anime des cours chez Learning Tree International et chez Neoxia. Il est intervenu auprès de sociétés comme McDonald, le Pôle Emploi, le Conseil Général du 93, BeIn Sports...

Vous souhaitez vous inscrire à cette formation ou avoir plus d'informations ?