(BIG02) Introduction au Big Data et Machine Learning

August 18, 2025 - August 19, 2025
Objectifs de la formation :
- Comprendre les concepts fondamentaux du Big Data et du Machine Learning.
- Identifier les cas d’usage métiers pour l’intelligence artificielle et l’exploitation de grands volumes de données.
- Découvrir les architectures Big Data modernes et les plateformes Cloud associées.
- Explorer les grandes familles d’algorithmes de Machine Learning supervisés et non-supervisés.
À qui s’adresse la formation ?
- Décideurs, chefs de projet, analystes métiers souhaitant comprendre les enjeux du Big Data et de l’IA.
- Développeurs, data analysts, ingénieurs ou administrateurs systèmes souhaitant initier un parcours Data/ML.
- Toute personne impliquée dans des projets d’innovation ou de transformation numérique.
Contenu
1. Introduction au Big Data
- Définition et caractéristiques du Big Data : volume, variété, vélocité, véracité, valeur.
- Comparaison entre données traditionnelles et données massives.
- Écosystèmes et technologies : Hadoop, Spark, NoSQL, Data Lake.
2. Architectures de traitement distribuées
- Modèle MapReduce et pipelines de traitement en flux.
- Présentation d’architectures Lambda et Kappa.
- Outils : Kafka, Spark Streaming, Azure Synapse, Google BigQuery.
3. Introduction au Machine Learning
- Définition, historique et positionnement dans l’IA.
- Différences entre ML supervisé, non supervisé et par renforcement.
- Cycle de vie d’un projet ML (collecte, préparation, modélisation, déploiement, évaluation).
4. Algorithmes de base en Machine Learning
- Régression linéaire, classification (KNN, arbres de décision, SVM).
- Clustering (K-means, DBSCAN), réduction de dimensions (PCA).
- Notions de sur-apprentissage, validation croisée, métriques de performance.
5. Applications et cas d’usage
- Prévisions de ventes, segmentation client, maintenance prédictive.
- Détection de fraude, recommandations, traitement de texte ou d’images.
- Intégration de l’IA dans les processus métiers (CRM, ERP, IoT, web).
6. Initiation à l’outillage
- Présentation de Jupyter, scikit-learn, pandas, matplotlib.
- Environnements cloud pour le ML : Azure ML Studio, Google Vertex AI, Amazon SageMaker.
- Notions de notebooks reproductibles, datasets open source, APIs IA (vision, NLP).