Data Science – Concepteur Développeur en Intelligence Artificielle et Analyse Big Data
Découvrez les fondamentaux de la Data Science. Construisez les modèles d’intelligence artificielle de demain, avec le bootcamp le mieux classé au monde !
Objectif :
2,5 mois pour apprendre à explorer, nettoyer, transformer des données pour les rendre actionnables (Python, base de données relationnelles SQL), à implémenter des modèles de Machine Learning en production, et développer toutes les compétences pour rejoindre une équipe data.
Validation: Concepteur développeur en intelligence artificielle et analyse big data(Niveau 6 : BAC+3, BAC+4, Licence, Licence professionnelle, Maîtrise)
La formation Data Science et IA du Wagon est un programme très intense qui se déroule en 3 étapes :
1/ Travail Préparatoire (80h) : Cours à suivre en ligne avant le début de la formation. L’objectif est de fournir les bases du langage Python, prérequis pour cette formation, ainsi que quelques notions clef en mathématiques utilisées tous les jours par les data scientists.partir sur des bases d’apprentissage solides et démarrer dans les meilleures conditions.
2/ Formation (360h) : possible en format hybride, en présentiel ou en distanciel (si aménagements nécessaires).Des fondamentaux de Pandas aux modèles avancés de Deep Learning, vous comprendrez les enjeux du big data et apprendrez à explorer, nettoyer, transformer des données pour les rendre actionnables et à implémenter des modèles de Machine Learning de A à Z en production, en travaillant en équipe avec les meilleurs outils.Le contenu de la formation est le suivant :
Semaines 1 et 2 : Data AnalyseProgrammer en Python en utilisant Jupyter Notebook et des librairies puissantes (Pandas et NumPy)Explorer de gros jeux de données (big data);Collecter des données depuis différentes sources (CSV, requêtes SQL, Google Big Query, API, Web scraping ;Base de données relationnelles & SQL (extraction d’informations par SELECT via BDD ou client SQL comme DBeaver);Intégration des visualisations de données à Notebooks;Tracer des graphes à partir de vos data frames grâce à des librairies Python (matplotlibou seaborn);Rendre vos données plus actionnables ;Statistiques, Probabilités, Algèbre linéaire ;
Semaine 3 : Decision ScienceStructurer un projet Python en programmation orientée objet;Préparation d’un vaste ensemble de données;Interprétation de résultats statistiques significatifs basés sur des modèles de régression linéaires à plusieurs variables;Présentation de conclusions techniques et transformation en recommandations business (analyse coûts/bénéfices);
Semaines 4 et 5 : Machine LearningPreprocessing et Apprentissage Supervisé : techniques de preprocessing, regressions linéaires et logistiques, tâches de prédiction et de classification (librairie scikit-learn et algorithmes KNN);Généralisation et Overfitting : méthodes de régularisation, généralisation du modèle, production et exactitude prédictible;Métriques de Performance: méthodes de validation (cross validation, l’hyperparameter tuning, SVM.Apprentissage non supervisé et Méthodes Avancées : apprentissage non supervisé (PCA), réduction de dimension, le clustering, méthodes ensemblistes (Random Forest, Gradient Boosting)
Semaine 6 : Deep LearningRéseaux de neurones : comprendre l’architecture des réseaux de neurones (neurones, couches, piles) et leurs paramètres (activations, pertes, optimiseurs), construction de réseaux, notamment pour travailler avec des (images, séries temporelles, texte) ;Computer Vision : techniques d’augmentation de données, Transfer Learning;Séries temporelles & données de textes : gestion de données séquentielles et de textes (séquence de mots), Natural Language Processing;Faciliter le Deep Learning : Prototypage (Keras Deep Learning ), Processuers graphiques (Google Colab).
Semaine 7 : Data EngineeringMachine Learning Pipeline : mise en place d’une pipeline robuste et scalable avec sklearn-pipeline (encoders, transformers);Workflow de Machine Learning avec MLflow;Mise en production avec Google Cloud Platform.
Semaines 8 et 9 :Mise en application de l’ensemble des connaissances acquises au cours de la formation professionnelle par la résolution d’une problématique en groupe.
Semaine 10 (40h) :Préparation à l’arrivée sur le marché du travail. Conférences, ateliers, mise en relation/réseau.
Disponible en distanciel et présentiel.