Doptim-Formation-python et data science
NOS FORMATIONS

Initiation à Python pour la Data Science

Durée : 2 jours – 1er jour à distance, 2ème jour en présentiel

Coût : devis sur demande ou via Captronic

Pour qui : ingénieurs et techniciens en bureau d’études ou toute autre personne utilisant de la modélisation de données.

Pré-requis :

  • Connaissances en programmation informatique, algorithmique, en mathématiques.
  • Chacun utilise son propre PC portable connecté sur Internet. Un PC avec webcam, haut-parleur et micro et une liaison Internet sont requis pour le jour 1.

Mode d’évaluation :

  • Attestation d’assiduité jour 1 et de présence jour 2.
  • Evaluation des connaissances via un questionnaire avant et après la formation. Feuilles de présence signées par chaque stagiaire et le formateur par demi-journée de formation pour le jour 2.

 

Objectifs d'apprentissage

  • Se familiariser avec les librairies python dans le traitement des données et les règles de base du Machine Learning,
  • Connaître et mettre en œuvre quelques algorithmes pour appréhender le travail sur les variables et l’optimisation des erreurs de modélisation.

Au programme

Jour 1 :

  • Collecte, caractérisation et préparation des données sur des séries temporelles et des données catégorielles – modélisations avec du code déjà préparé et commenté.
  • Introduction à Python : présentation du langage et utilisation des Notebook et de l’IDE, présentation des librairies principales et des aides, les objets de Python (vecteurs, matrices, listes, dataframes, types de données), la manipulation des données (importation, exportation, sélection et regroupement, ré-échantillonnage, opérations).

Jour 2 :

  • Travaux pratiques en binôme, sur des jeux de données de l’entreprise et des objectifs que les participants proposeront.
  • Application au Machine Learning : les grands principes (modélisations supervisées, non-supervisées et par renforcement, les étapes de construction d’un modèle, l’évaluation des modèles), l’étude d’algorithmes (régression linéaire simple, multiple et polynomiale, régression logistique, classification hiérarchique et non hiérarchique (K-means), classification par arbres de décision (Random Forest, XGBoost) et mise en pratique.

Cette formation vous intéresse ?

Translate »