Informatique

Machine Learning sous Python et R

Machine Learning sous Python et R

Réf 4-PY-MLPR
Durée 4 jours

Objectifs

Utiliser R et Python dans le cadre de modèles d'apprentissage et de fonctions algorithmiques

Infos

Sessions à venir

25 nov-28 nov 2024
03 fév-06 fév 2025
03 jun-06 jun 2025

Certifications :

Nous consulter

Programme

Généralités

  • Présentation et installation du logiciel R
  • GUIs et IDEs
  • Prise en main et premiers pas
  • Fonctions et packages
  • Utilisation des aides

Rappel des concepts de base du Data Mining

  • Introduction à R - Concepts de base
  • Syntaxe
  • Type de données
  • Import/Export de données
  • Manipulation des librairies

Manipulation des données

  • Rappels des grandeurs statistiques de bases
  • Calcul des grandeurs statistiques de bases avec R
  • Aperçu des types de visualisation courants en Data Mining
  • Fonctions et librairies de base de visualisation avec R

Data Preprocessing

  • Data Cleaning
  • Data Reduction (analyse en composantes principales)
  • Data Preprocessing et ACP avec R

Règles d'association

  • Rappels théoriques de l'algorithme Apriori
  • Application et exploitation des règles d'association avec R

Classification et régression

  • Règles bayésiennes naïves
  • Rappels théoriques
  • Initiation à la librairie "e1071" de R
  • Arbre de décision CART
  • Rappels théoriques
  • Initiation à la librarie "party" de R
  • Arbre de décision RandomForest
  • Rappels théoriques
  • Initiation à la librairie "randomForest" de R
  • Régression linéaire
  • Rappels théoriques
  • Initiation à la fonction lm() de R

Clustering

  • Centroid-based clustering
  • Algorithme du K-means
  • Fonction kmeans de R
  • Hierarchical clustering
  • Concepts théoriques
  • Fonction hclust de R
  • Density-based clustering
  • Concepts théoriques
  • Application dans R

Outils de support à R

  • Data preprocessing avec Dataiku
  • Utilisation de R dans Dataiku

En savoir +

Prérequis

Cette formation s’adresse au profil métier orienté Data Scientist
Bonnes bases de statistiques et de data mining

Moyens pédagogiques

Réflexion de groupe et apports théoriques du formateur
Travail d'échange avec les participants sous forme de
Utilisation de cas concrets issus de l'expérience professionnelle
Validation des acquis par des questionnaires, des tests d'évaluation, des mises en situation et des jeux pédagogiques.
Remise d'un support de cours.

Possibilité de certification

Nous consulter.