Informatique

Machine Learning sous Python et R

Machine Learning sous Python et R

Réf 4-PY-MLPR
Durée 4 jours

Objectifs

Utiliser R et Python dans le cadre de modèles d'apprentissage et de fonctions algorithmiques

Infos

Sessions à venir

02 jun-05 jun 2020
07 sep-10 sep 2020
02 nov-05 nov 2020

Certifications :

Nous consulter

Programme

Généralités

  • Présentation et installation du logiciel R
  • GUIs et IDEs
  • Prise en main et premiers pas
  • Fonctions et packages
  • Utilisation des aides

Rappel des concepts de base du Data Mining

  • Introduction à R - Concepts de base
  • Syntaxe
  • Type de données
  • Import/Export de données
  • Manipulation des librairies

Manipulation des données

  • Rappels des grandeurs statistiques de bases
  • Calcul des grandeurs statistiques de bases avec R
  • Aperçu des types de visualisation courants en Data Mining
  • Fonctions et librairies de base de visualisation avec R

Data Preprocessing

  • Data Cleaning
  • Data Reduction (Analyse en composantes principales)
  • Data Preprocessing et ACP avec R

Règles d'association

  • Rappels théoriques de l'algorithme Apriori
  • Application et exploitation des règles d'association avec R

Classification et Regression

  • Règles bayesiennes naïves
  • Rappels théoriques
  • Initiation à la librairie "e1071" de R
  • Arbre de décision CART
  • Rappels théoriques
  • Initiation à la librarie "party" de R
  • Arbre de décision RandomForest
  • Rappels théoriques
  • Initiation à la librairie "randomForest" de R
  • Régression linéaire
  • Rappels théoriques
  • Initiation à la fonction lm() de R

Clustering

  • Centroid-based clustering
  • Algorithme du K-means
  • Fonction kmeans de R
  • Hierarchical clustering
  • Concepts théoriques
  • Fonction hclust de R
  • Density-based clustering
  • Concepts théoriques
  • Application dans R

Outils de support à R

  • Data preprocessing avec Dataiku
  • Utilisation de R dans Dataiku

En savoir +

Prérequis

Cette formation s’adresse au profil métier orienté Data Scientist
Bonnes bases de statistiques et de data mining

Moyens pédagogiques

Possibilité de certification

Nous consulter.