Projet 1 : analyse de données nutritionnels : analyse exploratoire, correction de données manquantes et aberrantes ( knn), analyse multivariée, ACP. Outils utilisés : Python, R, packages utilisés : Scikit learn, numpy, pandas... Projet 2: création d'un système de recommandation de films base de données IMDB : analyse exploratoire, correction de données aberrantes, encodage, méthodes de clustering, knn, mise en production et création d'une API. Outils utilisés : Python, html, css Projet 3 : création d'une API de prédiction de retards de vols aériens : analyse exploratoire, ACP et régression linéaire, régression linéaire régularisée, arbre de décision, mise en production et création de l'API . Outils utilisés : Python, R, hmtl, css. Projet 4 : analyse et segmentation de clients d'un site commercial en ligne : analyse exploratoire et nettoyage de la base de données, création de variables RFM et autres, clustering, méthode de classification ( forêt aléatoire, knn, perceptron, gradient boosting...). Projet 5 : NLP, catégorisation des questions du site stackoverflow.com et création d'un API qui retourne des tags descriptifs des questions : Traitement du langage naturel, méthodes de création de sujets ( LDA..), création d'un modèle Word2Vec, TF-IDF, méthodes de classification, mise en production et création de l'API. Outils utilisés : Python, html, css, SQL, NLTK Projet 6 : indexation d'images de chiens et classification suivant la race ( extraction de variables d'images, algorithme SIFT, SURF, ORB, méthodes de classification, création d'un réseau de neurones convolutifs ( CNN), transfert learning, mise en production et création d'une API pour la prédiction de la race d'un chien à partir d'une image fournie par l'utilisateur ). Outils utilisés : Python, html, css, packages utilisés : Tensorflow, Keras... Projet 7 : proof of concept basé sur une analyse NLP Projet 8 : Compétition Kaggle