Formation Data science avec Python : Types de variables et opérations

Tuto vidéo Décomposition et combinaison

Les méthodes de chaîne de caractères : partition(), rpartition(), split(), rsplit(), join() …etc
Présentation
Plan détaillé
Ressources
Discussion
Avis (0)

Description de la formation

Python est un langage à caractère général, versatile et riche en fonctionnalités. Et de ce fait, on peut y trouver pour son compte selon le domaine que l’on envisage de poursuivre et en l’occurrence, nous pour ce second module de notre parcours Data Science, nous nous sommes concentrés sur les structures de données de base natives Python et l’étude du package Numpy.

Il faut entendre par les structures de données les objets itérables qui sont le fondement même de la programmation Python. Il s’agit des listes, des tuples, … des chaînes de caractères et des dictionnaires. Dans ce module chaque type d’objet est abordé individuellement pour en connaître les méthodes et propriétés de manière pratiques. 

En parallèle, des objets particuliers tels que les dates et temps du module datetime, time …etc. sont aussi étudiés enfin d’avoir une vision globale de l’univers des types de données que peut manipuler Python et auxquels un data scientiste recourt inéluctablement.

Dans cette même veine et pour donner une teinture scientifique à ce module (après tout nous n’apprenons pas que Python mais nous apprenons Python et son application au domaine de la science des données) nous avons étudié les types de nombres à travers des modules de la librairie standard Python math, cmath, … et surtout le package Numpy notamment à travers la manipulation de son objet central l’objet ndarray qui permet de travailler avec les tableaux numériques multidimensionnels. 

Dans ce détour, très important en Data Science, nous avons abordé les concepts essentiels de l’algèbre linéaire étudiés certainement en cours : inversion, transposée, décompositions (valeurs et vecteurs propres, LU, SVD, …) …etc. de matrices et tout ceci à travers des exercices pratiques. Nous y voyons aussi les méthodes de statistiques de bases et des méthodes avancées de manipulations de données numériques. 

Nous abordons aussi le cas particulier des matrices creuses ou sparses matrix et du module random. Ce dernier permet la manipulation des nombres aléatoires qui est un prémisse aux méthodes d’échantillonnage. On a abordé également des applications diverses sur le produit de convolution et la transformée de Fourier discrète …etc. 

Pour finir, ce module n’est pas des moindres dans le parcours que nous sommes entrain de dérouler au fur et à mesure car les différents objets et opérations vus ici permettront plus tard de construire des structures et algorithmes plus ou moins complexes.

Objectifs

Découvrir les types de variables et objets majeurs (outres data frame car chapitre exclusif), leurs manipulations les plus courantes, les opérations de transformations et mathématiques s’appliquant sur ces derniers qui sont importants dans le cadre de la Data Science (particulièrement dans le Scripting d’algorithmes).

Prérequis

Bonnes connaissances de l'environnement Microsoft Windows (gestion des fichiers) et maîtrise du clavier et de la souris, avoir suivi la formation précédente Prise en main des IDE est plus que fortement recommandé !

Public concerné

Ce module vise essentiellement les débutants en Python et les expérimentés qui voudraient se remémorer des concepts bases importants. Toutefois, les métiers auxquels, il peut servir sont : Chargé des analyses statistiques numériques ou visuelles dans tous les domaines possibles et imaginables (biostatistique, pharmaceutique, banque, assurance, data science, data mining, machine learning, industrie, ingénierie, chimie, text mining, image mining, science de l'information géographique, etc.)
Formateur : Daname KOLANI
Date de mise en ligne : 11-01-2019

Evaluations


5
(10 votes)
5
10
4
0
3
0
2
0
1
0
Ceci peut aussi vous intéresser