TP 2 Les données structurées.

I/ Les data center.

Nous avons vu dans le TP 1 ce qu'était le cloud. Nous avons été cherché dans celui-ci des "open data". Redescendons un peu sur terre et allons voir les lieux de stockage de données, les data center.

data center

Tapez dans un moteur de recherche la requête: PUE infomaniak. Quelle valeur est affichée?

Faites de même avec: PUE Safe Host

Lancez spyder pour qu'il s'ouvre pendant que vous prenez connaissance des informations suivantes:

II/ Traitement des données d'un fichier csv avec Python.

Pour traiter des données nous allons utiliser la bibliothèque Python Pandas.

Faites un copier coller du programme suivant dans Spyder.

import pandas
usa=pandas.read_csv("usagers-2017.csv")

Pensez à enregistrer votre travail dans:
votre dossier de classe/votre nom/4 Données/TP2.

Appelez le :

lecture

Faites fonctionner le programme avec la flèche verte comme d'habitude. Vous aurez constaté qu'il ne se passe rien. Qu'a fait le programme? Il a entré les données du fichier dans la variable usa.

Je vous propose de le vérifier en cliquant sur l'explorateur de variables de spyder, puis en double cliquant sur usa

Comme vous pouvez le constaté, vous trouvez un fichier des accidents en 2017 sous la forme d'un tableau, comme dans Excel.

Les nombres présents dans la première colonne sont appelés des index. Chaque ligne du tableau a un index (première ligne: index 0, deuxième ligne index 1,...)

ATTENTION : les index commencent à 0 et pas 1.

Je vous propose de vérifier que les filles ont moins d'accidents.

Nous allons commencé par récupérer dans une variable le sexe des personnes par accident. Pour cela, vous allez faire comme d'habitude:

Faites un copier coller du programme suivant dans Spyder.

import pandas
usa=pandas.read_csv("usagers-2017.csv")
sexe=usa.loc[:,"sexe"]

Pensez à enregistrer votre travail dans:
votre dossier de classe/votre nom/4 Données/TP2.

Appelez le :

sexe

Faites fonctionner le programme avec la flèche verte comme d'habitude. Vous aurez constaté qu'à nouveau, il ne se passe rien. Qu'a fait le programme? Il a entré les données de la colonne sexe se trouvant dans la variable "usa" dans la variable "sexe".

Je vous propose de le vérifier en allant dans l'explorateur de variables et en double cliquant sur la variable sexe. Comme vous pouvez le constaté, vous retrouvez nos 1 et nos 2.

Nous allons désormais compter le nombre de 1 et le nombre de 2. Comme d'habitude:

Faites un copier coller du programme suivant dans Spyder.

import pandas
from collections import Counter
usa=pandas.read_csv("usagers-2017.csv")
sexe=usa.loc[:,"sexe"]
resultat=Counter(sexe)
print(resultat)

Pensez à enregistrer votre travail dans:
votre dossier de classe/votre nom/4 Données/TP2.

Appelez le :

comparaison_H_F

Faites fonctionner le programme avec la flèche verte comme d'habitude. Vous aurez constaté que cette fois, nous avons introduit une instruction pour afficher le résultat, qui confirme que les femmes (2) ont moins d'accidents que les hommes (1).

Pour insister un peu (sans vouloir vexer les garçons), nous pouvons visualiser cela sur un graphique.

Faites un copier coller du programme suivant dans Spyder.

import pandas
usa=pandas.read_csv("usagers-2017.csv")
print(usa['sexe'].value_counts())
df=usa['sexe'].value_counts()
df.plot.pie(subplots=True, figsize=(2,3))

Pensez à enregistrer votre travail dans:
votre dossier de classe/votre nom/4 Données/TP2.

Appelez le :

graphique_H_F

Faites fonctionner le programme avec la flèche verte comme d'habitude. Pour voir le graphique cliquez sur "Plots"

A faire vous même

1/ Modifiez le programme comparaison_H_F précédent pour qu'il compte combien d'accidents ont été répertorié "grav" niveau 4, "grav" niveau 3, "grav" niveau 2, "grav" niveau 1.

Pensez à enregistrer votre travail dans:
votre dossier de classe/votre nom/4 Données/TP2.

Appelez le :

grave

2/ Modifiez le programme graphique_H_F précédent pour qu'il compte combien d'accidents ont été répertorié "grav" niveau 4, "grav" niveau 3, "grav" niveau 2, "grav" niveau 1.

Pensez à enregistrer votre travail dans:
votre dossier de classe/votre nom/4 Données/TP2.

Appelez le :

grav