TP 1 Les données structurées.

I/ Big Data.

Big data = données massives

Nous créons environs 2,5 trillons de données tous les jours. Aucun outils classique de gestion de base de données ou de gestion de l'information ne peut vraiment travailler le Big Data.

Exploiter le Big Data est difficile, mais des tentatives sont réalisées avec plus ou moins de succès, trois exemples:

* Le New York Times estimait la probabilité de gagner d'Hilary Clinton contre Donald Trump à 85%. (petite erreur)

* L'équipe d'Allemagne de football pendant sa coupe du monde 2014 et l'Euro 2016, l'a utilisé pour développer sa stratégie face aux différentes équipes rencontrées. Elle a gagné la coupe du monde et a perdu en demi-finale de l'Euro.

* L'application "Plantnet" que vous pouvez télécharger sur votre téléphone portable reconnait des végétaux (fleurs, plantes, arbres, ...) à l'aide d'une photo que l'application compare avec celles situées dans le Big data.

* Cette photo de David Bowie (à gauche), Yoko Ono et John Lennon (à droite) a beaucoup circulé sur le WEB. Il s'agit en faite d'une photo montage.

montage

Le logiciel en ligne TinEye peut aller chercher sur le Big Data la photo originale. Pour cela, ouvrez le logiciel en ligne TinEye en cliquant ci-dessous. Puis allez chercher à l'aide de la flèche le fichier "montage" (contenant la photo) si situant dans votre dossier de classe/dossiers en consultation/SNT/élève/4 Données/TP 1 (ou bien, faites un clique droit sur l'image, copier l'image et coller au niveau de la demande d'URL)

Vous devriez voir apparaître une liste de photos. La photo originale se trouve tout au bout de la liste page 10.

tineye

Travailler le BIG Data est trop compliqué pour nous.

Mais où sont stocké toutes ces données? Nos Mail ne sont pas sauvegardés sur nos ordinateurs. Nous avons l'habitude de sauvegarder nos fichier sur notre ordinateur, mais peut-on les sauvegarder ailleurs?

II/ Le cloud.

Après avoir visionné la vidéo ci-dessous, répondre aux questions concernant le cloud.

cloud
  1. Qu'est-ce que le cloud?
  2. D'où vient le terme cloud?
  3. Quelles sont les évolutions techniques qui ont permis le développement du cloud?
  4. Quels sont les avantages et les inconvénients du cloud.
  5. Comment pourrait-on améliorer ce système de cloud?

III/ L'open Data.

Une partie des données que l'on peut trouver sur internet sont publiques. Ces données sont librement utilisables, c'est l'Open Data.

Open Data = données publiques brutes, librement accessibles et réutilisables.

Par exemple le site : data.gouv.fr  recence un grand nombre de données publiques librement réutilisables.

A faire vous même 1

  1. Aller sur le site : data.gouv.fr 
  2. Cliquez sur "Commencer sur data.gouv.fr"
  3. Aller sur "qu'est ce que data.gouv.fr"
  4. Lire le paragraphe.
  5. Revenir en arrière.
  6. Dans la barre de recherche, copier-coller :"Carte des collèges et associations susceptibles de proposer des activités éducatives aux collèges de la Seine-et-Marne"
  7. Descendez et cliquez sur le deuxième; "Recherche ......dans les réutilisations."
  8. Comme vous pouvez le constater, il y a une réutilisation. Cliquez dessus.
  9. Cliquez sur voir la réutilisation.

Comme vous pouvez le constater, les données sont déjà traitées à l'aide d'un outil que vous connaissez. Lequel?

A faire vous même 2

Les fichiers sont souvent au format CSV. Vous allez ouvrir avec excell le fichier CSV se trouvant dans votre dossier de classe/espace d'échange/SNT/élève/4 Données/TP1

Vous pouvez constater qu'il est difficile à lire. Néanmoins, vous constatez que la première ligne est constituées de descripteurs (titre de colonne), et que les données sont séparées de virgules.

Les fichier CSV ont pour séparateur soit des virgules, soit des point-virgule, ou autre... Les tableurs ne gèrent pas toujours correctement le téléchargement. Nous allons charger notre fichier proprement:


Partie 1: Préparation d'Excel

  1. Fermer le fichier Excel, sans fermer Excel.
  2. Faites nouveau.
  3. Ouvrez une page vierge.

Partie 2: Ouverture propre.

excel_propre
  1. Dans Excel, cliquez sur Données
  2. Puis sur Nouvelle requête.
  3. Puis sur A partir d'un fichier.
  4. Puis sur A partir d'un fichier csv.
  5. Allez chercher le fichier situé dans: dossier de classe/espace en consultation/SNT/élève/4 Données/TP 1
  6. Cliquez sur Importer.
  7. Laissez Excel travailler.
  8. Cliquez sur Charger.
  9. Laissez Excel travailler, le tableau qui s'ouvre doit être propre, à l'exception des lettres avec accens et des c cédille.

Quels sont les différents descripteurs du tableau?

Descripteur = élément qui décrit et caractérise les données d'un fichier.

A faire vous même 3

  1. Aller sur le site : data.gouv.fr 
  2. Descendez et cliquez sur "Toutes les thématiques"
  3. Cliquez sur "Covid-19"
  4. Cliquez sur"Données hospitalières relatives à lépidémie de covid 19."
  5. Descendez voir les fichiers . Ils sont au format CSV.
  6. Téléchargez le premier fichier. Vous constatez qu'il s'ouvre proprement avec Excell.

A faire vous même 4

Je vous propose de regarder l'égalité hommes femmes dans les entreprises.

Toujours sur le site: data.gouv.fr . Cliquez sur "Toutes les thématiques." puis sur "Emploi". Descendez sur "Index Egalité Professionnelle F/H des entreprises de 50 salariés ou plus". Téléchargez puis ouvrez le fichier.

Combien d'entreprise ont une note hautes rémunération de 0?