Aquest lloc web utilitza cookies pròpies i de tercers per recopilar informació estadística sobre els teus hàbits de navegació i poder així millorar i personalitzar la teva experiència oferint-te continguts del teu interès. Si segueixes navegant, considerem que acceptes la seva instal·lació i ús. Pots canviar la configuració o obtenir més informació en Política de cookies.
Fem 5

La wikipedia i el data scraping

En aquesta activitat es proposa utilitzar tècniques per capturar dades de pàgines web, en aquest cas la Viquipèdia, així com l'eina lnfogr.am per crear gràfics de manera ràpida i senzilla, amb l'objectiu de redactar després una notícia curta a partir d'ells.

Per a aquesta pràctica, es necessita un compte de Gmail.

Que les dades t’acompanyin!

Pas 1

Buscar informació sobre un tema a la Viquipèdia

Com a exemple, per analitzar l'evolució de la sèrie Lost, us proposem fer la prova d'importar la taula d'evolució de les audiències de la sèrie a partir de la seva entrada en Wikipedia:

https://es.wikipedia.org/wiki/Lost

Pas 2

Extreure'n les dades en un full de càlcul de Google

Ara utilitzarem el data scrapping, una tècnica que serveix per obtenir les dades d'una pàgina web i poder treballar amb ells: creuar-los, analitzar-los, visualitzar-los...

Obre un full de càlcul de Google

Afegeix a l'apartat de fórmula: =IMPORTHTML("https://es.wikipedia.org/wiki/Lost";"table" ;3)

Explicació de la fórmula emprada: IMPORTHTML("URL";"TABLE O LIST";NUMERO)

  • IMPORTHTML – Importar des de pàgina web
  • URL – Adreça del lloc web, exemple: https://es.wikipedia.org/wiki/Lost
  • TABLE O LIST – Escriu LIST si vols extreure una llista o TABLE si vols extreure una taula.
  • NOMBRE - Indica el nombre d'ordre en què es troba la llista o la taula dins de la pàgina web que vols importar (En aquest cas és la tercera taula)
Pas 3

Crear un gràfic a Infogr.am

Fes clic en aquest enllaç per poder crear el gràfic:  https://infogr.am/

Fes clic al gràfic que vols crear.

Pas 4

Redactar un titular que resumeixi el gràfic

Res de titulars llargs, tediosos o altisonants. Sigues breu, directe i concís.

Pas 5

Plantejar una hipòtesi per explicar els fets

  • Van començar altres sèries d'èxit
  • La trama va perdre interès
  • Els actors populars van deixar la sèrie
Pas 6

Redactar una notícia breu

Recorda que, per redactar la notícia, has de citar les pàgines i autors en els quals et bases.

5

final del bloc 5

Felicitats!

Has finalitzat amb èxit el bloc 5.
Pots seguir amb un altre bloc per aprendre més sobre big data.

Descobrir més blocs