Este Sitio web utiliza cookies propias y de terceros para recopilar información estadística sobre tus hábitos de navegación y poder así mejorar y personalizar tu experiencia ofreciéndote contenidos de tu interés. Si sigues navegando, consideramos que aceptas su instalación y uso. Puedes cambiar la configuración u obtener más información en Política de cookies.
Hacemos 5

La wikipedia y el data scraping

En esta actividad se propone utilizar técnicas para capturar datos de páginas web, en este caso Wikipedia, así como la herramienta lnfogr.am para crear gráficos de forma rápida y sencilla, a fin de redactar después una noticia corta a partir de ellos.

Para esta práctica se necesita una cuenta de Gmail.

¡Que los datos te acompañen!

Paso 1

Buscar información sobre un tema en Wikipedia

Como ejemplo, para analizar la evolución de la serie Lost, os proponemos hacer la prueba de importar la tabla de evolución de las audiencias de la serie a partir de su entrada en Wikipedia:

https://es.wikipedia.org/wiki/Lost

Paso 2

Extraer los datos en una hoja de cálculo de Google

Ahora vamos a usar el data scrapping, una técnica que sirve para obtener los datos de una página web y poder trabajar con ellos: cruzarlos, analizarlos, visualizarlos...

Abre una hoja de cálculo de Google

Añade en el apartado de fórmula: =IMPORTHTML("https://es.wikipedia.org/wiki/Lost";"table" ;3)

Explicación de la fórmula utilizada: IMPORTHTML("URL";"TABLE O LIST";NUMERO)

  • IMPORTHTML – Importar desde página web
  • URL – Dirección del sitio web, ejemplo: https://es.wikipedia.org/wiki/Lost
  • TABLE O LIST – Escribe LIST si quieres extraer una lista o TABLE si quieres extraer una tabla.
  • NÚMERO - Indica el número de orden en que se encuentra la lista o la tabla dentro de la página web que quieres importar (En este caso es la tercera tabla)
Paso 3

Crear un gráfico en Infogr.am

Haz clic en este link para poder crear el gráfico: https://infogr.am/

Haz clic en el gráfico que quieres crear.

Paso 4

Redactar un titular que resuma el gráfico

Nada de titulares largos, tediosos o rimbombantes. Sé breve, directo y conciso.

Paso 5

Plantear hipótesis para explicar los hechos

  • Empezaron otras series de éxito
  • La trama perdió interés
  • Los actores populares dejaron la serie
Paso 6

Redactar una breve noticia.

Recuerda que, para redactar la noticia, debes citar las páginas y autores en los que te basas.

5

fin del bloque 5

¡Felicidades!

Has finalizado con éxito el bloque 5.
Puedes seguir con otro bloque para aprender más sobre big data.

Descubrir más bloques