Extraer datos desde una página web

como extraer datos pagina web

En Power BI se pueden obtener datos de muchas fuentes distintas: archivos, bases de datos, e incluso desde páginas web. Esta última característica permite importar datos que se encuentren alojados en una página web y realizar un informe en base a estos datos.

La conexión que establece Power BI con una dirección web permite una autenticación básica (usuario y contraseña), pero si nuestros datos se encuentran en una web que necesita autenticación, es probable que no podamos acceder a ellos.

La importación de datos desde una página web presenta otro problema, y es que, a veces, los datos no se nos presentan de forma estructurada, si no que se encuentran en varios puntos de una misma página. En este artículo veremos cómo importar datos desde una página web, tanto si están estructurados en tablas como si no.

Importar tablas desde una página web

Para este ejemplo, vamos a importar los datos sobre las selecciones ganadoras del mundial de fútbol. Extraeremos los datos de una tabla de Wikipedia:

Para importar esta tabla en nuestro archivo, abriremos el desplegable Get Data y seleccionaremos Web. Inmediatamente, se abrirá una ventana en la que debemos escribir la URL de la página en la que se encuentran nuestros datos.

Al hacer clic en OK, Power BI navegará por la página que le indicamos y nos mostrará una ventana con toda la información que encuentre. Seleccionando cada opción, podemos ir viendo una previsualización de las tablas. Para cargar la tabla que nos interesa, seleccionaremos Campeonatos, y haremos clic en Load.

Una vez se haya cargado la tabla, podremos realizar las modificaciones que sean necesarias y crear informes en base a estos datos.

Importar datos no estructurados

A menudo, los datos que nos interesan de cierta página web no se encuentran ordenados en tablas, pero los queremos estructurar de esta forma para trabajar con ellos. Podríamos crearnos nosotros mismos las tablas, pero sería algo tedioso si se trata de tablas de cientos de filas. Power BI nos ofrece una alternativa, que es añadir tablas usando ejemplos.

Vamos a crear una tabla con información de los vuelos de Madrid a Barcelona. Para ello, hemos realizado una búsqueda en Google de esos vuelos, con estos resultados:

Al introducir la URL que obtenemos para obtener estos datos, Power BI no detecta ningún tipo de información en la ventana que nos muestra. Pero le podemos enseñar qué es lo que queremos pulsando el botón Add table using examples.

Al seleccionar esta opción, se no mostrará una ventana con dos partes. En una veremos la página web, y debajo, una tabla vacía. En esta tabla iremos escribiendo la información que queremos de la web, las columnas que queremos, y los valores que queremos en esas columnas. Al escribir dos o tres valores, Power BI entenderá qué es lo que queremos, y completará automáticamente el resto de la tabla.

En este caso, solo ha sido necesario escribir dos valores en la primera columna, y uno en el resto. Al hacer clic en OK, volverá aparecer la ventana anterior, pero esta vez con la tabla que acabamos de crear mediante ejemplos. Cuando carguemos la tabla, podremos editarla en Power Query como cualquier otro tipo de tabla y crear un informe con ella.

¿Te ha sido útil este artículo? Deja tu opinión en los comentarios.

 

También te puede interesar:

COMENTARIOS

  1. Muy interesante

DEJA UNA RESPUESTA

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *