Introducción a Power Query

Primeros pasos

Power Query es una tecnología de extracción, transformación y carga de datos. Está incluido en Power BI, así como en Excel, y permite conectar un archivo con varios tipos de fuentes de datos (archivos Excel, CSV, JSON, bases de datos como SQL, Access o Azure o servicios web).

Para la transformación de los datos, Power Query cuenta con una interfaz gráfica de usuario, además de un lenguaje de programación propio llamado M. La interfaz gráfica es bastante completa e intuitiva, y permite realizar muchos tipos de transformaciones, pero si se quiere realizar operaciones más complejas, habrá que programarlas en M.

Si abrimos el editor de Power Query, podemos ver tres ventanas distintas:

  • Queries: en ella aparecerán todas las tablas que hayamos cargado. Además, aquí aparecerán las funciones que hayamos definido, las listas y los registros.
  • Ventana principal: en ella veremos la tabla con la que estemos trabajando. Podemos interactuar con ella directamente desde esta ventana para sustituir valores, cambiar los tipos o eliminar columnas.
  • QUERY SETTINGS > APPLIED STEPS: en esta ventana aparecerán por orden las operaciones o pasos que hayamos aplicado a nuestra tabla, de forma que podamos modificarlos, introducir nuevos, o ver el resultado de pasos anteriores.

La interfaz gráfica dispone de una serie de operaciones para la obtención y transformación de datos bastante completa, además mediante la interfaz podemos acceder al editor avanzado con el que programar las consultas en M. A continuación, seguiremos con el ejemplo del artículo anterior (Power BI Desktop), de forma que veamos algunas de estas características.

Trabajando con Power Query

En el artículo anterior, realizamos una serie de modificaciones muy básicas sobre una tabla que habíamos cargado previamente. Estas modificaciones pueden verse en la ventana APPLIED STEPS: Removed Top Rows y Removed Other Columns. Las tres primeras se realizan automáticamente al extraer la tabla de Wikipedia.

A continuación, depuraremos los datos para trabajar más fácilmente con ellos. Primero, eliminaremos el punto final de la columna Nº. Haciendo clic sobre el nombre de la columna y a continuación Replace Values. Escribiremos un punto (.) en el primer recuadro, y dejaremos vacío el segundo. Esto hará que se eliminen los puntos. Si nos fijamos, en el encabezado de la columna, junto a su nombre, aparecen las letras ABC. Significa que los datos que contiene la columna son de tipo texto. Si lo dejamos así, tendremos problemas sí queremos usar esos valores como números. Para cambiar el tipo haremos clic derecho de nuevo sobre el nombre de la columna y seleccionaremos Change Type > Whole Number.

Vamos a modificar la columna Ingresos. En esta ocasión hay que eliminar el símbolo del dólar, lo haremos igual que antes, sustituyendo $ por nada. Tras esta operación hay un valor que empieza por US, lo eliminaremos de la misma forma. Como vemos, algunos valores utilizan como separador decimal el punto y otros la coma. Esta vez vamos a sustituir las comas por puntos. Antes de cambiar el tipo, nos quedaremos con la parte entera de los ingresos. Para ello, seleccionaremos en la pestaña Transform la opción Text Before Delimiter del botón Extract, con la columna Ingresos seleccionada, y en la ventana que aparece, escribiremos el punto. Tras esto, ya se puede cambiar el tipo a Whole Number.

Por último, nos interesaría poder extraer el país de la columna sede de alguna manera. Hay una dificultad añadida, ya que unos valores son del tipo Ciudad-País, y otros Ciudad-Provincia/Estado-País. Si todos tuvieran el mismo nivel de detalle, sería tan simple como seleccionar Extract > Text After Delimiter, pero en este caso corremos el riesgo de quedarnos con la parte Provincia/Estado de algunos valores. Si miramos bien la ventana que sale al elegir esta opción, vemos que hay un apartado de opciones avanzadas, en la que podemos configurar desde dónde empezar a buscar el delimitador, si desde el principio, o desde el final. Elegimos desde el principio, y ya nos aparecen los países.

Al extraer lo que había después de la coma, los valores que hemos obtenido empiezan con un espacio que, aunque en principio no molesta, conviene eliminarlo. Hay varias formas de eliminarlo, una de ellas es seleccionar de nuevo la opción Extract > Text After Delimiter y escribir un espacio como delimitador.

Tras este paso, nuestros datos ya estarían perfectamente depurados y organizados para cargarlos en nuestro modelo, haciendo clic en Close & Apply, y realizar un informe más completo que el realizado en el artículo anterior.

DEJA UNA RESPUESTA

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *