COMBINAR o ANEXAR Consultas en Power Query

Combinar consultas es básico en la preparación de datos. Hay dos tipos de combinación, pero entenderlos no es sencillo si estás empezando.

La unión de tablas es una operación básica y muy utilizada en el análisis de datos y en Power BI. Los conjuntos de datos no siempre están preparados para trabajar con ellos y a veces es más sencillo combinar consultas que realizar numerosas transformaciones (como vimos en el artículo Limpieza de datos en Power BI, este sería el método de Traducción). Otras veces nos encontramos con conjuntos de datos que proceden de orígenes distintos, y para trabajar con ellos a la vez es necesario juntarlos en una misma consulta.

Power BI permite dos tipos de uniones: Combinar (merge) o anexar (append). Son dos operaciones distintas que, aunque se apliquen a las mismas tablas, dan resultados distintos, cada una tiene su utilidad. Entender las diferencias entre ambas operaciones es sencillo en analistas experimentados, pero para aquellos que estén dando sus primeros pasos puede causar confusión.

Anexar

La operación de anexar dos tablas, o append en inglés, es bastante simple. Consiste en pegar una a continuación de otra. Se entiende mejor si se dice una debajo de otra, ya que el resultado es una tabla cuyo número de filas es igual a la suma de las filas de las dos tablas.
¿Y qué pasa con las columnas?

En cuanto a las columnas se pueden dar dos casos: coinciden o no, es decir, se llaman igual o no. Si dos tablas tienen columnas que tienen el mismo nombre, en la nueva tabla que se forme, habrá una columna con ese nombre y los valores de las dos tablas en sus filas correspondientes. Si hay columnas que no se llaman igual, aprecerán igualmente, pero en las filas que pertenecerían a la tabla en la que no se encuentra esa columna, aprecerán celdas vacías.

Se entiende mejor mediante un ejemplo:

Queremos anexar las siguientes tablas.

Para juntarlas es una misma tabla, abrimos el editor de Power Query, y seleccionamos Anexar consultas.

Tenemos la opción de anexar dos tablas, o tres o más. Las tablas que elijamos se añadirán a la que tengamos seleccionada, modificándola. Si queremos consvervar la tabla original, podemos pinchar en la flecha y elegir la opción Anexar consultas para crear una nueva.

El resultado es una tabla en la que aparecen todas las filas, con valores en las columnas comunes [País] y [Población], y en [Capital], que solo aparecía en la segunda tabla, la mitad de los valores son null, ya que esa columna no existía en la primera tabla.

No es necesario que las columnas con el mismo nombre contengan además el mismo tipo de dato. Por ejemplo, si una contiene texto y otra fechas, se siguen uniendo en una única columna. Esta y otras consideraciones extra se explican en los cursos de Power BI de Bisnia, y en los vídeos de nuestro canal de You Tube.

Combinar

Esta operación es algo más complicada que la anterior. Combinar, o merge en inglés, supone fusionar dos tablas, atendiendo a unos criterios determinados. En esta operación sólo se pueden combinar dos tablas a la vez, no más.

Para realizar esta operación, se deben seleccionar dos tablas, una columna coincidente en cada una, que debería tener valores comunes, y un tipo de combinación. El resultado es una tabla cuyo número de filas depende del tipo de combinación escogido, y el número de columnas depende de las columnas de la segunda tabla que queramos añadir, ya que de la primera aparecerán todas.

Nuevamente ponemos un ejemplo:

Esta vez queremos combinar estas tablas.

Ambas tienen una columna coincidente, [País], y cada una de ellas una columna propia, de forma que queremos que aparezca la información de la columna [Capital] en la primera tabla.

En la primera tabla tenemos menos países de los que salen en la segunda, por lo que, dependiendo del tipo de combinación, saldrán unos u otros.

Seleccionamos Combinar consultas.

Tenemos la opción de realizar la modificación sobre la tabla que tengamos seleccionada o crear una nueva. Una vez seleccionemos una opción nos aparecerá la siguiente ventana.

En ella, seleccionamos las tablas que queremos combinar, las columnas coincidentes, [País] en este caso, y el tipo de combinación. El tipo de combinación por defecto es externa izquierda, que significa que el resultado contiene todas las filas de la primera tabla, y solo aquellas de la segunda que tengan valores comunes a la primera tabla en su columna coincidente, que en este caso serían Indonesia, Pakistán y Brasil, dejando fuera las filas que contiene el resto de países.

Al aceptar, nos aparecerá una tabla con una columna adicional, que contiene registros con todas las columnas de la segunda tabla. Si pulsamos en el icono de las dos flechas, tendremos la opción de elegir si queremos expandir esa columna, con las columnas que elijamos, y si queremos realizar algún tipo de agrupación.

Este es el resultado que aparece si elegimos expandir solamente con la columna capital. Se han mantenido las filas de la tabla original, y se ha añadido la información coincidente.

Las posibilidades de esta operación son muy numerosas. Uno de los factores a tener en cuenta es el tipo de combinación. En las siguientes figuras se puede ver de un vistazo en qué consistirían todas.

Las partes resaltadas indicarían qué elementos de cada tabla permanecerían en el resultado final. En el ejemplo, usamos el tipo externa izquierda, que ya viene marcado por defecto. Este tipo significa que permanecerán todas las filas de la primera tabla, y de la segunda, sólo aquellas que coincidan. Por eso no aparecen todos los países de la segunda tabla.

LEAVE REPLY

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *