Comment supprimer les doublons à l’aide de Power Query ?
Power Query vous permet de supprimer les doublons des données, comme dans Excel. Et dans ce didacticiel, nous apprendrons à supprimer les valeurs en double des données.
Étapes pour supprimer les doublons avec Power Query
Ci-dessous, vous avez une liste de noms où nous avons des noms en double, et maintenant vous devez utiliser PowerQuery pour supprimer ces valeurs en double.
Vous pouvez utiliser les étapes ci-dessous :
- Tout d’abord, sélectionnez les données, puis accédez à l’onglet Données > Obtenir et transformer des données > Obtenir des données > À partir d’autres sources > À partir d’une table/plage.
- Après cela, cliquez sur OK pour convertir vos données en un tableau Excel (si ce n’est pas déjà un tableau Excel).
- Maintenant, lorsque vous cliquez sur OK, il ouvre l’éditeur Power Query et y charge les données.
- Après cela, dans l’onglet Accueil, cliquez sur le menu déroulant « Supprimer les lignes », puis cliquez sur l’option « Supprimer les doublons ».
Lorsque vous cliquez dessus, il supprime les noms en double de la liste et vous laisse uniquement les noms uniques.
Au-dessus, la barre d’état affiche le nombre de lignes avec des doublons et sans valeurs en double. Outre l’onglet « Accueil », vous pouvez cliquer avec le bouton droit sur l’en-tête de colonne et cliquer sur l’option « Supprimer les doublons ».
C’est la même option que vous avez utilisée dans les étapes ci-dessus et fait exactement cela.
Suppression des doublons lorsque vous avez plusieurs colonnes
Si vous avez plusieurs colonnes de données, la requête avancée vous propose deux manières différentes de supprimer les valeurs en double.
Dans l’exemple ci-dessous, vous avez deux colonnes, des noms et des scores.
Maintenant, si vous souhaitez supprimer les doublons en considérant les doublons des deux colonnes, vous devez sélectionner les deux colonnes et utiliser l’option « Supprimer le doublon ».
Et vous ne pouvez voir qu’une seule ligne en double lorsque nous la considérons en sélectionnant les deux colonnes.
Informations sur les valeurs en double
Dans Power Query, vous pouvez également modifier l’affichage des données pour obtenir le nombre de valeurs en double. Accédez à l’onglet Affichage > Répartition des colonnes.
Ci-dessus, vous pouvez voir combien de valeurs uniques et distinctes vous avez dans chaque colonne.
Conserver les valeurs en double
Il existe une option vous permettant de conserver les doublons et de supprimer les valeurs uniques. Onglet Accueil > Conserver les lignes > Conserver les doublons.