Comment supprimer les doublons à l’aide de Power Query ?

Power Query vous permet de supprimer les doublons des données, comme dans Excel. Et dans ce didacticiel, nous apprendrons à supprimer les valeurs en double des données.

Étapes pour supprimer les doublons avec Power Query

Ci-dessous, vous avez une liste de noms où nous avons des noms en double, et maintenant vous devez utiliser PowerQuery pour supprimer ces valeurs en double.

supprimer les doublons à l'aide de power-query

Vous pouvez utiliser les étapes ci-dessous :

  1. Tout d’abord, sélectionnez les données, puis accédez à l’onglet Données > Obtenir et transformer des données > Obtenir des données > À partir d’autres sources > À partir d’une table/plage.
    get-data-from-table-range
  2. Après cela, cliquez sur OK pour convertir vos données en un tableau Excel (si ce n’est pas déjà un tableau Excel).
    convert-the-data-into-excel-table
  3. Maintenant, lorsque vous cliquez sur OK, il ouvre l’éditeur Power Query et y charge les données.
    load-the-data-into-power-query-editor
  4. Après cela, dans l’onglet Accueil, cliquez sur le menu déroulant « Supprimer les lignes », puis cliquez sur l’option « Supprimer les doublons ».
    choose-remove-duplicates-option

 

Lorsque vous cliquez dessus, il supprime les noms en double de la liste et vous laisse uniquement les noms uniques.

ne laisse-que-les-valeurs-uniques

Au-dessus, la barre d’état affiche le nombre de lignes avec des doublons et sans valeurs en double. Outre l’onglet « Accueil », vous pouvez cliquer avec le bouton droit sur l’en-tête de colonne et cliquer sur l’option « Supprimer les doublons ».

la barre d'état affiche le nombre de lignes avec et sans valeurs en double

C’est la même option que vous avez utilisée dans les étapes ci-dessus et fait exactement cela.

Suppression des doublons lorsque vous avez plusieurs colonnes

Si vous avez plusieurs colonnes de données, la requête avancée vous propose deux manières différentes de supprimer les valeurs en double.

Dans l’exemple ci-dessous, vous avez deux colonnes, des noms et des scores.

supprimer-les-doublons-lorsqu'ils-ont-plusieurs-colonnes

Maintenant, si vous souhaitez supprimer les doublons en considérant les doublons des deux colonnes, vous devez sélectionner les deux colonnes et utiliser l’option « Supprimer le doublon ».

sélectionner-les-deux-colonnes-et-cliquer-supprimer-les-colonnes-dupliquées

Et vous ne pouvez voir qu’une seule ligne en double lorsque nous la considérons en sélectionnant les deux colonnes.

Informations sur les valeurs en double

Dans Power Query, vous pouvez également modifier l’affichage des données pour obtenir le nombre de valeurs en double. Accédez à l’onglet Affichage > Répartition des colonnes.

informations sur les valeurs en double

Ci-dessus, vous pouvez voir combien de valeurs uniques et distinctes vous avez dans chaque colonne.

Conserver les valeurs en double

Il existe une option vous permettant de conserver les doublons et de supprimer les valeurs uniques. Onglet Accueil > Conserver les lignes > Conserver les doublons.

conserver les valeurs en double

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *