Wie entferne ich duplikate mit power query?

Mit Power Query können Sie Duplikate aus Daten entfernen, genau wie in Excel. Und in diesem Tutorial erfahren Sie, wie Sie doppelte Werte aus Daten entfernen.

Schritte zum Entfernen von Duplikaten mit Power Query

Unten finden Sie eine Liste mit Namen, bei denen wir doppelte Namen haben. Jetzt müssen Sie PowerQuery verwenden, um diese doppelten Werte zu entfernen.

Entfernen Sie Duplikate mithilfe der Power-Abfrage

Sie können die folgenden Schritte ausführen:

  1. Wählen Sie zunächst die Daten aus und gehen Sie dann zur Registerkarte „Daten“ > „Daten abrufen und transformieren“ > „Daten abrufen“ > „Aus anderen Quellen“ > „Aus Tabelle/Bereich“.
    get-data-from-table-range
  2. Klicken Sie anschließend auf OK, um Ihre Daten in eine Excel-Tabelle zu konvertieren (sofern es sich noch nicht um eine Excel-Tabelle handelt).
    convert-the-data-into-excel-table
  3. Wenn Sie nun auf „OK“ klicken, wird der Power Query-Editor geöffnet und die Daten werden dort geladen.
    load-the-data-into-power-query-editor
  4. Klicken Sie anschließend auf der Registerkarte „Startseite“ auf das Dropdown-Menü „Zeilen löschen“ und dann auf die Option „Duplikate entfernen“.
    choose-remove-duplicates-option

Wenn Sie darauf klicken, werden doppelte Namen aus der Liste entfernt und Sie haben nur noch eindeutige Namen.

Belassen Sie nur die eindeutigen Werte

Oben zeigt die Statusleiste die Anzahl der Zeilen mit Duplikaten und ohne Duplikatwerte an. Neben der Registerkarte „Startseite“ können Sie auch mit der rechten Maustaste auf die Spaltenüberschrift klicken und auf die Option „Duplikate entfernen“ klicken.

Die Statusleiste zeigt die Anzahl der Zeilen mit und ohne doppelte Werte an

Dies ist dieselbe Option, die Sie in den obigen Schritten verwendet haben, und genau das bewirkt sie.

Entfernen von Duplikaten, wenn Sie mehrere Spalten haben

Wenn Sie über mehrere Datenspalten verfügen, bietet Ihnen Advanced Query zwei verschiedene Möglichkeiten, doppelte Werte zu entfernen.

Im folgenden Beispiel haben Sie zwei Spalten, Namen und Bewertungen.

Duplikate entfernen, wenn sie mehrere Spalten haben

Wenn Sie nun Duplikate entfernen möchten, indem Sie Duplikate beider Spalten berücksichtigen, müssen Sie beide Spalten auswählen und die Option „Duplikat entfernen“ verwenden.

Wählen Sie beide Spalten aus und klicken Sie auf „Doppelte Spalten löschen“.

Und Sie können nur eine doppelte Zeile sehen, wenn wir sie durch Auswahl von Spalten betrachten.

Informationen zu doppelten Werten

In Power Query können Sie auch die Datenanzeige ändern, um die Anzahl der doppelten Werte zu erhalten. Gehen Sie zur Registerkarte „Ansicht“ > „Spaltenaufschlüsselung“.

Informationen zu doppelten Werten

Oben können Sie sehen, wie viele eindeutige und unterschiedliche Werte Sie in jeder Spalte haben.

Behalten Sie doppelte Werte bei

Es gibt eine Option, mit der Sie Duplikate behalten und eindeutige Werte entfernen können. Registerkarte „Startseite“ > „Zeilen behalten“ > „Duplikate behalten“.

Behalten Sie doppelte Werte bei

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert