Mit der unique()-Funktion in Python Pandas Da­ta­Frames er­mit­telst du blitz­schnell die ein­deu­ti­gen Werte innerhalb einer Spalte. So ver­schaffst du dir effizient einen Überblick über die Vielfalt deines Da­ten­sat­zes.

Syntax von Pandas DataFrame[].unique()

Die Anwendung von Pandas unique() ist denkbar einfach, da die Funktion keine weiteren Parameter benötigt:

DataFrame['column_name'].unique()
python

Wichtig ist, dass du bei Pandas Da­ta­Frames unique() immer auf eine ganz bestimmte Spalte anwendest. Diese musst du vorab festlegen. Die unique()-Funktion liefert dir ein numpy-Array mit den ein­zig­ar­ti­gen Werten zurück. Die Rei­hen­fol­ge ent­spricht dabei dem ersten Auftreten im Datensatz; die Werte werden also nicht au­to­ma­tisch sortiert.

Hinweis

Falls du schon länger mit Python arbeitest, ist dir sicher das numpy-Pendant zur Pandas unique()-Funktion bekannt. Nutze jedoch lieber die Pandas-Variante, da diese per­for­man­ter arbeitet.

So nutzt du Pandas unique()

Bei Pandas Da­ta­Frames kommt unique() zum Einsatz, sobald du eine Spalte aus­ge­wählt hast, die du nach Unikaten durch­su­chen möchtest.

Im nächsten Beispiel schauen wir uns einen DataFrame mit Per­so­nen­da­ten an.

import pandas as pd
# Erstellen eines Beispiel-DataFrames
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
    'Alter': [24, 27, 22, 32, 29],
    'Stadt': ['New York', 'Los Angeles', 'New York', 'Chicago', 'Los Angeles']
}
df = pd.DataFrame(data)
print(df)
python

Dieser DataFrame ist wie folgt aufgebaut:

Name  Alter      Stadt
0    Alice     24     New York
1    Bob     27  Los Angeles
2  Charlie     22     New York
3    David     32    Chicago
4   Edward     29  Los Angeles

Jetzt möchten wir wissen, in welchen Städten die Personen wohnen. Dabei soll jede Stadt nur einmal in der Liste auf­tau­chen. Wir wenden die Pandas unique()-Funktion direkt auf der Spalte mit den Stadt­na­men an:

# Eindeutige Städte finden
unique_cities = df['Stadt'].unique()
print(unique_cities)
python

Das Ergebnis ist ein numpy-Array, das jede Stadt exakt einmal listet. Du siehst sofort: Die Personen wohnen in New York, Los Angeles und Chicago.

['New York' 'Los Angeles' 'Chicago']
Zum Hauptmenü