Pandas DataFrame[].unique(): Eindeutige Werte finden
Mit der unique()-Funktion in Python Pandas DataFrames ermittelst du blitzschnell die eindeutigen Werte innerhalb einer Spalte. So verschaffst du dir effizient einen Überblick über die Vielfalt deines Datensatzes.
Syntax von Pandas DataFrame[].unique()
Die Anwendung von Pandas unique() ist denkbar einfach, da die Funktion keine weiteren Parameter benötigt:
DataFrame['column_name'].unique()pythonWichtig ist, dass du bei Pandas DataFrames unique() immer auf eine ganz bestimmte Spalte anwendest. Diese musst du vorab festlegen. Die unique()-Funktion liefert dir ein numpy-Array mit den einzigartigen Werten zurück. Die Reihenfolge entspricht dabei dem ersten Auftreten im Datensatz; die Werte werden also nicht automatisch sortiert.
Falls du schon länger mit Python arbeitest, ist dir sicher das numpy-Pendant zur Pandas unique()-Funktion bekannt. Nutze jedoch lieber die Pandas-Variante, da diese performanter arbeitet.
So nutzt du Pandas unique()
Bei Pandas DataFrames kommt unique() zum Einsatz, sobald du eine Spalte ausgewählt hast, die du nach Unikaten durchsuchen möchtest.
Im nächsten Beispiel schauen wir uns einen DataFrame mit Personendaten an.
import pandas as pd
# Erstellen eines Beispiel-DataFrames
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
'Alter': [24, 27, 22, 32, 29],
'Stadt': ['New York', 'Los Angeles', 'New York', 'Chicago', 'Los Angeles']
}
df = pd.DataFrame(data)
print(df)pythonDieser DataFrame ist wie folgt aufgebaut:
Name Alter Stadt
0 Alice 24 New York
1 Bob 27 Los Angeles
2 Charlie 22 New York
3 David 32 Chicago
4 Edward 29 Los AngelesJetzt möchten wir wissen, in welchen Städten die Personen wohnen. Dabei soll jede Stadt nur einmal in der Liste auftauchen. Wir wenden die Pandas unique()-Funktion direkt auf der Spalte mit den Stadtnamen an:
# Eindeutige Städte finden
unique_cities = df['Stadt'].unique()
print(unique_cities)pythonDas Ergebnis ist ein numpy-Array, das jede Stadt exakt einmal listet. Du siehst sofort: Die Personen wohnen in New York, Los Angeles und Chicago.
['New York' 'Los Angeles' 'Chicago']