Pandas DataFrame.loc[] ist ein prak­ti­sches Feature der Python-Pandas-Bi­blio­thek. Damit wählst du Daten aus einem DataFrame ganz einfach über Be­zeich­ner (Labels) aus. So lassen sich Zeilen und Spalten gezielt für deine Projekte ex­tra­hie­ren.

Die Syntax von Pandas loc[]

Du übergibst loc[] lediglich die ge­wünsch­te Auswahl der Labels als Parameter. Der Aufbau ist dabei denkbar simpel:

DataFrame.loc[selection]
python

Die Auswahl erfolgt bei Pandas loc[] primär über die Labels. Dabei kannst du ein einzelnes Label, eine Liste oder einen Bereich (Slice) von Labels angeben. Auch das Filtern über Boolesche Arrays ist möglich.

Un­ter­schie­de: loc[] vs. iloc[]

Während Pandas DataFrame.loc[] auf Labels setzt, nutzt du DataFrame.iloc, wenn du Daten anhand ihrer nu­me­ri­schen Position (Integer-basiert) an­spre­chen willst.

Das folgende Beispiel ver­deut­licht den Un­ter­schied. Zuerst erstellen wir einen Pandas DataFrame:

import pandas as pd
# Beispiel DataFrame
data = {'Name': ['Anna', 'Bob', 'Chris'], 'Alter': [23, 35, 30]}
df = pd.DataFrame(data)
print(df)
python

So sieht der erstellte DataFrame aus:

Name  Alter
0   Anna     23
1    Bob     35
2  Chris     30
Zum Hauptmenü