Pandas iterrows(): So gehst du DataFrames Zeile für Zeile durch

Inhaltsverzeichnis

Die Python-Pandas-Funktion DataFrame.iterrows() hilft dir dabei, durch die Zeilen eines Pandas DataFrames zu iterieren. Du erhältst pro Zeile ein Python Tuple, das aus dem Index und einer Series mit den Zeilendaten besteht.

Syntax von Pandas `iterrows()`

Die Anwendung von Pandas DataFrame.iterrows() ist unkompliziert, da die Funktion keine Parameter benötigt:

df.iterrows()

python

Im Beispiel oben steht df für den DataFrame, den du durchlaufen möchtest.

Anwendung der Pandas-`iterrows()`-Funktion

Nutze die Funktion DataFrame.iterrows() immer dann, wenn du Daten zeilenweise bearbeiten willst. Meistens geschieht dies in Kombination mit Python-for-Loops.

Werte einer Spalte addieren

Schauen wir uns einen DataFrame mit den Spalten Name, Alter und Punktzahl an:

import pandas as pd
# Beispiel-DataFrame erstellen
data = {'Name': ['Anna', 'Ben', 'Clara'],
    'Alter': [23, 35, 29],
    'Punktzahl': [88, 92, 85]}
df = pd.DataFrame(data)
print(df)

python

Dieser Code erzeugt folgenden DataFrame:

Name  Alter  Punktzahl
0   Anna     23         88
1    Ben     35         92
2  Clara     29         85

Um die Summe der Punktzahlen zu ermitteln, kannst du Pandas DataFrame.iterrows() verwenden:

# Summe der Punktzahlen berechnen
total_score = 0
for index, row in df.iterrows():
    total_score += row['Punktzahl']
print(f"Die Gesamtsumme der Punktzahlen beträgt: {total_score}")

python

Hier nutzt du die Pandas-iterrows()-Funktion, um durch die Zeilen zu gehen und die Werte der Spalte Punktzahl Schritt für Schritt zu addieren. So sieht das Resultat aus:

Die Gesamtsumme der Punktzahlen beträgt: 265

Hinweis

Achte bei der Arbeit mit Pandas iterrows() darauf, die Daten während der Iteration nicht direkt zu ändern. Das führt oft nicht zum gewünschten Ergebnis und kann Fehler verursachen.

Zeilen nach Bedingungen bearbeiten

Mit iterrows() kannst du auch Bedingungen auf einzelne Zeilen anwenden. Angenommen, du möchtest aus dem DataFrame alle Namen herausfiltern, die über 30 Jahre alt sind:

# Namen von Personen abrufen, die älter als 30 sind
names = []
for index, row in df.iterrows():
    if row['Alter'] > 30:
        names.append(row['Name'])
print(f"Personen älter als 30 Jahre: {names}")

python

Hier wird mittels Pandas DataFrame.iterrows() der Datensatz durchlaufen. In der for-Schleife prüfen wir das Alter und speichern nur passende Namen in der Python-Liste names. Dafür kommt die Python-append()-Funktion zum Einsatz. Das Ergebnis:

Personen älter als 30 Jahre: ['Ben']

Hinweis

Pandas DataFrames.iterrows() ist zwar intuitiv, bei sehr großen DataFrames aber oft weniger effizient. In solchen Fällen fährst du mit Alternativen wie apply() oder vektorisierten Operationen meist besser.

Pandas DataFrame: Tabellen in Python effizient und strukturiert bearbeiten!

Pandas ist dein Kraftpaket für die moderne Datenverarbeitung mit Python. Die wichtigste Basis dafür sind DataFrames, mit denen du strukturierte Infos effizient und übersichtlich im Griff hast. Wir zeigen dir mit einfachen Code-Beispielen, wie die Datenstruktur aufgebaut ist und…

Mr. Kosalshutterstock

So nutzt du Pandas any() richtig

Mit der Pandas-Methode `any()` prüfst du blitzschnell, ob in deinem DataFrame auf der gewählten Achse zumindest ein True-Wert vorkommt. Das Tool ist beim Analysieren und Validieren deiner Daten ein echtes Ass im Ärmel. Wir erklären dir, wie du die Funktion gezielt anwendest und…

UndreyShutterstock

Python Pandas: Datenzugriff mit iloc[]

Analysierst du Daten in Python Pandas, ist oft nur ein Teil deines DataFrames wirklich relevant. Mit der Eigenschaft iloc[] hast du das ideale Werkzeug parat, um Zeilen oder Spalten ganz einfach über ihre Indizes herauszufiltern. Erfahre hier, wie du diese Funktion effizient für…

REDPIXEL.PLShutterstock

Pandas mean(): Mittelwerte ganz unkompliziert berechnen

Die Methode Pandas DataFrame.mean() ermittelt effizient Mittelwerte in deinen Datensätzen. Sie geht souverän mit NaN-Werten um und berechnet Durchschnitte für Zeilen sowie Spalten. In diesem Guide erfährst du, welche Parameter entscheidend sind, damit bei deiner Datenverarbeitung…

UndreyShutterstock

Pandas-DataFrames mit merge() effizient zusammenführen

Mit der merge()-Funktion von Pandas bündelst du als Programmierer:in flexibel Daten aus unterschiedlichsten Quellen. Nutze die Parameter gezielt für diverse Joins, um deine Analysen auf das nächste Level zu heben. Wir zeigen dir in diesem Guide, wie du merge() richtig einsetzt,…

Pandas iterrows(): So gehst du Da­ta­Frames Zeile für Zeile durch

Syntax von Pandas iterrows()

Anwendung der Pandas-iterrows()-Funktion

Werte einer Spalte addieren

Zeilen nach Be­din­gun­gen be­ar­bei­ten

Pandas iterrows(): So gehst du DataFrames Zeile für Zeile durch

Syntax von Pandas `iterrows()`

Anwendung der Pandas-`iterrows()`-Funktion

Zeilen nach Bedingungen bearbeiten