Die DataFrame.mean()-Funktion in Python Pandas ist dein Werkzeug zur Be­rech­nung des Mit­tel­werts über ver­schie­de­ne Achsen eines Da­ta­Frames. Mit Pandas mean() ana­ly­sierst du nu­me­ri­sche Daten effizient und erhältst sofort klare Einblicke in deren Ver­tei­lung.

Syntax von Pandas DataFrame.mean()

Die Anwendung der Pandas-mean()-Funktion ist un­kom­pli­ziert und arbeitet mit bis zu drei Pa­ra­me­tern:

DataFrame.mean(axis=None, skipna=True, numeric_only=None)
python

Relevante Parameter

Passe Pandas DataFrame.mean() mit diesen Pa­ra­me­tern einfach an dein Projekt an:

Parameter Be­schrei­bung Stan­dard­wert
axis Legt fest, ob die Be­rech­nung über Zeilen (axis=0) oder Spalten (axis=1) erfolgt. 0
skipna Bei True werden NaN-Werte in der Analyse ignoriert. True
numeric_only Bei True fließen nur nu­me­ri­sche Da­ten­ty­pen in das Ergebnis ein. False

So nutzt du die Pandas mean()-Funktion

Es gibt ver­schie­de­ne Wege, wie du Pandas DataFrame.mean() sinnvoll einsetzen kannst.

Mit­tel­wer­te für jede Spalte ermitteln

Für die folgenden Beispiele nutzen wir einen Pandas-DataFrame mit diesen Testdaten:

import pandas as pd
data = {
    'A': [1, 2, 3, 4],
    'B': [4, 5, 6, 7],
    'C': [7, 8, 9, 10]
}
df = pd.DataFrame(data)
print(df)
python

Daraus ergibt sich dieser DataFrame:

A  B    C
0  1  4    7
1  2  5    8
2  3  6    9
3  4  7  10

Willst du den Durch­schnitt pro Spalte wissen, nutzt du die Pandas-mean()-Funktion einfach mit dem Stan­dard­wert axis=0:

column_means = df.mean()
print(column_means)
python

Hierbei werden die Werte der Spalten A, B und C summiert und durch die Anzahl der Einträge dividiert. Das Ergebnis erhältst du als Pandas Series:

A    2.5
B    5.5
C    8.5
dtype: float64

Durch­schnitts­wer­te pro Zeile berechnen

Möchtest du statt­des­sen den Schnitt für jede Zeile berechnen, setzt du den Parameter axis auf 1:

row_means = df.mean(axis=1)
print(row_means)
python

Durch Pandas mean() wird für jede Zeile die Summe der Elemente durch deren Anzahl geteilt. Der Output sieht dann so aus:

0    4.0
1    5.0
2    6.0
3    7.0
dtype: float64

Umgang mit NaN-Werten

In diesem Beispiel arbeiten wir mit einem DataFrame, der fehlende Werte (NaN) enthält:

import pandas as pd
import numpy as np
data = {
    'A': [1, 2, np.nan, 4],
    'B': [4, np.nan, 6, 7],
    'C': [7, 8, 9, np.nan]
}
df = pd.DataFrame(data)
print(df)
python

Daraus entsteht folgender DataFrame:

A    B    C
0  1.0  4.0  7.0
1  2.0  NaN  8.0
2  NaN  6.0  9.0
3  4.0  7.0  NaN

Mit dem Parameter skipna steuerst du, wie mit Lücken um­ge­gan­gen wird. Stan­dard­mä­ßig ist dieser auf True ein­ge­stellt, wodurch Pandas mean() diese Werte einfach auslässt. Würdest du hier skipna=False wählen, wäre das Ergebnis für jede Spalte mit einer Lücke ebenfalls NaN.

mean_with_nan = df.mean()
print(mean_with_nan)
python

Das Ergebnis der Abfrage mit Pandas mean() lautet:

A    2.333333
B    5.666667
C    8.000000
dtype: float64
Zum Hauptmenü