Python Pandas read_csv() zählt zu den be­währ­tes­ten Lösungen, um Daten effizient aus CSV-Dateien zu im­por­tie­ren und als DataFrame zu or­ga­ni­sie­ren. Da CSV-Dateien (Comma-separated Values) ein Stan­dard­for­mat für ta­bel­la­ri­sche Daten sind, werden sie von nahezu allen An­wen­dun­gen un­ter­stützt.

Die Syntax von Python Pandas read_csv()

Mit der Funktion pandas.read_csv() erstellst du einen Pandas DataFrame direkt aus einer CSV-Datei. Dir stehen dabei zahl­rei­che Parameter zur Verfügung, um den Import präzise zu steuern. Hier kon­zen­trie­ren wir uns auf die wich­tigs­ten Argumente für deinen Alltag. Details zu allen Optionen findest du in der of­fi­zi­el­len Pandas-Do­ku­men­ta­ti­on.

Der Basis-Aufbau der Funktion ist intuitiv:

import pandas as pd
df = pd.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, usecols=None, dtype=None, ...)
python

Wichtige Parameter im Überblick

Hier siehst du die re­le­van­tes­ten Stell­schrau­ben für deinen Da­ten­im­port:

Parameter Nutzen Stan­dard­wert
filepath_or_buffer Ein Python-String mit dem Dateipfad oder eine Quelle wie eine URL.
sep Bestimmt das Zeichen, das die einzelnen Werte von­ein­an­der trennt. ,
header Definiert, welche Zeile als Ta­bel­len­kopf (Header) dient. infer (Zeile 1)
names Falls kein Header vorhanden ist, kannst du hier eine Python-Liste mit Spal­ten­na­men übergeben.
index_col Legt fest, welche Spalte als Index der Tabelle fungiert. None
usecols Wähle gezielt aus, welche Spalten du in den DataFrame laden möchtest. None
dtype Gibt den Datentyp für die einzelnen Spalten vor. None

Anleitung: So greifst du auf CSV-Dateien zu

Dank pandas.read_csv() bringst du deine CSV-Daten in wenigen Au­gen­bli­cken direkt nach Python.

Für unsere Beispiele nutzen wir eine CSV-Datei mit folgendem Aufbau:

1,Max Mustermann,35,Berlin,50000
2,Anna Müller,29,Hamburg,62000
3,Peter Schmidt,41,München,58000
4,Lisa Meier,33,Köln,49000
5,Tom Becker,28,Frankfurt,52000

Schritt 1: Pandas einbinden

Zuerst im­por­tierst du die Pandas-Bi­blio­thek in dein aktuelles Skript.

import pandas as pd
python

Schritt 2: CSV-Daten einlesen

Lade deine Datei nun mit der Funktion read_csv(). Gib dazu einfach den Pfad zur Datei an. In diesem Beispiel nutzen wir die Datei daten.csv, die im selben Ordner wie dein Skript liegt:

df = pd.read_csv('daten.csv')
python

Der Befehl speichert die Daten im Objekt df, bereit zur weiteren Analyse. Stan­dard­mä­ßig nutzt pandas die erste Zeile als Spal­ten­na­men, sofern du nichts anderes de­fi­nierst.

Schritt 3: Daten kon­trol­lie­ren

Prüfe kurz, ob alles glatt gelaufen ist, indem du dir die ersten Zeilen des Da­ta­Frames ausgibst. Die Funktion DataFrame.head() zeigt dir stan­dard­mä­ßig die ersten fünf Einträge und liefert dir einen schnellen Überblick über deine Da­ten­struk­tur:

print(df.head())
python

So sieht das Ergebnis aus:

0   1  Max Mustermann     35     Berlin   50000
1   2     Anna Müller     29    Hamburg   62000
2   3   Peter Schmidt     41    München   58000
3   4      Lisa Meier     33       Köln   49000
4   5      Tom Becker     28  Frankfurt   52000

Schritt 4: Spal­ten­na­men anpassen (optional)

Sollte deine Datei keine Kopfzeile besitzen, kannst du die Namen der Spalten einfach selbst festlegen:

df = pd.read_csv('daten.csv', header=None, names=['Spalte1', 'Spalte2', 'Spalte3', 'Spalte4', 'Spalte5'])
python

Hier wurden die Spalten manuell als Spalte1 bis Spalte5 benannt. Das Ergebnis sieht so aus:

Spalte1            Spalte2  Spalte3     Spalte4  Spalte5
0          1  Max Mustermann         35      Berlin    50000
1          2      Anna Müller         29     Hamburg    62000
2          3    Peter Schmidt         41     München    58000
3          4        Lisa Meier         33         Köln    49000
4          5        Tom Becker         28  Frankfurt    52000
Zum Hauptmenü