Pandas is een van de meest gebruikte Python modules voor data analyse. Hier zijn een aantal basisfuncties om je op weg te helpen:
1. Eerst moet je pandas importeren naar je Python script of notebook:
```
import pandas as pd
```
1. Het laden van gegevens in een pandas DataFrame (dit is de belangrijkste datastructuur van pandas):
```
df = pd.read_csv(‘mijn_gegevens.csv’)
```
1. Gegevens weergeven:
```
print(df.head()) # bekijk de eerste 5 rijen
```
1. Toegang tot gegevens:
```
print(df[‘mijn_kolom’]) # drukt alle waarden in ‘mijn_kolom’ af.
```
1. Kolommen selecteren:
```
df2 = df[[‘mijn_kolom’, ‘mijn_andere_kolom’]] # maakt een nieuwe DataFrame met alleen deze twee kolommen.
```
1. Voorwaarde gebruiken om gegevens te selecteren:
```
gefilterd_df = df[df[‘mijn_kolom’] > 10] # selecteert alleen de rijen waar ‘mijn_kolom’ groter is dan 10.
```
1. Kolommen toevoegen:
```
df[‘mijn_nieuwe_kolom’] = df[‘mijn_kolom’] + df[‘mijn_andere_kolom’] # voegt een nieuwe kolom toe die het resultaat is van de toevoeging van ‘mijn_kolom’ en ‘mijn_andere_kolom’.
```
1. Kolommen verwijderen:
```
df = df.drop(‘mijn_kolom’, axis=1) # verwijdert ‘mijn_kolom’ uit de DataFrame.
```
1. Missing waarden aanpassen:
```
df = df.fillna(0) # vervangt alle ontbrekende waarden (NaN) door 0.
```
Dit zijn slechts de basisfuncties van Pandas. Het heeft veel meer geavanceerde functies waarmee je data analyse en -verwerking kunt uitvoeren. Om volledig gebruik te maken van de kracht van Pandas, wordt aangeraden om de uitgebreide documentatie te lezen: https://pandas.pydata.org/pandas-docs/stable/