Wat is Python?
Python is een ideale programmeertaal als het gaat om data science vanwege de nadruk op leesbaarheid van de code, en de uitgebreide libraries en frameworks. Omdat de taal eenvoudig en consistent is, kunnen ontwikkelaars snel systemen schrijven. Zo kunnen ze zich richten op de problemen van machine learning, zonder zich zorgen te hoeven maken over mogelijke knelpunten die vaak geassocieerd worden met complexe programmeertalen. Bovendien beschikt Python over een uitgebreide set libraries die specifiek zijn voor data science, zoals Keras, TensorFlow en Scikit-learn.
Wat doet een Python ontwikkelaar ?
Wat voornamelijk van belang is voor een Python data scientist is de kennis van de verschillende libraries. Ten eerste weten ze hoe data verzameld kan worden, denk bijvoorbeeld aan data scraping van websites m.b.v. bijvoorbeeld selenium. Ook weet een Python data scientist hoe je met deze (enorme hoeveelheid) data om kan gaan. Basiskennis van SQL is daarvoor handig, en kennis van data libraries zoals Pandas en/of NumPy vereist. Uiteraard weet een Python data scientist ook welke technieken toegepast kunnen worden, dus ze hebben ervaring met verschillende machine learning technieken (Naive Bayes, Linear Regression, Neural Networks) en frameworks (scikit-learn, TensorFlow, PyTorch). Tenslotte, data science gaat ook over het communiceren van je bevindingen, en data visualisatie is daar een extreem waardevol onderdeel van. Hiervoor gebruiken Python data scientists voornamelijk matplotlib.
in het dagelijks leven is zij Masterstudent Biomechanical Engineering aan de TU Delft. Hiernaast heeft zij een minor Data Science gevolgd en deze kennis toegepast in een eerder bijbaantje.