Programmeertalen
Python
Een veelzijdige en gebruiksvriendelijke programmeertaal die populair is bij data professionals vanwege de uitgebreide bibliotheek aan data-analyse en machine learning packages. Voorbeelden van populaire bibliotheken zijn
Pandas,
NumPy en
Scikit-learn.
R
Een programmeertaal en software-omgeving die specifiek is ontworpen voor statistische analyse en data visualisatie. Het
R Project biedt een groot aantal packages en tools voor het werken met data, zoals
ggplot2 en
dplyr.
Data opslag en verwerking
Een gestandaardiseerde programmeertaal voor het beheren en ophalen van data in relationele databases, zoals
MySQL,
PostgreSQL en
Microsoft SQL Server.
NoSQL
Een verzameling van niet-relationele databasemodellen, zoals document-, key-value- en grafiekgebaseerde databases. Populaire NoSQL databases zijn
MongoDB,
Cassandra en
Neo4j.
Hadoop
Een open-source software framework voor het verwerken en opslaan van grote hoeveelheden data. Hadoop maakt gebruik van het
Hadoop Distributed File System (HDFS) en
MapReduce voor parallelle verwerking van data.
Apache Spark
Een snel en flexibel data-verwerkingsplatform dat vaak wordt gebruikt voor big data en machine learning toepassingen. Spark biedt API's voor
Python, Scala en Java en bevat ingebouwde libraries zoals
MLlib voor machine learning.
Data visualisatie en rapportage
Tableau
Een krachtige en gebruiksvriendelijke data-visualisatietool waarmee gebruikers interactieve en shareable dashboards kunnen maken. Meer informatie over Tableau is te vinden op de
Tableau-website.
Power BI
Een business intelligence tool van Microsoft die helpt bij het analyseren en visualiseren van data. Power BI biedt integratie met andere Microsoft-producten en -diensten, zoals Excel en Azure. Kijk voor meer informatie over Power BI op de
Power BI-website.
D3.js
Een JavaScript-bibliotheek voor het creëren van dynamische en interactieve datavisualisaties in webbrowsers. D3.js maakt gebruik van HTML, SVG en CSS om een breed scala aan visualisaties te produceren. Bezoek de
D3.js-website voor meer informatie en voorbeelden.
Machine Learning en AI
TensorFlow
Een open-source machine learning bibliotheek ontwikkeld door Google Brain Team, die gebruikt wordt voor het bouwen en trainen van neurale netwerken en andere ML-modellen. TensorFlow ondersteunt meerdere programmeertalen, waaronder Python en C++. Lees meer over TensorFlow op de
TensorFlow-website.
PyTorch
Een open-source machine learning bibliotheek ontwikkeld door Facebook's AI Research Lab, die populair is onder onderzoekers en ontwikkelaars vanwege de flexibiliteit en dynamische berekeningsgraaf. Meer informatie over PyTorch is te vinden op de
PyTorch-website.
Keras
Een gebruiksvriendelijke, high-level neurale netwerkbibliotheek die op TensorFlow, Microsoft Cognitive Toolkit of Theano kan draaien. Keras is ontworpen om het bouwen en experimenteren met neurale netwerken te vergemakkelijken. Bezoek de
Keras-website voor meer informatie.
Cloud computing en data-opslag
Een uitgebreid cloud computing platform van Amazon dat een breed scala aan diensten aanbiedt, zoals rekenkracht, opslag, databases en machine learning tools. Enkele populaire AWS-diensten voor data-professionals zijn
Amazon S3 en
Amazon Redshift.
Een cloud computing platform van Google met diensten voor het bouwen, uitvoeren en schalen van applicaties, waaronder data-analyse en machine learning tools zoals
BigQuery en
Google Cloud ML Engine.
Een cloud computing platform van Microsoft dat een scala aan diensten en oplossingen biedt voor het bouwen, implementeren en beheren van applicaties. Azure biedt data-opslag- en verwerkingsdiensten zoals
Azure Data Lake Storage en
Azure Machine Learning.