Data cleaning tools
Hieronder vallen tools zoals Trifacta, OpenRefine, en Data Ladder. Deze tools helpen bij het opschonen van data door het verwijderen van duplicaten, het corrigeren van inconsistenties, en het invullen van ontbrekende waarden.
Data profiling tools
Data profiling tools zoals Ataccama, Informatica Data Explorer, en IBM InfoSphere Information Analyzer worden gebruikt om de data beter te begrijpen en te analyseren. Ze helpen bij het identificeren van patronen, afwijkingen, en relaties in de data.
Data quality management tools (DQM)
DQM-tools zoals Informatica Data Quality, IBM InfoSphere QualityStage, en Talend Data Quality helpen bij het beheren van de algehele kwaliteit van data. Ze ondersteunen functies zoals data governance, data stewardship, en master data management.
Database management systems (DBMS)
Dit kunnen
SQL-gebaseerde systemen zijn zoals MySQL, PostgreSQL, of Oracle, of NoSQL-systemen zoals MongoDB of Cassandra. Ze worden gebruikt om data te verzamelen, op te slaan, te beheren en te manipuleren.
Data visualisatie tools
Deze tools, zoals Tableau, Power BI, of Looker, worden gebruikt om de data op een visueel aantrekkelijke manier te presenteren.
Programmeertalen voor data analyse
Talen zoals
Python (met libraries zoals Pandas, NumPy, Matplotlib) en
R (met packages zoals dplyr, ggplot2) worden vaak gebruikt voor data-analyse en data-opschoning.