Databases
Om de enorme hoeveelheden data die moderne organisaties genereren te beheren, gebruiken data-architecten databases zoals MySQL, PostgreSQL, Oracle, Microsoft SQL Server en NoSQL-databases zoals MongoDB of Cassandra.
Data Modeling Tools
Data-architecten gebruiken tools zoals ER/Studio, Sparx Systems Enterprise Architect en IBM InfoSphere Data Architect om gegevensmodellen te creëren en te beheren. Deze modellen helpen bij het begrijpen van complexe datastructuren en bij het ontwerpen van databases.
ETL Tools
Extract, Transform, Load (ETL) tools worden gebruikt om data uit verschillende bronnen te extraheren, te transformeren in een bruikbaar formaat en vervolgens te laden in een data warehouse. Enkele van de populaire ETL-tools zijn Informatica PowerCenter, Microsoft SQL Server Integration Services (SSIS) en IBM InfoSphere DataStage.
Big Data Tools
Gezien de toename van big data, gebruiken data-architecten tools zoals Hadoop,
Apache Spark en Hive om deze grote gegevenssets te verwerken.
Cloud Platforms
Veel organisaties migreren hun data-architecturen naar de cloud, dus data-architecten moeten bekend zijn met cloudplatforms zoals
AWS,
Google Cloud Platform en
Microsoft Azure.
Data Visualization Tools
Om de data begrijpelijk te maken voor anderen in de organisatie, worden data-visualisatie tools gebruikt. Voorbeelden zijn Tableau, Microsoft Power BI en QlikView.
Data Governance Tools
Deze tools helpen bij het beheren van de beschikbaarheid, bruikbaarheid, integriteit en veiligheid van data in organisaties. Voorbeelden zijn Collibra, Informatica Axon en IBM Data Governance Catalog.
Programmeertalen
Tenslotte is het nuttig voor een data-architect om vertrouwd te zijn met programmeertalen die veel worden gebruikt in datamanagement en -analyse, zoals
Python,
R, Java,
SQL en
Scala.