Datenqualität vs. Big Data: Eine Popularitätsanalyse

Wie schon in einem früheren Blogpost erwähnt ist das Interesse für Big Data enorm, während das Thema Datenqualität etwas auf der Strecke bleibt. Einen Beweis dafür findet man in der Beliebtheit der Begriffe auf Google. Vergleicht man die weltweite Beliebtheit der Suchbegriffe „Big Data“ und „Data Quality“ miteinander, so sieht man, dass „Big Data“ bei weitem populärer als „Data Quality“ ist. „Big Data“ hat „Data Quality“ allerdings erst im Juli 2011 überholt! Vorher war der Begriff eher unbedeutend. Interessant ist auch, dass der Begriff „Business Intelligence“ langsam aber sicher in seiner Beliebtheit sinkt.

Datenqualität vs. Big Data

Kurzum: Das Interesse für Datenqualität tritt auf der Stelle, obwohl die Datenmengen immer größer werden. Schaut man sich nun an, wie das weltweite Interesse an „Data Quality“ verteilt ist, entdeckt man Überraschendes.

Datenqualität weltweites Interesse

In Deutschland, dem Land der Qualitätsprodukte „Made in Germany“, scheint das Interesse an Datenqualität relativ gering. Das weltweite Interesse für Datenqualität konzentriert sich vor allem auf Kenia, Indien, Pakistan, Südafrika, USA, Kanada, Australien, Neuseeland, Irland und Großbritannien. Natürlich sucht man in Deutschland eher nach „Datenqualität“ als nach „Data Quality“, aber auch dieser Begriff ist mit monatlich ca. 2.900 Abfragen eher mäßig beliebt. Zum Vergleich: „Big Data“ wird in Deutschland monatlich ca. 14.800 mal gesucht, „Data Quality“ in den USA monatlich etwa 40.500 mal und in Großbritannien ca. 9.900 mal.

Zum Zeitpunkt der Erstellung dieses Artikels konzentrierte sich das Interesse für Datenqualität auf die Bundesländer Bayern, Baden Württemberg, Nordrhein-Westfalen und Hessen. Das Interesse der übrigen 12 Bundesländer wurde bei Erstellung dieses Beitrags in Google Trends noch nicht mal aufgeführt. Nachfolgend finden Sie die Popularität des Suchbegriffes „Datenqualität“ verteilt auf die Bundesländer.

Datenqualität nationales Interesse

Mein Fazit:

Die Bedeutung von Datenqualität für das heutige Wirken wird weiterhin unterschätzt. Immerhin hat man erkannt, dass man IT-Architekturen für die performante Analyse immer größer werdender Datenmengen auf neue Beine stellen muss. Dass mit den Datenmengen auch die Datenqualitätsprobleme steigen, spiegelt sich derzeit noch nicht im Interesse der Googlesuchenden wieder. Aus meiner Sicht ist dies allerdings nur eine Frage der Zeit. Ich erwarte, dass durch das zunehmende Interesse für Big Data auch der Erfolgsfaktor Datenqualität erkannt wird. Die Frage ist nur: Wie lange dauert es, bis diese Erkenntnis überall angekommen ist. Limitierend wirkt jedoch, dass es derzeit kaum vorstellbar ist, dass für Datenqualität ähnliche Marketinganstrengungen angestellt werden wie für Big Data.

Stimmen Sie meiner Prognose zu oder sind Sie anderer Meinung? Dann hinterlassen Sie doch einen Kommentar!