Spalten-orientierte Datenbanken

Von 2002-2006 habe ich bei einem kanadischen Hersteller einer spalten-orientierten Datenbank gearbeitet.

Die traditionellen Datenbanken speichern ihre Daten in einzelnen Datensätzen: und zwar Datensatz für Datensatz. Das hat Vorteile bei transaktionalen Datenbanken, weil die Daten, die in einer Operation benötigt werden, eng zusammenliegen. Bei analytischen Anwendungen ist man aber z. B. am durchschnittlichen Verbrauch aller Kunden in einer bestimmten Postleitzahlregion interessiert. Hier müssen sehr viel einzelne Datensätze berücksichtigt werden, die sehr “weit” im Speicher auseinanderliegen können. Wenn die Daten nach den jeweiligen Spalten gespeichert werden, bringt dieses Geschwindigkeitsvorteile. Man kann die einzelnen Spalten auch besser komprimieren, weil die Datem sich oft sehr ähnlich sind. Damit sind die spaltenbasierten Datenbanken oftmals besser für analytische Anwendungen geeignet.

Einige Beispiele sind:

Anmerkung: Dieser Artikel wurde im November 2016 an das neue Blog-Format angepasst.

 "CUDA Real-Time Ray Tracer" "Sony verprellt die ersten Fans der Playstation 3"