Posts in Big data & data science

All posts in Big data & data science in chronological order with newest first.

Guter Hands-on Einstieg in Apache Spark

Wer die Grundlagen von Spark lernen möchte, ist mit dem Buch “Learning Spark” gut beraten. Mir hat besonders gut gefallen, dass das Buch sehr praxisorientiert ist und man nebenbei mit der Spark-Shell die Beispiele ausprobieren und nachvollziehen kann.

Jul 06, 2015
Map of the USA using the LBNN

k-d-trees with Apache Spark and Scala

Jul 02, 2015

Definitiver Rundumschlag um das Hadoop-Ökosystem

Das Hadoop-Ökosystem ist im Laufe der Zeit erheblich gewachsen. “Hadoop: The Definitive Guide” bietet einen Überblick über die wichtigsten Themen und Projekte des Frameworks.

Jun 02, 2015

Guter Einstieg in die 'Daten-Kultur', aber zu unkritisch

In “Data driven - Creating a Data Culture” erläutern die Autoren, was sie unter einer “Datenkultur” verstehen.

May 15, 2015

Java MapReduce mit Hadoop

MapReduce ist ein “Korsett” und zwingt den Entwickler in enge Grenzen. Daher macht es Sinn, “MapReduce Design Patterns” zu lesen, damit man schnell die üblichen Tricks und Kniffe kennenlernt. Ähnlich ist es ja beim Lernen von anderen Paradigmen auch, wie z. B. Devide-and-Conquer oder Rekursion. Man begreift das allgemeine Prinzip schnell, man muss aber lernen, wann und wie man es am besten einsetzt.

Mar 27, 2015

Gute Einführung in nicht-relationale Datenbanken

Das kleine Buch “NoSQL Distilled:” bietet einen guten Überblick auf die verschiedenen NoSQL-Datenbanken.

Jun 04, 2013

Spalten-orientierte Datenbanken

Von 2002-2006 habe ich bei einem kanadischen Hersteller einer spalten-orientierten Datenbank gearbeitet.

Feb 01, 2010

Missbrauchserkennung mit Künstlicher Intelligenz

Von 1999 - 2005 habe ich Informationen zum Thema "Fraud detection" auf einer Webseite gesammelt. Als ich 1999 damit als wissenschaftlicher Mitarbeiter der Uni Karlsruhe anfing, gab es zum Thema "Data Science" noch nicht viel Informationen. Es hieß damals auch eher "Knowledge Discovery in Databases" (KDD) in akademischen Kreisen oder "Data Mining" in der Wirtschaft.

Jan 02, 2005