Posts in Big data & data science

All posts in Big data & data science in chronological order with newest first.

Guter Hands-on Einstieg in Apache Spark

Wer die Grundlagen von Spark lernen möchte, ist mit dem Buch “Learning Spark” gut beraten. Mir hat besonders gut gefallen, dass das Buch sehr praxisorientiert ist und man nebenbei mit der Spark-Shell die Beispiele ausprobieren und nachvollziehen kann.

Jul 06, 2015
Map of the USA using the LBNN

k-d-trees with Apache Spark and Scala

Jul 02, 2015

Definitiver Rundumschlag um das Hadoop-Ökosystem

Das Hadoop-Ökosystem ist im Laufe der Zeit erheblich gewachsen. “Hadoop: The Definitive Guide” bietet einen Überblick über die wichtigsten Themen und Projekte des Frameworks.

Jun 02, 2015

Guter Einstieg in die 'Daten-Kultur', aber zu unkritisch

In “Data driven - Creating a Data Culture” erläutern die Autoren, was sie unter einer “Datenkultur” verstehen.

May 15, 2015

Java MapReduce mit Hadoop

MapReduce ist ein “Korsett” und zwingt den Entwickler in enge Grenzen. Daher macht es Sinn, “MapReduce Design Patterns” zu lesen, damit man schnell die üblichen Tricks und Kniffe kennenlernt. Ähnlich ist es ja beim Lernen von anderen Paradigmen auch, wie z. B. Devide-and-Conquer oder Rekursion. Man begreift das allgemeine Prinzip schnell, man muss aber lernen, wann und wie man es am besten einsetzt.

Mar 27, 2015

Gute Einführung in nicht-relationale Datenbanken

Das kleine Buch “NoSQL Distilled:” bietet einen guten Überblick auf die verschiedenen NoSQL-Datenbanken.

Jun 04, 2013

Column-oriented databases

From 2002 to 2006, I worked at a Canadian manufacturer of a column-oriented database.

Feb 01, 2010

Fraud Detection with Artificial Intelligence

From 1999 to 2004, I collected information on the topic of ‘Fraud detection’ on my website.

When I started this in 1999 as a research assistant at the University of Karlsruhe, there was not much information available on the topic of ‘Data Science’. Back then, it was more commonly referred to as ‘Knowledge Discovery in Databases’ (KDD) in academic circles or ‘Data Mining’ in the business world.

Jan 02, 2005