Unter
Data-Mining [] ( für
Daten-Bergbau, eine Metapher für einen scheinbar wertlosen Datenberg, in dem aufwändig nach neuem Wissen „gegraben“ werden soll) versteht man die systematische Anwendung statistischer Methoden auf große Datenbestände (insbesondere "
Big Data" bzw. Massendaten) mit dem Ziel,
neue Querverbindungen und Trends zu erkennen. Solche Datenbestände können aufgrund ihrer Größe nicht manuell verarbeitet werden, sodass man computergestützte Methoden benötigt. Die Methoden können aber auch auf kleinere Datenmengen angewendet werden. In der Praxis wurde der Unterbegriff
Data-Mining auf den gesamten Prozess der sogenannten „
Knowledge Discovery in Databases“ (Wissensentdeckung in Datenbanken; KDD) übertragen, der auch Schritte wie die Vorverarbeitung beinhaltet, während Data-Mining eigentlich nur den Analyseschritt des Prozesses bezeichnet.