Ein Entscheidungsbaum teilt ein Problem in eine Reihe von Fragen auf. Jede Frage trägt dazu bei, Unsicherheiten zu reduzieren, bis die Antwort klar ist.
Der Prozess beginnt an der Wurzel mit einer Frage, die auf Daten basiert. In diesem Schritt führt der Algorithmus eine Merkmalselektion durch, bei der die relevanteste Variable für die Aufteilung der Daten identifiziert wird. Jede Antwort führt zu einer anderen Frage, wiederum basierend auf der Funktion, die in dieser Phase am besten hilft, die Daten zu trennen. Der Baum setzt diesen Prozess fort, bis er einen Blattknoten erreicht, wo eine endgültige Prognose oder Entscheidung getroffen wird.