Computer Vision ist ein Teil des größeren Rätsels um die künstliche Intelligenz. KI ist ein weites Feld, das sich auf den Aufbau von Systemen konzentriert, die auf eine Weise lernen, denken und handeln, die wir mit menschlicher Intelligenz verbinden. Dazu gehören Disziplinen wie Natural Language Processing, mit dem Computer Sprache und Text verstehen können, Robotik, die mechanische Bewegung mit Wahrnehmung kombiniert, und Entscheidungssysteme, die Daten analysieren, um optimale Aktionen auszuwählen.
Computer Vision bildet den visuellen Zweig dieses Ökosystems. Während andere KI-Systeme mit Wörtern, Zahlen oder strukturierten Daten arbeiten, konzentriert sich Computer Vision auf Pixel. Sie trainiert Modelle, um Bedeutung aus visuellen Eingaben zu extrahieren und Rohbilder und Videos in Informationen zu verwandeln, mit denen sie arbeiten können.