Un seul facteur ne suffit pas pour résumer la différence entre le Big Data et les données traditionnelles. Parmi les différences fondamentales, on peut citer la valeur (comme nous l’avons mentionné plus haut), mais aussi la possibilité ou non de réaliser efficacement des analyses avec des outils traditionnels ou anciens. Les données traditionnelles sont structurées, par exemple dans des bases de données, et leur analyse repose sur des méthodes statistiques et des outils d’interrogation traditionnels comme SQL. Le Big Data évolue rapidement et inclut de vastes jeux de données aux formats disparates, y compris des données structurées, non structurées et semi-structurées. Les outils d’analyse de données traditionnels ne peuvent pas traiter ou analyser le Big Data dans toute son ampleur et sa complexité. L’analyse du Big Data nécessite donc des systèmes distribués et des outils avancés comme le machine learning.
L’analyse de données traditionnelle ne peut prendre en charge qu’un volume d’informations gérable, par exemple pour exécuter un rapport de ventes en fin de journée à partir d’une base de données financière unique et structurée par le biais d’un traitement par batch prévisible. À l’inverse, des solutions d’analyse du Big Data sont nécessaires pour gérer un volume massif de flux de données en continu, comme lorsqu’une application mondiale de covoiturage surveille des millions de véhicules. Dans cette situation, par exemple, les données doivent être ingérées et traitées à grande vitesse (en quelques millisecondes) pour calculer les heures d’arrivée estimées en temps réel et fournir une tarification dynamique.
Ici, le Big Data va également de pair avec une grande variété, puisqu’il exige l’intégration de coordonnées GPS structurées avec du texte et des images non structurés fournis par le conducteur. Des techniques sophistiquées sont nécessaires pour gérer la véracité (fiabilité) et garantir l’extraction d’une valeur ajoutée du Big Data, or les systèmes traditionnels ne sont tout simplement pas conçus pour une tâche d’une telle complexité.