L’approche Data Lake est la tendance du Big Data. En industrialisant cette démarche, General Electric annonce avoir amélioré ses performances par un facteur 2000 et divisé ses coûts par dix en matière d’analyse de données dans les services délivrés à ses clients.
Un test avec 25 compagnies aériennes
General Electric s’appuie sur les chiffres remontés par un test pilote réalisé en 2013 avec plusieurs de ses clients, des compagnies aériennes. La société a collecté les données concernant les moteurs d’avions de 15 000 vols de 25 compagnies différentes.
Un vol représente 14 Go de données, et le tout pesait donc plusieurs To d’informations. L’approche Data Lake a permis de réduire les coûts d’un facteur dix et de passer d’une analyse réalisée auparavant en mois en jours. General Electric parle d’une amélioration d’un facteur 2000 dans les performances.
En 2015, General Electric entend passer à 10 millions de vols, et 1500 To de données, comprenant l’ensemble des données opérationnelles de vol. Les données des moteurs d’avion sont collectées en temps réel. L’analyse de ces données permet d’optimiser leur usage. Une compagnie aérienne comme Air Asia peut économiser plus de 1% de leur facture de kérosène annuelle.
Plusieurs secteurs concernés
Pour cet usage d’un Data Lake qu’il qualifie de première, General Electric s’est associé à Pivotal – filiale logicielle Big Data et décisionnelle d’EMC – afin de délivrer une plateforme de Data Lake. General Electric souhaite commercialiser cette approche Data Lake afin d’industrialiser le Big Data dans les secteurs des compagnies aériennes, des chemins de fer, des hôpitaux et des services.
Dans une approche Data Lake, l’ensemble des informations est stockée sur une plateforme unique, sans modifier leur format d’origine. Le goulet d’étranglement habituel des projets Big Data est la transformation des formats de données. Dans ce domaine, les dataWarehouses sont trop lents et trop chers, selon le cabinet d’études IDC, cité par General Electric. « 80% du temps d’un projet est alors passé sur la préparation des données pour leur analyse » indique ainsi IDC.
Photo : un moteur d’avion conçu par General Electric.