Ingestion de données

Qu’est-ce que l’ingestion de données ou data ingestion ?

L’ingestion de données est le processus d’importation de fichiers de données volumineux et variés, provenant de sources multiples, dans un support de stockage unique basé sur le cloud computing (entrepôt de données, data mart ou base de données), où ils peuvent être consultés et analysés. Comme les données peuvent se présenter sous plusieurs formes différentes et provenir de centaines de sources, elles sont nettoyées et transformées en un format uniforme à l’aide d’un processus d’extraction/transformation/chargement (ETL).

Quels sont les avantages de l’ingestion de données ?

Un processus d’ingestion de données efficace présente de nombreux avantages, notamment :

  • Disponibilité des données dans l’ensemble de l’entreprise, dans différents services et domaines fonctionnels avec des besoins disparates en matière de données.
  • Processus simplifié de collecte et de nettoyage des données importées à partir de centaines de sources, avec des dizaines de types et schémas, dans un format unique et cohérent.
  • La capacité de traiter des données volumineuses à grande vitesse, par lots en temps réel, ainsi que de nettoyer et/ou d’ajouter des horodatages pendant le processus d’ingestion.
  • Réduction des coûts et gain de temps par rapport aux processus manuels d’agrégation des données, surtout si la solution est un modèle as-a-service.
  • La capacité, même pour une petite entreprise, de collecter et d’analyser des volumes de données plus importants et de gérer facilement les pics de données.
  • Le stockage cloud de gros volumes de données sous forme brute permet d’y accéder facilement en cas de besoin.