Intégrer et exploiter des données du BigData est devenu aujourd’hui un impératif stratégique pour les entreprises.

Pour être réellement agile, il faut enrichir ses référentiels de données transactionnelles par des données externes provenant du BigData afin de pouvoir mener quasiment en temps réel des analyses plus pertinentes qui permettront de mieux anticiper l’évolution des tendances et y réagir plus rapidement. L’inconvénient c’est que cela bouscule clairement les modèles et technologies informatiques que nous connaissions jusqu’ici !

Qu’est-ce qui caractérise les données du BigData ? Les 3 « V » :
Volume, Variété et Vitesse

Les volumes de données dans le BigData sont gigantesques

VOLUME

La quantité de données dans le BigData est bien supérieure aux volumes habituellement traités et elle ne cesse d’augmenter.

Les données dans le BigData sont par définition hétérogènes

VARIETE

Les données du BigData sont par définition hétérogènes et dans des formats bien souvent non structurés.

Les données dans le BigData évoluent en temps réel

VITESSE

Les données sont générées dans des temps beaucoup plus courts et il faut pouvoir les collecter et les exploiter quasiment en temps réel.

1
CONSEQUENCE

Dépasser la barrière technique du stockage des données

C’est le premier point à prendre en compte : les données du BigData ne peuvent pas être exploitées dans les modèles de bases de données habituels. Compte-tenu de la volumétrie des données et de leur nature hétérogène (données multimédia, etc.), les bases de données traditionnelles (SGBD) ne sont plus adaptées et il faut se tourner vers des solutions de stockage sur des bases « NO SQL » (qui signifie « Not Only SQL »).

Ces bases NO SQL permettent de s’affranchir des limites des SGBD traditionnels. Apparues à la fin des années 2000 à l’initiative des géants du Web tels que Google, Amazon, Yahoo ou même Facebook qui se retrouvaient constamment confrontés à des problèmes de performance pour traiter la montée en charge des volumétries de données.

Pour mettre en œuvre ces entrepôts de données moins structurants et plus à même d’absorber la montée en charge des volumes, il faut se tourner vers des bases telles que :

logo hadoop
 née des travaux de Google et Yahoo.
logo MongoDB
 très appropriée pour l’exploitation de documents numériques ; par exemple pour numériser et indexer l’ensemble des archives d’un journal.
logo neo4j
 particulièrement utile lorsque l’on peut stocker et exploiter des données sous forme de graphe selon leur degré de séparation…
2
ENJEU

Exploiter les données du BigData et de l’IoT (Internet of Things) dans l’entreprise

Evidemment, lancer des requêtes dans ces énormes silos de stockage de données ne se fait pas exactement par la manière habituelle : on ne peut pas rechercher les images similaires à une photo dans la base de données Google Images comme on rechercherait les coordonnées d’un client.

La plateforme Blueway apporte un avantage considérable avec des connecteurs NO SQL permettant d’écrire et de requêter dans ces silos de données du BigData, d’analyser les résultats puis de faire transiter les données en temps réel dans l’entreprise pour les délivrer aux bonnes personnes au bon moment.

Intégrer des données du BigData est devenu un enjeu de connaissance et de savoir pour les entreprises qui enrichissent et affinent les informations qu’elles avaient l’habitude d’exploiter. Les constructeurs automobiles qui enregistrent régulièrement des données liées à l’utilisation et au comportement des voitures peuvent les corréler à des sources externes comme la météo ou les statistiques d’embouteillage et ainsi mesurer l’influence de facteurs externes.

Mais pour cela, il faut respecter la contrainte des 3V du BigData : analyser très Vite un grand Volume de données d’une grande Variété pour avoir une connaissance parfaite

3
ENJEU

Dernier enjeu : rapprocher les données du BigData avec les données du système d’information de l’entreprise

C’est clairement l’enjeu « Business » lié au BigData qui va aider les entreprises à mieux comprendre le parcours et les interactions avec leurs clients, dans un centre commercial ou sur un site E-Commerce par exemple. En rapprochant ces données en temps réel des données de sa CRM ou de son historique de commandes dans l’ERP, cela permet de proposer aux clients une information qui réponde réellement à leurs attentes au bon moment et qui ne soit pas une promotion commerciale interruptive supplémentaire.

C’est la valeur ajoutée de la solution Oxway qui facilite le rapprochement des données du BigData avec les ERP et CRM de l’entreprise.