News

[Vidéo] Comprendre le Big Data en 2 minutes

Après avoir revu les fondamentaux de la business intelligence lors d’un précédent article, nous avons décidé de consacrer un article entier à un sujet qui, non content de révolutionner notre monde, a le mérite de faire parler de lui. Le Big Data est aujourd’hui au centre de toutes les attentions.

Les organisations ont à faire à des volumes de données toujours plus importants, nécessitant de nouveaux processus afin d’en extraire de la valeur. Dans cet article nous allons tenter de vous éclairer sur ce qui a conduit à son émergence.

Qu’est ce que le Big Data ?

Les évolutions technologiques de ces dernières années ont provoqué d’importants changements dans nos habitudes d’utilisation des technologies. Nous sommes passés d’une phase où les utilisateurs se connectaient presque exclusivement depuis un poste fixe à une phase ou les smartphones ont pris de plus en plus d’importances.

Ces dernières années cette transition vers plus de mobilité s’est exacerbée et notre consommation de données a augmenté. Nous utilisons toujours plus d’applications mobiles, nous monitorons notre activité physique grâce à des bracelets connectés, nous traquons nos clients sur le web, et nous assistons à l’émergence d’un nombre importants d’objets connectés.

L’utilisateur se constitue un écosystème d’applications, de logiciels et d’objets connectés très simple à utiliser (autrefois, ce type de produits étaient de véritables usines à gaz parfaitement incompréhensibles). Internet étant également toujours plus rapide et accessible (4G, Fibre), d’énormes volumes de données n’ont pas tardé à s’accumuler un peu partout.

Les entreprises n’ont bien sûr pas mis longtemps avant de comprendre qu’elles pouvaient exploiter des précieuses informations à partir de ces énormes volumes de données que l’on appelle aujourd’hui Big Data.

Exemple d’un écosystème “Big Data”

L’exemple ci-dessous présente l’activité d’une société fictive nommée XSport. C’est un grand équipementier sportif qui commercialise du textile, des chaussures, du matériel de sport dont des bracelets connectés. Ces bracelets permettent aux utilisateurs de monitorer leurs performances de running et de les partager avec leurs amis sur les réseaux sociaux.

Le schéma ci-dessous représente les différentes sources de données accessibles en fonction des différentes activités de l’entreprise.

Nous voyons que l’entreprise XSport est confrontée à une complexité d’analyse liée à ses différents canaux d’informations, à l’origine de ces données, aux type de ces données et à des problèmes de volumétries importante.

Nous sommes au coeur de la définition du Big Data ou l’ensemble des données devient tellement volumineux qu’il devient difficile de les travailler et d’en extraire rapidement des analyses.

Un très fort enjeu commercial se cache derrière ces montagnes de données qu’elle doit absolument traiter afin d’adapter son offre au marché.

Comment capitaliser sur ses données pour booster son activité ?

L’Objectif de l’entreprise Xsport est de développer son chiffre d’affaires, d'améliorer son service client et de fidéliser sa clientèle en capitalisant sur les données récoltées à la fois via son application, son site web, les réseaux sociaux et les boutiques physiques.

Pour cela, elle va recouper l’ensemble des données afin de diffuser des messages plus en adéquation avec les profils utilisateurs et leur proposer des produits et services adaptés au contexte.

Par exemple, l'entreprise souhaite faire apparaître sur la page d’accueil de son application le TOP 3 des produits correspondant le plus au profil de l’utilisateur.

Elles se base donc sur plusieurs types de données (performances, fréquence, achats déjà effectués, réseaux sociaux, etc.) afin de vendre des produits plus haut de gamme (up selling) et des produits complémentaires (cross selling).

Pour résoudre cette problématique, l'entreprise doit faire face à d’énormes volumes de données hétérogènes et disparates.

Voici certains extraits des données sous forme de tableaux :

Le tableau suivant présente quelque données issues de l’utilisation des bracelets et de l’application Xsport.

Ces données sont intéressantes car elles nous renseignent sur les habitudes sportives des utilisateurs.

L’application mobile permet également aux utilisateurs de saisir des courses ou des objectifs auxquelles ils souhaitent participer.

XSport étudie aussi le comportement des visiteurs sur son site de vente en ligne et enregistre les données suivantes :

L’entreprise enregistre également les achats effectués par les membres sur son site web :

Grâce à son programme de fidélité, XSport récolte via ses cartes de fidélité des données sur les clients qui fréquentent ces boutiques physiques :

Enfin, les community managers travaillant au siège de XSport publient chaque jour plusieurs articles sur les réseaux sociaux.

Ce qui permet à l’entreprise de récolter des données sur l'interaction des utilisateurs avec ces publications (likes, commentaires, partages, etc.) :

Ceci n’est qu’une infime représentation des données pouvant être récoltées par la société XSport.

Nous allons maintenant explorer les difficultés que cette société peut rencontrer dans l’exploitation de ses données afin de résoudre sa problématique.

Prenons le cas d’un client aussi utilisateur de l’application et du bracelet connecté de XSport.

Ce jeune homme de 31 ans est un sportif expérimenté. Il court en moyenne 12 km et ce, 4 fois par semaine.

Les coordonnées GPS issues du bracelet connecté montre qu’il court à la fois en ville et également en montagne.

Les données indiquent qu’il court principalement le soir.

Nous savons qu’il s’est également inscrit à un semi marathon au mois de Juillet et que son objectif en terme de temps est de 01h45.

Un humain est capable d’interpréter ces données et de recommander une liste de produits au client. Il serait alors tenté de lui proposer les produits suivants :

  1. Des chaussures moyen de gamme voire haut de gamme car l’utilisateur court régulièrement et parcourt une distance plutôt élevée. Ces chaussures pourraient être soit des chaussures de route ou de trail (car l’utilisateur court sur des terrains différents).
  2. Sachant que l’utilisateur court principalement le soir, proposer une lampe frontale serait approprié (toutefois, il convient de vérifier si l’utilisateur n’en a pas déjà acheté dans son historique “achat de produits”).
  3. Des produits de nutrition, notamment lorsqu’il approchera de la date de son semi marathon.

Dans le cas où nous souhaitons lui recommander d’autres produits tels que des t-shirts, shirt et coupes vents, il serait intéressant de tenir compte de la température de son lieu de course afin d’adapter les propositions.

Pourquoi mettre en place un projet Big Data au sein de son entreprise ?

La question est maintenant de déterminer si la mise en place d’une solution de “Big Data” apporte réellement de la valeur à l’entreprise.

Imaginez maintenant que l’entreprise XSport dispose d’une base de données de plus de 10 de millions de clients. Il n’est pas envisageable d’effectuer la manipulation décrite ci dessus plusieurs millions de de fois. De plus, les profils clients évoluent et il serait donc nécessaire de les réévaluer constamment (évolutions sur le plan sportif mais aussi en terme d’achats effectués).

Les logiciels capables de traiter les Big Data nous permettent d’automatiser ce processus. 

L’intérêt de mettre en place un projet Big Data dans le cas de l’entreprise Xsport est multiple. 

Il permettra à l’entreprise d’optimiser ses revenus et de mieux gérer la relation client, automatiser son marketing, mieux gérer ses stocks, centraliser ses informations et bien d’autres...

Pourquoi les logiciels de Business Intelligence traditionnelle sont incapables de mettre en place ce type de projets ?

Pour répondre à cette question nous allons présenter le volume de données auquel peut être confronté XSport. Le volume le plus important est issu du couple application / bracelet connecté.

Nous considérons que sur les 10 millions de clients, 2 millions utilisent le bracelet connecté. De plus, nous faisons l’hypothèse que chaque utilisateur court en moyenne 2 fois par semaine pendant 35 min. Si le bracelet envoie un bip de localisation toutes les 3 secondes, nous obtenons en moyenne 1400 bips par utilisateurs et par semaine. Cela équivaut à un total de 2 800 000 000 bips par semaine pour l’ensemble des utilisateurs. Si nous convertissons cela en terme de volume de données, cela représente un volume d’environ 3800 go de donnée chaque année rien que pour les bracelets connectés.

Nous pourrions continuer ainsi en nous penchant sur les données issues des visiteurs de la boutique en ligne, des boutiques physiques ainsi que des millions de likes et commentaires sur les réseaux sociaux chaque année.

De plus, pour pouvoir être utilisées par des algorithmes de recommandations tel que du filtrage collaboratif, les données doivent souvent être transformées (jointure, union, catégorisation, etc), ce qui génère des données souvent plus volumineuses.

Dans le cas d’algorithmes de recommandations, cela implique l’utilisation de matrices devant être multipliées entre elles. Ces calculs génèrent des résultats intermédiaires nécessitant également de l’espace de stockage, ainsi qu’une puissance de calcul importante.

Des logiciels de BI traditionnels fonctionnant sur un seul serveur n’ont pas été conçus pour manipuler des données aussi volumineuses, et encore moins dans un temps raisonnable.

Fort heureusement il existe aujourd’hui des logiciels de business intelligence agiles capables de traiter les Big Data instantanément.

Dans le prochain article nous rentrerons dans une vision plus technologique du Big Data et nous montrerons en quoi le logiciel de business intelligence agile DigDash Enterprise s'adapte à cette problématique.

Europarc Sainte Victoire, Bâtiment 1

13590 Meyreuil

contact@digdash.com

04 84 25 01 40

×

 

Comment fonctionne le logiciel
DigDash Enterprise ?

Inscrivez-vous à la prochaine web-conférence de présentation de DigDash Enterprise :