Qu'est-ce que le Big Data?
NouvellesSi les origines du terme sont insaisissables, voire discutables, le Big Data est l’un de ces concepts que beaucoup connaissent, mais il défie une définition simple. Comme le terme l'indique directement, le big data est constitué d'un volume de données extrêmement important. Ces informations proviennent souvent de sources diverses et même de différents types de données, qui sont ensuite analysées au moyen de techniques analytiques avancées qui, espérons-le, permettent de déterminer des modèles pouvant aboutir à des conclusions utiles..
Les mégadonnées déduisent également les trois V: volume, variété et vélocité. Le volume fait référence à la taille des données, la variété indique que les jeux de données sont non homogènes et la vitesse correspond à la vitesse à laquelle l'analyse a lieu, souvent dans le but de réaliser une analyse en temps réel..
Les jeux de données en question sont effectivement très volumineux - nous parlons de téraoctets à zettaoctets (1ZB équivaut à 909 494 701 To, pour les curieux). Outre la taille de ces ensembles de données, les données peuvent être de différents types: structurées, semi-structurées et non structurées, et elles peuvent également être extraites de plusieurs sources..
Cela pose la question de savoir d'où proviennent toutes ces données. Il provient de tous les types d'endroits, y compris le Web, les médias sociaux, les réseaux, les fichiers journaux, les fichiers vidéo, les capteurs et les appareils mobiles..
Ces derniers sont particulièrement importants car la plupart d’entre nous gardons nos téléphones avec nous 24 heures sur 24, 7 jours sur 7, et ils disposent d’un grand nombre de capteurs, dont un GPS, des appareils photo, un microphone et un capteur de mouvement. De plus, la majorité des smartphones n’est pas la communication vocale, mais d’autres activités, telles que les courriels, les jeux, la navigation sur le Web et les applications sociales, ce qui représente 90% des applications mobiles. Les données mobiles, qui sont générées à un rythme effréné, sont un facteur important du Big Data..
Exploration de données
Mais les données sans aucune analyse n’ont guère de valeur, et c’est l’autre partie du processus Big Data. Cette analyse s'appelle l'exploration de données. Elle s'efforce de rechercher des modèles et des anomalies dans ces grands ensembles de données. Ces modèles génèrent ensuite des informations utilisées à diverses fins, telles que l'amélioration des campagnes marketing, l'augmentation des ventes ou la réduction des coûts. L’approche Big Data et Data Mining a non seulement le pouvoir de transformer des industries entières, mais elle l’a déjà fait..
Par exemple, Trainline est un important distributeur européen de billets de train européen leader dans la vente de billets domestiques et transfrontaliers dans 173 pays, avec environ 127 000 trajets effectués quotidiennement par les clients. La société a utilisé le Big Data pour moderniser son approche des voyages, en mettant l'accent sur l'amélioration de l'expérience client via l'innovation via son application..
Il en résulte que les clients reçoivent désormais des notifications de perturbation améliorées via l'application. Plus que de simples notifications de retards, ces notifications améliorées sont spécifiques au voyage de chaque voyageur, une première pour le secteur ferroviaire britannique. La société a également innové en termes de tarification prédictive, ce qui permet de prédire quand les tarifs anticipés augmenteront par rapport au tarif réduit initial, permettant ainsi aux passagers d’acheter des tarifs à des prix inférieurs..
Les mégadonnées ont également été utilisées dans les restaurants, en particulier dans le secteur de la restauration rapide. McDonald's est la plus grande chaîne de restaurants au monde en termes de chiffre d'affaires et sert plus de 69 millions de clients par jour dans plus de 36 900 établissements dans plus de 100 pays..
Du fait de son volume considérable, des tonnes de données sont générées. C'est pourquoi McDonald's a adopté une culture axée sur les données, dans le but d'améliorer sa compréhension au niveau de chaque emplacement, avec l'objectif global d'une meilleure chaîne de restaurants..
Grâce aux données massives, McDonald's a optimisé son expérience en matière de conduite en passant, par exemple, en prenant note de la taille des voitures qui arrivent et en se préparant à une augmentation de la demande lorsque de grosses voitures rejoignent la file d'attente..
Une autre innovation Big Data concerne les affichages de menu numériques qui peuvent afficher de manière flexible des éléments de menu sur la base d’une analyse en temps réel des données. Les menus déplacent les éléments en surbrillance en fonction des données, y compris l'heure du jour et le temps qu'il fait à l'extérieur, en particulier pour promouvoir les boissons froides lorsqu'il fait chaud et des aliments plus réconfortants les jours plus froids. Cette approche a entraîné une augmentation des ventes sur les sites canadiens de 3% à 3,5%.
Questions de santé
Cette approche Big Data a également été appliquée aux soins de santé. Un exemple évident est le changement majeur de la feuille de calcul 'stylo et papier' où les données de votre médecin sont conservées dans un classeur du bureau, au profit des dossiers de santé électroniques (DSE), qui contiennent désormais toutes les informations des patients soigneusement enregistrées dans une base de données. , prêt à être exploité.
Cette approche risque d’être perturbante, une publication récente dans le European Heart Journal promettant la “potentiel pour améliorer notre compréhension de la causalité et de la classification des maladies pertinentes pour la traduction précoce et pour contribuer à des analyses exploitables pour améliorer la santé et les soins de santé”.
Les avantages des mégadonnées dans les soins de santé iront au-delà de l’exploration de données du DSE. La dotation en personnel est un défi de taille pour les hôpitaux. Elle doit être adéquate en tout temps, avec le potentiel de montée en puissance en période de pointe..
Au sein d'un groupe de quatre hôpitaux parisiens regroupant l'Assistance Publique-Hôpitaux de Paris (AP-HP), ils cherchent à améliorer la flexibilité de leur personnel. Ils ont utilisé un ensemble de données de 10 années d’hospitalisation, jusqu’à un niveau granulaire du nombre d’admissions par jour, ainsi que l’heure du jour, et l’ont combiné avec les données météorologiques, le profil de la grippe et les jours fériés..
À l'aide de l'apprentissage automatique, ils ont ensuite affiné leurs algorithmes pour les tendances futures afin de prévoir le nombre d'entrées à venir pour différents jours et moments. Le résultat est qu’ils disposent désormais d’une interface conviviale, basée sur un navigateur, pour l’administration hospitalière, ainsi que d’un personnel clinique capable de prévoir les taux d’admission au cours des 15 prochains jours, ce qui permet d’obtenir du personnel supplémentaire à certains moments. nombre d'admissions prévu.
Étant donné que les données, et en particulier les données mobiles, sont générées à une vitesse ridiculement rapide, il est nécessaire d’adopter une approche fondée sur le big data pour transformer cet énorme volume d’informations en informations exploitables. Dans les exemples que nous avons cités ci-dessus, le défi a été relevé et, à mesure que davantage de données seront collectées, il sera plus possible d'accroître la qualité et l'efficacité dans un certain nombre de secteurs divers grâce à une analyse plus rapide et meilleure de ces ensembles de données disparates..
- Nous posons également la question suivante: le big data est-il un gros échec??