Le terme «Big Data» est un terme sans cesse évoqué dans le secteur des technologies de l’information, mais dans quelle mesure l’avez-vous réellement maîtrisé? Le Dr. Andrew Jennings, directeur des analyses chez FICO et responsable de FICO Labs, approfondit notre compréhension collective du sujet dans le cadre de notre programme spécial de questions-réponses..

Quels ont été les jalons clés dans l'histoire de l'analyse prédictive?

Parmi les premiers jalons, beaucoup provenaient d'applications militaires dans les années 1930 et 1940. Par exemple, Alan Turing et IJ Good ont élaboré des travaux novateurs sur l’attribution de poids de preuves à des variables spécifiques lorsqu’ils étaient impliqués dans le décodage de codes allemands au cours de la Seconde Guerre mondiale..

Les années 50 et 60 ont vu l’élaboration de méthodologies de modélisation, telles que le travail effectué par Bill Fair et Earl Isaac sur la notation de crédit..

À la fin des années 90, l'essor de la recherche sur Internet et de la personnalisation par eBay, Amazon et Google a certainement ouvert la voie à la montée en puissance du Big Data. Vous pouvez voir plus de jalons dans la récente infographie sur les analyses de FICO.

Quelles sont certaines des utilisations courantes de l'analyse prédictive aujourd'hui?

L'analyse prédictive est largement utilisée dans l'industrie du voyage, à la fois pour définir les trajectoires des vols et les prix des billets, et pour aider les consommateurs à trouver les meilleurs prix. Dans le secteur du crédit, l’évaluation des risques et la détection des fraudes sont essentielles..

Et, bien sûr, les spécialistes du marketing de nombreux secteurs l'utilisent pour identifier les meilleures offres pour chaque individu..

Le big data est sans aucun doute un sujet brûlant en ce moment, mais y a-t-il beaucoup d'entreprises qui utilisent déjà des informations Big Data dans leurs opérations quotidiennes??

Oui, et certaines entreprises ont tout leur modèle commercial basé sur l'analyse de données volumineuses. Farecast, une société créée pour aider les consommateurs à déterminer quand acheter des billets d’avion afin d’obtenir le meilleur prix, en est un exemple..

Comment l'essor du Big Data a-t-il affecté l'utilisation de l'analyse??

Aujourd'hui, de plus en plus d'entreprises réalisent qu'elles ne seront pas compétitives si elles ne peuvent pas exploiter les données..

Alors qu'auparavant, la plupart des analyses étaient ce que nous appellerions l'intelligence commerciale, centrée sur le reporting, les entreprises comprennent aujourd'hui le niveau de personnalisation nécessaire pour faire concurrence aux géants en ligne tels qu'Amazon n'est possible que si vous comprenez mieux vos clients et agissez en conséquence avec un service plus personnalisé.

Cela a entraîné une forte augmentation de la demande en matière d'analyse - l'industrie des logiciels d'analyse est passée de 11 milliards de dollars (7,2 milliards de livres sterling) en 2000 à 35 milliards de dollars (23 milliards de livres sterling) en 2012..

Quel type d'impact l'analyse de texte aura-t-elle?

L'analyse de texte et son équivalent, l'analyse de la parole, auront un impact considérable. Pour construire des modèles d’analyse prédictive, les informations doivent être fournies sous forme numérique..

Le traitement du langage naturel permet de convertir le texte et la parole en un format numérisé utilisable dans la modélisation. Étant donné que la plupart des communications humaines reposent sur la langue, nous disposerons d'un ensemble de données beaucoup plus vaste à utiliser dans les modèles, ce qui nous permettra de véritablement résoudre de nouveaux problèmes..

Par exemple, les termes que les gens utilisent lorsqu'ils effectuent des recherches en ligne sont analysés pour identifier l'épidémie d'une maladie dans une région donnée..

Que signifie l'intégration d'analyses dans une infrastructure de cloud computing pour le secteur??

Le nuage réduit la barrière à l'entrée pour les analyses. Plus d'entreprises que jamais pourront accéder aux analyses sans avoir à dépenser beaucoup d'argent en outils logiciels et en matériel informatique..

Premièrement, les entreprises peuvent "construire dans le nuage" à l'aide d'outils de modélisation..

Deuxièmement, les entreprises peuvent accéder à des services analytiques pré-développés pour des problèmes spécifiques, ou adapter rapidement des services analytiques à leurs activités..

Troisièmement, un nuage avancé peut mettre les entreprises en contact avec une communauté d'experts en analyse. Quatrièmement, certains nuages ​​créent un "marché de l'analyse" - un échange d'applications ou un magasin d'applications pour l'analyse développé par des tiers..

D'une part, les mégadonnées sont considérées comme une solution à de nombreux problèmes économiques et sociétaux pressants. D'autre part, les défenseurs de la vie privée soutiennent qu'une fois les données collectées, nous n'avons aucun contrôle sur qui les utilise ou comment elles sont utilisées. Comment les organisations peuvent-elles surmonter cette perception négative? Existe-t-il un code de déontologie relatif aux données volumineuses??

Il n’existe pas de code d’éthique relatif aux données volumineuses, mais il existe certainement des contrôles permettant de déterminer qui peut accéder à quelles données, non seulement les réglementations en matière de protection de la vie privée au niveau national mais également au niveau de l’industrie.

Les données financières d'un individu, telles que celles transmises à un bureau de crédit, sont soumises à des réglementations très strictes, par exemple. Le défi est que de nouvelles sources de données sont mises en ligne rapidement et que, dans certains cas, il peut y avoir un décalage entre le moment où les données sont disponibles et celui où les réglementations sont mises en place..

Il est important que chaque entreprise utilisant des données respecte l'esprit de la réglementation en matière de protection de la vie privée et détermine si son utilisation compromettra la protection de la vie privée..

Y a-t-il suffisamment d'experts en analytique pour répondre à l'explosion de la demande des entreprises??

Non, et c'est un problème. Entre 2011 et 2012, les postes pour les "scientifiques de données" ont bondi de 15 000%. Il y a un déficit de talents dans le monde entier et les personnes formées à l'analyse, aux statistiques et à la recherche opérationnelle sont en demande..

Malheureusement, la demande mondiale signifie qu'un certain nombre de personnes se déclarent être des experts en analyse moins bien formés que les professionnels qui exercent déjà le métier..

Cependant, la plupart des sociétés d'analyse et la plupart des équipes d'analyse au sein des entreprises sont dirigées par des analystes qui peuvent déterminer si un candidat à un poste possède les compétences nécessaires. L'analyste idéal possède les compétences en mathématiques, la mentalité d'un résolveur de problèmes et de bonnes compétences en communication..

Il existe certainement des universités fortes en Asie qui sont renommées dans le monde pour leurs programmes d'analyse et leurs diplômés, notamment l'Université Renmin, l'Université de commerce et d'économie internationale, l'Institut indien de statistique et l'Institut indien de technologie..

Le Harvard Business Journal a qualifié le data scientist de "travail le plus sexy du XXIe siècle", c'est donc un excellent moment pour être analyste.!

  • Dr. Andrew Jennings est directeur des analyses chez FICO et responsable de FICO Labs. Il blogue sur le Blog FICO Banking Analytics et le Blog de FICO Labs.