Hello World !

Le 21-10-2019 Meta 3 minutes

Bienvenue sur ledatablog !

L’objectif de ce blog est de parler de la data au sens large. Les sujets abordés seront essentiellements les suivants :

  • l’Intelligence Artificielle
  • la Business Intelligence
  • le langage de programmation Python
  • La data

Voyons rapidement sous quels biais ces thématiques seront traitées :

L’Intelligence Artificielle

Les articles de presse vendent parfois l’IA comme l’équivalent de Terminator. Elon Musk déclarait par exemple en 2017 “L’IA est le plus grand risque qui nous menace en tant que civilisation”. Au risque de décevoir les amateurs de science fiction, l’Intelligence Artificielle telle qu’elle existe aujourd’hui, et telle qu’elle est envisagée pour, a minima, les dizaines d’années à venir, n’a rien à voir avec une prise de pouvoir par les robots. Cela n’empêche pas que l’automatisation du travail est aujourd’hui une réalité qui s’accélère, même si celle-ci est en grande partie dûe à une informatisation à laquelle l’Intelligence Artificielle est assez étrangère. En bref, de nombreux emplois sont automatisés, mais c’est bien davantage grâce à des programmes informatiques “basiques” (gestion d’emploi du temps, réservation en ligne, …) que grâce à des algorithmes faisant appel à une quelconque IA (même si ces derniers existent et commencent à jouer un rôle).

On parlera donc dans ce blog de l’Intelligence Artificielle comme domaine de recherche, et probablement plus spécifiquement du traitement des langages, c’est à dire de ce que l’ordinateur est capable de faire avec du texte “humain”. Cela recouvre des sujets tels que la traduction automatique, la génération automatique de résumés, l’analyse de sentiments, détection de fake news, … On parlera également à l’occasion de l’impact de ces approches sur la société, ou de lectures à ce sujet.

La Business Intelligence

La Business Intelligence (Informatique décisionnelle en français, convenez que c’est moins sexy) est la discipline qui consiste à aider les décideurs ou dirigeants d’Entreprise dans leurs décisions. La BI commence par une visualisation “simple” des données de l’Entreprise (chiffre d’affaires et sa ventilation, comptage des clients et de leurs dépenses, …) pour ensuite permettre l’analyse de ces données et la création d’indicateurs pertinents (churn ou nombre de clients résiliant chaque mois, prévisions de chiffre d’affaire, …) et, en bout de chaîne, mettre en place des actions pour améliorer la santé de lEntreprise (orientation des forces commerciales, communications personnalisées avec les clients, prévention du churn, priorisation des prospects, …).

On parlera ici de certains cas d’usages et de l’intérêt de l’exploitation de la data, y compris par des Entreprises de taille moyenne. On y parlera néanmoins pas d’Intelligence Artificielle appliquée au business, étant donné que les exceptionnelles Entreprises concernées par ce genre d’approches sont les très (très) grandes Entreprises, et que l’immense majorité des approches de BI ne font pas appel à l’IA, mais à des approches statistiques “standards”.

Le langage de programmation Python

Python est un langage de programmation informatique, leader dans le domaine de l’Intelligence Artificielle, et leader dans la BI dès lors que l’on sort des approches par interface (la majorité de la BI est réalisée via des outils type Qlik ou SAS, aux licences coûteuses, mais plus simples à utiliser grâce à leurs interfaces graphiques).

Ce blog a une vocation plutôt généraliste, et on évitera tant que possible les billets spécialisés sur le langage, mais étant un grand utilisateur, et participant occasionnellement à des conventions autour du langage, il est probable que quelques articles s’y attardent.

La data

Certains cas d’usages ne rentrent ni dans la BI, ni dans l’IA. J’ai par exemple, durant les élections 2017, écrit plusieurs billets sur l’usage de Twitter des candidats, et réalisé quelques analyses statistiques de leurs discours. Ces billets seront republiés ici, et j’encourage vivement à la reprise de ces travaux lors des prochaines échéances électorales. Elles apportent un éclairage intéressant, et ont été assez présentes aux US lors des dernières élections, mais assez peu en France.

Mon chat devrait clore chacun des billets de ce blog.


Next

Ne laissez pas vos données devenir des Gremlins !

Ne pas prendre assez soin de ses données clients expose à de nombreux risques. Pourquoi avoir une source de données unique (single source of truth) est-il primordial, et à quels risques vous exposez-vous si vous n'en disposez pas ?