Simplifions-nous l'AI par Bertil Wicht

Êtes-vous en train de lire cette newsletter dans le train, au bureau, sur les toilettes, ou encore sous la couette ? Vous avez peut-être dégainé votre téléphone ou peut-être, êtes-vous déjà derrière un laptop, à partir duquel vous avez, comme un rituel, cliqué sur la petite icône qui représente une enveloppe, symbole d’une époque où l’enveloppe était encore l’objet qui renfermait le message et non des paquets de données qui se déploient sur un réseau.

Aujourd’hui, plutôt que de parler du contenant du courrier électronique, évoquons son contenu : le format textuel.

Comme la majeure partie de ce que nous lisons sur nos écrans, la rédaction d’un courriel passe d’abord par un logiciel de traitement de texte, avant d’être converti dans un format facilitant sa lecture ou sa transmission aux utilisateurs. Cette dissociation est essentielle : Le texte existe en effet indépendamment de l’environnement dans lequel il a été généré ou de son format de lecture. Votre texte existe dans un format brut “.txt”. Cette extension, il y a des chances que vous ne la rencontriez que très rarement, bien qu’elle soit celle de la très grande partie des données que vous consommez chaque jour.

Le texte brut est un format de base sur lequel, par la suite, on ajoutera du style par le biais de logiciels de traitement de texte. Grâce à eux, l’utilisateur annotera certaines parties de ce texte créant ainsi des documents prêts à être imprimés. Ces « annotations » permettent notamment de définir un titre, de souligner des passages ou encore de les présenter en italique. Il est aujourd’hui plus facile de surligner une phrase avec sa souris et de cliquer sur l’icône idoine pour la mettre en italique que de le faire à la main. Les interfaces utilisateurs sont bien là pour nous faciliter la vie, sans que nous ne nous posions trop de questions, à quoi bon nous la compliquer. Seulement, les ennuis commencent lorsque nous devons collaborer : passez un fichier Word d’un mac à un PC ou collez votre belle mise en page sur un Word en ligne et il y a de grandes chances pour que celle-ci subisse des modifications que vous n’avez pas demandées et des fois, ce n’est vraiment pas le moment !

En plus, ce que je viens de vous décrire, c’est dans le meilleur des cas. Comme nous sommes entourés de licences Microsoft office, nous avons tendance à ignorer qu’il existe d’autres logiciels. Ce n’est que lorsque nous n’avons plus accès à Word que nous nous rendons compte de tout ce qu’il facilite dans notre travail. On le voit déjà dans les universités lors d’échanges de travaux, notamment avec des professeurs, lorsque chacun utilise son logiciel et sa méthode d’annotation de texte. Dans les faits, ce problème a déjà été réglé depuis longtemps grâce à des logiciels ouverts comme Open document, sans limites d’accessibilité ou de prix. Il y a donc des solutions.

La question de l’édition d’un texte est ainsi aujourd’hui un faux problème, dès lors que chacun peut utiliser librement son logiciel de traitement de texte ; nous sommes sur ce front en période de paix après les affrontements violents qui ont opposé les défenseurs de Emacs, Vim ou encore d’autres logiciels. C’était l’époque où l’on traitait encore les format “.txt” directement dans les consoles et il n’était alors pas possible de livrer bataille en lançant sa souris sur un adepte de l’autre faction, non pas parce que ces souris étaient filaires, mais parce qu’elles n’étaient pas encore présentes sur tous les bureaux. Les interfaces utilisateurs ont grandement facilité l’utilisation des outils informatiques et la simplicité actuelle fait apparaître bien futiles les difficultés d’avant.

Le problème surgit lorsque nous utilisons d’autres formats que le “.txt", car non seulement nous compliquons les échanges de documents, mais surtout nous empêchons en partie le traitement automatique de ceux-ci. En effet, quand tous les fichiers sont sur le même format et suivent une structure similaire, il est aisé de les organiser, d’y rechercher des informations ou de créer des bases de données à partir de ceux-ci. Il est plus simple de chercher une information en faisant “ctrl-f” sur une page de texte que de la chercher dans la photo d’un passage que vous avez tiré de la lecture d’un nouveau livre sur la startup nation. Je m’explique : prenons le format PDF qui est lui aussi largement utilisé. Il semble avoir été pendant longtemps la solution miracle pour l’impression de documents. Toutefois, maintenant que le greenwashing (ou écologie pour certains) et l’intelligence artificielle (l’automatisation) sont devenus les deux maîtres mots que les entreprises mettent en avant pour montrer qu’ils sont à page, on commence à voir les difficultés apparaître. Tout doit être numérisé pour ne plus utiliser de papier et tout doit être automatisé pour aller plus vite.

Le propos n’est pas ici de dire que c’était mieux avant, mais plutôt que nous n’avons pas encore les bons outils pour cette transition. Lorsqu’on essaie de traiter automatiquement des PDF, on tente, dans le meilleur des cas, de trouver l’information dans un document textuel qui a été converti et dans lequel il est possible de retrouver du texte. Malheureusement, le plus souvent, puisque le PDF est en fait un format de présentation qui ne dissocie pas le contenu de son aspect visuel, il s’agit de trouver dans une photo, des informations textuelles. Si vos contrats et vos factures sont numérisées en format PDF, elles peuvent bien sûr être organisées dans vos disques durs d’une manière à pouvoir être facilement trouvables par le titre, mais vous devrez ouvrir le document pour trouver précisément l’information recherchée. Pour pouvoir directement interagir avec une base de données, il faudrait procéder à de l’extraction de données, ce qui permettra ensuite d’avoir accès à chaque élément séparément pour ensuite inscrire chacun de ces éléments dans ladite base pour pouvoir ensuite faire une recherche sans recourir à une recherche manuelle. Faire de l’extraction sur un PDF n’est pas toujours facile, parce que chacun structure ses documents comme bon lui semble. Les enjeux dans ce domaine sont les mêmes que ceux relatifs aux voitures autonomes qui utilisent des caméras pour analyser leur environnement. La technologie est certes bien avancée, mais elle doit encore être perfectionnée et les corrections requièrent une attention humaine. Quand il s’agit d’archives de grande taille, l’état actuel de la technologie est assez satisfaisant, mais pour améliorer l'efficacité, le travail doit commencer en amont à la création des documents. Pour certains, il est impératif d’avoir de beaux documents. Toutefois, pour pouvoir utiliser efficacement les outils à disposition, il faudrait anticiper les difficultés pour faciliter la transition vers l’automatisation et ce temps de gagné se traduirait aussi en argent économisé.

Les modèles actuels de reconnaissance de structure permettent déjà de mener de nombreux projets à bien mais il est important de continuellement penser à la manière dont nous créons, en vue de l’utilisation future ; le contenu à traiter est aussi important que les techniques que nous développons pour nous assister demain.

L’utilisateur lambda ne devrait pas avoir à se soucier de créer une structure explicite pour que son document puisse par la suite être traité par la machine. Vous avez cependant compris qu’en simplifiant l’information, on retrouve de la complexité dans les nouvelles solutions apportées, plutôt que de les rendre plus aisées.

N’avait-on pas dit que les interfaces utilisateurs étaient pour nous faciliter la vie ?

Photo Eftakher Alam

Simplifions-nous l'AI par Bertil Wicht

Posts récents

Comments