documentation automatique (suite)
Langages d’interrogation
Actuellement, on ne peut envisager l’accès automatique à l’analyse du contenu explicite d’un document en fonction d’une perspective particulière ; par exemple, il n’est pas possible de demander s’il constitue un apport original à la stratégie d’une recherche en cours. Cela impliquerait un processus d’analyse critique du contenu sémantique dont on n’imagine pas comment une machine pourrait l’aborder. Tout ce qui est possible, c’est d’accrocher à l’adresse d’un texte un certain nombre de « fanions » de signalisation. Faire une recherche documentaire automatique par le contenu, c’est sélectionner des porteurs de fanions. Le mode le plus élémentaire est de les détecter soit seuls, soit groupés, mais sans liens entre eux. On pourrait par exemple caractériser un texte par : cybernétique, automatique, ordinateur, mémoire, optique, cartes perforées, etc. On saisit immédiatement l’indigence et le danger d’un tel système. Il conduit à éliminer des textes fondamentaux et à submerger le demandeur de textes inutiles. Il est nécessaire d’articuler les mots clés (les fanions) entre eux en fonction du sens de la recherche entreprise, et cela conduit à l’élaboration d’un langage, fût-il très sommaire. Son lexique est composé des mots clés, l’articulation de ces mots entre eux étant le fait d’une syntaxe. Un certain nombre de programmes d’ordinateurs ont été construits à cette fin. On a élaboré des algorithmes de recherche fondés sur l’analyse statistique de l’occurrence des termes, l’établissement de niveaux hiérarchiques entre les mots clés, l’étude des couplages de mots clés entre eux avec de nouveau analyse statistique de l’occurrence des seconds mots clés en fonction de celui qui les précède, etc. La faiblesse de ces systèmes, déjà cependant très efficaces, est qu’ils sont élaborés une fois pour toutes et non en fonction du besoin propre de chaque utilisateur. (V. documentaire [analyse].)
Procédures de recherche
Elles sont évidemment directement fonction du langage d’interrogation. Cela signifie que le résumé du document, résumé qui est le pivot du système documentaire, doit être établi à partir du document original par un « traducteur » ; de même, la question posée devra préalablement à toute opération être traduite dans le langage d’interrogation. Tout cela mène à une perte sémantique considérable.
Finalement, l’intéressé va recevoir une liste de références ; certains systèmes optiques délivrent, eux, le texte original. Mais ces derniers systèmes, qui sont étrangers aux techniques d’ordinateur, n’ont pas encore les capacités de stockage nécessaires pour aborder les grands problèmes documentaires. De toute façon, ceux-ci transcendent les moyens dont on dispose actuellement. En effet, une documentation bien faite, à l’échelle des publications mondiales, conduirait à délivrer à l’utilisateur, pour une question même modeste, quelques milliers ou même quelques centaines de milliers de documents pertinents. L’obstacle moderne de l’informatique devant le temps réel, c’est-à-dire devant le temps dont on dispose pour donner obligatoirement une réponse à une question, se retrouve dans toute son acuité. Tous les systèmes actuels se contentent de proposer l’équivalent d’un bibliothécaire stupide, mais extraordinairement rapide, ce qui ne permettra jamais de résoudre les difficultés combinatoires de la recherche. La documentation qui devient nécessaire est celle qui serait constituée par une collaboration de la machine et du chercheur, telle que la première propose au second une stratégie extraite de la masse documentaire, le rôle du dernier étant de la contrôler et de l’orienter de nouveau en fonction de sa réflexion propre et de son intuition.
J. S.
L. I. Gutenmaker, Traitement électronique de l’information (Éd. Radio, 1961). / B. C. Vickery, On Retrieval System Theory (New York, 1961 ; 2e éd., 1965 ; trad. fr. Techniques modernes de documentation. Analyse des systèmes de recherches de documents, Dunod, 1962) ; Faceted Classification. A Guide to Construction and Use of Special Schemes (Londres, 1960 ; trad. fr. la Classification à facettes. Guide pour la construction et l’utilisation de schémas spéciaux, Gauthier-Villars, 1963). / F. Paycha, Cybernétique de la consultation. Logique et morale de la médecine (Gauthier-Villars, 1963). / L. Couffignal, les Machines à penser (les Éditions de Minuit, 1964). / R. C. Cros, J.-C. Gardin et F. Lévy, l’Automatisation des recherches documentaires. Un modèle général : le Syntol (Gauthier-Villars, 1964 ; 2e éd., 1968). / J.-C. Gardin, E. de Grollier et F. Levery, l’Organisation de la documentation scientifique (Gauthier-Villars, 1964). / A. Dewèze, Traitement de l’information linguistique par l’homme, par la machine (Dunod, 196). / M. Coyaud et N. Siot-Decauville, l’Analyse automatique des documents (Mouton, 1967). / G. Salton, Automatic Information, Organization and Retrieval (New York, 1968). / M. Van Dijk et G. Van Slype, le Service de documentation face à l’explosion de l’information (Bruxelles, 1969). / J.-P. Trystram, la Documentation automatique (Dunod, 1971).