SYNAPSE Développement
21 Mars 2000

Lire notre communiqué de presse à propos de l'émission Canal Plus du 27 mars 2000

Communiqué de presse
à propos de "Anti-stress" et "Anti-arabes"

Synapse Développement, étant l'auteur du vérificateur orthographique fourni avec Office 2000, est directement visée par une campagne de désinformation initiée le 21 mars 2000 par un journaliste de Canal+ et abondamment reprise par l'ensemble des médias.

Le mot "désinformation" est violent mais ce communiqué en justifiera l'emploi. 90% des articles de presse parlent d'une "confusion" entre "anti-stress" (sans capitale) et "anti-arabes". C’est faux ! Le mot "anti-stress" (sans capitale) est reconnu et accepté par notre vérificateur ! C’est le mot " Anti-stress " (avec une majuscule) qui est absent de notre dictionnaire. Or, cette forme avec majuscule n’existe pas dans notre corpus, un corpus de plus d’un million de pages ! Mais remplacer la première lettre par une minuscule rend le mot plus commun et, du coup, la prétendue confusion devient plus spectaculaire. On comprend que ce seul élément nous permettrait d'attaquer en justice, si nous étions aussi procéduriers que d'aucuns.

Télécharger ce document au format Word 7/95 (34 Ko)

Sommaire

  1. Préalable
  2. Qu'est-ce qu'un vérificateur orthographique ?
  3. Comment fonctionne le vérificateur de Synapse Développement ?
  4. Comment fonctionne le vérificateur de Synapse Développement ?
  5. Pourquoi "Anti-arabes" est-il dans notre dictionnaire et pas "Anti-stress" ?
  6. Pourquoi le mot "Anti-arabes" prend-il un trait d'union ?
  7. Pourquoi notre vérificateur n'utilise-t-il pas un dictionnaire commercial usuel du type Larousse ou Robert ?
  8. Est-il possible d'éviter des rapprochements entre des mots aussi déplacés que "Anti-stress" et "Anti-arabes" ?
  9. Conclusion
  10. Annexe 1. Mots débutant par "anti-" dans notre dictionnaire
  11. Annexe 2. Quelques citations d’ "anti-arabe(s)" dans notre base

Préalable

Ce communiqué, surtout avec ses annexes, dépasse largement la taille habituelle des communiqués de presse et nous savons bien qu'aucun média n'en reprendra l'intégralité. Mais, face à des attaques multipliées et largement diffusées, il ne nous reste que la solution de détailler l'ensemble des processus et des raisons techniques ayant conduit au rapprochement algorithmique de "Anti-stress" et "Anti-arabes". Nous savons bien que dans la société du spectacle et dans le monde de l’information réifiée le discernement et la raison ne triomphent pas aisément mais il nous faut bien dénoncer cette étonnante niaiserie tant médiatisée.

Retour au menu

Qu'est-ce qu'un vérificateur orthographique ?

Un vérificateur orthographique répond au cahier des charges suivant :

Un vérificateur orthographique est donc un outil simple qui ne dispose d'aucune connaissance sémantique ni, le plus souvent, grammaticale. D'ailleurs ces connaissances seraient totalement inutiles puisque le but est de corriger des mots inconnus, donc sur lesquels aucune information grammaticale ou sémantique ne saurait être disponible.

Retour au menu

Comment fonctionne le vérificateur de Synapse Développement ?

Selon les principes généraux décrits ci-dessus, notre vérificateur recherche des suggestions pour les mots ne figurant pas dans ses dictionnaires. Notons ici que ces mots sont le plus souvent des mots fautifs (avec une ou plusieurs fautes d'orthographe), beaucoup plus rarement des mots existant vraiment mais ne figurant pas (encore) dans les listes de mots.

Pour rechercher ces suggestions, plusieurs mécanismes sont mis en œuvre :

Si aucune de ces méthodes n'a permis de trouver de suggestion, alors les mots des dictionnaires les plus voisins morphologiquement sont extraits et comparés au mot inconnu.

Retour au menu

Comment s'effectue la vérification de "Anti-stress" ?

L'ensemble des méthodes de recherche de suggestions décrites ci-dessus ne fournit aucune suggestion (chacun pourra vérifier qu'en intervertissant des lettres, en en ajoutant ou en en supprimant, on n'obtient aucun mot existant). Les mots voisins alphabétiquement sont donc extraits des dictionnaires. Ces mots sont peu nombreux.

En effet, la règle d'usage pour les mots débutant par "anti" est de ne pas mettre de trait d'union après le préfixe sauf si le mot suivant le préfixe commence par un "i" (comme dans "anti-infectieux"). La liste des 22 mots commençant par "anti-" et figurant dans nos dictionnaires est fournie en annexe. Parmi ces 22 mots, 3 seulement ont le même nombre de lettres que "Anti-stress" : "Anti-arabes", "Anti-émeute" et "Anti-romain". Comme seul le mot "Anti-arabes" a trois lettres communes ('e','r','s') avec le mot "Anti-stress", c'est ce mot qui devient la suggestion la plus probable. D'autant que le mot "Arabe" figure à la fois dans le dictionnaire de noms communs et dans le dictionnaire de noms propres, ce qui augmente la probabilité qu'il remplace un mot débutant par une majuscule.

Il suffit d'essayer quelques autres mots débutant par "Anti-" pour constater des phénomènes similaires. Exemples : pour Anti-arbre, suggestion : "Anti-arabe"; pour "Anti-Parisien", suggestion : Anti-raison; pour "Anti-Toulousain", suggestion "Anti-sous-marin", pour "Anti-rien", suggestion "Anti-romain", etc.

Retour au menu

Pourquoi "Anti-arabes" est-il dans notre dictionnaire et pas "Anti-stress" ?

Nos listes de mots ont été constituées à partir d'une base de plus d'un million de pages. Cette base est constituée de 2600 ouvrages (anciens et récents), d'un an de dépêches de l'AFP, de cinq ans d'articles du Monde, de textes extraits du Net (sites et groupes de discussion) et de divers textes techniques. On peut discuter de la représentativité de cette base par rapport au langage. Il demeure que ce corpus est le plus étendu en français, à notre connaissance et selon tous les chercheurs consultés. En le constituant, nous avons cherché à y intégrer de nombreux types de langages, en particulier par la sélection des 2600 ouvrages y figurant. Mais plusieurs critères objectifs comme la disponibilité de certaines bases ont également joué. Ainsi les cinq années d'articles du Monde proviennent de la commercialisation par ce quotidien de ses archives, service que n'offrent que peu de journaux.

Il se trouve que dans la totalité de notre corpus, le mot "anti-arabe(s)" figure 118 fois avec un trait d'union et 4 fois sous la graphie "antiarabe(s)" et que, par contre, le mot "anti-stress" ou "antistress" ne figure que 58 fois. Ce rapport de fréquences est flagrant lorsque l'on consulte les archives du Monde (www.lemonde.fr/services/0,2321,199-QUO,00.html). En demandant "anti-arabes" sur la totalité des archives, 1334 occurrences sont fournies, alors que pour le mot "anti-stress" sur la totalité des archives, 78 occurrences seulement sont trouvées, soit un rapport de fréquence de 17 à 1.

Retour au menu

Pourquoi le mot "Anti-arabes" prend-il un trait d'union ?

Comme décrit plus haut, la règle avec le préfixe "anti" est de ne pas mettre de trait d'union sauf avant un "i". Mais lors de l'emploi de mots récents ou de néologismes, comme "anti-jeunes", "anti-tabac", etc. on constate que la plupart des gens placent un trait d'union, sans doute pour mieux faire ressortir le préfixe "anti". De fait "anti-arabe(s)" figure 30 fois plus souvent avec un tiret que sans et "anti-tabac" par exemple figure 178 fois dans nos bases avec un trait d'union contre 66 fois sans trait d'union.

Retour au menu

Pourquoi notre vérificateur n'utilise-t-il pas un dictionnaire commercial usuel du type Larousse ou Robert ?

Les dictionnaires de référence sont des dictionnaires de définitions, conçus pour la lecture et non pour la vérification orthographique. Ils ne comportent qu'un nombre assez faible d'entrées (entre 50 000 et 60 000 pour les dictionnaires usuels). Surtout ils partent de présupposés lexicographiques. Ainsi certains adverbes courants manquent car l'adjectif ou le nom étant présent, le lecteur est supposé déterminer l'existence et le sens de l'adverbe d'après le nom ou l'adjectif. Dans certains dictionnaires, les noms de classes animales et végétales figurent toujours au pluriel : "coelentérés", "rosacées". La lourdeur des révisions et la fréquence des éditions font que certains néologismes y apparaissent tardivement (vocabulaire Internet par exemple).

Pour toutes ces raisons, il nous a semblé préférable de constituer nos propres listes à partir de nos bases, c'est-à-dire de plus de 3 milliards de caractères, pour l'essentiel des textes actuels mais aussi la plupart des grands classiques.

Retour au menu

Est-il possible d'éviter des rapprochements entre des mots aussi déplacés que "Anti-stress" et "Anti-arabes" ?

A notre avis, non. Rappelons que lorsqu'un mot ne figure pas dans nos listes (comme ici pour "Anti-stress"), nous n'avons aucune information sur ce mot et ne pouvons donc comparer son sens au sens des suggestions... En fait, on pourrait imaginer deux méthodes mais aucune d'elles n'est infaillible :

  1. Éliminer de nos listes tous les mots susceptibles d'être mal perçus comme suggestions, par exemple les mots offensants, argotiques, populaires, familiers. Le dictionnaire subira ainsi un élagage important mais cela ne fournira pas une garantie suffisante. D'abord parce que, pour reprendre l'exemple ci-dessus, en quoi "anti-arabe" serait-il considéré comme offensant, argotique ou même familier ? Si l'on supprime ce mot, il faut aussi supprimer "raciste", "antisémite", "nazi", "fasciste", etc. (en consultant l'annexe 2 de ce document, on constate d'ailleurs que le mot "anti-arabe" appartient au vocabulaire des anti-racistes et des journalistes spécialisés du Moyen-Orient).
  2. Ensuite, parce que beaucoup de mots familiers ou offensants correspondent à des mots courants de la langue, il ne s'agit que d'une acception injurieuse ou offensante parmi d'autres acceptions. Donc si l'on supprime ces mots, on supprime aussi des mots courants de la langue.

    Cet élagage de la langue est pourtant courant aux États-Unis, suite à la psychose du "politically correct". On osait croire qu'en France ce type de censure n'était pas d'actualité mais il semblerait que ce soit loin d'être le cas puisque même "anti-arabe" est frappé d'ostracisme, comme si le fait de supprimer les mots de la langue abolissait les comportements que ces mots définissent...

  3. Ajouter le plus grand nombre possible de mots aux dictionnaires afin que le vérificateur ne recherche des suggestions que pour des mots fautifs et non pour des mots inconnus. Nos listes de mots, telles qu'elles sont fournies actuellement par Microsoft portent sur plus de 82 000 lemmes (radicaux) pour les noms communs et 30 000 noms propres. Ces 82 000 lemmes correspondent à plus de 550 000 mots, soit environ 40% de plus que les dictionnaires courants (Larousse, Robert). Si l'on peut imaginer d'accroître le nombre de noms communs, il est inimaginable de saisir la totalité des noms propres existants (ce qui, par ailleurs, annihilerait l'utilité du correcteur pour des noms propres fautifs). Donc il restera toujours des cas où le vérificateur proposera des suggestions étranges, parfois offensantes, pour des noms propres ou pour des néologismes.

Pour avoir effectué des essais avec différents correcteurs dans plusieurs langues, nous savons qu'il est possible avec n'importe quel correcteur et n'importe quelle langue de trouver des cas où est, par exemple, remplacé le nom ou le prénom d'une personne par un mot offensant ou injurieux. Il suffit que le nom propre en question soit voisin phonétiquement ou morphologiquement du mot injurieux ou offensant.

Retour au menu

En conclusion

Les explications ci-dessus démontrent que le rapprochement des mots "Anti-stress" et "Anti-arabes" répond à des contraintes techniques et que ces contraintes sont inhérentes aux principes mêmes de tous les vérificateurs orthographiques. Il est intéressant de noter que sur les forums de discussion américains où cette campagne a été relayée, de très nombreux programmeurs se sont esclaffé et ont fourni des explications techniques qui ont réduit à rien cette polémique (cf, par exemple, www.zdnet.com/zdnn/stories/news/0,4586,2471939,00.html).

Sans forcer le trait, on peut considérer qu'il est aussi abusif d'attaquer l'algorithme qui rapproche "Anti-stress" et "Anti-arabes" qu'il serait abusif d'accuser Larousse de racisme parce que lorsque l'on recherche "antiaméricain" dans le petit Larousse, le mot précédent le plus proche est "antiallergique"... Le hasard des proximités morphologiques est aussi prégnant que le hasard de l'ordre alphabétique.

De fait toute personne ayant connaissance du fonctionnement d'un vérificateur orthographique ne peut que trouver ridicule cette polémique. Et toute personne ayant un jour utilisé un vérificateur orthographique sait que, sur un mot inconnu des dictionnaires, les suggestions sont souvent curieuses, parfois sémantiquement aberrantes ou offensantes.

Comment expliquer alors que cette affaire ait pris cette ampleur (plus de 50 spots sur France-Info par exemple...) ? Il y a pour nous deux raisons :

  1. Microsoft est devenu une personne publique. Il suffit de citer le nom de cette société dans un communiqué de presse, a fortiori de mettre en cause cette multinationale, pour que la publicité faite à ce communiqué soit infiniment plus importante. La ficelle est grosse mais elle marche toujours... et dans ce cas d'espèce la ficelle est d'autant plus grosse que Microsoft n'est pas en cause puisque c'est notre société qui a développé ce vérificateur !
  2. Face aux attaques et aux menaces de procès, Microsoft France a choisi de plaider coupable et cela n'a fait que renforcer les attaques (selon l'adage bien connu "haro sur le baudet"). Cette stratégie est d'autant plus étonnante que Microsoft n'était pas le concepteur du vérificateur et qu'il n'y avait aucune raison de plaider coupable !

Pour en revenir au mot "désinformation" utilisé en introduction, nous sommes pour le moins surpris qu'un seul journaliste (de IDG France) ait pris la peine de nous contacter, et après 4 jours de développement médiatique de cette affaire. Word 2000 dispose d'une boîte de dialogue d'informations sur ses composants et la première ligne de cette boîte est :

Dictionnaires et vérificateur orthographique © SYNAPSE Développement, Toulouse (France)

On ne peut donc prétendre que l'information n'était pas visible ! Microsoft France lui-même a fort logiquement indiqué qu'ils nous avaient sous-traité ce vérificateur... Faut-il croire que seul le nom de Microsoft intéressait les polémistes ?

Retour au menu

Annexe 1
Mots débutant par "anti-" dans notre dictionnaire

anti-absolutiste
anti-âge
anti-arabe
anti-autoritarisme
anti-autoritariste
anti-aveuglant
anti-crevaison
anti-éblouissant
anti-effraction
anti-émeute
anti-g
anti-impérialisme
anti-impérialiste
anti-infectieuse
anti-infectieux
anti-inflammatoire
anti-inflationniste
anti-populaire
anti-romain
anti-science
anti-sous-marin
anti-tabac

Retour au menu

Annexe 2.
Quelques citations d’ "anti-arabe(s)" dans notre base

Plusieurs de mes professeurs d'histoire furent à la fois antisémites, anti-arabes et réactionnaires et j'appris à associer antisémitisme, racisme et réaction. (La statue de sel, Albert MEMMI, 1953, Gallimard, Folio n°206)
Tout le monde sait bien qu'il n'y a pas LE racisme mais LES racismes : racisme anti-pauvre, racisme anti-jeune, racisme anti-femme, racisme anti-arabe...
Alors, si vous êtes une PAUVRE JEUNE FEMME ARABE !... (Petites drôleries, Guy BEDOS, 1989, Seuil, Point virgule)
Elle [La démocratie] est dénoncée chaque jour, partout dans le pays, comme une invention satanique des juifs et de l'ex-puissance coloniale, comme un modèle antinationaliste, anti-arabe, donc antimusulman, et de plus "impie", comme le proclame Ali Benhadj. (Une algérienne debout, Khalida MESSAOUDI, 1995, J’ai lu n° 4077)
Un beau matin, donc, deux flics du groupe anti-arabe, l'antigang du cru, celui-là même auquel appartenait l'espèce de dangereux péquenaud, no te mue vas, no te mue vas o te matos, qui m'avait arrêté calle Jiménez-Aranda, vinrent me chercher en voiture à la prison et m'emmenèrent dûment menotté au palais de justice. (Suerte, Claude LUCAS, 1995, Plon Pocket n°10593)
Ils annoncent que tu as fait la guerre d'Algérie, que tu étais tireur d'élite dans un commando anti-arabes, que, probablement, tu en es revenu un peu sonné. (Notes de sang, François JOLY, 1997, Gallimard, Série noire n° 2465)
On cherche dans le passé des victimes, on insinue que les cibles représentaient la lie de la société, un danger potentiel. L'ennemi intérieur est l'anti-arabe. (Vendanges en Bordelais, Jean-Christophe PINPIN, 1997, Comète)
Un peu avant de mourir, le détective avait avoué à l'ami de Spitzner qu'il était en train de "retourner" un petit comptable de l'organisation, avec la complicité d'un journaliste spécialisé dans l'investigation anti-arabe. (Babylone Babies, Georges G. DANTEC, 1999, Gallimard)
La propagande antibaassiste des Iraniens ne reçoit pas d'écho en Irak où la population, y compris les shi'ites, se regroupe autour de Saddam Hussein. Cette propagande prend également un aspect anti-arabe et antisunnite par des manifestations de pèlerins iraniens à La Mecque et par des menaces lancées contre les émirats du Golfe. (Encyclopaedia Universalis, article Iran)
À l'approche de la fin de la guerre, dès 1944, un terrorisme anti-anglais et anti-arabe se développe. Il est surtout le fait des groupes "dissidents" (la Haganah), c'est-à-dire l'Etzel (Irgoun Tsvaï Leumi dirigé par Menahem Begin depuis 1942) et le groupe Stern (qui comprend des éléments de gauche et de droite). (Encyclopaedia Universalis, article Israël)
Bien que ces mouvements aient parfois été anti-arabes et anti-musulmans, les Iraniens participèrent davantage à l'élaboration de l'islam qu'à sa destruction; même dans le mouvement shu'ubiya qui défendait les droits des non-Arabes, les discussions se faisaient dans la langue de l'élite arabo-persane, l'arabe. (Encyclopaedia Universalis, article Perse)
Le nationalisme exacerbé (anti-arabe et naguère anti-ottoman) et le fanatisme qui s'exprimaient dans ces commémorations ont entraîné leur interdiction. (Encyclopaedia Universalis, article Ta'ziyé)
L'orientation communiste de Zanzibar s'affirma dès les premiers jours de la révolution anti-arabe. (Encyclopaedia Universalis, article Zanzibar)
Mais, au-delà de ces dénonciations, les autorités s'étaient abstenues de frapper sévèrement les milieux extrémistes juifs, qui appelaient ouvertement à la violence anti-arabe et accusaient le gouvernement de trahison. (Le Monde, janvier 1997)
Malgré les crimes anti-juifs de Bordeaux et les horreurs anti-arabes de Charonne, Le Monde ne fait pas rejaillir la honte sur de Gaulle, Pompidou ou Giscard d'Estaing, qui ont pourtant placé Papon aux commandes de l'État. (Le Monde, février 1997)
Une enfance perturbée par une extrême nervosité sa mère a recours à des douches froides pour le calmer et il suce son pouce jusqu'à l'âge de douze ans, une scolarité chaotique, mais également la montée d'un "sentiment anti-arabe" à la suite d'agressions et "l'impression de ne s'être jamais senti en sécurité nulle part". (Le Monde, mars 1997)
Le second groupe, dit " comité d'action ", était composé de colons fanatiques, adeptes des thèses anti-arabes du rabbin Menahem Kahana. (Le Monde, mai 1997)
Lorsque je suis confrontée à des messages anti-arabes, raconte Zohara Ron, je me demande comment en tant que Juive je réagirais si je voyais leur équivalent antisémite dans des journaux allemands. (Le Monde, septembre 1997)
Très jeune, il est révulsé par le racisme anti-arabe et antijuif qui règne dans la colonie. (Le Monde, octobre 1997)
Autre rumeur devenue parole d'Évangile : la princesse de Galles serait morte dans un attentat, fomenté par les cercles "anti-arabes" d'Angleterre. (Le Monde, octobre 1997)

Retour au menu


Accueil | Produits | Support | Téléchargement | Français

© 2000 Synapse Développement - Tous droits réservés All rights reserved
Dernière mise à jour le Last updated:
Webmestre: synapse@synapse-fr.com
Design by RG Consulting