Un vérificateur orthographique pour la langue bambara


C’était une idée qui, ces dernières années, ressurgissait de temps en temps, elle a finit par voir le jour.

Écrire sur ordinateur devrait être plus facile pour les auteurs maliens. Oui mais voilà : il y a vraiment très peu de temps que l’alphabet bambara est réellement disponible, et entre-temps beaucoup de solutions ont été bricolées, incompatibles les unes avec les autres. Ceci devrait s’arranger, la solution a un nom : avec Unicode, tous les alphabets de la planète peuvent entrer dans l’ordinateur.

Au-delà de l’alphabet, il y a les mots. En bambara comme dans d’autres langues, c’est en écrivant qu’on se pose des questions : faut-il un é ou un è (en français) ? Ce mot s’écrit-il (en bambara) avec un o ou un ɔ (o ouvert), avec ny ou avec ɲ , avec un u ou avec un w ?…

Les traitements de texte d’aujourd’hui permettent de répondre à ces questions : si le mot est mal écrit, il est souligné en rouge, et l’ordinateur propose la bonne orthographe (ou plus souvent : les bonnes orthographes possibles : il faut alors choisir !). C’est ce qu’on appelle le « vérificateur orthographique », ou « correcteur » : j’hésite à employer ce mot car le « vérificateur » informatique ne remplacera jamais le métier très noble et exigeant de « correcteur », métier qui a été victime de licenciements chez la plupart des éditeurs et journaux, dont les pages sont maintenant remplies de fautes inacceptables que l’on ne trouvait pas il y a quelques années, rendant la lecture plus difficile.

Oui mais voilà : pas pour toutes les langues ! Environ 40 langues ont un vérificateur orthographique. Certaines sont même richement dotées : Pour le français, on distingue bien sûr le français du Canada… mais aussi le français du Luxembourg et même celui de Monaco ! Seules 3 langues africaines ont un vérificateur orthographique : Le swahili (langues bantoues de l’Afrique de l’Est), le shona (Zimbabwe, principalement), et le malagasy (Madagascar). Nous voici avec un tout nouveau vérificateur orthographique pour le bambara.

Il est disponible sur les traitements de texte et outils bureautiques libres et gratuit : Open Office, Libre Office, Néo Office, et sur les ordinateurs Windows, Mac, et Linux.

Qu’est-ce qui a rendu ceci possible ? D’abord l’énorme travail fait par les linguistes qui ont publié des dictionnaires et des grammaires ces dernières années : ces dictionnaires sont maintenant disponibles sur ordinateur ; les règles grammaticales de base comme les pluriels et les conjugaisons, et celles qui permettent de fabriquer des mots à partir d’autres mots, peuvent être codifiées pour être comprises par un ordinateur. Ces linguistes ont rencontré des informaticiens, tous ces gens là ont eu des rêves…  Je suis un de ces derniers, un modeste étudiant en licence de bambara, qui a une petite expérience en informatique  ( jean jacques Meric)

Comment ça marche ?

Dans l’utilisation quotidienne, un vérificateur apporte du confort : on est rassuré de ne pas laisser passer une faute d’orthographe énorme. Enfin presque toutes les fautes…

Car un vérificateur est toujours imparfait, et il vous laisse un large part de travail : bref, c’est un outil et comme tout outil il faut apprendre à s’en servir, et apprendre quand il ne faut pas s’en servir.

Prenons un exemple

Voici une page avec un conte écrit par Umaru Jara, instituteur, sur un cahier, et le même conte tapé sur l’ordinateur :

warabilen (1)

On voit quelques mots soulignés avec une vaguelette rouge : Nbɛ, tuɲan, Libaabanun, mɔgɔnifin, jɛlenbɛ, naafɔ.

D’abord rassurons-nous : seul celui qui tape le texte sur ordinateur voit ces mots soulignés en rouge : quand on imprime, par exemple, elles ne s’impriment pas !

Ensuite, pour chacun de ces mots, l’auteur peut demander (clic droit) quelles sont les corrections possibles : ainsi l’ordinateur propose bien "N bɛ" à la place de "Nbɛ". Mais remarquez que l’ordinateur est un peu idiot : il propose des mots qui s’écrivent presque pareils, comme « Bɛn » mais qu’on n’aurait pas idée de mettre à cet endroit dans une phrase. C’est que l’ordinateur ne reconnaît pas la phrase et sa grammaire, il ne connaît que des mots isolément, il ignore les relations entre eux : il ne fait que comparer un mot avec la liste des mots possibles dans le dictionnaire. Pour "tuɲan" il ne trouvera pas qu’il s’agit de "tiɲɛ", mais pour "mɔgɔnifin" il proposera la bonne orthographe, et elle seule : "mɔgɔninfin"

Enfin, ce dictionnaire est toujours incomplet : Par exemple ici il ignore le village (probablement inventé pour le conte) de Libaabanun, bien qu’il connaissent quelques centaines de noms de pays et de villes. Avec 15.000 mots c’est certainement un des plus complets, mais il est sûr et certain que certains mots qu’utilisent les griots manquent encore, que le vocabulaire de certains métiers est mal représenté… Nous comptons sur les écrivains pour nous les signaler, afin que nous les ajoutions aux versions futures.

Prenons un autre exemple

Il s’agit d’un extrait d’un roman très bien écrit de Tumani Yalam Sidibé. C’est moi qui ai ajouté les couleurs. Désolé ce sont des couleur criardes : Elles sont là pour montrer que le vérificateurs reconnaît bien plus que les mots du dictionnaire. Le plus simple : en vert les pluriels des mots, comme "tungafɛtagalaw". En jaune, les mots composés qui ne sont pas dans le dictionnaire, mais qui font la richesse expressive du bambara, comme "masirimafɛn". En violet les conjugaisons des verbes : "kɛra", "sɔnnen". En gris, les variantes acceptées : "janjo" au lieu de "janjon", "segi" (dans "segilen") au lieu de "segin" (utilisé plus loin dans "seginna"). Il y a bien d’autres choses, comme le "ya" de "yamaruya" par exemple en ocre.

Très peu de mots sont soulignés en rouge

"Cɛmalenbugu" n’est pas dans le dictionnaire, donc "Cɛmalenbugukaw" est souligné en rouge, mais Segukaw ne serait pas souligné en rouge, car Segu est dans le dictionnaire. Si on utilise beaucoup ce nom de village dans le texte et qu’on en veut pas être dérangé par le  "souligné en rouge", on peut tout de suite indiquer "ignorer l’erreur pour ce mot à l’avenir".

"jagabo" est souligné car le dictionnaire ne connaît que "jakabo", et pour Fɛrɛbɔ, le vérificateur propose Fɛɛrɛbɔ… La correction de cette page ne demanderait donc pas plus de 3 secondes.

L’avenir

Nous aimerions beaucoup que les auteurs en langue bambara utilisent ce correcteur et nous en parlent, afin de l’améliorer. Un bon exemple d’utilisation : plusieurs auteurs pour un seul livre de médecine au village (voir le projet : http://www.dokotoro.org) – il est donc important que le bambara soit écrit de la même façon du début à la fin du livre ! Le vérificateur peut être utile pour ce projet. Nous pensons également que, bien encadré par les professeurs, son utilisation peut être utile aux élèves qui apprennent le bambara à l’école ; nous serions ravis d’avoir des nouvelles directement de la salle de classe !

De notre côté nous continuerons d’augmenter le dictionnaire (avec votre aide!), d’apprendre à l’ordinateur à proposer plus intelligemment la bonne orthographe, et nous rêvons à une suite avec correcteur grammatical (erreurs soulignées en vert)… Nous aimerions également proposer un dictionnaire, c’est à dire la possibilité en cliquant sur n’importe quel mot du texte, d’avoir accès à son sens (si possible, en bambara!), à ses synonymes, … A tɔ bɛ na !

ce-jalamugufintigi

Quelques liens

Le dictionnaire (celui utilisé pour le vérificateur) est en ligne sur le site du Corpus bambara de référence

Le vérificateur pour Open Office, Libre Office, Néo Office…

Le vérificateur pour Firefox (navigateur web) et Thunderbird (email)

Un clavier français/bambara pour Windows :

Un clavier français/bambara pour Mac OSX :

6 Responses to “Un vérificateur orthographique pour la langue bambara”

  1. Très intéressant, dommage que ça ne soit pas très bien diffusé ! Je l’ai quand même mis sur ma page facebook, et je le mettrai aussi sur mon site http://soueloum2.wix.com/djoyorofa. Bravo

  2. Vous avez tellement raison, quel dommage de lire les journaux remplis de grosses fautes !!! Même dans certains livres, certaines éditions, on peut voir que les correcteurs font cruellement défaut !!!

  3. Et pour Microsoft Office? Est-il possible de le faire fonctionner avec Microsoft Office (Word, Excel, etc.) aussi? Car les instructions d’installation me semblent conçues uniquement pour OpenOffice….

    • Merci à tous pour votre appréciation et votre aide. En effet, Sedey, ça n’est pas encore très diffusé, il faut dire que c’est tout nouveau et Fasokan en a eu la primeure.
      Francesco : je n’ai pas oublié Word, mais je suis en attente du bon contact chez Microsoft pour contribuer ce vérificateur.
      Une nouvelle version 1.4 devrait être diffusée fin janvier, on y travaille ! Celle-ci devrait être plus complète, fournir une meilleure aide pour les petites erreurs courantes, et surtout il y aura en plus un dictionnaire des synonymes… plus de nouvelles bientôt sur Fasokan!

Rétroliens

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

Suivre

Recevez les nouvelles publications par mail.

Joignez-vous à 1  222 followers

%d bloggers like this: