IREQ-Francais.dico -- Un dictionnaire franais pour ispell 3.1

  Copyright (c) 1993, 1994, 1995 Martin Boyer et Hydro-Qubec.

    Ce programme est un logiciel libre: vous pouvez le redistribuer
    et/ou le modifier selon les termes du "GNU General Public
    License", tel que publi par le "Free Software Foundation"; soit
    la version 2 de cette licence ou ( votre choix) toute version
    ultrieure.

    Ce programme est distribu dans l'espoir qu'il sera utile, mais
    SANS AUCUNE GARANTIE; sans mme la garantie implicite de valeur
    commerciale ou d'aptitude  satisfaire un but donn.  Se rfrer
    au "GNU General Public License" pour plus de dtails.

    Vous devriez avoir reu une copie du "GNU General Public License"
    en mme temps que ce programme; sinon, crivez  "Free Software
    Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA".


1. INTRODUCTION
---------------

Cet ensemble de fichiers constitue une liste de mots franais et, de
concert avec les logiciels buildict et ispell (versions 3.1.04 et
ultrieures), forme la base d'un correcteur d'orthographe.  La version
courante (1.4) contient 24419 mots simples et 23199 mots "affixs",
reprsentant un total de 221376 mots ou variations de mots.

Pour faciliter la correction du dictionnaire, les mots sont groups
selon leur type (noms communs et adjectifs, noms propres, verbes du
premier groupe, verbes du deuxime groupe, etc.).  Le fichier MANIFEST
identifie chaque fichier de cette liste.  Tous et seulement les
fichiers contenant des mots franais se terminent par l'extension
".dico".  Les fichiers contenant des mots anglais se terminent par
l'extension ".dict".

Un fichier spcial, "francais.aff", dcrit les rgles de modification
des racines qui permettent de crer plusieurs mots  partir de
variations sur une mme racine.  Ce fichier dcrit aussi les
caractres accepts par le correcteur d'orthographe et leurs
quivalents en syntaxe TeX.

Le site d'archive principal est:

       Site: ftp.robot.ireq.ca
       Rpertoire: /pub/ispell
       Fichier: francais-IREQ-1.4.tar.gz

Il y a aussi un site miroir :

       Site: ftp.ibp.fr
       Rpertoire: /pub/ispell/francais
       Fichier: francais-IREQ-1.4.tar.gz


2. INSTALLATION
----------------

Pour utiliser ce dictionnaire, vous devez d'abord installer ispell
3.1.04 ou une version plus rcente.  Au moment de l'criture de ces
lignes, la version 3.1.13 est la version courante.  Ce logiciel est
disponible par ftp:

       Site : ftp.cs.ucla.edu
       Rpertoire : pub/ispell-3.1
       Fichier : ispell-3.1.xx.tar.gz ("xx" est le numro de version)

Je peux malheureusement pas rpondre aux demandes d'aide relatives 
ispell.  Vous pouvez contacter l'auteur, Geoff Kuenning
<ispell-bugs@itcorp.com> ou <geoff@ITcorp.com>, ou encore poster un
message  l'un des groupes suivants: gnu.emacs.help, comp.emacs ou
comp.text.tex.

Si vous dsirez MODIFIER la liste de mots dans le dictionnaire
francais-IREQ, vous devez vous procurer le programme buildict,
disponible  l'adresse suivante:

       Site: ftp.robot.ireq.ca
       Rpertoire: /pub/ispell
       Fichier: buildict.tar.gz

Buildict remplace le "shell script" munchlist fourni avec la
distribution standard de ispell.  Il peut tre utilis avantageusement
avec les dictionnaires anglais qui font partie de la distribution de
ispell et DOIT tre utilis pour construire de nouveaux dictionnaires
bass sur la description de langage contenue dans francais.aff.
Buildict N'EST PAS REQUIS POUR L'UTILISATION NORMALE du dictionnaire
francais-IREQ; un dictionnaire pr-compil, francais.dico, est
disponible.  La reconstruction de francais.dico peut demander
plusieurs heures et environ une centaine de mgabytes d'espace disque
temporaire.

 partir du dictionnaire francais.dico, tel que distribu ou construit
avec buildict, il est ncessaire de crer une table de hachage pour
accs rapide.  Le programme buildhash, qui fait partie de la
distribution standard de ispell, est utilis  cette fin:

% buildhash francais.dico ./francais.aff francais.hash

Avec la version 3.1 de ispell, cette opration est automatise si on
installe les fichiers de la distribution francais-IREQ dans le
rpertoire .../languages/francais-IREQ et que la ligne suivante est
insre dans le fichier local.h de la distribution ispell (sur une
seule ligne):

#define LANGUAGES "{english,MASTERDICTS=english.med+,\
		    HASHFILES=med+.hash,VARIANTS=american,\
		    EXTRADICT=/usr/dict/words} \
		   {francais-IREQ}"

Voir la documentation de ispell pour plus de dtails.

L'installation est simple et consiste  dplacer le fichier
francais.hash et  copier le fichier francais.aff dans le rpertoire
dsign  cette fin (LIBDIR, dans le Makefile de ispell).  Il faut
aussi diter le fichier Makefile de francais-IREQ; la dfinition de
LIBDIR dans ispell n'est pas propage dans francais-IREQ.

Si les lignes ci-haut sont prsentes dans local.h, l'installation se
fait automatiquement avec la commande "make install" dans le
rpertoire ispell.

Il est aussi possible de compiler et d'installer le dictionnaire
francais-IREQ indpendamment de ispell en faisant "make" et "make
install" dans le rpertoire .../languages/francais-IREQ.


3. UTILISATION
--------------

Il est essentiel, pour chaque utilisateur, de crer le fichier
.ispell_francais dans son rpertoire d'attache ($HOME).  Ainsi, les
ajouts personnels au dictionnaire principal seront distincts de ceux
du dictionnaire anglais.

Un rappel sur la faon de choisir la version franaise de ispell, une
fois l'installation termine:

% ispell -d francais fichier.texte	    (pour l'encodage ISO 8859/1)
% ispell -d francais fichier.tex	    (pour l'encodage TeX)
% ispell -d francais -T list -t fichier.tex (fichier TeX, encodage 8859/1)


 l'utilisation, vous remarquerez que les lisions (apostrophes)
causent des problmes.  J'ai choisi de faire de l'apostrophe une
partie possible d'un mot; ceci permet d'admettre, par exemple, le mot
"aujourd'hui" mais de rejeter "l'handicap", ou d'accepter "l'enfant"
en rejetant "l'enfants".  Idalement, ispell devrait tre modifi pour
permettre l'utilisation de rgles de modifications entirement
automatiques et une table des combinaisons lgales des rgles.  Il
serait ainsi possible d'admettre automatiquement l'utilisation de "l'"
devant une voyelle, mais pas devant une consonne et seulement devant
un mot singulier.  Pour l'instant, malheureusement, il faut ajouter
toutes les lisions possibles au dictionnaire.

Emacs ( partir de la version 19.23) et XEmacs supportent les versions
rcentes de ispell.  Les seuls changements  apporter sont l'ajout du
dictionnaire francais-IREQ et de ses caractristiques dans la liste
des dictionnaires supports.  Pour utiliser francais-IREQ avec Emacs
et TeX (avec l'encodage TeX), il faut crer deux liens symboliques: le
premier, du fichier francais-TeX.hash vers le fichier francais.hash,
dans le rpertoire de dictionnaires de ispell, et le second, de
.ispell_francais-TeX vers .ispell_francais dans le rpertoire
d'attache de chaque utilisateur.  Ceci parce que le nom du
dictionnaire dtermine l'encodage utilis par ispell.  Le contenu du
dictionnaire est indpendant de l'encodage utilis.

Une fois cette installation termine, Il suffit d'appeler la commande
emacs "ispell-change-dictionary" avec l'argument "francais-TeX" pour
utiliser ispell avec l'encodage TeX.  Pour les fichiers qui utilisent
l'encodage ISO 8859/1 (parfois appel ISO latin1), il suffit de
choisir le dictionnaire "francais", puisque ISO 8859/1 est l'encodage
naturel de francais-IREQ.

Voici ce que j'utilise comme dfinition du dictionnaire francais-IREQ
dans emacs:

    ("francais"                         ; francais.aff
     "[A-Za-z--]" "[^A-Za-z--]"
     "[-']" t nil)
    ("francais-TeX"                     ; francais.aff
     "[A-Za-z--\\]" "[^A-Za-z--\\]"
     "[-'^`\"]" t nil "~tex")

L'ajout de dictionnaires pour utilisation de ispell avec emacs est 
mon avis un imbroglio, mais ce n'est pas mon problme.  Le fichier
ispell-ireq.el (inclus dans la distribution de francais-IREQ)
fonctionne bien ici.  Il suffit de faire (require 'ispell-ireq).  
vos risques...



4. NOTES
--------

Si vous utilisez gcc avec SunOS 4.1.3 pour compiler ispell, les
versions antrieures  2.5.8 optimisent incorrectement la fonction
upcase(), dans le fichier makedent.c.  Il faut alors compiler ce
fichier (ou ispell au complet) sans optimisation.

Il faut s'assurer que ispell n'est pas compil avec l'option NO8BIT
(voir config.X).

videmment, je suis intress par toute erreur ou ajout utile au
dictionnaire, seulement si les modifications proposes sont vrifies
au pralable dans un (vritable) dictionnaire.  Vous pouvez
communiquer avec moi  l'adresse ci-dessous; je rpondrai dans la
mesure de mes moyens (c'est--dire selon le temps dont je dispose
aprs le travail).

Il existe aussi un autre dictionnaire franais pour ispell:

       Site : ftp.inria.fr
       Rpertoire : gnu
       Fichier : ispell-french.tar.Z


Many thanks to Geoff Kuenning for ispell and his interest to support
other languages.

Merci aux nombreuses personnes qui m'ont fait parvenir des corrections
au dictionnaire: Martin Beaudoin, Michel Pelletier, Rgis Houde et
d'autres chercheurs de l'IREQ, de mme que Pham Dinh Tuan, Robert
Germic, Tom De Pauw et Frdric Devernay.  Merci aussi  tous ceux qui
m'ont encourag  poursuivre ce travail.

Martin Boyer
Longueuil
25 novembre 1996


Envoyez vos commentaires, relevs de bogues et corrections :


  Martin Boyer                         http://www.robot.ireq.ca/Martin.Boyer/
  Division Robotique                                     mboyer@robot.ireq.ca
  Institut de recherche d'Hydro-Qubec             Tlphone: +1 514 652-8412
  Varennes, QC, Canada                                   Fax: +1 514 652-1316
