REDAC
REssources Développées À CLLE CLLE : Cognition, Langues, Langage, Ergonomie






GLAFF

GLAWIEnglish version
GLÀFF et WiktionaryX
Description
GLAWI est un dictionnaire électronique libre du français encodé au format XML. Il s'agit d'une version structurée et normalisée du Wiktionnaire (l'édition française de Wiktionary).
Cette ressource contient :
  • des mots simples, mots composés et locutions
  • des formes fléchies et leur lemme
  • l'étymologie des mots
  • des prononciations, au format API
  • des définitions (gloses et exemples)
  • des traductions
  • des relations sémantiques
  • des relations morphologiques
  • des variantes orthographiques
Des éléments de description du format de la ressource et du processus de conversion (extraction de l'information, structuration et normalisation) sont décrits dans (Sajous and Hathout, 2015) et (Hathout and Sajous, 2016).

Concepteurs
Franck Sajous, Nabil Hathout et Basilio Calderone

Responsable ressource
Franck Sajous
Contact :

Droits/Crédits
Certains droits sont réservés. GLAWI est diffusé sous licence Creative Commons By-SA 3.0.
Le logo de GLAWI est réalisé par Darwin.

Documentation
Une documentation en ligne présente la structure de GLAWI et en donne des extraits à titre d'illustration.
Pour plus d'informations, se reporter aux articles mentionnés dans la section Références ci-dessous.

Outils
G-PeTo (GLAWI Perl Tools) est un ensemble de programmes que nous diffusons pour permettre la manipulation de GLAWI, en particulier l'extraction de sous-lexiques et de contenus spécifiques. Les scripts peuvent être utilisés en l'état ou adaptés par vos soins à vos besoins particuliers.

Téléchargement
GLAWI est disponible sous plusieurs versions : la version "travail" est celle qui correspond probablement à la majorité des utilisations. La version "développement" comprend des informations supplémentaires relatives au processus d'extraction et de conversion. Les deux versions sont disponibles avec ou sans l'analyse syntaxique des sections étymologiques et des définitions. Les tailles indiquées correspondent à celle de l'archive à télécharger et à celle du fichier une fois décompressé.
Les deux versions, mises à disposition le 18/05/2016, sont issues du Dump du Wiktionnaire du 26/12/2015.


TRAVAILDEV
DTDDTD_GLAWI_work.dtdDTD_GLAWI_dev.dtd
Sans analyse syntaxique GLAWI_FR_work_D2015-12-26_R2016-05-18.xml.bz2
(81Mo/1.7Go)
GLAWI_FR_dev_D2015-12-26_R2016-05-18.xml.bz2
(118Mo/2.2Go)
Avec analyse syntaxique GLAWI_FR_workParsed_D2015-12-26_R2016-05-18.xml.bz2
(214Mo/3.4Go)
GLAWI_FR_devParsed_D2015-12-26_R2016-05-18.xml.bz2
(251Mb/3.9Gb)


Références