Données lexicales
Sources pour les mots croises français
Aide Mots Croisés sera construit à partir de sources lexicales françaises ouvertes, avec une politique prudente: n'indexer que les pages dont les définitions, les synonymes et les indices sont assez solides.
§ 1
Lexique 3
Base lexicale française avec formes, fréquences et informations morphologiques utiles au classement.
Licence: licence Lexique 3 à vérifier et attribuer dans le pipeline
§ 2
WOLF / WordNet Libre du Français
Relations sémantiques, synonymes et familles de sens pour enrichir la recherche.
Licence: licence WOLF à conserver par source importée
§ 3
Wiktionnaire / DBnary / Kaikki
Définitions et formes complémentaires. Les textes dérivés du Wiktionnaire doivent garder leur attribution.
Licence: CC BY-SA pour les données Wiktionnaire
§ 4
Rédaction et indices vérifiés
Les indices de mots croisés doivent être courts, naturels, non ambigus et relus avant d'entrer dans les sitemaps.
Licence: rédaction originale pour les indices manuels
Politique de lancement
Indices d'abord, qualité d'abord
Les premiers sitemaps publics doivent privilégier les pages d'indices vérifiés et les pages principales. Les grandes listes de mots attendront que la base ait assez de définitions, de synonymes, de fréquences et de contrôle éditorial.