Derrière le terme CNRTL — parfois saisi comme « cntrl » par ceux qui le cherchent en vitesse — se cache bien plus qu’un simple dictionnaire en ligne. Le Centre National de Ressources Textuelles et Lexicales, créé en 2005 par le Centre National de la Recherche Scientifique (CNRS), est une infrastructure scientifique unique : un portail qui fédère dictionnaires, corpus, lexiques et outils d’analyse de la langue française. Son ancrage institutionnel est solide, adossé à l’UMR ATILF de Nancy-Université et intégré aux réseaux ORTOLANG et CLARIN à l’échelle européenne.
Sa pièce maîtresse ? Le Trésor de la Langue Française informatisé (TLFi). Ce dictionnaire colossal, version numérique d’un ouvrage paru en 16 volumes entre 1971 et 1994, recense 270 000 définitions couvrant les XIe et XXe siècles. Peu d’outils rivalisent avec cette profondeur historique.
Un portail lexical d’une richesse rare
Le portail lexical du CNRTL ne se limite pas au TLFi. Il donne accès à plusieurs éditions du Dictionnaire de l’Académie française — de la 1ère édition de 1694 jusqu’à la 9ème commencée en 1992 — ainsi qu’au Dictionnaire du Moyen Français couvrant la période 1330-1500. Les amateurs de sources anciennes apprécieront aussi le Thresor de la langue françoyse de Jean Nicot (1606), le Dictionnaire de Trévoux (1740) ou encore l’Encyclopédie de Diderot et d’Alembert.
Voici les principaux onglets thématiques du portail lexical :
- Étymologie — origine et histoire des mots
- Synonymie — mots de sens équivalent, issus du laboratoire CRISCO
- Antonymie — termes de sens contraire
- Proxémie — proximité sémantique, via le projet Prox du laboratoire ERSS
- Morphologie — formation et variations des mots
- Concordance — exemples d’usage tirés de la littérature classique
Un dictionnaire électronique d’expressions idiomatiques français-portugais / portugais-français complète l’offre : 3 918 expressions au total, dont 2 459 en français de France et 1 459 en portugais brésilien.
Des outils et corpus pour la recherche linguistique
Chercheurs en traitement automatique des langues, lexicographes ou étudiants trouveront des corpus directement exploitables. Frantext regroupe des centaines de textes littéraires du XVIIIe au XXe siècle. Le corpus DEDE, annoté pour les descriptions définies, contient 4 910 descriptions définies et 48 360 mots issus du journal Le Monde (septembre 1987).
| Outil | Fonction principale |
|---|---|
| Flemm v3.1 | Analyseur flexionnel compatible Brill et TreeTagger |
| Derif | Analyse morpho-sémantique des néologismes |
| FastKwic | Indexation automatique et concordancier |
| Pompamo | Détection de candidats à la néologie |
Le lexique MORPHALOU mérite une mention spéciale : 540 000 formes fléchies issues de 68 000 lemmes, téléchargeable librement. Jean-Marie Pierrel et Étienne Petitjean ont présenté ces ressources lors de la 14ème conférence TALN à Toulouse du 5 au 8 juin 2007. Le CNRTL, accessible sur navigateur via des extensions pour Firefox et Chrome, reste aujourd’hui la référence incontournable pour quiconque travaille sérieusement sur le français.
- CNRTL : ressources textuelles et lexicales - 15 avril 2026
- Test TCF gratuit en ligne : évaluez votre niveau - 13 avril 2026
- Savoir gré : « je vous saurais gré » ou « serais » - 11 avril 2026