LOD_meta

Lëtzebuerger Online Dictionnaire – lod.lu

Le Lëtzebuerger Online Dictionnaire (LOD) est un outil officiel de documentation de la langue luxembourgeoise, dont les origines remontent au Règlement grand-ducal du 29 juillet 1999 portant création du Conseil permanent de la langue luxembourgeoise.

Unique en son genre de par son ambition et son envergure dans le paysage lexicographique luxembourgeois actuel, le LOD s'inscrit en plein dans le contexte plurilingue caractéristique du Grand-Duché.

Le présent document vise à éclairer les choix de traitement et d'organisation retenus pour ce répertoire associant quatre langues de traduction (allemand, français, anglais, portugais) aux termes du luxembourgeois contemporain et à en expliquer en détail le fonctionnement.

Depuis sa création par la Loi du 20 juillet 2018 relative à la promotion de la langue luxembourgeoise, le Centre pour le luxembourgeois (Zenter fir d'Lëtzebuerger Sprooch, zls.lu) s'occupe de la maintenance et du développement du LOD.

Nature du dictionnaire

Le LOD renferme des composants microstructurels susceptibles de figurer dans ou d'être associés tantôt à des articles de dictionnaires monolingues (synonymes, locutions glosées, ...), tantôt à des articles de dictionnaires bilingues (dispositif traductionnel, ...), tantôt aux deux (subdivisions sémantiques, contextualisations, marquage d'emplois, ...), ce qui constitue son originalité d'un point de vue lexicographique.

Sans que cela ne dise quoi que ce soit au sujet la qualité dictionnairique du LOD, force est donc de constater que ce répertoire résiste à une classification dichotomique traditionnelle : Associant quatre langues cibles de traduction aux termes de sa nomenclature luxembourgeoise, le LOD est a priori un dictionnaire multilingue.

Cependant, la définition, en début de projet, d'un public cible et de fonctionnalités lexicographiques adaptées au contexte plurilingue du Grand-duché induit une classification plus nuancée, explicitée dans le chapitre suivant.

Public cible et fonctionnalités

Le public cible du LOD inclut aussi bien les utilisateurs luxembourgophones natifs que les utilisateurs allophones maîtrisant au moins l'une des quatre langues de traduction du dictionnaire, à condition bien sûr qu'ils s'intéressent à la langue luxembourgeoise dans une démarche couverte par l'une des fonctionnalités offertes par le dictionnaire.

Les fonctionnalités couvertes par le dictionnaire sont les suivantes :

- grâce au dispositif traductionnel (par mobilisation des compétences trilingues pour les utilisateurs luxembourgophones et, idéalement, des compétences en langue maternelle pour les utilisateurs allophones)
- grâce aux locutions glosées (par mobilisation des compétences en langue maternelle pour les utilisateurs luxembourgophones)
- grâce au respect des règles orthographiques en vigueur
- grâce aux informations grammaticales et flexionnelles
- grâce aux contextualisations
- grâce aux synonymes

- grâce aux équivalents traductionnels

- grâce aux index des traductions

Il s'agit cependant de relativiser certaines des fonctionnalités reprises ci-dessus :

- concernant les utilisateurs allophones

Les locutions étant glosées en luxembourgeois, un certain niveau de maîtrise de cette langue est requis afin de garantir un accès au sens.
Une traduction des locutions et/ou de leurs gloses pourrait être envisagée à moyen terme.
Les contextualisations n'étant pas traduites, un certain niveau de maîtrise de la langue luxembourgeoise est prérequis, afin qu'un utilisateur allophone puisse interpréter les phénomènes linguistiques observables au sein desdites contextualisations.
Une traduction des contextualisations pourrait être envisagée à moyen terme.

- concernant tous les utilisateurs

Les index des traductions sont générés automatiquement à partir des éléments traductionnels présents dans les articles du LOD. Ils constituent en cela un produit dérivé du travail de description de la langue luxembourgeoise, mission première du service LOD. Un terme allemand, français, anglais ou portugais n'est donc répertorié qu'à condition d'avoir été nécessaire pour « décrire » de façon pertinente un terme luxembourgeois figurant à la nomenclature du dictionnaire.
Aucune procédure ne garantit une exhaustivité ou au moins une représentativité de ces index. Une telle procédure n'est d'ailleurs pas prévue, pas même à long terme.

Nomenclature

La nomenclature initiale du LOD (intitulé à l'origine Dictionnaire Pratique de la Langue Luxembourgeoise), établie d'abord par exploitation statistique du corpus LuxText, comportait autour des 20.000 termes.

Complétée et homogénéisée, la nomenclature compte actuellement environ 28.000 termes et se stabilisera probablement à moyen terme autour de 34.000.

Elle est développée par

- exploitation statistique des recherches infructueuses sur le site Internet du dictionnaire
- contrôles de cohérence et d'homogénéité
- ajout de nouveaux textes au corpus

La plupart des termes à la nomenclature du LOD sont des mots de la langue. Quantitativement, la répartition d'articles marqués comme décrivant un terme appartenant à une certaine catégorie grammaticale se présente de la sorte :

- substantifs : ~ 58,4 %
- verbes : ~ 19,6 %
- adjectifs : ~ 11,7 %
- nombres : ~ 0,9 %  
- adverbes : ~ 3 % (dont 0,5 % d'adverbes pronominaux)
- pronoms : ~ 0,8 %
- prépositions : ~ 0,3 %
- conjonctions : ~ 0,2 %
- particules : ~ 0,1 %
- autres catégories, dont les articles et les interjections : moins de 0,1 %

Les noms propres constituent, quant à eux, à peu près 5 % de la nomenclature du dictionnaire. Les noms propres actuellement admis sont les noms de pays, les noms de localités (luxembourgeoises et limitrophes), ainsi que les noms de cours d'eau luxembourgeois.

Il est prévu d'admettre de nouveaux types de noms propres à moyen terme. De premiers tests sont en cours en ce sens.

L'intégration de termes spécialisés sera systématisée une fois que la nomenclature de base sera stabilisée et ne nécessitera plus qu'un travail de maintenance. Cette intégration se fera idéalement en collaboration avec des experts. De premiers contacts ont déjà été établis en ce sens, notamment en ce qui concerne la terminologie médicale.

Corpus LuxText

La production écrite en langue luxembourgeoise n'étant pas assez riche pour pouvoir procéder de manière plus sélective, le corpus LuxText est un outil établi avant tout sur un critère de disponibilité. Il reste par conséquent largement hétérogène et déséquilibré et ne prétend en aucun cas atteindre une représentativité parfaite de la langue.

Le contenu actuel (~ 45 millions de mots) est structuré de façon à être conforme par rapport au niveau 1 (
minimal encoding level) du Corpus Encoding Standard (cf. https://www.cs.vassar.edu/CES/).

LuxText continue à être enrichi. Les proportions de types de textes sont actuellement les suivantes :

- transcriptions des débats en séance publique de la Chambre des députés (depuis 2002) : ~ 78 %
- production littéraire (prose publiée depuis 1980) : ~ 15 %
- transcriptions d'émissions de radio (De Sproochmates [compilation 2011], Commentaires et Cartes blanches, de 1997 à 2008, entre autres) : ~ 2,4 %
- transcriptions d'émissions de télévision (Den Nol op de Kapp, saisons 1998 à 2001, entre autres) : ~ 0,9 %
- articles de presse (publiés depuis 2001) : ~ 0,5 %
- transcriptions d'échanges verbaux (tables rondes, débats, de 2000 à 2011) : ~ 0,5 %
- transcriptions de dialogues de films de fiction (réalisés entre 1993 et 2007) : ~ 0,2 %

- autres types de textes : ~ 2,5 %

Les collaborateurs du LOD sont formés pour reconnaître et pallier les lacunes du corpus, qui, pour des raisons de droits d'auteurs, ne peut être rendu accessible au grand public.

Le corpus LuxText est également mis à profit pour la discrimination et la description sémantiques, ainsi que comme aide à l'exemplification, dans la mesure où y sont repérables collocations privilégiées, expressions figées et tournures idiomatiques.

Étant donné que le LOD ne dispose que de droits de consultation sur la plupart des textes qui constituent LuxText, les passages intéressants repérés pour un lemme donné servent avant tout comme source de documentation. Les citations sont exceptionnelles.

Macrostructure

L'organisation des articles a été pensée selon un système strictement alphabétique, même si cette organisation n'est pas forcément visible lors d'une consultation en ligne, au cours de laquelle l'utilisateur ne se voit présenter qu'un sous-ensemble (souvent limité à 1) d'items linguistiques catégorisés :

Toujours est-il que, lorsqu'une recherche sur le site https://www.lod.lu/ est ambiguë et que le terme recherché est susceptible de renvoyer à plus d'un article, la liste des résultats est classée alphabétiquement :

Article dictionnairique

Le contenu du Lëtzebuerger Online Dictionnaire est subdivisé en articles dictionnairiques. Chacun de ces articles répertorie des informations pertinentes par rapport à un item linguistique dont la forme lemmatisée constitue l'adresse de l'article en question.

L'organisation interne des articles (leur microstructure) diffère légèrement selon la nature du mot traité.

La trame générale des articles pleins se définit cependant de la sorte :

item d'adressage catégorie grammaticale
dispositif traductionnel
contextualisation(s)

L'article suivant illustre cette trame :

Le dispositif traductionnel et les contextualisations se trouvent à l'intérieur d'unités de sens, dont le nombre par article peut varier, en fonction de la richesse sémantique des termes décrits.

Chaque article est ainsi structuré en autant de subdivisions de même nature qu'il comporte d'emplois distingués, chacune de ces unités de traitement étant introduite par un chiffre arabe en début de ligne :

Ces subdivisions numérotées constituent le seul niveau de structuration valant pour tous les articles du LOD traitant de plus d'un emploi.

Les articles ne traitant qu'un seul emploi ne sont ni structurés, ni numérotés, comme le montre l'article planzlech reproduit ci-dessus.
Reste à noter que ces subdivisions peuvent aussi bien être consacrées à des sens du mot mis en adresse (cf. planzlech) qu'à des expressions contenant celui-ci, traitées alors comme sous-adresses :

Un chapitre à part est dédié à ce dispositif de sous-adressage.

De nombreux autres éléments microstructurels sont susceptibles d'enrichir les articles du LOD. Leur nature et leurs fonctions seront détaillées par la suite.

Le couple graphie du lemme/catégorie grammaticale constitue le critère de base pour la répartition des informations lexicographiques en articles dictionnairiques distincts, comme l'illustrent les articles ideal et Ideal, dont les lemmes se distinguent à la fois par leur graphie (malgré le fait qu'il s'agisse de quasi-homographes) et par leur catégorie grammaticale,

les articles Bank et Bänk, dont les lemmes présentent une similitude au niveau de la catégorie grammaticale, mais qui se distinguent par leur graphie,

ou encore les trois articles an, dont les lemmes présentent la même graphie, mais qui se distinguent au niveau de la catégorie grammaticale.

Cependant, d'autres critères de répartition peuvent être pris en compte, tels que

- une différence de flexion, comme l'illustrent les articles ëmstellen :

- une différence sémantique forte, critère renforcé la plupart du temps par des arguments étymologiques, comme l'illustrent les deux articles Box :

- une différence de prononciation, comme l'illustrent les articles viraus (le lemme du premier étant accentué sur la première syllabe, celui du deuxième sur la seconde) :

Certains des exemples précédemment cités cumulent plusieurs critères de distinction. Ils ont été choisis pour illustrer le critère le plus évident les concernant.

Item d'adressage

La forme lemmatisée de l'item linguistique traité au sein d'un article dictionnairique en constitue l'adresse. Il s'agit de la forme de base, non fléchie, comme l'illustrent les articles suivants :

La plupart des items d'adressage sont monolexicaux. De rares items sont polylexicaux, comme certains emprunts au français,

 certains noms propres,

ainsi que de rares locutions prépositives

ou adverbiales :

Ces termes polylexicaux constituent moins de 2 % de la nomenclature du dictionnaire. Par contre, de nombreux articles présentent un dispositif de sous-adressage de séquences incluant les mots mis en adresse. Un chapitre à part leur est dédié.

Catégories et informations grammaticales

Les items d'adressage sont suivis d'une indication concernant leur catégorie grammaticale. Dans le LOD, il est distingué entre 12 catégories, qui se répartissent de la sorte :

- déclinables : substantifs, verbes, adjectifs, pronoms, articles, nombres (ordinaux) (cf. le chapitre « Informations flexionnelles »)

- indéclinables : adverbes, nombres (cardinaux), prépositions, conjonctions, particules et interjections

Les informations grammaticales disponibles au sujet de ces différentes catégories sont les suivantes :

- pour les substantifs, l'indication « substantif » est en outre suivie d'une indication concernant le genre du mot traité,

sauf dans les cas où le substantif traité ne s'utilise que dans la forme du pluriel :

Lorsque plusieurs genres sont possibles pour un substantif donné, cela est indiqué de la sorte :


Les formes substantivées d'adjectifs et de verbes ne sont pas lemmatisées et adressées dans le LOD. On les retrouve néanmoins au sein de contextualisations illustrant les articles qui traitent les verbes et les adjectifs correspondants, à condition que l'usage de la forme lemmatisée soit notable du point de vue de sa fréquence :

- pour les verbes, la distinction est faite entre verbes pleins, marqués simplement « verbe »,

verbes de modalité

et verbes auxiliaires :


Pour les verbes pleins, l'information catégorielle est complétée par d'autres informations grammaticales, qui relèvent alors du critère de structuration des articles correspondants en unités grammaticales, introduites par le symbole » .

Ces informations sont le typage des constructions : transitivité (« transitif », « intransitif »), pronominalité (« pronominal »)

et impersonnalité (« impersonnel », « également impersonnel ») :

- pour les adjectifs, la distinction est faite entre adjectifs déclinables, marqués simplement « adjectif », et adjectifs invariables :

Un adjectif n'est considéré comme étant invariable que lorsqu'il peut être épithète sans pour autant être accordé au nom qu'il qualifie. C'est le cas de marber ci-dessus.

Un adjectif utilisé exclusivement comme attribut n'est pas spécialement marqué. Un dispositif de sous-adressage prend alors le relais afin de renseigner l'utilisateur :

Un chapitre à part est dédié à ce dispositif.

Les adjectifs luxembourgeois pouvant être utilisés comme adverbes sont recatégorisés comme tels au niveau du dispositif traductionnel, lorsque la forme adverbiale d'une traduction diffère de la forme adjectivale. Cela peut être le cas en français, en anglais et en portugais :


Lorsque l'usage adverbial d'un adjectif luxembourgeois diffère sémantiquement des usages adjectivaux décrits, le terme en question est traité dans deux articles à adresses homographes, une fois comme adjectif, une fois comme adverbe :



Un article n'est consacré aux adjectifs dérivés du participe passé d'un verbe qu'à condition que le verbe en question ne soit pas ou plus attesté, ou qu'il existe un écart sémantique notable :



Lorsqu'il existe un lien sémantique fort, l'adjectif dérivé n'est pas décrit au sein d'un article dédié, mais peut être montré grâce à une contextualisation dans l'article traitant le verbe correspondant :


N.B. : lorsqu'un utilisateur cherche la forme fléchie d'un adjectif dérivé d'un participe passé pour lequel il n'existe pas d'article dédié conformément aux critères précédemment décrits, le système lui retourne l'article du verbe correspondant :


- pour les nombres, la distinction est faite entre nombres cardinaux et nombres ordinaux :

- pour les adverbes pronominaux, la distinction est faite entre formes fortes et formes faibles :

- pour les pronoms, la distinction est faite entre pronoms personnels, pronoms indéfinis, pronoms possessifs, pronoms interrogatifs, pronoms démonstratifs, pronoms relatifs et pronoms réfléchis :


L'information catégorielle est complétée par d'autres informations grammaticales, qui relèvent alors du critère de structuration des articles correspondants en unités grammaticales, introduites par le symbole » . Ces informations sont, selon la pertinence pour un type de pronom donné, la personne, le nombre, le genre et/ou le cas,



avec, pour les pronoms possessifs, une distinction entre « possesseur » (concerné par les informations qui précèdent le signe « + ») et « possédé » (concerné par les informations qui suivent le signe « + ») :


- pour les articles, la distinction est faite entre articles définis et articles indéfinis :


L'information catégorielle est complétée par d'autres informations grammaticales, qui relèvent alors du critère de structuration des articles correspondants en unités grammaticales, introduites par le symbole » . Ces informations sont le nombre, le genre et le cas :


- pour les noms propres, les adverbes (non pronominaux), les prépositions, les conjonctions, les particules et les interjections, aucune distinction particulière n'est à signaler.

En ce qui concerne les prépositions, l'information catégorielle est complétée par une autre information grammaticale, qui relève alors du critère de structuration des articles correspondants en unités grammaticales, introduites par le symbole » . Cette information concerne le cas du complément :


Informations flexionnelles

Bon nombre d'articles dictionnairiques du LOD présentent, comme élément(s) microstructurel(s), certaines formes fléchies du mot traité.

C'est notamment le cas en ce qui concerne les substantifs, pour lesquels la (ou les) forme(s) du pluriel est (sont) répertoriée(s). Il s'agit principalement de formes du pluriel attestées, et non pas de formes purement construites, même si des procédures d'homogénéisation peuvent impliquer l'ajout de formes non documentées.

Lorsqu'une forme du pluriel est valable pour l'ensemble des sens décrits au sein d'un article plein, elle suit directement l'indication de la catégorie grammaticale en tête d'article :

Lorsqu'une forme du pluriel n'est attestée que pour certains des sens décrits, elle est affichée au niveau des sens concernés. Les sens sans pluriel attesté portent la mention « pas de pluriel » entre parenthèses :

Lorsqu'aucune forme du pluriel n'est attestée pour l'ensemble des sens décrits, la mention « pas de pluriel » suit directement l'indication de la catégorie grammaticale en tête d'article :

Dans de rares cas, des formes du pluriel différentes sont attestées et documentées selon le sens décrit :

N.B. : cette différence de flexion particulière n'est pas un critère suffisant pour justifier à elle seule que les informations au sujet d'un substantif donné soient réparties sur plusieurs articles (cf. le chapitre « Article dictionnairique »)

Lorsqu'un substantif donné n'existe qu'au pluriel, la mention « pas de singulier » suit l'indication de la catégorie grammaticale en tête d'article :

Cette mention peut également signaler des sens isolés pour lesquels le substantif traité ne se rencontre que sous sa forme plurielle, que cette forme soit également attestée pour d'autres sens,

ou pas :

Les formes du pluriel attestées, mais rares, sont marquées comme telles :

Les sens pour lesquels un singulier est attesté, mais pour lesquels le substantif traité se rencontre le plus souvent au pluriel, sont marqués comme tels :

Lorsque plusieurs formes du pluriel sont documentées, ces formes sont séparées par une barre oblique :

L'ordre dans lequel apparaissent les formes du pluriel n'est pas indicatif de leur fréquence.

Dans les articles dédiés à la description d'un verbe, le participe passé, en tant que l'une des formes verbales de base, est systématiquement affiché. La forme du participe passé est précédée d'une indication concernant le verbe auxiliaire (« hunn » ou « sinn ») utilisé pour la construction des temps composés du verbe concerné :

Lorsque plusieurs formes du participe passé sont documentées, ces formes sont séparées par une barre oblique :

L'ordre dans lequel apparaissent les formes du participe passé n'est pas indicatif de leur fréquence.

Lorsque les temps composés d'un verbe donné peuvent se construire tantôt avec le verbe auxiliaire sinn, tantôt avec l'auxiliaire hunn, avec une différence sémantique faible n'impliquant pas de création d'articles distincts (cf. le chapitre « Article dictionnairique »), les informations grammaticales et flexionnelles pertinentes sont reprises en cours d'article, précédant les unités de sens concernées :

De rares verbes n'existent qu'à l'infinitif au sein d'associations lexicales figées. Les informations précédemment décrites ne sont donc pas reprises dans les articles concernés :

Des tableaux flexionnels complets peuvent être affichés pour les adjectifs déclinables et pour les verbes conjugables. Un chapitre à part leur est dédié.

Items de sous-adressage

Les items de sous-adressage, qui apparaissent en rouge en début d'unité de sens, ont vocation soit à fournir des informations sur les conditions particulières d'insertion dans des énoncés des mots à propos desquels elles sont évoquées, comme ici la construction d'un verbe avec une préposition,

soit à montrer des associations lexicales figées :


Lorsqu'une unité de sens traite un tel item polylexical, la majorité des autres éléments microstructurels s'articulent autour de cet item, aux dépens du seul terme constituant l'adresse principale de l'article en cours.

Ainsi, les éléments traductionnels proposent un (ou des) équivalent(s) qui couvre(nt) sémantiquement l'item de sous-adressage dans son ensemble. Il en va de même pour les synonymes :


Deux expressions alternatives de même signification, mais pouvant présenter de légères différences structurelles, sont séparées par une barre oblique,


sauf dans les cas où l'existence de variantes peut être signalée par un jeu de parenthèses (cf. le chapitre « Expression et signification de l'optionnalité ») :


Deux expressions semblables, mais de signification différente, sont séparées par un point virgule. L'ordre dans lequel apparaissent les équivalents traductionnels et les contextualisations est alors conditionné par l'ordre dans lequel sont listées les deux sous-adresses, comme le montre cette unité de sens de l'article Kaart :


Dispositif traductionnel

Le dispositif traductionnel est l'élément central du fonctionnement du Lëtzebuerger Online Dictionnaire. C'est en effet grâce à ce dispositif que l'on accède au(x) sens des mots luxembourgeois décrits.

Traditionnellement, c'est la lexicographie monolingue qui produit des répertoires dédiés avant tout à la description sémantique d'un lexique donné. Cette description se fait alors par l'intermédiaire de définitions formulées dans la même langue que celle à laquelle appartiennent les termes à décrire, comme l'illustre l'exemple suivant, qui reprend l'article minimiser de la version numérique 5.3 du Petit Robert de la langue française (consulté le 26 mai 2020) :

Un tel dispositif ne permet l'accès au sens du terme traité qu'à condition de maîtriser, au moins de façon élémentaire, la langue de définition, qui est également la langue des termes à la nomenclature.

La lexicographie bilingue, quant à elle, est le plus souvent orientée vers l'encodage dans une langue autre que celle à laquelle appartiennent les termes à la nomenclature d'un dictionnaire donné.

Dans l'exemple suivant, qui reprend l'un des deux articles glace de la version électronique de la 3e édition (2015) du PONS Großwörterbuch Französisch-Deutsch, des sélecteurs sémantiques, tels que « (miroir) » et « (plaque de verre) »  orientent alors les utilisateurs vers la (les) traduction(s) pertinente(s) pour un sens donné du terme traité :

Pensé avant tout pour un outil d'aide à l'encodage, un tel dispositif ne permet pas forcément d'accéder au sens du terme en adresse, car la potentielle polysémie non désambiguïsée des équivalents traductionnels proposés autorise tout au plus à émettre des hypothèses quant au contenu sémantique dudit terme.

Le Duden online Wörterbuch (http://www.duden.de, consulté le 26 mai 2020) définit notamment onze sens distincts, dont cinq sont affinés à l'aide de sous-unités sémantiques, pour le mot allemand Spiegel, proposé comme équivalent dans la première subdivision de l'article glace reproduit ci-dessus.

L'originalité du LOD réside dans le fait que les sélecteurs sémantiques, caractéristiques de la lexicographie bilingue, ne s'appliquent pas au niveau de la langue de départ (le luxembourgeois), mais aux langues cibles (l'allemand, le français, l'anglais et le portugais) du dictionnaire. C'est la raison pour laquelle le terme de « clarificateur sémantique » sera utilisé pour parler de ce composant microstructurel dans la suite du présent document.

Dans les exemples suivants, qui reprennent les articles Bürosklamer et Trombonn du LOD, les éléments de clarification français « [petite agrafe] » et « [instrument de musique] » suivent l'équivalent traductionnel et permettent à l'utilisateur de comprendre lequel parmi les sens qui lui sont connus pour l'équivalent « trombone  » est celui qui est pertinent au sein de l'article consulté :

Ce dispositif permet aussi bien aux utilisateurs luxembourgophones qu'aux utilisateurs allophones maîtrisant au moins l'une des quatre langues de traduction utilisées dans le LOD d'accéder au(x) sens des termes luxembourgeois traités : les premiers activeront leurs compétences multilingues, les seconds, idéalement, leurs compétences en langue maternelle, pour saisir, grâce au couple « équivalent traductionnel / clarificateur sémantique », le sens décrit au sein d'une unité sémantique donnée.

Cette approche est particulièrement bénéfique, car elle permet de subvenir, grâce à un seul répertoire, aux besoins de plusieurs publics cibles, tout en élargissant les possibilités fonctionnelles du dictionnaire par rapport à un outil purement monolingue ou purement bilingue (cf. les chapitres « Nature du dictionnaire » et « Public cible et fonctionnalités »).

Le tableau suivant reprend les principaux types de clarificateurs sémantiques, illustrés par des exemples issus d'articles décrivant des termes appartenant aux trois catégories grammaticales les plus représentées au sein du LOD (cf. le chapitre « Nomenclature »), à condition que celles-ci soient pertinentes pour la clarification en question :



substantif verbe adjectif
Clarification par cooccurrent(s) privilégié(s) Complément (avec article indéfini) Abschnitt […] FR passage [d'un texte] adoptéieren […] FR adopter [un enfant]
brauen […] FR brasser [de la bière]


Sujet (sans article)
quaken […] FR cancaner [canard]

Nom qualifié (sans article)

abordabel […] FR abordable [prix]
Clarification par contexte extralinguistique
Ambiance […] FR ambiance [dans un groupe] ausdrécken […] FR presser [pour extraire un liquide]

Hyperonyme ou synonyme Bréck […] FR pont [construction] amputéieren […] FR amputer [opérer]

Définition (souvent minimale)
Bréck […] FR bridge [prothèse dentaire] bestätegen […] FR confirmer [affirmer l'exactitude de] schléifreg […] FR somnolent [qui a envie de dormir]

Les équivalents proposés sont choisis de façon à pouvoir, idéalement, être utilisés pour traduire au moins les exemples qui illustrent l'unité de sens en cours.

Ils sont précédés de l'abréviation normalisée ISO 639-1:2002 de la langue de traduction, « DE » pour l'allemand, « FR » pour le français, « EN » pour l'anglais et « PT » pour le portugais :




Chaque unité de sens compte au moins un équivalent traductionnel par langue. La virgule est utilisée pour séparer plusieurs équivalents :

N.B. : la coprésence de deux ou de plusieurs équivalents traductionnels synonymes (partiels) au sein d'une même unité de sens rend souvent superflu l'ajout d'un élément de clarification sémantique, dans la mesure où les différents équivalents sont susceptibles d'assumer un rôle de clarificateur à l'égard de leurs voisins :

Quelques rares items linguistiques luxembourgeois décrits au sein du LOD résistent, pour diverses raisons, à l'exercice de la traduction telle que la prévoit, par défaut, le cahier des charges du dictionnaire.

Deux solutions peuvent alors être mises à profit :

- la description sémantique sous forme de définition

Pour certains rares termes intraduisibles (moins de 0,03 % des unités de sens sont concernées), une définition est proposée à l'utilisateur. L'élément définitionnel est introduit comme tel par un introducteur « [définition] » entre crochets :

- la description fonctionnelle

Des éléments de description fonctionnelle entre accolades sont mis à profit lorsqu'une description sémantique (par équivalence, avec ou sans clarification, ou par définition) n'est pas envisageable pour un terme donné. C'est notamment le cas pour les particules, qui, abstraction faite de l'allemand, ne se traduisent que rarement vers l'une des langues cibles du LOD :

Lorsque l'on considère les unités de sens pour lesquelles aucune équivalence traductionnelle ne peut être proposée, il s'agit de reconsidérer ponctuellement la portée fonctionnelle du LOD (cf. le chapitre « Public cible et fonctionnalités ») : le dictionnaire reste certes un outil de décodage de la langue luxembourgeoise, mais ne peut, dans ces rares cas, être raisonnablement considéré comme un outil d'aide à l'encodage. En effet, la description sémantique ou la description fonctionnelle ne permet de fournir guère plus qu'une intuition traductionnelle à l'utilisateur-traducteur. De plus, ces éléments ne figurant pas dans les index consultables des équivalents traductionnels, aucun retour vers le luxembourgeois n'est envisageable.

N.B. : dans de très rares cas, un équivalent traductionnel peut être suivi, pour des raisons de clarification, d'un élément de description fonctionnelle :

Contextualisations

Chaque unité de sens d'article plein du LOD présente toujours au moins un exemple montrant le terme traité en contexte.
Même si ces exemples peuvent s'inspirer de syntagmes relevés dans le corpus LuxText, il ne s'agit jamais de citations (cf. le chapitre « Corpus LuxText »). C'est la raison pour laquelle aucune référence ne leur est associée.

Une contextualisation de qualité tend à satisfaire avant tout à deux critères de base, à savoir celui de la brièveté (critère hérité de la tradition du dictionnaire imprimé) et celui de la représentativité pour le terme traité, à savoir que ce terme ne devrait idéalement pouvoir être remplacé par aucun autre au sein de la contextualisation sans que celle-ci ne cesse de faire sens.

Les contextualisations présentent donc souvent le terme traité accompagné de cooccurrents privilégiés, surtout lorsque le caractère privilégié de la cooccurrence est attesté par LuxText.
L'article qui traite billen, verbe pour lequel la très grande majorité des occurrences attestées dans LuxText s'accompagne du sujet Hond, illustre l'application de cette directive :

Les contextualisations commencent par une minuscule, sauf si le premier mot est un substantif ou tout autre mot s'écrivant toujours avec une initiale majuscule. Le point n'est pas utilisé pour marquer la fin de la phrase :

Par ailleurs, les règles syntaxiques, orthographiques et de ponctuation en vigueur sont respectées.

Les questions se terminent par un point d'interrogation, les phrases exclamatives par un point d'exclamation :

Les phrases contenant un verbe principal au mode impératif se terminent par un point d'exclamation :

Contextualisations glosées

Une part importante des contextualisations du LOD sont suivies par une clarification en luxembourgeois entre crochets.

Il s'agit soit de phrases figées ou quasi-figées (idiotismes et proverbes) dont l'explicitation sémantique requiert une clarification globale,


soit de contextualisations qui ne sont pas figées dans leur entièreté et ne demandent donc qu'une clarification partielle :

Les contextualisations glosées peuvent présenter des variantes, de même signification, mais avec de légères différences structurelles. Ces variantes sont alors séparées par un point-virgule :


Lorsque deux clarifications sémantiques sont possibles pour une contextualisation donnée, celles-ci sont également séparées par un point-virgule :


Alors que la plupart des clarifications paraphrasent la contextualisation qui précède (elles sont alors sémantiques), il en existe également qui en expliquent les conditions d'emploi (elles sont alors pragmatiques). Ces clarifications à contenu informationnel métalinguistique sont signalées par une double flèche les précédant :


Synonymes

Chaque unité de sens d'article plein du LOD est susceptible de présenter un ou plusieurs terme(s) synonymique(s) pertinent(s) pour l'unité en cours, précédé(s) de l'introducteur « synonyme » ou « synonymes », en fonction du nombre de termes retenus pour ladite unité. Plusieurs termes synonymiques se suivent sur la même ligne, sont séparés par des virgules et apparaissent dans l'ordre alphabétique :

La pertinence des termes candidats est d'abord évaluée par rapport à leur capacité à pouvoir remplacer le mot traité dans les contextualisations non glosées sans qu'une variation sémantique n'affecte ces dernières. Une relation sémantique hiérarchique (de type hyperonyme / hyponyme) ou partielle peut donc impliquer une absence de réciprocité.

Le degré de formalité des termes considérés est également pris en considération. Ainsi, seul un terme considéré comme égal ou plus positif sur l'échelle du degré de formalité que le terme traité peut être retenu comme terme synonymique :


Les termes synonymiques sont, dans la grande majorité des cas (~ 90%), des termes monolexicaux, comme le montrent les exemples précédents.

Les termes synonymiques polylexicaux concernent la plupart du temps un terme lui-même polylexical, figurant soit en adresse principale, ce qui est assez rare,

soit en sous-adresse de l'article en cours :


Ils peuvent également concerner un terme monolexical figurant en adresse principale de l'article en cours :


Chaque article de réadressage  (cf. le chapitre « Article de réadressage ») est susceptible de présenter un ou plusieurs terme(s) synonymique(s) pertinent(s) pour le terme figurant en adresse principale, selon les principes d'affichage évoqués précédemment :


De par la nature de ce type d'article, aucune distinction sémantique, telle que pratiquée au sein des articles pleins, ne peut être opérée localement. En cas d'ambiguïté, il s'agit donc de s'en référer à l'article vers lequel renvoie l'article en cours :



Cet inconvénient devrait être pallié à moyen terme, lorsque les articles de réadressage seront développés.

Marquage de registres énonciatifs

Les trois ensembles de marques registrales mises en œuvre dans le LOD servent à signaler des caractéristiques diaphasiques, diaévaluatives et diachroniques.

Les marques diaphasiques signalent des degrés positifs ou négatifs dans la formalité de l'expression par rapport à un lexique, non marqué, posé comme neutre de ce point de vue. Dans le LOD, les marques diaphasiques sont les suivantes :

- « soutenu », traduisant une certaine recherche de la part des énonciateurs :


- « familier », qui sert à signaler des usages non formels mais qui ne sont pas susceptibles de choquer et qui passent inaperçus dans les échanges du quotidien :


- « grossier », qui sert à signaler des usages non formels qui sont susceptibles de choquer et ne passent pas inaperçus dans les échanges du quotidien :


- « vulgaire », qui sert à signaler des usages s'écartant le plus fortement de la neutralité énonciative et ont généralement un référent lié à la sexualité :


- « langage enfantin », qui a vocation à coder des items lexicaux typiques d'échanges entre adultes et très jeunes enfants :


Les marques diaévaluatives signalent des termes qui permettent aux locuteurs d'exprimer un positionnement énonciatif par rapport au contenu de leurs propos. Une seule marque de ce type est utilisée.

- « péjoratif », qui indique qu'un mot permet d'envisager son référent sous un aspect défavorable :


La marque diachronique « vieilli » signale un certain degré d'obsolescence d'usages qui gardent cependant une vitalité relative du moins dans la compétence passive de certains locuteurs natifs :


N.B. : une unité de sens donnée peut être porteuse de plusieurs marques :


Les contextualisations glosées peuvent être porteuses d'une marque d'usage diaphasique. Les marques affectant les exemples ne signalent que les cas où il existe un écart par rapport au degré de formalité du terme traité considéré isolément.

De plus, la marque diaévaluative « ironique », plutôt rare, est spécifique aux contextualisations glosées :

Tableaux flexionnels

À chaque verbe et à chaque adjectif décrit au sein du LOD est a priori associé un tableau des formes fléchies.

Les deux tableaux suivants illustrent l'ensemble des formes susceptibles d'être montrées pour les verbes


et pour les adjectifs :


N.B. : les formes du comparatif formées grâce à « méi », de loin les plus fréquentes en luxembourgeois, ne sont pas déclinées, étant donné que les formes fléchies du positif couvrent celles du comparatif :


Une forme n'est montrée qu'à condition qu'elle soit attestée.

La barre oblique (« / ») peut signaler l'absence de forme(s) sémantiquement viable(s) ou attestée(s)



ou séparer plusieurs formes équivalentes :


L'ordre dans lequel apparaissent les formes ainsi séparées n'est pas indicatif de leur fréquence.

Le pronom réflexif est repris dans les tableaux associés aux verbes pronominaux :


Ce pronom est entre parenthèses lorsqu'une forme donnée correspond à une forme de verbe potentiellement, mais pas nécessairement, réflexif :


Aucun tableau n'est associé aux rares verbes n'existant qu'à l'infinitif au sein d'associations lexicales figées (cf. le chapitre « Informations flexionnelles ») et aux adjectifs considérés comme étant invariables (cf. le chapitre « Catégorisation des items mis en adresse »).

Informations phonétiques

Les informations phonétiques sont véhiculées dans le LOD par l'intermédiaire d'un fichier audio.

Les formes lemmatiques des mots mis en adresse sont sonorisées pour tous les articles.

Pour l'article fiicht, on peut donc entendre prononcer la forme fiicht.


Pour les articles, y compris ceux de réadressage vers d'autres articles, qui comportent un composant flexionnel à la suite de l'adresse, ce qui est le cas, à certaines exceptions près, pour ceux qui traitent de verbes ou de noms, les formes fléchies mentionnées sont prononcées.

Pour l'article Tru, on peut donc entendre prononcer les formes Tru et Truen.


Pour l'article pfleegen, on peut donc entendre prononcer les formes pfleegen et gepfleegt.


Pour les mots dont la flexion, parce qu'elle varie selon leurs emplois, n'est pas mentionnée dans le composant flexionnel initial mais distribuée sur les subdivisions qui décrivent ceux-ci, les formes fléchies ainsi réparties sont également sonorisées, à la suite de la prononciation du lemme.

Pour l'article Bau, on peut donc entendre prononcer les formes Bau, Bauten et Bai.


Pour chaque forme enregistrée, une seule prononciation, considérée comme étant la plus commune, est retenue. L'ajout de prononciations alternatives est envisagé à moyen terme.

La grande majorité des séquences prononcées le sont par une même voix féminine, les autres le sont par deux voix masculines.

Article de réadressage

La trame générale des articles de réadressage se définit de la sorte :

item d'adressage catégorie grammaticale - nature du renvoi ↗lien vers l'article principal

Ces articles, dont le nombre est assez conséquent (environ 13 %), proposent un contenu limité à celui de la zone d'entrée des articles pleins, avec les variations propres aux différentes catégories lexicales, suivi d'un lien vers l'article cible et d'un typage du statut de l'item de départ par rapport à l'item d'arrivée.

Grâce à ce dispositif, on distingue






Seul les renvois entre variantes orthographiques établissent une hiérarchie d'importance entre mots traités, la graphie du mot qui constitue l'adresse de l'article cible étant considérée comme préférable à la graphie du mot qui constitue l'adresse de l'article source (cf. le chapitre « Orthographe luxembourgeoise »).

À moyen terme, il est prévu de développer certains articles de réadressage pour en faire des articles pleins, notamment ceux qui traitent les formes féminines et masculines.

Ébauche d'article

Les mots nouvellement admis à la nomenclature du LOD sont accessibles à l'utilisateur grâce à un dispositif particulier, à savoir l'ébauche d'article.

La trame générale des ébauches se définit de la sorte :

item d'adressage catégorie grammaticale

Ces articles particuliers permettent d'accéder à un sous-ensemble des fonctionnalités offertes par le dictionnaire (cf. le chapitre « Public cible et fonctionnalités »), en attendant que les procédures de rédaction et de relecture prévues par le cahier des charges ne permettent de toutes les débloquer.

Un encadré renseigne l'utilisateur sur la nature incomplète de l'article consulté :

foiegras

Encadrés d'information

Des encadrés situés en fin d'article permettent de véhiculer des informations qui ne pourraient l'être grâce aux éléments microstructurels précédemment décrits.

Leur contenu textuel n'est pas contraint a priori, mais une certaine régularité s'observe pour des contenus comparables, comme ceux qui concernent les changement orthographiques induits par le texte D'Lëtzebuerger Orthografie, publié fin 2019 et faisant depuis autorité en matière d'orthographe luxembourgeoise :

 

Les informations à caractère historique et/ou culturel constituent, à côté des informations orthographiques, le gros de ce que l'utilisateur peut s'attendre à trouver dans les encadrés d'information :


L'ajout d'autres types d'information est prévu, concernant notamment la grammaire et l'usage de la langue luxembourgeoise.

Durant une première phase expérimentale, toujours en cours actuellement, les encadrés d'information ne sont disponibles qu'en luxembourgeois. Il est prévu à moyen terme de les traduire dans les quatre langues cibles du dictionnaire.

Considérations générales

Expression et signification de l'optionnalité

Les parenthèses rondes servent, pour certains éléments microstructurels du LOD, à signaler des séquences optionnelles.

Les éléments concernés sont notamment les items de sous-adressage,


les équivalents traductionnels,


les contextualisations


et les synonymes :


L'optionnalité se propage le plus souvent (on retrouve alors des séquences entre parenthèses au sein de plusieurs éléments d'une même unité de sens),


mais pas toujours, comme le montrent certains exemples qui précèdent.

Ces exemples illustrent également des cas pour lesquels la séquence entre parenthèses est facultative. Les parenthèses sont alors un moyen de montrer des variantes dans l'usage.

Dans d'autres cas, le caractère optionnel de la séquence entre parenthèses a d'autres implications, notamment syntaxiques, lorsque, au sein d'un patron de construction, cette séquence renseigne sur le caractère facultatif du complément :


La distinction entre les deux interprétations possibles des séquences entre parenthèses n'est pas marquée typographiquement, mais pourrait l'être à moyen terme.

Orthographe luxembourgeoise

Les règles orthographiques observées au sein du LOD sont celles qui sont définies par le texte actuellement en vigueur, édité par le Centre pour le luxembourgeois (Zenter fir d'Lëtzebuerger Sprooch, zls.lu). Ce texte (D'Lëtzebuerger Orthografie) peut être consulté et téléchargé à l'adresse suivante : https://portal.education.lu/zls/orthografie.

Utilisation et navigation

La fenêtre située en haut à gauche de l'écran sert à saisir les mots à rechercher. Un menu permet de sélectionner la langue de recherche, le luxembourgeois étant sélectionné par défaut :


Le système permet également de chercher les nombres de 0 à 999999. Pour cela, il suffit de saisir des chiffres (« 2318 » p.ex.).

À condition que le navigateur le permette, des suggestions sont faites en cours de saisie. Le moteur de recherche est insensible à la casse et aux accents :


La recherche est lancée par la touche entrée ou par un clic sur le bouton situé à droite de la fenêtre de saisie. Lorsqu'un mot luxembourgeois recherché n'est pas ambigu, l'article correspondant est immédiatement affiché. Dans le cas contraire, les articles susceptibles de correspondre à la recherche sont affichés sous forme de liste :


Lorsque l'utilisateur effectue une recherche en luxembourgeois et que le système ne trouve pas de correspondances, une liste de propositions valides à graphie proche est générée. Un clic sur l'une des propositions relance la recherche avec le terme sélectionné.

Lorsque l'utilisateur recherche un mot allemand, français, anglais ou portugais, le système propose une liste des articles au sein desquels le mot recherché figure comme élément de traduction :

Le menu des langues permet de changer la langue de traduction :

N.B. : la langue du paratexte est liée à la langue de traduction. Lorsque l'utilisateur choisit d'afficher simultanément les langues de traduction allemande et française (option « DE + FR »), le paratexte est en luxembourgeois.

Il est possible de cliquer sur les mots des exemples et sur les synonymes afin d'afficher les articles dictionnairiques correspondants.

Un clic sur le bouton « T » permet d'afficher un tableau des formes fléchies du mot en question. La prononciation d'un mot donné peut être écoutée en cliquant sur le bouton sur lequel figure une note :


Les liens permettant d'accéder aux articles peuvent être partagés sur les réseaux sociaux Facebook et Twitter ou envoyés par e-mail en cliquant sur les icônes correspondantes, affichées sous les contenus dictionnairiques :



Pour toute question supplémentaire concernant le Lëtzebuerger Online Dictionnaire, n'hésitez pas à contacter l'équipe du ZLS !