Introduction: tour d'horizon de la sémantique


mise à jour: mai2004, Françoise Labelle

  • 1. La pertinence technologique et psychologique de la sémantique
  • 2. Le domaine de la sémantique et de la pragmatique en linguistique, les formes que peuvent prendre ces deux disciplines
  • 3. Une première notion logique importante :  la conséquence logique
  • 4. L’acceptabilité sémantique
  • 5. Les aspects logiques et conceptuels
  • 6. Sémantique lexicale et sémantique combinatoire

  • 1. La pertinence technologique et psychologique de la sémantique

    1.1 La pertinence psychologique : Le langage et la capacité symbolique sont au cœur des recherches en sciences cognitives (sciences du cerveau).

    Les scientifiques découvrent les fondements biologiques de l'expérience consciente

    Pauline Gravel

    Édition du lundi 29 avril 2002

    […]

    Outre cette concentration exceptionnelle de cellules nerveuses dans le cerveau humain, on remarque un vaste réseau de connexions entre les différentes aires corticales, qui assument diverses fonctions. "Les aires qui coordonnent le langage par exemple doivent être connectées à toutes les autres modalités sensorielles, explique Wolf Singer. Car on peut reconnaître et nommer un objet aussi bien par le toucher que par la vision, l'audition ou l'odeur. Toutes ces informations doivent trouver leur chemin vers le générateur du mot."

    […]

    Or, les connexions intermodales entre les différentes aires corticales sont beaucoup moins nombreuses chez les animaux dont les systèmes sensoriels demeurent davantage isolés, nous apprend le chercheur. Si l'animal détecte un stimulus par le système visuel, il n'est pas certain qu'il sache le généraliser dans une autre modalité, comme le toucher par exemple. "Les animaux généralisent beaucoup moins bien, parce qu'ils ont moins de connexions intermodales", précise le neurobiologiste.

    […]

    Par ailleurs, Wolf Singer insiste sur les synchronisations qu'il a observées entre les multiples activités neuronales qui surviennent en parallèle en diverses régions du cerveau lors d'une expérience consciente. Ces synchronisations seraient importantes pour lier les résultats de ces activités distribuées, pour les associer et les interpréter en un tout cohérent afin de créer l'unité de la conscience, explique-t-il.


    En résumé, les animaux généralisent beaucoup moins bien, parce qu'ils ont moins de connexions intermodales. La capacité d’abstraction, de généralisation, est plus poussée chez l’humain (pour le meilleur et pour le pire) et cette capacité d’abstraction intermodale est devenue possible grâce à l’association concept-mot (ou signifié-signifiant). Et ce sont des neurologues qui parlent.

    Les animaux sont capables de classer des stimuli. Cependant, la capacité symbolique, c’est-à-dire la capacité de définir un symbole (mot) en renvoyant à d’autres symboles n'est accessible qu'uax plus brillants d'entre eux et qu’au terme d’un entraînement fastidieux. Ce n'est pas une aptitude qui leur vient naturellement, comme c’est le cas chez un enfant.

    La capacité symbolique, c’est le fait que les symboles «lait», «jus»… renvoient chez nous non seulement à une réalité physique mais aussi à d’autres symboles comme «liquide» «extrait de fruits» etc., comme dans un dico [dictionnaire]. C’est cette faculté qui nous permet d’inventer des animaux imaginaires, des mondes imaginaires à partir des propriétés symboliques que possèdent les animaux et les situations réelles, ou d’imaginer une vie après la mort…


    1.2 La pertinence technologique :

    Bien que les technologies de l’information soient maintenant plus humbles, comme il se doit, elles demeurent un domaine d’avenir pour la linguistique. Qui ne rêve, par exemple, de faire une recherche intelligente sur Internet ou à travers des tonnes de  [copies!] documents du type : «Donne-moi les documents qui traitent des maladies respiratoires» et que l’ordi comprenne qu’il s’agit d’asthme, d’emphysème, d’embolie pulmonaire… de virus s’attaquant aux bronches… La sémantique intervient directement dans ce processus. En fait, comme on le verra, maladie respiratoire est un hyperonyme d’asthme, d’emphysème, d’embolie pulmonaire… Mais simplement entrer un dico dans l’ordi ne suffira pas à la tâche parce que les dicos n’ont pas été conçus de manière strictement formelle. Ce sera peut-être à vous qu’incombera cette tâche. Ce domaine s’appelle l’extraction d’informations, la représentation des connaissances (data mining, knowledge representation).

    Les applications faisant appel directement à la sémantique ne manquent pas. On peut mentionner les recherches sur le résumé automatique (ex : http://www.pertinence.net/index.html), la traduction automatique… La sémantique intervient également en robotique, en particulier sur le raisonnement en langues naturelles, le dialogue homme-machine…

    http://www.universimmedia.com/topicmaps/topics/semantique.htm

    La sémantique est, dans les sciences du langage, opposée à la syntaxe.
    La syntaxe concerne les règles formelles, alors que la sémantique concerne la signification.
    Le but du "Semantic Web" est de permettre aux machines d'échanger des informations en utilisant le sens des mots comme dans les langages naturels. Cet objectif ambitieux nécessite un travail important sur les langages, la structure des systèmes, et les ontologies. Dans le cadre de cet objectif, les Topic Maps sont amenées à tenir une place importante.
    Exemple :
    Les moteurs de recherche classiques fonctionnent de manière syntaxique :
    Une requête sur le mot-clé "soleil" va aller chercher dans une base de données les pages contenant la chaîne de caractères [soleil] sans se préoccuper du sens du mot, qui dépend bien sûr du contexte. On trouvera aussi bien l'Auberge du Soleil, le Théâtre du Soleil, un catalogue de lunettes de Soleil ... que des pages concernant l'étoile Soleil. Dans une Topic Map, on créera un Topic Soleil, qui sera défini suivant le contexte. Les liens avec ce Topic, via les associations et les occurrences, sont des liens sémantiques.


    Question d’évaluation : Faites la recherche suivante sur Altavista avancé (http://www.altavista.com/sites/search/adv). Tapez "extraction d'information" (les guillemets sont importants). Comme il y a beaucoup de projets en développement, j'en ai choisi un pour vous.

    Reformulation Allez au lien suivant http://www.iro.umontreal.ca/~kosseim/Publications/pub.html et décrivez brièvement (5 lignes) les objectifs linguistiques du système d'extraction d'information Exibum .


    Si vous êtes curieux(-se), faites donc la recherche sur «résumé automatique».

    art. inséré dans : traiter.ladoc.net/analyse/pertinence.php3

    Solution innovante de traitement du flux informationnel : Pertinence.net est un service sur Internet derrière lequel est mis en œuvre un logiciel qui résume automatiquement des textes. L'utilisateur peut soumettre des textes de trois manières différentes: un texte en local (ordinateur personnel), une URL web ou du texte saisi dans une fenêtre dédiée, un Copier/Coller est aussi possible. Ce service est GRATUIT à l'URL : www.pertinence.net
    Pertinence permet d'accéder à l'information essentielle du texte à travers une extraction paramétrée des phrases les plus significatives selon une méthode linguistique propriétaire. Pertinence offre à l'utilisateur de lire davantage en moins de temps tout en accédant aux informations les plus essentielles. C'est un réel outil de productivité intelligente. Le service proposé par Pertinence est unique dans le web francophone, il permet de traiter les seuls textes écrits en français. Des versions ultérieures pourront résumer automatiquement des textes écrits en d'autres langues. L'application Pertinence permet de traiter les textes de formats texte ASCII (. txt) et HTML, HTM, RTF, DOC (Word) et PDF. De plus, une présentation très conviviale des résumés automatiques aide l'utilisateur à disposer des informations pertinentes : les phrases les plus informatives sont représentées sous la forme d'un dégradé de couleurs allant du bleu foncé pour les phrases les plus importantes à la couleur bleue très claire pour les informations de moindre importance. Enfin, il est possible de sélectionner en ligne, librement, le taux de contraction allant de 100% à 1%, un taux quelconque peut être saisi.


    2. Le domaine de la sémantique et de la pragmatique en linguistique, les formes que peuvent prendre ces deux disciplines

    La sémantique, c’est l’étude du sens. Et le sens, c’est quoi  ? On peut s’interroger longtemps là-dessus. Je préfère poser la question à partir d’une situation plus concrète. Vous êtes dans votre jeu vidéo préféré et vous voyez une phrase écrite (en français) sur un mur, inscription importante pour la poursuite du jeu :

    Le demi-frère de Laura a tué le gardien de la Porte

    Quel est le sens  de cette phrase?  Après l’avoir lue, vous pouvez tirer plusieurs conclusions : entre autres, dans cette réalité …

    { Il y a quelqu’un qui s’appelle Laura, appelons-la l, l a un frère par alliance, appelons-le f, il y a quelqu’un qui garde une entrée vers un autre lieu, appelons-le g, g est mort, f est directement responsable de sa mort…}

    Ces conclusions (ou inférences) que vous tirez font partie du sens de la phrase. Mais elles peuvent être attribuables à toute sorte de facteurs bien différents, linguistiques et non linguistiques. Certaines proviennent du sens des mots, de la grammaire, de la syntaxe. Si X a tué Y, alors Y est mort, sinon tuer n’a pas son sens linguistique conventionnel. De même, si je dis Mon docteur est partie en vacances, on peut tirer comme conclusions, entre autres, que j’ai un docteur habituel, c’est une femme, elle n’est pas là… D’autres conclusions proviennent de connaissances sans intérêt linguistique : par exemple, je sais qu’elle était épuisée, donc il se peut qu’elle ne revienne pas de sitôt. Si vous êtes parano, vous allez conclure qu’elle ne veut pas vous voir ou que c’est de votre faute si elle est partie…

    Pour nous, donc, le sens d’une phrase, c’est l’ensemble des conclusions qu’on peut en tirer, à partir de règles relevant de la structure linguistique de la phrase. Parmi les conclusions linguistiques, notre champ d’intérêt, il y a deux types : les conclusions sémantiques (ou conventionnelles) attribuables au sens des mots, à la grammaire et à la syntaxe : si X a tué Y, alors Y est mort est une conclusion sémantique (ou conventionnelle). L’autre ensemble provient du contexte linguistique : les conclusions pragmatiques (ou conversationnelles).  Par exemple : si vous répondez à quelqu’un qui tombe en panne d’essence à Saint-Félicien qu’il y a un poste d’essence à Chicoutimi, il sera en droit de conclure qu’il n’y en a pas plus près, même si ça ne figure pas dans ce que vous avez dit. Vous aurez dit la vérité mais vous aurez été peu coopératif. De même, dans «Le dernier client avait la mine basse»,  la référence de le dernier client est variable et dépend du moment où vous le dites. La sémantique et la pragmatique sont indissolublement liées, comme on le verra, et on a comme objectif d’expliquer comment on peut tirer un ensemble de conclusion à partir d’une phrase ou d’un texte.

    Question d'évaluation : Qu’est-ce que le sens d’une phrase  ? Qu’est-ce que la sémantique et la pragmatique. Exemples.

    Remarque: La décomposition de textes en propositions élémentaires, comme dans l'exemple ci-haut, s'appelle Discourse representation Theory(ou DRT). En psychologie, plusieurs chercheurs, dont le plus connue est Walter Kintsch, utilisent également une représentation propositionnelle des textes.


    3. Une première notion logique importante :  la conséquence (inférence) logique

    Ce qui précède nous amène à préciser la notion de conséquence logique, ce qu’on a appelé les conclusions qu’on peut tirer d’une phrase ou d’un texte. Nous allons faire de la notion de conséquence (conclusion, inférence) logique une des bases de la sémantique et la pragmatique, ce qui nous permettra a) d’unifier la sémantique lexicale (liens entre les mots) et propositionnelle (liens entre les propositions) et b) de bénéficier des acquis importants de la logique formelle, qui est basée sur la notion de conséquence logique. Nous ferons, au fur et à mesure, le lien entre notre approche et les approches plus classiques. [cf. J.Moeschler et A.Auchlin, Introduction à la linguistique contemporaine, Chap.10]

    Un des concepts de base de la logique, qui est intuitivement facile à comprendre, est celui de conséquence (inférence) logique symbolisée par |-  et mettant en relation une (1) ou plusieurs phrases (2,3) : ex :

    1.      Julie a cessé de fumer |-  Julie fumait

    2.      Paul est policier, les policiers sont bien payés |-  Paul est bien payé

    3.      Néron, c’est mon chat  |-  Néron est un mammifère, Néron est poilu

     

    Remarque : La conséquence logique peut aussi être notée verticalement comme suit :

    Paul est policier
    les policiers sont bien payés
    \Paul est bien payé

    La relation A |-  B veut dire exactement ceci : si une personne considère que la proposition A est vrai, alors, si cette personne n’ajoute aucune autre information, alors on peut conclure que cette personne  considère que la proposition B est également vraie.
    Par exemple, en (1) ci-haut, si on tient pour vrai que Julie a cessé de fumer, à moins de redéfinir le sens conventionnel de cessé, alors on doit accepter que Julie fumait. De même pour les autres exemples.
    Bien sûr, il ne suffit pas de constater qu'il y a des relations de conséquence logique entre les phrases. Ce n'est qu'un début. Il faut ensuite produire une analyse permettant de l'expliquer et, ce de manière la plus rigoureuse et la plus générale possible. Dans le cas de (2), l'analyse relève de la logique des prédicats; en (3), la notion d'hyponymie (prochaine section) permet d'expliquer ce type d'inférence.

    Question d'évaluation: Définir la relation d'inférence logique. Donnez un exemple et expliquez.


    Exercice: En se basant sur le sens conventionnel des mots et en n'ajoutant pas d'informations supplémentaires, pour chacune des phrases (1-4) indiquer le rapport d'inférence (|-) lorsque c'est le cas, avec a) Jules a atteint Julie et b) Jules n'a pas atteint Julie

    1. Jules a failli heurter Julie
    2. Jules croit avoir heurté Julie
    3. Jules regrette avoir heurté Julie
    4. Jules ne regrette pas avoir heurté Julie
    5. Jules n'a pas cessé de heurter Julie
    6. Paul a forcé Jules à heurter Julie

    Un exemple classique d'inférence en logique serait du type :

    Tous les homme sont mortels, Socrate est un homme |- Socrate est mortel

    "x (homme(x) -> mortel(x)),   homme(Socrate) |- mortel(Socrate)

    Quels que soient les mots utilisés, si un raisonnement a cette forme, lorsqu’on accepte les prémisses, on doit accepter la ou les conclusions. Si cette relation de conséquence logique n’existait pas, il n’y aurait pas de sémantique (logique ou intuitive), puisqu’il n’y aurait plus de stabilité dans le sens. Les logiciens se sont donné comme tâches de fixer le sens de certains mots comme tous ("), si (->). Ces mots sont des mots du langage quotidien auxquels on a donné un sens limité et précis. Une des tâches du sémanticien est d’étendre l’analyse aux divers sens de tous et si qui ne sont pas couverts et d’étendre l’analyse aux autres mots du même type, comme certains, chaque… mais, pourtant, donc

    Une autre tâche consiste à expliquer les régularités sémantiques comme celle-ci: si une personne vous dit que «Julie a cessé de fumer» et que vous croyez qu’elle dit vrai alors, à moins qu’elle n’ajoute d’autres informations, vous devez conclure que «avant, Julie fumait». Cette propriété est propre au sens du verbe cesser. Si vous utilisez plutôt le verbe tenter, tout change. S’il n’y avait pas cette stabilité, le verbe cesser n’aurait plus son sens. Autre exemple : si une personne vous dit que «Néron, c’est mon chat » et que vous croyez qu’elle dit vrai alors, à moins qu’elle n’ajoute d’autres informations (qu'il est né à Tchernobyl), vous devez conclure que Néron est poilu.

    La clause «à moins qu’elle n’ajoute d’autres informations» est essentielle. Contrairement aux systèmes mathématiques, il est possible, dans les langues naturelles, d’ajouter des informations qui suspendent (ou annulent) momentanément certaines des conclusions attendues. C’est l’utilité de la conjonction mais. Ex : Néron, c’est mon chat mais il n’est pas poilu.

    Ce qui vous permet d’utiliser mais, c’est le fait que normalement, «il est poilu» est une conséquence logique de «Néron, c’est mon chat». Vous utilisez mais parce qu’il y a suspension momentanée (exceptionnelle) de la conséquence logique découlant de l’emploi de du mot chat (Néron est un chat exceptionnel).

    Par conséquent, il est impossible d’utiliser mais devant une proposition qui est une conséquence logique. Ainsi, les phrases suivantes sont absurdes :

    *Néron, c’est mon chat mais il est poilu
    *C’est une fraise mais elle est rouge
    *Julie a cessé de fumer, mais avant elle fumait

    Cette propriété des langues naturelles qui permet d’ajouter des informations qui annulent les conséquences logiques de ce qui a été dit précédemment permet de classer les langues naturelles parmi les systèmes logiques non-monotones. Une langue naturelle est un système ouvert beaucoup plus riche que les langages artificiels, qui permet de résoudre des contradictions apparentes. On peut dire par exemple «Néron est un chat et il n’en est pas un» [contradiction], ou «Un politicien est un politicien» [tautologie]. Pour une ordi programmé selon la logique classique (monotone), c’est simplement contradictoire ou redondant dans le cas de la seconde phrase. Mais en langues naturelles, ça signifie «d’un point de vue, on peut dire qu’il est un chat», «d’un autre point de vue, on peut dire qu’il n’est pas un chat». Ce jeu sur les points de vue peut être formalisé dans les systèmes de logique intensionnelle. La seconde signifiera «un politicien ne sera jamais plus qu’un politicien» renvoyant ainsi aux limites du politicien standard (stéréotypé), un menteur profiteur à l’ego enflé… [ou un martyr qui assume pleinement les contradictions…selon votre point de vue].


    Remarque : Deux mots sur le rap entre les symboles |- et ->

    L’implication -> a un rapport étroit avec la conséquence |-. La différence, c’est que -> est un connectif unissant deux propositions qui peuvent être vraies ou fausses, comme et (&) ou (v), alors que |- est une relation plus générale entre une proposition ou un ensemble de propositions (les prémisses) et une autre proposition ou un autre ensemble de propositions (les conclusions ou conséquences). La vérité des prémisses est prise pour acquis. Le connectif -> peut apparaître dans une ou plusieurs prémisses mais la conséquence n’apparaît jamais dans les prémisses : elle n’apparaît qu’une fois entre les prémisses et les conclusions :

    "x (homme(x) -> mortel(x)),   homme(Socrate) |- mortel(Socrate)

    La conséquence |- a plus ou moins le sens de donc alors que -> a plutôt le sens de si. Cependant, il y a un lien entre les deux. Il y a une règle de déduction qui dit : si de la prémisse A, je peux prouver B, alors A->B est vrai :

    si …A… |- B alors …|- A -> B

    On pourra donc souvent les interchanger. Lorsqu’on verra A |- B, on pourra utiliser A -> B et inversement, lorsqu’on verra A->B, on pourra (généralement) remplacer par A|- B.


    4. L’acceptabilité sémantique

    Il sera important de distinguer entre ce qui se comprend et ce qui est inacceptable, incorrect ou douteux. Il est certain que Toi Tarzan moi Jane se comprend mais on ne considérerait pas qu'un anglophone qui parlerait ou écrirait ainsi maîtrise le français.

    De la même façon ce déficit est économique, bien que ça se comprenne, est incorrect. Lorsqu’on mettra les symboles * ou  ? devant une phrase, ça voudra dire que, selon des critères stricts du français (écrit), cette phrase est incorrecte ou douteuse syntaxiquement ou sémantiquement.

    Évaluez les phrases suivantes (* ou  ?) selon qu’elles semblent correctes ou incorrectes :

    1. Néron est un chat mais il n’a pas de poil.
    2. Néron est un chat, donc il n’a pas de poil.
    3. Néron est un chat mais il a du poil.
    4. Néron est un cheval, donc il a une queue.

    Une autre difficulté qui est propre à la sémantique linguistique vient d’une règle gouvernant les dialogues, qui stipule que ce que dit l’interlocuteur a du sens. S’il y a conflit avec une règle sémantique, il faut chercher une réinterprétation qui règle le conflit. Si je dis : Jules a déchiré ton coq, il y a un conflit entre la définition normale de coq (oiseau mâle de basse-cour…) et les conséquences qu’on tire de la définition de déchirer, dans le sens physique, ( i.e.: déchirer X |- X est en papier ou en tissu, X est non animé). La conciliation vient de la possibilité de réinterpréter ton coq comme ton dessin d’un coq. On reviendra sur ces processus de réinterprétation qui sont extrêmement courants et, souvent, inclus explicitement dans les dicos.

    Ce qu’il faut retenir, c’est qu’on doit être à tout moment sur ses gardes et se demander s’il y a un changement de sens qu’on peut détailler.


    5. Les aspects logiques et conceptuels

    Si vous faites une recherche du terme sémantique sur Google, vous allez vite constater qu’il y a des sites qui semblent ne rien avoir avec la sémantique linguistique, du moins à première vue. Recherche faite le 6 août sur Google: 1e site (sémantique linguistique), 2e site :

    Le web sémantique se veut un web dont le contenu peut être appréhendé et exploité par des machines. Ainsi, le web sémantique pourra fournir des services plus aboutis à ses utilisateurs (trouver l'information pertinente, sélectionner, localiser et activer le service nécessaire...). Il peut être vu comme une infrastructure complémentant le contenu informel du web actuel avec de la connaissance formalisée. Il peut conduire à faire cohabiter plusieurs degrés de formalisations allant de schémas de métadonnées figés (comme celui du Dublin core) à des langages de représentation plus complexes (comme DAML+OIL et différentes logiques). Le Web sémantique représente un champ de recherches en plein développement dans lequel de nombreux travaux peuvent s'inscrire.

    http://www.lalic.paris4.sorbonne.fr/stic/as5.html

     

    Semantic Web Definition: The Semantic Web is the abstract representation of data on the World Wide Web, based on the RDF standards and other standards to be defined. It is being developed by the W3C, in collaboration with a large number of researchers and industrial partners.

    "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation." -- Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001

    http://www.w3.org/2001/sw/

    En deux mots, il s’agit de remplacer le langage HTML d’Internet par un langage comme le XML dans lequel des portions de texte sont  identifiés non seulement par la forme (ex : caractères gras) mais aussi par le contenu. Ex : les passages définissant des termes seraient identifiés par une balise comme <DÉFINITION> </DÉFINITION>.

    Un peu plus loin, on trouve

    D.E.A. Programmation:
    Sémantique, Preuves et Langages

    Ce D.E.A. s'adresse aux étudiants qui souhaitent s'orienter vers une activité de recherche dans le domaine de la programmation et de ses fondements logiques. Il débouche sur des sujets de stages et de thèses assez variés c'est-à-dire, à dominante théorique ou pratique, en milieu académique ou en milieu industriel, dans des équipes françaises ou étrangères.

    http://www.pps.jussieu.fr/DEA_PROGRAMMATION/

    On se demande ce que la sémantique fait en programmation. En fait, on retrouve le terme en mathématique depuis les années 30. La logique mathématique est un langage très précis dérivé des langues naturelles et conçu de manière à éviter les ambiguïtés. La logique mathématique contient une syntaxe formelle qui dit par exemple que la phrase suivante est correcte :

    "x ( naturel(x) ®$y ( successeur(x, y) ))

    Pour tout nombre naturel x, il existe un nombre successeur de ce x.

    Mais, il existe également une sémantique formelle qui donne un sens invariable et précis aux symboles "$®, soit en termes de valeurs de vérités ou de théorie des ensembles (" est vrai si tous les éléments de l’ensemble ont telle propriété).

    Les théoriciens de l’informatique ont étendu ces méthodes à l’analyse des langages de programmation. On retrouve donc le terme sémantique en linguistique, en logique mathématique et en informatique. De leur côté, les linguistes travaillant en sémantique formelle étendent ces mêmes méthodes à l’analyse des conjonctions (mais, donc, si…), des déterminants (tout, certain, chaque, plusieurs…), de la négation, des temps de verbes, etc. Toute la sémantique linguistique, même la plus intuitive, peut être reformulée logiquement. Il est évidemment possible de faire de la sémantique intuitivement. Mais en lisant en sémantique, on se demandera toujours : quel est le lien entre la sémantique intuitive et logique ? Mon défi : faire le lien entre les deux. (donc, un peu de logique et de théorie des ensembles), tout en tenant compte du fait que vos connaissances en logique sont limitées.


    6. Sémantique lexicale et sémantique combinatoire

    Pour comprendre le sens d'une phrase : il faut passer par les étapes suivantes :

    a) comprendre le sens des mots de la phrase ;
    b) faire l'interprétation syntaxique (déterminer quel mot modifie tel autre mot d'après l'ordre des mots dans la langue donnée) ;
    c) faire l'interprétation sémantique à partir de l'interprétation syntaxique et du sens des mots.

    Pourquoi la syntaxe et le sens des mots ne suffisent-ils pas ? Parce qu'une même structure syntaxique peut avoir plusieurs interprétations possibles. Par exemple, le sujet et l'objet d'une phrase jouent des rôles sémantiques variables : parfois c'est la cause directe d'un événement volontaire ou non, la cause indirecte (et inconsciente) parfois c'est ce qui subit l'action, parfois c'est l'objet d'un état, parfois rien ou presque :

    [±volontaire]

  • Jules a tué son frère en nettoyant sa carabine
  • ?? Jules a assassiné son frère en nettoyant sa carabine
  • [±conscient]

  • ??Sans le savoir, Jules a tué son frère en nettoyant sa carabine
  • Sans le savoir, Jules a terrifié son frère en nettoyant sa carabine
  • Le sujet est la cause: L'amiral Nelson a coulé le porte-avions

    Le sujet est l'objet du processus: Le porte-avions coule/ est en train de couler

    Le sujet est objet d'un état: Le porte-avions repose/gît au fond de la baie / ? Le porte-avions est en train de reposer/gésir

    Le sujet est vide: Il pleut et il me faut un volontaire car il est arrivé un terrible accident

    On note que dans chaque cas, le rôle des éléments de la phrase, dans le procès (=événement ou état) décrit, dépend a) du sens du verbe + la syntaxe. La sémantique doit donc donner les règles permettant de calculer le sens à partir du sens des mots et des relations syntaxiques. Ce calcul dirigé par la syntaxe et les propriétés lexicales, c'est la sémantique combinatoire. L'assignation des rôles sémantiques au sujet et aux objets des verbes s'appelle théorie de la liaison (linking). C'est, vu d'une autre façon, rendre compte de manière générale des inférences qu'on peut tirer en utilisant un mot dans un contexte syntaxique donné (OD: Objet Direct:

    Règles d'interprétation de couler

    1. Sujet - couler- OD |-

  • Sujet a causé le changement d'état de OD, OD est devenu dans le lieu FOND de l'eau
  • Avant, OD n'était pas au fond de l'eau
  • Sujet est impliqué (in-)directement Sujet est impliqué (in-)volontairement
  • 2. Sujet - couler |-

    • Sujet est devenu dans le lieu FOND de l'eau
    • Avant, Sujet n'était pas au fond de l'eau

    3. Sujet - a été coulé |- Comme (1) mais le Sujet n'est pas spécifié

    Question : Comment se fait l'interprétation d'une phrase ? Pourquoi le syntaxe ne suffit-elle pas à interpréter une phrase ? Donnez deux exemples avec une brève description.
    Question : torpiller ressemble intuitivement à couler. Est-ce que les mêmes règlesd'interprétation (1-3) s'appliqueraient à torpiller ? Pouvez-vous trouver un autre verbe comme couler, pour lequel les règles 1-3 s'appliqueraient sauf pour la partie soulignée qui est spécifique à couler?


    La sémantique lexicale: Dans notre modèle de l'interprétation d'une phrase, il doit y avoir un lexique, une syntaxe (ce qui est sujet, OD, circonstanciel i.e. devant/après le verbe) et une sémantique qui s'applique au deux premiers. L'étude du lexique fait partie de la sémantique (sémantique lexicale), distincte de la morphologie, qui est en quelque sorte, la syntaxe des mots (ex: ir+règle+ul+arité). La sémantique lexicale précisera que ir= NON arité= phénomène abstrait).

    Ainsi, la morphologie étudie la forme des mots, la syntaxe étudie la forme des phrases (ordre et groupement en constituants) et la sémantique s'applique aux deux premiers nivaux: on pourra distinguer la sémantique lexicale et la sémantique combinatoire, chacune mettant l'accent sur des aspects reliés mais qui leur sont propres.