mise à jour: mai2004, Françoise Labelle
Les scientifiques découvrent les fondements biologiques de l'expérience conscienteÉdition du lundi 29 avril 2002 [ ] Outre cette concentration exceptionnelle de cellules nerveuses dans le cerveau humain, on remarque un vaste réseau de connexions entre les différentes aires corticales, qui assument diverses fonctions. "Les aires qui coordonnent le langage par exemple doivent être connectées à toutes les autres modalités sensorielles, explique Wolf Singer. Car on peut reconnaître et nommer un objet aussi bien par le toucher que par la vision, l'audition ou l'odeur. Toutes ces informations doivent trouver leur chemin vers le générateur du mot." [ ] Or, les connexions intermodales entre les différentes aires corticales sont beaucoup moins nombreuses chez les animaux dont les systèmes sensoriels demeurent davantage isolés, nous apprend le chercheur. Si l'animal détecte un stimulus par le système visuel, il n'est pas certain qu'il sache le généraliser dans une autre modalité, comme le toucher par exemple. "Les animaux généralisent beaucoup moins bien, parce qu'ils ont moins de connexions intermodales", précise le neurobiologiste. [ ] Par ailleurs, Wolf Singer insiste sur les synchronisations qu'il a observées entre les multiples activités neuronales qui surviennent en parallèle en diverses régions du cerveau lors d'une expérience consciente. Ces synchronisations seraient importantes pour lier les résultats de ces activités distribuées, pour les associer et les interpréter en un tout cohérent afin de créer l'unité de la conscience, explique-t-il. |
En résumé, les animaux généralisent beaucoup moins bien, parce qu'ils ont moins de connexions intermodales. La capacité dabstraction, de généralisation, est plus poussée chez lhumain (pour le meilleur et pour le pire) et cette capacité dabstraction intermodale est devenue possible grâce à lassociation concept-mot (ou signifié-signifiant). Et ce sont des neurologues qui parlent.
Les animaux sont capables de classer des stimuli. Cependant, la capacité symbolique, cest-à-dire la capacité de définir un symbole (mot) en renvoyant à dautres symboles n'est accessible qu'uax plus brillants d'entre eux et quau terme dun entraînement fastidieux. Ce n'est pas une aptitude qui leur vient naturellement, comme cest le cas chez un enfant.
La capacité symbolique, cest le fait que les symboles «lait», «jus» renvoient chez nous non seulement à une réalité physique mais aussi à dautres symboles comme «liquide» «extrait de fruits» etc., comme dans un dico [dictionnaire]. Cest cette faculté qui nous permet dinventer des animaux imaginaires, des mondes imaginaires à partir des propriétés symboliques que possèdent les animaux et les situations réelles, ou dimaginer une vie après la mort
Bien que les technologies de linformation soient maintenant plus humbles, comme il se doit, elles demeurent un domaine davenir pour la linguistique. Qui ne rêve, par exemple, de faire une recherche intelligente sur Internet ou à travers des tonnes de [copies!] documents du type : «Donne-moi les documents qui traitent des maladies respiratoires» et que lordi comprenne quil sagit dasthme, demphysème, dembolie pulmonaire de virus sattaquant aux bronches La sémantique intervient directement dans ce processus. En fait, comme on le verra, maladie respiratoire est un hyperonyme dasthme, demphysème, dembolie pulmonaire Mais simplement entrer un dico dans lordi ne suffira pas à la tâche parce que les dicos nont pas été conçus de manière strictement formelle. Ce sera peut-être à vous quincombera cette tâche. Ce domaine sappelle lextraction dinformations, la représentation des connaissances (data mining, knowledge representation).
Les applications faisant appel directement à la sémantique ne manquent pas. On peut mentionner les recherches sur le résumé automatique (ex : http://www.pertinence.net/index.html), la traduction automatique La sémantique intervient également en robotique, en particulier sur le raisonnement en langues naturelles, le dialogue homme-machine http://www.universimmedia.com/topicmaps/topics/semantique.htm La
sémantique est, dans les sciences du langage, opposée à la
syntaxe. |
Question dévaluation : Faites la recherche suivante sur Altavista avancé (http://www.altavista.com/sites/search/adv). Tapez "extraction d'information" (les guillemets sont importants). Comme il y a beaucoup de projets en développement, j'en ai choisi un pour vous.
Reformulation Allez au lien suivant http://www.iro.umontreal.ca/~kosseim/Publications/pub.html et décrivez brièvement (5 lignes) les objectifs linguistiques du système d'extraction d'information Exibum .
Si vous êtes curieux(-se), faites donc la recherche sur «résumé automatique».
art. inséré dans : traiter.ladoc.net/analyse/pertinence.php3 Solution
innovante de traitement du flux informationnel : Pertinence.net est un service
sur Internet derrière lequel est mis en uvre un logiciel qui
résume automatiquement des textes. L'utilisateur peut soumettre des
textes de trois manières différentes: un texte en local
(ordinateur personnel), une URL web ou du texte saisi dans une fenêtre
dédiée, un Copier/Coller est aussi possible. Ce service est GRATUIT à l'URL :
www.pertinence.net |
La sémantique, cest létude du sens. Et le sens, cest quoi ? On peut sinterroger longtemps là-dessus. Je préfère poser la question à partir dune situation plus concrète. Vous êtes dans votre jeu vidéo préféré et vous voyez une phrase écrite (en français) sur un mur, inscription importante pour la poursuite du jeu :
Le demi-frère de Laura a tué le gardien de la Porte
Quel est le sens de cette phrase? Après lavoir lue, vous pouvez tirer plusieurs conclusions : entre autres, dans cette réalité
{ Il y a quelquun qui sappelle Laura, appelons-la l, l a un frère par alliance, appelons-le f, il y a quelquun qui garde une entrée vers un autre lieu, appelons-le g, g est mort, f est directement responsable de sa mort }
Ces conclusions (ou inférences) que vous tirez font partie du sens de la phrase. Mais elles peuvent être attribuables à toute sorte de facteurs bien différents, linguistiques et non linguistiques. Certaines proviennent du sens des mots, de la grammaire, de la syntaxe. Si X a tué Y, alors Y est mort, sinon tuer na pas son sens linguistique conventionnel. De même, si je dis Mon docteur est partie en vacances, on peut tirer comme conclusions, entre autres, que jai un docteur habituel, cest une femme, elle nest pas là Dautres conclusions proviennent de connaissances sans intérêt linguistique : par exemple, je sais quelle était épuisée, donc il se peut quelle ne revienne pas de sitôt. Si vous êtes parano, vous allez conclure quelle ne veut pas vous voir ou que cest de votre faute si elle est partie
Pour nous, donc, le sens dune phrase, cest lensemble des conclusions quon peut en tirer, à partir de règles relevant de la structure linguistique de la phrase. Parmi les conclusions linguistiques, notre champ dintérêt, il y a deux types : les conclusions sémantiques (ou conventionnelles) attribuables au sens des mots, à la grammaire et à la syntaxe : si X a tué Y, alors Y est mort est une conclusion sémantique (ou conventionnelle). Lautre ensemble provient du contexte linguistique : les conclusions pragmatiques (ou conversationnelles). Par exemple : si vous répondez à quelquun qui tombe en panne dessence à Saint-Félicien quil y a un poste dessence à Chicoutimi, il sera en droit de conclure quil ny en a pas plus près, même si ça ne figure pas dans ce que vous avez dit. Vous aurez dit la vérité mais vous aurez été peu coopératif. De même, dans «Le dernier client avait la mine basse», la référence de le dernier client est variable et dépend du moment où vous le dites. La sémantique et la pragmatique sont indissolublement liées, comme on le verra, et on a comme objectif dexpliquer comment on peut tirer un ensemble de conclusion à partir dune phrase ou dun texte.
Question d'évaluation : Quest-ce que le sens dune phrase ? Quest-ce que la sémantique et la pragmatique. Exemples.
Remarque: La décomposition de textes en propositions élémentaires, comme dans l'exemple ci-haut, s'appelle Discourse representation Theory(ou DRT). En psychologie, plusieurs chercheurs, dont le plus connue est Walter Kintsch, utilisent également une représentation propositionnelle des textes.
Ce qui précède nous amène à préciser la notion de conséquence logique, ce quon a appelé les conclusions quon peut tirer dune phrase ou dun texte. Nous allons faire de la notion de conséquence (conclusion, inférence) logique une des bases de la sémantique et la pragmatique, ce qui nous permettra a) dunifier la sémantique lexicale (liens entre les mots) et propositionnelle (liens entre les propositions) et b) de bénéficier des acquis importants de la logique formelle, qui est basée sur la notion de conséquence logique. Nous ferons, au fur et à mesure, le lien entre notre approche et les approches plus classiques. [cf. J.Moeschler et A.Auchlin, Introduction à la linguistique contemporaine, Chap.10]
Un des concepts de base de la logique, qui est intuitivement facile à comprendre, est celui de conséquence (inférence) logique symbolisée par |- et mettant en relation une (1) ou plusieurs phrases (2,3) : ex :
1. Julie a cessé de fumer |- Julie fumait
2. Paul est policier, les policiers sont bien payés |- Paul est bien payé
3. Néron, cest mon chat |- Néron est un mammifère, Néron est poilu
Remarque : La conséquence logique peut aussi être notée verticalement comme suit :
Paul est policier
les policiers sont bien payés
\Paul est bien payé
La relation A |- B veut dire
exactement ceci : si une personne
considère que la proposition A est vrai, alors, si cette personne
najoute aucune autre information, alors on peut conclure que cette
personne considère que la proposition B est également
vraie.
Par exemple, en (1) ci-haut, si on tient pour vrai que Julie a cessé
de fumer, à moins de redéfinir le sens conventionnel de
cessé, alors on doit accepter que Julie fumait. De
même pour les autres exemples.
Bien sûr, il ne suffit pas de constater qu'il y a des relations de
conséquence logique entre les phrases. Ce n'est qu'un début. Il
faut ensuite produire une analyse permettant de l'expliquer et, ce de
manière la plus rigoureuse et la plus générale possible.
Dans le cas de (2), l'analyse relève de la logique des prédicats;
en (3), la notion d'hyponymie (prochaine section) permet d'expliquer ce type
d'inférence.
Question d'évaluation: Définir la relation d'inférence logique. Donnez un exemple et expliquez.
Exercice: En se basant sur le sens conventionnel des mots et en n'ajoutant pas d'informations supplémentaires, pour chacune des phrases (1-4) indiquer le rapport d'inférence (|-) lorsque c'est le cas, avec a) Jules a atteint Julie et b) Jules n'a pas atteint Julie
Un exemple classique d'inférence en logique serait du type :
Tous les homme sont mortels, Socrate est un homme |- Socrate est mortel
"x (homme(x) -> mortel(x)), homme(Socrate) |- mortel(Socrate)
Quels que soient les mots utilisés, si un raisonnement a cette forme, lorsquon accepte les prémisses, on doit accepter la ou les conclusions. Si cette relation de conséquence logique nexistait pas, il ny aurait pas de sémantique (logique ou intuitive), puisquil ny aurait plus de stabilité dans le sens. Les logiciens se sont donné comme tâches de fixer le sens de certains mots comme tous ("), si (->). Ces mots sont des mots du langage quotidien auxquels on a donné un sens limité et précis. Une des tâches du sémanticien est détendre lanalyse aux divers sens de tous et si qui ne sont pas couverts et détendre lanalyse aux autres mots du même type, comme certains, chaque mais, pourtant, donc
Une autre tâche consiste à expliquer les régularités sémantiques comme celle-ci: si une personne vous dit que «Julie a cessé de fumer» et que vous croyez quelle dit vrai alors, à moins quelle najoute dautres informations, vous devez conclure que «avant, Julie fumait». Cette propriété est propre au sens du verbe cesser. Si vous utilisez plutôt le verbe tenter, tout change. Sil ny avait pas cette stabilité, le verbe cesser naurait plus son sens. Autre exemple : si une personne vous dit que «Néron, cest mon chat » et que vous croyez quelle dit vrai alors, à moins quelle najoute dautres informations (qu'il est né à Tchernobyl), vous devez conclure que Néron est poilu.
La clause «à moins quelle najoute dautres informations» est essentielle. Contrairement aux systèmes mathématiques, il est possible, dans les langues naturelles, dajouter des informations qui suspendent (ou annulent) momentanément certaines des conclusions attendues. Cest lutilité de la conjonction mais. Ex : Néron, cest mon chat mais il nest pas poilu.
Ce qui vous permet dutiliser mais, cest le fait que normalement, «il est poilu» est une conséquence logique de «Néron, cest mon chat». Vous utilisez mais parce quil y a suspension momentanée (exceptionnelle) de la conséquence logique découlant de lemploi de du mot chat (Néron est un chat exceptionnel).
Par conséquent, il est impossible dutiliser mais devant une proposition qui est une conséquence logique. Ainsi, les phrases suivantes sont absurdes :
*Néron, cest mon chat mais il est poilu
*Cest une fraise mais elle est rouge
*Julie a cessé de fumer, mais avant elle fumait
Cette propriété des langues naturelles qui permet dajouter des informations qui annulent les conséquences logiques de ce qui a été dit précédemment permet de classer les langues naturelles parmi les systèmes logiques non-monotones. Une langue naturelle est un système ouvert beaucoup plus riche que les langages artificiels, qui permet de résoudre des contradictions apparentes. On peut dire par exemple «Néron est un chat et il nen est pas un» [contradiction], ou «Un politicien est un politicien» [tautologie]. Pour une ordi programmé selon la logique classique (monotone), cest simplement contradictoire ou redondant dans le cas de la seconde phrase. Mais en langues naturelles, ça signifie «dun point de vue, on peut dire quil est un chat», «dun autre point de vue, on peut dire quil nest pas un chat». Ce jeu sur les points de vue peut être formalisé dans les systèmes de logique intensionnelle. La seconde signifiera «un politicien ne sera jamais plus quun politicien» renvoyant ainsi aux limites du politicien standard (stéréotypé), un menteur profiteur à lego enflé [ou un martyr qui assume pleinement les contradictions selon votre point de vue].
Remarque : Deux mots sur le rap entre les symboles |- et ->
Limplication -> a un rapport étroit avec la conséquence |-. La différence, cest que -> est un connectif unissant deux propositions qui peuvent être vraies ou fausses, comme et (&) ou (v), alors que |- est une relation plus générale entre une proposition ou un ensemble de propositions (les prémisses) et une autre proposition ou un autre ensemble de propositions (les conclusions ou conséquences). La vérité des prémisses est prise pour acquis. Le connectif -> peut apparaître dans une ou plusieurs prémisses mais la conséquence napparaît jamais dans les prémisses : elle napparaît quune fois entre les prémisses et les conclusions :
"x (homme(x) -> mortel(x)), homme(Socrate) |- mortel(Socrate)
La conséquence |- a plus ou moins le sens de donc alors que -> a plutôt le sens de si. Cependant, il y a un lien entre les deux. Il y a une règle de déduction qui dit : si de la prémisse A, je peux prouver B, alors A->B est vrai :
si A |- B alors |- A -> B
On pourra donc souvent les interchanger. Lorsquon verra A |- B, on pourra utiliser A -> B et inversement, lorsquon verra A->B, on pourra (généralement) remplacer par A|- B.
Il sera important de distinguer entre ce qui se comprend et ce qui est inacceptable, incorrect ou douteux. Il est certain que Toi Tarzan moi Jane se comprend mais on ne considérerait pas qu'un anglophone qui parlerait ou écrirait ainsi maîtrise le français.
De la même façon ce déficit est économique, bien que ça se comprenne, est incorrect. Lorsquon mettra les symboles * ou ? devant une phrase, ça voudra dire que, selon des critères stricts du français (écrit), cette phrase est incorrecte ou douteuse syntaxiquement ou sémantiquement.
Évaluez les phrases suivantes (* ou ?) selon quelles semblent correctes ou incorrectes :
Une autre difficulté qui est propre à la sémantique linguistique vient dune règle gouvernant les dialogues, qui stipule que ce que dit linterlocuteur a du sens. Sil y a conflit avec une règle sémantique, il faut chercher une réinterprétation qui règle le conflit. Si je dis : Jules a déchiré ton coq, il y a un conflit entre la définition normale de coq (oiseau mâle de basse-cour ) et les conséquences quon tire de la définition de déchirer, dans le sens physique, ( i.e.: déchirer X |- X est en papier ou en tissu, X est non animé). La conciliation vient de la possibilité de réinterpréter ton coq comme ton dessin dun coq. On reviendra sur ces processus de réinterprétation qui sont extrêmement courants et, souvent, inclus explicitement dans les dicos.
Ce quil faut retenir, cest quon doit être à tout moment sur ses gardes et se demander sil y a un changement de sens quon peut détailler.
Si vous faites une recherche du terme sémantique sur Google, vous allez vite constater quil y a des sites qui semblent ne rien avoir avec la sémantique linguistique, du moins à première vue. Recherche faite le 6 août sur Google: 1e site (sémantique linguistique), 2e site :
Le web sémantique se veut un web dont le contenu peut être appréhendé et exploité par des machines. Ainsi, le web sémantique pourra fournir des services plus aboutis à ses utilisateurs (trouver l'information pertinente, sélectionner, localiser et activer le service nécessaire...). Il peut être vu comme une infrastructure complémentant le contenu informel du web actuel avec de la connaissance formalisée. Il peut conduire à faire cohabiter plusieurs degrés de formalisations allant de schémas de métadonnées figés (comme celui du Dublin core) à des langages de représentation plus complexes (comme DAML+OIL et différentes logiques). Le Web sémantique représente un champ de recherches en plein développement dans lequel de nombreux travaux peuvent s'inscrire. http://www.lalic.paris4.sorbonne.fr/stic/as5.html
Semantic Web Definition: The Semantic Web is the abstract representation of data on the World Wide Web, based on the RDF standards and other standards to be defined. It is being developed by the W3C, in collaboration with a large number of researchers and industrial partners. "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation." -- Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001 http://www.w3.org/2001/sw/ |
En deux mots, il sagit de remplacer le langage HTML dInternet par un langage comme le XML dans lequel des portions de texte sont identifiés non seulement par la forme (ex : caractères gras) mais aussi par le contenu. Ex : les passages définissant des termes seraient identifiés par une balise comme <DÉFINITION> </DÉFINITION>.
Un peu plus loin, on trouve
D.E.A.
Programmation: Ce D.E.A. s'adresse aux étudiants qui souhaitent s'orienter vers une activité de recherche dans le domaine de la programmation et de ses fondements logiques. Il débouche sur des sujets de stages et de thèses assez variés c'est-à-dire, à dominante théorique ou pratique, en milieu académique ou en milieu industriel, dans des équipes françaises ou étrangères. http://www.pps.jussieu.fr/DEA_PROGRAMMATION/ |
On se demande ce que la sémantique fait en programmation. En fait, on retrouve le terme en mathématique depuis les années 30. La logique mathématique est un langage très précis dérivé des langues naturelles et conçu de manière à éviter les ambiguïtés. La logique mathématique contient une syntaxe formelle qui dit par exemple que la phrase suivante est correcte :
"x ( naturel(x) ®$y ( successeur(x, y) ))
Pour tout nombre naturel x, il existe un nombre successeur de ce x.
Mais, il existe également une sémantique formelle qui donne un sens invariable et précis aux symboles "$®, soit en termes de valeurs de vérités ou de théorie des ensembles (" est vrai si tous les éléments de lensemble ont telle propriété).
Les théoriciens de linformatique ont étendu ces méthodes à lanalyse des langages de programmation. On retrouve donc le terme sémantique en linguistique, en logique mathématique et en informatique. De leur côté, les linguistes travaillant en sémantique formelle étendent ces mêmes méthodes à lanalyse des conjonctions (mais, donc, si ), des déterminants (tout, certain, chaque, plusieurs ), de la négation, des temps de verbes, etc. Toute la sémantique linguistique, même la plus intuitive, peut être reformulée logiquement. Il est évidemment possible de faire de la sémantique intuitivement. Mais en lisant en sémantique, on se demandera toujours : quel est le lien entre la sémantique intuitive et logique ? Mon défi : faire le lien entre les deux. (donc, un peu de logique et de théorie des ensembles), tout en tenant compte du fait que vos connaissances en logique sont limitées.
Pour comprendre le sens d'une phrase : il faut passer par les étapes suivantes :
a) comprendre le sens des mots de la phrase ;
b) faire l'interprétation syntaxique (déterminer quel mot modifie tel autre mot d'après l'ordre des mots dans la langue donnée) ;
c) faire l'interprétation sémantique à partir de l'interprétation syntaxique et du sens des mots.
Pourquoi la syntaxe et le sens des mots ne suffisent-ils pas ? Parce qu'une même structure syntaxique peut avoir plusieurs interprétations possibles. Par exemple, le sujet et l'objet d'une phrase jouent des rôles sémantiques variables : parfois c'est la cause directe d'un événement volontaire ou non, la cause indirecte (et inconsciente) parfois c'est ce qui subit l'action, parfois c'est l'objet d'un état, parfois rien ou presque :
[±volontaire]
[±conscient]
Le sujet est la cause: L'amiral Nelson a coulé le porte-avions
Le sujet est l'objet du processus: Le porte-avions coule/ est en train de couler
Le sujet est objet d'un état: Le porte-avions repose/gît au fond de la baie / ? Le porte-avions est en train de reposer/gésir
Le sujet est vide: Il pleut et il me faut un volontaire car il est arrivé un terrible accident
On note que dans chaque cas, le rôle des éléments de la phrase, dans le procès (=événement ou état) décrit, dépend a) du sens du verbe + la syntaxe. La sémantique doit donc donner les règles permettant de calculer le sens à partir du sens des mots et des relations syntaxiques. Ce calcul dirigé par la syntaxe et les propriétés lexicales, c'est la sémantique combinatoire. L'assignation des rôles sémantiques au sujet et aux objets des verbes s'appelle théorie de la liaison (linking). C'est, vu d'une autre façon, rendre compte de manière générale des inférences qu'on peut tirer en utilisant un mot dans un contexte syntaxique donné (OD: Objet Direct:
| Règles d'interprétation de couler 1. Sujet - couler- OD |- 2. Sujet - couler |-
3. Sujet - a été coulé |- Comme (1) mais le Sujet n'est pas spécifié |
Question : Comment se fait l'interprétation d'une phrase ?
Pourquoi le syntaxe ne suffit-elle pas à interpréter une phrase ?
Donnez deux exemples avec une brève description.
Question : torpiller ressemble intuitivement à
couler. Est-ce que les mêmes règlesd'interprétation
(1-3) s'appliqueraient à torpiller ? Pouvez-vous trouver un autre
verbe comme couler, pour lequel les règles 1-3 s'appliqueraient
sauf pour la partie soulignée qui est spécifique à
couler?
La sémantique lexicale: Dans notre modèle de l'interprétation d'une phrase, il doit y avoir un lexique, une syntaxe (ce qui est sujet, OD, circonstanciel i.e. devant/après le verbe) et une sémantique qui s'applique au deux premiers. L'étude du lexique fait partie de la sémantique (sémantique lexicale), distincte de la morphologie, qui est en quelque sorte, la syntaxe des mots (ex: ir+règle+ul+arité). La sémantique lexicale précisera que ir= NON arité= phénomène abstrait).
Ainsi, la morphologie étudie la forme des mots, la syntaxe étudie la forme des phrases (ordre et groupement en constituants) et la sémantique s'applique aux deux premiers nivaux: on pourra distinguer la sémantique lexicale et la sémantique combinatoire, chacune mettant l'accent sur des aspects reliés mais qui leur sont propres.