Remerciez-le!

Remerciez @Admin pour avoir partagé cet document gratuitement, de la manière la plus simple, en partageant sur les réseaux sociaux.

La syntaxe, c’est de la sémantique Pascal Vaillant LIM&Bio (Laboratoire d’Infor

La syntaxe, c’est de la sémantique Pascal Vaillant LIM&Bio (Laboratoire d’Informatique Médicale et de Bio-Informatique) Université Paris-13 74, rue Marcel Cachin 93017 Bobigny cedex vaillant@univ-paris13.fr 1 Introduction Le concept d’ aﬀérence, proposé par Rastier (1987) pour décrire à l’échelle microscopique la construction du sens dynamique en contexte, est un mécanisme fondamental de la sémio- genèse, auquel les sciences du langage n’ont sans doute pas accordé jusqu’ici l’importance qu’il mérite. L’ aﬀérence est le principe par lequel une unité sémiotique peut importer, par « contagion », un sème présent dans son contexte ; ce sème vient ainsi s’agréger à son signiﬁé dynamique. Ce concept permet de rendre compte de la construction d’eﬀets de sens, et il est l’une des manifestations de la dynamique de l’interprétation. Il relève donc du champ de la sémantique, et il est logique que ce soit dans ce champ qu’il ait émergé. Nous souhaitons montrer ici qu’il permet aussi de rendre compte de phénomènes syn- taxiques, comme l’attribution à une unité linguistique d’une fonction dans la phrase. Ce type de phénomènes est habituellement délégué à une tradition descriptive — celle de la syntaxe — jugée plus rigoureuse que la sémantique, et pouvant fournir un palier séparé d’analyse. Le fait que des outils descriptifs issus de la sémantique rendent parfaitement compte de phénomènes syntaxiques n’a rien de surprenant en soi, puisque les deux niveaux d’analyse s’intéressent au fond à la même classe d’unités (des signes linguistiques) ; la seule frontière nette que l’on puisse objectivement tracer dans les classes d’unités linguistiques passant entre les signes (porteurs d’une valeur) et les segments purement distinctifs (phonèmes), et non entre « morphèmes lexicaux » et « morphèmes grammaticaux » — distinction dont la typologie et la linguistique historique démontrent qu’elle est graduelle, et variable dans le temps et l’espace. La question intéressante est donc plutôt de savoir si l’on peut se débarrasser de la séparation traditionnellement maintenue (de façon, à notre avis, trop rigide) entre les deux paliers d’analyse, tout en gardant les apports de l’un comme de l’autre. Le présent article propose une manière d’intégrer une représentation du phénomène d’af- férence dans un modèle de description formel de la syntaxe qui a fourni des preuves de son utilité et de son eﬃcacité dans le domaine du traitement automatique de la langue (celui des grammaires d’arbres adjoints à uniﬁcation de structures de traits). Nous montrerons 1 que ce qui bloque cette intégration n’est pas le principe du formalisme lui-même. Celui-ci, au contraire, dispose de la capacité de représenter l’intégration de structures dynamiques, et fournit une modélisation naturelle de l’aﬀérence. Ce qui bloque est la rigidité artiﬁ- cielle qu’introduit, dans ce modèle, l’habitude d’attribuer une catégorie syntaxique ﬁxe (caractérisation de la partie du discours) à chaque mot ou syntagme. Cette subdivision du lexique en catégories étanches, les parties du discours, n’est en réalité pas indispensable à une représentation du fonctionnement syntaxique de la langue ; en outre, elle repose sur une tradition descriptive qui n’est pas universelle, et s’adapte assez mal à la description de certaines langues. On peut construire un modèle de la syntaxe en s’en dispensant, et ce renoncement permet, dans le cas qui nous intéresse, de transcender la séparation artiﬁcielle entre paliers de description syntaxique et sémantique. 2 Situation du problème 2.1 Les catégories de parties du discours Selon Lallot (1988), Platon introduit la première opposition consciente entre catégories de mots dans le Cratyle, où il fait la distinction entre o nomat a et ûhmat a (noms et verbes). Aristote (De l’Interprétation, Poétique) introduit explicitement la notion de parties du discours (merh lexew ), et ajoute, au nom et au verbe, la conjonction (sundesmo ) et l’article (arjro n). La liste des parties du discours de la langue grecque se stabilise chez les grammairiens alexandrins (notamment Denys le Thrace et Apollonius Dyscole) en un inventaire de huit catégories : o noma (nom), ûhma (verbe), met o qh (participe), arjro n (article), ant wnumia (pronom), projesi (préposition), epirûhma (adverbe), et sundesmo (conjonction). La déﬁnition des parties du discours pour la langue française, fournie dans la Grammaire de Port-Royal reprend encore quasiment à l’identique cette liste, en y ayant seulement ajouté l’interjection (l’adjectif y est encore considéré comme une sous-catégorie du nom, ceux-ci étant divisés en noms substantifs et noms adjectifs). Il est important de noter que ces catégories sont toujours déﬁnies prioritairement sur un critère essentialiste (par exemple, dans les termes d’Arnauld et Lancelot, les noms désig- nent « les objets de nos pensées », et les verbes « la forme et la manière de nos pensées »), mais que dès Aristote, puis de manière plus nette chez Apollonius, et très explicite enﬁn chez Arnauld et Lancelot, des critères morphologiques sont utilisés pour les discriminer : « Ainsi le verbe, selon ce qui lui est essentiel, est un mot qui signiﬁe l’aﬃrmation. Mais si l’on veut joindre, dans la déﬁnition du verbe, ses principaux accidents, on le pourra déﬁnir ainsi : Vox signiﬁcans aﬃrmationem, cum designatione personæ, numeri et temporis : Un mot qui signiﬁe l’aﬃrmation, avec désignation de la personne, du nombre et du temps (...) » (Arnauld et Lancelot, 1997, chap. 13). La convocation des critères morphologiques est intéressante car elle montre la diﬃculté à trouver des délimitations nettes en ne se fondant que sur des critères essentialistes ; et qu’elle constitue en même temps un ancrage non-avoué de ces catégories dans l’étude d’un certain type très particulier de langues (le grec, le latin, l’hébreu, le français), qui possèdent en commun une morphologie ﬂexionnelle, et le marquage indiciel de catégories comme le genre, le nombre, la personne et le temps. Dans la variété des langues du monde, 2 ces quatre langues sont typologiquement très voisines, et au fond assez peu représentatives de l’ensemble. Mais ni Apollonius, ni les grammairiens de Port-Royal, n’envisagent l’idée que ces critères grammaticaux puissent être autre chose que des « accidents » : la déﬁnition sémantique universelle doit primer. Dans cette conviction qu’il est possible de donner une déﬁnition purement essentielle du concept1 réside l’idée que tout mot doit pouvoir être rattaché à une catégorie — autrement dit que les catégories constituent une partition2 de l’ensemble des mots d’une langue : « D’une représentation de la langue comme collection grammaticalement amorphe de noms (onomata), on est passé par étapes à une taxinomie rigoureuse selon laquelle tout mot grec relève d’une des huit classes appelées « parties du discours », et d’une seule. Le critère de classement est, pour chaque mot, sa conformité à l’idia en- noia, la « notion propre », qui déﬁnit une classe. Cette notion propre in- clut des données morphophonologiques (présence/absence de ﬂexion, ﬂexion casuelle/personnelle notamment), mais, pour Apollonius, ce qui la constitue essentiellement, c’est un « signiﬁé » (sêmainomenon) de nature sémantico- syntaxique (le nom désigne une substance avec une qualité, l’article exprime l’anaphore du déjà connu, l’adverbe prédique le verbe, etc.). C’est donc ce « signiﬁé » qui fournit le critère principal de classiﬁcation d’un mot. » (Lallot, 1988, p. 22) 2.2 Utilisation en linguistique formelle La grammaire formelle se développe à partir du milieu du XXe siècle avec un double pro- jet : rendre le fonctionnement de la langue modélisable pour les applications automatiques qui commencent à devenir envisageables (par exemple la traduction automatique) ; et of- frir un modèle du fonctionnement de l’esprit humain lorsque celui-ci manipule le langage. Cette grammaire formelle a des ambitions explicitement universalistes (chez Chomsky). Dans ses deux grandes variantes d’origine, la grammaire formelle hérite dès le départ de la conception alexandrine de la grammaire, avec ses parties du discours étanches, son intérêt pour la phrase comme objet central du langage, et sa conception de la phrase comme proposition logique décomposée en sujet et attribut, sans se poser (plus que les grammairiens alexandrins ou ceux de Port-Royal) la question de son adéquation à la diversité des langues. Le modèle des PSG (Phrase Structure Grammars) proposé par Chomsky (1969) prend pour point de départ la structure syntagmatique des phrases. Il propose, comme mécan- isme fondamental de l’articulation de la langue, des règles qui permettent de combiner des syntagmes, en fonction de leur catégorie, en syntagmes de niveau supérieur (par ex- emple, une phrase est la combinaison d’un groupe nominal et d’un groupe verbal). Les étiquettes de parties du discours ont dans ce modèle un rôle charnière, puisqu’ils sont les premières catégories abstraites : les catégories des syntagmes minimaux, encore appelées « pré-terminaux ». 1Le mot concept est ici bien entendu un anachronisme ; le mot utilisé par Apollonius est σημαινομενον (sêmainomenon) — qu’il est tout aussi anachronique de traduire par signiﬁé. 2Partition au sens mathématique, c’est-à-dire : répartition en un ensemble de sous-ensembles disjoints dont l’union reconstitue l’ensemble total. 3 Ainsi la mini-grammaire « CFG » (Context-Free Grammar) décrite par le paquet de règles ci-dessous : Ph → GN GV Det → le V → mange GN → Det N N → chat V → poursuit GV → V GN N → rat permet-elle de produire la phrase : Ph →GN GV →Det N uploads/Philosophie/ art-pascal-vaillant-la-syntaxe-c-x27-est-de-la-semantique.pdf