FR2862780A1 - Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee - Google Patents

Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee Download PDF

Info

Publication number
FR2862780A1
FR2862780A1 FR0313819A FR0313819A FR2862780A1 FR 2862780 A1 FR2862780 A1 FR 2862780A1 FR 0313819 A FR0313819 A FR 0313819A FR 0313819 A FR0313819 A FR 0313819A FR 2862780 A1 FR2862780 A1 FR 2862780A1
Authority
FR
France
Prior art keywords
generic
grammar
entities
conceptual model
lexical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR0313819A
Other languages
English (en)
Inventor
Celestin Sedogbo
Benedicte Goujon
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Thales SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thales SA filed Critical Thales SA
Priority to FR0313819A priority Critical patent/FR2862780A1/fr
Priority to EP04804566A priority patent/EP1687740A1/fr
Priority to JP2006540459A priority patent/JP2007512601A/ja
Priority to PCT/EP2004/053083 priority patent/WO2005052809A1/fr
Priority to US10/580,343 priority patent/US20070078643A1/en
Publication of FR2862780A1 publication Critical patent/FR2862780A1/fr
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

Le procédé de la présente invention est un procédé de conception d'une grammaire sémantique, c'est-à-dire relative à un domaine d'application à partir d'une grammaire générique et d'une base de connaissances lexicales du domaine d'application considéré. La grammaire générique est une grammaire de type grammaire d'unification avec des traits morpho-syntaxiques usuels (tels que le genre et le nombre pour les substantifs ou adjectifs employés), et le modèle sémantique du domaine décrit les traits syntaxico-sémantiques propres au domaine d'application.Selon l'invention on établit un modèle conceptuel spécifique du domaine concerné, on combine ce modèle conceptuel avec une grammaire générique et un lexique générique et on en déduit la grammaire spécifique.Un tel procédé est mis en oeuvre par exemple pour assurer la commande automatisée d'un processus ou d'un véhicule.

Description

La présente invention sera mieux comprise à la lecture de la description
détaillée d'un mode de mise en oeuvre, pris à titre d'exemple non limitatif.
Le procédé de l'invention réalise la séparation entre des connaissances génériques et des connaissances spécifiques à une application. Les connaissances liées au domaine d'application sont contenues dans le modèle conceptuel de l'application, qui est vu comme un ensemble d'entités et un ensemble de relations entre ces entités. Les connaissances génériques se trouvent dans la grammaire générique, qui est lo décrite comme un ensemble de règles syntaxiques et sémantiques avec des contraintes conceptuelles (telles que des relations autorisées entre un adjectif et le nom auquel il se rapporte) et un lexique morphologique (qui comporte par exemple toutes les formes conjuguées d'un verbe).Un exemple de contrainte conceptuelle pourrait être la couleur d'un char d'assaut. Cette couleur peut être grise, mais non pas rose.
Le modèle conceptuel de l'application contient des entités, des relations entre entités et des associations entre entités. Généralement, les entités sont assignées à des noms, des noms propres et des adjectifs. Les relations entre entités peuvent être par exemple: une propriété (une couleur est une propriété d'un objet physique), une partie de quelque chose (par exemple, une roue est une partie d'une bicyclette), une possession (Pierre a une bicyclette), un héritage (une bicyclette est un véhicule terrestre, et en tant que tel, possède les propriétés des véhicules terrestres, par exemple des roues). Les associations sont reliées aux verbes et reflètent leur structure fonctionnelle. Le lexique générique contient des traits ne dépendant pas d'une application (genre, nombre, personne, etc..). Couplé au modèle conceptuel de l'application, le lexique générique permet de délivrer un lexique spécifique au domaine d'application considéré. La grammaire générique est une grammaire d'unification contenant un ensemble de règles syntaxiques et sémantiques ayant des contraintes conceptuelles sous-spécifiées. Couplée au modèle conceptuel, cette grammaire permet d'obtenir une grammaire spécifique du domaine considéré.
Le procédé de l'invention sera expliqué maintenant en référence à l'exemple très simplifié d'une grammaire décrivant un programme de 35 télévision. Le tableau 1 ci-dessous présente le modèle conceptuel associé à ce domaine d'application. Dans ce tableau, afin de différencier les éléments du méta-langage de leurs contenus, les éléments du méta- langage sont écrits en italique gras, et les contenus en police normale.
TABLEAU 1
Entité ([chaîne, [TF1, France 2j]). Propriété (programme, catégorie).
Entité ([film, [film]]). Propriété (programme, durée).
Entité ([programme, [programme]]). Est un (film, programme).
Entité ([catégorie, [violent, non violent]]). Est un (dessin_animé, programme) Structure fonctionnelle ([jouer, Sujet (chaîne), ObjetDirect (programme), [jouer]]).
Dans ce tableau simplifié de modèle conceptuel, la première description de concept indique que chaîne est une entité reliée aux mots TF1 et France2 , et ainsi de suite pour les autres entités. Propriété io décrit les propriétés attribuées aux entités correspondantes. La dernière ligne du tableau est une règle de structure fonctionnelle qui indique que la relation jouer a une entité sujet qui est chaîne , une entité ObjetDirect (ou complément d'objet direct) qui est programme et est assignée au mot jouer .
Le modèle conceptuel encode des connaissances linguistiques détaillées sur les objets du domaine d'application. De plus, des transformations linguistiques implicites sont utilisées afin d'optimiser la définition de relations entre objets. Par exemple, on définit des primitives conceptuelles dérivées telles que: Qualificatif (E, A) : -entité (E), propriété (E, A) Qualificatif (E, A) : -est un (E, H), qualificatif (H, A) Dans ces primitives, E est une entité, A une propriété et H une autre entité. Dans la première primitive, E est par exemple l'entité programme , A est une catégorie de programme et dans la deuxième, l'entité E est un film, H un programme et A une catégorie.
A partir d'un lexique générique et du modèle conceptuel, on dérive un lexique spécifique du domaine en question. Etant donné que chaque entité ou relation est liée à sa forme lexicale, on enrichit le lexique général avec les contraintes imposées par le modèle conceptuel.
En supposant que le modèle conceptuel pointe sur des lexèmes (entrées du lexique générique) valides, le lexique du domaine d'application peut être généré à partir du lexique générique, comme montré de façon simplifiée sur le tableau 2 ci-dessous.
TABLEAU 2
Dans ce tableau 2, les flèches indiquent la catégorie grammaticale de chacune des entrées du lexique, par exemple, un est un déterminant, non violent est un adjectif de type catégorie, etc... Les expressions entre crochets indiquent les traits morpho-syntaxiques (genre et nombre) des lexèmes.
On va décrire maintenant en référence au tableau 3 ci-dessous un extrait de la grammaire générique présentant les groupes nominaux.
Un->dét [genre masc] [nombre sing] violent-> adj_catégorie [genre masc] [nombre sing] joue-> verb_ouer [nombre sing] [pers, troisième] film->nom film [genre masc] [nombre sing.] non violent--> adj_catégorie [genre masc] [nombre sing.]
TABLEAU 3
np -> dét nom adj [ genre np] = [genre nom] [genre défi = [genre nom] [genre adj] = [genre nom] [nombre np] = [nombre nom] [nombre dét] = [nombre nom] [nombre adj] = [nombre nom] [type np] = E1 [type nom] = El [type adj] = E2 { qualificatif (El, E2) } Dans ce tableau 3, constituant une règle de grammaire, les six premières contraintes sont liées au lexique utilisé, et les quatre dernières sont des contraintes liées au modèle conceptuel. El et E2 sont des entités, au même titre que dans le tableau 2, et np est un groupe nominal. Les crochets entourent les contraintes conceptuelles. Les règles présentées dans ce tableau montrent qu'il y a une contrainte conceptuelle entre l'adjectif (adj), le nom et le déterminant (dét), et que cette contrainte est indépendante de l'instance du domaine d'application.
Le tableau 4 ci-dessous décrit des règles génériques qui sont ajoutées afin de tenir compte de la construction des phrases.
TABLEAU 4
Dans ce tableau, np est un groupe nominal, vp est un groupe verbal, V le type du verbe, S le type du groupe nominal sujet, O le type du s groupe nominal ObjetDirect (complément d'objet direct) et F est la structure fonctionnelle de la phrase à construire. En reprenant l'exemple du tableau 1, on voit qu'à la dernière ligne de ce tableau (représentant la structure fonctionnelle F), V est le verbe jouer , S est l'entité chaîne , et O est l'entité programme .
lo A partir du modèle conceptuel (tableau 1) et du lexique du domaine considéré (tableau 2), les extraits des règles de grammaire générique décrivant les groupes nominaux sont combinés afin d'obtenir la règle syntaxico-sémantique exposée de façon simplifiée dans le tableau 5 cidessous. Cette règle dépend du domaine considéré.
TABLEAU 5
np_film dét nom film adj_catégorie adj_catégorie (violent) [genre np film] = [genre nom film] adj_catégorie (non violent) [genre dét] = [genre nom film] nom film (film) [genre adj catégorie] = [genre nom film] [nombre np film] = [nombre nom film] [nombre dét] = [nombre nom film}] [nombre adj catégorie] = [nombre nom film] s -+npvp [nombre np] = [nombre vp] [type vp] = V [type np] S {structure_ fonctionnelle (F) type (F) = V sujet (F) = S}vp verbe np [type vp] = [type verbe] [nombre vp] = [nombre verbe] [type np] = O { structure fonctionnelle (F) type (F) = V ObjetDirect (F) = O} La grammaire ainsi obtenue autorise les groupes nominaux (syntagmes) tels que un film violent ou un film non violent , puisque le prédicat qualificatif permet à catégorie d'être un modificateur de film dans l'application considérée.
De la même façon, les règles suivantes, présentées de façon simplifiée dans le tableau 6 ci-dessous, sont générées à partir du modèle conceptuel, du lexique générique et de la grammaire générique des phrases.
TABLEAU 6
s - np_chaîne vpJouer np_film dét nom film adj_catégorie [nombre np chaîne] = [nombre vpJouer] [genre np_film] = [genre nom lllm] [genre dét] = [genre nom film] vpJouer -p verbejouer np_film [genre adj catégorie] = [genre nom film] [nombre vpJouer] = [nombre verbejouer] [nombre np_film] = [nombre nom film] [nombre dét] = [nombre nom film] [nombreadj catégorie]=[nombre nom film] i0 La grammaire complète ainsi élaborée (y compris une règle permettant de traiter les noms propres) autorise la phrase suivante: TF1 joue un film non violent .
En conclusion, le procédé de l'invention présente les avantages suivants. Il repose sur la séparation entre les contraintes purement grammaticales et les contraintes sémantiques et conceptuelles, ce qui permet de réutiliser des parties purement grammaticales lors d'un changement d'application. II permet d'adapter une grammaire à l'aide des contraintes conceptuelles du domaine d'application. II permet également la génération automatique des règles syntaxico-sémantiques qui sont dépendantes de l'application.
De plus, les contraintes conceptuelles sont suffisamment simples pour être saisies par des experts non linguistes. L'information conceptuelle peut aussi bénéficier aux autres niveaux de la compréhension du langage naturel, c'est-à-dire l'interprétation contextuelle et, en partie, le niveau d'interaction contextuelle.

Claims (4)

REVENDICATIONS
1. Procédé d'élaboration d'une grammaire spécifique à un domaine à partir d'une grammaire sous-spécifiée, utilisant un lexique générique et une grammaire générique, caractérisé en ce que: - on constitue une base de connaissances lexicales du domaine 5 d'application, - on établit des relations et des associations entre les entités de la base de connaissances, - on constitue un modèle conceptuel à partir des entités, des relations entre entités et des associations entre entités, io - on combine le modèle conceptuel avec une grammaire générique et un lexique générique, - on produit une grammaire spécifique au domaine considéré à partir de cette combinaison.
2. Procédé selon la revendication 1, caractérisé en ce que la combinaison consiste à appliquer des contraintes du modèle conceptuel à la fois à la grammaire générique et au lexique générique.
3. Procédé selon la revendication 1 ou 2, caractérisé en ce qu'il 20 produit automatiquement des règles syntaxico-sémantiques dépendantes de l'application.
4. Procédé selon l'une des revendications précédentes, caractérisé en ce que lors d'un changement d'application, on réutilise des parties purement grammaticales.
FR0313819A 2003-11-25 2003-11-25 Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee Pending FR2862780A1 (fr)

Priority Applications (5)

Application Number Priority Date Filing Date Title
FR0313819A FR2862780A1 (fr) 2003-11-25 2003-11-25 Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee
EP04804566A EP1687740A1 (fr) 2003-11-25 2004-11-24 Procede d elaboration d une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee
JP2006540459A JP2007512601A (ja) 2003-11-25 2004-11-24 未完結な文法に基づいてドメイン固有の文法を定式化する方法
PCT/EP2004/053083 WO2005052809A1 (fr) 2003-11-25 2004-11-24 Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee
US10/580,343 US20070078643A1 (en) 2003-11-25 2004-11-24 Method for formation of domain-specific grammar from subspecified grammar

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0313819A FR2862780A1 (fr) 2003-11-25 2003-11-25 Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee

Publications (1)

Publication Number Publication Date
FR2862780A1 true FR2862780A1 (fr) 2005-05-27

Family

ID=34531260

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0313819A Pending FR2862780A1 (fr) 2003-11-25 2003-11-25 Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee

Country Status (5)

Country Link
US (1) US20070078643A1 (fr)
EP (1) EP1687740A1 (fr)
JP (1) JP2007512601A (fr)
FR (1) FR2862780A1 (fr)
WO (1) WO2005052809A1 (fr)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060195313A1 (en) * 2005-02-25 2006-08-31 Microsoft Corporation Method and system for selecting and conjugating a verb
US8732114B2 (en) * 2008-04-14 2014-05-20 Nuance Communications, Inc. Knowledge re-use for call routing
US10282411B2 (en) * 2016-03-31 2019-05-07 International Business Machines Corporation System, method, and recording medium for natural language learning
CN111325035B (zh) * 2020-02-15 2023-10-20 周哲 泛化和泛在的语义交互方法、设备及存储介质
CN114547921B (zh) * 2022-04-28 2022-09-20 支付宝(杭州)信息技术有限公司 离线求解方法和装置、在线决策方法和装置
CN117574878B (zh) * 2024-01-15 2024-05-17 西湖大学 用于混合领域的成分句法分析方法、装置及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2849515A1 (fr) * 2002-12-31 2004-07-02 Thales Sa Procede generique de production automatique d'interfaces de reconnaissance vocale pour un domaine d'application et dispositif de mise en oeuvre

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001098942A2 (fr) * 2000-06-19 2001-12-27 Lernout & Hauspie Speech Products N.V. Analyse effectuee a l'aide de paquets grammaticaux
US20020087315A1 (en) * 2000-12-29 2002-07-04 Lee Victor Wai Leung Computer-implemented multi-scanning language method and system
RU2269164C2 (ru) * 2001-02-28 2006-01-27 Войс-Инсайт Система запросов на естественном языке для доступа к информационной системе
US7080004B2 (en) * 2001-12-05 2006-07-18 Microsoft Corporation Grammar authoring system
US7315810B2 (en) * 2002-01-07 2008-01-01 Microsoft Corporation Named entity (NE) interface for multiple client application programs
US7398209B2 (en) * 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2849515A1 (fr) * 2002-12-31 2004-07-02 Thales Sa Procede generique de production automatique d'interfaces de reconnaissance vocale pour un domaine d'application et dispositif de mise en oeuvre

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BRISCOE, T AND CARROLL, J: "Automatic Extraction of Subcategorization from Corpora", IN PROCEEDINGS OF THE 5TH CONFERENCE ON APPLIED NATURAL LANGUAGE PROCESSING, 31 March 1997 (1997-03-31), WASHINGTON, DC, USA, XP002305690, Retrieved from the Internet <URL:http://citeseer.ist.psu.edu/briscoe97automatic.html> [retrieved on 20041115] *
HOCKENMAIER, BIERNER AND BALDRIDGE: "Extending the Coverage of a CCG system", RESEARCH IN LANGUAGE AND COMPUTATION, 2002, XP002305687, Retrieved from the Internet <URL:http://home.comcast.net/~gbierner/gann/jlac-2002.pdf> [retrieved on 20041115] *
KILGARRIFF, A: "Foreground and Background Lexicons and Word Sense Disambiguation for Information Extraction", PROC. INTERNATIONAL WORKSHOP ON LEXICALLY DRIVEN INFORMATION EXTRACTION, 23 December 1997 (1997-12-23), FRASCATI, ITALY, XP002305688, Retrieved from the Internet <URL:http://arxiv.org/PS_cache/cmp-lg/pdf/9712/9712007.pdf> [retrieved on 20041115] *
PEREIRA AND WARREN: "Definite clause grammars for language analysis---A survey of the formalism and a comparison to augmented transition networks", ARTIFICIAL INTELLIGENCE, vol. 13, no. 3, May 1980 (1980-05-01), pages 231 - 278, XP002305689, Retrieved from the Internet <URL:doi:10.1016/0004-3702(80)90003-X> [retrieved on 20041115] *

Also Published As

Publication number Publication date
JP2007512601A (ja) 2007-05-17
EP1687740A1 (fr) 2006-08-09
US20070078643A1 (en) 2007-04-05
WO2005052809A1 (fr) 2005-06-09

Similar Documents

Publication Publication Date Title
Bassac et al. Towards a type-theoretical account of lexical semantics
Oehrle Boolean properties in the analysis of gapping
Moravcsik Aristotle: a collection of critical essays
Boretz Meta-variations: Studies in the foundations of musical thought (I)
JP2005165958A (ja) 情報検索システム、情報検索支援システム及びその方法並びにプログラム
I-IWANG et al. Episodic logic: A situational logic for natural language processing
Schnieder Bolzano on causation and grounding
Bunt et al. Towards an ISO standard for the annotation of quantification
FR2862780A1 (fr) Procede d&#39;elaboration d&#39;une grammaire specifique a un domaine a partir d&#39;une grammaire sous-specifiee
Tanaka et al. The production of head-initial and head-final languages
Studtmann Aristotle’s categorial scheme
Fortenbaugh Eudemus’ Work On Expression
Pietarinen Intentional identity revisited
Seuren et al. The logic and mathematics of occasion sentences
Almog Would you believe that?
Routley et al. Exploring Meinong’s jungle and beyond
Hajičová Prague school syntax and semantics
Wlodarczyk et al. Subjecthood and Topicality are both Pragmatic Issues
Spade Late medieval logic
Munch North Germanic negation. A microcomparative perspective
Lappin Intensions as Computable Functions
Wigtil The sequence of the translations of Apocryphal Psalm 151
Agazzi Meaning between sense and reference: Impacts of semiotics on philosophy of science
Bosch 5: Predicate Indexicality and Context Dependence
Farina Diathesis and middle voice in the Syriac ancient grammatical tradition: The translations and adaptations of the Téchne Grammatiké and the Arabic model

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 13

PLFP Fee payment

Year of fee payment: 14

PLFP Fee payment

Year of fee payment: 15