FR2862780A1 - Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee - Google Patents
Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee Download PDFInfo
- Publication number
- FR2862780A1 FR2862780A1 FR0313819A FR0313819A FR2862780A1 FR 2862780 A1 FR2862780 A1 FR 2862780A1 FR 0313819 A FR0313819 A FR 0313819A FR 0313819 A FR0313819 A FR 0313819A FR 2862780 A1 FR2862780 A1 FR 2862780A1
- Authority
- FR
- France
- Prior art keywords
- generic
- grammar
- entities
- conceptual model
- lexical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
Le procédé de la présente invention est un procédé de conception d'une grammaire sémantique, c'est-à-dire relative à un domaine d'application à partir d'une grammaire générique et d'une base de connaissances lexicales du domaine d'application considéré. La grammaire générique est une grammaire de type grammaire d'unification avec des traits morpho-syntaxiques usuels (tels que le genre et le nombre pour les substantifs ou adjectifs employés), et le modèle sémantique du domaine décrit les traits syntaxico-sémantiques propres au domaine d'application.Selon l'invention on établit un modèle conceptuel spécifique du domaine concerné, on combine ce modèle conceptuel avec une grammaire générique et un lexique générique et on en déduit la grammaire spécifique.Un tel procédé est mis en oeuvre par exemple pour assurer la commande automatisée d'un processus ou d'un véhicule.
Description
La présente invention sera mieux comprise à la lecture de la description
détaillée d'un mode de mise en oeuvre, pris à titre d'exemple non limitatif.
Le procédé de l'invention réalise la séparation entre des connaissances génériques et des connaissances spécifiques à une application. Les connaissances liées au domaine d'application sont contenues dans le modèle conceptuel de l'application, qui est vu comme un ensemble d'entités et un ensemble de relations entre ces entités. Les connaissances génériques se trouvent dans la grammaire générique, qui est lo décrite comme un ensemble de règles syntaxiques et sémantiques avec des contraintes conceptuelles (telles que des relations autorisées entre un adjectif et le nom auquel il se rapporte) et un lexique morphologique (qui comporte par exemple toutes les formes conjuguées d'un verbe).Un exemple de contrainte conceptuelle pourrait être la couleur d'un char d'assaut. Cette couleur peut être grise, mais non pas rose.
Le modèle conceptuel de l'application contient des entités, des relations entre entités et des associations entre entités. Généralement, les entités sont assignées à des noms, des noms propres et des adjectifs. Les relations entre entités peuvent être par exemple: une propriété (une couleur est une propriété d'un objet physique), une partie de quelque chose (par exemple, une roue est une partie d'une bicyclette), une possession (Pierre a une bicyclette), un héritage (une bicyclette est un véhicule terrestre, et en tant que tel, possède les propriétés des véhicules terrestres, par exemple des roues). Les associations sont reliées aux verbes et reflètent leur structure fonctionnelle. Le lexique générique contient des traits ne dépendant pas d'une application (genre, nombre, personne, etc..). Couplé au modèle conceptuel de l'application, le lexique générique permet de délivrer un lexique spécifique au domaine d'application considéré. La grammaire générique est une grammaire d'unification contenant un ensemble de règles syntaxiques et sémantiques ayant des contraintes conceptuelles sous-spécifiées. Couplée au modèle conceptuel, cette grammaire permet d'obtenir une grammaire spécifique du domaine considéré.
Le procédé de l'invention sera expliqué maintenant en référence à l'exemple très simplifié d'une grammaire décrivant un programme de 35 télévision. Le tableau 1 ci-dessous présente le modèle conceptuel associé à ce domaine d'application. Dans ce tableau, afin de différencier les éléments du méta-langage de leurs contenus, les éléments du méta- langage sont écrits en italique gras, et les contenus en police normale.
TABLEAU 1
Entité ([chaîne, [TF1, France 2j]). Propriété (programme, catégorie).
Entité ([film, [film]]). Propriété (programme, durée).
Entité ([programme, [programme]]). Est un (film, programme).
Entité ([catégorie, [violent, non violent]]). Est un (dessin_animé, programme) Structure fonctionnelle ([jouer, Sujet (chaîne), ObjetDirect (programme), [jouer]]).
Dans ce tableau simplifié de modèle conceptuel, la première description de concept indique que chaîne est une entité reliée aux mots TF1 et France2 , et ainsi de suite pour les autres entités. Propriété io décrit les propriétés attribuées aux entités correspondantes. La dernière ligne du tableau est une règle de structure fonctionnelle qui indique que la relation jouer a une entité sujet qui est chaîne , une entité ObjetDirect (ou complément d'objet direct) qui est programme et est assignée au mot jouer .
Le modèle conceptuel encode des connaissances linguistiques détaillées sur les objets du domaine d'application. De plus, des transformations linguistiques implicites sont utilisées afin d'optimiser la définition de relations entre objets. Par exemple, on définit des primitives conceptuelles dérivées telles que: Qualificatif (E, A) : -entité (E), propriété (E, A) Qualificatif (E, A) : -est un (E, H), qualificatif (H, A) Dans ces primitives, E est une entité, A une propriété et H une autre entité. Dans la première primitive, E est par exemple l'entité programme , A est une catégorie de programme et dans la deuxième, l'entité E est un film, H un programme et A une catégorie.
A partir d'un lexique générique et du modèle conceptuel, on dérive un lexique spécifique du domaine en question. Etant donné que chaque entité ou relation est liée à sa forme lexicale, on enrichit le lexique général avec les contraintes imposées par le modèle conceptuel.
En supposant que le modèle conceptuel pointe sur des lexèmes (entrées du lexique générique) valides, le lexique du domaine d'application peut être généré à partir du lexique générique, comme montré de façon simplifiée sur le tableau 2 ci-dessous.
TABLEAU 2
Dans ce tableau 2, les flèches indiquent la catégorie grammaticale de chacune des entrées du lexique, par exemple, un est un déterminant, non violent est un adjectif de type catégorie, etc... Les expressions entre crochets indiquent les traits morpho-syntaxiques (genre et nombre) des lexèmes.
On va décrire maintenant en référence au tableau 3 ci-dessous un extrait de la grammaire générique présentant les groupes nominaux.
Un->dét [genre masc] [nombre sing] violent-> adj_catégorie [genre masc] [nombre sing] joue-> verb_ouer [nombre sing] [pers, troisième] film->nom film [genre masc] [nombre sing.] non violent--> adj_catégorie [genre masc] [nombre sing.]
TABLEAU 3
np -> dét nom adj [ genre np] = [genre nom] [genre défi = [genre nom] [genre adj] = [genre nom] [nombre np] = [nombre nom] [nombre dét] = [nombre nom] [nombre adj] = [nombre nom] [type np] = E1 [type nom] = El [type adj] = E2 { qualificatif (El, E2) } Dans ce tableau 3, constituant une règle de grammaire, les six premières contraintes sont liées au lexique utilisé, et les quatre dernières sont des contraintes liées au modèle conceptuel. El et E2 sont des entités, au même titre que dans le tableau 2, et np est un groupe nominal. Les crochets entourent les contraintes conceptuelles. Les règles présentées dans ce tableau montrent qu'il y a une contrainte conceptuelle entre l'adjectif (adj), le nom et le déterminant (dét), et que cette contrainte est indépendante de l'instance du domaine d'application.
Le tableau 4 ci-dessous décrit des règles génériques qui sont ajoutées afin de tenir compte de la construction des phrases.
TABLEAU 4
Dans ce tableau, np est un groupe nominal, vp est un groupe verbal, V le type du verbe, S le type du groupe nominal sujet, O le type du s groupe nominal ObjetDirect (complément d'objet direct) et F est la structure fonctionnelle de la phrase à construire. En reprenant l'exemple du tableau 1, on voit qu'à la dernière ligne de ce tableau (représentant la structure fonctionnelle F), V est le verbe jouer , S est l'entité chaîne , et O est l'entité programme .
lo A partir du modèle conceptuel (tableau 1) et du lexique du domaine considéré (tableau 2), les extraits des règles de grammaire générique décrivant les groupes nominaux sont combinés afin d'obtenir la règle syntaxico-sémantique exposée de façon simplifiée dans le tableau 5 cidessous. Cette règle dépend du domaine considéré.
TABLEAU 5
np_film dét nom film adj_catégorie adj_catégorie (violent) [genre np film] = [genre nom film] adj_catégorie (non violent) [genre dét] = [genre nom film] nom film (film) [genre adj catégorie] = [genre nom film] [nombre np film] = [nombre nom film] [nombre dét] = [nombre nom film}] [nombre adj catégorie] = [nombre nom film] s -+npvp [nombre np] = [nombre vp] [type vp] = V [type np] S {structure_ fonctionnelle (F) type (F) = V sujet (F) = S}vp verbe np [type vp] = [type verbe] [nombre vp] = [nombre verbe] [type np] = O { structure fonctionnelle (F) type (F) = V ObjetDirect (F) = O} La grammaire ainsi obtenue autorise les groupes nominaux (syntagmes) tels que un film violent ou un film non violent , puisque le prédicat qualificatif permet à catégorie d'être un modificateur de film dans l'application considérée.
De la même façon, les règles suivantes, présentées de façon simplifiée dans le tableau 6 ci-dessous, sont générées à partir du modèle conceptuel, du lexique générique et de la grammaire générique des phrases.
TABLEAU 6
s - np_chaîne vpJouer np_film dét nom film adj_catégorie [nombre np chaîne] = [nombre vpJouer] [genre np_film] = [genre nom lllm] [genre dét] = [genre nom film] vpJouer -p verbejouer np_film [genre adj catégorie] = [genre nom film] [nombre vpJouer] = [nombre verbejouer] [nombre np_film] = [nombre nom film] [nombre dét] = [nombre nom film] [nombreadj catégorie]=[nombre nom film] i0 La grammaire complète ainsi élaborée (y compris une règle permettant de traiter les noms propres) autorise la phrase suivante: TF1 joue un film non violent .
En conclusion, le procédé de l'invention présente les avantages suivants. Il repose sur la séparation entre les contraintes purement grammaticales et les contraintes sémantiques et conceptuelles, ce qui permet de réutiliser des parties purement grammaticales lors d'un changement d'application. II permet d'adapter une grammaire à l'aide des contraintes conceptuelles du domaine d'application. II permet également la génération automatique des règles syntaxico-sémantiques qui sont dépendantes de l'application.
De plus, les contraintes conceptuelles sont suffisamment simples pour être saisies par des experts non linguistes. L'information conceptuelle peut aussi bénéficier aux autres niveaux de la compréhension du langage naturel, c'est-à-dire l'interprétation contextuelle et, en partie, le niveau d'interaction contextuelle.
Claims (4)
1. Procédé d'élaboration d'une grammaire spécifique à un domaine à partir d'une grammaire sous-spécifiée, utilisant un lexique générique et une grammaire générique, caractérisé en ce que: - on constitue une base de connaissances lexicales du domaine 5 d'application, - on établit des relations et des associations entre les entités de la base de connaissances, - on constitue un modèle conceptuel à partir des entités, des relations entre entités et des associations entre entités, io - on combine le modèle conceptuel avec une grammaire générique et un lexique générique, - on produit une grammaire spécifique au domaine considéré à partir de cette combinaison.
2. Procédé selon la revendication 1, caractérisé en ce que la combinaison consiste à appliquer des contraintes du modèle conceptuel à la fois à la grammaire générique et au lexique générique.
3. Procédé selon la revendication 1 ou 2, caractérisé en ce qu'il 20 produit automatiquement des règles syntaxico-sémantiques dépendantes de l'application.
4. Procédé selon l'une des revendications précédentes, caractérisé en ce que lors d'un changement d'application, on réutilise des parties purement grammaticales.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0313819A FR2862780A1 (fr) | 2003-11-25 | 2003-11-25 | Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee |
EP04804566A EP1687740A1 (fr) | 2003-11-25 | 2004-11-24 | Procede d elaboration d une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee |
JP2006540459A JP2007512601A (ja) | 2003-11-25 | 2004-11-24 | 未完結な文法に基づいてドメイン固有の文法を定式化する方法 |
PCT/EP2004/053083 WO2005052809A1 (fr) | 2003-11-25 | 2004-11-24 | Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee |
US10/580,343 US20070078643A1 (en) | 2003-11-25 | 2004-11-24 | Method for formation of domain-specific grammar from subspecified grammar |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0313819A FR2862780A1 (fr) | 2003-11-25 | 2003-11-25 | Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee |
Publications (1)
Publication Number | Publication Date |
---|---|
FR2862780A1 true FR2862780A1 (fr) | 2005-05-27 |
Family
ID=34531260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR0313819A Pending FR2862780A1 (fr) | 2003-11-25 | 2003-11-25 | Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee |
Country Status (5)
Country | Link |
---|---|
US (1) | US20070078643A1 (fr) |
EP (1) | EP1687740A1 (fr) |
JP (1) | JP2007512601A (fr) |
FR (1) | FR2862780A1 (fr) |
WO (1) | WO2005052809A1 (fr) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060195313A1 (en) * | 2005-02-25 | 2006-08-31 | Microsoft Corporation | Method and system for selecting and conjugating a verb |
US8732114B2 (en) * | 2008-04-14 | 2014-05-20 | Nuance Communications, Inc. | Knowledge re-use for call routing |
US10282411B2 (en) * | 2016-03-31 | 2019-05-07 | International Business Machines Corporation | System, method, and recording medium for natural language learning |
CN111325035B (zh) * | 2020-02-15 | 2023-10-20 | 周哲 | 泛化和泛在的语义交互方法、设备及存储介质 |
CN114547921B (zh) * | 2022-04-28 | 2022-09-20 | 支付宝(杭州)信息技术有限公司 | 离线求解方法和装置、在线决策方法和装置 |
CN117574878B (zh) * | 2024-01-15 | 2024-05-17 | 西湖大学 | 用于混合领域的成分句法分析方法、装置及介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2849515A1 (fr) * | 2002-12-31 | 2004-07-02 | Thales Sa | Procede generique de production automatique d'interfaces de reconnaissance vocale pour un domaine d'application et dispositif de mise en oeuvre |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001098942A2 (fr) * | 2000-06-19 | 2001-12-27 | Lernout & Hauspie Speech Products N.V. | Analyse effectuee a l'aide de paquets grammaticaux |
US20020087315A1 (en) * | 2000-12-29 | 2002-07-04 | Lee Victor Wai Leung | Computer-implemented multi-scanning language method and system |
RU2269164C2 (ru) * | 2001-02-28 | 2006-01-27 | Войс-Инсайт | Система запросов на естественном языке для доступа к информационной системе |
US7080004B2 (en) * | 2001-12-05 | 2006-07-18 | Microsoft Corporation | Grammar authoring system |
US7315810B2 (en) * | 2002-01-07 | 2008-01-01 | Microsoft Corporation | Named entity (NE) interface for multiple client application programs |
US7398209B2 (en) * | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
-
2003
- 2003-11-25 FR FR0313819A patent/FR2862780A1/fr active Pending
-
2004
- 2004-11-24 US US10/580,343 patent/US20070078643A1/en not_active Abandoned
- 2004-11-24 EP EP04804566A patent/EP1687740A1/fr not_active Withdrawn
- 2004-11-24 JP JP2006540459A patent/JP2007512601A/ja active Pending
- 2004-11-24 WO PCT/EP2004/053083 patent/WO2005052809A1/fr not_active Application Discontinuation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2849515A1 (fr) * | 2002-12-31 | 2004-07-02 | Thales Sa | Procede generique de production automatique d'interfaces de reconnaissance vocale pour un domaine d'application et dispositif de mise en oeuvre |
Non-Patent Citations (4)
Title |
---|
BRISCOE, T AND CARROLL, J: "Automatic Extraction of Subcategorization from Corpora", IN PROCEEDINGS OF THE 5TH CONFERENCE ON APPLIED NATURAL LANGUAGE PROCESSING, 31 March 1997 (1997-03-31), WASHINGTON, DC, USA, XP002305690, Retrieved from the Internet <URL:http://citeseer.ist.psu.edu/briscoe97automatic.html> [retrieved on 20041115] * |
HOCKENMAIER, BIERNER AND BALDRIDGE: "Extending the Coverage of a CCG system", RESEARCH IN LANGUAGE AND COMPUTATION, 2002, XP002305687, Retrieved from the Internet <URL:http://home.comcast.net/~gbierner/gann/jlac-2002.pdf> [retrieved on 20041115] * |
KILGARRIFF, A: "Foreground and Background Lexicons and Word Sense Disambiguation for Information Extraction", PROC. INTERNATIONAL WORKSHOP ON LEXICALLY DRIVEN INFORMATION EXTRACTION, 23 December 1997 (1997-12-23), FRASCATI, ITALY, XP002305688, Retrieved from the Internet <URL:http://arxiv.org/PS_cache/cmp-lg/pdf/9712/9712007.pdf> [retrieved on 20041115] * |
PEREIRA AND WARREN: "Definite clause grammars for language analysis---A survey of the formalism and a comparison to augmented transition networks", ARTIFICIAL INTELLIGENCE, vol. 13, no. 3, May 1980 (1980-05-01), pages 231 - 278, XP002305689, Retrieved from the Internet <URL:doi:10.1016/0004-3702(80)90003-X> [retrieved on 20041115] * |
Also Published As
Publication number | Publication date |
---|---|
JP2007512601A (ja) | 2007-05-17 |
EP1687740A1 (fr) | 2006-08-09 |
US20070078643A1 (en) | 2007-04-05 |
WO2005052809A1 (fr) | 2005-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bassac et al. | Towards a type-theoretical account of lexical semantics | |
Oehrle | Boolean properties in the analysis of gapping | |
Moravcsik | Aristotle: a collection of critical essays | |
Boretz | Meta-variations: Studies in the foundations of musical thought (I) | |
JP2005165958A (ja) | 情報検索システム、情報検索支援システム及びその方法並びにプログラム | |
I-IWANG et al. | Episodic logic: A situational logic for natural language processing | |
Schnieder | Bolzano on causation and grounding | |
Bunt et al. | Towards an ISO standard for the annotation of quantification | |
FR2862780A1 (fr) | Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee | |
Tanaka et al. | The production of head-initial and head-final languages | |
Studtmann | Aristotle’s categorial scheme | |
Fortenbaugh | Eudemus’ Work On Expression | |
Pietarinen | Intentional identity revisited | |
Seuren et al. | The logic and mathematics of occasion sentences | |
Almog | Would you believe that? | |
Routley et al. | Exploring Meinong’s jungle and beyond | |
Hajičová | Prague school syntax and semantics | |
Wlodarczyk et al. | Subjecthood and Topicality are both Pragmatic Issues | |
Spade | Late medieval logic | |
Munch | North Germanic negation. A microcomparative perspective | |
Lappin | Intensions as Computable Functions | |
Wigtil | The sequence of the translations of Apocryphal Psalm 151 | |
Agazzi | Meaning between sense and reference: Impacts of semiotics on philosophy of science | |
Bosch | 5: Predicate Indexicality and Context Dependence | |
Farina | Diathesis and middle voice in the Syriac ancient grammatical tradition: The translations and adaptations of the Téchne Grammatiké and the Arabic model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PLFP | Fee payment |
Year of fee payment: 13 |
|
PLFP | Fee payment |
Year of fee payment: 14 |
|
PLFP | Fee payment |
Year of fee payment: 15 |