JPS63216175A - Natural language processor and natural language question and reply device - Google Patents

Natural language processor and natural language question and reply device

Info

Publication number
JPS63216175A
JPS63216175A JP62049518A JP4951887A JPS63216175A JP S63216175 A JPS63216175 A JP S63216175A JP 62049518 A JP62049518 A JP 62049518A JP 4951887 A JP4951887 A JP 4951887A JP S63216175 A JPS63216175 A JP S63216175A
Authority
JP
Japan
Prior art keywords
sentence
words
natural language
word
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62049518A
Other languages
Japanese (ja)
Inventor
Tamaki Saito
斎藤 珠喜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP62049518A priority Critical patent/JPS63216175A/en
Publication of JPS63216175A publication Critical patent/JPS63216175A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PURPOSE:To realize natural expression for human being by providing a data relating homonym/synonym and case structure dominated by a word as to a declinable word being a major component of the case structure of a sentence. CONSTITUTION:The titled device consists of an input section 1, a sentence analysis section 2, a word dictionary 3, a semantic structure extraction section 4 and a synonym table 5. Then data of homonym/synonym relating to declinable words being especially important in the syntax of a natural language as th data with respect to the homonym/synonym to a natural language processing unit 10 are provided and the surface case dominant by declinable words is provided. Even when the declinable words are similar (identical) but the surface case structure dominating the declinable words differ such as 'A constitutes B' and 'B consists of A', the processing handling the meaning of a sentence to be similar or identical is attained. Thus, the system copes with versatile expression and more natural expression for human being is realized.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は質問応答システム、情報検索システム。[Detailed description of the invention] [Industrial application field] The present invention relates to a question answering system and an information retrieval system.

文書処理システムなどの技術において、自然言語を用い
て入力および出力を行う場合の自然言語処理に関するも
のであり、特に単語における類義・同義等の意味を扱い
、文章における同一(或いは類似)意味内容を取り扱う
ことを可能とする自然言語処理装置に関するものである
In technology such as document processing systems, it relates to natural language processing when inputting and outputting using natural language, and in particular deals with meanings such as synonyms and synonyms in words, and the same (or similar) meaning content in sentences. The present invention relates to a natural language processing device that can handle .

〔従来の技術〕[Conventional technology]

従来、自然言語による文章の格宿造を明らかにする構文
解析は、例えば、Fillmoreによって提案された
格文法に基づいて行われ、これは文書を構成する単語に
対応する統語的規則として、格文法に対応する格構造(
格フレーム)を用意してその文章の内容を抽出するもの
である(このような解析処理の概要については例えば長
尾真著「言語工学」、昭晃堂、昭和j′♂年初版/刷、
参照のこお。
Conventionally, syntactic analysis that reveals the case structure of sentences in natural language has been performed based on, for example, the case grammar proposed by Fillmore. The case structure corresponding to (
This method prepares a case frame) and extracts the content of the sentence (for an overview of such analysis processing, see, for example, "Language Engineering" by Makoto Nagao, published by Shokodo, first edition/printed in 1999,
For reference.

即ち、構文解析にあっては文章を構成する単語の品詞お
よび主語と述語、目的語と述語など文章の係り受け関係
が最も基本的な規則となり、このような単語と単語の文
法に関する属性からなるデータを記憶している単語辞薔
を備え、自然言語によって入力された文章を単語に分割
し、文章における各単語の文法的役割を決定するもので
ある。
In other words, in syntactic analysis, the most basic rules are the parts of speech of the words that make up the sentence, and the dependency relationships between the subject and predicate, object and predicate, etc. It is equipped with a word dictionary that stores data, divides sentences input in natural language into words, and determines the grammatical role of each word in the sentence.

例えば、日本語の自然言語処理では文章における用言、
主格、格(係)助詞、目的格などを決定し、「原子は分
子を構成する。」という文章では用言は「構成する」、
主格は「原子」、格(係)助詞は「は」および「を」、
目的格は[分子コとなることを特定する。或いは、主語
と述語の関係および目的語と述語の関係など文章の係り
受け関係の解析を行い、主語、述語或いは目的語となる
単語を求め文章の文法的構造を規定し意味・内容を決定
する。
For example, in Japanese natural language processing, words in sentences,
Determine the nominative case, case particle, object case, etc. In the sentence ``Atoms constitute molecules.'', the verb ``comprise'',
The nominative case is "atomic", the case particles are "wa" and "wo",
The objective case is [specify that it is the molecule ko. Alternatively, it analyzes the dependency relationships of a sentence, such as the relationship between a subject and a predicate, and the relationship between an object and a predicate, and determines the meaning and content by determining the grammatical structure of the sentence by finding words that can be subjects, predicates, or objects. .

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

しかし、従来の自然言語処理は複数の単語間にある意味
の同一性・類似性について扱ったものではなく、したが
って、あるλつの文章が意味とじ−では同一の(或いは
類似した)内容を表現しているにもかかわらず、2つの
文章を別のものとして扱うことがあった。即ち、「原子
は分子を構成する。」という文と「分子は原子から成る
。」という文があった場曾、この2つの文は同一の内容
であるにもかかわらず、大形および用言(「構成する」
と「から成る」)が異なるから、このλつの文章を別の
文章として見做してしまうことになる。
However, conventional natural language processing does not deal with the sameness or similarity of meaning between multiple words. Despite this, the two sentences were sometimes treated as different. In other words, if we have the sentence ``Atoms make up a molecule.'' and the sentence ``A molecule consists of atoms,'' even though these two sentences have the same content, they are ("Configure"
and "consisting of") are different, so these λ sentences are regarded as different sentences.

したがって、このような2つの文章における意味の同一
性・類似性に関する識別機能がない場合、・多くの自然
言5吾を用いたシステムにおいてはその運用に際し大幅
な制限が課せられ、自然言語入力等による利便性が損な
われるという問題があった。
Therefore, if there is no identification function regarding the sameness or similarity of meaning between two sentences, significant restrictions will be imposed on the operation of many systems using natural language, and natural language input etc. There was a problem in that the convenience was lost.

例えば、自然言語による質問応答システムにおいて、デ
ータとして[原子は分子を構成する。」という文を与え
、その後「分子は何から成るか?」という質問文を与え
ても、この質問に対する解答を見出すことは困難である
。即ち、この2つの文章についてその大形および用言の
意味についての同一性・類似性に関する情報がなければ
、上記の例では「原子は何を構成するか?」、或いは「
分子を構成するのは何か?」というような同じ用言「構
成する」を用いた質問に応えることができたとしても、
「分子を構成するのは何か?」と同一の内容である「分
子は何から成るか?」という質問に応えることはできな
い。このようにデータとして与えた文章と同一の用語を
用いなければならないという制限があっては「自然言語
処理」の目的には程遠いものである。
For example, in a natural language question answering system, the data [Atoms make up molecules. Even if you give the sentence ``What does a molecule consist of?'' and then ask the question ``What does a molecule consist of?'', it is difficult to find an answer to this question. In other words, if there is no information regarding the identity or similarity of the two sentences in terms of their general form and the meaning of the predicates, then in the above example, we can write "What do atoms consist of?" or "
What makes up molecules? Even if you were able to answer a question using the same term ``comprise'', such as
It is impossible to answer the question ``What does a molecule consist of?'', which is the same question as ``What makes up a molecule?''. This restriction of having to use the same terms as the sentences given as data falls far short of the purpose of "natural language processing."

〔問題点を解決するだめの手段〕[Failure to solve the problem]

本発明は自然言語を用いて入力した文章を単語に分割し
、予め規定した各単語の品詞情報および係り受けの関係
、単語の同義・類義語の関係に基づき、自然言語による
文章の意味を抽出し、合わせて同義・類義の表現をも生
成する意味構造抽出手段を備え、同一(或いは類似)の
意味を表す別の用語を用いた場合にも同一(或いは類似
)の意味内容として扱えるようにするものである。そし
て、同義・類義の別の表現をされた文章の意味内容を同
義・類義として取り扱えるように同義・類義語に関する
データを所持させたことを特徴とし、その目的は扱われ
る文章に関して制約の少ない、より自由な文章表現であ
っても意味解釈を可能とする自然言語処理装置を提供す
ることにある。このような自然言語処理装置は自然言語
による文章を入力する入力部と、入力部に入力された文
章を文法的に解析して、その文章の文法的構造を明らか
にする文解析部と、文解析部における文章の文法的解析
のために必要な単語辞書と、文解析部の解析結果を受け
て、入力文章の意味内容を抽出する意味構造抽出部と、
文の意味内容を扱うための類義語テーブルを備えたもの
であって、従来の技術とは、特に文章の格構造の主要因
である用言について同義・類義語およびその言葉が支配
する格構造に関するデータを所持させた点が異なる。
The present invention divides a sentence input using natural language into words, and extracts the meaning of the sentence in natural language based on predefined part-of-speech information of each word, dependency relationships, and word synonyms. It is also equipped with a meaning structure extraction means that generates synonymous and similar expressions, so that even when different terms expressing the same (or similar) meaning are used, they can be treated as the same (or similar) meaning content. It is something to do. It is characterized by having data on synonyms and synonyms so that the meaning content of sentences expressed in different ways can be treated as synonyms and similar meanings, and its purpose is to have fewer restrictions on the sentences that are handled. , it is an object of the present invention to provide a natural language processing device that enables semantic interpretation of even freer text expressions. Such a natural language processing device has an input section that inputs sentences in natural language, a sentence analysis section that grammatically analyzes the sentences input to the input section and reveals the grammatical structure of the sentences, a word dictionary necessary for the grammatical analysis of the sentence in the analysis section; a semantic structure extraction section that extracts the semantic content of the input sentence based on the analysis result of the sentence analysis section;
Conventional technology is equipped with a synonym table for handling the semantic content of sentences, and the conventional technology is to collect data on synonyms and synonyms and the case structure dominated by the words, especially for words that are the main factor in the case structure of sentences. The difference is that he was made to possess.

〔発明の作用〕[Action of the invention]

本発明において所持させた同義・類義語に関するデータ
として、自然言語の文解析において特に重要な意森をも
つ用言に関する同義・類義語のデータを備え、各用言の
支配する表層格関係をも含めて所持させることにより、
用言同士は類義(同義)でありながら、その用言が支配
する表層格構造が異なる場合にも、文の意味を類似(或
いは同一)として取り扱う処理が可能となる。したがっ
て、自然言語処理装置を質問応答システムに適用すれば
多様な表現に対応でき、人間にとってより自然なやりと
りを実現できる。以下、図面にしたがって詳細に説明す
る。
The data on synonyms and synonyms possessed in the present invention includes synonyms and synonyms data on terms with meanings that are particularly important in natural language sentence analysis, including the surface case relationships governing each term. By possessing
Even if the predicates have similar meanings (synonyms) but differ in the surface case structure that the predicates govern, it is possible to treat the meanings of the sentences as similar (or the same). Therefore, if a natural language processing device is applied to a question answering system, it can handle a variety of expressions and realize more natural interaction for humans. A detailed explanation will be given below with reference to the drawings.

〔実施例〕〔Example〕

本発明の実施例を第7図に示す。/は入力部、2は文解
析部、3は単語辞書、≠は意味構造抽出部および夕は類
義語テーブルである。入力部/は自然言語による文章を
入力するものであり、キー操作入力あるいは音声認識、
文字のバタン認識などの文字符号化処理を介1て自然言
語の文章が装置に取り込まれる。文解析部2は入力部/
をとおして入力された文章の日本語文法を解析して、文
章の文法的構造を決定する。これには文章における単語
識別を行いさらに単語に分割する形態素解析と、構文解
析がある。文解析部2で行う構文解析は表層格構造とし
ての表現、或いは係り受け関係としての表現を求めるも
のであり、前者は日本語文章における用言、主格、格(
係)助詞、目的格などを決定し、後者は主語と述語、連
用修飾語(目的語)と述語の関係に基づき単語間の係り
受け関係が規定される。゛ 単語辞書3には文解析部コにおける文法的解析に用いる
情報が記憶されている。単語辞書3の例を示すと第2図
のようになる。辞書の内容は、単語の見出しとその単語
の品詞、および構文解析に必要な文法情報とから成る。
An embodiment of the invention is shown in FIG. / is an input section, 2 is a sentence analysis section, 3 is a word dictionary, ≠ is a semantic structure extraction section, and y is a synonym table. The input section/ is for inputting sentences in natural language, and can be input by key operation, voice recognition,
Natural language sentences are imported into the device through character encoding processing such as character recognition. The sentence analysis section 2 is the input section/
Analyzes the Japanese grammar of sentences input through the system and determines the grammatical structure of the sentences. This includes morphological analysis, which identifies words in sentences and further divides them into words, and syntactic analysis. The syntactic analysis carried out by the sentence analysis unit 2 seeks expressions as surface case structures or as dependency relationships;
Dependency) Particles, objects, etc. are determined, and the latter defines the dependency relationships between words based on the relationships between the subject and predicate, and the conjunction modifier (object) and predicate.゛The word dictionary 3 stores information used for grammatical analysis in the sentence analysis section. An example of the word dictionary 3 is shown in FIG. 2. The contents of the dictionary consist of a word heading, the word's part of speech, and grammatical information necessary for syntactic analysis.

構文解析として係り受け解析を例にとれば、体言及び用
言についてはその品詞(「愛」はす変の他動詞、「藍」
は名詞)が分かれば良く、「が」、「は」、「を」等の
助詞については、品詞の他に係り受け解析のだめの情報
が記述されている。即ち、(前1体言)はその助詞の前
に許される単語の種類は体言であり、(後、述語)はそ
の助詞が付属語として付いている文節が係り得る先は述
語であり、さらにその時のその文節の文法的役割りが、
(役、A)のAに示された内容となる。
Taking dependency analysis as an example of syntactic analysis, the part of speech (``ai'' is a transitive verb, ``藍'' is
It is sufficient to know the part of speech (noun), and for particles such as ``ga'', ``wa'', and ``wo'', information necessary for dependency analysis is described in addition to the part of speech. In other words, (first nominative) means that the type of word that is allowed before the particle is nominal, and (second predicate) means that the clause to which the particle is attached as an adjunct can relate to a predicate, and furthermore, The grammatical role of that clause in
The content shown in A of (Rack, A) will be the same.

意味構造抽出部弘は文解析部コの解析結果に基づき文章
の意味内容を抽出する。ここでは構文解析の結果を受取
シ、文章における意味の同一(或いは類似)性の処理を
行い、例えば述語、主語。
The Semantic Structure Extraction Department extracts the semantic content of sentences based on the analysis results of the Sentence Analysis Department. Here, the results of syntactic analysis are received, and the sameness (or similarity) of meanings in the sentences is processed, such as predicates and subjects.

修飾語の組から構成される知識データを生成する。Generate knowledge data consisting of a set of modifiers.

類義語テーブルjには見出し語(単語)に対して同義・
類義となる単語のデータが記憶されている。
The synonym table j contains synonyms and synonyms for headwords (words).
Data of words with similar meanings is stored.

ここで、入力部/、文解析部2および単語辞書3からな
る構成は従来パーザと称せられたものであって(入力部
/はパーザとしては必須のものではない)、自然言語の
文章解析処理としてはこれまでと同様の処理を行うもの
である。したがって、本発明は上述したように[意味構
造抽出部≠は文解析部2の解析結果に基づき文章の意味
内容を抽出する。ここでは構文解析の結果を受取り、文
章における意味の同一(或いは類似)性の処理を行い、
述語、主語、修飾語の組から構成される知識データを生
成する。」することを特徴とするものである。
Here, the configuration consisting of the input section/, sentence analysis section 2, and word dictionary 3 is conventionally called a parser (the input section/ is not essential as a parser), and is used for natural language sentence analysis processing. The same processing as before is performed. Therefore, in the present invention, as described above, the semantic structure extraction unit extracts the semantic content of a sentence based on the analysis result of the sentence analysis unit 2. Here, the results of syntactic analysis are received, and the sameness (or similarity) of meaning in the sentences is processed.
Generate knowledge data consisting of a set of predicates, subjects, and modifiers. ”.

つぎに、第1図に示しだ実施例における処理の流れを説
明する。入力部/により取り込まれた自然言語による文
章は文解析部2において単語に分割され(形態素解析)
、日本語文法に基づき文章の文法的構造が解析される。
Next, the flow of processing in the embodiment shown in FIG. 1 will be explained. The natural language sentences captured by the input unit are divided into words in the sentence analysis unit 2 (morphological analysis).
, the grammatical structure of the sentence is analyzed based on Japanese grammar.

文解析部2で行う構文解析は前述したように表層格構造
成いは係り受け関係を解析するものであり、まず表層格
構造は第3図に示すように文章における用言、主格、格
(係)助詞、目的格など文法的構造を解析する。
As mentioned above, the syntactic analysis carried out by the sentence analysis unit 2 is to analyze the surface case structure or dependency relationship. First, the surface case structure is divided into the predicate, nominative, case ( Section) Analyze grammatical structures such as particles and objective cases.

例えば、入力文が「原子は分子を構成する。」であると
する。この場合、用言は「構成する」、主格は「原子」
、目的格は「分子」、格(係)助詞は「は」および「を
」とそれぞれなる。このような解析は単語辞書3に記憶
されたデータに基づき行われる。単語辞書3には見出し
語となる単語毎に品詞としての属性が対応づけられてい
て、例えば周知のとおシ品詞が名詞であれば主格あるい
は目的格となり、助詞であれば格助詞、係助詞等の区別
がなされていて、これら、名詞と助詞の結合関係によっ
て主格、目的格が判別される。このようにして単語の品
詞と単語の結合関係によって、用言、主格、格(係)助
詞、目的格などが判る。また、単語間の係り受け関係を
示すと第グ図のようになる。即ち、入力文「原子は分子
を構成する。」に対して、主語と述語の関係に基づく単
語間の係り受け関係は「原子(は)」(主9[株]、「
構成する」(述語)となシ、連用修飾語(目的語)と述
語の関係に基づく単語間の係シ受け関係は「分子(を)
」(目的語)、「構成する」(述語)となる。このよう
に構文解析結果として第3図に示された文法的構造、或
いは第グ図に示されたような文章の係シ受け関係が出力
される。
For example, assume that the input sentence is "Atoms constitute molecules." In this case, the word "consists" and the nominative "atom"
, the object case is ``molecule'', and the case particles are ``wa'' and ``wo'', respectively. Such analysis is performed based on data stored in the word dictionary 3. In the word dictionary 3, attributes as parts of speech are associated with each word used as a headword. For example, if the well-known part of speech is a noun, it will be the nominative or objective case, and if it is a particle, it will be the case particle, modal particle, etc. The nominative case and object case are determined by the bonding relationship between the noun and the particle. In this way, the predicate, nominative, case particle, objective case, etc. can be determined by the part of speech of a word and the bonding relationship between the words. Also, the dependency relationships between words are shown in Figure 3. In other words, for the input sentence "Atoms constitute molecules.", the dependency relationship between words based on the relationship between the subject and predicate is "atomic (ha)" (Main 9 [Co., Ltd.], "
The dependency relationship between words based on the relationship between the conjunctive modifier (object) and the predicate is the ``numerator (wo)''.
” (object) and “comprise” (predicate). In this manner, the grammatical structure shown in FIG. 3 or the sentence relationship as shown in FIG. 3 is output as a syntactic analysis result.

つぎに、意味構造抽出部≠は第3図、第弘図に示した構
文解析結果を受取り、述語、主語、修飾語を要素とする
知識データを生成する。なお、知識データの構成をここ
では簡単に(述語、主語。
Next, the semantic structure extraction unit≠ receives the syntactic analysis results shown in FIGS. 3 and 3 and generates knowledge data having predicates, subjects, and modifiers as elements. The structure of the knowledge data is briefly explained here (predicate, subject.

修飾語)のように表現するが、この表現は第μ図に示し
たような主語と述語の関係、および連用修飾語と述語の
関係から当然もたらされる文章の意味を規定するもので
ある。これは例えば原子と分子との間に成り立つ一つの
関係として(構成する。
This expression defines the meaning of the sentence that naturally results from the relationship between subject and predicate as shown in Figure μ, and the relationship between conjunction modifier and predicate. For example, this is defined as a relationship between atoms and molecules.

原子9分子)というような知識データにおいては「原子
は分子を構成する。」という意味内容を表す。
Knowledge data such as ``atoms (9 molecules)'' expresses the semantic content ``atoms constitute molecules.''

Iζ ここで、知識データ今対応させて文章の同義・類義を判
定するため知識データの要素を変数として扱えるように
しである。即ち、2つの入力文「原子は分子を構成する
。」と「分子は原子から成る。」を例として説明する。
Iζ Here, the elements of the knowledge data can be handled as variables in order to determine the synonyms and similar meanings of the sentences by making them correspond to the knowledge data. That is, two input sentences "Atoms constitute a molecule." and "A molecule consists of atoms." will be explained as an example.

入力文が「分子は原子から成る。」の場合はこれに対応
する知識データは例えば(から成る2分子、原子)とな
り、この2つの知識データを同一(或いは類似)のもの
として扱うためには(構成する+A+B)と(から成る
If the input sentence is "A molecule consists of atoms," the corresponding knowledge data is, for example, (2 molecules consisting of, atoms), and in order to treat these two knowledge data as the same (or similar), Consists of (consists of +A+B) and (.

B、A)とが同一(或いは類似)の意味を表していると
いうことが処理できる必要がある(ここに、アルファベ
ットA、Bは変数の意味であり、hは原子、Bは分子と
なる)。意味構造抽出部弘に対しては用語(単語)の同
義・類義に関するデータを類義語テーブルタとして設け
ておき、前記知識データ(構成する。原子9分子)と(
から成る。
It is necessary to be able to process that B and A) represent the same (or similar) meaning (here, the alphabets A and B are the meanings of variables, h is an atom, and B is a molecule). . For the semantic structure extraction department Hiroshi, data on synonyms and similar meanings of terms (words) is provided as a synonym tableter, and the knowledge data (consists of 9 atoms) and (
Consists of.

分子、原子)とは類義として扱えるようにしである。molecules, atoms) can be treated as synonyms.

第5図に類義語テーブルjにおける記憶データの構成を
示す。類義語テーブルjは見出し語に対して類義の意味
をMする他の語を対応づけたものである。ここでの入力
文の例にあるようにその言葉の意味が結びつける複数個
(ここでは簡単に2個の場合を示した。)の言葉の間の
関係を説明するような言葉の場合には、その複数個の言
葉の文章中における役割(これをここでは表層格という
)も同時に扱う必要があり、2個の言葉の間の関係の場
合には第3図における主格(主体)、目的語(客体)(
第1図における主語、連用修飾語(目的語))のような
2種類の立場に対応し、これが見出し語におけるそれぞ
れの語の役割(表層格)と同一か或いは逆かの2種類の
関係があることになる。第5図の類義語テーブル!では
7つの見出し語に対応する2榎類の類義語粟として/、
2に分類して示している。ここに、/は言葉の役割(表
層路)が同一の場合であり、2はその逆の場合である。
FIG. 5 shows the structure of the stored data in the synonym table j. The synonym table j is a table in which a headword is associated with other words having M similar meanings. As shown in the example of the input sentence here, in the case of a word that explains the relationship between multiple words (here I have simply shown the case of two) that are connected by the meaning of the word, It is also necessary to simultaneously handle the roles of these multiple words in the sentence (here called surface cases), and in the case of a relationship between two words, the nominative (subject) and object (in Figure 3) object)(
This corresponds to two types of positions such as subject and conjunction modifier (object) in Figure 1, and there are two types of relationships: whether this is the same as or opposite to the role of each word in the headword (surface case). It turns out that there is. The synonym table in Figure 5! So, as a synonym for 2 Enoki-class millet corresponding to the 7 headwords/,
It is classified into 2 and shown. Here, / means the words have the same role (surface route), and 2 means the opposite.

したがって、意味構造抽出部≠で抽出された入力文の意
味構造をもとに、類義語テーブルタを参照し、入力文と
同義・類義の表現を生成することにより、入力文と同義
・類義の表現をも同時に入力したことと同等にすること
ができる。
Therefore, based on the semantic structure of the input sentence extracted by the semantic structure extraction unit can also be made equivalent to inputting the expression at the same time.

第2図は同義・類義の表現を生成する処理を示すフロー
である。ここでは入力文が解析された結果としての知識
データ(構成する。原子1分子)を入力とし、まず用言
「構成する」の類義語があるかどうかを類義語テーブル
jを参照することによって調べ、その最初の類義語「生
成する」とその格構造情報(1)とを取り出し、格構造
情報(1)に対応して知識データ中の第2項、第3項の
順序が同じである新しい知識データ(生成する。原子2
分子)を生成し、つぎの類義語を求める。
FIG. 2 is a flowchart showing the process of generating synonymous/similar meaning expressions. Here, we input the knowledge data (comprise, one atom, molecule) resulting from the analysis of the input sentence, first check whether there is a synonym for the term "comprise" by referring to the synonym table j, and then The first synonym "to generate" and its case structure information (1) are extracted, and new knowledge data (corresponding to case structure information (1) in which the second and third terms in the knowledge data have the same order) Generate.Atom 2
molecule) and find the next synonym.

以下、同様の操作を繰り返すが、類義語として「から成
る」と、その格構造情報(2)とを取り出しだ場合は、
格構造情報(2)に対応して、知識データの要素の内、
第2項、第3項の順序を入れ換えた新しい知識データ(
から成る9分子、原子)を生成する。このようにして類
義語テーブル中の類義語すべてについて新しい知識デー
タを生成し、全ての類義語がなくなるまで処理を繰り返
す。
Below, the same operation is repeated, but when extracting the synonym "consisting of" and its case structure information (2),
Corresponding to case structure information (2), among the elements of knowledge data,
New knowledge data with the order of the second and third terms reversed (
(9 molecules, atoms) consisting of In this way, new knowledge data is generated for all the synonyms in the synonym table, and the process is repeated until all the synonyms are exhausted.

つぎに、第7図では第1図において示した実施例を自然
言語処理装置として用い、この装置を前処理装置として
自然言語質問応答装置を構成した実施例を示す。第7図
においてIOは第1図に示した実施例と同一の構成を成
す自然言語処理部である。また、//は検索/登録部、
/2は知識データベース、/3は応答文作成部である。
Next, FIG. 7 shows an embodiment in which the embodiment shown in FIG. 1 is used as a natural language processing device, and this device is used as a preprocessing device to configure a natural language question answering device. In FIG. 7, IO is a natural language processing unit having the same configuration as the embodiment shown in FIG. Also, // is the search/registration section,
/2 is a knowledge database, and /3 is a response sentence creation section.

検索/登録部//は自然言語処理部IOからの出力、即
ち入力文の意味構造を受けその文の内容に応じて知識デ
ータベース/2へのデータの登録或いは検索を行い、知
識データベース7.2は入力文の内容をデータとして蓄
積しておく。応答文作成部/3は入力文の内容に応じて
応答文を作成する。
The search/registration unit // receives the output from the natural language processing unit IO, that is, the semantic structure of the input sentence, and registers or searches the data in the knowledge database 7.2 according to the content of the sentence. stores the contents of input sentences as data. The response sentence creation unit/3 creates a response sentence according to the content of the input sentence.

以下その処理を説明する。例えば、前述の入力文「原子
は分子を構成する。」に対しては、文章の解析結果とし
て意味構造(知識データ(構成する。
The process will be explained below. For example, for the above-mentioned input sentence ``Atoms constitute molecules.'', the result of analyzing the sentence is the semantic structure (knowledge data).

原子9分子))が検索/登録部//に与えられたとする
。ここで検索/登録部l/においては受けた文章が疑問
文か平叙文かを判定し、平叙文の場合は知識データベー
ス7.2に新しく入力されたこの知識データと同義・類
義のデータが既に登録されているか否かの検索を行い、
登録されていなければ介入力された知識データを知識デ
ータベース/2に登録する(既に登録されているデータ
に同義・類義のものがある場合は登録する必要がない)
Assume that 9 atoms (9 molecules)) are given to the search/registration section //. Here, the search/registration unit l/ determines whether the received sentence is an interrogative sentence or a declarative sentence, and if it is a declarative sentence, data with the same meaning or similar meaning as this new knowledge data input into the knowledge database 7.2 is determined. Search to see if it is already registered,
If it is not registered, register the intervened knowledge data in Knowledge Database/2 (if the already registered data has the same or similar meaning, there is no need to register it)
.

ここで、新しく入力された知識データと同義・類義のデ
ータが既に登録されているか否かのチェックは、具体的
には入力文の解析結果(構成する。
Here, checking whether data having the same meaning or similar meaning as the newly input knowledge data has already been registered is performed by checking the result of analysis of the input sentence (constructing).

原子2分子)と同義・類義の知識データ(から成る2分
子、原子)を類義語テーブル!を参照することにより自
然言語処理部10の出力として全て生成し、これらの同
義・類義のデータのうちどれかに一致(マツチング)す
るデータが知識データベース中に存在するかどうか調べ
れば良い。
A synonym table of knowledge data (consisting of two molecules, atoms) with synonyms and similar meanings! It is only necessary to generate all the outputs of the natural language processing unit 10 by referring to the above, and check whether there is data in the knowledge database that matches (matches) any of these synonymous/synonymous data.

次に、入力文「分子は何から成るか。」が与えられると
、これは同様に自然言語処理部IOで解析され、意味構
造(知識データ)として例えば(から成る2分子、何(
疑問詞))を検索/登録部//へ引き渡す。検索/登録
部//ではこの知識データが疑問文であることを認識し
て、疑問詞「何」の部分に対応する言葉を求めるべく、
知識データベース12に対してデータの検索(この場合
には、入力文の知識データ(から成る2分子、X)によ
るパターンマツチング処理で簡単に行える。なお、Xは
何(疑問詞)である。)を行う。ここで知識データベー
ス/2には前述の入力文「原子は分子を構成すも」に対
応する知識データ(構成する。
Next, when the input sentence ``What does a molecule consist of?'' is given, it is similarly analyzed by the natural language processing unit IO, and the semantic structure (knowledge data) is given, for example, two molecules consisting of (, what (
Interrogative word)) is handed over to the search/registration department//. The search/registration section // recognizes that this knowledge data is an interrogative sentence, and searches for the word that corresponds to the interrogative "what" part.
Searching for data in the knowledge database 12 (in this case, it can be easily done by pattern matching processing using the knowledge data of the input sentence (two molecules consisting of X). Note that what is X (an interrogative word)? )I do. Here, the knowledge database/2 contains knowledge data (configure) corresponding to the above-mentioned input sentence "Atoms constitute molecules."

原子2分子)が登録されていると、このままではマツチ
ングする知識データが存在しないことになるが、第1図
の実施例の説明で述べたように自然言語処理部10中の
意味構造抽出部弘では類義語テーブルjを参照すること
により、(から成る。
If two atoms (two molecules) are registered, there is no knowledge data to be matched as is, but as mentioned in the explanation of the embodiment shown in FIG. Then, by referring to the synonym table j, (consists of).

分子、何(疑問詞))と同時に(構成する。何(疑問詞
)1分子)をも生成するので、これが前述の知識データ
とマツチングし、解「原子」(何(疑問詞)=原子)が
求まる。この結果(何=原子)を受けて応答文作成部/
3は入力文中の「何」を「原子」で置き候え、さらに疑
問の意味を示す「か」を除いて、応答文「分子は原子か
ら成も」を作成し、ディスプレイ等の応答装置に出力す
る。
Molecule, what (interrogative word)) and (constituting. what (interrogative word) one molecule) are also generated at the same time, so this is matched with the knowledge data mentioned above, and the solution ``atom'' (what (interrogative word) = atom) is generated. is found. Based on this result (what = atoms), the response sentence creation section/
Step 3 replaces "what" in the input sentence with "atom" and then removes "ka" which indicates the meaning of the question to create the response sentence "Molecules are made up of atoms" and output it to a response device such as a display. do.

なお、第1図の実施例、第7図の実施例の説明において
入力文を解析した結果の意味構造(知識データ)の説明
を簡単にするため第弘図の係り受け関係に対応した(述
語、主語、修飾語)なる3要素の組で説明したが、この
要素の数は単に3個に限定されるものではなく、よシ詳
細に内容を特定する場合にはさらに要素の数が増えるこ
とはいうまでもない。これには文章の意味解釈に現在形
In addition, in the explanation of the example in Figure 1 and the example in Figure 7, in order to simplify the explanation of the semantic structure (knowledge data) as a result of analyzing the input sentence, the dependency relationship (predicate , subject, modifier), but the number of these elements is not limited to just three, and the number of elements may increase if the content is specified in more detail. Needless to say. This includes the present tense for the meaning interpretation of sentences.

過去形等の時制、或いは当該文章の内容が真となるため
の条件など種々の条件を盛シ込んだケースが考えられる
There may be cases in which various conditions are included, such as tenses such as past tense, or conditions for the content of the sentence to be true.

また、本発明における「同義・類義」とは実施例に示し
たような単語の意味が同義・類義であるものだけではな
く、例えば「売る」と「買う」或いは「教える」と「教
えられる」のような同一の現象(raはbに本を売る。
In addition, "same meaning/similar meaning" in the present invention does not mean only words that have the same meaning or similar meaning as shown in the examples, but also includes, for example, "sell" and "buy" or "teach" and "teach". The same phenomenon as ``ra sells a book to b.''

」と[bはaより本を買う。」、「aはbに英語を教え
る。」と「aはbより英語を教えられる」等)を主体と
客体のどちら側に着目するかによって生ずる別表現の関
係も含むものである。
” and [b buys a book from a. ", "A teaches English to B." and "A is taught English by B." etc.) also include the relationships of different expressions that arise depending on whether one focuses on the subject or the object.

〔発明の効果〕〔Effect of the invention〕

以上説明したように、本発明は文解析において重要な用
言を含めた単語の同義・類義語に関するデータを各用言
の支配する表層格関係をも含めて所持した自然言語処理
部を備えたものであるから、「AはBを構成する。」と
「BはAから成る。」のように、用言同士は類義(同義
)でありながら、その用言を支配する表層格構造が異な
る場合にも、文の意味を類似(或いは同一)として取り
扱う処理が可能となる。また、このことよシ、このよう
な機能を有する自然言語処理装置を質問応答システムに
適用すれば多様な表現に対応でき、人間にとってより自
然なやりとりを実現できる。なお、本発明の機能は情報
検索システム、文書処理システム、その他の自然言語に
よる入出力が望まれる分野にも適用できるのはもちろん
、その効果においても同様であるのは言うまでもない。
As explained above, the present invention is equipped with a natural language processing unit that has data on synonyms and synonyms of words including important terms in sentence analysis, including the surface case relationships governing each term. Therefore, although the predicates have similar meanings (synonymous), the surface case structure governing the predicates is different, such as "A constitutes B." and "B consists of A." In this case, it is possible to treat the meanings of the sentences as similar (or the same). In addition, if a natural language processing device having such a function is applied to a question answering system, it will be able to handle a variety of expressions and realize more natural interaction for humans. It goes without saying that the functions of the present invention can be applied to information retrieval systems, document processing systems, and other fields where input/output using natural language is desired, and the effects are also the same.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の自然言語処理装置の実施例を示す図、
第2図は単語辞書の構成例を示す図、第3図および第弘
図は構文解析結果の一般的な結果の例を示す図、第を図
は類義語テーブルの内容例を示す図、第3図は同義・類
義の表現を生成する処理を示すフローチャート、第7図
は本発明を適用した質問応答システムの実施例を示す図
である。 /・・・入力部、2・・・文解析部、3・・・単語辞書
、グ・・・意味構造抽出部、!・・・類義語テーブル、
10・・・自然言語処理部、//・・・検索/登録部、
/2・・・知識データベース、/3・・・応答文作成部
。 峯″3 防 茅4−V 原j賛、ば) −師り反ずん (ヤ諾)(K′路) 紛j(幻 −Itr−或Tろ
FIG. 1 is a diagram showing an embodiment of the natural language processing device of the present invention,
Figure 2 shows an example of the structure of a word dictionary; Figures 3 and 3 show examples of general syntax analysis results; Figure 3 shows an example of the contents of a synonym table; The figure is a flowchart showing the process of generating synonymous/similar expressions, and FIG. 7 is a diagram showing an embodiment of the question answering system to which the present invention is applied. /...input section, 2...sentence analysis section, 3...word dictionary, g...semantic structure extraction section,! ...synonym table,
10...Natural language processing unit, //...Search/registration unit,
/2...Knowledge database, /3...Response sentence creation section. Mine'3 Homo 4-V Hara j praise, ba) - Master's opposition (Ya Nuo) (K'ro) Conj (phantom -Itr-or Tro)

Claims (2)

【特許請求の範囲】[Claims] (1)自然言語を用いて文章を入力する入力部と、見出
しの単語と品詞情報の関係を記憶した単語辞書と、見出
しの単語とその単語と同義或いは類義の関係にある単語
およびその単語が支配する格構造情報を記憶した類義語
テーブルと、前記入力された文章を単語に分割し (形態素解析)、該分割した各単語の品詞情報或いは係
り受け関係から文章の文法的構造の解析(構文解析)を
行う文解析部と、前記文解析部の解析結果と同義・類義
の関係にある単語情報と各単語間の関係を支配する格構
造情報とに基づき前記入力文の同義・類義の表現を生成
するとともに意味内容を抽出する意味構造抽出部とから
なることを特徴とする自然言語処理装置。
(1) An input unit that inputs sentences using natural language, a word dictionary that stores the relationship between heading words and part-of-speech information, and heading words, words that are synonymous with or similar to the heading words, and words thereof. A synonym table that stores case structure information dominated by A sentence analysis unit that performs synonymous/similar meaning analysis of the input sentence based on word information that has a synonymous/similar meaning relationship with the analysis result of the sentence analysis unit and case structure information that governs the relationship between each word. 1. A natural language processing device comprising: a semantic structure extraction unit that generates an expression and extracts semantic content.
(2)自然言語を用いて文章を入力する入力部と、見出
しの単語と品詞情報の関係を記憶した単語辞書と、見出
しの単語とその単語と同義或いは類義の関係にある単語
およびその単語が支配する格構造情報を記憶した類義語
テーブルと、前記入力された文章を単語に分割し (形態素解析)、該分割した各単語の品詞情報或いは係
り受け関係から文章の文法的構造の解析(構文解析)を
行う文解析部と、前記文解析部の解析結果と同義・類義
の関係にある単語情報と各単語間の関係を支配する格構
造情報とに基づき前記入力文の同義・類義の表現を生成
するとともに意味内容を抽出する意味構造抽出部とを備
えた自然言語処理部があって、該自然言語処理部からの
出力となる前記入力文の意味構造(同義・類義の表現と
意味内容からなる)と、予め文章の意味構造を蓄積して
おく知識データベースからの情報とに基づき、前記入力
文の意味構造によって規定される文章の内容に対応して
前記知識データベースに対してデータの登録或いは検索
を行う検索登録部と、前記入力文の内容に対応して応答
文を作成する応答文作成部を備えたことを特徴とする自
然言語質問応答装置。
(2) An input unit that inputs sentences using natural language, a word dictionary that stores the relationship between words in the heading and part-of-speech information, and words in the heading and words that are synonymous with or similar to the word and those words. A synonym table that stores case structure information dominated by A sentence analysis unit that performs synonymous/similar meaning analysis of the input sentence based on word information that has a synonymous/similar meaning relationship with the analysis result of the sentence analysis unit and case structure information that governs the relationship between each word. There is a natural language processing unit equipped with a semantic structure extraction unit that generates an expression and extracts the semantic content, and the semantic structure (synonymous/similar expression) of the input sentence that is output from the natural language processing unit and semantic content) and information from a knowledge database that stores the semantic structure of sentences in advance. A natural language question answering device comprising: a search registration section that registers or searches for data; and a response sentence creation section that creates a response sentence in accordance with the content of the input sentence.
JP62049518A 1987-03-04 1987-03-04 Natural language processor and natural language question and reply device Pending JPS63216175A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62049518A JPS63216175A (en) 1987-03-04 1987-03-04 Natural language processor and natural language question and reply device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62049518A JPS63216175A (en) 1987-03-04 1987-03-04 Natural language processor and natural language question and reply device

Publications (1)

Publication Number Publication Date
JPS63216175A true JPS63216175A (en) 1988-09-08

Family

ID=12833356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62049518A Pending JPS63216175A (en) 1987-03-04 1987-03-04 Natural language processor and natural language question and reply device

Country Status (1)

Country Link
JP (1) JPS63216175A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006163491A (en) * 2004-12-02 2006-06-22 Fuji Xerox Co Ltd Question-and-answer system, question-and-answer method, and question-and-answer program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006163491A (en) * 2004-12-02 2006-06-22 Fuji Xerox Co Ltd Question-and-answer system, question-and-answer method, and question-and-answer program
JP4635585B2 (en) * 2004-12-02 2011-02-23 富士ゼロックス株式会社 Question answering system, question answering method, and question answering program

Similar Documents

Publication Publication Date Title
Al‐Sughaiyer et al. Arabic morphological analysis techniques: A comprehensive survey
Abbassy et al. Rule-based emotion AI in Arabic customer review
JPS61163467A (en) Translation method
Grif et al. Semantic analyses of text to translate to Russian sign language
JP2007011775A (en) Dictionary creating device, dictionary creation method, program, and recording medium
Kwong Natural language processing
Naidenova et al. An analysis of plane task text ellipticity and the possibility of ellipses reconstructing based on cognitive modelling geometric objects and actions
JPS5892063A (en) Idiom processing system
JPS63216175A (en) Natural language processor and natural language question and reply device
JP4033093B2 (en) Natural language processing system, natural language processing method, and computer program
JP2004287679A (en) Natural language processing system and natural language processing method and computer program
Jun Paraphrasing Chinese Idioms: Paraphrase Acquisition, Rewording and Scoring
JP3919732B2 (en) Machine translation apparatus and machine translation program
JP2008204010A (en) Question content extraction device and question content extraction method
JPH0773200A (en) Key word extracting method
Singh et al. Comprehensive Analysis of Natural Language Processing Technique
Motavallian et al. An intelligent extension of the training set for the Persian n-gram language model: an enrichment algorithm
Le Duyen Sandra Vu CISQA: Corporate Smart Insights Question Answering System
JPH04256171A (en) System for processing unregistered word
Yıldırım et al. Pronoun resolution in Turkish using decision tree and rule-based learning algorithms
JPH07334504A (en) Japanese processing system
JPH0421167A (en) Machine translation device
JPH02302874A (en) Analytical conversion method for natural language
JP2555918B2 (en) Context analysis method
JPH0634207B2 (en) Topic prediction device