JP2012248142A - Sentence creation support natural sentence processing method for displaying meaning in detail of input sentence - Google Patents
Sentence creation support natural sentence processing method for displaying meaning in detail of input sentence Download PDFInfo
- Publication number
- JP2012248142A JP2012248142A JP2011121493A JP2011121493A JP2012248142A JP 2012248142 A JP2012248142 A JP 2012248142A JP 2011121493 A JP2011121493 A JP 2011121493A JP 2011121493 A JP2011121493 A JP 2011121493A JP 2012248142 A JP2012248142 A JP 2012248142A
- Authority
- JP
- Japan
- Prior art keywords
- semantic
- sentence
- natural sentence
- semantic structure
- meaning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Machine Translation (AREA)
Abstract
Description
ワープロなどで入力された自然文に形態素解析及び構文解析を行うと、形態素解析結果や構文解析結果が得られる。その形態素解析結果や構文解析結果に意味構築規則を適用することによって、部分意味構造を構築することができる。それらの部分意味構造を意味根で結合していけば、入力自然文の全体意味構造を構築することができる。その全体意味構造に自然文生成経路を形成すれば、意味構造から全体自然文が生成できる。意味構造は意味根で結合されているので、意味根で意味構造を分割し、その分割した部分意味構造に自然文生成経路を形成すれば、その部分意味構造の意味を表出する部分自然文が生成できる。全体自然文及び部分自然文で、入力自然文の意味を細部にわたって検証できる。これを参照することによって、書き手が精確な意味を表現する自然文を作成することを支援する自然文処理法を提供する。 When morphological analysis and syntax analysis are performed on a natural sentence input by a word processor or the like, a morphological analysis result and a syntax analysis result are obtained. A partial semantic structure can be constructed by applying a semantic construction rule to the morphological analysis result and the syntax analysis result. By combining these partial semantic structures with semantic roots, the entire semantic structure of the input natural sentence can be constructed. If a natural sentence generation path is formed in the entire semantic structure, an entire natural sentence can be generated from the semantic structure. Since the semantic structure is connected by the semantic root, if the semantic structure is divided by the semantic root and a natural sentence generation path is formed in the divided partial semantic structure, the partial natural sentence that expresses the meaning of the partial semantic structure is displayed. Can be generated. The whole natural sentence and partial natural sentence can verify the meaning of the input natural sentence in detail. By referring to this, there is provided a natural sentence processing method for assisting a writer to create a natural sentence expressing an accurate meaning.
意味解析を行う前には、まず形態素解析と構文解析を行う。形態素解析はかなり難しい技術であるが、ほぼ確立していて、無料で公開されている。本発明では無料で公開されている形態素解析プログラムJUMAN(非特許文献3)を用いている。構文解析はまだ問題はあるといわれているが、質の高い構文解析プログラムがすでに無料で公開されている。本発明では多くの研究者に利用されている構文解析プログラムKNP(非特許文献4)を用いている。本発明では、構文解析結果を直接用いずに、その途中で得られる文節解析結果を用いている。形態素解析と文節解析については周知の技術であるので、詳しく説明しない。 Before performing semantic analysis, first perform morphological analysis and syntactic analysis. Morphological analysis is a fairly difficult technique, but it is almost established and is available for free. In the present invention, a free morphological analysis program JUMAN (Non-Patent Document 3) is used. Parsing is still said to have problems, but quality parsing programs are already available for free. In the present invention, a syntax analysis program KNP (Non-patent Document 4) used by many researchers is used. In the present invention, the phrase analysis result obtained in the middle is used instead of directly using the syntax analysis result. Morphological analysis and phrase analysis are well-known techniques and will not be described in detail.
本発明の意味構造は、既に日本(特許文献1)、米国(特許文献2)、欧州(特許文献3)で特許として認可されている。特許第3811902号で示した意味フレームをベースに意味構造を構築している。この意味構造をベースにして、世界共通語の普遍的な言語として、意味語を提案している。意味語を日本語と英語について、普遍文法的な役割を分かりやすく解説した本をすでに 「知能からみた日本語と英語の普遍文法(非特許文献1)」 として出版している。 The semantic structure of the present invention has already been approved as a patent in Japan (Patent Document 1), the United States (Patent Document 2), and Europe (Patent Document 3). The semantic structure is constructed based on the semantic frame shown in Japanese Patent No. 3811902. Based on this semantic structure, we have proposed a semantic word as a universal language of universal language. A book that explains the role of universal grammar in an easy-to-understand manner regarding Japanese and English semantic words has already been published as "Universal Japanese and English Grammar from the Viewpoint of Intelligence (Non-patent Document 1)".
世界共通の自然言語を記述するための意味構造は、自然言語処理関係の分野でまだ問題にされていないので、参考になる文献はない。しかし、自然言語処理研究者で広く引用されている文献は長尾真編「自然言語処理」(非特許文献2)である。形態素解析プログラムや構文解析プログラムを無料で提供している人たちが、執筆しているので、形態素解析や構文解析に関して参考になる。 The semantic structure for describing the natural language that is common throughout the world has not yet been questioned in the field of natural language processing, so there is no reference. However, a document widely cited by natural language processing researchers is “Natural Language Processing” (Non-Patent Document 2) edited by Shin Nagao. Those who provide morphological analysis programs and syntax analysis programs for free have written, so it will be helpful for morphological analysis and syntax analysis.
文の書き手は、読み手も書き手と同じ知識を共有していることを前提にして、文を作成している。しかし、読み手が書き手と同じ知識を共有しているとはかぎらない。そのときには、読み間違えることがある。例えば、「流れる雲や野鳥のさえずりに心を留める。」という文では、普通の人は、「雲が流れる」や「野鳥はさえずる」という知識を持っているので、解釈1:「雲が流れる。野鳥がさえずる。その雲やそのさえずりに心を留める。」と解釈する。しかし、「雲」や、「野鳥」や「さえずり」の意味が分からない次の文「流れるAやBのCにDを留める。」では、次のような解釈2も成り立つ。解釈2:「A(雲)やB(野鳥)が流れる。そのA(雲や)やそのB(野鳥)がC(さえずる)する。そのC(さえずり)にD(心)を留める。」 しかし、「野鳥が流れる」や「雲がさえずる。」 ことは考え難いので、解釈2は成立しないことがわかる。解釈1が成り立つのは、一般に人は上述のような知識を持っているからである。 Sentence writers create sentences on the assumption that the reader shares the same knowledge as the writer. However, readers do not always share the same knowledge as writers. At that time, it may be misread. For example, in the sentence “Keep your heart on the flowing clouds and twittering wild birds”, an ordinary person has the knowledge that “clouds flow” and “wild birds sing”. "The wild birds tweet. Keep in mind the clouds and the tweet." However, in the next sentence that “Clouds”, “Wild Birds”, and “Twitter” do not understand, the following interpretation 2 holds. Interpretation 2: “A (clouds) and B (wild birds) flow. The A (clouds) and B (wild birds) do C (tweet). The D (heart) remains in C (tweet).” Since it is difficult to think of “birds flowing” and “clouds tweet”, it can be seen that interpretation 2 does not hold. Interpretation 1 is valid because people generally have the knowledge described above.
しかし、次のような文「支援していたA社やB社のC社にD負債を引き受けさせる。」 となると、2つの解釈が成り立つ。即ち、解釈1:「A社やC社にD負債を引き受けさせる。」 解釈2:「C社にD負債を引き受けさせる。」。 「B社のC社」という句を先に意味として結合させるのか、「A社やB社」を先に意味として結合させるかだけの問題である。しかし、負債を負うのが、「A社とC社」なのか、「C社だけ」であるのかはA社にとっては重大な問題である。「支援していたのは、A社だけで、C社はB社の関連会社である」という知識があれば、解釈1であるが、「支援していたのがA社とB社であり、C社はA社とB社の関連会社である」という知識があれば、解釈2が成り立つ。 However, if the following sentence “Let company C of company A or company B who undertakes undertake D debt”, two interpretations hold. In other words, Interpretation 1: “A company or C company undertakes D debt” Interpretation 2: “C company undertakes D debt”. The only question is whether the phrase “Company B, Company C” is combined as meaning first, or “Company A or Company B” is combined as meaning first. However, it is a serious problem for Company A whether it is “Company A and Company C” or “Company C only” that bears the debt. If there is knowledge that “Company A was the only company that supported it, and Company C was an affiliated company of Company B”, it would be interpretation 1, but “Company A and Company B supported Interpretation 2 is established if there is knowledge that “Company C is an affiliate of Company A and Company B”.
また、長文の中には、本文と直接関係がない引用文が挿入される場合がある。さらに、日本語では 「私は、………と思う。」 のように、主語が一番後ろの動詞に係ることがある。それには、文脈が理解できるかどうかや、文の内容に関する知識があるかないかによって解釈が変わる。 In some cases, a long sentence may include a quotation that is not directly related to the text. Furthermore, in Japanese, the subject may be related to the last verb, such as “I think ………”. The interpretation changes depending on whether the context can be understood and whether there is knowledge about the content of the sentence.
「ニュージーランドのキー首相は15日の定例記者会見で、南極海での反捕鯨団体シー・シェパードのメンバーのニュージーランド人が日本の調査捕鯨船に侵入したことについて「このような行為は捕鯨を終わらせる助けにはならない。公海での彼らの活動はとても危険であり、冷静になることを求める」と批判。」 “New Zealand's Key Prime Minister said at a regular press conference on the 15th that a New Zealander who was a member of Sea Shepherd, an anti-whaling group in the Antarctic Ocean, invaded a Japanese research whaling ship. "It doesn't help. Their activities on the high seas are very dangerous and they seek to be calm." "
文脈から、キー首相がずっと後ろの「批判」に係ることはすぐ分かる。つまり、「キー首相は……批判。」となる。しかし、文脈が読み取れない場合は、主語が直近の動詞の「侵入した」に係ると考えるので、 「キー首相は……調査捕鯨船に侵入した。」となる。 From the context, it is readily apparent that Prime Minister Key is involved in “criticism” far behind. In other words, "Key Prime Minister ... criticized." However, if the context cannot be read, it is considered that the subject is related to the invasion of the latest verb, so “Key Prime Minister ... has entered the research whaling vessel”.
また、「その際に転職、再就職者が不利になる。」という文では、多くの人は、自分の知識で文字を適当に付け加えて、「その際に転職者や、再就職者が不利になる。」 と理解すると思われるが、「その際に転職して、再就職者が不利になる。」という意味にも解釈することもできる。このように書き手が気付かない曖昧な表現の文や、読み手に入力自然文に関する知識があるかないかによって、意味解釈の違いが生じる文は沢山ある。しかも書き手は全く気付かないことが多い。このようことは、公的な文書では許されない。損害賠償などか絡む文章では、誤解を生まない文章を作成する事が大切である。本発明は、入力文の意味を細部まで精確に提示して、書き手が意図した意味が正確に表現されているかどうかを考えることができる情報を提供する。これによって書き手が意図した意味が精確に表現されている文を作成させることを助ける。そのための自然文処理方法を提供することである。 In addition, in the sentence, “Change of job and re-employee are disadvantaged at that time”, many people add letters appropriately with their own knowledge, “At that time, the change of job and re-employed are disadvantageous. It can be interpreted to mean "changed job at that time and re-employed become disadvantaged". In this way, there are many sentences in which the semantic interpretation differs depending on whether there is an ambiguous expression that the writer does not notice or whether the reader has knowledge about the input natural sentence. Moreover, the writer often does not notice at all. This is not allowed in official documents. It is important to create sentences that do not cause misunderstandings in sentences involving damages. The present invention provides information that accurately presents the meaning of an input sentence and can consider whether the meaning intended by the writer is accurately expressed. This helps to create sentences that accurately express the meaning intended by the writer. It is to provide a natural sentence processing method for that purpose.
読み手は、提示され文に関する知識が全くない場合に、隣同士の単語を結びつけて解読しようとする。また、複合語は一つの単語として解釈されるが、句も複合語に次いで優先的に解釈される傾向がある。このような傾向を意味解析規則の中に取り入れて意味構築を行う。A社、B社、C社の社は組織名として、負債は金銭的な名詞として、ある程度文法的な知識として加味することはできるが、本格的な意味情報にはならない。 When the reader is presented and has no knowledge of the sentence, he or she tries to decipher the words by connecting them together. In addition, compound words are interpreted as one word, but phrases tend to be preferentially interpreted after compound words. Such a tendency is incorporated into the semantic analysis rules to construct the meaning. Company A, Company B and Company C can be added as organization names, debts as monetary nouns, and to some extent grammatical knowledge, but they do not become full-fledged semantic information.
意味解析では、まず文法情報をベースで進める。基本的にはごくふつうの人が持っている程度の意味解釈を意味構築規則として、これをベースにして、意味構造を構築する。即ち、解釈1のように、「雲や野鳥」 より、「野鳥のさえずりに」 や「B社のC社」のような句を優先させて意味構造を構築する。また、主語となる名詞は、最初の用言(動詞)に係るのが一般的であるので、「キー首相は……調査捕鯨船に侵入した。」という意味に解析する。「その際に転職、再就職者が不利になる。」 では一切、単語や文を追加しないので、「その際に転職し、そして再就職者が不利になる。」という意味に解析する。書き手に、「このような意味に解釈される可能性がありますが、それでいいのですか」と問うことになる。もし、そのような解釈を防ぎたいならば、書き手が別な表現方法を探すことになる。本発明では、書き手に注意を喚起するだけである。本発明では、入力自然文を一旦意味構造に変換し、その意味構造をいろいろな部分に分解して、その分解した意味構造から自然文を表出させて、入力文の細部の意味を自然文で表示させるので、読み手が誤解されやすい箇所を見つけることができる。しかし、どうしても、入力文には、本文の意味と関係のない引用文を挿入せざるをえないことがある。そのときの為に独立に意味解析を行うことを指定する機能をもたせる。つまり、((……))や<<……>>、「「………」」などの二重括弧で指定したり、 、。―――。、 のように句点と読点を組み合わせて、その部分を独立させて意味解析する意味範囲を指定する。また、文中で意味解析範囲の境界を指定するために 、、 や 。。のように、二重に読点や句点を打って、前後の意味関係を遮断する機能も持たせている。 「キー首相は15日の定例記者会見で、<<……と>>批判。」 のように、<<……>>の範囲で独立して意味解析させれば、「キー首相は…批判。」のようにキー首相は“批判”に係ることになる。また<<< >>>などの三重括弧で、入力文から削除して、意味解析の対象から外すなどを行う。 Semantic analysis begins with grammatical information. Basically, a semantic structure is constructed on the basis of semantic construction rules based on the semantic interpretation of ordinary people. That is, as in Interpretation 1, the semantic structure is constructed by prioritizing phrases such as “Bird's Twitter” and “Company B of Company B” over “Clouds and Wild Birds”. In addition, since the noun to be the subject is generally related to the first predicate (verb), it is analyzed to mean “the prime minister… invaded the investigation whaler”. In this case, no words or sentences are added at all. In this case, it is analyzed that it means that the job is changed and the re-employed is disadvantaged. The writer asks, “It may be interpreted in this way, but is that okay?” If you want to prevent such interpretation, the writer will look for a different way of expressing. The present invention only draws attention to the writer. In the present invention, the input natural sentence is once converted into a semantic structure, the semantic structure is decomposed into various parts, the natural sentence is expressed from the decomposed semantic structure, and the meaning of the details of the input sentence is expressed in the natural sentence. Because it is displayed with, it is possible to find a place where the reader is easily misunderstood. However, there are cases where it is unavoidable to insert a quote that is not related to the meaning of the text in the input sentence. For that purpose, a function to specify that semantic analysis is performed independently is provided. In other words, ((...)), <<<< >>>, double brackets such as "" ... …… "", etc. ―――. Specify the semantic range for semantic analysis by combining the punctuation and punctuation marks as in,. Also,, and to specify the boundary of the semantic analysis range in the sentence. . Like this, it also has a function to block the semantic relations before and after by putting double punctuation marks and punctuation marks. “Key Prime Minister criticized << …… and >> criticized at the regular press conference on the 15th”, and if we analyzed semantics independently within the scope of << …… >>, The key prime minister is related to “criticism”. In addition, the parentheses such as <<<< >>>> are deleted from the input sentence and excluded from the target of semantic analysis.
「12日の東京株式市場では、経営再建の行方に注目が集まっている日本航空株に売り注文が殺到し、取引が成立しないまま、週末比30円安の37円まで気配値が下落している。」という文においては、主旨は何か。知識として提示したい根幹意味はどれで、その背景となる背景情報はどれか、誤解されやすい表現はどれか、文を簡略化するには、どの部分を検討すればよいか。或いは、精確に情報として提示しなければならないものはどれかが分かり難い。本発明は、入力自然文の意味構造を細かく分割して、細かく分割した意味構造から部分意味自然文を生成して、部分意味自然文の意味を細部に分けて表示する。意味構造から生成された文に意味構造を示す意味構造記号を付加して、自然文の意味構造を明示している。また、枝葉を取り払った根幹意味や根幹意味の背景となる枝葉意味を分けて示しているので、文全体の意味、部分的な意味を含めて意味構造が理解できる。機械翻訳を行う場合、書き手の意図した正確な文が作成されていることが前提である。悪文を翻訳しても、悪文は悪文である。まず、翻訳する前に、日本語なら日本語で正しい文を作成することが重要である。また賠償責任などが発生する公的な文章では、正確な意味を表現している文を作成することが大切である。また、文章を作成しながら、知的なトレーニングを行うのに利用できる。 “In the Tokyo stock market on the 12th, Japan Airlines stocks that are attracting attention on the future of management reconstruction were flooded with sell orders, and the market price fell to 37 yen, a 30 yen reduction compared to the weekend, without a successful transaction. What are the main points in the sentence? What is the basic meaning that you want to present as knowledge, what background information is the background, which expressions are easily misunderstood, and which part should be considered to simplify the sentence? Or, it is difficult to understand what must be accurately presented as information. The present invention finely divides the semantic structure of an input natural sentence, generates a partial semantic natural sentence from the finely divided semantic structure, and displays the meaning of the partial semantic natural sentence in detail. A semantic structure symbol indicating the semantic structure is added to the sentence generated from the semantic structure to clarify the semantic structure of the natural sentence. In addition, since the root meaning from which branches and leaves have been removed and the branch and leaf meanings behind the root meaning are shown separately, the meaning structure including the meaning and partial meaning of the whole sentence can be understood. When performing machine translation, it is assumed that the exact sentence intended by the writer has been created. Even if a bad sentence is translated, the bad sentence is a bad sentence. First of all, it is important to create correct sentences in Japanese before translation. In addition, it is important to create a sentence that expresses the correct meaning in a public sentence that causes liability. It can also be used for intellectual training while creating sentences.
装置全体の構成を図1に示す。中央制御装置1と、内部メモリー2、表示装置3、外部記憶装置4、入力装置5は互いにメモリーハブ6とIOハブ7を中継装置として、バス8で接続されている。外部記憶装置4には、日本語辞書や形態素解析規則、構文解析規則、形態素意味構築規則、文節意味構築規則などの規則類や、辞書検索プログラム、形態素解析プログラム、構文解析プログラム、形態素意味構築プログラム、文節意味構築プログラム、自然文生成プログラムなどのプログラムが格納されている。中央制御装置1によって、外部記憶装置4からプログラムが内部メモリー2に取り出され、プログラムの指示に従って、各種の処理が行われる。 The overall configuration of the apparatus is shown in FIG. The central control device 1, the internal memory 2, the display device 3, the external storage device 4, and the input device 5 are connected to each other via a bus 8 with a memory hub 6 and an IO hub 7 as relay devices. The external storage device 4 includes rules such as a Japanese dictionary, morpheme analysis rules, syntax analysis rules, morpheme semantic construction rules, clause semantic construction rules, a dictionary search program, a morpheme analysis program, a syntax analysis program, and a morpheme semantic construction program. In addition, programs such as phrase meaning construction programs and natural sentence generation programs are stored. The central controller 1 retrieves the program from the external storage device 4 to the internal memory 2 and performs various processes according to the instructions of the program.
処理の全体の流れを図2に示す。入力自然文は必ずしも分割する必要はないが、文中に挿入された引用文の意味を独立に解析したり、指定された意味範囲を独立して、優先的に解析するなどの機能を持たせるために、入力文をいくつかの部分に分割する。そのために自然文分割20を行う。その分割された入力自然文について、形態素解析21を行うが、形態素解析21は、入力自然文の文字列の文頭から、全ての文字列を辞書検索する。検索された文字列について、前後の文字列の関係を規定する形態素解析規則によって形態素解析21を実行して、関連性がある形態素だけを選別して、図9のような形態素解析結果を得る。この結果で得られた形態素解析結果に構文解析規則により構文解析22を実行して、構文解析結果を得る。本発明では構文解析結果の一部である図10のような文節解析結果のみを用いる。先の形態素解析結果に形態素意味構築規則を適用して、形態素意味構築24を行い、入力自然文の部分的な意味構造を得る。形態素意味構築24で得られる意味構造が、既に構築された意味構造と結合可能であれば、意味根41で相互に結合させる。次に文節解析結果に文節意味構築規則を適用して文節意味構築23を行い意味構造を得る。すでに、形態素意味構築24で得られた意味構造や、文節意味構築23によって構築された意味構造などと結合可能であれば、これらの意味構造を意味根41で結合する。このような意味構築を繰り返して、入力自然文が表現する図11のような全体意味構造58を得る。また、意味構造を構築するときには、意味構造の結合の基点になる意味根41を収集して、意味根収集要素32のBun_ixrtに格納する。これらの意味根41で意味構造を任意に分割する。その分割された意味構造に自然文生成経路56作成すれば、部分意味構造57の意味を表現する自然文がえられる。意味解析のプログラムの詳細については、改めて自然文生成を中心にして後ほど説明する。 The overall process flow is shown in FIG. Input natural sentences do not necessarily need to be divided, but in order to provide functions such as independently analyzing the meaning of quoted text inserted in the sentence and preferentially analyzing the specified meaning range. The input sentence is divided into several parts. For this purpose, natural sentence division 20 is performed. The morpheme analysis 21 is performed on the divided input natural sentence, and the morpheme analysis 21 searches all character strings from the beginning of the character string of the input natural sentence. For the retrieved character string, morpheme analysis 21 is executed according to the morpheme analysis rules that define the relationship between the preceding and following character strings, and only relevant morphemes are selected to obtain a morpheme analysis result as shown in FIG. A parse analysis 22 is executed on the morphological analysis result obtained as a result of the parse analysis rule to obtain a parse analysis result. In the present invention, only the phrase analysis result as shown in FIG. 10 which is a part of the syntax analysis result is used. A morpheme semantic construction rule is applied to the previous morpheme analysis result to perform a morpheme semantic construction 24 to obtain a partial semantic structure of the input natural sentence. If the semantic structure obtained by the morpheme semantic construction 24 can be combined with the already constructed semantic structure, the semantic root 41 connects them. Next, the phrase meaning construction rules are applied to the phrase analysis result to perform the phrase meaning construction 23 to obtain the semantic structure. If the semantic structure obtained by the morpheme semantic construction 24 or the semantic structure constructed by the phrase semantic construction 23 can be combined, these semantic structures are combined by the semantic root 41. Such semantic construction is repeated to obtain an overall semantic structure 58 as shown in FIG. 11 expressed by the input natural sentence. Further, when constructing a semantic structure, the semantic root 41 that is the base point of the coupling of the semantic structure is collected and stored in Bun_ixrt of the semantic root collection element 32. The semantic structure is arbitrarily divided by these semantic roots 41. If a natural sentence generation path 56 is created in the divided semantic structure, a natural sentence expressing the meaning of the partial semantic structure 57 can be obtained. Details of the semantic analysis program will be described later, focusing on natural sentence generation.
自然言語で表現される意味構造を次の二つの要素で記述する。即ち、図3のMW(Meta Word)要素30と図4のPS(Primitive Sentence)要素31である。そのデータ構造を図5に示す。MWには主に単語に関する意味情報を格納する。これを( )で示す。 MWは基本的に、U(上Upper)、L(下 Lower)、 B( 前 Before)、N(次Next)の四本の結合手をもっている。これらのMW要素30の結合情報はMW結合要素50に次のようにして、格納される。すなわち、これらの結合相手の要素番号をPrc_mw[mw_num].N、 Prc_mw[mw_num].B、 Prc_mw[mw_num].U、 Prc_mw[mw_num].Lに格納する。上に結合する要素は基本的には一つだけであるが、複雑な文では、複数の要素と上に結合させることがある。そのために、補助的に、Prc_mw[mw_num].amwを設けている。さらに多くの要素と上に結合する必要があれば、Prc_mw[mw_num].bmw、Prc_mw[mw_num].cmwなどを設けることもできる。mw_numはMW要素30の番号である。MWやPSなどの結合相手の種類などもMW結合要素50として、Prc_mw[ ].FLGに格納する。表現禁止の有無などは、MW表現可否要素52として、また自然文生成経路の遮断などはMW経路遮断要素53として、Prc_mw[ ].KAKに格納される。FLGと KAKは16進数の8桁で表現する。 Describe the semantic structure expressed in natural language with the following two elements. That is, PS (Primitive S entence) elements 31 of MW (Meta Word) elements 30 and 4 of FIG. The data structure is shown in FIG. MW mainly stores semantic information about words. This is indicated by (). MW basically has four joints: U (upper Upper), L (lower Lower), B (previous Before), and N (next Next). The coupling information of these MW elements 30 is stored in the MW coupling element 50 as follows. That is, the element numbers of these binding partners are stored in Prc_mw [mw_num] .N, Prc_mw [mw_num] .B, Prc_mw [mw_num] .U, and Prc_mw [mw_num] .L. Basically, there is only one element connected to the top, but in complex sentences, it may be combined with multiple elements. For this purpose, Prc_mw [mw_num] .amw is provided as an auxiliary. If more elements need to be combined above, Prc_mw [mw_num] .bmw, Prc_mw [mw_num] .cmw, etc. can be provided. mw_num is the number of the MW element 30. The type of the coupling partner such as MW or PS is also stored in Prc_mw [] .FLG as the MW coupling element 50. Presence / absence of expression prohibition is stored in Prc_mw [] .KAK as an MW expression permission / inhibition element 52, and blocking of a natural sentence generation path is stored as an MW path blocking element 53. FLG and KAK are expressed as 8 hexadecimal digits.
単語の文字列は、次のMW文字列要素51に格納される。すなわち、単語の見出し語の文字列は主に、Prc_mw[ ].mojiに、冠詞や接頭辞は主にPrc_mw[ ].moji_jar、助詞は主にPrc_mw[ ].moji_jcsに、“→”なのどの論理記号は主にPrc_mw[ ].moji_ronriに分けて格納される。PS要素は図4で示すように、基本的に、主格(Agent case)、時間格(Time case)、 空間格(Space case)、対象格(Object case)、回数格(V case)、理由格(Why case)、述語格(Predicate case)などの七つの格で構成されている。これを[ ]で示す。PS要素31は、このA格、 T格、 S格、V格、 W格、 O格、 P格と、下のMWと結合するための結合手L( 下 Lower)の合計8本の結合手を持っている。PS要素のPS結合の情報はPS結合要素55に格納される。図5に示すデータ構造として格納される。たとえば、A格の結合情報はPrc_mw[ ].Aに格納される。PS要素31が図6で示すように、MW要素と結合すると、意味フレーム40となる。図6に示す意味フレーム40は、これ以上分解できない意味の最小単位となるので、これを基本意味単位と呼んでいる。この基本意味単位は一つの文を表現しているので、基本単文とも呼ぶ。本発明では、入力自然文の意味構造をこのような意味フレームを結合させて、入力自然文が表現する複雑な意味構造を構築する。その上に日本語の文字列を格納していくが、その意味構造を部分に分割して、その部分意味構造上に自然文生成経路を作成して、それに対応する意味を日本語で表示させる。意味語を用いて、自然文質問応答や多言語間機械翻訳などを行う場合は、意味構造内の細部について正確に記述しなければならないが、本発明では、意味構造の上に日本語をのせるだけであるから、意味構造の内部構造について詳細に規定する必要がない。 The character string of the word is stored in the next MW character string element 51. That is, the word headword character string is mainly in Prc_mw [] .moji, articles and prefixes are mainly in Prc_mw [] .moji_jar, and particles are mainly in Prc_mw [] .moji_jcs. The symbols are mainly stored in Prc_mw [] .moji_ronri. As shown in Fig. 4, the PS elements are basically the main case (Agent case), time case (Time case), space case (Space case), object case (Object case), frequency case (V case), reason case. It consists of seven cases such as (Why case) and Predicate case. This is indicated by []. PS element 31 consists of a total of 8 bonds, A, T, S, V, W, O, P, and L (lower) for combining with lower MW. have. The PS coupling information of the PS element is stored in the PS coupling element 55. It is stored as the data structure shown in FIG. For example, the combination information of the A case is stored in Prc_mw [] .A. When the PS element 31 is combined with the MW element as shown in FIG. The semantic frame 40 shown in FIG. 6 is a minimum unit of meaning that cannot be further decomposed, and is called a basic semantic unit. Since this basic semantic unit expresses one sentence, it is also called a basic simple sentence. In the present invention, a semantic structure of an input natural sentence is constructed by combining such semantic frames with the semantic structure of the input natural sentence. The Japanese character string is stored on it, but the semantic structure is divided into parts, a natural sentence generation path is created on the partial semantic structure, and the corresponding meaning is displayed in Japanese. . When using semantic words to answer natural language questions and perform multilingual machine translation, details in the semantic structure must be accurately described.In the present invention, Japanese is added to the semantic structure. Therefore, there is no need to specify the internal structure of the semantic structure in detail.
動詞の意味フレームとして、図7で示す意味フレームを辞書に格納しておき、必要な時に取り出して用いる。取り出した時には、動詞の文字列をP2格に書き込む。動詞以外の文字列は、格の種類を指定する必要がない。むしろ、意味構造から生成された日本語の文字列と入力文の文字列の順序を同じにするために、意味フレームには、入力自然文の語順で、意味フレームのスロットに書き込んでいる。名詞の複合語を格納する意味フレームには、図6(a)に示すPS_EXを用いている。最初の単語をS格に、次の単語を意味根に書き込む。しかし、それ以外は格納する格を指定する必要がない。意味フレームに書き込む単語の数を最大10程度と見込んで、図7のような意味フレームを汎用意味フレームとして用いているが、図7に示す格を指定する必要はない。この場合、10個のスロットを確保するだけでよい。 As the meaning frame of the verb, the meaning frame shown in FIG. 7 is stored in the dictionary, and is extracted and used when necessary. When taken out, the verb string is written in the P2 case. For character strings other than verbs, it is not necessary to specify the type of case. Rather, in order to make the order of the Japanese character string generated from the semantic structure the same as the character string of the input sentence, the semantic frame is written in the slot of the semantic frame in the word order of the input natural sentence. PS_EX shown in FIG. 6A is used for a semantic frame for storing a noun compound word. Write the first word in the S case and the next word in the semantic root. However, there is no need to specify the case to store other than that. The number of words to be written in the semantic frame is estimated to be about 10 at maximum, and the semantic frame as shown in FIG. 7 is used as the general-purpose semantic frame. However, it is not necessary to specify the case shown in FIG. In this case, it is only necessary to secure 10 slots.
入力自然文を一旦意味構造に変換する。意味構造はかなり複雑な構造になることもあるが、まずは簡単な意味構造から構築していく。簡単な意味構造を意味根で結合させて、次第に複雑な意味構造を構築する。意味構築プロセスで、結合基点になる意味根41を幾つかの種類に分類して、収集する。これらの意味根を格納する要素が意味根収集要素32で、次のようにBun_ixrtに格納する。そのデータ構造を図5に示す。主旨を構成する単文の基点となる意味根41は Bun_ixrt[Bun_num].syu_shi[ ]に格納する。Bun_numは入力自然文の番号である。入力自然文のなかで、単文で表現される単文の意味根41はBun_ixrt[].tan_bun[]に集める。スロットへの書込み語は節ごとにまとめるので、Bun_ixrt[ ].setu[Setu_num].slot[ ]に書き込む。Setu_numは節の番号である。このほかに、縦に結合される縦結合複合語はBun_ixrt[].setu[Setu_num].goh_tate_kon[]に、横に結合された横結合語はBun_ixrt[].setu[Setu_num].goh_yoko_kon[]に、句はBun_ixrt[ ].setu[Setu_num].phrase_kon[ ]に、文から取り出される単語、すなわち、根単語はBun_ixrt[ ].bun_tate_kon[ ]に書き込む。 The input natural sentence is once converted into a semantic structure. Semantic structures can be quite complex, but we start with a simple semantic structure. Combining simple semantic structures with semantic roots to build up more complex semantic structures. In the semantic construction process, the semantic root 41 that becomes the bond base point is classified into several types and collected. The element for storing these semantic roots is the semantic root collection element 32, which is stored in Bun_ixrt as follows. The data structure is shown in FIG. The semantic root 41 that is the base point of the single sentence constituting the main point is stored in Bun_ixrt [Bun_num] .syu_shi []. Bun_num is the number of the input natural sentence. Among input natural sentences, the semantic roots 41 of simple sentences expressed in simple sentences are collected in Bun_ixrt []. Tan_bun []. Since the word to be written to the slot is grouped by clause, it is written to Bun_ixrt [] .setu [Setu_num] .slot []. Setu_num is a section number. In addition, the vertically combined compound word that is vertically connected is Bun_ixrt []. Setu [Setu_num] .goh_tate_kon [], and the horizontally combined word is horizontally connected to Bun_ixrt []. Setu [Setu_num] .goh_yoko_kon []. The phrase is written in Bun_ixrt [] .setu [Setu_num] .phrase_kon [], and the word taken out from the sentence, that is, the root word is written in Bun_ixrt [] .bun_tate_kon [].
意味は世界共通である。それをコンピュータ上で実現するために考案されたのが意味語である。意味語が世界共通語として、利用されるためには、世界各国の言語がコンピュータ上で正確に同じ意味構造で、また同じ意味で記述されなければならない。本発明は意味語のごく初歩的な技術の応用である。ごく基本的な考えを簡単に説明する。 The meaning is universal. Semantic words were devised to realize this on a computer. In order for a semantic word to be used as a global common language, languages from around the world must be described on the computer with exactly the same semantic structure and the same meaning. The present invention is an application of a very elementary technique of semantic words. Briefly explain very basic ideas.
これ以上分解することができない基本単文には、PS_EX「EXist 〜ある;存在」と、状態を表すPS_IS「IS 〜である;状態」と、行為を表すPS_DO「DO〜する;行為」の三種がある。これを分かりやすく示すと、図6のようになる。すなわち、PS_EXのP格には、存在を意味する 「ある」、PS_ISのP格には状態を意味する「である」、PS_DOのP格には行為を意味する「する」 を書き込み、他のMW要素30には、暗黙値として、A格には「だれか」や「なにか」(WHO WHAT)、T格には 「いつか」(WHEN)、S格には 「どこか」(WHERE)、O格には 「なにか」(WHAT)、V格には 「なん回か」、W格には 「なぜか」(WHY)が書き込まれている。基本意味単位は基本的には1H5Wで構成されている。この三つの基本単文のほかに、「移動」、「変化」、「経過」、「発生」、「消滅」などの意味を表現する五つの準基本単文を設定している。動詞、助動詞、形容詞、接尾辞、判定詞などの用言が表現する意味構造は、これら合計8個の基本単文と準基本単文を縦、横に結合して構成される。これであらゆる複雑な意味構造を表現することができる。 There are three types of basic sentences that cannot be disassembled any more: PS_EX “EXist ~ is; existence”, PS_IS “IS is; state” that represents the state, and PS_DO “DO to do; act” that represents the action. is there. This is shown in an easy-to-understand manner as shown in FIG. In other words, in the P case of PS_EX, there is “Yes” meaning existence, in the P case of PS_IS “Yes” meaning state, and in the P case of PS_DO, “Yes” meaning action is written. The MW element 30 has an implicit value: “Anyone” or “What” (WHO WHAT) for the A rating, “Someday” (WHEN) for the T rating, “Where” for the S rating, In the O case, “what” (WHAT), in the V case “some times”, and in the W case “why” (WHY) are written. The basic semantic unit is basically composed of 1H5W. In addition to these three basic simple sentences, five quasi-basic simple sentences expressing meanings such as “movement”, “change”, “progress”, “occurrence”, “disappearance” are set. Semantic structures expressed by phrases such as verbs, auxiliary verbs, adjectives, suffixes, and judgments are composed of these 8 basic simple sentences and semi-basic simple sentences combined vertically and horizontally. This can represent any complex semantic structure.
「動詞、助動詞、形容詞、判定詞、接尾辞」などは用言である。複数の用言が組み合わされた用言を複合用言と呼ぶ。ここでは、一つの用言や複合用言で表現される文を単文としている。例として「太郎が花を水に浮かべる」の意味構造を示すと、図7のようになる。即ち、基本意味フレーム40のPS_EX(存在)を基本意味フレーム40のPS_DO(行為)のO2格で縦に結合し、PS_EXのP1格には、「ある」が、PS_DOのP2格には「浮かべる」が書き込まれている。残りの格はスロットと呼ばれ、単語の文字列などが書き込まれる。この場合、A2格のスロットに「太郎が」、A1格に「花を」、S1格に「水に」などの文字列や意味情報が書き込まれている。「太郎が花を水に浮かべる」という意味は、「花が」、「水に」、「ある」という状態に「太郎がする」という意味であると考える。そのような状態に「する」を「浮かべる」という動詞(用言)で表現したことになる。同図において小さい文字で示したものが、人間の頭脳の中には暗黙値でとして存在していると考えられるが、自然文では文字列として表現されない。コンピュータでもこれを表現しないように、表現禁止にしている。これを自然文で示すときには、マーク(*)を付けた。 “Verbs, auxiliary verbs, adjectives, judgments, suffixes” and the like are predicates. A predicate in which a plurality of predicates are combined is called a composite predicate. Here, a sentence expressed by a single predicate or a compound predicate is a simple sentence. As an example, a semantic structure of “Taro floats a flower in the water” is shown in FIG. That is, the PS_EX (existence) of the basic semantic frame 40 is vertically combined with the O2 rating of the PS_DO (act) of the basic semantic frame 40, and “is” in the P1 rating of the PS_EX, but “floating” in the P2 rating of the PS_DO. "Is written. The remaining cases are called slots, and word strings are written in them. In this case, a character string and semantic information such as “Taro is”, “Flower” is assigned to the A1 slot, and “Water is” is written to the S1 rank. The meaning of “Taro floats a flower in the water” is considered to mean “Taro does” in the state of “flower is”, “in the water”, “is”. In such a state, “do” is expressed by a verb (predicate) “floating”. The small characters in the figure are thought to exist as implicit values in the human brain, but are not represented as character strings in natural sentences. In order not to express this even on computers, the expression is prohibited. A mark (*) was added to indicate this in natural text.
最下層にあるMW要素は特別な役割を持ったMW要素である。意味構造の根っこにあるので、これを意味根41と呼ぶ。意味根に書き込まれた単語が根単語と呼んでいる。すべての意味構造はこれを連結点として結合する。この意味フレーム40からプログラムで自然文を生成するには、意味根を基点として、自然文生成経路を生成する。それに沿って表現可の文字列だけを集めれば、自然文が簡単に生成できる。次のようにしても、簡単に自然文が生成できる。上のPS_EXを下のPS_DOのO2格に埋め込むだけでよい。図7の格要素だけを示すと次のようになる。
([A2 T2 S2 V2 W2 ([A1 T1 S1 V1 W1 O1 P1])O2 P2])
このうち、「太郎が」、「花を」、「水に」、「浮かべる」などの文字列を持つMW要素30だけを並べると、次のようになる。A2格を示す記号A2をサフィックスとして示した。
([(太郎が)A2 (花を)A1 (水に)S1(浮かべる)P2])
本発明では、意味構造を自然文の中で表現するために上述のように、MW要素30の記号 ( ) やPS要素31の記号 [ ] を用いている。PS要素31の内側にあるMW要素30の記号を削除すると次のようになる。
([太郎が花を水に浮かべる])
さらに、PS要素の記号[ ]を省略すると、次のようになる。
(太郎が花を水に浮かべる)
内部にある意味構造記号42は省略しているが、これが「太郎が花を水に浮かべる」という文の意味構造である。このMW要素を省略すると、
太郎が花を水に浮かべる
となる。自然文の中で意味構造を示唆するために、文字列と違和感がない記号を用いている。ここで、「浮かべる」という意味フレーム40を紹介したが、意味フレーム40には多種類の意味フレーム40がある。本発明では、意味フレーム40の内部構造については問題にしないので、本発明の説明には、この意味フレーム40を汎用的な意味フレーム40として用いている。
The MW element at the lowest level is a MW element with a special role. Since it is at the root of the semantic structure, it is called a semantic root 41. The word written in the semantic root is called the root word. All semantic structures connect this as a connecting point. In order to generate a natural sentence from the semantic frame 40 by a program, a natural sentence generation path is generated using a semantic root as a base point. If you collect only expressible character strings along that line, you can easily generate natural sentences. A natural sentence can be easily generated as follows. Simply embed the upper PS_EX in the O2 case of the lower PS_DO. Only the case element of FIG. 7 is shown as follows.
([A2 T2 S2 V2 W2 ([A1 T1 S1 V1 W1 O1 P1]) O2 P2])
Among these, when only the MW elements 30 having character strings such as “Taro ga”, “Hana wa”, “In the water”, “Float” are arranged, the result is as follows. The symbol A2 indicating the A2 case is shown as a suffix.
([(Taro) A2 (flower) A1 (in water) S1 (floating) P2]))
In the present invention, the symbol () of the MW element 30 and the symbol [] of the PS element 31 are used as described above in order to express the semantic structure in a natural sentence. When the symbol of the MW element 30 inside the PS element 31 is deleted, the result is as follows.
([Taro floats a flower in the water])
Further, when the symbol [] of the PS element is omitted, the following is obtained.
(Taro floats a flower in the water)
The semantic structure symbol 42 inside is omitted, but this is the semantic structure of the sentence “Taro floats a flower in the water”. If this MW element is omitted,
Taro floats a flower in the water
It becomes. In order to suggest a semantic structure in natural sentences, symbols that do not feel uncomfortable with character strings are used. Here, the meaning frame 40 of “floating” has been introduced. There are various types of meaning frames 40 in the meaning frame 40. In the present invention, since the internal structure of the semantic frame 40 is not a problem, the semantic frame 40 is used as a general-purpose semantic frame 40 in the description of the present invention.
次に、「太郎が水に浮かべる花」という文の意味構造について説明する。これは
「太郎が花を水に浮かべる。その花」
という意味である。それを意味フレーム40で示すと図8のようになる。図7に示す ように「太郎が花を水に浮かべる」と同じ意味構造であるが、意味フレーム40のA1格に書き込まれた「花が」が表現禁止となり、それが一番下にある意味根41に書き込まれた状態になる。単語の文字列が書きこまれていないスロットを省略すると表1のような意味構造になる。
Next, the semantic structure of the sentence “Taro floats in the water” will be described. this is
"Taro floats a flower in the water. That flower"
It means that. This is shown as a semantic frame 40 in FIG. As shown in Fig. 7, it has the same semantic structure as “Taro floats a flower on the water”, but “Hanaga” written in the A1 rating of the semantic frame 40 is prohibited, and it means that it is at the bottom. The state is written in the root 41. If a slot in which a word string is not written is omitted, the semantic structure shown in Table 1 is obtained.
表1
[(太郎が)(*花を)(水に)(浮かべる)]
↑↓
( 花 )意味根
意味根41の上にある意味構造を意味根41の前に埋め込むと、
([(太郎が)(*花を)(水に)(浮かべる)]↑↓花)
このようになる。 意味根41の後に埋め込むと、英語の語順になる。↑↓は [(太郎が)(*花を)(水に)(浮かべる)]というPS要素と(花)というMW要素が縦に結合されたことをしめすマークである。これを意味構造記号42の縦結合記号とする。自然文の中に意味構造を示す記号を書き込んで自然文の中の意味構造を浮かび上がらせることを試みている。なるべく文字列となじみのある記号を用いるために、「↑↓」の代わりに「::」 を用いることにした。従って
([(太郎が)(*花を)(水に)(浮かべる)]::花)
このように記述する。表現禁止の文字列を削除し、意味構造としてMW要素30を強調する必要がなければ、外の( )の中のMW記号を削除して、次のように
([太郎が水に浮かべる]::花)
と記述する。 意味フレーム40 の [ ] も特に強調する必要がなければ、それを削除するすると次のようになる。
(太郎が水に浮かべる::花)
これは 「太郎が花を水に浮かべる」 から「花」を取り出して意味根41の要素MWに書き込まれたものである。 記号 :: によって、文と縦に結合された意味構造であることを示す。
Table 1
[(Taro is) (* flower) (in the water) (floating)]
↑ ↓
(Flower) If the semantic structure above the semantic root 41 is embedded before the semantic root 41,
([(Taro is) (* flower) (in the water) (floating)] ↑ ↓ flower)
It looks like this. If it is embedded after the semantic root 41, it is in English word order. ↑ ↓ are marks indicating that the PS element [[Taro] (* flower) (in the water) (floating)] and the MW element (flower) are vertically connected. This is a vertically connected symbol of the semantic structure symbol 42. I am trying to make a semantic structure in a natural sentence emerge by writing a symbol indicating the semantic structure in the natural sentence. We decided to use “::” instead of “↑ ↓” in order to use symbols that are as familiar as possible. Therefore ([(Taro is) (* flower) (in the water) (floating)] :: flower)
Write like this. If it is not necessary to delete the prohibited character string and emphasize the MW element 30 as a semantic structure, delete the MW symbol in the outer () and change it as follows ([Taro floats on the water]: :flower)
Is described. If it is not necessary to emphasize [] of the semantic frame 40, deleting it will result in the following.
(Taro floats in the water :: flowers)
This is “Taro floats a flower in the water” and “flower” is taken out and written in the element MW of the semantic root 41. The symbol :: indicates a semantic structure that is vertically connected to the sentence.
「太郎が花を水に浮かべた理由」 の「理由」や「太郎が花を水に浮かべたという理由」の「という理由」などは、前文から取り出されたものではない。もう少し複雑な意味構造をもっている。しかし、その程度の違いは、読み手も自然に理解できる内容であるので、若干の違いは無視して、その差異を示さない。 The “reason” of “Taro ’s floating flower in the water” and “The reason why Taro floated the flower in water” are not taken from the preamble. It has a slightly more complicated semantic structure. However, since the difference in level is content that can be understood naturally by the reader, the slight difference is ignored and the difference is not shown.
複合語の意味構造について説明する。「経営再建」のように「経営」と「再建」という単語が合成された語を複合語と呼ぶ。本発明では、このような複合語を一つの単語としてみるのではなく、次のような文、すなわち、「経営には、再建がある。その再建」として取り扱う。これを意味構造として表現するには、存在を表すPS_EX、を用いる。この意味構造を文字列にすると、表2のようになる。 The semantic structure of the compound word will be described. A word in which the words “management” and “reconstruction” are combined like “management reconstruction” is called a compound word. In the present invention, such a compound word is not regarded as one word, but is handled as the following sentence, that is, “Management has a reconstruction. Its reconstruction”. To express this as a semantic structure, PS_EX representing existence is used. Table 2 shows this semantic structure as a character string.
表2
([(スロット)A1(書込禁)T1(スロット)S1(書込禁)V1(書込禁)W1(書込禁)O1(ある)P1]::( ))
スロットS1に「経営」を、スロットA1に「再建」を書き込む。これが取り出されて、意味根41に書き込まれるので、意味構造は表3のようになる。スロットA1を表現禁止にする。
Table 2
([(Slot) A1 (write prohibited) T1 (slot) S1 (write prohibited) V1 (write prohibited) W1 (write prohibited) O1 (present)) P1] :: ())
Write “Management” in slot S1 and “Rebuild” in slot A1. Since this is extracted and written in the semantic root 41, the semantic structure is as shown in Table 3. Prohibit expression of slot A1.
表3
([(*再建が)A1 (経営に)S1(*ある)]::(再建))
ここで、助詞の「に」や動詞の「ある」を表現禁止にして、必要のない記号と文字列を削除すると、次のようになる。 (経営::再建) すなわち、「経営には、再建がある。」という文と 「その再建」 という単語が縦に結合した意味構造である。つまり、「再建」は単なる「再建」でなく、「経営に関する再建」の意味になる。
Table 3
([(* Reconstruction) A1 (In Management) S1 (* Yes)]: :( Reconstruction))
Here, when the particle “ni” and the verb “a” are prohibited from being expressed and unnecessary symbols and character strings are deleted, the following is obtained. (Management :: Reconstruction) In other words, it is a semantic structure in which the sentence “Management has reconstruction” and the word “Reconstruction” are vertically connected. In other words, “reconstruction” means not “reconstruction” but “reconstruction related to management”.
ところで、「延べ300キロ」は複合語であるが、その意味は「300キロは延べである。その300キロ」という意味である。そこで、表4のように意味構造として記述する。 By the way, “total 300 km” is a compound word, but its meaning is “300 km is total. That 300 km”. Therefore, it is described as a semantic structure as shown in Table 4.
表4
([(*300キロは) (延べ) (*である)] :: (300キロ) )
表現禁止の文字列を削除すると、次のようになる。(延べ :: 300キロ)。 この場合は「〜は〜である」という意味であるからPS_ISという基本単文を用いるべきであるが、PS_EXを用いている。この程度の差異は無視する。
Table 4
([(* 300km) (total) (*)]] :: (300km))
When the prohibited character string is deleted, it becomes as follows. (Total: 300 km). In this case, the basic sentence of PS_IS should be used because it means "~ is ~", but PS_EX is used. Ignore this difference.
次に句の意味構造について説明する。句の「野鳥のさえずり」は「野鳥にはさえずりがある。」という意味構造と「そのさえずり」という意味構造が縦に結合していると考える。これは、「さえずりは単なるさえずり ではなく、[野鳥に関するさえずり」という意味になる。表5のような意味構造として表現する。「野鳥に」の助詞「に」を「の」に変更して、表現禁止の文字列を削除した。 Next, the semantic structure of the phrase will be described. The phrase “Birds of the Birds” is thought to be a vertical combination of the semantic structure of “There is a Bird in Wild Birds” and the semantic structure of “That Twitter”. This means that “Twitter is not just twitter, but“ birds ”. It is expressed as a semantic structure as shown in Table 5. Changed the particle "Ni" to "No" for "Wild Bird" and deleted the prohibited text.
表5
(野鳥の::さえずり)
Table 5
(Bird's :: Twitter)
「経済再建」も「経済の再建」もほとんど同じ意味であるように、複合語と句は殆ど同じ意味構造である。しかし、単語間の結合力に若干の違いがある。単語同志の結合の方が強い。従って、先に単語同士を左から右に結合させて、意味を構築する。例えば、「12日の東京株式市場では」の場合、「東京」と「株式」がまず結合して、(東京::株式) となり、次に 「株式」と「市場では」が結合して、(株式::市場では)となり、その後に「12日の」と「東京株式市場では」が結合して、(12日の::東京株式市場では)となる。前述の意味構築結果を反映させて、意味構造の内部構造も示せば、表6のようになる。 Just as “economic reconstruction” and “economic reconstruction” have almost the same meaning, compound words and phrases have almost the same semantic structure. However, there is a slight difference in the binding power between words. The combination of words is stronger. Therefore, the meaning is constructed by combining words from left to right first. For example, in the case of “Tokyo Stock Market on the 12th”, “Tokyo” and “Stock” are first combined to become (Tokyo :: Stock), then “Stock” and “In the Market” are combined, (Stock :: In the market), then “12th” and “In Tokyo Stock Market” are combined to become (12 :: In Tokyo Stock Market). Table 6 shows the internal structure of the semantic structure reflecting the above-described semantic construction result.
表6
(12日の::((東京::株式)::市場では))
つまり、複合語の方が結合力が強いので、先に結合される。その後に句の意味構造が構築される。
Table 6
(12th :: ((Tokyo :: Stock) :: In the market))
In other words, the compound word has a stronger binding force, so it is combined first. After that, the semantic structure of the phrase is built.
文と、複合語や句との違いは、意味構造のスロットに文字列などの意味情報が自由に書き込めるかどうかである。複合語や句を記述した意味フレーム40には、意味情報を書き手が自由に書き込むことができるスロットがないので、限定的な意味しか表現できない。それに対して、意味情報を自由に書き込めるスロットがある動詞、形容詞、判定詞などの用言を用いると、複雑な意味を自由にしかも精確に表現できる。一般に、背景としての意味情報は複合語と句を用いて表現することが多い。しかも、読み手が当然知識として持っていることが前提となるが、その意味は正確でなくてもよいことが多い。少なくとも、背景知識情報として示しておきたいという程度のものであると考えられる。明確に提示したい情報は用言を用いて表現し、それ以外の背景知識は複合語か句で表現すること基本である。本発明はこのようなことができる自然文作成支援方法を提供しようとするものである。 The difference between a sentence and a compound word or phrase is whether or not semantic information such as a character string can be freely written in a slot of a semantic structure. The semantic frame 40 describing compound words and phrases has no slots in which the writer can freely write semantic information, and therefore can express only a limited meaning. On the other hand, the use of verbs, adjectives, judgments and other predicates with slots in which semantic information can be freely written, allows complex meanings to be expressed freely and accurately. In general, semantic information as a background is often expressed using compound words and phrases. Moreover, it is assumed that the reader has knowledge as a matter of course, but the meaning is not necessarily accurate. It is thought that it is at least the level that we want to show as background knowledge information. The basic idea is to express the information that you want to present clearly using a predicate, and the rest of the background knowledge as a compound word or phrase. The present invention is intended to provide a natural sentence creation support method capable of such a purpose.
本発明の基本になっている意味言語では、文章の意味は、基本的に単文の意味構造が縦横に結合されて構成されるとしている。「一日、騒音を断って、しばし立ち止まって、さえずりに心を留めたい。」 という文の意味構造は表7で示すように、「一日、騒音を断ち、」という文と、「しばし立ち止まって、」という文102と「さえずりに心を留めたい。」という文という三つの単文が横に結合されている。 In the semantic language which is the basis of the present invention, the meaning of a sentence is basically composed of a semantic structure of a single sentence vertically and horizontally. As shown in Table 7, the meaning structure of the sentence "I refuse noise for a day, stop for a while, and keep my heart in mind" is as shown in Table 7, and the sentence "I cut the noise for a day" The sentence 102 and the sentence “I want to keep in mind” are combined horizontally.
表7
(一日、騒音を断ち、)→(しばし立ち止まって、)→(さえずりに心を留める)
↑
( )意味根
もし〜ならば、〜する。 は if_then の関係であるが、「もし、騒音を断って、しばし立ち止まれば、さえずりが心に留まる。」という意味を示している。三つの文が論理関係によって結合された意味構造である。しかし、ここではとりあえず、横結合として扱うことにする。それを「→」で示す。「スピードや」、「騒音を」、「雲や」、「さえずり、」は単語であるが、単語が横に結合されたものであるので、次の表8ように記述する。
Table 7
(Suppress the noise for a day) → (stop for a while) → (keep on twitter)
↑
() Meaning Is the relationship of if_then, but it means that if you turn off the noise and stop for a while, the twitter will stay in your heart. It is a semantic structure in which three sentences are connected by a logical relationship. However, for now, we will treat it as a horizontal connection. This is indicated by “→”. “Speed”, “Noise”, “Cloud”, “Twitter” are words, but the words are combined horizontally, so they are described as shown in Table 8 below.
表8
(スピードと)→and(*騒音を) (野鳥や)→or(*さえずりに)
↑ ↑
(騒音を)意味根 (さえずりに)意味根
意味言語では、文も単語も同じように取り扱っている。単語は意味としてと固定しているので、意味フレームを持たないが、文は用言のスロットにいろいろな単語を書きこむことによって、多様な意味を表現することができる。「スピードと騒音を」の「スピード」と「騒音」は論理積の関係にあり、「野鳥やさえずりに」の「野鳥」と「さえずり」は論理和の関係にある。ここでは、論理関係であることだけを示唆し、文の場合と同じように、単に横に結合されたものとする。このように、幾つかの意味を横結合させたときには、必ず、最下層に意味根41を設置して、横結合された意味構造の代表とする。これで別の意味構造と結合させる。横に結合された最終語を代表として意味根41に書き込むが、二重表現を禁止にするために、終点の単語を表現禁止にしている。
Table 8
(With speed) → and (* noise) (wild bird) → or (* Twitter)
↑ ↑
(Noise) Semantic Root (twitter) Semantic Root Semantic Language treats sentences and words in the same way. Since words are fixed as meanings, they do not have a meaning frame, but sentences can express a variety of meanings by writing various words in the predicate slots. “Speed” and “Noise” in “Speed and Noise” have a logical product relationship, and “Wild Bird” and “Twitter” in “Wild Bird and Twitter” have a logical sum relationship. Here, only a logical relationship is implied, and it is assumed that it is simply connected horizontally as in the case of sentences. In this way, when several meanings are laterally coupled, a semantic root 41 is always set at the lowermost layer to represent the laterally coupled semantic structure. This combines with another semantic structure. The last word joined horizontally is written in the semantic root 41 as a representative, but in order to prohibit double expression, the word at the end point is prohibited.
次に意味根について説明する。既に説明したように、意味根に書き込まれた単語は根単語であるが、一つの単語はそれ自体根単語である。意味フレーム40やMW要素30が幾つか横に結合された意味構造には、意味構造の代表として、意味根41をもうけることはすでに述べた。この意味根41だけが他の意味構造と結合する。このように結合点を制限したので意味構造の構築が簡単になった。この意味根41に、自然文生成基点や自然文生成経路の遮断の可否の機能を与えることによって、自然文の意味構造を意味根41で分割できる。意味根を設けたことが本発明のキーポイントとなる。 Next, the meaning root will be described. As already explained, the word written in the semantic root is the root word, but one word is itself the root word. It has already been described that a semantic root 41 is provided as a representative of a semantic structure in a semantic structure in which several semantic frames 40 and MW elements 30 are coupled horizontally. Only this semantic root 41 is combined with other semantic structures. In this way, the point of attachment is limited, making it easier to construct semantic structures. The semantic structure of the natural sentence can be divided by the semantic root 41 by giving the semantic root 41 the function of whether or not the natural sentence generation base point and the natural sentence generation path can be blocked. Providing a root of meaning is a key point of the present invention.
意味範囲の設定について説明する。「秋の一日、スピードと騒音を断ち、しばし立ち止まって、流れる雲や野鳥のさえずりに心を留めたい。」を例文として意味解析を説明する。本発明では、入力文を幾つかの部分に分割して、各部分で独立して意味解析を行う。従来の自然文解析方法では、ある単語が別の単語とどのような関係があるかどうかという、係り受け関係を中心に構文解析22などを進めている。その係り受けを入力自然文全域にわたって行っている。係り受けの関係があるかどうかは、人間は書き手が当然持っていると考えられる知識をベースにしていることが多い。ところが、本発明では、人が当然持っていると考えられる知識を殆ど持っていないことを前提に、意味解析をおこなう。知識がないと、単語はごく近くにある単語としか関連しなくなる。逆にこのことを利用して、意味解析を行い、知識が無い読み手がどのように入力文を解釈するかを示し、書き手の注意を喚起することが目的である。コンピュータによる自然文処理では、統計的な処理で、係り受けの可能性を決めている。賠償責任が伴う大切な文章の意味を統計的な処理では決められない。むしろ、誤解しやすい箇所を書き手に示すことが重要である。 The setting of the semantic range will be described. The semantic analysis will be explained with an example sentence: “I want to cut off speed and noise during the autumn day, stop for a while, and keep my mind in the clouds and wild birds.” In the present invention, the input sentence is divided into several parts, and semantic analysis is performed independently at each part. In the conventional natural sentence analysis method, syntax analysis 22 and the like are proceeding with a focus on a dependency relationship such as how a certain word is related to another word. The dependency is performed over the entire input natural sentence. Whether or not there is a dependency relationship is often based on the knowledge that a writer would naturally have. However, in the present invention, the semantic analysis is performed on the assumption that the person has little knowledge that is naturally considered to be possessed. Without knowledge, words can only be related to words that are very close. On the contrary, the purpose of this is to perform semantic analysis, show how a reader with no knowledge interprets the input sentence, and call the writer's attention. In natural sentence processing by a computer, the possibility of dependency is determined by statistical processing. The meaning of important sentences with liability cannot be determined by statistical processing. Rather, it is important to indicate to the writer what is easily misunderstood.
入力文の意味範囲分割は、文節解析結果に意味範囲分割規則(Bsyori_irange.rule) を適用する。どのように、意味範囲を分割しても良いが、ここでは、動詞の活用形が基本連用形か又は、タ系連用テ形で終わり、読点が付いていることを条件にしている。これらの各単文の意味が独立し、横に結合して読み手に知識を提示していると思われるからである。これは表9のようなルールとなる。例示した規則は一つだけである。図10に示した文節解析結果に意味範囲分割規則を適用する。図9で示すように、形態素解析結果で、mrph_no=9の([動詞 * * 基本連用形])とmrph_no=12の([動詞 * * タ系連用テ形])は、文節解析結果では、bmst_n=4、 と、bnst_n=6で、用言:動 係:連用 読点などの特長が示されている。”*“は条件を無視する記号である。このような規則を多数作成して、Bsyori_irange.rule に登録する。 The semantic range division of the input sentence applies the semantic range division rule (Bsyori_irange.rule) to the phrase analysis result. The semantic range may be divided in any way, but here, it is conditional on the verb inflection form being either the basic continuous form or ending in the ta series joint form and with a reading. This is because the meaning of each single sentence is independent and seems to be combined horizontally to present knowledge to the reader. This is the rule shown in Table 9. There is only one example illustrated. The semantic range division rule is applied to the phrase analysis result shown in FIG. As shown in FIG. 9, in the result of morphological analysis, mrph_no = 9 ([verb * * basic continuous form]) and mrph_no = 12 ([verb * * data system joint form]) are bmst_n = 4, and bnst_n = 6, features such as prescription: relation: continuous reading and so on. “*” Is a symbol for ignoring the condition. Create many such rules and register them in Bsyori_irange.rule.
表9
意味範囲分割規則 Bsyori_irange.rule
(( )mae(用言:動 係:連用 読点)hon( )ato prog_no:8000 rule_no:8020 )
このような規則を図10の文節解析結果に適用する。mae(前)、hon(本)、ato(後)は ( ) のサフィックスで、参考のために示したもので、実際のルールには記述しない。hon=bnst_noで、mae=bnst_no−1、ato=bnst_no+1である。即ち、bnst_noを始から辿って、検索するが、maeはその前、atoは後を意味する。つまり、図10において、bnst_no=0から、意味範囲分割規則と文節解析結果をマッチングさせるが、bnst_noの前と後でもマッチングするかどうかを調べる。上で示した規則では、maeもatoの条件が指定されていないので、honだけがマッチングすればよい。prog_noの8000はプログラム番号で、関数prog_8000( )を実行する。rule_no:8020はルールの識別番号である。図10の文節解析結果で、bnst_noを辿って、どのルールがマッチするかを調べる。上述の規則の場合、bnst_no=4の「断ち、」 とbnst_no=6の「立ち止まり、」で、文節解析結果の特長“用言:動 係:連用 読点”にマッチする。従って、意味解析範囲をbnst_no = 0〜4と5〜6と7〜12の三つの範囲に分割する。これを意味範囲0(imi_range_0)、 意味範囲1(imi_range_1)、 意味範囲2(imi_range_2)とする。この三つの意味範囲に分割して意味解析を行う。
Table 9
Semantic range division rule Bsyori_irange.rule
(() Mae (Phrase: Action: Continuous reading) hon () ato prog_no: 8000 rule_no: 8020)
Such a rule is applied to the phrase analysis result of FIG. mae (front), hon (book), and ato (rear) are suffixes for () and are shown for reference, and are not described in the actual rules. hon = bnst_no, mae = bnst_no−1, and ato = bnst_no + 1. In other words, bnst_no is searched from the beginning, mae means before, and ato means after. That is, in FIG. 10, the semantic range division rule and the phrase analysis result are matched from bnst_no = 0, but it is checked whether or not the matching is performed before and after bnst_no. In the rules shown above, mae also does not specify the ato condition, so only hon needs to be matched. 8000 of prog_no is a program number, and the function prog_8000 () is executed. rule_no: 8020 is an identification number of the rule. Based on the phrase analysis result of FIG. 10, bnst_no is traced to check which rule matches. In the case of the above-mentioned rule, bnst_no = 4 “breaks” and bnst_no = 6 “stops”, and matches the feature “phrase: movement: continuous readings” of the phrase analysis result. Therefore, the semantic analysis range is divided into three ranges of bnst_no = 0-4, 5-6, and 7-12. This is defined as semantic range 0 (imi_range_0), semantic range 1 (imi_range_1), and semantic range 2 (imi_range_2). The semantic analysis is performed by dividing into these three semantic ranges.
次に形態素解析結果を用いた意味構築について説明する。(秋の)や(スピードや)(騒音を)などのように、名詞に助詞がついてものは、意味構造として極めて簡単である。本発明では意味構造が簡単で確実なものから意味構築を始める。意味構築は、図10に示す文節解析結果に基づいて解析を進める。図10の文節に対応する形態素は図10のmrph_fromとmrph_toに示されている。例えば、bnst_no=0の「秋の」に対応する形態素は「秋」のmrph_from=0と、「の」のmrph_to=1である。この範囲に形態素意味構築規則Msyori.ruleを適用する。本発明の説明で使用する形態素意味構築規則Msyori.ruleを表10に示す。 Next, semantic construction using morphological analysis results will be described. When a noun is attached to a noun, such as (autumn) or (speed) or (noise), the semantic structure is very simple. In the present invention, semantic construction starts with a simple and reliable semantic structure. Semantic construction proceeds with analysis based on the phrase analysis results shown in FIG. The morphemes corresponding to the clauses in FIG. 10 are shown in mrph_from and mrph_to in FIG. For example, morphemes corresponding to “autumn” of bnst_no = 0 are mrph_from = 0 of “autumn” and mrph_to = 1 of “no”. The morpheme semantic construction rule Msyori.rule is applied to this range. Table 10 shows the morpheme semantic construction rule Msyori.rule used in the description of the present invention.
表10
形態素意味構築規 Msyori.rule
(( )mae ([名詞 (普通名詞 時相名詞)])hon ([助詞 (格助詞 接続助詞)])ato prog_no:2000 rule_no:1900 )
(([名詞 数詞])mae([接尾辞 名詞性名詞助数辞])hon( )ato prog_no:1400 rule_no:1400)
(([接尾辞 名詞性名詞助数辞])mae([特殊 (句点 読点])hon()ato prog_no:2400 rule_no:2405)
(([動詞 * * (基本連用形 タ系連用テ形)])mae([特殊 (句点 読点)])hon( )ato prog_no:2002 rule_no:2414)
(([動詞 * * 基本連用形])mae([接尾辞 形容詞性述語接尾辞])hon()ato prog_no:4600 rule_no:4413)
(( )mae([動詞 * * 基本形])hon( )ato prog_no:2000 rule_no:2400)
(( )mae( 副詞 )hon( )ato prog_no:2001 rule_no:2401)
Table 10
Morphological Semantic Building Rules Msyori.rule
(() Mae ([noun (common noun temporal phase noun)]) hon ([particle (case particle connection particle)]) ato prog_no: 2000 rule_no: 1900)
(([Noun Numeral]) mae ([Suffix noun noun suffix]) hon () ato prog_no: 1400 rule_no: 1400)
(([Suffix noun noun suffix]) mae ([special (punctuation)] hon () ato prog_no: 2400 rule_no: 2405)
(([Verb * * (basic continuous form)) mae ([special (punctuation)] hon () ato prog_no: 2002 rule_no: 2414)
(([Verb * * Basic Conjunction]) mae ([Suffix Adjective Predicate Suffix]) hon () ato prog_no: 4600 rule_no: 4413)
(() Mae ([verb * * basic form]) hon () ato prog_no: 2000 rule_no: 2400)
(() Mae (adverb) hon () ato prog_no: 2001 rule_no: 2401)
検索条件を [品詞 細分類 活用型 活用形 文字列] の順に記述する。もし、活用型と活用形を指定しない場合は、“*”で、次のように記述する。 [品詞 細分類 * * 文字列] 、( )のように検索条件が記述されていないものは、検索条件なし。 [ ] の中で(普通名詞 時相 名詞)のように括弧で示したものは、普通名詞でも時相名詞でもよいという意味である。細分類のあとにマッチング条件がない場合は、[名詞 細分類]のように条件を記述しなくてもよい。意味範囲0(imi_range_0)では、マッチングは、図9のmrph_no=0から始める。[秋]の品詞は名詞で細分類が時相名詞であり、mrph_no=1の品詞が助詞、細分類が接続助詞であるので、honがmrph_no=0のときに規則番号rule_no:1900がマッチングし、関数prog_2000( )を実行する。MW要素30一個をメモリーから取り出し、mw_1とし、MW要素30のPrc_mw[1].moji に見出し語である文字列「秋」を、助詞の「の」をPrc_mw[1].moji_jcsに書き込む。名詞の「秋」は今後の意味解析で使用しないので、処理済として、形態素解析結果から削除する。図11は、入力文との関係が直感的に理解できるように意味構造を階層的に示したものであるが、同図で mw_1 (秋の) のようにしてMW要素30を示す。
rule_no:1900の規則は「スピードと」、「騒音を」 にも一致するので、図11に示すように、mw_3(スピードと)とmw_4(騒音を)のMW要素30を作成する。「一日、」は2つの規則で意味を構築する。規則番号 rule_no: 1400でmw_2(一日)を作成し、さらに、規則番号rule_no:2405で、mw_2(一日、)のように、読点を追加する。
Describe the search conditions in the order of [part of speech fine classification utilization type utilization form string]. If the usage type and the usage type are not specified, use “*” as follows. [Part-of-speech sub-category * * character string] No search condition is specified if no search condition is described, such as (). Items in parentheses, such as [] (common noun time phase noun), mean that either a common or time phase noun may be used. If there is no matching condition after the fine classification, the condition does not have to be described as [noun fine classification]. In the semantic range 0 (imi_range_0), matching starts from mrph_no = 0 in FIG. The part of speech of [autumn] is a noun and the subcategory is a temporal noun. The part of speech of mrph_no = 1 is a particle and the subcategory is a connected particle. Therefore, when hon is mrph_no = 0, rule number rule_no: 1900 matches. The function prog_2000 () is executed. One MW element 30 is taken out of the memory and set as mw_1, and the character string “autumn” as the headword is written in Prc_mw [1] .moji of the MW element 30 and the particle “no” is written in Prc_mw [1] .moji_jcs. Since the noun “autumn” is not used in future semantic analysis, it is deleted from the morphological analysis result as processed. FIG. 11 shows the semantic structure hierarchically so that the relationship with the input sentence can be intuitively understood. In FIG. 11, the MW element 30 is shown as mw_1 (autumn).
Since the rule of rule_no: 1900 also matches “speed and” and “noise”, MW elements 30 of mw_3 (speed and) and mw_4 (noise) are created as shown in FIG. “One day” builds meaning with two rules. Rule number rule_no: 1400 creates mw_2 (one day), and rule number rule_no: 2405 adds a reading as mw_2 (one day).
「断つ、」はrule_no:2414にマッチするので、関数prog_2002( )で、意味フレーム辞書から意味フレームps_2を取り出し、P格のmw_22( ) の要素moji、すなわち、Prc_mw[mw_22].mojiに文字列の 「断つ」を書き込む。そして、その意味根41であるmw_23の要素moji_jcs即ち、Prc_mw[mw_23].moji_jcsに読点「、」を書き込むなどの処理を行い、表11と図11に示すような意味構造を構築する。
表11
ps_2[ mw_22(断ち) ]
↑
mw_23( 、)
これで意味範囲0(imi_range_0)の意味構造の構築は終わる。つぎに、同様のことを意味範囲1(imi_range_1)について意味構築をおこなう。図11でも示すようにmw_24(しばし)を作成する。文字列の 「立ち止まり、」は、mrph_no=12で、規則番号rule_no:2414にマッチするので、関数prog_2002( )を実行し、意味フレーム(ps_4)を意味フレーム辞書から取り込んでメモリー上に設定する。前述の 「断つ、」と同じ方法である。この意味構造を表12に示す。
Since “Decline” matches rule_no: 2414, the function prog — 20002 () extracts the semantic frame ps — 2 from the semantic frame dictionary, and the character m in the element moji of the Pw mw — 22 (), that is, Prc_mw [mw — 22] .moji Write "severe". Then, processing such as writing a punctuation mark “,” in the element moji_jcs of mw_23 which is the semantic root 41, that is, Prc_mw [mw_23] .moji_jcs, is performed to construct a semantic structure as shown in Table 11 and FIG.
Table 11
ps_2 [mw_22 (cut off)]
↑
mw_23 (,)
This completes the construction of the semantic structure of the semantic range 0 (imi_range_0). Next, the meaning is constructed for the meaning range 1 (imi_range_1). As shown in FIG. 11, mw_24 (for a while) is created. The character string “stop,” is mrph_no = 12, and matches the rule number rule_no: 2414. Therefore, the function prog_2002 () is executed, and the semantic frame (ps_4) is fetched from the semantic frame dictionary and set in the memory. It is the same method as the above-mentioned “cut off”. This semantic structure is shown in Table 12.
表12
ps_4[ mw_38(立ち止まり) ]
↑
mw_39( 、)
次に意味範囲2(imi_range_2)について、「雲や」、「野鳥の」、「さえずりに」、「心を」などの意味構築を行う。形態素意味構築規則Msyori.ruleをこの範囲に適用する。mw_5(雲や)、mw_6(野鳥の)、mw_7(さえずりに)、mw_8(心を)などは、形態素意味構築規則rule_no:1900で構築できる。これを図11に示す。
Table 12
ps_4 [mw_38 (stop)]
↑
mw_39 (,)
Next, for the meaning range 2 (imi_range_2), semantic construction such as “clouds”, “wild bird”, “twitter”, “heart” is performed. The morpheme semantic construction rule Msyori.rule is applied to this range. mw_5 (clouds), mw_6 (wild birds), mw_7 (twits), mw_8 (hearts), etc. can be constructed with the morpheme semantic construction rule rule_no: 1900. This is shown in FIG.
mrph_no=14の「流れる」は、形態素意味構築規則 rule_no:2400にマッチして、関数prog_2000( )を実行して、意味フレームps_6をメモリー上に取り込む。これを図11に示す。「留める」の意味フレーム40は、図11に示すように、前述と同じようにメモリー上に取り出す。「留めたい」は動詞の「留める」という意味フレーム40と接尾辞の「たい」という意味フレーム40を縦に結合した複合意味フレーム40であるが、本発明では、自然文の全体の意味構造を分かりややすく説明することが目的で、意味フレーム内部の意味構造については詳しく論じない。そのために「留め_たい」という仮想的な意味フレーム40を作って、それを用いる。「留め」と「たい」とは、形態素意味構築規則rule_no:4413がmrph_no=25でマッチするので、関数prog_4600( )を実行する。即ち、基本連用形の「留め」と接尾辞の形容詞性述語接尾辞である「たい」を「_」で結んだ文字列「留め_たい」をps_8の意味フレーム40のP2格のMW要素30(mw_68)の要素、即ち、Prc_mw[mw_68].mojiに書き込む。それを表13に示す。 “Flowing” with mrph_no = 14 matches the morpheme semantic construction rule rule_no: 2400, executes the function prog_2000 (), and fetches the semantic frame ps_6 into the memory. This is shown in FIG. As shown in FIG. 11, the frame 40 meaning “fasten” is taken out to the memory in the same manner as described above. “I want to keep” is a compound meaning frame 40 in which the meaning frame 40 of the verb “Stuck” and the meaning frame 40 of the suffix “Tai” are vertically connected. In the present invention, the whole semantic structure of the natural sentence is changed. The purpose is to explain in an easy-to-understand manner, and the semantic structure inside the semantic frame will not be discussed in detail. For this purpose, a virtual meaning frame 40 of “Fix_I want” is created and used. “Fix” and “Tai” execute the function prog — 4600 () because the morpheme semantic construction rule rule_no: 4413 matches with mrph_no = 25. That is, the character string “stop_tai” obtained by connecting the basic consecutive form “stop” and the suffix adjective predicate suffix “tai” with “_” is the P2 MW element 30 of the meaning frame 40 of ps_8 ( mw — 68), ie, Prc_mw [mw — 68] .moji. This is shown in Table 13.
表13
ps_8[ mw_68(留め_たい) ]
↑
mw_69( 。)
次に文節解析結果を用いて意味構築をおこなう。
Table 13
ps_8 [mw_68 (stop_want)]
↑
mw_69 (.)
Next, semantic construction is performed using the phrase analysis results.
構文解析22では、文節がどのような役割を持つかを示すために幾つかの特長featureが与えられている。その特長を用いて意味構築を行う。例えば、図10で示すように、bnst_no=0の[秋の]についてみると、特長2では[体言]、特長4では、[係:ノ格]が与えられ、bnst_no=1の[一日、]では特長1で[体言]、特長2では[数量]などが与えられている。これらを組み合わせて、表14のような文節意味構築規則Bsyori.ruleを設ける。 In the parsing 22, some feature features are given to indicate what role the clause has. Semantic construction is performed using these features. For example, as shown in FIG. 10, regarding [autumn] where bnst_no = 0, [word] is given in feature 2 and [engagement: no case] is given in feature 4, and [every day, bnst_no = 1] ], [Description] is given in Feature 1, and [Quantity] is given in Feature 2. By combining these, the phrase meaning construction rule Bsyori.rule as shown in Table 14 is provided.
表14
文節意味構築規則 Bsyori.rule
((体言 係:ノ格)mae (体言 数量) hon ( ) ato prog_no:6100 rule_no:6220)
((体言 係:ノ格)mae (体言 助詞 格要素 連用要素) hon ( ) ato prog_no:6100 rule_no:6221)
((体言 助詞 係:ト格)mae (体言 助詞 格要素 連用要素)hon ( )ato prog_no:6200 rule_no:7044)
((体言 助詞 係:連体)mae (体言 助詞 格要素 連用要素)hon ( )ato prog_no:6200 rule_no:6460)
((用言:動 係:連格 連体修飾 連体並列条件) mae (体言 助詞 )hon ( )ato prog_no:6000 rule_no:6060)
Table 14
Clause semantic construction rule Bsyori.rule
((Speaking person: no) mae (speaking quantity) hon () ato prog_no: 6100 rule_no: 6220)
((Speaking person: no case) mae (sentence particle case element combination element) hon () ato prog_no: 6100 rule_no: 6221)
((Participant particle clerk: G) mae (Body particle grammar element element) hon () ato prog_no: 6200 rule_no: 7044)
((Participant particle clerk: Conjunction) mae (Partial particle Participant case element Conjunctive element) hon () ato prog_no: 6200 rule_no: 6460)
((Phrase: Action: Conjunction Conjunction Modification Conjunction Parallel Condition) mae (Conjunction Particle) hon () ato prog_no: 6000 rule_no: 6060)
文節意味構築規則の規則番号rule_no:6220が、bnst_no = 1 でマッチするので、関数prog_6100( )が実行される。即ち、図11に示すように、意味フレーム ps_10 が作成されて、その意味フレーム40のS格のmw_83に「秋の」という文字列を、mw_2の文字列「一日、」の意味情報などをA格のmw_81のスロットと、意味根41のmw_88にコピーする。A格の「一日、」は表現禁止になるので、図11では省略している。この意味根41をphrase(句)_kon(根)として、次のようにBun_ixrt[Bun_num].setu[Setu_num].phrase_kon[i] =mw_88;に格納する。ここで、Bun_numは文番号、Setu_numは節番号で、iは既に登録された意味根41の数である。即ち、文番号と節番号ごとに分類して格納する。bnst_no=0の「秋の」はこの段階で今後意味構造に関与するする事がなくなるので、図10の文節解析結果から処理済として削除する。bnst_no=2の「スピードと」とbnst_no=3の「騒音を」とは、文節意味構築規則のrule_no:7044とマッチするので、関数prog_6200( )で次に示すような意味を構築する。mw_3とmw_4を横に結合する。そして、mw_4の下に、新たにもう一つのmw_70を設けて、それをmw_4と上下に結合する。その様子を表15にしめす。 Since the rule number rule_no: 6220 of the clause meaning construction rule matches with bnst_no = 1, the function prog_6100 () is executed. That is, as shown in FIG. 11, a semantic frame ps_10 is created, the character string “autumn” is added to the mw_83 of the S case of the semantic frame 40, the semantic information of the character string “one day,” etc. of mw_2, etc. Copy to the slot of mw_81 of the A case and mw_88 of the semantic root 41. Since "A day," in the A rating is prohibited, it is omitted in FIG. This semantic root 41 is stored in Bun_ixrt [Bun_num] .setu [Setu_num] .phrase_kon [i] = mw_88 as phrase (phrase) _kon (root) as follows. Here, Bun_num is a sentence number, Setu_num is a section number, and i is the number of semantic roots 41 already registered. That is, the sentence numbers and the section numbers are classified and stored. Since “autumn” with bnst_no = 0 is no longer involved in the semantic structure at this stage, it is deleted as processed from the phrase analysis result of FIG. Since “speed and” of bnst_no = 2 and “noise” of bnst_no = 3 match rule_no: 7044 of the clause semantic construction rule, the following meaning is constructed by the function prog_6200 (). Combine mw_3 and mw_4 horizontally. Then, another mw_70 is newly provided under mw_4, and is combined with mw_4 in the vertical direction. The situation is shown in Table 15.
表15
mw_3(スピードと) → mw_4(*騒音を)
↑
mw_70(騒音を)
これが他の意味構造との結合点になるので、語が横に結合する意味根41としてgoh語)_yoko(横)_kon(根)、即ち、Bun_ixrt[Bun_num].setu[Setu_num].goh_yoko_kon[i]=mw_70;に格納する。ここで、上のような結合情報を格納するために次にように、mw_3と mw_4、 mw_70が結合相手の要素番号を格納する。Prc_mw[mw_3].N = mw_4;Prc_mw[mw_4].B = mw_3;Prc_mw[mw_4].L= mw_70;Prc_mw[mw_70].U = mw_4; ここでmw_4はMW要素mw_4の要素番号である。その他に、結合相手の要素の種類、即ち、PSかMWかなどの情報をPrc_mw[mw_num].FLGに格納する。bnst_no=2の「スピードと」は今後意味構造の構築に関与しないので、図10の文節解析結果から処理済として削除する。
Table 15
mw_3 (with speed) → mw_4 (* noise)
↑
mw_70 (noise)
Since this becomes a connection point with other semantic structures, goh word) _yoko (horizontal) _kon (root), that is, Bun_ixrt [Bun_num] .setu [Setu_num] .goh_yoko_kon [i ] = Mw — 70; Here, in order to store the coupling information as described above, mw_3, mw_4, and mw_70 store the element numbers of the coupling partners as follows. Prc_mw [mw_3] .N = mw_4; Prc_mw [mw_4] .B = mw_3; Prc_mw [mw_4] .L = mw_70; Prc_mw [mw_70] .U = mw_4; where mw_4 is the element number of the MW element mw_4. In addition, information such as the type of element to be combined, that is, whether it is PS or MW, is stored in Prc_mw [mw_num] .FLG. Since “speed and” of bnst_no = 2 will not be involved in the construction of the semantic structure in the future, it is deleted as processed from the phrase analysis result of FIG.
次に、imi_range_0で、「一日、」と「騒音を」の文字列は「断つ、」という意味フレーム40のスロットのMW要素30に書き込む。意味フレーム40の空いているスロットを見つけて、その順番に空きスロットに文字列などの意味情報をコピーする。これは簡単なプログラムで実現できる。すでに作成された意味フレームps_2の空きスロットmw_17にmw_88(一日、)の意味情報をコピーし、スロットmw_17のMW結合要素50とps_10のPS結合要素55に結合相手の要素番号を格納することによって、結合情報を格納する。この場合、入力自然文の語順が出力時に変わらないように、入力文の語順に従って、空きスロットに文字列を書き込む。このようにして、「一日、」という意味構造は「断つ、」という意味フレーム40と結合する。意味言語では、指定された意味の単語を指定された意味を持つスロットに書き込むことになっているが、これを厳密に行うと、書き手の語順と、意味構造から生成される自然文の語順が微妙に変わり、書き手に心理的な負担をあたえるので、ここでは、書き手の語順どおりに出力するために、入力文の語順どおりにスロットに書き込んでいる。(スピードと)→(騒音を)の意味根mw_70の意味情報を空きスロットmw_18にコーピして、さらに、mw_18とmw_4に結合相手の要素番号を持たせて結合情報を格納する。この場合も、(スピードと騒音を)は、mw_70とスロットのmw_18との2つの意味連結MWを持つことになる。スロットのmw_17とmw_18で、自然文表現の可否や自然文生成経路の遮断の可否の制御は、MW表現可否要素52やMW経路遮断要素53であるPrc_mw[mw_num].KAKで行う。KAKは16進数の8桁で、上から一桁目で表現可否、上から4桁目で遮断可否を指定する。意味根41は既に収集されて、Bun_ixrt[Bun_num]に分類して格納されているので、いつでも制御することができる。経路遮断可とすれば、「一日、騒音を断ち、」 となり、遮断しなければ、「秋の一日、スピードと騒音を断ち、」 という文が得られる。 Next, in imi_range_0, the character strings “one day” and “noise” are written in the MW element 30 of the slot of the frame 40 meaning “cut off”. An empty slot of the semantic frame 40 is found, and semantic information such as a character string is copied to the empty slot in that order. This can be achieved with a simple program. By copying the semantic information of mw_88 (one day) to the empty slot mw_17 of the semantic frame ps_2 that has already been created, and storing the element number of the coupling partner in the MW coupling element 50 of the slot mw_17 and the PS coupling element 55 of ps_10 , Store the binding information. In this case, a character string is written in the empty slot according to the word order of the input sentence so that the word order of the input natural sentence does not change during output. In this way, the semantic structure of “one day” is combined with the semantic frame 40 of “cut off”. In a semantic language, a word with a specified meaning is written in a slot with a specified meaning. If this is done strictly, the word order of the writer and the natural sentence generated from the semantic structure will be changed. Since it changes slightly and places a psychological burden on the writer, here, in order to output in the word order of the writer, it is written in the slot in the word order of the input sentence. The semantic information of the semantic root mw_70 of (speed and) → (noise) is copied to the empty slot mw_18, and the combined information is stored with the element numbers of the coupling partners in mw_18 and mw_4. Again (speed and noise) will have two semantically connected MWs, mw_70 and slot mw_18. With the slots mw_17 and mw_18, whether or not the natural sentence expression is possible and whether or not the natural sentence generation path is blocked is controlled by the MW expression permission element 52 and the MW path blocking element 53, Prc_mw [mw_num] .KAK. KAK is an 8-digit hexadecimal number that can be expressed by the first digit from the top, and can be blocked by the fourth digit from the top. Since the semantic root 41 is already collected and classified and stored in Bun_ixrt [Bun_num], it can be controlled at any time. If the route can be cut off, the sentence reads “Turn off noise for a day,” otherwise, the sentence “Turn off speed and noise for a fall day,” is obtained.
文節意味構築規則によるimi_range_1の意味構築は簡単である。図11に示すように、mw_24(しばし)を、意味フレームps_4[mw_33(スロット)mw_38(立ち止まり、)])の空きスロットmw_33に意味情報と結合情報を書き込むだけである。imi_range_2の意味構築は次のように行う。図10のbnst_no=10で、文節意味構築規則rule_no:6221とマッチして、関数prog_6100( )が実行され、表16のような意味構造が得られる。 The semantic construction of imi_range_1 by the phrase semantic construction rules is simple. As shown in FIG. 11, the semantic information and the combined information are simply written in mw_24 (for a while) in the empty slot mw_33 of the semantic frame ps_4 [mw_33 (slot) mw_38 (stop)). The semantic construction of imi_range_2 is performed as follows. When bnst_no = 10 in FIG. 10 matches the clause semantic construction rule rule_no: 6221, the function prog_6100 () is executed, and the semantic structure as shown in Table 16 is obtained.
表16
mw_73 mw_79
(野鳥の::さえずり)
この段階で、「野鳥の」は今後意味構築に関与しないので、図10から処理済として削除する。「流れる雲や」はbnst_no=8で文節意味構築規則rule_no:6060がマッチし、関数prog_6000( )によって、図11に示すように、「流れる」の意味フレームps_6の意味根mw_54にmw_5(雲や)の意味情報を書き込む。「雲や」は「流れる」という用言と縦接合されているので、Bun_ixrt[Bun_num].setu[Setu_num].bun_tate_kon[ ]に格納する。これを基点して、「流れる雲」という文字列が生成できる。この段階で「流れる」の意味解析が終わるので、処理済として、図10から「流れる」の項目を削除する。
Table 16
mw_73 mw_79
(Bird's :: Twitter)
At this stage, “wild bird” will not be involved in semantic construction in the future, and is deleted from FIG. 10 as processed. “Flowing cloud” matches bnst_no = 8 and the phrase semantic construction rule rule_no: 6060 matches, and the function prog_6000 () causes mw_5 (clouds or clouds) to the semantic root mw_54 of the “flowing” semantic frame ps_6 as shown in FIG. ) Write semantic information. Since “cloud” is vertically joined with the phrase “flowing”, it is stored in Bun_ixrt [Bun_num] .setu [Setu_num] .bun_tate_kon []. Based on this, a character string “flowing cloud” can be generated. At this stage, since the semantic analysis of “flowing” is finished, the item “flowing” is deleted from FIG. 10 as being processed.
前の処理で、bnst_no=9の「野鳥の」が処理対象から除去されているので、bnst_no=8の「雲や」とbnst_no=10の「さえずりに」とが隣り合わせとなり、文節意味構築規則のrule_no:6460とマッチする。そこで、関数prog_6200( )で、表17と図11に示すように、意味構造が構築される。 In the previous processing, “wild bird” with bnst_no = 9 has been removed from the processing target, so “cloud” with bnst_no = 8 and “twitter” with bnst_no = 10 are next to each other. rule_no: Matches 6460. Therefore, a semantic structure is constructed by the function prog — 6200 () as shown in Table 17 and FIG.
表17
mw_71(雲や) → mw_79(*さえずりに)
↑
mw_80(さえずりに)
Table 17
mw_71 (clouds) → mw_79 (* twitter)
↑
mw_80 (to twitter)
「留め_たい」の意味フレーム40の空きスロットmw_63に、mw_80(さえずりに)の意味情報をコピーして、上の意味構造と結合させる。この場合も、意味情報をスロットに書き込むだけで、mw_80を削除するわけではない。mw_8(心を)をスロットmw_64に書き込めむと、これでimi_range_2の意味構築が終わる。スロットmw_63で自然文生成経路を遮断すれば、mw_69を基点をした自然文「さえずりに心を留め_たい。」という文が得られる。遮断しなければ、「流れる雲や野鳥のさえずりに心を留め_たい。」という自然文が得られる。 The meaning information of mw_80 (to twitter) is copied to the empty slot mw_63 of the meaning frame 40 of “Still_Tai” and combined with the above semantic structure. In this case, mw_80 is not deleted only by writing the semantic information into the slot. When mw_8 (heart) is written into the slot mw_64, the semantic construction of imi_range_2 is completed. If the natural sentence generation path is interrupted in the slot mw_63, a sentence “I want to keep in mind” is obtained based on mw_69. If you don't cut it off, you will get a natural sentence that says, “I want to keep my mind on the flowing clouds and the singing birds.”
自然文生成処理については、図16で示すプログラムで詳しく説明する。関数は 文作支援( );のように、文字列の後に括弧( )と ; をつけて示した。プログラムはmain( ) ;で始まる。形態素解析( );と構文解析( );、規則類の読み込み( );を実行し、次いで文作支援( );を実行する。文作支援( );は入力自然文の意味範囲分割( );で、入力文を幾つかに分割する。その後、入力自然文の意味構築( );で自然文の意味を構築し、次いで指定された意味根mw_rootを基点として、自然文生成(mw_root);を実行する。入力自然文の意味構築( );では、形態素解析結果による意味構築( );で、形態素解析結果に形態素意味構築規則を適用して、意味構造を構築する。その後、文節解析結果による意味構築( );では、文節解析結果に文節意味構築規則を適用して、意味構造を構築する。
自然文生成(mw_root);では、意味構造の自然文生成経路を辿って、自然文を作成するための文字列を収集するが、上に結合される要素がPSやMWかによって、経路作成が異なる。最初はmw_rootを起点として、MWの生成経路作成と文字列収集(mw_root)を実行する。MWの生成経路作成と文字列収集( );で示すように、上に結合された要素がMW要素の場合は、MWの生成経路作成と文字列収集( );で、PS要素の場合が、PSの生成経路作成と文字列収集( );で生成経路を作成して、その経路で表現可の文字列を収集する。PSの生成経路と文字列収集( );では、A格、T格、S格、V格、W格、O格、P格の7つの格に分岐する。生成経路の作成順序は、格順テーブルで指定するkakuで決められる。同図では、日本語の格順を示したが、格順が言語ごとに異なる。基本的な格順は、英語はAPOST、中国語のATSPOである。どのような格順でも格順テーブルで指示できる。MWの生成経路生成と文字列収集( );は、表現可でしかも経路遮断否のMW要素と、もしバイパス経路のamwが指定されている場合には、バイパス経路での生成経路作成と文字列収集();によって、それらの要素を辿って、指定された意味根41を基点として、自然文生成経路が形成され、表現可の文字列を収集する。MW要素が表現不可や経路遮断の場合は、MW要素の文字列を取り込まないで、MW要素のNで指定されるMW要素を経由して、自然文生成25を行う。
The natural sentence generation process will be described in detail with reference to the program shown in FIG. Functions are shown with parentheses () and; after the character string, as in writing support (); The program begins with main (); Perform morphological analysis (); and parsing (); read rules (); and then execute sentence support (); Sentence support (); divides the input sentence into several parts by dividing the meaning range of the input natural sentence (); Thereafter, the meaning of the natural sentence is constructed by means of constructing the meaning of the input natural sentence (); and then natural sentence generation (mw_root); is executed using the designated semantic root mw_root as a base point. In the semantic construction (); of the input natural sentence, the semantic structure is constructed by applying the morphological semantic construction rules to the morphological analysis result in the semantic construction (); based on the morphological analysis result. Then, in the semantic construction based on the phrase analysis result () ;, the semantic structure is constructed by applying the phrase semantic construction rules to the phrase analysis result.
In natural sentence generation (mw_root) ;, a natural sentence generation path of a semantic structure is traced to collect character strings for creating a natural sentence. Depending on whether the element connected above is PS or MW, path generation is possible. Different. First, MW generation route creation and character string collection (mw_root) are executed starting from mw_root. MW generation route creation and character string collection (); As shown in MW, if the combined element is an MW element, MW generation route creation and character string collection (); Create a PS generation path and collect character strings (); create a generation path and collect character strings that can be expressed by that path. In the PS generation path and character string collection () ;, it branches into seven cases: A, T, S, V, W, O, and P. The creation route creation order is determined by kaku specified in the case order table. In the figure, the Japanese case order is shown, but the case order is different for each language. The basic order is APOST for English and ATSPO for Chinese. Any order can be indicated in the order table. MW generation route generation and character string collection (); is a MW element that can be expressed and the route is blocked, and if the bypass route amw is specified, the generation route generation and character string in the bypass route By collecting () ;, these elements are traced, a natural sentence generation path is formed using the designated semantic root 41 as a base point, and expressible character strings are collected. When the MW element cannot be expressed or the route is blocked, the natural sentence generation 25 is performed via the MW element designated by N of the MW element without taking in the character string of the MW element.
MW要素番号mw_numの文字列は次のようにして収集される。即ち、
冠詞、前置詞、接頭辞などの文字列は
strcat(語の文字列[moji_num][1]、Prc_mw[mw_num].moji_jar);
見出し語の文字列は
strcat(語の文字列[moji_num][2]、Prc_mw[mw_num].moji);
助詞の文字列、
strcat(語の文字列[moji_num][3]、Prc_mw[mw_num].moji_jcs);
論理関係の記号などは
strcat(語の文字列[moji_num][4]、Prc_mw[mw_num].moji_ronri);
によって、語の文字列[moji_num]に書き込まれる。これらの文字列は、収集文字列からの自然文生成( );によって、語順テーブルで指定された順で出力する。図16で示した語順は、日本語の場合で、接頭辞、見出し語、接尾辞、論理記号の順で示したが、その順序は、自由に語順テーブルで変更できる。従って、各国語の語順で生成できる。MWの生成経路作成と文字列収集( );や、PS要素の場合がPSの生成経路作成と文字列収集( );で文字列を収集し、その後バイパス経路での生成経路作成と文字列収集( )で収集し、最後に、Prc_mw[ ].Nで示された経路の文字列を収集する。
これらの文字列の出力順序は、MWの生成経路作成と文字列収集( );内でプログラムの位置によって容易に変更可能である。英語では、関係代名詞は、節より先に表現される。これはを実現させるためには、「 strcat(語の文字列[moji_num][2]、Prc_mw[mw_num].moji) 」を、プログラムのMWの生成経路作成と文字列収集( )の中にある 「 if(上に結合する要素がPSの場合) 」の上に移動させればよい。このように、本発明では、格順、語順、単文の順序、関係代名詞と節の順序を、日本語だけでなく、いろいろな国の言語の語順でも、表現できる。
The character string of the MW element number mw_num is collected as follows. That is,
Strings such as articles, prepositions, prefixes, etc.
strcat (word string [moji_num] [1], Prc_mw [mw_num] .moji_jar);
The string of headwords is
strcat (word string [moji_num] [2], Prc_mw [mw_num] .moji);
Particle string,
strcat (word string [moji_num] [3], Prc_mw [mw_num] .moji_jcs);
Logical symbols etc.
strcat (word string [moji_num] [4], Prc_mw [mw_num] .moji_ronri);
Is written in the character string [moji_num]. These character strings are output in the order specified in the word order table by natural sentence generation (); from the collected character strings. The word order shown in FIG. 16 is in the case of Japanese and is shown in the order of prefix, headword, suffix, and logical symbol, but the order can be freely changed in the word order table. Therefore, it can be generated in the word order of each language. MW generation route creation and character string collection (); and PS elements in the case of PS elements, PS generation route creation and character string collection (); Collect with (), and finally collect the character string of the route indicated by Prc_mw [] .N.
The output order of these character strings can be easily changed depending on the position of the program within the creation route of MW and character string collection (); In English, relative pronouns are expressed before clauses. To achieve this, "strcat (word string [moji_num] [2], Prc_mw [mw_num] .moji)" is in the program MW generation path creation and string collection () It should be moved above "if (when the element to be connected to is PS)". Thus, according to the present invention, case order, word order, simple sentence order, relative pronoun and clause order can be expressed not only in Japanese but also in word order of languages of various countries.
意味構造と自然文について説明する。本発明では、入力自然文を一旦意味構造に変換する。その意味構造のいろいろな部分を指定して、各部分の意味構造から部分意味自然文を表出させる。その部分意味自然文によって、書き手が意図している意味が精確に表現されているかどうか細部にわたって検証できる。図11の( a )に意味構造を, ( b )に入力文100を示した。図11では、意味構造を結合する意味根41の文字列を上下に並べて階層的に示したので、文の意味がどのような構造になっているかが一目でわかる。意味構造をこのように表示することは、コンピュータでも行えるが、複雑な長文になると、かえって分かり難くなる。そのために、通常は、図12に示すように自然文を出力させている。ここでは、図11に示す意味構造を参照しながら、部分的な意味構造からどのように、部分意味自然文を生成するかを説明する。 Explain the semantic structure and natural sentences. In the present invention, the input natural sentence is once converted into a semantic structure. Various parts of the semantic structure are specified, and partial semantic natural sentences are expressed from the semantic structure of each part. The partial meaning natural sentence can verify in detail whether the meaning intended by the writer is accurately expressed. The semantic structure is shown in (a) of FIG. 11, and the input sentence 100 is shown in (b). In FIG. 11, since the character strings of the semantic roots 41 that combine the semantic structures are arranged in a hierarchical manner and shown hierarchically, it can be seen at a glance what structure the meaning of the sentence is. This way of displaying the semantic structure can be done by a computer, but it becomes difficult to understand if it becomes a complicated long sentence. Therefore, normally, a natural sentence is output as shown in FIG. Here, how the partial semantic natural sentence is generated from the partial semantic structure will be described with reference to the semantic structure shown in FIG.
この意味構造から生成される自然文を二種類に分類して示す。一つは意味構造を幹や枝や葉の部分にばらばらに切り分けて、その部分的な意味構造の意味を自然文で表示する。これらは、意味根で自然文生成経路を遮断すれば、簡単に生成できる。このようにして生成された文や語や句に「簡略」という枕詞をつけている。もう一つは、意味根で自然文生成経路を遮断しないで生成した自然文で、これに「詳細」という枕詞をつけて区別している。図12では、前半に簡略意味表現と後半に詳細意味表現を示している。簡略表現では、自然文生成経路を遮断して、必要最小限の文字列しか表示させていないので、基本的な意味表現を見るには、便利である。大抵は、簡略表現で十分であるが、もっと細かく検証したいときには、詳細意味表現を見ることになる。 Natural sentences generated from this semantic structure are classified into two types. One is to divide the semantic structure into parts such as trunks, branches, and leaves, and display the meaning of the partial semantic structure in natural sentences. These can be generated easily if the natural sentence generation path is cut off at the semantic root. The phrase “simplified” is attached to the sentence, word or phrase generated in this way. The other is a natural sentence that is generated without blocking the natural sentence generation path at the semantic root, and is distinguished by adding a “detail” pillow. In FIG. 12, a simplified semantic expression is shown in the first half and a detailed semantic expression is shown in the second half. In the simple expression, the natural sentence generation path is blocked and only the minimum necessary character string is displayed, so it is convenient to see the basic semantic expression. In most cases, a simplified expression is sufficient, but if you want to examine it more closely, you will see a detailed semantic expression.
図12に入力自然文の主旨を示したが、簡潔で分かりやすい。これはmw_17(一日、)とmw_18(騒音を)とmw_63(さえずりに)で自然文生成経路を遮断して、表現可の文字列を集めたものである。この場合の自然文生成は簡単である。意味根41のmw_23、 mw_39、mw_69の上にある意味フレーム40で、左から右に表現可の文字列をならべると自然文が得られる。主旨には、横結合記号の → を付記したが、これによって、主旨は三つの単文が横に結合された意味構造であることが分かる。図12の簡略単文には、文末に 横結合記号の「→」を持つ文と、文末記号の「。」 を持つ文と、他の文と縦結合する文がある。縦に結合する文には、意味の連結語となる根単語の前に縦結合記号「::」持っている。簡略単文では、単文のスロットに書き込まれた文字だけを示したので、木から枝葉を払ったような状態になり、意味構造が分かりやすい。簡略書込語は意味フレーム40のスロットに書き込まれた単語を枝葉を取り去った状態で示したものである。上の簡略単文の意味フレーム40のスロットに書き込まれた単語であるが、参考のために表示した。その他に簡略横結合語と簡略句を表示している。横結合語は単語が→で横に結合された意味構造を持つ。簡略横結合語1は 「スピードと→騒音を」であり、簡略横結合語2は「雲や→さえずりに」などである。簡略句1は「秋の::一日、」 、簡略句2は 「野鳥の::さえずり」 である。句では、助詞「の」がついているが、複合語と同じ意味構造である。縦結合語は自然文形成経路を遮断しない詳細縦結合語で示す。この文100では、縦結合語はないが、後で説明する図14で、詳細縦結合語を示す。 Although the gist of the input natural sentence is shown in FIG. 12, it is simple and easy to understand. This is a collection of expressible character strings by blocking the natural sentence generation path with mw_17 (one day), mw_18 (noise) and mw_63 (Twitter). Natural sentence generation in this case is simple. In the semantic frame 40 above the mw_23, mw_39, and mw_69 of the semantic root 41, a natural sentence can be obtained by arranging character strings that can be expressed from left to right. The main sign is appended with the horizontal link symbol →, which indicates that the main sign is a semantic structure in which three simple sentences are combined horizontally. The simple simple sentence in FIG. 12 includes a sentence having a horizontal join symbol “→” at the end of the sentence, a sentence having a sentence end symbol “.”, And a sentence that is vertically connected to other sentences. A sentence that is vertically combined has a vertical combination symbol “::” in front of the root word that is a connected word of meaning. In the simple simple sentence, only the characters written in the slot of the simple sentence are shown, so that the state is as if the branches and leaves are removed from the tree, and the semantic structure is easy to understand. The simple written word indicates the word written in the slot of the semantic frame 40 with the branches and leaves removed. The word written in the slot of the simplified simple sentence semantic frame 40 above is displayed for reference. In addition, simple horizontal combined words and simple phrases are displayed. Horizontally combined words have a semantic structure in which words are combined horizontally with →. Simplified horizontal combined word 1 is “speed and noise →”, and simplified horizontal combined word 2 is “cloud and → twitter”. Simplified phrase 1 is “Autumn :: One day”, and simplified phrase 2 is “Wild bird's :: twitter”. The phrase has the particle "no", but has the same semantic structure as the compound word. Vertically connected words are indicated by detailed vertically connected words that do not block the natural sentence formation path. In this sentence 100, there is no vertical combination word, but in FIG. 14 described later, a detailed vertical combination word is shown.
同図の「詳細意味表現」の文字列は、自然文生成経路を遮断しない場合に生成される文字列である。詳細単文1では意味根mw_23を、詳細単文2では意味根mw_39を、詳細単文3ではmw_71を、詳細単文4はmw_69を基点として、生成した自然文である。図11で、プログラムで生成した自然文生成経路を点線で示したが、上の意味構造を下の意味構造に埋め込んで、それを一列に並べるだけで、そのような自然文分が得られる。 The character string “detailed semantic expression” in the figure is a character string generated when the natural sentence generation path is not blocked. The detailed simple sentence 1 is a generated natural sentence based on the semantic root mw_23, the detailed simple sentence 2 is generated based on the semantic root mw_39, the detailed simple sentence 3 is generated based on mw_71, and the detailed simple sentence 4 is generated based on mw_69. In FIG. 11, the natural sentence generation path generated by the program is indicated by a dotted line. However, by embedding the upper semantic structure in the lower semantic structure and arranging them in a line, such a natural sentence portion can be obtained.
意味言語の原理は単純明快であるので、詳細単文から簡単に階層的な意味構造が次のように構築できる。一つの単語は根単語として扱われる。二つの単語で構成される複合語や句では、後の単語が根単語である。単語が横に結合される場合は、最後の単語が根単語である。単文の場合は、意味フレームと根単語で構成される。縦結合記号の::の後にある単語が根単語である。これらの根単語を文中で指示され結合記号に従って、その順序で結合させると自動的に図17に示すような階層的な意味構造になる。詳細単文4を例にして説明する。図11や図12の詳細単文4では、MW要素記号( )を省略したが、図17の詳細単文4では、どの単語がどの単語と結合をしているかを明示するために、自然文の中に「( )」、や「::」や「→」などの意味構造記号を付記した。詳細単文4から(流れる::雲や)を取り出して、下位に書き出す。(野鳥の::さえずりに)も下位に書き出す。(流れる::雲や)の「雲や」と(野鳥の::さえずりに)の「さえずりに」を同列に並べると、簡略横結合語2の(雲や→さえずりに)になる。これによって、「雲や」と「さえずりに」が横に結合された意味構造を構築していることが分かる。それより下位に(留め_たい。)という意味フレームを置き、その意味フレームに(雲や→さえずりに)の根単語の「さえずりに」と「心を」を書き込めば、簡略文4になる。これによって、「流れる雲や野鳥のさえずりに心を留めたい。」の「雲や」は「雲が流れる」の「雲」で、それが「野鳥のさえずりに」の「さえずりに」と横に結合し、(雲や→さえずりに)となり、その「さえずりに」が(さえずりに心を留めたい。)の「さえずりに」になっていることが一目瞭然に分かる。すなわち、「雲」は、「簡略文3」と関わり、簡略横結語2を通して、簡略文4と結合していることがわかる。この意味構造から「雲や」は「野鳥の」には、意味として全く関係がないことがわかる。このように、入力文を意味構造の上で表現すると、ある単語がどの単語と関わっていることがはっきりする。もう少し複雑な入力文で、意味構造と自然文との関係を説明する。 Since the principle of the semantic language is simple and clear, a hierarchical semantic structure can be easily constructed from a simple sentence as follows. One word is treated as the root word. In a compound word or phrase composed of two words, the subsequent word is the root word. If the words are combined horizontally, the last word is the root word. In the case of a simple sentence, it consists of a semantic frame and a root word. The word after the vertical joint symbol :: is the root word. When these root words are specified in the sentence and combined in the order in accordance with the combination symbol, a hierarchical semantic structure as shown in FIG. 17 is automatically obtained. The detailed simple sentence 4 will be described as an example. In the detailed simple sentence 4 in FIGS. 11 and 12, the MW element symbol () is omitted, but in the detailed simple sentence 4 in FIG. 17, in order to clearly indicate which word is combined with which word, The meaning structure symbols such as “()”, “::” and “→” are added to the table. Take out (flowing :: cloud) from the detailed single sentence 4 and write it down. (Wild Bird's :: Twitter) is also written down. When “clouds” of (flowing :: clouds) and “twitters” of (wild birds :: twiddles) are arranged in the same row, it becomes the simplified horizontal combined word 2 (clouds and → twiddles). As a result, it can be seen that “clouds” and “twitter” are constructed in a semantic structure. If you place a meaning frame (same_want) below it, and write the words “twitter” and “heart” of the root words (in the cloud and → twitter) in that meaning frame, the simplified sentence 4 is obtained. As a result, “clouds” in “I want to keep in mind the flowing clouds and twittering of wild birds” are “clouds” in “flowing clouds”, which is next to “twittering in the wild birds” It becomes clear that it is connected (to clouds and → twitter), and that “twitter” is “twitter” (we want to keep in mind twitter). That is, it can be seen that “cloud” is related to “simplified sentence 3” and is combined with simplified sentence 4 through simplified horizontal composition 2. From this semantic structure, it can be seen that “clouds” have nothing to do with “wild birds”. In this way, when an input sentence is expressed on a semantic structure, it becomes clear that a word is associated with which word. Explain the relationship between semantic structures and natural sentences with a slightly more complicated input sentence.
入力文200は「12日の東京株式市場では、経営再建の行方に注目が集まっている日本航空株に売り注文が殺到し、取引が成立しないまま、同日の日航株の値幅制限の下限となる前週末比30円安の37円まで気配値が下落している。」 の意味構造とその自然文生成経路を図13に示す。図13において、最下層に簡略単文2と簡略単文3と簡略単文5が横に並び、次のように→で結合されている。すなわち、
(株に注文が殺到し、)→(取引が成立しない:まま)→(37円まで値が下落して_いる。)
となるが、これらの簡略単文は、mw_83、 mw_84、 mw_24、 mw_25で自然文生成経路を遮断して、生成された単文である。これが本入力文の主旨になる。
The input sentence 200 says, “In the Tokyo stock market on the 12th, Japan Airlines stocks that are attracting attention on the future of management reconstruction are inundated with sell orders, and the price limit of Nikko shares on the same day will be the lower limit without a successful transaction. The quotes have dropped to 37 yen, which is 30 yen lower than the previous weekend. " In FIG. 13, the simple simple sentence 2, the simple simple sentence 3, and the simple simple sentence 5 are arranged side by side in the lowermost layer, and are combined with → as follows. That is,
(The stock is inundated with orders.) → (Transaction is not successful: Remain) → (The price has dropped to 37 yen.)
However, these simple simple sentences are simple sentences generated by blocking the natural sentence generation path with mw_83, mw_84, mw_24, and mw_25. This is the main point of this input sentence.
本発明では、このように主旨が簡単に得られる。まずこの文から、入力文は書き手の意図を正確に反映した文かどうかが判断できる。簡略単文の項では、このように横に結合した文だけでなく、簡略単文1と簡略単文4などのように、縦に結合した簡略単文も示した。簡略単文1と簡略単文2は根単語の「株に」で縦に結合されるので、図13にも示されているが、意味構造は表18のようになる。
表18
(市場では、行方に注目が集まっている::*株に)ps_18
(株に注文が殺到し、)ps_11
同じように、簡略単文4は簡略単文5と「37円まで」で縦に結合されているので、意味構造は表19のようになる。
表19
(下限となる::*37円まで)ps_22
(37円まで値が下落している。)ps_4
根単語の「株に」と「37円まで」は自然文を生成するときに重複するので、上にある意味根の文字列に「*」をつけて表現禁止にすると、表20のような文になる。
表20
「市場では、行方に注目が集まっている::株に注文が殺到し、」
「下限となる::37円まで値が下落している。」
「::」の後ろにある根単語で二つの文が縦に結合されていることがわかる。簡略単文は、単文と直接関係がない文字列が削除されているので、詳細単文より分かり易くなる。図14では、簡略単文のスロットに書き込まれた文字列を簡略書込語と簡略句として示した。図14の詳細書込語1の「12日の::東京::株式::市場では」の意味構造は、図13のmw_144から上に伸びている自然文生成経路をたどると、分かる。「東京」は「株式」に係り、「株式」は「市場では」に係り、「12日の」は「市場では」に係っていることが分かる。つまり、「12日の」は「東京」に係らずに、「市場では」に係っていることが明確である。詳細書込語8の(同日の::日航::株の::値::幅::制限の::下限となる::前週末::比::30::円安の::37円まで)の意味構造は図13のmw_24から上に伸びる自然文生成経路をたどれば分かる。mw_214の「制限の」はmw_209の「株の」とmw111の「幅」とmw_238の「下限と」に係り、mw_111の「幅」はmw_103の「値」とmw_116の「制限の」に係っている。「円安」は「比」と「30」と「37円まで」に係っている。このように言葉で表現すると、複雑であるが、図13の意味構造では簡単明瞭である。同図から「円安」は「前週末」には関係なく、「前週末」の「比」に関係していることが分かる。このことは、図15の詳細縦結合語9の「30::円安の」と詳細縦結合語12の「前週末::比::円安の」と図14の簡略句6の「円安の::37円まで」からでも確認できる。
In the present invention, the gist can be easily obtained as described above. First, from this sentence, it can be determined whether the input sentence accurately reflects the intention of the writer. In the section of simple simple sentences, not only sentences that are horizontally coupled as described above, but also simple simple sentences that are vertically coupled, such as simple single sentence 1 and simple single sentence 4, are shown. Simplified simple sentence 1 and simplified simple sentence 2 are vertically connected by the root word “to stock”, and therefore, as shown in FIG. 13, the semantic structure is as shown in Table 18.
Table 18
(In the market, whereabouts are attracting attention :: * to stocks) ps_18
Ps_11
Similarly, the simple simple sentence 4 and the simple simple sentence 5 are vertically coupled with “up to 37 yen”, so the semantic structure is as shown in Table 19.
Table 19
(Lower limit: Up to * 37 yen) ps_22
(The price has dropped to 37 yen.) Ps_4
Since the root words "stock" and "up to 37 yen" are duplicated when generating a natural sentence, "*" is added to the character string of the upper semantic root and expression is prohibited. Become a sentence.
Table 20
“In the market, attention is focused on whereabouts :: stocks are inundated with orders,”
“Lower limit: The value has dropped to 37 yen.”
It can be seen that the root sentence behind “::” is two sentences vertically connected. The simple simple sentence is easier to understand than the detailed simple sentence because the character string not directly related to the simple sentence is deleted. In FIG. 14, the character string written in the slot of the simple simple sentence is shown as a simple writing word and a simple phrase. The semantic structure of “12th :: Tokyo :: stocks :: in the market” of the detailed writing word 1 in FIG. 14 can be understood by following the natural sentence generation path extending upward from mw_144 in FIG. It can be seen that “Tokyo” relates to “stock”, “stock” relates to “in the market”, and “12 days” relates to “in the market”. That is, it is clear that “12th day” is related to “in the market”, not related to “Tokyo”. Detail writing word 8 (Same day :: Nikko :: Stock :: Value :: Width :: Limit :: Lower limit :: Last weekend :: Ratio :: 30 :: Yen depreciation :: 37 yen Can be understood by following the natural sentence generation path extending upward from mw_24 in FIG. The “limit” of mw_214 relates to the “stock” of mw_209, the “width” of mw111 and the “lower limit” of mw_238, and the “width” of mw_111 relates to the “value” of mw_103 and the “limit” of mw_116. ing. “Yen depreciation” is related to “ratio”, “30” and “up to 37 yen”. In this way, it is complicated to express in words, but it is easy and clear in the semantic structure of FIG. From the figure, it can be seen that “yen depreciation” is not related to “previous weekend” but related to “ratio” of “previous weekend”. This means that “30 :: Yen depreciation” of the detailed vertical combination word 9 in FIG. 15 and “Last weekend :: ratio :: Yen depreciation” of the detailed vertical combination word 12 and “Yen of simplification 6 of FIG. It can be confirmed even from “An :: Up to 37 yen”.
以上述べたように、入力文を意味構造に変換して、その意味構造を細部に分解して、それをベースにして意味構造を再構築すると図11や図13で示すような意味構造が得られる。また、それぞれの意味構造から自然文を生成すると、図12や図14や図15で示す自然文が得られる。これらの意味自然文から、入力自然文の意味を細部にわたって、検証することができる。文中の単語は、漠然として全体の意味に関与しているのではなく、明確な意味構造で規定される意味が組み合わされて頑健は意味が構築されている。このことから、入力した文の意味を示すと、書き手が意図している意味が精確に表現されているかどうかが分かるので、書き手が正しい文を作成することを支援できる。 As described above, when the input sentence is converted into a semantic structure, the semantic structure is decomposed into details, and the semantic structure is reconstructed based on the semantic structure, the semantic structure as shown in FIGS. 11 and 13 is obtained. It is done. When natural sentences are generated from the respective semantic structures, the natural sentences shown in FIGS. 12, 14, and 15 are obtained. From these semantic natural sentences, the meaning of the input natural sentence can be verified in detail. The words in the sentence are not vaguely related to the whole meaning, but the meaning defined by the clear semantic structure is combined to make the meaning robust. From this, if the meaning of the input sentence is shown, it can be determined whether or not the meaning intended by the writer is accurately expressed, so that the writer can assist in creating a correct sentence.
機械翻訳を行う場合、書き手が意図した正確な文が作成されていることが前提である。悪文を翻訳しても、悪文は悪文である。まず、翻訳するまえに、日本語なら日本語で正しい文を作成することが重要である。また賠償責任などが発生する公的な文章では、意味が正確な文を作成することが大切である。また、文章を作成しながら、知的なトレーニングを行うのに利用できる。 When performing machine translation, it is assumed that the exact sentence intended by the writer has been created. Even if a bad sentence is translated, the bad sentence is a bad sentence. First of all, it is important to create correct sentences in Japanese before translation. In addition, it is important to create a sentence that has an accurate meaning in official sentences that cause liability. It can also be used for intellectual training while creating sentences.
1 中央制御装置、
2 内部メモリー、
3 表示装置、
4 外部記憶装置、
5 入力装置、
6 メモリーハブ、
7 IOハブ、
8 バス、
20 自然文分割プログラム、
21 形態素解析プログラム、
22 構文解析プログラム、
23 文節意味構築プログラム、
24 形態素意味構築プログラム、
25 自然文生成プログラム、
30 MW要素、
31 PS要素
32 意味根収集要素、 Bun_ixrt[Bun_num]
40 意味フレーム、
41 意味根、
42 意味構造記号、( ),[ ],::,→
50 MW結合要素、 Prc_mw[].U,L,B,N
Prc_mw[].FLG
51 MW文字列要素、Prc_mw[].moji_jar[],moji[]
moji_jcs[], moji_ronri[]
52 MW表現可否要素、 Prc_mw[].KAK
53 MW経路遮断要素、 Prc_mw[].KAK
55 PS結合要素 Prc_ps[].A,T,S,V,W.O.P,L
56 自然文生成経路
57 部分意味構造
58 全体意味構造
1 Central control unit,
2 internal memory,
3 display device,
4 external storage device,
5 input devices,
6 Memory hub,
7 IO hub,
8 Bus,
20 Natural sentence division program,
21 Morphological analysis program,
22 syntax analysis program,
23 phrase meaning construction program,
24 Morphological semantic construction program,
25 Natural sentence generation program,
30 MW element,
31 PS element 32 Semantic root collection element, Bun_ixrt [Bun_num]
40 meaning frames,
41 Meaning root,
42 Semantic structure symbols, (), [], ::: →
50 MW coupling element, Prc_mw []. U, L, B, N
Prc_mw []. FLG
51 MW character string element, Prc_mw []. moji_jar [], moji []
moji_jcs [], moji_ronri []
52 MW representation availability element, Prc_mw []. KAK
53 MW path blocking element, Prc_mw []. KAK
55 PS coupling element Prc_ps []. A, T, S, V, W.M. O. P, L
56 Natural Sentence Generation Path 57 Partial Semantic Structure 58 Whole Semantic Structure
Claims (2)
MW要素30は、少なくとも、上下左右の結合相手の要素番号やMW要素かPS要素の種類を格納するMW結合要素50及び、形態素解析結果及び文節解析結果で得られた文字列などを格納するMW文字列要素51及び、文字列の表現の可否を制御する情報を格納するMW表現可否要素52及び、自然文生成経路を遮断するかどうかを制御する情報を格納するMW経路遮断要素53を持ち、
PS要素31は、単数及び複数の上に縦結合するMW要素30と下に縦結合するMW要素30の番号を格納するPS結合要素55を持ち、
意味フレームは、単数及び複数のMW要素と単数及び複数のPS要素が結合して構成され
単数及び複数の意味フレームや単数及び複数のMW要素が縦横に結合されて意味構造が構築され、意味構造の最下層のMW要素を、これらの意味構造を結合する意味根41とし、当該意味根41を意味根収集要素32に格納し、
中央制御装置1によって、形態素解析プログラム21を内部メモリ2に取り出し、当該形態素解析プログラム21によって、形態素解析を行い、形態素解析結果を得て、当該形態素解析結果に構文解析プログラム22によって、構文解析規則を適応して構文解析結果を得て、
形態素意味構築プログラム24によって、当該形態素解析結果に形態素意味構築規則を適用して、当該規則が指定するプログラムによって、MW要素や意味フレームを結合させて部分的な意味構造を構築し、同時に意味解析対象になっている文字列をMW文字列要素51に格納し、また既に構築した既存の意味構造と結合関係にある意味根で当該既存意味構造と結合させて、意味構造を拡張するともに、当該意味根を意味根収集要素32に格納し、
さらに文節意味構築プログラム23によって、当該構文解析結果で得られる文節解析結果に文節意味構築規則を適用して、当該規則で指定されたプログラムに従って、MW要素や意味フレームを結合させて部分的な意味構造を構築し、同時に意味解析対象になっている文字列をMW文字列要素51に格納し、
既に作成した既存の意味構造と結合関係にある意味構造を意味根で当該意味構造を結合させて、意味構造を構築するとともに、当該意味根を意味根要素32に格納し、このような処理を繰り返して、意味構造上に文字列が書き込まれた意味構造を構築し、
MW表現可否要素52及びMW経路遮断要素53に基づいて自然文生成経路を作成し、入力自然文の全体的な意味をあらわす自然文を生成し、或いは自然文生成経路を遮断させて部分的な意味構造に分割し、分割した意味構造から自然文生成を生成し、入力自然文の意味をを多面的に表示させて、入力自然文を細部にわたって検証し、これに基づき正確な意味を表現する自然文を作成することを支援する文作支援自然文処理法。 A central control device 1 connected by a bus 8 with a memory hub 6 and an IO hub 7 as a relay device, an internal memory 2, an external storage device 4, a display device 3, and an input device 5, and a Japanese dictionary and morphological analysis Rules such as rules, syntax analysis rules, morpheme semantic construction rules, clause semantic construction rules, dictionary search programs, morphological analysis programs, syntax analysis programs, semantic range dividing programs of input natural sentences, morphological semantic construction programs, clause semantic construction In a natural language processing apparatus that stores programs such as programs and natural sentence generation programs in the external storage device 4,
The MW element 30 stores at least the MW combination element 50 that stores the element number of the upper / lower / left / right combination partner and the type of the MW element or the PS element, and the MW that stores the character string obtained from the morphological analysis result and the phrase analysis result. A character string element 51, an MW expression availability element 52 for storing information for controlling the possibility of expression of the character string, and an MW path blocking element 53 for storing information for controlling whether to block the natural sentence generation path,
The PS element 31 has a single and a plurality of MW elements 30 that are vertically coupled above and a PS coupling element 55 that stores the numbers of the MW elements 30 that are vertically coupled below.
Semantic frames are composed of single and multiple MW elements and single and multiple PS elements combined, and single and multiple semantic frames and single and multiple MW elements are combined vertically and horizontally to construct a semantic structure. The MW element at the lowest layer is a semantic root 41 that combines these semantic structures, and the semantic root 41 is stored in the semantic root collection element 32.
The central control unit 1 takes out the morpheme analysis program 21 into the internal memory 2, performs the morpheme analysis by the morpheme analysis program 21, obtains the morpheme analysis result, and the parse analysis program 22 To get the parsing result
The morpheme semantic construction program 24 applies the morpheme semantic construction rules to the morpheme analysis results, and the program specified by the rules combines the MW elements and the semantic frames to construct partial semantic structures, and simultaneously performs the semantic analysis. The target character string is stored in the MW character string element 51, and the semantic structure is expanded by combining the existing semantic structure with the existing semantic structure having a connection relationship with the existing semantic structure. Store the semantic root in the semantic root collection element 32;
Further, the phrase semantic construction program 23 applies a phrase semantic construction rule to the phrase analysis result obtained by the syntax analysis result, and combines the MW elements and the semantic frames according to the program specified by the rule to obtain partial semantics. Constructing the structure, and simultaneously storing the character string subject to semantic analysis in the MW character string element 51,
The semantic structure is combined with the semantic structure that has already been created and connected with the semantic structure to construct the semantic structure, and the semantic root is stored in the semantic root element 32. Repeat to build a semantic structure with strings written on the semantic structure,
A natural sentence generation path is created based on the MW representation availability element 52 and the MW path blocking element 53, and a natural sentence representing the entire meaning of the input natural sentence is generated, or the natural sentence generation path is interrupted to partially Divide into semantic structures, generate natural sentence generation from the divided semantic structures, display the meaning of the input natural sentence in multiple directions, verify the input natural sentence in detail, and express the correct meaning based on this A sentence-supporting natural sentence processing method that supports the creation of natural sentences.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011121493A JP2012248142A (en) | 2011-05-31 | 2011-05-31 | Sentence creation support natural sentence processing method for displaying meaning in detail of input sentence |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011121493A JP2012248142A (en) | 2011-05-31 | 2011-05-31 | Sentence creation support natural sentence processing method for displaying meaning in detail of input sentence |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012248142A true JP2012248142A (en) | 2012-12-13 |
Family
ID=47468499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011121493A Withdrawn JP2012248142A (en) | 2011-05-31 | 2011-05-31 | Sentence creation support natural sentence processing method for displaying meaning in detail of input sentence |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012248142A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015506511A (en) * | 2011-12-27 | 2015-03-02 | コーニンクレッカ フィリップス エヌ ヴェ | Text analysis system |
CN110046491A (en) * | 2019-03-05 | 2019-07-23 | 北京达佳互联信息技术有限公司 | Method of calibration, device, electronic equipment and the storage medium of close guarantor's problem |
-
2011
- 2011-05-31 JP JP2011121493A patent/JP2012248142A/en not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015506511A (en) * | 2011-12-27 | 2015-03-02 | コーニンクレッカ フィリップス エヌ ヴェ | Text analysis system |
CN110046491A (en) * | 2019-03-05 | 2019-07-23 | 北京达佳互联信息技术有限公司 | Method of calibration, device, electronic equipment and the storage medium of close guarantor's problem |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Im Walde | Experiments on the automatic induction of German semantic verb classes | |
Nakov | On the interpretation of noun compounds: Syntax, semantics, and entailment | |
Arista | Recursivity, derivational depth and the search for Old English lexical primes | |
US20170286408A1 (en) | Sentence creation system | |
CN115048944B (en) | Open domain dialogue reply method and system based on theme enhancement | |
US20120124467A1 (en) | Method for automatically generating descriptive headings for a text element | |
McShane | Subject ellipsis in Russian and Polish | |
Debusmann | An introduction to dependency grammar | |
Archangeli et al. | Emergent phonology (Volume 7) | |
Kipka | Slavic aspect and its implications | |
JP2012248142A (en) | Sentence creation support natural sentence processing method for displaying meaning in detail of input sentence | |
Brinton | English historical linguistics: approaches and perspectives | |
Wilson | Toward automatic processing of English metalanguage | |
Lohar | A Grammar of Bhojpuri | |
Kleenankandy | Implementation of Sandhi-rule based compound word generator for Malayalam | |
Yang et al. | A dynamic account of verb doubling cleft construction in Chinese | |
Nirmal et al. | A Context-Free Grammar for Parsing Manipuri Language | |
Fan et al. | Constructivist tokenization for English | |
Roland | Literary Heterolingualism in Contemporary Nigerian Literature and its Translation into French | |
Goh et al. | Automatic dominant character identification in fables based on verb analysis–Empirical study on the impact of anaphora resolution | |
Pustejovsky et al. | Annotation of compositional operations with glml | |
Deklu | Ewe vowel harmony: implications for theories of underspecification | |
Zhang et al. | VV-Couplet: An open source Chinese couplet generation system | |
Newbold | Variable affix ordering in Kuna | |
Zheng | Negation in Longxi Qiang |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20140805 |