JP4437778B2 - Vertical relationship determination method, vertical relationship determination device, vertical relationship determination program, and recording medium - Google Patents
Vertical relationship determination method, vertical relationship determination device, vertical relationship determination program, and recording medium Download PDFInfo
- Publication number
- JP4437778B2 JP4437778B2 JP2005292073A JP2005292073A JP4437778B2 JP 4437778 B2 JP4437778 B2 JP 4437778B2 JP 2005292073 A JP2005292073 A JP 2005292073A JP 2005292073 A JP2005292073 A JP 2005292073A JP 4437778 B2 JP4437778 B2 JP 4437778B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- relationship
- honorific
- sentence
- subject
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
本発明は、例えば機械翻訳や情報検索を行う自然言語処理システムに関するものである。 The present invention relates to a natural language processing system that performs machine translation and information retrieval, for example.
日本語や英語を始めとする各種言語で記述される自然言語は、往々にして抽象的で曖昧性が高い性質を持つが、文章を数学的に扱うことにより、コンピュータ処理を行うことができる。この結果、機械翻訳システム、対話システム、検索システム、質問応答システムなど、様々な自然言語処理システムが実現されている。 Natural languages described in various languages such as Japanese and English often have abstract and highly ambiguous properties, but they can be processed computerically by handling sentences mathematically. As a result, various natural language processing systems such as a machine translation system, a dialogue system, a search system, and a question answering system are realized.
ところで、自然言語、特に日本語では尊敬語、謙譲語および丁寧語などからなる敬語が用いられるが、それらの敬語のうち何れを用いるかは絶対的なものではなく、文章に関連する人間の社会的地位、年齢、話者の主観的な親密度、性差等の相対的な尺度により決定される。一例として、「部長が来た」という文章に対して敬語を用いる場合について説明する。例えば、話者が社内の同僚と話すときには、尊敬語を用いて「部長がいらした」となる。また、話者がその同僚に敬意を示すときには、丁寧語も用いて「部長がいらっしゃいました」となる。さらに、話者が顧客に話すときには、謙譲語と丁寧語を用いて「部長が参りました」となる。このような敬語の使い分けは、人間であれば、自身が有する一般常識等に基づいて行うことも可能であるが、機械では、所定のアルゴリズムに基づいて行われる。したがって、自然言語処理システムにおいて正しい敬語の解釈と使い分けをするには、文章に関連する人間の上下関係を判定するアルゴリズムが必要である。このため断片的ではあるが、敬語用法を考慮した提案がなされている(例えば、非特許文献1,2参照。)。
By the way, honorifics consisting of respected words, humility words, polite words, etc. are used in natural language, especially Japanese, but it is not absolute which one of those honorific words is used, and human society related to sentences It is determined by relative measures such as target status, age, speaker's subjective familiarity, and gender. As an example, a case where honorific words are used for the sentence “A manager has come” will be described. For example, when a speaker speaks with an in-house colleague, a respected word is used to say “A manager has come”. Also, when the speaker shows respect for his colleague, the polite language is used to say, “The manager has come.” In addition, when the speaker speaks to the customer, the head of the department has come, using humility and polite language. Such honorifics can be used properly based on general common sense or the like of a person, but in a machine, it is performed based on a predetermined algorithm. Therefore, in order to correctly interpret and properly use honorifics in a natural language processing system, an algorithm for determining the human hierarchical relationship related to sentences is required. For this reason, although it is fragmentary, the proposal which considered honorific usage is made (for example, refer
しかしながら、従来の自然言語処理システムでは、対話形式の文、または、一人称および二人称の登場人物を中心としており、語彙のみからの絶対的かつ断片的な敬語情報を反映するのみで、文に関連する人間の上下関係を相対的に正しく判定することができず、結果として、処理精度向上に生かされていなかった。 However, the conventional natural language processing system focuses on interactive sentences or first-person and second-person characters, and only reflects absolute and fragmentary honorific information from only the vocabulary, and is related to sentences. As a result, it has not been possible to improve the processing accuracy because the human vertical relations cannot be correctly determined.
そこで、本願発明は上述したような課題を解決するためになされたものであり、文に関連する人間の上下関係を相対的に判定することができる上下関係判定方法、上下関係判定装置、上下関係判定プログラム、および、記録媒体を提供することを目的とする。 Accordingly, the present invention has been made to solve the above-described problems, and a hierarchical relationship determination method, a hierarchical relationship determination device, and a vertical relationship that can relatively determine the human hierarchical relationship related to a sentence. An object is to provide a determination program and a recording medium.
上述したような課題を解消するため、本発明にかかる上下関係判定方法は、電子化された入力文を解析し、この入力文の話者と、この話者の相手と、前記入力文が話題としている対象者との3者からなる指示対象の上限関係を判定する上下関係判定方法であって、解析部が、前記入力文に対して形態素解析と構文解析を行う解析ステップと、検出部が、敬語辞書を参照して、前記解析部の解析結果から敬語および、文における主語と目的語との関係を意味的に制約する動詞を検出する検出ステップと、抽出部が、前記解析部の解析結果から前記指示対象となり得る具体的な名詞を抽出する抽出ステップと、指示対象特定部が、前記抽出部により抽出された名詞が、一人称の場合には前記話者、二人称の場合には前記相手、これら以外の場合には前記対象者であると特定する特定ステップと、敬語判断部が、前記検出部が検出した敬語が尊敬表現の場合には主語に対応する指示対象が他の指示対象よりも上位と判断し、前記検出部が検出した敬語が謙譲表現の場合には主語に対応する指示対象が他の指示対象よりも下位と判断し、前記検出部が検出した文における主語と目的語との関係を意味的に制約する動詞が尊敬表現の場合には主語に対応する指示対象が他の指示対象よりも上位と判断し、前記検出部が検出した文における主語と目的語との関係を意味的に制約する動詞が謙譲表現の場合には主語に対応する指示対象が他の指示対象よりも下位と判断し、前記検出部により丁寧表現の敬語が検出されない場合には相手は話者と同等または話者よりも下位と判断することにより、前記指示対象の上下関係を判断する敬語判断ステップとを実行することを特徴とする。 In order to solve the above-described problems, the hierarchical relation determination method according to the present invention analyzes a digitized input sentence, and talks about the speaker of the input sentence, the partner of the speaker, and the input sentence. The upper and lower relationship determination method for determining an upper limit relationship of an instruction target consisting of three persons with a target person , an analysis step in which an analysis unit performs morphological analysis and syntax analysis on the input sentence, and a detection unit , Referring to the honorific dictionary, a detection step of detecting a honorific and a verb that semantically restricts the relationship between the subject and the object in the sentence from the analysis result of the analysis unit, and the extraction unit analyzes the analysis unit An extraction step for extracting a specific noun that can be the instruction target from the result, and the instruction target specifying unit, the noun extracted by the extraction unit is the speaker when the first person is first person, and the partner when the second person is the second person In other cases The specific step of identifying the target person, and the honorific determination unit determines that the instruction object corresponding to the subject is higher than the other instruction objects when the honorific word detected by the detection unit is a respect expression, When the honorific detected by the detection unit is a humility expression, it is determined that the instruction object corresponding to the subject is lower than the other instruction objects, and the relationship between the subject and the object in the sentence detected by the detection unit is semantically A verb that semantically constrains the relationship between the subject and the object in the sentence detected by the detection unit, when the restricting verb is a respected expression, the instruction object corresponding to the subject is determined to be higher than the other instruction objects Is a modest expression, the instruction object corresponding to the subject is determined to be lower than the other instruction objects, and if the polite expression of the polite expression is not detected by the detection unit, the opponent is equal to the speaker or more than the speaker By judging the subordinate, Perform a honorific determining step of determining a vertical relationship dictates characterized Rukoto.
上記上下関係判定方法において、敬語判断部が敬語から指示対象の上下関係を検出できない場合、ランク判断部が、各名詞間の社会的、年齢的または世代的な上下関係を記録したデータベースであるランクDBを参照して指示対象の上下関係の判断を行うランク判断ステップをさらに実行するようにしてもよい。 In the above-described hierarchical relationship determination method, when the honorific judgment unit cannot detect the hierarchical relationship of the target object from the honorific, the rank is a database that records the social, age, or generational hierarchical relationship between the nouns. You may make it perform further the rank determination step which refers to DB and determines the hierarchical relationship of an instruction | indication object .
上記上下関係判定方法において、敬語判断部が敬語から指示対象の上下関係を検出した場合、ランク判断部が、各名詞間の社会的、年齢的または世代的な上下関係を記録したデータベースであるランクDBを参照して指示対象の上下関係の確認を行うランク確認ステップをさらに実行するようにしてもよい。このランク確認ステップは、ランクDBには含まれる単語により互いに関連付けられたカテゴリーが異なる複数の上下関係が記録されており、ランク判断部が複数のカテゴリーを参照して指示対象の上下関係の確認を行うようにしてもよい。 In the above-described hierarchical relationship determination method, when the honorific determination unit detects the hierarchical relationship of the target object from honorifics, the rank determination unit is a database that records the social, age, or generational hierarchical relationship between each noun. You may make it further perform the rank confirmation step which confirms the hierarchical relationship of an instruction | indication object with reference to DB . In this rank confirmation step, a plurality of hierarchical relationships with different categories associated with each other are recorded in the rank DB, and the rank determination unit refers to the plurality of categories to confirm the hierarchical relationship of the instruction target. You may make it perform.
また、上記上下関係判定方法において、特定ステップは、抽出部により入力文から主語が抽出されない場合、話者を主語として特定するようにしてもよい。 In the above hierarchical relationship determining method, specifying step, if the subject from the input sentence by the extraction unit is not extracted, it may be specific speaker as the subject.
また、本発明にかかる上下関係判定装置は、電子化された入力文を解析し、この入力文の話者と、この話者の相手と、入力文が話題としている対象者との3者からなる指示対象の上限関係を判定する上下関係判定装置であって、入力文に対して形態素解析と構文解析を行う解析部と、敬語辞書を参照して、解析部の解析結果から敬語および、文における主語と目的語との関係を意味的に制約する動詞を検出する検出部と、解析部の解析結果から指示対象となり得る具体的な名詞を抽出する抽出部と、抽出部により抽出された名詞が、一人称の場合には話者、二人称の場合には相手、これら以外の場合には対象者であると特定する指示対象特定部と、検出部が検出した敬語が尊敬表現の場合には主語に対応する指示対象が他の指示対象よりも上位と判断し、検出部が検出した敬語が謙譲表現の場合には主語に対応する指示対象が他の指示対象よりも下位と判断し、検出部が検出した文における主語と目的語との関係を意味的に制約する動詞が尊敬表現の主語に対応する指示対象が他の指示対象よりも上位と判断し、検出部が検出した文における主語と目的語との関係を意味的に制約する動詞が謙譲表現の場合には主語に対応する指示対象が他の指示対象よりも下位と判断し、検出部により丁寧表現の敬語が検出されない場合には相手は話者と同等または話者よりも下位と判断することにより、指示対象の上下関係を判断する敬語判断部とを備えることを特徴とする。 Further, the hierarchical relationship determination device according to the present invention analyzes an input sentence that has been digitized, and includes three persons: a speaker of the input sentence, a partner of the speaker, and a target person who is talking about the input sentence. An upper / lower relationship determination device for determining an upper limit relationship of an instruction target, an analysis unit that performs morphological analysis and syntax analysis on an input sentence, and an honorific dictionary and sentence from an analysis result of the analysis unit with reference to an honorific dictionary That detects verbs that semantically constrain the relationship between the subject and object in the database, an extraction unit that extracts specific nouns that can be directed from the analysis results of the analysis unit, and nouns extracted by the extraction unit However, in the case of the first person, the speaker, in the case of the second person, the other party, in other cases the target object specifying part that specifies the target person, and the honorific expression detected by the detection part is the subject The target object corresponding to is higher than the other target objects. Determines that the detection unit is determined to lower than the referent otherwise indicated object corresponding to the subject in the case of honorific is humility expression detected, the relationship between the subject and the object in the sentence detecting unit detects The verb that constrains the relationship between the subject and the object in the sentence detected by the detection unit is determined that the instruction target whose semantically constrained verb corresponds to the subject of the respected expression is higher than the other target objects. In the case of humble expression, the instruction object corresponding to the subject is determined to be lower than the other instruction objects, and if the polite expression of the polite expression is not detected by the detection unit, the partner is equivalent to the speaker or lower than the speaker. And a honorific determination unit that determines the vertical relationship of the instruction target.
また、本発明にかかる上下関係判定プログラムは、コンピュータを、上記上下関係判定装置の各手段として機能させることを特徴とする。 The hierarchical relationship determining program according to the present invention causes a computer to function as each unit of the hierarchical relationship determining device .
また、本発明にかかる記録媒体は、上記上下関係判定プログラムが記録されたことを特徴とする。
The recording medium according to the present invention is characterized in that the above-described hierarchical relationship determination program is recorded.
本発明によれば、電子化された文を解析し、話者、相手、および、対象者の3者を特定し、この特定された3者間の上下関係を判定することにより、話者、相手、および、対象者という文に関連するより具体的な人間の相対的な上下関係を判定することができる。 According to the present invention, an electronic sentence is analyzed, a speaker, a partner, and a target person are identified, and a hierarchical relationship between the identified three parties is determined. It is possible to determine a more specific human relative vertical relationship related to the sentence of the partner and the subject.
[第1の実施の形態]
以下、図面を参照して、本発明の第1の実施の形態について図面を参照して説明する。図1は、本実施の形態における上下関係判定装置の構成を示すブロック図である。上下関係検出装置1は、入力部11と、解析部12と、文法辞書13と、検出部14と、敬語辞書15と、抽出部16と、判定部17と、ランクDB(Data Base)18と、内外関係DB19とから構成される。このような上下関係検出装置1は、CPU等の演算装置と、メモリ、HDD(Hard Disc Drive)等の記憶装置と、キーボード、マウス、ポインティングデバイス、ボタン、タッチパネル等の外部から情報の入力を検出する入力装置と、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)等の通信回線を介して各種情報の送受信を行うI/F装置と、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)またはFED(Field Emission Display)等の表示装置を備えたコンピュータと、このコンピュータにインストールされたプログラムとから構成される。すなわちハードウェア装置とソフトウェアとが協働することによって、上記のハードウェア資源がプログラムによって制御され、上述した入力部11、解析部12、文法辞書13、検出部14、敬語辞書15、抽出部16、判定部17およびランクDB18が実現される。なお、上記プログラムは、フレキシブルディスク、CD−ROM、DVD−ROM、メモリカードなどの記録媒体に記録された状態で提供されるようにしてもよい。
[First Embodiment]
Hereinafter, a first embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing the configuration of the vertical relationship determination apparatus according to the present embodiment. The hierarchical
入力部11は、外部から入力される文章(以下、「入力文」と呼ぶ。)を受け付けるインターフェース装置である。
The
解析部12は、入力部11に入力された入力文に対して、文法辞書13に記憶された文法規則に基づいて形態素解析する演算処理部である。
The
文法辞書13は、対象とする自然言語の文法規則が登録されているデータベースである。
The
検出部14は、敬語辞書15に基づいて、解析部12により形態素解析が行われた入力文から敬語を検出する演算処理部である。
The
敬語辞書15は、図2に示すように、「述語」、「文型」、「動詞/サ変名詞の意味的制約」、「名詞」の項目毎に対応する敬語を登録したデータベースである。なお、「尊敬表現」とは、従来の国語文法に規定されるような「尊敬語」や文型や動詞またはサ変名詞の意味的制約等を含むものである。また、「謙譲表現」とは、従来の国語文法に規定されるような「尊敬語」や文型や動詞またはサ変名詞の意味的制約等を含むものである。また、「丁寧表現」とは、従来の国語文法に規定される「丁寧語」等を含むものである。このような敬語辞書15は予め作成される。
As shown in FIG. 2, the
一例として、「述語」の場合、「動詞」、「助動詞」、「サ変名詞」、「形容詞」、「形容動詞」の各単語の基本形と、この基本形となる単語の対応する「尊敬表現」、「謙譲表現」、「丁寧表現」が記録されている。
具体的には、「動詞」は「尊敬表現」や「謙譲表現」にはなるが、「丁寧表現」にはならない。例えば、動詞の基本形「言う」は、「尊敬表現」では「おっしゃる」になり、「謙譲表現」では「申す」になる。
また、「助動詞」は、「謙譲表現」にはなり得ない。例えば、助動詞の基本形「だ」は、「丁寧表現」では「です、ます」になる。また、助動詞「られる」は「尊敬表現」に該当する。
また、「サ変名詞」は、例えば、基本形「研究」,「訪問」は、「尊敬表現」ではそれぞれ「ご研究」,「ご訪問」になる。また、語彙や文脈によって、例えば基本形「報告」は「ご報告」となり、「尊敬表現」および「謙譲表現」の両方の解釈が可能となる。
また、「形容詞」は、例えば、基本形「早い」は、「尊敬表現」では「お早い」になる。
また、「形容動詞」は、例えば、基本形「元気」は、「尊敬表現」では「お元気」になる。
なお、各単語は、主語が二人称のとき「尊敬表現」と「丁寧表現」の両方になり得る。
As an example, in the case of “predicate”, the basic form of each word of “verb”, “auxiliary verb”, “sa variable noun”, “adjective”, “adjective verb”, and the corresponding “respect expression” of the word that becomes this basic form, "Humility expression" and "Polite expression" are recorded.
Specifically, “verb” can be “respect expression” or “humility expression” but not “poor expression”. For example, the basic form “say” of a verb becomes “speak” in “respect expression” and “speak” in “modesty expression”.
Also, “auxiliary verbs” cannot be “modest expressions”. For example, the basic form “DA” of an auxiliary verb becomes “Is, Masu” in “Polite Expression”. In addition, the auxiliary verb “re” corresponds to “respect expression”.
For example, the basic form “research” and “visit” become “research” and “visit” in “respect expression”, respectively. Depending on the vocabulary and context, for example, the basic form “report” becomes “report”, and it is possible to interpret both “respect expression” and “humility expression”.
In addition, the “adjective”, for example, the basic form “early” becomes “early” in “respect expression”.
In addition, the “adjective verb” is, for example, the basic form “genki” becomes “good” in “respect expression”.
Each word can be both a “respect expression” and a “poor expression” when the subject is a second person.
「文型」の場合は、「命令文」と「使役文」の各単語についてそれぞれが「尊敬表現」、「謙譲表現」、「丁寧表現」の何れになり得るかが記録されている。
「命令文」は、「丁寧表現」にはなり得ない。例えば、命令文「〜しなさい」は「謙譲表現」になる。
「使役文」は、「丁寧表現」にはなり得ない。例えば、使役文「〜させる」は「尊敬表現」になる。
In the case of “sentence pattern”, each word of “command sentence” and “use sentence” is recorded as “respect expression”, “humility expression”, or “poor expression”.
A “command sentence” cannot be a “poor expression”. For example, the imperative sentence “Please do” becomes “modesty expression”.
The “utility sentence” cannot be a “poor expression”. For example, the usage sentence “~ let” becomes “respect expression”.
動詞またはサ変名詞の意味的制約の場合は、例えば、基本形「求める」は、「謙遜語」では「仰ぐ」になり、基本形「たのむ」は「尊敬表現」では「指示する」になり、基本形「同席する」は「謙遜語」では「陪席する」になる。 In the case of a verbal or sa-variant noun, for example, the basic form “Request” becomes “Look up” in “Humility”, the basic form “Enjoy” becomes “Instruct” in “Respectful expression”, and the basic form “ “To be present” becomes “To be seated” in “Humility”.
「名詞」の場合は、「単語」、「接頭辞」、「接尾辞」の各単語についてそれぞれが「外の関係」、「内の関係」、「丁寧」の何れになり得るかが記録されている。ここで、「内の関係」とは話者が対象者と親しい関係にあると判断していることを意味し、「外の関係」とはそれほど親しくないことを意味する。なお、名詞の各「単語」は、主語が二人称のとき「尊敬表現」と「丁寧表現」の両方になり得る。
例えば、「内の関係」の単語「おかあさん」は、「外の関係」では単語「母」となる。
In the case of “noun”, the word “word”, “prefix”, “suffix” is recorded as to whether it can be “external relationship”, “internal relationship”, or “polite”. ing. Here, “inner relationship” means that the speaker determines that the speaker is intimately related to the target person, and “outer relationship” means that the speaker is not so close. Each “word” of the noun can be both “respect expression” and “poor expression” when the subject is the second person.
For example, the word “mother” in “inner relationship” becomes the word “mother” in “outer relationship”.
「接頭辞」は、例えば、基本形「荷物」は、「外の関係」では「お荷物」となる。また、基本形「会社」は、「外の関係」では「御社」、「内の関係」では「当社」となる。なお、「接頭辞」は、主語が二人称のとき「尊敬表現」と「丁寧表現」の両方に該当する場合がある。
また、「接尾辞」は、例えば、「外の関係」の「佐藤さん」,「学生さん」は、「内の関係」で「佐藤」,「田中」となる。
The “prefix” is, for example, the basic form “luggage” becomes “luggage” in “external relationship”. In addition, the basic form “company” is “your company” in “external relationship” and “our company” in “internal relationship”. The “prefix” may correspond to both “respect expression” and “poor expression” when the subject is the second person.
The “suffix” is, for example, “Sato-san” and “student” in “external relationship” are “Sato” and “Tanaka” in “internal relationship”.
抽出部16は、解析部12により形態素解析が行われた入力文からこの入力文の話者と、この話者の相手と、その文章の話題の対象となる対象者との3者(以下、「指示対象」と呼ぶ。)のうちの何れかを抽出する演算処理部である。
The
判定部17は、入力文の指示対象間の社会的、年齢的または世代的な上下関係を判定する演算処理部であり、指示対象判断部17aと、敬語判断部17bと、ランク判断部17cと、内外判断部17dと、親密度判断部17eと、出力部17fとから構成される。
The
指示対象特定部17aは、抽出部16により抽出された指示対象が何れの指示対象に該当するかを特定する。敬語判断部17bは、検出部14から抽出された敬語に基づいて指示対象の上下関係を判断する。ランク判断部17cは、ランクDB18に基づいて指示対象の上下関係を判断する。内外判断部17dは、敬語辞書15の単語の内外関係に基づいて指示対象の上下関係を判断する。親密度判断部17eは、敬語判断部17b,ランク判断部17c,内外判断部17dの判断結果に基づいて、指示対象の上下関係を決定する。出力部17fは、敬語判断部17b,ランク判断部17c,内外判断部17dおよび親密度判断部17eの判断結果を外部に出力する。
The instruction
ランクDB18は、図3に示すような各名詞間の社会的、年齢的または世代的な上下関係を記録したデータベースである。例えば、図3(a)に示す社会的な上下関係には、「師匠」と「弟子」の場合は、「師匠」は「弟子」よりも社会的に上位にあることが記録されている。また、図3(b)に示す年齢的/世代的な上下関係には、「老人」と「成人」の場合、「老人」は「成人」よりも年齢的に上位にあることが記録されている。このようなランクDB18は予め作成される。
The
なお、ランクDB18に記録された上下関係は、異なるカテゴリーの上下関係を関連づけることもできる。例えば、図4に示すように、教育というカテゴリーにおける名詞間の上下関係が記録されたモジュール1と、世代というカテゴリーにおける名詞関係の上下関係が記録されたモジュール2とは、名詞「太郎」により関連づけがなされている。この場合、太郎は、モジュール1では「学生」に相当し、モジュール2では「本人」に相当する。モジュール1の「学生」では最下位にあるが、モジュール2の「本人」では最下位ではない。このように、各モジュールを関連づけることにより、相対的な上下関係を検出することができる。また、「太郎」の「祖父母」が「文科大臣」の「先生」の場合も有り得る。このような場合、モジュール間において複数の関連づけを行うことが可能となる。
Note that the vertical relationship recorded in the
次に、本実施の形態にかかる上下関係検出装置1の動作について、図5を参照して説明する。なお、本実施の形態において、上下関係検出装置1は、言語として日本語を用いて以下に説明する処理を行うものとする。
Next, the operation of the hierarchical
ユーザの操作入力、記録媒体、通信回線等を介して外部からテキストデータ等からなる文(以下、「入力文」と呼ぶ。)が入力されると、入力部11は、その入力文を受け付け、解析部12に送出する(ステップS501)。なお、入力文としては、1つの文でもあってもよく、複数の文であってもよい。
When a sentence composed of text data or the like (hereinafter referred to as “input sentence”) is input from the outside through a user operation input, a recording medium, a communication line, etc., the
入力文が受け付けられると、解析部12は、その入力文に対して解析、すなわち形態素解析と構文解析を行う(ステップS502)。例えば、入力部11により「社長に進言する」という入力文が受け付けられた場合、解析部12は、「社長(名詞)/に(助詞)/進言(動詞)/する(助動詞)」と単語単位に分割するとともに各単語に品詞を付与する。このような形態素解析と構文解析は、例えば主辞駆動句構造文法(Head-Driven Phrase Structure Grammar:HPSG)等の手法により実現することができる。なお、本実施の形態では、各単語を「/」で区切って記載している。
When the input sentence is received, the
形態素解析と構文解析が行われると、検出部14は、敬語辞書15に基づいて、形態素解析が行われた入力文から敬語を検出する(ステップS503)。具体的には、検出部14は、入力文に含まれる各単語と敬語辞書15に登録されている単語とを比較し、敬語辞書15に登録されている単語を抽出する。例えば、入力文「社長に進言する」の場合、敬語として「進言」が検出される。
When the morphological analysis and the syntax analysis are performed, the
検出部14により敬語が検出されない場合(ステップS504:NO)、判定部17の出力部17fは、敬語が検出されなかった旨を出力する(ステップS513)。出力部17fは、敬語が検出されなかった旨を上下関係検出装置1の表示画面に表示したり、プリントアウトしたり、通信回線を介して外部に送信したり、記録媒体に記録したりする。
When honorifics are not detected by the detection unit 14 (step S504: NO), the
敬語が検出された場合(ステップS504:YES)、抽出部16は、解析部12により解析された入力文から指示対象となり得る具体的な名詞を抽出する(ステップS504)。ここで、指示対象とは、上述したように、入力文の発した話者と、この話者が入力文を語りかけた相手と、入力文の話題の対象となる対象者の3者のことを意味する。抽出部16は、このような指示対象、すなわち、話者、相手および対象者のうちの何れかとなり得る具体的な名詞を抽出する。このとき、抽出部16は、名詞のみを抽出すると指示対象となり得ない名詞も抽出されることがあるので、格助詞が付随する名詞を抽出する。例えば、入力文「社長に進言する」の場合、格助詞が付随する名詞「社長に」を抽出する。なお、抽出部16は、格助詞が付随した名詞を抽出すると、その名詞のみを判定部17に出力する。
When an honorific is detected (step S504: YES), the
指示対象となり得る具体的な名詞が抽出されると、判定部17の指示対象特定部17aは、抽出された名詞が話者、相手、対象者の何れに対応するかを特定する(ステップS506)。具体的には、指示対象特定部17aは、抽出部16により抽出された名詞が一人称ときは「話者」、二人称のときは「相手」、これら以外のときは「対象者」であると特定する。例えば、入力文「社長に進言する」の場合、抽出部16により抽出された「社長に」から抽出した指示対象「社長」は、一人称および二人称ではないので、「対象者」であると特定する。また、入力文に主語が存在しない場合は、入力文の主語は「話者」をデフォルトとする。また、入力文に「相手」に対応する名詞が存在しない場合、「相手」はデフォルトとする。ここで、デフォルトとは、該当する具体的な名詞が存在しない場合に、指示対象に具体的な指示対象を対応付けない状態のことを意味する。
When a specific noun that can be an instruction target is extracted, the instruction
なお、入力文によっては、相手と対象者とが同一など、指示対象が重複する場合もあり得る。この場合、各指示対象を独立して扱ってもよく、重複する指示対象を統合して扱うようにしてもよい。 Note that, depending on the input sentence, there may be a case where the instruction target is duplicated, for example, the other party is the same as the target person. In this case, each instruction object may be handled independently, or overlapping instruction objects may be handled in an integrated manner.
指示対象が特定されると、判定部17の敬語判断部17bは、検出部14により検出された敬語に基づいて、指示対象の上下関係を判断する(ステップS507)。具体的には、検出された敬語が尊敬表現の場合、主語が他の指示対象よりも上位となる。また、検出された敬語が謙譲表現の場合、主語が他の指示対象よりも下位となる。また、検出された敬語の意味的制約動詞の尊敬表現に対応する場合、主語が他の指示対象よりも上位となる。また、検出された敬語の意味的制約動詞の謙譲表現に対応する場合、主語が他の指示対象よりも下位となる。また、丁寧表現の敬語が検出されない場合、相手は話者と同等または話者より下位となる。
例えば、入力文「社長に進言する」の場合、検出された敬語「進言」は意味的制約動詞の「謙譲表現」なので、主語である話者は「社長」よりも下位となる。また、丁寧表現の敬語が検出されていないので、相手は話者と同等または話者よりも下位となる。したがって、「社長>話者≧相手」という上下関係が検出される。
When the instruction target is specified, the
For example, in the case of the input sentence “advance to the president”, the detected honorificial word “advancement” is the “modest expression” of the semantically restricted verb, so the speaker as the subject is subordinate to the “president”. In addition, since the polite expression honorific is not detected, the other party is equal to or lower than the speaker. Therefore, the hierarchical relationship “president> speaker ≧ partner” is detected.
なお、敬語判断部17bは、入力文に主語がなく、文脈からも主語が特定できないが、その入力文の敬語が謙譲表現の場合、話者が主語であるとデフォルトで特定して、上述した指示対象の上下関係の判断を行う。
The
また、例えば、基本形「見る」は、「見られる」,「ごらんになる」、「ごらんになられる」というように、敬語表現には複数の段階が存在する場合がある。敬語判定部17bは、敬語表現の段階に基づいて、指示対象間の距離を判断するようにしてもよい。例えば、「見られる」などの敬語が用いられる場合には指示対象間の上下関係の距離が比較的近いとし、「ごらんになられる」などのより丁寧な敬語が用いられている場合には指示対象間の距離が比較的遠いと判断する。これにより、指示対象間の上下関係をより詳細に判断することができる。
Further, for example, the basic form “see” may have a plurality of stages in honorific expression, such as “seen”, “see”, and “become seen”. The
敬語により指示対象の上下関係が検出された場合、または、敬語から上下関係が検出できない場合ランク判断部17cは、ランクDB18に基づいて上下関係の確認または判断を行う(ステップS508)。例えば、入力文「社長に電話を差し上げた」の話者が「部長」場合、ランクDB18から「部長」は「社長」より下位にあることが検出されるので、入力文にある謙譲表現「差し上げた」の用法が正しいことが確認される。
When the hierarchical relationship of the instruction target is detected by honorific or when the hierarchical relationship cannot be detected from honorific, the
なお、話者と対象者の上下関係の検出を行うことにより、主語と目的語との上下関係の検出も同時に行うことができる。したがって、主語のみならず、目的語を用いて指示対象間の上下関係の検出を行うこともできる。 By detecting the hierarchical relationship between the speaker and the target person, it is possible to simultaneously detect the vertical relationship between the subject and the object. Therefore, not only the subject but also the object can be used to detect the vertical relationship between the target objects.
また、ランク判断部17cにより上下関係が検出されない場合(ステップS509:NO)、内外判断部17dは、敬語辞書15に含まれる単語の内外関係に基づいて指示対象の上下関係を判断する(ステップS510)。例えば、入力文「夫が田中さんに進言した」の場合、話者は、内の関係にある主語「夫」を用いているので、対象者よりも下位となる。したがって、「話者<対象者」という上下関係が検出される。
When the
また、内外判断部17dにより上下関係が検出されない場合(ステップS511:NO)、親密度判断部17eは、指示対象の3者の親密度が低いと判断し、話者が他の指示対象よりも下位であると判断する(ステップS512)。したがって、内外判断部17dは、「対象者>話者,相手≧話者」という上下関係を検出する。
Further, when the inside /
上下関係が検出されると(ステップS509:YES,S511:YES,S512)、出力部17fは、検出した上下関係を出力する(ステップS513)。出力部17fは、検出した上下関係を上下関係検出装置1の表示画面に表示したり、プリントアウトしたり、通信回線を介して外部に送信したり、記録媒体に記録したりする。これにより、ユーザは、入力した文から導き出される指示対象の上下関係を認識することが可能となる。
When the vertical relationship is detected (step S509: YES, S511: YES, S512), the
このように、本実施の形態によれば、敬語の種類、各対象者間の社会的、年齢的または世代的な上下関係、内外関係当等に基づいて、指示対象の上下関係を判定することにより、文に関連する人間の上下関係をより具体的に判定することができる。 As described above, according to the present embodiment, the hierarchical relationship of the instruction target is determined based on the type of honorific, the social, age or generational hierarchical relationship between the subjects, the internal / external relationship, etc. Thus, it is possible to more specifically determine the human vertical relationship related to the sentence.
[第2の実施の形態]
次に、本発明の第2の実施の形態について詳細に説明する、図7は、本実施の形態にかかる文生成装置2の構成を示すブロック図である。なお、本実施の形態において、第1の実施の形態と同等の構成要素については、同じ名称および符号を付し、適宜説明を省略する。
[Second Embodiment]
Next, the second embodiment of the present invention will be described in detail. FIG. 7 is a block diagram showing the configuration of the
文生成装置2は、入力部11と、解析部12と、文法辞書13と、敬語辞書15と、抽出部16と、判定部17と、ランクDB18と、選択部21と、生成部22と、機械翻訳装置23から構成される。このような文生成装置2は、CPU等の演算装置と、メモリ、HDD等の記憶装置と、キーボード、マウス、ポインティングデバイス、ボタン、タッチパネル等の外部から情報の入力を検出する入力装置と、インターネット、LAN、WAN等の通信回線を介して各種情報の送受信を行うI/F装置と、CRT、LCDまたはFED等の表示装置を備えたコンピュータと、このコンピュータにインストールされたプログラムとから構成される。すなわちハードウェア装置とソフトウェアとが協働することによって、上記のハードウェア資源がプログラムによって制御され、上述した入力部11、解析部12、文法辞書13、敬語辞書15、抽出部16、判定部17、ランクDB18、選択部21、生成部22および機械翻訳装置23が実現される。なお、上記プログラムは、フレキシブルディスク、CD−ROM、DVD−ROM、メモリカードなどの記録媒体に記録された状態で提供されるようにしてもよい。
The
判定部17は、入力文の指示対象の上下関係を判定する演算処理部であり、指示対象特定部17aと、ランク判断部17cと、内外判断部17dと、親密度判断部17eと、出力部17fとから構成される。指示対象特定部17aは、抽出部16により抽出された指示対象が何れの指示対象に該当するかを特定する。ランク判断部17cは、ランクDB18に基づいて指示対象の上下関係を判断する。内外判断部17dは、敬語辞書15の単語の内外関係に基づいて指示対象の上下関係を判断する。親密度判断部17eは、敬語判断部17b,ランク判断部17c,内外判断部17dの判断結果に基づいて、指示対象の上下関係を決定する。出力部17fは、敬語判断部17b,ランク判断部17c,内外判断部17dおよび親密度判断部17eの判断結果を選択部21に出力する。
The
受付部20は、外部から入力文を受け付け、この入力文を機械翻訳装置23により翻訳させて翻訳文を生成する演算処理部である。なお、受付部20は、入力文に対して翻訳を行わせるのみならず、例えば、入力文を要約させたり、入力文から文を抽出させたり、入力文に対する質疑応答により文を生成させたりするようにしてもよい。
The accepting
選択部21は、解析部12による解析結果と、判定部17による指示対象の上下関係の検出結果とに基づいて、翻訳文に用いるべき敬語の種類を選択する演算処理部である。
The
生成部22は、選択部21の演算結果に基づいて、敬語辞書15から翻訳文に用いるべき敬語を抽出し、この敬語を用いた翻訳文を生成する。
The
機械翻訳装置23は、外国語辞書や対訳辞書等を用いて、1の言語を他の言語に翻訳する公知の機械翻訳システムである。上記他の言語としては、1カ国語のみならず複数の言語を設定することもできる。
The
次に、本実施の形態にかかる文生成装置2の動作について図7を参照して説明する。なお、以下においては、受付部20には英語の入力文が入力され、機械翻訳装置23は、上記1の言語として英語語、上記他の言語として日本語が設定されている場合を例に説明する。
Next, operation | movement of the
まず、受付部20は、ユーザの操作入力、記録媒体、通信回線等を介して外部からテキストデータ等からなる英語の入力文が入力されると、機械翻訳装置23にその入力文を日本語に翻訳させる(ステップS701)。例えば、受付部20は、入力文「I called the president」が入力されると、この入力文を機械翻訳装置23に日本語に翻訳させ、翻訳文「私は社長に電話した」を生成する。
First, when an English input sentence made up of text data or the like is input from the outside via a user operation input, a recording medium, a communication line, etc., the accepting
翻訳文が生成されると、解析部12は、その翻訳文に対して解析、すなわち形態素解析および構文解析を行う(ステップS702)。例えば、受付部20により「私は社長に電話した」という翻訳文が生成されると、解析部12は、「私(名詞)/は(助詞)/社長(名詞)/に(助詞)/電話(名詞)/を(助詞)/し(動詞)/た(助動詞)」と単語単位に分割するとともに各単語に品詞を付与する。
When the translated sentence is generated, the
解析が行われると、抽出部16は、解析が行われた翻訳文から指示対象となり得る具体的な名詞を抽出する(ステップS703)。例えば、翻訳文「私は社長に電話した」の場合、格助詞が付随した名詞である「私は」,「社長に」を抽出する。なお、抽出部16は、格助詞が付随した名詞を抽出すると、その名詞のみを判定部17に出力する。
When the analysis is performed, the
指示対象となり得る具体的な名詞が抽出されると、判定部17の指示対象特定部17aは、抽出された翻訳文の名詞が話者、相手、対象者の何れであるかを特定する(ステップS704)。例えば、翻訳文「私は社長に電話した」の場合、抽出部16により抽出された「私」は一人称であるので「話者」、「社長」は一人称および二人称ではないので「対象者」であると特定する。なお、形態素解析の格助詞の結果から、主語は「私」であることも特定される。
When a specific noun that can be an instruction target is extracted, the instruction
指示対象が特定されると、判定部17のランク判断部17cは、ランクDB18に基づいて指示対象の上下関係を判断する(ステップS705)。例えば、翻訳文「私は社長に電話した」の文脈から、話者が「課長」、相手が「部長」、対象者が「社長」ということが検出されている場合、図3(a)に示すようなランクDB18から、「社長>部長>課長」という上下関係が検出される。
When the instruction target is specified, the
なお、ランク判断部17cにより上下関係が検出されない場合(ステップS706:NO)、内外判断部17dは、敬語辞書15の単語の内外関係に基づいて指示対象の上下関係を判断する(ステップS707)。例えば、翻訳文「夫が田中に電話した」の場合、主語「夫」は、内の関係である。したがって、「話者<対象者(田中)、話者=対象者(夫)」という上下関係が検出される。
If the
また、内外判断部17dにより上下関係が検出されない場合(ステップS708:NO)、親密度判断部17eは、指示対象の3者の親密度が低いと判断し、話者が他の指示対象よりも下位であると判断する(ステップS709)。したがって、内外判断部17dは、「対象者>話者,相手≧話者」という上下関係を検出する。
Also, when the vertical relationship is not detected by the inside /
上下関係が検出されると(ステップS706:YES,S708:YES,S709)、出力部17fは、検出した上下関係を選択部21に出力する。選択部21は、出力部17fから入力される指示対象の上下関係と、解析部12により形態素解析された翻訳文とに基づいて、「尊敬表現」、「謙譲表現」、「丁寧表現」のうち何れを用いるべきかを選択する(ステップS710)。具体的には、翻訳文の構造と指示対象の上下関係から目的語が主語より上位にある場合、選択部21は、翻訳文に「謙譲表現」を用いると決定する。また、相手が話者より上位にある場合、選択部21は、翻訳文に「丁寧表現」を用いると決定する。例えば、翻訳文「私は社長に電話をした」の場合、目的語は対象者である「社長」であり、主語は話者である「課長(私)」であるから、翻訳文に「謙譲表現」を使用する。また、相手である「部長」は、話者である「課長(私)」よりも上位であるので、翻訳文に「丁寧表現」を使用する。
When the vertical relationship is detected (step S706: YES, S708: YES, S709), the
敬語の種類が選択されると、生成部22は、敬語辞書15から翻訳文に用いるべき敬語を抽出し、この敬語を用いた翻訳文を生成する(ステップS711)。具体的には、まず、生成部22は、翻訳文の中から敬語に置換すべき単語の基本形を検出する。これは、翻訳文の中から述語、文型、動詞またはサ変名詞の意味的制約から適切な単語を検索することにより行われる。次に、生成部22は、検出した単語を置換することができる敬語を、選択部21の選択結果に基づいて敬語辞書15から抽出する。最後に、生成部22は、検出した単語を抽出した敬語に置き換えた翻訳文を生成する。生成された翻訳文は、文生成装置2の表示画面に表示したり、プリントアウトしたり、通信回線を介して外部に送信したり、記録媒体に記録したりされる。例えば、翻訳文「私は社長に電話をした」の場合、生成部22は、置換する単語として「し」を検出し、これに置換する敬語として謙譲表現「いたし」と丁寧表現「まし」を敬語辞書15から抽出し、最終的に翻訳文「私は社長に電話をいたしました」を出力する。
When the type of honorific is selected, the
なお、生成部22は、生成部22は、ランク判断部17cによるランクDB18を用いた上下関係の判断結果に基づいて、翻訳文に用いるべき敬語を抽出するようにしてもよい。例えば、基本形「見る」は、「見られる」,「ごらんになる」、「ごらんになられる」というように、敬語表現に複数の段階が存在する。したがって、例えば、「課長」と「社員」のように指示対象間の距離が近い場合には、「見られる」などの敬語を用い、「会長」と「社員」のように指示対象間の距離が遠い場合には、「ごらんになられる」などのより丁寧な敬語を用いる。このようにすることにより、より詳細に敬語の使い分けを行うことができる。
Note that the
このように、本実施の形態によれば、各指示対象間の社会的、年齢的または世代的な上下関係、内外関係当等に基づいて、指示対象の上下関係を判定し、この判定結果に基づいて翻訳文の敬語を選択することにより、語用的により適切な文を生成することができる。 Thus, according to the present embodiment, based on the social, age or generational hierarchical relationship between each target object, the internal / external relationship, etc., the vertical relationship of the target object is determined, and the determination result is By selecting the honorific of the translated sentence based on it, it is possible to generate a more appropriate sentence.
なお、本実施の形態では、英語の入力文を日本語に翻訳した翻訳文について上述した各処理をようにしたが、入力文の言語および翻訳文の言語はそれぞれ英語または日本語に限定されず、適宜自由に設定することができる。 In the present embodiment, the above-described processes are performed for a translated sentence obtained by translating an English input sentence into Japanese. However, the language of the input sentence and the language of the translated sentence are not limited to English or Japanese, respectively. It can be set freely as appropriate.
また、本実施の形態にかかる文生成装置は、機械翻訳による翻訳文について意味的に正しい文章を生成するようにしたが、語用的に適切な文を生成できる文は翻訳文に限定されず、例えば、機械的に文章を要約した要約文、機械的に文章から抽出した抽出文、質疑応答システムで生成された文章など、各種文章について意味的に正しい文章を生成することができる。 In addition, the sentence generation device according to the present embodiment generates a sentence that is semantically correct for a translation sentence obtained by machine translation, but a sentence that can generate a grammatically appropriate sentence is not limited to a translation sentence. For example, it is possible to generate semantically correct sentences for various sentences such as a summary sentence that mechanically summarizes sentences, an extracted sentence that is mechanically extracted from sentences, and a sentence generated by a question and answer system.
本発明は、自然言語処理システムに利用することができる。また、外国語等の言語を学習するための言語学習装置や、企業等の新人研修において正しい文章を学習させるための学習装置等にも利用することができる。 The present invention can be used in a natural language processing system. It can also be used for a language learning apparatus for learning a language such as a foreign language, a learning apparatus for learning correct sentences in a new employee training for a company or the like.
1…上下関係判定装置、2…文生成装置、11…入力部、12…解析部、13…文法辞書、14…検出部、15…敬語辞書、16…抽出部、17…判定部、17a…指示対象特定部、17b…敬語判断部、17c…ランク判断部、17d…内外判断部、17e…親密度判断部、17f…出力部、18…ランクDB、19a…述語取得手段、19b…翻訳手段、19c…判断手段、19d…登録手段、20…受付部、21…選択部、22…生成部、23…機械翻訳装置。
DESCRIPTION OF
Claims (8)
解析部が、前記入力文に対して形態素解析と構文解析を行う解析ステップと、
検出部が、敬語辞書を参照して、前記解析部の解析結果から敬語および、文における主語と目的語との関係を意味的に制約する動詞を検出する検出ステップと、
抽出部が、前記解析部の解析結果から前記指示対象となり得る具体的な名詞を抽出する抽出ステップと、
指示対象特定部が、前記抽出部により抽出された名詞が、一人称の場合には前記話者、二人称の場合には前記相手、これら以外の場合には前記対象者であると特定する特定ステップと、
敬語判断部が、前記検出部が検出した敬語が尊敬表現の場合には主語に対応する指示対象が他の指示対象よりも上位と判断し、前記検出部が検出した敬語が謙譲表現の場合には主語に対応する指示対象が他の指示対象よりも下位と判断し、前記検出部が検出した文における主語と目的語との関係を意味的に制約する動詞が尊敬表現の場合には主語に対応する指示対象が他の指示対象よりも上位と判断し、前記検出部が検出した文における主語と目的語との関係を意味的に制約する動詞が謙譲表現の場合には主語に対応する指示対象が他の指示対象よりも下位と判断し、前記検出部により丁寧表現の敬語が検出されない場合には相手は話者と同等または話者よりも下位と判断することにより、前記指示対象の上下関係を判断する敬語判断ステップと
を実行することを特徴とする上下関係判定方法。 The upper and lower relations which analyze the digitized input sentence and determine the upper limit relation of the instruction target composed of three persons, the speaker of the input sentence, the other party of the speaker, and the target person who is talking about the input sentence A determination method comprising:
An analysis step in which an analysis unit performs morphological analysis and syntax analysis on the input sentence;
A detecting step of detecting a honorific word and a verb that semantically restricts a relationship between a subject and an object in a sentence from an analysis result of the analyzing unit with reference to the honorific dictionary;
An extraction step for extracting a specific noun that can be the instruction target from the analysis result of the analysis unit;
A specifying step for specifying that the noun extracted by the extracting unit is the speaker when the first person is first person, the partner when the second person is the second person, and the target person in other cases; ,
The honorific judgment unit determines that the instruction object corresponding to the subject is higher than the other instruction objects when the honorific word detected by the detection unit is a respect expression, and the honorific word detected by the detection unit is a humble expression Determines that the instruction object corresponding to the subject is lower than the other instruction objects, and if the verb that semantically restricts the relationship between the subject and the object in the sentence detected by the detection unit is a respected expression , If the verb that restricts the relationship between the subject and the object in the sentence detected by the detection unit is a humility expression, the instruction corresponding to the subject is determined. If the target is determined to be lower than the other instruction target and the polite expression of the polite expression is not detected by the detection unit, the opponent is determined to be equal to or lower than the speaker, thereby Honorifics judgment step to judge the relationship Vertical relationship determination method characterized by executing and.
をさらに実行することを特徴とする請求項1記載の上下関係判定方法。 When the honorific judgment unit cannot detect the hierarchical relationship of the instruction target from the honorific, the rank determination unit refers to the rank DB that is a database that records the social, age, or generational hierarchical relationship between the nouns. The rank determination step according to claim 1, further comprising a rank determination step of determining the vertical relationship of the instruction target.
をさらに実行することを特徴とする請求項1記載の上下関係判定方法。 When the honorific determination unit detects the hierarchical relationship of the instruction target from the honorific, the rank determination unit refers to the rank DB, which is a database that records the social, age, or generational hierarchical relationship between each noun. The method of claim 1, further comprising: a rank confirmation step of confirming the vertical relationship of the instruction target.
ことを特徴とする請求項1記載の上下関係判定方法。 The specifying step, if the subject from the input sentence by the extraction unit is not extracted, the vertical relationship determination method according to claim 1, wherein the identifying the speaker as the subject.
ことを特徴とする請求項3記載の上下関係判定方法。 In the rank confirmation step, a plurality of vertical relationships in which categories associated with each other by words included in the rank DB are recorded are recorded, and the rank determination unit refers to the plurality of categories and determines whether the indication target 4. The hierarchical relation determination method according to claim 3, wherein the relation is confirmed .
前記入力文に対して形態素解析と構文解析を行う解析部と、
敬語辞書を参照して、前記解析部の解析結果から敬語および、文における主語と目的語との関係を意味的に制約する動詞を検出する検出部と、
前記解析部の解析結果から前記指示対象となり得る具体的な名詞を抽出する抽出部と、
前記抽出部により抽出された名詞が、一人称の場合には前記話者、二人称の場合には前記相手、これら以外の場合には前記対象者であると特定する指示対象特定部と、
前記検出部が検出した敬語が尊敬表現の場合には主語に対応する指示対象が他の指示対象よりも上位と判断し、前記検出部が検出した敬語が謙譲表現の場合には主語に対応する指示対象が他の指示対象よりも下位と判断し、前記検出部が検出した文における主語と目的語との関係を意味的に制約する動詞が尊敬表現の場合には主語に対応する指示対象が他の指示対象よりも上位と判断し、前記検出部が検出した文における主語と目的語との関係を意味的に制約する動詞が謙譲表現の場合には主語に対応する指示対象が他の指示対象よりも下位と判断し、前記検出部により丁寧表現の敬語が検出されない場合には相手は話者と同等または話者よりも下位と判断することにより、前記指示対象の上下関係を判断する敬語判断部と
を備えることを特徴とする上下関係判定装置。 The upper and lower relations which analyze the digitized input sentence and determine the upper limit relation of the instruction target composed of three persons, the speaker of the input sentence, the other party of the speaker, and the target person who is talking about the input sentence A determination device,
An analysis unit that performs morphological analysis and syntax analysis on the input sentence;
With reference to the honorific dictionary, the detection unit that detects the honorific and the verb that semantically restricts the relationship between the subject and the object in the sentence from the analysis result of the analysis unit;
An extraction unit for extracting a specific noun that can be the instruction target from the analysis result of the analysis unit;
When the noun extracted by the extraction unit is first person, the speaker, in the case of the second person, the partner, in other cases, the instruction target specifying unit for specifying the target person,
When the honorific detected by the detection unit is a respected expression, the instruction object corresponding to the subject is determined to be higher than the other instruction objects, and when the honorific detected by the detection unit is a humble expression, it corresponds to the subject. If the verb that restricts the relationship between the subject and the object in the sentence detected by the detection unit is a respect expression, the instruction target corresponding to the subject is When the verb that semantically constrains the relationship between the subject and the object in the sentence detected by the detection unit is higher than the other instruction target, the instruction target corresponding to the subject is another instruction. Honorifics for determining the hierarchical relationship of the indicated object by determining that the polite expression of polite expression is not detected by the detection unit, and determining that the other party is equivalent to the speaker or lower than the speaker And a determination unit. A vertical relation judging device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005292073A JP4437778B2 (en) | 2005-10-05 | 2005-10-05 | Vertical relationship determination method, vertical relationship determination device, vertical relationship determination program, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005292073A JP4437778B2 (en) | 2005-10-05 | 2005-10-05 | Vertical relationship determination method, vertical relationship determination device, vertical relationship determination program, and recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007102526A JP2007102526A (en) | 2007-04-19 |
JP4437778B2 true JP4437778B2 (en) | 2010-03-24 |
Family
ID=38029399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005292073A Expired - Fee Related JP4437778B2 (en) | 2005-10-05 | 2005-10-05 | Vertical relationship determination method, vertical relationship determination device, vertical relationship determination program, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4437778B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5574241B2 (en) * | 2011-02-25 | 2014-08-20 | 独立行政法人情報通信研究機構 | Honorific word misuse judgment program and honorific word misuse judgment device |
JP5727980B2 (en) * | 2012-09-28 | 2015-06-03 | 株式会社東芝 | Expression conversion apparatus, method, and program |
-
2005
- 2005-10-05 JP JP2005292073A patent/JP4437778B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007102526A (en) | 2007-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9805718B2 (en) | Clarifying natural language input using targeted questions | |
US20180314689A1 (en) | Multi-lingual virtual personal assistant | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
US9753918B2 (en) | Lexicon development via shared translation database | |
JP6570169B2 (en) | Dialog support program, server and method for supporting user operation together with user dialog system | |
US9697477B2 (en) | Non-factoid question-answering system and computer program | |
JP3920812B2 (en) | Communication support device, support method, and support program | |
JP4237001B2 (en) | System and method for automatically detecting collocation errors in documents | |
US20180011842A1 (en) | Lexicon development via shared translation database | |
Griol et al. | Combining speech-based and linguistic classifiers to recognize emotion in user spoken utterances | |
WO2018055983A1 (en) | Translation device, translation system, and evaluation server | |
JP2009139390A (en) | Information processing system, processing method and program | |
JP2007219190A (en) | Speech recognition device and recognision method, and program therefor | |
Seljan et al. | Combined automatic speech recognition and machine translation in business correspondence domain for english-croatian | |
Abhishek et al. | Aiding the visually impaired using artificial intelligence and speech recognition technology | |
Fan et al. | Just speak it: Minimize cognitive load for eyes-free text editing with a smart voice assistant | |
Stepanov et al. | The Development of the Multilingual LUNA Corpus for Spoken Language System Porting. | |
JP4437778B2 (en) | Vertical relationship determination method, vertical relationship determination device, vertical relationship determination program, and recording medium | |
JP2005115468A (en) | Text mining apparatus, text mining method and text mining program | |
JP4054035B2 (en) | Database construction apparatus, database construction method, database construction program, and recording medium | |
JP2004118720A (en) | Translating device, translating method, and translating program | |
Ji et al. | Translation Technology in Accessible Health Communication | |
KR102476497B1 (en) | Apparatus and method for outputting image corresponding to language | |
Kim | A dialogue-based NLIDB system in a schedule management domain | |
Rashwan | Introduction to Arabic Computational Linguistics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080219 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081104 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091222 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091224 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130115 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130115 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |