JP2849341B2 - Dialogue processing device - Google Patents

Dialogue processing device

Info

Publication number
JP2849341B2
JP2849341B2 JP6278966A JP27896694A JP2849341B2 JP 2849341 B2 JP2849341 B2 JP 2849341B2 JP 6278966 A JP6278966 A JP 6278966A JP 27896694 A JP27896694 A JP 27896694A JP 2849341 B2 JP2849341 B2 JP 2849341B2
Authority
JP
Japan
Prior art keywords
topic
word
utterance
words
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP6278966A
Other languages
Japanese (ja)
Other versions
JPH08137874A (en
Inventor
一志 西本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ei Tei Aaru Tsushin Shisutemu Kenkyusho Kk
Original Assignee
Ei Tei Aaru Tsushin Shisutemu Kenkyusho Kk
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ei Tei Aaru Tsushin Shisutemu Kenkyusho Kk filed Critical Ei Tei Aaru Tsushin Shisutemu Kenkyusho Kk
Priority to JP6278966A priority Critical patent/JP2849341B2/en
Publication of JPH08137874A publication Critical patent/JPH08137874A/en
Application granted granted Critical
Publication of JP2849341B2 publication Critical patent/JP2849341B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】この発明は、対話処理装置に関
し、特に、対話者間での対話内における話題転換の有無
を検出できるような対話処理装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a dialogue processing apparatus, and more particularly to a dialogue processing apparatus capable of detecting the presence or absence of a topic change in a dialogue between dialogue parties.

【0002】[0002]

【従来の技術および発明が解決しようとする課題】従来
から行なわれている話題認識技術の大半は、「目的指向
型の対話」の話題理解に対するものである。ここで目的
指向型の対話とは、たとえば会社の受付での対話、学会
への参加申込における対話が挙げられる。このような目
的指向型の対話に対して、たとえばプラン・ゴールモデ
ルなどで対話の構造を記述することによって、話題理解
が行なわれる。
2. Description of the Related Art Most of the conventional topic recognition techniques are related to the topic understanding of "object-oriented dialogue". Here, the purpose-oriented dialogue includes, for example, a dialogue at a reception of a company and a dialogue in an application for participation in a conference. For such a goal-oriented dialogue, the topic is understood by describing the structure of the dialogue using, for example, a plan / goal model.

【0003】ところが、プラン・ゴールモデルが使用さ
れる場合には、状況の数だけスクリプトが準備されなけ
ればならない。したがって、目的指向型の対話の話題理
解を行なえる装置の柔軟度が欠けることとなる。さら
に、このような装置では、特に目的を持たない「自由展
開型の対話」には適用されず、自由展開型の対話の話題
理解が行なわれない。
However, when the plan-goal model is used, scripts must be prepared for the number of situations. Therefore, the flexibility of the device capable of understanding the topic of the goal-oriented dialogue is lacking. Further, such a device is not applied to a "free-development type dialog" having no particular purpose, and does not understand the topic of the free-development type dialog.

【0004】一方、わずかに自由展開型対話に対する話
題理解の装置が存在する。図9は、そのようなわずかに
自由展開型対話に対する話題理解の装置での話題理解の
方法を説明するための図である。
[0004] On the other hand, there is a device for slightly understanding a topic for a free-development type dialogue. FIG. 9 is a diagram for explaining a topic understanding method using such a topic understanding device for a slightly free-development type dialogue.

【0005】図9を参照して、まず、対話者間で対話が
行なわれているとする。それによって、発話311、発
話313、発話315、発話317、発話319のよう
に、この順で発話が得られたとする。次に、発話311
をコンピュータ処理可能なテキスト301に変更し、発
話313をテキスト303に変更し、発話315をテキ
スト305に変更し、発話317をテキスト307に変
更し、発話319をテキスト309に変更する。テキス
ト301には話題候補語321a,321bが含まれて
いる。テキスト303には、話題候補語323a,32
3bが含まれる。テキスト305には、話題候補語32
5が含まれる。テキスト307には、話題候補語327
a,327bが含まれる。テキスト309には、話題候
補語329が含まれる。
Referring to FIG. 9, first, it is assumed that a dialogue is performed between the talkers. Thus, it is assumed that utterances are obtained in this order, such as utterance 311, utterance 313, utterance 315, utterance 317, and utterance 319. Next, the utterance 311
Is changed to text 301 which can be processed by a computer, utterance 313 is changed to text 303, utterance 315 is changed to text 305, utterance 317 is changed to text 307, and utterance 319 is changed to text 309. The text 301 includes topic candidate words 321a and 321b. The text 303 includes topic candidate words 323a, 32
3b is included. The text 305 includes topic candidate words 32
5 is included. The text 307 includes topic candidate words 327
a, 327b. The text 309 includes a topic candidate word 329.

【0006】このようにして得られた5発話311,3
13,315,317,319に対応するテキスト30
1,303,305,307,309が、話題スタック
331にスタックされる。スタックされたテキスト30
1,303,305,307,309には、話題候補語
321a,321b,323a,323b,325,3
27a,327b,329が含まれている。そこで、こ
れらの話題候補語321a,321b,323a,32
3b,325,327a,327b,329の中で、同
一の話題候補語が存在する場合には、話題が同定され
る。さらに、その話題同定後に、話題転換が検出され
る。このようにして、自由展開型に対する話題理解が行
なわれる。
The five utterances 311 and 3 obtained in this way are
Text 30 corresponding to 13,315,317,319
1, 303, 305, 307, 309 are stacked on the topic stack 331. Stacked text 30
1, 303, 305, 307, 309 include topic candidate words 321a, 321b, 323a, 323b, 325, 3
27a, 327b, and 329 are included. Therefore, these topic candidate words 321a, 321b, 323a, 32
If the same topic candidate word exists among 3b, 325, 327a, 327b, and 329, the topic is identified. Further, after the topic identification, a topic change is detected. In this way, the topic is understood for the freely deployable type.

【0007】しかしながら、このような自由展開型対話
に対する話題理解の方法が存在するとはいえ、実際に
は、対話の内容に応じた分野辞書が準備される必要があ
る。したがって、準備された分野から外れた内容の話題
理解は行なわれず、本当の意味での自由展開型対話に対
する話題理解は行なわれていない。
[0007] However, although there is a method of understanding topics for such a free-development type dialogue, it is actually necessary to prepare a field dictionary corresponding to the content of the dialogue. Therefore, the topic understanding of the content outside the prepared field is not performed, and the topic understanding of the free-development dialogue in the true sense is not performed.

【0008】さらに、話題同定のために話題スタックが
使用されているため、話題転換の認識、話題同定に数発
話の遅れが発生する。前述の例では、5発話の遅れが発
生する。したがって、リアル時間に近い状態での話題の
転換の認識、話題同定は行なわれない。
Further, since the topic stack is used for topic identification, a delay of several utterances occurs in recognition of topic change and topic identification. In the example described above, a delay of five utterances occurs. Therefore, recognition of topic change and topic identification in a state close to real time are not performed.

【0009】以上のことをまとめる。従来の話題理解で
は、目的指向型の対話であれ、自由展開型の対話であ
れ、分野ごとに準備されたドメイン知識から外れた分野
の話題には適応されない。さらに、従来の自由展開型の
対話では、まず話題同定を行ない、その後に話題転換を
認識するため、実時間での話題転換の検出は行なわな
い。
The above is summarized. Conventional topic understanding does not apply to topics in fields other than domain knowledge prepared for each field, whether goal-oriented conversations or freely expanding conversations. Furthermore, in the conventional free-development-type dialogue, topic identification is performed first, and then topic change is recognized. Therefore, topic change is not detected in real time.

【0010】ゆえに、本発明の目的は、ほぼ実時間で話
題転換を検出でき、目的指向型の対話および自由展開型
の対話におけるいずれの分野の話題にも変更されること
なく適用可能な対話処理装置を提供することである。
Therefore, it is an object of the present invention to provide a dialog processing method capable of detecting a topic change in almost real time, and applicable to a topic in any field in a goal-oriented dialog and a free-evolving dialog. It is to provide a device.

【0011】[0011]

【課題を解決するための手段】の発明にる対話処理
装置は、入力手段と、形態素解析手段と、話題転換要因
抽出手段と、話題候補語抽出手段と、演算処理手段とを
備える。入力手段は、話題の発話を入力し、その入され
た発話を文章に変換する。形態素解析手段は、入力手段
から与えられる文章を形態素解析する。話題転換要因抽
出手段は、形態素解析手段から与えられる単語の中から
話題を転換する要因となり得る話題転換要因語を抽出す
る。話題候補語抽出手段は、形態素解析手段から与えら
れる単語の中から話題を表わす話題語となり得る話題候
補語を抽出する。演算処理手段は、形態素解析手段から
与えられる単語の中で話題候補語の出現回数および出現
間隔に基づいて話題候補語が話題の転換に寄与する話題
転換寄与指数を演算し、話題転換寄与指数と話題転換要
因語とに基づいて話題の転換を検出する。
In order to solve the problems] by that dialogue processing apparatus to the invention of this is, the input means, and the morphological analysis means, topic conversion factor
Extracting means, topic candidate word extracting means, and arithmetic processing means
Prepare. The input means inputs the utterance of the topic,
Convert utterances into sentences. The morphological analysis means is an input means
Morphologically analyzes the sentence given by. Topic change factor extraction
The output means is selected from words given by the morphological analysis means.
Extract topic conversion factor words that can be the cause of topic conversion
You. Topic candidate word extraction means is provided by the morphological analysis means.
Topics that can be topic words that represent topics from among the words
Extract complements. The arithmetic processing means is provided by a morphological analysis means.
Number of occurrences and occurrences of topic candidate words in given words
Topics whose topic candidate words contribute to topic switching based on intervals
Calculate the conversion contribution index, and convert the topic conversion contribution index and the topic conversion
Detect topic change based on factors.

【0012】好ましくは、上記入力手段は、文章をテキ
スト形式で表現するテキスト入力装置を含む。
Preferably, the input means includes a text input device for expressing a sentence in a text format.

【0013】好ましくは、上記入力手段は、いずれの話
者が発話しているかを監視する話者監視装置を含む。上
演算処理手段は、話題転換寄与指数と話題転換要因語
とに加えて、話者監視装置の監視結果に基づいて話題の
転換を検出する。
[0013] Preferably, said input means including a speaker monitoring device that monitors one talk <br/>'s is speaking. Up
The notation processing means uses a topic conversion contribution index and a topic conversion factor word.
In addition to the above, based on the monitoring result of the speaker monitoring device ,
Detect conversion .

【0014】好ましくは、上記入力手段は、話者の発話
開始時刻から発話終了時刻までの時間を監視する時間監
視装置を含む。上記演算処理手段は、話題転換寄与指数
と話題転換要因語に加えて、時間監視装置の監視結果
基づいて話題の転換を検出する。
[0014] Preferably, said input means including a time monitoring device for monitoring the time from the utterance <br/> start time of the speaker to the speech ending time. The arithmetic processing means is a topic conversion contribution index.
And the topic conversion factor words, and the monitoring results of the time monitoring device
Detect topic shift based on

【0015】好ましくは、上記形態素解析手段は、予め
定められた単語辞書を有し、単語辞書を用いて文章を形
解析する。
[0015] Preferably, the morphological analysis means has a predetermined word dictionary, to form <br/> state element analyzes the sentence using the word dictionary.

【0016】好ましくは、上記形態素解析手段は、予め
定められた同義語辞書を有し、同義語辞書を用いて形態
素解析により得られた単語の中から同義語を抽出して同
義語リストを作成する。
[0016] Preferably, the morphological analysis means has a predetermined synonym dictionary, and uses a synonym dictionary to form a synonym.
Extract synonyms from words obtained by elementary analysis
To create a synonym list.

【0017】好ましくは、上記形態素解析手段は、予め
定められた対比語辞書を有し、対比語辞書を用いて形態
素解析により得られた単語の中から対比語を抽出して対
比語リストを作成する。
Preferably, the morphological analysis means has a predetermined contrast word dictionary, and uses a contrast word dictionary to form
Extract a comparison word from the words obtained by elementary analysis
To create a specific word list.

【0018】好ましくは、上記対話処理装置はさらに、
話題語同定手段を備える。話題語同定手段は、演算処理
手段が話題の転換を検出したとき、話題候補語の中から
話題語を同定する。
[0018] Preferably, in the dialog processing system Hasa, et al.,
A topic word identification unit is provided. Topic word identification means performs arithmetic processing
When means detects the conversion topic, we identify <br/> topic words from the topic candidate word.

【0019】好ましくは、上記形態素解析手段は、予め
定められた同義語辞書を有し、同義語辞書を用いて形態
素解析により得られた単語の中から同義語を抽出して同
義語リストを作成する。上記話題語同定手段は、同義語
リストに基づい話題語を同定する。
Preferably, the morphological analysis means has a predetermined synonym dictionary, and forms a synonym using the synonym dictionary.
Extract synonyms from words obtained by elementary analysis
Create a synonym list. The above-mentioned topic word identification means is a synonym.
Identify topic words based on the list .

【0020】さらに好ましくは、上記形態素解析手段
は、予め定められた対比語辞書を有し、対比語辞書を
いて形態素解析により得られた単語の中から対比語を抽
出して対比語リストを作成する。上記話題語同定手段
は、対比語リストに基づい話題語を同定する。
More preferably, the morphological analysis means has a predetermined contrast word dictionary , and extracts a contrast word from words obtained by morphological analysis using the contrast word dictionary.
To create a contrasting word list. The topic word identification means identifies a topic word based on a comparison word list .

【0021】[0021]

【作用】の発明にる対話処理装置は、対話者間の対
話の内容に依存する構成を有していないため、いずれの
分野の話題にも適用でき、さらに、話題同定に数発話を
蓄積する必要がないためほぼ実時間に近い状態で話題転
換の有無を検出できる。
[Action] by that dialogue processing apparatus to the invention of this is, because it does not have a configuration that is dependent on the contents of the dialogue between the interlocutors, can be applied to the topic of any of the fields, further, the number speech to the topic identification Since there is no need to accumulate, it is possible to detect the presence / absence of a topic change almost in real time.

【0022】また、入力手段としてテキスト入力装置を
用いることで、コンピュータ処理可能なテキスト形式に
変換できる。
Further, by using the text input device as an input device, it can be converted into a computer processable text format.

【0023】また、入力手段として話者監視装置を含む
ので、話者指定による話題転換の発生検出でき、話題
転換検出精度を向上させることができる。
Further, because it includes a speaker monitoring device as input means, able to detect the occurrence of the topic transformed by the speaker specified, it is possible to improve the topic transformed detection accuracy.

【0024】また、入力手段として時間監視装置を含む
ので、発話間の空白期間による話題転換の発生を検出で
き、話題転換検出精度を向上させることができる。
Further, because it includes a time monitoring device as input means, able to detect the occurrence of the topic transformed by a blank period between utterances, it is possible to improve the topic transformed detection accuracy.

【0025】また、形態素解析手段が単語の品詞によっ
て発話内容を解析するので、単語の品詞別の話題候補を
抽出できる。
[0025] In addition, since the morphological analysis means for analyzing the speech content by the word of the part of speech, it can be extracted the part of speech another topic candidate of the word.

【0026】また、発話内容を同義語によって解析する
ので、同義語から得られる話題転換要因を抽出できる。
[0026] In addition, since the analysis by the synonym of the speech content, it can be extracted the topic conversion factors obtained from synonyms.

【0027】また、発話内容を対比語によって解析する
ので、その対比語から得られる解析結果を統計処理する
ことで、対比語に関する統計処理情報を得ることができ
る。
Further, since analyzes the utterance by comparing words, by statistical processing of the analysis result obtained from the comparison word, it is possible to obtain a statistical processing information about the comparison word.

【0028】また、話題転換が存在するか否かを検出す
るための評価結果に応じて話題候補語に基づく話題語を
同定するので、ほぼ実時間に近い話題同定を行なえる。
[0028] In addition, because to identify topic words based on the topic candidate word according to the evaluation result for the detection of whether or not the topic conversion exists, almost perform the topic identified close to real time.

【0029】また、発話内容を同義語で解析し、同義語
によって話題語を同定するので、話題語同定精度を向上
させることができる。
Also , the utterance contents are analyzed with synonyms, and synonyms are analyzed.
Because to identify the topic word by, it is possible to improve the topic word same Teisei degree.

【0030】また、発話内容を対比語によって解析し、
対比語に基づい話題語を同定するので、話題定精
度を向上させることができる。
Also , the utterance contents are analyzed by contrast words,
Since identifying topic words based on the comparison word, it is possible to improve the topic language same Teisei <br/> degree.

【0031】[0031]

【実施例】図1は、この発明の一実施例による対話処理
装置の概略ブロック図である。
FIG. 1 is a schematic block diagram of a dialog processing apparatus according to an embodiment of the present invention.

【0032】図1を参照して、人々の間で行なわれる対
話を処理する対話処理装置1は、対話入力部3と、形態
素解析部5と、話題転換要因抽出部7と、話題候補語抽
出部9と、解析情報統計処理部11と、単語の話題転換
寄与指数演算部13と、話題転換尤度評価部15とを含
む。
Referring to FIG. 1, a dialogue processing apparatus 1 for processing a dialogue between people includes a dialogue input unit 3, a morphological analysis unit 5, a topic conversion factor extraction unit 7, and a topic candidate word extraction. A section 9, an analysis information statistical processing section 11, a topic topic conversion contribution index calculation section 13, and a topic conversion likelihood evaluation section 15.

【0033】対話入力部3は、対話を行なっている人々
のそれぞれの発話を入力する。対話入力部3は、テキス
ト入力装置19で構成される。テキスト入力装置19
は、人々の発話内容をテキスト形式で装置本体に入力す
る。たとえば、テキスト入力装置19が音声認識装置で
構成された場合には、人々のうちの話者の音声による発
話に対して音声認識を行ない、その発話内容をテキスト
形式に変換して形態素解析部5に出力する。また、テキ
スト入力装置19には、キーボードなどが用いられても
よく、用いられたキーボードによって話者の発話内容が
テキスト形式に変換されて形態素解析部5に与えられて
もよい。さらに、テキスト入力装置19は、人々の間で
行なわれる手話や点字に対しての対話の発話内容を入力
してもよい。
The dialogue input unit 3 inputs utterances of people who are in a dialogue. The dialogue input unit 3 includes a text input device 19. Text input device 19
Input the utterance contents of the people into the apparatus body in a text format. For example, when the text input device 19 is constituted by a speech recognition device, speech recognition is performed for speech uttered by a speaker among people, and the speech content is converted into a text format to convert the speech content into a text format. Output to In addition, a keyboard or the like may be used for the text input device 19, and the uttered content of the speaker may be converted into a text format by the used keyboard and provided to the morphological analysis unit 5. Further, the text input device 19 may input the utterance content of the dialogue between the people in sign language or Braille.

【0034】形態素解析部5は、単語辞書21を有して
いる。そして、単語辞書21を用いて、形態素解析部5
は、対話入力部3でテキスト化された発話文を単語に分
解する。その後、形態素解析部5は、分解された単語の
品詞を決定する。そして、形態素解析部5は、単語品詞
リストを話題転換要因抽出部7、話題候補語抽出部9お
よび解析情報統計処理部11に与える。
The morphological analysis section 5 has a word dictionary 21. Then, using the word dictionary 21, the morphological analysis unit 5
Decomposes the utterance sentence converted into text by the dialog input unit 3 into words. After that, the morphological analysis unit 5 determines the part of speech of the decomposed word. Then, the morphological analysis unit 5 gives the word part-of-speech list to the topic conversion factor extraction unit 7, the topic candidate word extraction unit 9, and the analysis information statistical processing unit 11.

【0035】話題転換要因抽出部7は、予め定められた
話題転換要因規則22を知識として有している。そし
て、形態素解析部5が決定した単語の品詞に転換要因規
則22を適用して、話題転換を発生させやすい単語の検
出を行なう。たとえば、そのような単語としては、クル
ーワード(話変わって、ところで、など)、疑問文、ま
たは相手を特定する語もしくは言回しなどが挙げられ
る。そして、話題転換要因抽出部7は、たとえばクルー
ワードの有無を話題転換尤度評価部15に与える。
The topic conversion factor extraction unit 7 has a predetermined topic conversion factor rule 22 as knowledge. Then, the conversion factor rule 22 is applied to the part of speech of the word determined by the morphological analysis unit 5 to detect a word that easily causes topic conversion. For example, such words may include crew words (instead of, by the way, etc.), question sentences, or words or phrases that identify the other party. Then, the topic conversion factor extraction unit 7 gives, for example, the presence or absence of a crew word to the topic conversion likelihood evaluation unit 15.

【0036】話題候補語抽出部9は話題化規則23を知
識として有している。そして、形態素解析部5が決定し
た単語の品詞にその話題化規則23が適用されて、規則
に当てはまる構文が発話中から検出される。そして、検
出が行なわれたことで、その構文を指示する話題候補が
得られ、話題候補語リストが解析情報統計処理部11に
出力される。
The topic candidate word extracting section 9 has the topicing rule 23 as knowledge. Then, the topicalization rule 23 is applied to the part of speech of the word determined by the morphological analysis unit 5, and a syntax applicable to the rule is detected from the utterance. Then, by performing the detection, a topic candidate indicating the syntax is obtained, and a topic candidate word list is output to the analysis information statistical processing unit 11.

【0037】解析情報統計処理部11は、形態素解析部
5、話題候補語抽出部9、後で説明する単語の話題転換
寄与数演算部13、および後で説明する話題転換尤度評
価部15で得られる情報を基に、統計処理を行なう。そ
して、統計処理後に得られる各話題候補語の転換寄与指
数および話題候補語の数/有無を話題転換尤度評価部1
5に与える。
The analysis information statistical processing section 11 includes a morphological analysis section 5, a topic candidate word extraction section 9, a topic conversion contribution number calculation section 13 for a word to be described later, and a topic conversion likelihood evaluation section 15 to be described later. Statistical processing is performed based on the obtained information. The conversion contribution index of each topic candidate word obtained after the statistical processing and the number / presence of the topic candidate words are determined by the topic conversion likelihood evaluation unit 1.
Give 5

【0038】単語の話題転換寄与指数演算部13は、解
析情報統計処理部11で得られる、入力された名詞の出
現回数、最も最近にその語が使用されてからの経過時間
に基づいて、所定の方法によってその語の話題転換寄与
指数を演算して解析情報統計処理部11に出力する。
The topic conversion contribution index calculation unit 13 for the word, based on the number of appearances of the input noun and the elapsed time since the word was used most recently, obtained by the analysis information statistical processing unit 11, Then, the topic conversion contribution index of the word is calculated and output to the analysis information statistical processing unit 11.

【0039】話題転換尤度評価部15は、解析情報統計
処理部11が統計処理することで得られた話題候補語の
数/有無および各話題候補語の転換寄与指数と、話題転
換要因抽出部7で得られたたとえばクルーワードの有無
に基づいて、現在の発話において話題転換が発生してい
るかどうかを評価する。そして、その評価結果によって
話題転換の有無25が得られる。また、話題転換したか
否かは、解析情報統計処理部11にも与えられる。
The topic conversion likelihood evaluation unit 15 includes a number / presence / absence of topic candidate words obtained by performing statistical processing by the analysis information statistical processing unit 11, a conversion contribution index of each topic candidate word, and a topic conversion factor extraction unit. Based on, for example, the presence or absence of a crew word obtained in step 7, it is evaluated whether a topic change has occurred in the current utterance. Then, the presence or absence 25 of topic change is obtained from the evaluation result. Further, whether or not the topic has been changed is also given to the analysis information statistical processing unit 11.

【0040】次に、動作について簡単に説明する。ま
ず、対話入力部3に入力された発話が、テキスト入力装
置19によってコンピュータ処理可能な形式(テキス
ト)に変換される。そして、変換されたテキストは形態
素解析部5に与えられる。
Next, the operation will be briefly described. First, the utterance input to the dialog input unit 3 is converted by the text input device 19 into a format (text) that can be processed by a computer. Then, the converted text is provided to the morphological analyzer 5.

【0041】次に、形態素解析部5は、単語辞書21を
使用して、入力された発話を解析して単語に分解し、各
単語の品詞を決定する。解析結果である単語品詞リスト
は、話題転換要因抽出部7、話題候補語抽出部9および
解析情報統計処理部11に与えられる。
Next, the morphological analysis unit 5 analyzes the input utterance using the word dictionary 21 and decomposes the utterance into words, and determines the part of speech of each word. The word part-of-speech list, which is the analysis result, is provided to the topic conversion factor extraction unit 7, the topic candidate word extraction unit 9, and the analysis information statistical processing unit 11.

【0042】次に、話題転換要因抽出部7は、形態素解
析部5の解析結果中に話題の転換を促す語(句)が現れ
ているかどうかを話題転換要因規則22に従ってチェッ
クする。そのような語(句)が検出されれば、話題転換
要因抽出部7は解析情報統計処理部11に通知する。
Next, the topic conversion factor extraction unit 7 checks according to the topic conversion factor rule 22 whether or not a word (phrase) that prompts a topic conversion appears in the analysis result of the morphological analysis unit 5. When such a word (phrase) is detected, the topic conversion factor extraction unit 7 notifies the analysis information statistical processing unit 11.

【0043】話題候補語抽出部9は、形態素解析部5の
解析結果に話題化規則23を適用し、規則に一致する構
文が発見されれば、その構文が指示する話題候補語を抽
出して、解析情報統計処理部11に与える。
The topic candidate word extraction unit 9 applies the topicization rule 23 to the analysis result of the morphological analysis unit 5, and if a syntax that matches the rule is found, extracts the topic candidate word indicated by the syntax. To the analysis information statistical processing unit 11.

【0044】解析情報統計処理部11は、対話入力部
3、形態素解析部5、話題転換要因抽出部7、話題候補
抽出部9から入力される情報に基づき、単語/文/発話
単位に各量の統計を取る。また、形態素解析部5および
話題候補語抽出部9のそれぞれから名詞および話題候補
語が入力されて、その後の出現回数と、初出語でない場
合は前回に出現してからの経過時間を単語の話題転換寄
与指数演算部13に与える。そして、単語の話題転換寄
与指数演算部13の演算結果を受取って、その値も統計
処理する。
The analysis information statistical processing section 11 is based on information input from the dialogue input section 3, morphological analysis section 5, topic conversion factor extraction section 7, topic candidate extraction section 9, and converts each quantity into a word / sentence / utterance unit. Take statistics. In addition, the noun and the topic candidate word are input from each of the morphological analysis unit 5 and the topic candidate word extraction unit 9, and the number of appearances thereafter, and if not the first appearance of the word, the elapsed time since the last appearance is indicated by the topic of the word. The conversion contribution index calculation unit 13 is provided. Then, the calculation result of the topic conversion contribution index calculation unit 13 of the word is received, and the value is also statistically processed.

【0045】単語の話題転換寄与指数演算部13は、解
析情報統計処理部11から入力されるある語の出現回数
と前回に出現してからの経過時間を用いて、その語が話
題の転換発生に寄与する度合を計算し、結果を解析情報
統計処理部11に与える。
The word topic conversion contribution index calculation unit 13 uses the number of appearances of a word input from the analysis information statistical processing unit 11 and the elapsed time since the last appearance to convert the word into a topic conversion occurrence. Is calculated, and the result is given to the analysis information statistical processing unit 11.

【0046】話題転換尤度評価部15は、解析情報統計
処理部11からたとえば話題転換候補語の数/有無や各
話題候補語の転換寄与指数のような各種の統計情報、話
題転換要因抽出部7から与えられるたとえばクルーワー
ドの有無のような話題転換要因に基づき、所定の評価手
法によって現在の発話において話題転換があったかどう
かを評価する。その評価結果は、解析情報統計処理部1
1に与えられる。また、話題転換尤度評価部15は、話
題の転換ありと判断した場合には、その旨をたとえば利
用者に通知する。
The topic conversion likelihood evaluation unit 15 receives various statistical information such as the number / presence of topic conversion candidate words and the conversion contribution index of each topic candidate word from the analysis information statistical processing unit 11, and a topic conversion factor extraction unit. Based on a topic conversion factor, such as the presence or absence of a crew word, given from 7, whether or not a topic change has occurred in the current utterance is evaluated by a predetermined evaluation method. The evaluation result is sent to the analysis information statistical processing unit 1
Given to one. Further, when it is determined that the topic has changed, the topic conversion likelihood evaluating unit 15 notifies the user, for example, of the fact.

【0047】このような装置によって、目的指向型の対
話のみならず、特に目的を持たない自由展開型の対話に
適用可能である話題転換の有無を検出する対話処理装置
が提供される。また、モデルや話題分野に応じた辞書な
どの対話の内容に依存する部分が処理の中で存在しない
ため、どんな分野の話題に対しても変更する必要のない
装置が提供される。これは、対話の構造、内容の分野な
どが一切仮定されず、話題の転換の検出が実際の人間か
ら獲得されたヒューリスティックなルールに基づいて行
なわれているためである。さらに、話題転換および話題
の検出が時間遅れなく行なわれる。すなわち、従来例の
ように話題転換の認識・話題同定に話題スタックなどが
使用されておらず、現在の発話とそこまでの発話との差
が検出されることで変化が把握されているため、ほぼ実
時間に近い話題転換の検出が行なわれる。
With such an apparatus, there is provided an interaction processing apparatus for detecting the presence / absence of a topic change applicable to not only goal-oriented dialogue but also free-development-type dialogue having no particular purpose. Also, since there is no part in the processing that depends on the content of the dialogue such as a dictionary corresponding to the model or topic field, there is provided an apparatus that does not need to be changed for topics in any field. This is because the structure of the dialogue, the field of the content, and the like are not assumed at all, and the detection of the change of the topic is performed based on the heuristic rules obtained from the actual person. Further, topic switching and topic detection are performed without time delay. That is, as in the conventional example, the topic stack is not used for the recognition and topic identification of topic conversion, and the change is grasped by detecting the difference between the current utterance and the utterance up to that point. Near real time detection of topic change is performed.

【0048】図2は、この発明の他の実施例による対話
処理装置を示した概略ブロック図である。
FIG. 2 is a schematic block diagram showing a dialog processing apparatus according to another embodiment of the present invention.

【0049】図2を参照して、この実施例の対話処理装
置101は、対話入力部103と、形態素解析部105
と、話題転換要因抽出部107と、話題候補語抽出部1
09と、解析情報統計処理部111と、単語の話題転換
寄与指数演算部113と、話題転換尤度評価部115
と、話題語同定部117とを含む。
Referring to FIG. 2, a dialogue processing apparatus 101 of this embodiment includes a dialogue input unit 103 and a morphological analyzer 105.
And topic conversion factor extraction unit 107 and topic candidate word extraction unit 1
09, an analysis information statistical processing unit 111, a word topic conversion contribution index calculation unit 113, and a topic conversion likelihood evaluation unit 115
And a topic word identification unit 117.

【0050】図1に示した実施例と異なる部分について
特に説明する。対話入力部103は、テキスト入力装置
19に加え、話者監視装置119と、発話推移時間監視
装置121とを含む。話者監視装置119には、人々の
発話が入力されており、話者監視装置119は現在の話
者が誰であるかを監視して、その監視結果を示す話者I
Dを解析情報統計処理部111に与える。発話推移時間
監視装置121には、人々の発話が入力されており、発
話推移時間監視装置121は発話行為に係る時間情報を
獲得する。そのような時間情報としては、現在の発話の
開始時刻と、現在の発話の終了時刻とが挙げられる。こ
れらの情報は解析情報統計処理部111に与えられる。
The parts different from the embodiment shown in FIG. 1 will be particularly described. The dialogue input unit 103 includes a speaker monitoring device 119 and an utterance transition time monitoring device 121 in addition to the text input device 19. The utterances of people are input to the speaker monitor 119, and the speaker monitor 119 monitors who the current speaker is, and indicates the speaker I indicating the monitoring result.
D is given to the analysis information statistical processing unit 111. The utterance transition time monitoring device 121 receives input of people's utterances, and the utterance transition time monitoring device 121 acquires time information related to the utterance act. Such time information includes the start time of the current utterance and the end time of the current utterance. These pieces of information are provided to the analysis information statistical processing unit 111.

【0051】次に、形態素解析部105は、単語辞書2
1に加え、対比語辞書123と、同義語辞書125とを
有する。したがって、形態素解析部105は、対比語辞
書123を用いて対比語(反意語)を検出する。同様
に、形態素解析部105は、同義語辞書125を用いて
同義語を検出する。そして、形態素解析部105の対比
語辞書123で得られた対比語リストは、解析情報統計
処理部111および後で説明する話題同定部117に与
えられる。さらに、形態素解析部105の同義語辞書1
25で得られた同義語リストは、話題転換要因抽出部1
07および話題語同定部117に与えられる。
Next, the morphological analysis unit 105 sends the word dictionary 2
1 and a comparison word dictionary 123 and a synonym dictionary 125. Therefore, the morphological analysis unit 105 detects a contrast word (antonym) using the contrast word dictionary 123. Similarly, the morphological analysis unit 105 uses the synonym dictionary 125 to detect synonyms. Then, the comparison word list obtained by the comparison word dictionary 123 of the morphological analysis unit 105 is provided to the analysis information statistical processing unit 111 and a topic identification unit 117 described later. Further, the synonym dictionary 1 of the morphological analysis unit 105
The synonym list obtained in 25 is the topic conversion factor extraction unit 1
07 and the topic word identification unit 117.

【0052】話題転換要因抽出部107は、話題転換要
因規則22を用いて、以下のような話題転換要因を抽出
して話題転換尤度評価部115に与える。すなわち、図
1の実施例で示したクルーワードの有無のみならず、疑
問文か否か、相手特定語の有無、同義語の数/有無、指
示語の数/有無、接続詞の数/有無を話題転換尤度評価
部115に与える。クルーワードの有無、疑問文か否
か、相手特定語の有無、指示語の数/有無および接続詞
の数/有無は、単語辞書21によって与えられた単語品
詞リストから、得られる。同義語の数/有無は、同義語
辞書125から得られた同義語リストによって得られ
る。
The topic conversion factor extraction unit 107 extracts the following topic conversion factors using the topic conversion factor rule 22 and provides the same to the topic conversion likelihood evaluation unit 115. That is, not only the presence or absence of the crew word shown in the embodiment of FIG. 1, but also the question sentence, the presence / absence of the partner specific word, the number / presence of synonyms, the number / presence of descriptive words, the number / presence of connectives This is given to the topic conversion likelihood evaluation unit 115. The presence / absence of a crew word, the presence or absence of a question, the presence / absence of a partner specific word, the number / presence of descriptive words, and the number / presence of connectives are obtained from the word part-of-speech list provided by the word dictionary 21. The number / presence of synonyms is obtained from a synonym list obtained from the synonym dictionary 125.

【0053】話題候補語抽出部109は、図1の話題候
補語抽出部9とほぼ同様であり、得られた話題候補語リ
ストを解析情報統計処理部111だけでなく、話題語同
定部117にも与える。
The topic candidate word extraction unit 109 is almost the same as the topic candidate word extraction unit 9 in FIG. 1, and the obtained topic candidate word list is sent to the topic word identification unit 117 in addition to the analysis information statistical processing unit 111. Also give.

【0054】次に、解析情報統計処理部111は、図1
の解析情報統計処理部11よりも多くの統計処理結果を
得て、それを話題転換尤度評価部115に与える。ま
ず、与えられた単語品詞リストに従って、解析情報統計
処理部111は、話題候補語の数/有無、各話題候補語
の転換寄与指数だけでなく、初出語の数/有無、初出語
かつ話題候補語の数/有無、各初出語の転換寄与指数を
話題転換尤度評価部115に与える。また、対話入力部
103に話者監視装置119および発話推移時間監視装
置121が加わったこと、形態素解析部105に対比語
辞書123が加わったことに伴って、解析情報統計処理
部111は以下のような統計情報を得て話題転換尤度評
価部115に与える。
Next, the analysis information statistical processing unit 111
The statistical information processing unit 11 obtains more statistical processing results than the analysis information statistical processing unit 11 and supplies it to the topic conversion likelihood evaluation unit 115. First, in accordance with the given word part-of-speech list, the analysis information statistical processing unit 111 determines not only the number / presence of topic candidate words and the conversion contribution index of each topic candidate word, but also the number / presence of first appearance words, first appearance word and topic candidate. The number / presence / non-existence of words and the conversion contribution index of each first word are given to the topic conversion likelihood evaluation unit 115. Also, with the addition of the speaker monitoring device 119 and the utterance transition time monitoring device 121 to the dialogue input unit 103 and the addition of the contrast word dictionary 123 to the morphological analysis unit 105, the analysis information statistical processing unit 111 Such statistical information is obtained and given to the topic change likelihood evaluator 115.

【0055】まず、形態素解析部105に対比語辞書1
23が加わったことに伴って、前文対比語の数/有無の
情報が得られ、それを話題転換尤度評価部115に与え
る。対話入力部103に話者監視装置119および発話
推移時間監視装置121が加わったことに伴って、解析
情報統計処理部111は、話者の交代の有無、前話題転
換からの経過時間、現発話者の前発話からの経過時間、
現発話の発話時間、および前発話終了から現発話開始ま
での時間に関する情報を得て、それを話題転換尤度評価
部115に与える。
First, the morphological analysis unit 105 sends the comparison word dictionary 1
With the addition of 23, information on the number / presence or absence of pre- sentence comparison words is obtained, and is provided to the topic conversion likelihood evaluation unit 115. With the addition of the speaker monitoring device 119 and the utterance transition time monitoring device 121 to the dialog input unit 103, the analysis information statistical processing unit 111 determines whether or not the speaker has been changed, the elapsed time since the previous topic change, the current utterance. Time since the previous utterance of the person,
Information about the utterance time of the current utterance and the time from the end of the previous utterance to the start of the current utterance is obtained, and the obtained information is provided to the topic conversion likelihood evaluation unit 115.

【0056】次に、単語の話題転換寄与指数演算部11
3は、解析情報統計処理部111が話題転換尤度評価部
115に各話題候補の転換寄与指数だけでなく、各初出
語の転換寄与指数をも与えるため、この各初出語の転換
寄与指数を演算して求め解析情報統計処理部111に与
える。
Next, the word topic conversion contribution index calculation unit 11
3 is that the analysis information statistical processing unit 111 gives the topic conversion likelihood evaluation unit 115 not only the conversion contribution index of each topic candidate but also the conversion contribution index of each first word. It is calculated and given to the analysis information statistical processing unit 111.

【0057】次に、話題転換尤度評価部115は、話題
転換要因抽出部107から与えられた話題転換要因、解
析情報統計処理部111から与えられた統計処理結果の
情報を含めて評価し、話題転換したか否かを決定する。
Next, the topic conversion likelihood evaluation unit 115 evaluates the topic conversion factor provided from the topic conversion factor extraction unit 107 and the information of the statistical processing result provided from the analysis information statistical processing unit 111. Determine if the topic has changed.

【0058】次に、話題語同定部117は、話題転換尤
度評価部115が話題転換があると評価したことに応じ
て、形態素解析部105の対比語辞書123および同義
語辞書125によって得られた対比語リストおよび同義
語リストと、話題候補語抽出部109によって得られた
話題候補語リストとに従って、話題語を同定し、話題1
27を利用者に提供する。
Next, the topic word identification unit 117 is obtained by the comparison word dictionary 123 and the synonym dictionary 125 of the morphological analysis unit 105 in response to the topic conversion likelihood evaluation unit 115 evaluating that there is topic conversion. A topic word is identified according to the compared word list and the synonym list and the topic candidate word list obtained by the topic candidate word extraction unit 109, and the topic 1 is identified.
27 is provided to the user.

【0059】このような新たな構成を加えた対話処理装
置101では、図1に示す実施例と同様に、話題転換の
ほぼ実時間による検出が可能となる。さらに、新たな構
成によって以下のような効果が得られる。
In the dialogue processing apparatus 101 having such a new configuration, it is possible to detect a topic change almost in real time, as in the embodiment shown in FIG. Further, the following effects can be obtained by the new configuration.

【0060】まず、話者監視装置119によって、話者
指定による話題転換の発生のルールが適用可能となり、
転換検出精度が向上する。次に、発話推移時間監視装置
121によって、発話と発話の間の空きかたによる話題
転換の発生のルールが適用可能となり、転換検出精度が
向上する。次に、同義語辞書125および対比語辞書1
23の使用により、同義語および対比語による話題転換
のルールが適用可能となり、転換検出精度が向上する。
次に、話題語同定部117の追加によって、話題転換検
出時に転換した話題を表わす語の抽出が可能となる。
First, the speaker monitoring device 119 makes it possible to apply the rule of occurrence of topic change by speaker designation,
Conversion detection accuracy is improved. Next, the utterance transition time monitoring device 121 makes it possible to apply a rule of occurrence of a topic change based on a vacant manner between utterances, thereby improving the accuracy of change detection. Next, the synonym dictionary 125 and the comparison word dictionary 1
The use of 23 makes it possible to apply the rule of topic conversion using synonyms and contrast words, and improves conversion detection accuracy.
Next, with the addition of the topic word identification unit 117, it is possible to extract a word representing a topic that has been changed when a topic change is detected.

【0061】なお、話題語同定部117が同定した結果
が解析情報統計処理部111に与えられてもよい。そし
て与えられた話題語が何度話題化に寄与したかを示す話
題化回数が解析情報統計処理部111で統計処理されれ
ば、より話題転換検出精度が向上する。
Note that the result identified by the topic word identification unit 117 may be given to the analysis information statistical processing unit 111. If the number of topicalizations indicating how many times the given topic word contributed to topicalization is statistically processed by the analysis information statistical processing unit 111, the topic conversion detection accuracy is further improved.

【0062】次に、このような効果をもたらす本装置の
動作について詳しく説明する。まず、対話入力部103
のテキスト入力装置19は、入力された発話をコンピュ
ータ処理可能な形式(テキスト)に変換し、形態素解析
部105の対比語辞書123、単語辞書21および同義
語辞書125に与える。また、話者監視装置119によ
って現在の話者が監視される。そして、発話推移時間監
視装置121は、発話行為にかかる推移時間情報を検出
する。そして、話者監視装置119の出力である検出結
果(話者id)および話者推移時間監視装置の検出結果
が解析情報統計処理部111に与えられる。
Next, the operation of the present apparatus that produces such effects will be described in detail. First, the dialogue input unit 103
The text input device 19 converts the input utterance into a format (text) that can be processed by a computer, and supplies the converted utterance to the contrast word dictionary 123, the word dictionary 21, and the synonym dictionary 125 of the morphological analysis unit 105. Further, the current speaker is monitored by the speaker monitoring device 119. Then, the utterance transition time monitoring device 121 detects transition time information relating to the utterance act. Then, the detection result (speaker id) output from the speaker monitoring device 119 and the detection result of the speaker transition time monitoring device are provided to the analysis information statistical processing unit 111.

【0063】形態素解析装置105は、同義語辞書12
5および対比語辞書123を使用して、同義語および対
比語の検出を行なう。その検出された結果である同義語
リストは話題転換要因抽出部107および話題語同定部
117に与えられ、対比語リストは解析情報統計処理部
111および話題語同定部117に与えられる。
The morphological analysis device 105 operates in the synonym dictionary 12
5 and the comparison word dictionary 123 are used to detect synonyms and comparison words. The synonym list that is the result of the detection is provided to the topic conversion factor extraction unit 107 and the topic word identification unit 117, and the comparison word list is provided to the analysis information statistical processing unit 111 and the topic word identification unit 117.

【0064】話題転換要因抽出部107は、図1の実施
例で示したように形態素解析部105の単語辞書21か
ら与えられた単語品詞リストに従って、話題転換要因と
して以下の情報を検出する。その以下の情報とは、第1
はクルーワードの有無であり、第2は疑問文か否かであ
り、第3は相手特定語の有無であり、第4は同義語(同
語)の数/有無であり、第5は、指示語の数/有無であ
り、第6は、接続詞の数/有無である。
The topic conversion factor extraction unit 107 detects the following information as a topic conversion factor according to the word part of speech list given from the word dictionary 21 of the morphological analysis unit 105 as shown in the embodiment of FIG. The following information is the first
Is the presence or absence of a crew word, the second is whether or not it is a question sentence, the third is the presence or absence of a partner specific word, the fourth is the number / presence of synonyms (synonyms), and the fifth is The sixth is the number / presence of connectives.

【0065】第1のクルーワードとは、一般に明示的に
話題の転換を促す語(句)であり、その例としては、と
ころで、次に、話変わって、それから、後、等が挙げら
れる。このクルーワードの有無は、話題転換要因抽出部
107に与えられる単語品詞リストから、話題転換要因
規則22に記述されるクルーワードに相当する語が見つ
け出されることで得られる。
The first crew word is generally a word (phrase) that explicitly prompts a change in topic, and examples thereof include, but not limited to, the next one, the second, and the like. The presence or absence of the crew word is obtained by finding a word corresponding to the crew word described in the topic conversion factor rule 22 from the word part of speech list provided to the topic conversion factor extraction unit 107.

【0066】第2の疑問文か否かは、疑問文が出現した
場合に話題転換として認識されやすいという、実験に基
づくヒューリスティックなルールによって得られる情報
である。この疑問文か否かは、話題転換要因抽出部10
7に与えられる単語品詞リストから、話題転換要因規則
22に記述される疑問文に相当するかどうかが判断され
ることで得られる。
The second question sentence is information obtained by an experimental heuristic rule that, when a question sentence appears, it is easily recognized as a topic change. Whether the sentence is a question sentence is determined by the topic conversion factor extraction unit 10.
7 is determined by determining from the word part-of-speech list given to 7 whether or not it corresponds to the question sentence described in the topic conversion factor rule 22.

【0067】第3の相手特定語の有無は、対話に参加し
ている特定の人に向かって話しかける場合に話題転換と
して認識されやすいという、実験に基づくヒューリステ
ィックなルールによって得られる情報である。たとえ
ば、参加者の名前、人称代名詞が挙げられる。この相手
特定語の有無は、話題転換要因抽出部107に与えられ
る単語品詞リストから、話題転換要因規則22に記述さ
れる相手特定語に相当する語が取出されることで得られ
る。
The presence / absence of the third partner specific word is information obtained by a heuristic rule based on an experiment, which is easily recognized as a topic change when talking to a specific person participating in the dialogue. For example, a participant's name and personal pronoun are mentioned. The presence / absence of this partner specific word is obtained by extracting a word corresponding to the partner specific word described in the topic conversion factor rule 22 from the word part-of-speech list provided to the topic conversion factor extraction unit 107.

【0068】第4の同義語の数/有無は、1発話または
1文中に同義語(同語)が出現する場合、それらの語は
強調されている(つまり話題を示す語である)と認識さ
れやすいという、実験に基づくヒューリスティックなル
ールによって得られる情報である。この同義語の数/有
無は、話題転換要因抽出部107に与えられる同義語リ
ストから同義語が取出されることで得られる。
The number / presence of the fourth synonym is that if synonyms (synonyms) appear in one utterance or one sentence, those words are recognized as being emphasized (that is, words indicating a topic). This is information obtained by a heuristic rule based on experimentation. The number / presence of the synonyms is obtained by extracting the synonyms from the synonym list provided to the topic conversion factor extraction unit 107.

【0069】第5の指示語の数/有無は、前発話に関す
る指示語が出現する発話は話題が継続しているものと認
識しやすいという実験に基づくヒューリスティックなル
ールによって得られる情報である。この指示語の数/有
無は、話題転換要因抽出部107に与えられる単語品詞
リストから指示語が取出されることで得られる。
The number / presence of the fifth directive is information obtained by a heuristic rule based on an experiment that it is easy to recognize that the utterance in which the directive relating to the previous utterance appears is a continuing topic. The number / presence / non-presence of the descriptive words is obtained by extracting the descriptive words from the word part-of-speech list provided to the topic conversion factor extraction unit 107.

【0070】第6の接続詞の数/有無は、前発話に対す
る接続詞が出現する発話は話題が継続しているものと認
識されやすいという実験に基づくヒューリスティックな
ルールによって得られる情報である。この接続詞の数/
有無は、話題転換要因抽出部107に与えられる単語品
詞リストから接続詞が取出されることで得られる。
The number / presence / absence of the sixth connective is information obtained by a heuristic rule based on an experiment that an utterance in which a connective to the previous utterance appears is likely to be recognized as a continuing topic. Number of this conjunction /
The presence / absence is obtained by extracting a conjunction from the word part-of-speech list provided to the topic conversion factor extraction unit 107.

【0071】次に、話題候補語抽出部109は、話題化
規則23によって話題候補語を抽出する。その話題規則
23としては、以下のようなものが挙げられる。
Next, the topic candidate word extraction unit 109 extracts topic candidate words according to the topicization rule 23. The topic rules 23 include the following.

【0072】まず第1は、強調文の名詞が話題候補語と
される。強調文の例としては名詞+助動詞「だ」、また
は名詞+助動詞「で」が挙げられる。第2は、体言止め
の名詞が話題候補語とされる。たとえば、名詞+句
点「。」の構文の場合の名詞が話題候補語とされる。
First, the noun of the emphasized sentence is set as a topic candidate word. Examples of the emphasized sentence include a noun + auxiliary verb "da" or a noun + auxiliary verb "de". Secondly, nouns that are absent are considered topic candidate words. For example, a noun in the case of a noun + phrase "." Syntax is a topic candidate word.

【0073】第3は、名詞+格助詞+提題助詞の構文の
場合の名詞が話題候補語とされる。第4は、名詞+提題
助詞の構文の場合の名詞が話題候補語とされる。第5
は、名詞+副助詞+提題助詞の構文の場合の名詞が話題
候補語とされる。第6は、名詞+取立助詞の構文の場合
の名詞が話題候補語とされる。第7は、名詞+格助詞+
取立助詞の構文の場合の名詞が話題候補語とされる。
Third, a noun in the case of the syntax of noun + case particle + proposal particle is regarded as a topic candidate word. Fourth, a noun in the case of a noun + proposal particle structure is a topic candidate word. Fifth
Is a topic candidate word in the case of the syntax of noun + accessory particle + proposed particle. Sixth, a noun in the case of a noun + collection particle construction is a topic candidate word. The seventh is noun + case particle +
A noun in the case of the collection particle is regarded as a topic candidate word.

【0074】第8は、存在文の場合の名詞が話題候補語
される。存在文の例としては、名詞+格助詞「が」+あ
る(本動詞語幹)、名詞+格助詞「が」+い(本動詞語
幹)、または名詞+格助詞「が」+あ(本動詞語幹)の
構文が挙げられる。
Eighth, nouns in the case of existence sentences are topic candidate words. Examples of existence sentences include noun + case particle "ga" + a (main verb stem), noun + case particle "ga" + i (main verb stem), or noun + case particle "ga" + a (main verb) Stem) syntax.

【0075】第9は、名詞+副助詞+取立助詞の構文の
場合の名詞が話題候補語とされる。第10は、名詞+副
助詞「とか」の構文の場合の名詞が話題候補語とされ
る。
Ninthly, nouns in the case of a noun + adjunctive + collective particle syntax are set as topic candidate words. Tenth, a noun in the case of a noun + adjunct particle “toka” syntax is set as a topic candidate word.

【0076】このような話題候補語をも入力される解析
情報統計処理部111は、以下のように管理表を作成し
て情報を管理する。
The analysis information statistical processing unit 111 to which such topic candidate words are also input creates a management table as described below to manage information.

【0077】図3は、そのような管理を説明するための
第1の図であり、図4は、そのような管理を説明するた
めの第2の図であり、図5は、そのような管理を説明す
るための第3の図である。
FIG. 3 is a first diagram illustrating such management, FIG. 4 is a second diagram illustrating such management, and FIG. 5 is a diagram illustrating such management. It is the 3rd figure for explaining management.

【0078】図3から図5を参照して、解析情報統計処
理部111は、図3の対話管理表201で管理する。対
話管理表201には、カレント・メタ情報203と、話
者情報205と、言語情報207と、文脈情報209と
が含まれる。カレント・メタ203には、発話番号、文
番号、発話内文番号および発話IDが含まれる。
Referring to FIGS. 3 to 5, the analysis information statistical processing unit 111 manages the information in the dialog management table 201 shown in FIG. The dialog management table 201 includes current meta information 203, speaker information 205, language information 207, and context information 209. The current meta 203 includes an utterance number, a sentence number, an in-utterance sentence number, and an utterance ID.

【0079】話者情報205は、話者IDを添字とする
配列で示されている。たとえば、話者IDが0の情報に
は、最近発話文番号211と、最近発話時刻213と、
全発話回数215と、名前217とが情報として含まれ
る。このような話者情報に関しては後で具体的に説明す
る。
The speaker information 205 is shown in an array with the speaker ID as a subscript. For example, information with a speaker ID of 0 includes a recently uttered sentence number 211, a recently uttered time 213,
The total number of utterances 215 and the name 217 are included as information. Such speaker information will be specifically described later.

【0080】言語情報207には名詞要素リスト219
が含まれる。名詞要素リスト219は、図4に示すよう
に、見出し語221、出現回数223、ENTRY(対
比語)225と、話題化回数227と、話題認識回数2
29と、最新使用文番号231と、Left(左)23
3と、Right(右)235とが含まれる。見出し語
221は、シソーラス同義語情報により正規化されてい
る。ENTRY(対比語)225は、反対語を参照する
ために取入れられている。そして、名詞要素リスト21
9のLeft(左)233には、さらに名詞要素リスト
237が記録され、名詞要素リスト219のRight
(右)235には名詞要素リスト239が記録されてい
る。このように、左右の名詞要素リストが各名詞要素リ
ストに記録されることにより、ツリー構造が作られる。
これにより、検索が容易となる。このような、名詞要素
リストについては後で具体的に説明する。
The language information 207 includes a noun element list 219
Is included. As shown in FIG. 4, the noun element list 219 includes a headword 221, an appearance frequency 223, an ENTRY (comparison word) 225, a topic frequency 227, and a topic recognition frequency 2
29, latest sentence number 231 and Left (left) 23
3 and Right (right) 235 are included. The headword 221 is normalized by thesaurus synonym information. ENTRY (comparison word) 225 has been incorporated to refer to the opposite word. And the noun element list 21
9, a noun element list 237 is further recorded in Left (left) 233 of No. 9, and Right of the noun element list 219 is recorded.
(Right) 235 records a noun element list 239. Thus, a tree structure is created by recording the left and right noun element lists in each noun element list.
This facilitates the search. Such a noun element list will be specifically described later.

【0081】次に、図3の対話管理表201に戻って、
対話管理表201の文脈情報209には、カレント情報
241と、短期発話メモリ(FIFO)243とが含ま
れる。カレント情報241には、最近転換文番号245
と、現在の話題247とが含まれる。
Next, returning to the dialog management table 201 of FIG.
The context information 209 of the dialog management table 201 includes current information 241 and a short-term utterance memory (FIFO) 243. The current information 241 includes a recent conversion sentence number 245.
And the current topic 247.

【0082】このようなカレント情報241以外のカレ
ント情報は、短期発話メモリ(FIFO)243に含ま
れており、短期発話メモリ(FIFO)243は、5つ
の発話情報によって形成されている。その1つの発話情
報249は、図5に示すように、発話番号251と、発
話者番号253と、文情報リスト255と、前発話情報
ポインタ257とを含む。そして、文情報255は、文
番号259と、発話内文番号261と、各種指標(ビッ
ト表現)263と、有題文フラグ265と、チャート
(形態素情報ほか)267と、NEXT文情報269と
を含む。さらに、各種指標(ビット表現)263は、位
置と区分と内容によって項分けされた情報271を含
む。このような、発話情報249および文情報255に
ついては後で説明する。
The current information other than the current information 241 is included in the short-term speech memory (FIFO) 243, and the short-term speech memory (FIFO) 243 is formed by five pieces of speech information. As shown in FIG. 5, the one utterance information 249 includes an utterance number 251, a speaker number 253, a sentence information list 255, and a previous utterance information pointer 257. The sentence information 255 includes a sentence number 259, an in-speech sentence number 261, various indexes (bit representation) 263, a title sentence flag 265, a chart (morphological information and the like) 267, and NEXT sentence information 269. Including. Further, the various indexes (bit representation) 263 include information 271 classified according to position, division, and content. Such utterance information 249 and sentence information 255 will be described later.

【0083】次に、表1から表4を用いて具体的に説明
する。
Next, a specific description will be given with reference to Tables 1 to 4.

【0084】[0084]

【表1】 [Table 1]

【0085】[0085]

【表2】 [Table 2]

【0086】[0086]

【表3】 [Table 3]

【0087】[0087]

【表4】 [Table 4]

【0088】表1に示すような対話管理表が得られてい
るとする。すなわち、発話番号は13であり、文番号は
23であり、発話内文番号は1であり、話者IDは0の
情報が得られているとする。この情報は、以下のような
状態を示している。すなわち、話者ID.0(名前は黒
鉄)の人が喋っている状態は、ある基準から数えて13
番目の発話であり、同じ基準から数えて23番目の文で
あること、さらに、13番目の発話内おける1番目の文
であることを示している。
It is assumed that a dialog management table as shown in Table 1 has been obtained. That is, it is assumed that the utterance number is 13, the sentence number is 23, the in-speech sentence number is 1, and the information of the speaker ID is 0. This information indicates the following state. That is, the speaker ID. The state where a person with 0 (name is black iron) is speaking is 13 from a certain standard.
This indicates that the utterance is the 23rd sentence counted from the same criterion, and is the first sentence in the 13th utterance.

【0089】さらに、表2の話者情報によって、現在発
話を行なっている話者IDが0の人の前に発話を行なっ
た人は、話者IDが2の人であることが最近の文番号の
示す値からわかる。また、話者IDが0、1および2の
全員の全発話回数を加えれば、12であることより、表
1の対話管理表における発話番号が13であることも明
らかである。そして、表2の話者情報の各話者IDごと
の情報は、図3の話者情報205と対応している。
Further, according to the speaker information shown in Table 2, the recent sentence that the person who uttered before the person whose speaker ID is currently uttering 0 is the person whose speaker ID is 2 is indicated. It can be seen from the value indicated by the number. In addition, if the total number of utterances of all the speaker IDs 0, 1, and 2 is added, the utterance number in the dialog management table in Table 1 is 13 because it is 12. The information for each speaker ID in the speaker information in Table 2 corresponds to the speaker information 205 in FIG.

【0090】次に、表1の対話管理表の言語情報(名詞
要素リスト)は、具体的には表3に示されるような情報
である。表3の各見出し語に対応した情報が、図4の名
詞要素リスト219,237,239のそれぞれに対応
している。特に、話題化回数は、話題候補語抽出部10
9によって得られ、話題認識回数は、話題語同定部11
7によって得られる。
Next, the linguistic information (noun element list) in the dialog management table in Table 1 is information as specifically shown in Table 3. Information corresponding to each headword in Table 3 corresponds to each of the noun element lists 219, 237, and 239 in FIG. In particular, the number of topics is determined by the topic candidate word extraction unit 10.
9 and the topic recognition frequency is calculated by the topic word identification unit 11
7 obtained.

【0091】ところで、表3には単語評価値(%)が記
載されているが、図4の名詞要素リストにはそのような
記載はない。これは、単語の話題転換寄与指数演算部1
13で得られる話題転換寄与指数が解析情報統計処理部
111にフィードバックされてもまたはされなくてもよ
いことを示すためである。すなわち、表3で得られる名
詞要素リストの場合には、単語の話題転換寄与指数演算
部113からの話題転換寄与指数のフィードバックがあ
った場合であり、図4に示す名詞要素リストの場合には
単語の話題転換寄与指数演算部113からの話題転換寄
与指数がフィードバックされず、話題転換尤度評価部1
15に直接与えられた場合である。したがって、単語の
話題転換寄与指数演算部113の出力が解析情報統計処
理部111にフィードバックされない場合には、各話題
候補語の転換寄与指数および各初出語の転換寄与指数は
単語の話題転換寄与指数演算部113から話題転換尤度
評価部115に直接入力される。話題転換寄与指数のフ
ィードバックが必要な場合としては、話題転換寄与指数
を求める関数が漸化式で表現されており、以前の話題転
換寄与指数の値が現在の話題転換寄与指数の計算のため
に必要な場合などが挙げられる。
By the way, although the word evaluation value (%) is described in Table 3, there is no such description in the noun element list of FIG. This is the word topic conversion contribution index calculation unit 1
This is to indicate that the topic conversion contribution index obtained in 13 may or may not be fed back to the analysis information statistical processing unit 111. That is, in the case of the noun element list obtained in Table 3, feedback of the topic conversion contribution index from the word topic conversion contribution index calculation unit 113 is performed, and in the case of the noun element list shown in FIG. The topic conversion contribution index from the word topic conversion contribution index calculation unit 113 is not fed back, and the topic conversion likelihood evaluation unit 1
15 directly. Therefore, when the output of the word topic conversion contribution index calculation unit 113 is not fed back to the analysis information statistical processing unit 111, the conversion contribution index of each topic candidate word and the conversion contribution index of each first appearance word are the topic conversion conversion index of the word. It is directly input from the operation unit 113 to the topic conversion likelihood evaluation unit 115. When the feedback of the topic conversion contribution index is required, the function for calculating the topic conversion contribution index is expressed by a recurrence formula, and the value of the previous topic conversion contribution index is used to calculate the current topic conversion contribution index. Such cases may be necessary.

【0092】次に、対話管理表の文情報は、具体的には
表4に示すような情報である。表4に示す文脈情報は、
発話情報と文情報に大きく分けて別れている。
Next, the sentence information of the dialog management table is information as specifically shown in Table 4. The context information shown in Table 4 is
It is roughly divided into utterance information and sentence information.

【0093】発話情報には、Uで表わされる発話番号
と、各発話の開始時刻および終了時刻と、転で表わされ
る話題が転換した文番号と、ワダイとが示されている。
発話番号U=9は、開始時刻が14時30分05秒であ
り、終了時刻が14時30分10秒である。発話番号U
=10の開始時刻は14時30分11秒であり、終了時
刻は14時30分20秒である。発話番号U=11の開
始時刻は14時30分22秒であり、終了時刻は14時
30分43秒である。発話番号U=12の開始時刻は1
4時30分44秒であり、終了時刻は14時30分46
秒である。そして、発話番号U=13の開始時刻は14
時30分51秒である。発話情報の最新の入力文は、発
話番号が13、話題転換の文番号が23、話題がお二人
となっており、表1の対話管理表に対応している。
The utterance information includes an utterance number represented by U, a start time and an end time of each utterance, a sentence number in which the topic represented by the word is changed, and a wadai.
The utterance number U = 9 has a start time of 14:30:05 and an end time of 14:30:10. Utterance number U
The start time of = 10 is 14:30:11, and the end time is 14:30:20. The start time of the utterance number U = 11 is 14:30:22, and the end time is 14:30:43. The start time of the utterance number U = 12 is 1
4:30:44 and end time is 14:30:46
Seconds. And the start time of the utterance number U = 13 is 14
It is 30:30 and 51 seconds. The latest input sentence of the utterance information has an utterance number of 13, a topic change sentence number of 23, and two topics, and corresponds to the dialog management table in Table 1.

【0094】文情報には、メタ情報と、各種指標(ビッ
ト表現)と、その他の情報が示される。メタ情報には、
表でSで表わされる文番号と、SUで表わされる発話内
の文番号が示されている。最新の入力文である文番号が
23、発話内の文番号が1となっており、表1の対話管
理表と対応している。
The sentence information includes meta information, various indexes (bit representation), and other information. Meta information includes
In the table, a sentence number represented by S and a sentence number in an utterance represented by SU are shown. The sentence number which is the latest input sentence is 23, and the sentence number in the utterance is 1, which corresponds to the dialog management table in Table 1.

【0095】各種指標(ビット表現)には、後続要因、
前節要因、転換要因、判定が含まれる。後続要因には、
表でQで表わされる疑問文であるか否かを示す情報が示
されている。前節要因には、表でそれぞれ接、指、同、
対で表わされるように、接続詞、指示語、同義語、対比
語を示す情報が示されている。転換要因には、それぞれ
初、クル、初提、相、題で示される、初出語の有無、ク
ルーワードの有無、初出語でありかつ話題候補語である
語の有無、対話の相手を特定する語の有無、話題候補語
の有無を示す情報が示されている。
The following indices (bit expressions) include the following factors:
The factors in the previous section, conversion factors, and judgment are included. Subsequent factors include:
Information indicating whether or not the question is represented by Q in the table is shown. The factors in the previous section include contact, finger,
As shown by a pair, information indicating a conjunction, a descriptive word, a synonym, and a contrast word is shown. The conversion factors include the presence of the first word, presence of the crew word, presence of the word that is the first word and a topic candidate word, and the partner of the dialogue, which are indicated by the first, kuru, first proposal, phase, and title, respectively. Information indicating presence / absence of a word and presence / absence of a topic candidate word is shown.

【0096】判定には、表で転で示す話題の転換があっ
たか否かを示す情報が示されている。発話推移時間監視
装置121がある場合に、ここに話題転換が発生した発
話の開始時刻が記録される。
In the judgment, information indicating whether or not there is a change in the topic indicated in the table is shown. If the utterance transition time monitoring device 121 is present, the start time of the utterance where the topic change occurred is recorded here.

【0097】このように表4で示される文脈情報のたと
えばメタ情報の文番号が16から21にかけての情報
が、図5の発話情報249に対応し、文脈情報の各1行
が図5の文脈情報255に対応する。
As described above, the context information shown in Table 4, for example, information in which the sentence number of the meta information is 16 to 21 corresponds to the utterance information 249 in FIG. 5, and each line of the context information corresponds to the context in FIG. This corresponds to the information 255.

【0098】なお、図3から図5および表1から表4を
用いた解析情報統計処理部では、統計処理する必要のな
い情報も管理しているが、図2に示すように解析情報統
計処理部111から出力する情報に関してのみ管理して
もよい。
The analysis information statistical processing unit using FIGS. 3 to 5 and Tables 1 to 4 also manages information that does not need to be subjected to statistical processing, but as shown in FIG. Only the information output from the unit 111 may be managed.

【0099】以上のように、解析情報統計処理部111
は、種々の情報を統計処理する。次に、このような統計
処理の結果得られる入力された単語の出現頻度および最
近出現してからの経過時間に従って、単語の話題転換寄
与指数演算部113は話題転換寄与指数を求める。入力
された単語の出現頻度をfで表わし、最近出現してから
の経過時間をtで表わすと、第(1)式に示すような関
数によって寄与指数hが求められる。また、第(1)式
の右辺のg(t)は、第(2)式によって与えられる。
As described above, the analysis information statistical processing unit 111
Performs statistical processing on various information. Next, in accordance with the appearance frequency of the input word obtained as a result of such statistical processing and the elapsed time since the latest appearance, the word topic conversion contribution index calculation unit 113 obtains a topic conversion contribution index. If the appearance frequency of the input word is represented by f and the elapsed time since the most recent appearance is represented by t, the contribution index h is obtained by a function as shown in equation (1). Further, g (t) on the right side of Expression (1) is given by Expression (2).

【0100】 h=:e−g(t)f…(1) g(t)=(1+kt)−1…(2) ここで、kは時間の重みを調整する計数である。このよ
うな関数は図6に示されるような関数となる。
H =: e− g (t) f (1) g (t) = (1 + kt) −1 (2) where k is a count for adjusting the weight of time. Such a function is a function as shown in FIG.

【0101】図6におけるグラフでは、平面座標の一方
の軸がt(経過時間)であり、他方の軸がf(出現頻
度)とされており、さらに縦軸にはh(評価値)が取ら
れている。図6から明らかなように、前に出現してから
今回出現するまでの経過時間が長いほど、評価値の値は
大きくなっている。これに対して、出現回数が増えるほ
ど、評価値の値は小さくなっている。
In the graph of FIG. 6, one axis of the plane coordinates is t (elapsed time), the other axis is f (frequency of appearance), and the vertical axis is h (evaluation value). Have been. As is clear from FIG. 6, the longer the elapsed time from the previous appearance to the current appearance, the larger the value of the evaluation value. On the other hand, as the number of appearances increases, the value of the evaluation value decreases.

【0102】なお、第(1)式で初出語の場合のfの値
は0とする。すなわち、初出語は必ず評価値(h)の値
が1とされるように設定されている。
In the expression (1), the value of f in the case of the first word is 0. That is, the first word is set so that the evaluation value (h) is always 1.

【0103】このように、ある単語が初めて出現した場
合に、または久し振りに出現した場合に寄与率が高く、
逆にしばしば出現する場合、またはほんのちょっと前に
も出現したことがある場合に寄与率が低くなるような関
数が用いられることで、話題転換の評価が可能となって
いる。
As described above, the contribution rate is high when a certain word first appears or after a long time,
Conversely, by using a function that reduces the contribution ratio when it frequently appears or when it appears just before, it is possible to evaluate the topic change.

【0104】図7は、第(1)式に示されるような関数
が実際にどのような値を示すかを実験した結果を示した
グラフである。図7において、横軸は出現時刻(t)を
示し、縦軸は出現単語話題転換指数(h)を示す。ただ
し、出現時刻(t)として、実際の経過時間でなく文字
数を使用し、k=0.01と設定されている。さらに、
ある対談記事中の「男」という単語の寄与指数について
図7に示すグラフは表わしている。
FIG. 7 is a graph showing the result of an experiment on what value the function as shown in the equation (1) actually shows. In FIG. 7, the horizontal axis indicates the appearance time (t), and the vertical axis indicates the appearance word topic conversion index (h). However, the number of characters is used as the appearance time (t) instead of the actual elapsed time, and k is set to 0.01. further,
The graph shown in FIG. 7 shows the contribution index of the word "male" in a certain talk article.

【0105】図7を参照して、t=2000までは連続
的に「男」という単語が頻出するので、寄与指数は時間
とともに低下している。しかし、t=2000から50
00の間では発話中に出現していないため、t=500
0付近で出現した際の寄与指数は再び高く評価されてい
る。つまり、t=1500辺りでは「男」という単語に
よる話題転換はあまり促進されていないが、t=500
0付近で再出現した際には「男」によって話題が転換す
る可能性が高いことを、図7に示すグラフは表わしてい
る。
Referring to FIG. 7, since the word "male" appears frequently up to t = 2000, the contribution index decreases with time. However, t = 2000 to 50
During the period between 00 and 00, t = 500
The contribution index when appearing near zero is again highly evaluated. That is, at around t = 1500, topic switching by the word “male” is not so much promoted, but at t = 500
The graph shown in FIG. 7 indicates that the topic is likely to be changed by "male" when reappearing near zero.

【0106】次に、話題転換尤度評価部115について
説明する。話題転換尤度評価部115は、3層のニュー
ラルネットで構成されている。入力層に与えられるデー
タと、各データの取り得る値は以下のとおりである。
Next, the topic conversion likelihood evaluation section 115 will be described. The topic conversion likelihood evaluation unit 115 is configured by a three-layer neural network. The data given to the input layer and the possible values of each data are as follows.

【0107】第1は、クルーワードの有無である。この
クルーワードは、なしの場合0の値を取り、ありの場合
1の値を取る。このようなクルーワードの有無は、前述
したように話題転換要因抽出部107によって話題転換
尤度評価部115に与えられる。
The first is the presence or absence of a crew word. This crew word takes a value of 0 when there is no crew word, and takes a value of 1 when there is a crew word. The presence or absence of such a crew word is given to the topic conversion likelihood evaluation unit 115 by the topic conversion factor extraction unit 107 as described above.

【0108】第2は、疑問文か否かである。疑問文であ
る場合は1を取り、それ以外は0を取る。このような疑
問文か否かは、話題転換要因抽出部107によって与え
られる。
The second is whether it is a question sentence or not. If the question is a question, take 1; otherwise, take 0. Whether or not such a question sentence is given by the topic conversion factor extraction unit 107.

【0109】第3は、相手特定語の有無である。対話の
相手を特定する語がない場合には0を取り、ある場合に
は1を取る。このような対話の相手を特定する語の有無
は、話題転換要因抽出部107によって与えられる。
The third is the presence / absence of a partner specific word. If there is no word identifying the conversation partner, 0 is taken, and in some cases, 1 is taken. The presence / absence of a word specifying such a conversation partner is given by the topic conversion factor extraction unit 107.

【0110】第4は、同義語の数/有無である。同義語
(同語)が1発話または1文中に含まれない場合には0
を取り、含まれる場合には1またはその個数の値を取
る。このような同義語(同語)が1発話または1文中に
含まれている数は、同義語辞書125で得られた同義語
リストから同義語の数がカウントされることで得られ
る。
The fourth is the number / presence of synonyms. 0 if a synonym (synonym) is not included in one utterance or sentence
And if it is included, take 1 or its value. The number of such synonyms (synonym) included in one utterance or one sentence is obtained by counting the number of synonyms from the synonym list obtained in the synonym dictionary 125.

【0111】第5は、指示語の数/有無である。指示語
がない場合には0を取り、ある場合には1またはその個
数の値を取る。このような指示語の数は、単語辞書21
から得られた単語品詞リストから指示語が数えられるこ
とで得られる。
Fifth is the number / presence / non-presence of the descriptive words. If there is no descriptive word, it takes 0, and if it does, it takes 1 or its value. The number of such descriptive words is determined by the word dictionary 21
Are obtained by counting descriptive words from the word part-of-speech list obtained from.

【0112】第6は、接続詞の数/有無である。接続詞
がない場合には0を取り、ある場合には1またはその個
数の値を取る。このような接続詞の数は、単語辞書21
から得られる単語品詞リストの接続詞が取出されること
で得られる。
The sixth is the number / presence of connectives. If there is no conjunction, it takes 0, and if there is, it takes 1 or its number. The number of such conjunctions can be found in the word dictionary 21
Is obtained by extracting the conjunction of the word part-of-speech list obtained from.

【0113】第7は、初出語の数/有無である。初出語
がない場合には0を取り、ある場合には1またはその個
数の値を取る。このような初出語の有無や数は単語辞書
21から与えられる単語品詞リストが解析情報統計処理
部11で統計処理されることで得られる。
The seventh is the number / presence of first words. If there is no first word, it takes 0, and if there is, it takes 1 or its value. The presence or absence and the number of such first words are obtained by statistically processing the word part-of-speech list provided from the word dictionary 21 by the analysis information statistical processing unit 11.

【0114】第8は、話題候補語の数/有無である。話
題候補語がない場合には0を取り、ある場合には1また
はその個数の値を取る。話題候補語の数や有無は、話題
候補語抽出部109で得られた話題候補語リストから話
題候補語が抽出されて得られる。
Eighth is the number / presence of topic candidate words. If there is no topic candidate word, 0 is taken, and if there is, 1 or the value of the number is taken. The number and presence / absence of topic candidate words are obtained by extracting topic candidate words from the topic candidate word list obtained by the topic candidate word extraction unit 109.

【0115】第9は、初出語かつ話題候補語の語の有無
/数である。初出語かつ話題候補語である語がない場合
には0を取り、ある場合には1またはその個数の値を取
る。このような初出語かつ話題候補語である語の有無や
数は、初出語の数/有無と話題候補語の数/有無より得
られる。
The ninth is the presence / absence / number of words that are new words and topic candidate words. When there is no word that is the first word and topic candidate word, 0 is taken, and in some cases, 1 or a value of the number is taken. The presence / absence and the number of such words that are first words and topic candidates are obtained from the number / presence of first words and the number / presence of topic candidate words.

【0116】第10は、前文または前発話に含まれた語
の対比語の数/有無である。前文または前発話に含まれ
た語の対比語がない場合には0を取り、ある場合には1
またはその個数の値を取る。このような前文または前発
話に含まれた語の対比語の数や有無は、単語品詞リスト
から統計処理されて得られた情報と、現発話から出力さ
れた対比語リストとが比べられることで、対比語リスト
に含まれる語は前発話に現れているかどうかが調べられ
て得られる。
The tenth is the number / presence / absence of words compared with words included in the preceding sentence or the previous utterance. If there is no contrast word of the word included in the previous sentence or previous utterance, 0 is taken, and if there is, there is 1
Or take the value of that number. The number and presence / absence of such words in the previous sentence or previous utterance are determined by comparing the information obtained by statistical processing from the word part-of-speech list with the comparative word list output from the current utterance. The word included in the contrast word list is obtained by checking whether or not the word appears in the previous utterance.

【0117】第11は、各初出語の転換寄与指数であ
る。この話題転換寄与指数は0以上1以下の実数を取
り、初出語がない場合には0を取る。
Eleventh is the conversion contribution index of each first word. This topic conversion contribution index takes a real number between 0 and 1, and takes 0 when there is no first word.

【0118】第12は、各話題候補語の転換寄与指数で
ある。この話題転換寄与指数は0以上1以下の実数を取
り、候補語がない場合には0を取る。
The twelfth is a conversion contribution index of each topic candidate word. This topic conversion contribution index takes a real number from 0 to 1 and takes 0 when there is no candidate word.

【0119】第13は、話者の交代の有無である。話者
監視装置119で得られる話者IDと解析情報統計処理
部11で統計処理した統計情報から得られる。話者が交
代している場合には1を取り、交代していない場合には
0を取る。なお、この話者が交代したか否かに関して
は、処理が発話単位で行なわれれば通常は必ず1とな
る。
The thirteenth is whether or not the speaker has been changed. It is obtained from the speaker ID obtained by the speaker monitoring device 119 and the statistical information statistically processed by the analysis information statistical processing unit 11. If the speaker has changed, take 1; if not, take 0. Note that whether or not this speaker has been changed is normally always 1 if the processing is performed in units of speech.

【0120】第14は、前話題転換からの経過時間であ
る。話題転換からの経過時間も0以上の実数を取る。こ
れは、話題転換尤度評価部115が転換を検出したとき
に、統計情報から前の話題転換検出発話の発話時刻が発
話推移時間監視装置121からの発話開始および終了時
刻から得られるので、現発話の発話開始時刻および終了
時刻とが演算されてその間の経過時間により得られる。
Fourteenth is the elapsed time since the previous topic change. The elapsed time from the topic change also takes a real number greater than zero. This is because when the topic change likelihood evaluation unit 115 detects a change, the utterance time of the previous topic change detection utterance can be obtained from the utterance start and end times from the utterance transition time monitoring device 121 from the statistical information. The utterance start time and end time of the utterance are calculated, and are obtained based on the elapsed time therebetween.

【0121】第15は、現発話者の前発話終了からの時
間である。この値は0以上の実数を取る。現発話の話者
IDと同じ話者IDの話者による前発話の開始時刻を統
計情報から得ることができ、現発話の開始時刻との差が
解析情報統計処理部11で統計処理されることで経過時
間が得られる。
Fifteenth is the time from the end of the previous utterance of the current speaker. This value takes a real number of 0 or more. The start time of the previous utterance by the speaker having the same speaker ID as that of the current utterance can be obtained from the statistical information, and the difference from the start time of the current utterance is statistically processed by the analysis information statistical processing unit 11. Gives the elapsed time.

【0122】第16は、現発話の発話時間である。この
現発話の発話時間は、発話推移時間監視装置121から
与えられる現発話の開始時刻および現発話の終了時刻の
差から得られる。
The sixteenth is the utterance time of the current utterance. The utterance time of the current utterance is obtained from the difference between the start time of the current utterance and the end time of the current utterance provided from the utterance transition time monitoring device 121.

【0123】第17は、前発話終了から現発話開始まで
の時間である。この時間は、発話推移時間監視装置12
1から与えられる現発話の開始時刻と、統計情報として
記録されている前発話の終了時刻との差から得られる。
The seventeenth is the time from the end of the previous utterance to the start of the current utterance. This time corresponds to the utterance transition time monitoring device 12.
1 is obtained from the difference between the start time of the current utterance given from 1 and the end time of the previous utterance recorded as statistical information.

【0124】以上のような値が入力層に与えられると、
出力層には話題転換の可能性が実数として出力される。
最終的には、この出力される値に対して何らかの足切り
が行なわれ、転換があったか否かが判定される。このよ
うに、話題転換の判断に使用される情報は、基本的に現
在の発話から得られたものである。各種経過時間情報、
語の出現頻度および対比語検出などで過去の発話の情報
が使用されるが、従来の話題スタックによる話題同定法
などとは異なる。すなわち、話題同定/転換の認識を遡
って行なうためにそのような過去のデータが使用される
のではなく、あくまでも現在の発話で転換が発生したか
どうかの判定のために使用される。これによって、本装
置の実時間性は損なわれない。
When the above values are given to the input layer,
The output layer outputs the possibility of topic change as a real number.
Finally, the output value is truncated to determine whether or not there is a change. As described above, the information used to determine the topic change is basically obtained from the current utterance. Various elapsed time information,
The past utterance information is used for the word appearance frequency and contrast word detection, but is different from the topic identification method using a conventional topic stack. In other words, such past data is not used to retroactively recognize topic identification / conversion, but is used only for determining whether or not a conversion has occurred in the current utterance. This does not impair the real-time performance of the device.

【0125】話題転換度の評価は、必ずしもこの実施例
のようにニューラルネットが使用される必要はない。た
とえば、何らかの妥当な多項式などによる評価関数が定
義されれば、それが使用されても構わない。ただし、判
定に用いられる要素が上記のように非常に多く、しかも
各要素の重み付けが困難であり、主観評価実験の結果か
ら解析的に何らかの評価加数が獲得されることは、一般
的に極めて困難であると思われる。そこで、ニューラル
ネットが用いられて主観評価実験から得られた結果が教
師データとして与えられて学習が行なわれれば、比較的
容易に評価関数に相当するものが得られる。そのため
に、本実施例ではニューラルネットが使用されている。
The evaluation of the degree of topic change does not necessarily require the use of a neural network as in this embodiment. For example, if an evaluation function based on any appropriate polynomial is defined, it may be used. However, the number of elements used for determination is extremely large as described above, and it is difficult to weight each element. Therefore, it is generally extremely difficult to obtain some evaluation addend from the result of the subjective evaluation experiment. Seems difficult. Therefore, if the result obtained from the subjective evaluation experiment is given as teacher data using a neural network and learning is performed, a function corresponding to the evaluation function can be obtained relatively easily. For this purpose, a neural network is used in this embodiment.

【0126】学習は、以下のように行なわれる。まず、
ある対話文を5名の被検者に粗読してもらう。そして、
話題転換があったと思った箇所にチェックをしてもら
う。このようにして得られた結果から、2名以上の被検
者が転換ありと判断した発話または文が話題転換のあっ
た発話または文とされる。
The learning is performed as follows. First,
Ask a subject to roughly read a dialogue sentence. And
Ask them to check where they think there was a change in topic. From the results obtained in this way, the utterance or sentence determined by two or more subjects to be changed is determined to be the utterance or sentence having the topic change.

【0127】次に、ニューラルネットの入力層に、各発
話または文から得られる上記データが入力され、その発
話または文で話題転換があった場合には1、なかった場
合には0が出力層に与えられる。そして、バックプロパ
ゲーションによって学習が行なわれる。このような学習
が対話の初めから終わりまで順次繰返され、必要であれ
ば同じ対談について複数回学習が行なわれる。これによ
ってニューラルネットは次第に適正な評価を行なわれる
ように学習される。または、sin(xπ/2m)のよ
うな関数(ここで、xは話題転換を検出した被検者の数
であり、mは被検者総数である。)が用いられて教師デ
ータが生成される方法も考えられる。このような関数が
用いられれば、総被検者数が少ない場合には教師データ
の転換尤度をより低く、逆にある程度以上の検出者がい
る場合には全員が検出しなくても転換尤度をほぼ1にす
ることができ、より現実的な学習の可能性がある。
Next, the above data obtained from each utterance or sentence is input to the input layer of the neural network, and 1 is output if there is a topic change in the utterance or sentence, and 0 if not. Given to. Then, learning is performed by back propagation. Such learning is sequentially repeated from the beginning to the end of the dialog, and if necessary, learning is performed a plurality of times for the same conversation. As a result, the neural network is gradually learned so as to be appropriately evaluated. Alternatively, teacher data is generated using a function such as sin (xπ / 2m) (where x is the number of subjects who have detected a topic change and m is the total number of subjects). There is also a possible method. If such a function is used, the conversion likelihood of the teacher data is lower when the total number of subjects is small, and conversely, when there are more than a certain number of detectors, the conversion likelihood does not need to be detected by all members. The degree can be set to almost 1, and there is a possibility of more realistic learning.

【0128】なお、実施例では被検者で2名以上が転換
と認めた箇所を転換ありとして学習が行なわれている。
しかし、他にも、たとえば5名のうち何名が転換ありと
認識したかの割合を使って学習する方法も考えられる。
たとえば、5名による主観評価実験で3名が転換ありと
した箇所については、出力層に与える教師データを0.
6とするような方法によってもよい。
In the embodiment, learning is performed on the part where two or more examinees have recognized the conversion as the conversion.
However, besides, for example, a method of learning using the ratio of how many of the five persons recognized that there is a change can be considered.
For example, for a part where three persons have changed in a subjective evaluation experiment by five persons, the teacher data given to the output layer is set to 0.
6 may be used.

【0129】このような方法によって、話題転換があっ
たかどうかが、時間遅れなく評価が可能となる。
According to such a method, it is possible to evaluate whether or not there has been a topic change without time delay.

【0130】次に、話題語同定部117について説明す
る。話題語同定部117は、話題転換尤度評価部115
から話題の転換ありと通知されたときに、話題候補語抽
出部109から与えられる現在の発話に含まれる話題候
補語から話題と見なされる語を抽出し、使用者に提示す
る。話題候補語から話題と見なされる語が抽出される方
法としては、以下のようなやり方が挙げられる。
Next, the topic word identification unit 117 will be described. The topic word identification unit 117 includes a topic conversion likelihood evaluation unit 115
When it is notified that there is a change in topic from, words that are regarded as topics are extracted from topic candidate words included in the current utterance provided from the topic candidate word extraction unit 109 and presented to the user. As a method of extracting a word regarded as a topic from the topic candidate words, the following method can be used.

【0131】図8は、そのような話題候補語から話題と
見なされる語が抽出される種々の方法を説明するための
図である。特に、図8には、図8(a)から図8(e)
に示すように、以下のような5種類の方法を示してい
る。
FIG. 8 is a diagram for explaining various methods for extracting words regarded as topics from such topic candidate words. In particular, FIGS. 8A to 8E show FIGS.
As shown in FIG. 5, the following five methods are shown.

【0132】第1は、図8(a)に示すように、話題候
補語すべてを話題候補語と見なして使用者に提示する方
法である。
The first method is, as shown in FIG. 8A, a method in which all topic candidate words are regarded as topic candidate words and presented to the user.

【0133】第2は、図8(b)に示すように、話題候
補語で初出語があればそれを話題語として提示する。初
出語でなければ、前回の出現から最も長い時間出現して
いなかった語を話題語として提示しておけばよい。また
は、初出語がなければ、前回の出現か長い時間出現しな
かった順に所定の数の語を話題語として提示してもよ
い。さらに、初出語がなければ、出現頻度の最も低い語
を話題語として提示してもよい。さらに、初出語がなけ
れば、出現頻度の低いものから順に所定の数の語を話題
語として提示してもよい。
Second, as shown in FIG. 8B, if there is a first candidate word among topic candidate words, it is presented as a topic word. If it is not the first word, a word that has not appeared for the longest time since the previous appearance may be presented as a topic word. Alternatively, if there is no first word, a predetermined number of words may be presented as topic words in the order in which they appeared last or did not appear for a long time. Furthermore, if there is no first word, the word with the lowest appearance frequency may be presented as a topic word. Furthermore, if there is no first word, a predetermined number of words may be presented as topic words in ascending order of appearance frequency.

【0134】第3の方法は、図8(c)に示すように、
話題候補語から、過去に話題語として同定された語を削
除した残りの語を話題語として提示する方法である。こ
のような第3の方法の場合には、話題語同定結果である
話題語が解析情報統計処理部111にフィードバックさ
れることで、過去に話題語として同定された語に関する
情報が解析情報統計処理部11に与えられる。
The third method is as shown in FIG.
This is a method of presenting, as topic words, remaining words obtained by deleting words previously identified as topic words from topic candidate words. In the case of the third method, a topic word as a topic word identification result is fed back to the analysis information statistical processing unit 111, so that information on a word identified as a topic word in the past is analyzed. Provided to the unit 11.

【0135】第4は、図8(d)に示すように、転換が
検出された発話内に複数回使用されている語、または同
義語が出現する語が強調されていると見なして、これを
話題語として提示する方法である。
Fourth, as shown in FIG. 8D, words that are used more than once in the utterance in which conversion is detected, or words in which synonyms appear, are regarded as being emphasized. Is presented as a topic word.

【0136】第5は、図8(e)に示すように、話題転
換要因抽出部107から、直前の発話内に含まれる語の
対比語は本発話内に含まれることが通知されていれば、
その対比語を話題語として提示する方法である。
Fifth, as shown in FIG. 8 (e), if the topic conversion factor extracting unit 107 notifies that the contrast word of the word included in the immediately preceding utterance is included in the main utterance. ,
This is a method of presenting the contrast word as a topic word.

【0137】以上のような種々の方法があるが、これら
の方法が単独で用いられるだけでなく、いくつかが組合
される方法でもよい。ただし、本装置では、話題の同定
はあまり重要な位置を占めていない。すなわち、本装置
の最も重要な目的は実時間に話題の転換を検出すること
であり、その検出に当たって予め話題が同定される必要
がない。このことは、従来の技術と明らかに異なる。従
来の技術では、まず話題の同定が行なわれ、その話題が
同定された後に、ある部分の話題が変わっていれば転換
があったと認識される。つまり、初めに話題があること
が前提となる方法である。これに対し、本装置はその逆
で、初めに話題の転換が前提とされる方法であり、転換
が検出された後に必要であれば話題の同定が行なわれ
る。
Although there are various methods as described above, these methods may be used not only alone but also in combination. However, in this device, topic identification does not occupy a very important position. That is, the most important purpose of the present apparatus is to detect a topic change in real time, and it is not necessary to identify a topic in advance for the detection. This is clearly different from the prior art. In the related art, a topic is first identified, and after the topic has been identified, if a certain part of the topic has changed, it is recognized that a change has occurred. In other words, it is a method that assumes that there is a topic first. On the other hand, the present device is a method that presupposes a topic change at the beginning, and the topic is identified if necessary after the change is detected.

【0138】ところで、話題の同定が行なわれることは
現実には難しい。前述のような何らかの重み付けによっ
て話題語が抽出されることは可能であるが、本当にその
語が意味的に正しい話題を表すものかどうかの判断は、
困難である。その正確な判断のために、「発話の意味理
解」の機構が必要であり、特に自由展開対話型における
発話内容の理解の可能な装置の構築は現状不可能と思わ
れる。このため、従来の手法では、自由展開型対話を対
象としつつも、実際には分野辞書が準備される必要があ
り、この分野を外れた内容の発話は処理できない。つま
り、話題の同定が行なわれてから、話題転換を検出する
ためには、発話の意味理解が一般的に不可欠であり、こ
の結果装置は対応する分野ごとに何らかのドメイン知識
が準備される必要がある。したがって、装置の適用可能
な分野は自ずと限られる。
Incidentally, it is actually difficult to identify a topic. Although it is possible to extract a topic word by some kind of weighting as described above, it is determined whether the word really represents a semantically correct topic.
Have difficulty. For the accurate judgment, a mechanism of "understanding the meaning of the utterance" is necessary, and it is considered impossible at present to construct a device capable of understanding the contents of the utterance in the freely developing interactive type. For this reason, in the conventional method, a field dictionary needs to be actually prepared while targeting a free-development-type dialogue, and utterances outside the field cannot be processed. In other words, in order to detect topic change after topic identification, it is generally essential to understand the meaning of the utterance, and as a result, the device needs to prepare some domain knowledge for each corresponding field. is there. Therefore, the applicable field of the device is naturally limited.

【0139】一方、本実施例の装置では、分野に依存す
る部分なくまず転換の認識が行なわれる。そして、転換
の検出された発話に必ず次の話題が含まれる。極端にい
えば、本装置では前述のような話題語同定が行なわれる
必要もない。その場合、転換の検出された発話がそっく
りそのまま使用者に提示されてもよい。つまり、発話内
容の理解という困難な作業は、使用者に任せてもよく、
このほうが、装置で中途半端な意味理解が行なわれるよ
りも確実に意味が伝わると思われるからである。
On the other hand, in the apparatus according to the present embodiment, conversion recognition is performed first without depending on the field. Then, the utterance in which the conversion is detected always includes the next topic. Extremely speaking, the present apparatus does not need to perform the topic word identification as described above. In that case, the utterance in which the conversion is detected may be presented to the user as it is. In other words, the difficult task of understanding the utterance content may be left to the user,
This is because the meaning is more likely to be conveyed than the device does not understand halfway.

【0140】[0140]

【発明の効果】以上のように、この発明によれば、入力
された対話者の発話内容の形態素を解析し、予め定めら
れた話題転換要因規則をその形態素の解析結果に適用し
て話題転換要因を抽出し、予め定められた話題規則をそ
の形態素の解析結果に適用して話題候補語を抽出し、そ
の後形態素の解析結果および話題候補語の抽出結果を統
計処理するとともに、話題候補語の転換寄与指数を求
め、話題転換要因、統計処理結果および話題候補語の転
換寄与指数を評価して、発話内容に話題転換が存在する
か否かを極力実時間で検出できる。
As described above, according to the present invention, the morpheme of the input utterance content of the interlocutor is analyzed, and a topic conversion factor rule determined in advance is applied to the analysis result of the morpheme to convert the topic. A factor is extracted, a topic rule determined in advance is applied to the analysis result of the morpheme to extract a topic candidate word, and then the analysis result of the morpheme and the extraction result of the topic candidate word are statistically processed. The conversion contribution index is obtained, the topic conversion factor, the statistical processing result, and the conversion contribution index of the topic candidate word are evaluated, and it can be detected in real time as to whether topic conversion exists in the utterance content.

【0141】さらに、目的指向型または自由展開型のよ
うな対話の型や話題の分野の問うことなく、話題転換が
検出された場合の話題同定をも行なえる。
Further, topic identification when a topic change is detected can be performed irrespective of the type of conversation such as the object-oriented type or the free-development type.

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明の一実施例による対話処理装置の概略
ブロック図である。
FIG. 1 is a schematic block diagram of a dialog processing device according to an embodiment of the present invention.

【図2】この発明の他の実施例による対話処理装置を示
した概略ブロック図である。
FIG. 2 is a schematic block diagram showing an interactive processing device according to another embodiment of the present invention.

【図3】図2の解析情報統計処理部の動作を説明するた
めの第1の図である。
FIG. 3 is a first diagram illustrating an operation of an analysis information statistical processing unit in FIG. 2;

【図4】図2の解析情報統計処理部の動作を説明するた
めの第2の図である。
FIG. 4 is a second diagram illustrating the operation of the analysis information statistical processing unit in FIG. 2;

【図5】図2の解析情報統計処理部の動作を説明するた
めの第3の図である。
FIG. 5 is a third diagram for explaining the operation of the analysis information statistical processing unit in FIG. 2;

【図6】図2の単語の話題転換寄与指数演算部の動作で
用いられる関数を示したグラフである。
FIG. 6 is a graph showing functions used in the operation of the word topic conversion contribution index calculating unit of FIG. 2;

【図7】図6に示された関数に対して、実験を行なった
結果を示したグラフである。
FIG. 7 is a graph showing a result of an experiment performed on the function shown in FIG. 6;

【図8】図2の話題語同定部の動作を説明するための図
である。
FIG. 8 is a diagram for explaining the operation of the topic word identification unit in FIG. 2;

【図9】従来の話題理解の方法を説明するための図であ
る。
FIG. 9 is a diagram for explaining a conventional topic understanding method.

【符号の説明】[Explanation of symbols]

1,101 対話処理装置 3,103 対話入力部 5,105 形態素解析部 7,107 話題転換要因抽出部 9,109 話題候補語抽出部 11,111 解析情報統計処理部 13,113 単語の話題転換寄与指数演算部 15,115 話題転換尤度評価部 117 話題語同定部 19 テキスト入力装置 119 話者監視装置 121 発話推移時間監視装置 123 対比語辞書 21 単語辞書 125 同義語辞書 1,101 Dialogue processing device 3,103 Dialogue input unit 5,105 Morphological analysis unit 7,107 Topic conversion factor extraction unit 9,109 Topic candidate word extraction unit 11,111 Analysis information statistical processing unit 13,113 Word topic conversion contribution Index operation unit 15, 115 Topic conversion likelihood evaluation unit 117 Topic word identification unit 19 Text input device 119 Speaker monitoring device 121 Utterance transition time monitoring device 123 Comparative word dictionary 21 Word dictionary 125 Synonym dictionary

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−332084(JP,A) 特開 平6−139276(JP,A) 竹下敦、「表層的処理による話題抽 出」、情報処理学会研究報告、Vol. 91、No.37(NL83−4)、p.23− p.30(1991) (58)調査した分野(Int.Cl.6,DB名) G06F 17/20 - 17/30 G06F 9/44 JICSTファイル(JOIS)────────────────────────────────────────────────── ─── Continuation of the front page (56) References JP-A-4-332084 (JP, A) JP-A-6-139276 (JP, A) Atsushi Takeshita, "Topic extraction by surface processing", Information Processing Society of Japan Research Report, Vol. 37 (NL83-4), p. 23-p. 30 (1991) (58) Field surveyed (Int. Cl. 6 , DB name) G06F 17/20-17/30 G06F 9/44 JICST file (JOIS)

Claims (10)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 者の発話を入力し、その入力された発
話を文章に変換る入力手段と、 前記入力手段から与えられる文章を形素解析する形態
素解析手段と、前記形態素解析手段から与えられる単語の中から話題を
転換する要因となり得る 話題転換要因を抽出する話題
転換要因抽出手段と、 前記形態素解析手段から与えられる単語の中から話題を
表わす話題語となり得る話題候補語を抽出する話題候補
語抽出手段と、 前記形態素解析手段から与えられる単語の中で前記話題
候補語の出現回数および出現間隔に基づいて前記話題候
補語が話題の転換に寄与する話題転換寄与指数を演算
し、前記話題転換寄与指数と前記話題転換要因語とに基
づいて話題の転換を検出する演算処理手段とを備える
対話処理装置。
[Claim 1] Enter the utterance of the speaker, which is the input originating
And input means that converts talk to the sentence, and the morphological analysis means to form state Motokai analyze the sentence given from the entering force means, the topic from the word given from the morphological analysis means
Topic conversion factor extraction means for extracting a topic conversion factor word that can be a conversion factor ; and a topic from words given by the morphological analysis means.
A topic candidate word extracting means for extracting the topic candidate words that can be the topic language representative, the topic within a word given from the morphological analysis unit
Based on the number of appearances and the appearance interval of the candidate word,
Calculate topic conversion contribution index that complements contribute to topic conversion
Based on the topic conversion contribution index and the topic conversion factor word.
Computing means for detecting a change in topic based on the
Interaction processor.
【請求項2】 前記入力手段は、前記文章をテキスト形
で表現するテキスト入力装置を含む、請求項1に記載
の対話処理装置。
Wherein the entering force means includes a text input device to represent the sentence in text format, interaction processing apparatus according to claim 1.
【請求項3】 前記入力手段は、いずれの話者が発話し
ているかを監視する話者監視装置を含み、 前記演算処理手段は、前記話題転換寄与指数と前記話題
転換要因語とに加えて、前記話者監視装置の監視結果
基づいて話題の転換を検出する、請求項1に記載の対話
処理装置。
Wherein the entering force means comprises a speaker monitoring device for monitoring one speaker is speaking, the processing means, the topic and the topic transformed contribution index
In addition to the conversion factor word, the monitoring result of the speaker monitoring device
The interactive processing device according to claim 1, wherein a conversation change is detected based on the topic .
【請求項4】 前記入力手段は、話者の発話開始時刻か
発話終了時刻までの時間を監視する時間監視装置を含
み、 前記演算処理手段は、前記話題転換寄与指数と前記話題
転換要因語とに加えて、前記時間監視装置の監視結果
基づいて話題の転換を検出する、請求項1に記載の対話
処理装置。
Wherein the entering force means comprises a time monitoring device for monitoring the time from the utterance start time of the speaker to the speech end time, the processing means, the topic and the topic transformed contribution index
In addition to the conversion factor word, the monitoring result of the time monitoring device
The interactive processing device according to claim 1, wherein a conversation change is detected based on the topic .
【請求項5】 前記形態素解析手段は、予め定められた
単語辞書を有し、前記単語辞書を用いて前記文章を形
素解析する、請求項1記載の対話処理装置。
Wherein said morphological analysis means has a predetermined word dictionary, the shape condition of the sentence using the word dictionary
To Motokai analysis, interaction processing apparatus according to claim 1.
【請求項6】 前記形態素解析手段は、予め定められた
同義語辞書を有し、前記同義語辞書を用いて前記形態素
解析により得られた単語の中から同義語を抽 出して同義
語リストを作成する、請求項1に記載の対話処理装置。
6. The morphological analysis means has a predetermined synonym dictionary, and uses the synonym dictionary to generate the morphological
Synonymous out extract the synonym from within a word obtained by the analysis
To create a word list, interaction processing apparatus according to claim 1.
【請求項7】 前記形態素解析手段は、予め定められた
対比語辞書を有し、前記対比語辞書を用いて前記形態素
解析により得られた単語の中から対比語を抽出して対比
語リストを作成する、請求項1に記載の対話処理装置。
7. The morphological analysis means has a predetermined contrast word dictionary, and uses the contrast word dictionary to generate the morpheme
Contrast by extracting contrast words from words obtained by analysis
To create a word list, interaction processing apparatus according to claim 1.
【請求項8】 前記演算処理手段が話題の転換を検出し
たとき、前記話題候補語の中から話題語を同定する話題
語同定手段をさらに備え、請求項1記載の対話処理
装置。
8. The method according to claim 1, wherein the arithmetic processing means detects a topic change.
When in further Ru comprising a topic word identification means for identifying the topic terms from among the topic candidate word, dialogue processing apparatus according to claim 1.
【請求項9】 前記形態素解析手段は、予め定められた
同義語辞書を有し、前記同義語辞書を用いて前記形態素
解析により得られた単語の中から同義語を抽出して同義
語リストを作成し、 前記話題語同定手段は、前記同義語リストに基づいて前
話題語を同定する、請求項8記載の対話処理装置。
9. The morphological analysis means has a predetermined synonym dictionary, and uses the synonym dictionary to generate the morphological
Synonymous by extracting synonyms from words obtained by analysis
A word list is created, and the topic word identification unit determines a topic word based on the synonym list.
Identifying serial topic words, interaction processing apparatus according to claim 8.
【請求項10】 前記形態素解析手段は、予め定められ
た対比語辞書を有し、前記対比語辞書を用いて前記形態
素解析により得られた単語の中から対比語を抽出して対
比語リストを作成し、 前記話題語同定手段は、前記対比語リストに基づいて前
話題語を同定する、請求項8または請求項記載の
対話処理装置。
Wherein said morphological analysis means has a predetermined compared Dictionary, the forms using the contrast Dictionary
Extract a comparison word from the words obtained by elementary analysis
A word list is created, and the topic word identification unit determines a topic word based on the word list.
Identifying serial topic words, interaction processing apparatus according to claim 8 or claim 9.
JP6278966A 1994-11-14 1994-11-14 Dialogue processing device Expired - Fee Related JP2849341B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6278966A JP2849341B2 (en) 1994-11-14 1994-11-14 Dialogue processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6278966A JP2849341B2 (en) 1994-11-14 1994-11-14 Dialogue processing device

Publications (2)

Publication Number Publication Date
JPH08137874A JPH08137874A (en) 1996-05-31
JP2849341B2 true JP2849341B2 (en) 1999-01-20

Family

ID=17604555

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6278966A Expired - Fee Related JP2849341B2 (en) 1994-11-14 1994-11-14 Dialogue processing device

Country Status (1)

Country Link
JP (1) JP2849341B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169804A (en) * 2000-12-01 2002-06-14 Namco Ltd System and method for simulated conversation, and information storage medium

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3883647B2 (en) 1997-06-10 2007-02-21 インターナショナル・ビジネス・マシーンズ・コーポレーション Message processing method, message processing apparatus, and storage medium for storing program for controlling message processing
JP4423327B2 (en) 2005-02-08 2010-03-03 日本電信電話株式会社 Information communication terminal, information communication system, information communication method, information communication program, and recording medium recording the same
JP6838739B2 (en) * 2016-06-05 2021-03-03 国立大学法人千葉大学 Recent memory support device
US9858265B1 (en) * 2016-06-08 2018-01-02 Rovi Guides, Inc. Systems and methods for determining context switching in conversation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
竹下敦、「表層的処理による話題抽出」、情報処理学会研究報告、Vol.91、No.37(NL83−4)、p.23−p.30(1991)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169804A (en) * 2000-12-01 2002-06-14 Namco Ltd System and method for simulated conversation, and information storage medium
JP3533371B2 (en) 2000-12-01 2004-05-31 株式会社ナムコ Simulated conversation system, simulated conversation method, and information storage medium

Also Published As

Publication number Publication date
JPH08137874A (en) 1996-05-31

Similar Documents

Publication Publication Date Title
US11775760B2 (en) Man-machine conversation method, electronic device, and computer-readable medium
Yeh Speech act identification using semantic dependency graphs with probabilistic context-free grammars
Benamara et al. Sentiment analysis: Adjectives and adverbs are better than adjectives alone.
Hori et al. A new approach to automatic speech summarization
Zechner Automatic generation of concise summaries of spoken dialogues in unrestricted domains
Clarke et al. Constraint-based sentence compression: An integer programming approach
Macary et al. AlloSat: A new call center french corpus for satisfaction and frustration analysis
Trnka et al. Topic modeling in fringe word prediction for AAC
Chowdhury et al. Automatic classification of speech overlaps: feature representation and algorithms
JP5867410B2 (en) Dialog text analysis apparatus, method and program
KR102109866B1 (en) System and Method for Expansion Chatting Corpus Based on Similarity Measure Using Utterance Embedding by CNN
Dyriv et al. The user's psychological state identification based on Big Data analysis for person's electronic diary
Cavalieri et al. Combination of language models for word prediction: An exponential approach
JP2849341B2 (en) Dialogue processing device
JP2849342B2 (en) Dialogue activation device
JP2011248409A (en) Keyword extraction device, method and program thereof
Mochales-Palau et al. Study on sentence relations in the automatic detection of argumentation in legal cases
Hunt A generalised model for utilising prosodic information in continuous speech recognition
JP2802602B2 (en) Dialogue processing device
Galescu et al. Augmenting words with linguistic information for n-gram language models.
Campbell et al. Discriminative Keyword Selection Using Support Vector Machines.
Dbabis et al. Automatic dialogue act annotation within Arabic debates
CN111191465A (en) Question-answer matching method, device, equipment and storage medium
Kim et al. Language models and dialogue strategy for a voice QA system
Langer et al. Automatic message indexing and full text retrieval for a communication aid

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19981020

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091106

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091106

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101106

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111106

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121106

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees