JP2004295834A - Analysis device, analysis method and analysis program for character speech record, and analysis device, analysis method and analysis program for information group - Google Patents

Analysis device, analysis method and analysis program for character speech record, and analysis device, analysis method and analysis program for information group Download PDF

Info

Publication number
JP2004295834A
JP2004295834A JP2003090900A JP2003090900A JP2004295834A JP 2004295834 A JP2004295834 A JP 2004295834A JP 2003090900 A JP2003090900 A JP 2003090900A JP 2003090900 A JP2003090900 A JP 2003090900A JP 2004295834 A JP2004295834 A JP 2004295834A
Authority
JP
Japan
Prior art keywords
utterance
sentence
information
utterance sentence
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003090900A
Other languages
Japanese (ja)
Inventor
Tatsuki Kobayashi
竜己 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CSK Corp
Original Assignee
CSK Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CSK Corp filed Critical CSK Corp
Priority to JP2003090900A priority Critical patent/JP2004295834A/en
Publication of JP2004295834A publication Critical patent/JP2004295834A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To grasp the degree of association between speech sentences in a chat log of complicated structure in which the speech sentences are intricately associated with each other. <P>SOLUTION: A link analysis part 50 of a chat log processor 10 acquires a prescribed clue (refer to Figure 27) usable in analyzing the degree of association between the respective speech sentences from the speech sentences of the chat log, and gives points indicating the strong/weak degree of association to each of a plurality of other speech sentences to the prescribed speech sentence, using the acquired clue and heuristics. Based on the thus given points, the other speech sentence (the most associated past speech sentence) used as a link source, or the other speech sentence (the most associated future speech sentence) used as a link destination, is selected and determined for the prescribed speech sentence. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
この発明は、例えば、複数人の文字による発話文が記録されたチャットログの分析装置、分析方法および分析プログラムに関し、特に、各発話文が複雑に関連して複雑な構造を有するチャットログにおいて各発話文間の関連度を把握することができる分析装置、分析方法および分析プログラムに関する。
【0002】
【従来の技術】
従来より、人間と人間との間の対話において、相互に交わされる発話間の関係を認識しようという技術がある。例えば、特開平10−69292号公報(特許文献1)では、各発話が「開始、応答、補足」のいずれの機能を果たしているかを決定することで、かかる「開始、応答、補足」の機能で括られる3つの発話の間には密接な関係が存在するものとして発話間の関係を認識している。
【0003】
また、最近になって、ビジネスの場においてもチャットを利用した会議が一般的になりつつあり、チャット会議の結果得られるテキスト形式のチャットログ(図44参照)から会議の議事録を自動的に作成しようという試みもある。つまり、例を挙げれば、チャットログから決定事項、宿題、今後の課題などの議事録項目に対応する重要発話文を自動的に抽出し、かかる議事録項目をフォームに備える議事録(図45参照)を作成しようという試みである。
【0004】
ところが、このような議事録項目ごとに重要発話文が一つずつ列挙されるだけの議事録では、重要発話文に含まれる照応代名詞の照応先の発話文や、重要発話文に対応する質問や回答の発話文などがないので、議事録の内容を容易に理解することができない場合もある。このため、議事録の理解を容易にするには、重要発話文に関連する他の関連発話文も一緒に列挙することが望まれる。
【0005】
ここで、チャットログのなかから他の関連発話文を如何にして抽出するかを考察すると、上記した発話間の関係を認識する技術を利用するという手法が先ずは考えられる。すなわち、チャットログから議事録項目に対応する重要発話文をそれぞれ抽出した後に、かかる重要発話文に対して「開始、応答、補足」の機能で括られる他の2つ発話文を関連発話文として抽出するという手法である。
【0006】
【特許文献1】
特開平10−69292号公報
【0007】
【発明が解決しようとする課題】
【0008】
しかしながら、チャットログは、一人対一人の単純な対話ではなく、複数人の文字による発話文から成り立つものであり、上記した従来技術を適用したとしても、重要発話文に関連する他の関連発話文を的確に抽出することは困難である。
【0009】
これを具体的に説明すると、チャットログは、例えば、話題という観点から考察しても、一つの話題から複数の話題が生まれたり、複数の話題が並行に入り組んで進行したり、複数の話題が結合して一つの話題になったり、一つの話題のなかで中位・下位の話題が枝分かれ状に進行したりなど、極めて複雑な構造を有するものである。このため、上記の従来技術のように「開始、応答、補足」といった機能構造だけに着目しても、重要発話文に関連する他の関連発話文を的確に抽出することには自ずと限界がある。
【0010】
言い換えれば、チャットログおける各発話文は、「開始、応答、補足」といった機能で括られるグループ内の各発話文同士だけで関連するといったものではなく、チャットログにおける他の全ての発話文との間で強弱はあれども何かしらの関連性を有するものである。したがって、各発話文が複雑に関連して複雑な構造を有するチャットログにおいて、重要発話文に関連する他の関連発話文を的確に抽出するには、各発話文の間における関連度を把握することが前提条件として必要になる。
【0011】
そこで、この発明は、上述した従来技術による問題点を解消するためになされたものであり、各発話文が複雑に関連して複雑な構造を有するチャットログにおいて各発話文間の関連度を把握することができる文字発話記録の分析装置、分析方法および分析プログラムを提供することを目的とする。さらに、この発明は、各情報が複雑に関連して複雑な構造を有する情報群において各情報間の関連度を把握することができる情報群の分析装置、分析方法および分析プログラムを提供することも目的とする。
【0012】
【課題を解決するための手段】
上述した課題を解決し、目的を達成するため、請求項1に係る発明は、複数人の文字による発話文が記録された文字発話記録を分析する文字発話記録の分析装置であって、前記文字発話記録の発話文から各発話文間の関連度を分析する際に利用可能な所定の手がかりを取得する手がかり取得手段と、前記手がかり取得手段によって取得された所定の手がかりを利用して、所定の発話文と他の発話文との間における関連度を分析する関連度分析手段と、を備えたことを特徴とする。
【0013】
この発明によれば、文字発話記録の発話文から各発話文間の関連度を分析する際に利用可能な所定の手がかりを取得し、取得された所定の手がかりを利用して、所定の発話文と他の発話文との間における関連度を分析する。したがって、各発話文が複雑に関連して複雑な構造を有するチャットログにおいて各発話文間の関連度を把握することが可能になる。
【0014】
また、請求項2に係る発明は、請求項1に記載の発明において、前記手がかり取得手段は、前記所定の手がかりとして、発話文の発話行為に基づく特徴を示す発話行為属性、発話文の発話者を示す発話者属性、発話文に含まれる発話者指定に関する発話者指定情報、発話文に含まれる照応に関する照応情報、発話文に含まれる話題の切替若しくは継続を示す接続属性、発話文に含まれる主題に関する主題情報、発話文に含まれる命題に関する命題情報、および/または、前記文字発話記録における発話位置に関する発話位置情報を取得し、前記関連度分析手段は、前記所定の発話文および他の発話文が有する前記発話行為属性、発話者属性、発話者指定情報、照応情報、接続属性、主題情報、命題情報、および/または、発話位置情報の関連性に応じて前記関連度を分析することを特徴とする。
【0015】
この発明によれば、所定の手がかりとして、発話文の発話行為に基づく特徴を示す発話行為属性、発話文の発話者を示す発話者属性、発話文に含まれる発話者指定に関する発話者指定情報、発話文に含まれる照応に関する照応情報、発話文に含まれる話題の切替若しくは継続を示す接続属性、発話文に含まれる主題に関する主題情報、発話文に含まれる命題に関する命題情報、および/または、文字発話記録における発話位置に関する発話位置情報を取得し、所定の発話文および他の発話文が有する発話行為属性、発話者属性、発話者指定情報、照応情報、接続属性、主題情報、命題情報、および/または、発話位置情報の関連性に応じて関連度を分析する。
【0016】
したがって、所定の発話文と他の発話文との間でいわゆるアクトが所定の関連性を有するか否かの観点、所定の発話文と他の発話文との間で発話者が共通するか否かの観点、所定の発話文と他の発話文との間で発話者指定が行われているか否かの観点、所定の発話文と他の発話文との間で照応が生じているか否かの観点、所定の発話文と他の発話文との間で話題を継続しているか否か、所定の発話文と他の発話文との間で主題が共通しているか否かの観点、所定の発話文と他の発話文との間で命題が共通するか否かの観点、および/または、所定の発話文と他の発話文との間で発話位置が近いか否かの観点から、各発話文間の関連度を把握することが可能になる。
【0017】
また、請求項3に係る発明は、請求項1に記載の発明において、前記関連度分析手段は、前記所定の発話文に対する複数の他の発話文それぞれに対して前記関連度の強弱を表すポイントを付与することを特徴とする。
【0018】
この発明によれば、所定の発話文に対する複数の他の発話文それぞれに対して関連度の強弱を表すポイントを付与する。したがって、所定の発話文に対する複数の他の発話文それぞれの関連度を強弱のポイントによって把握することが可能になる。
【0019】
また、請求項4に係る発明は、請求項3に記載の発明において、前記関連度分析手段によって付与されたポイントに基づいて、前記複数の他の発話文のなかから所定の他の発話文を選択する関連発話文選択手段をさらに備えたことを特徴とする。
【0020】
この発明によれば、所定の発話文に対する複数の他の発話文それぞれに対して付与された関連度の強弱を表すポイントに基づいて、複数の他の発話文のなかから所定の他の発話文を選択する。したがって、各発話文に付与されたポイントに応じて、所定の発話文に対して所定の強さで関連する関連発話文を抽出することが可能になる。
【0021】
また、請求項5に係る発明は、請求項4に記載の発明において、前記関連発話文選択手段は、前記ポイントの数が最大である他の発話文を選択することを特徴とする。
【0022】
この発明によれば、ポイントの数が最大である他の発話文を選択する。したがって、所定の発話文に対して最も強く関連する関連発話文を一意に抽出することが可能になる。
【0023】
また、請求項6に係る発明は、請求項4に記載の発明において、前記関連発話文選択手段は、前記ポイントの数が所定の数以上である他の発話文を選択することを特徴とする。
【0024】
この発明によれば、ポイントの数が所定の数以上である他の発話文を選択する。したがって、所定の発話文に対して所定の強さで関連する一群の関連発話文を抽出することが可能になる。
【0025】
また、請求項7に係る発明は、請求項1〜6のいずれか一つに記載の発明において、前記関連度分析手段は、前記所定の発話文に対して関連元になるか否かの観点から前記関連度を分析することを特徴とする。
【0026】
この発明によれば、所定の発話文に対して関連元になるか否かの観点から関連度を分析する。したがって、所定の発話文に対してリンク元になり得るか否かの観点から、各発話文間の関連度を把握することが可能になる。
【0027】
また、請求項8に係る発明は、請求項1〜6のいずれか一つに記載の発明において、前記関連度分析手段は、前記所定の発話文に対して関連先になるか否かの観点から前記関連度を分析することを特徴とする。
【0028】
この発明によれば、所定の発話文に対して関連先になるか否かの観点から関連度を分析する。したがって、所定の発話文に対してリンク先になり得るか否かの観点から、各発話文間の関連度を把握することが可能になる。
【0029】
また、請求項9に係る発明は、請求項1〜6のいずれか一つに記載の発明において、前記関連度分析手段は、前記所定の発話文に対して関連元になるか否かの観点から前記関連度を分析した後、当該関連元にならなかった他の発話文を前記所定の発話文として、当該所定の発話文に対して関連先になるか否かの観点から前記関連度を分析することを特徴とする。
【0030】
この発明によれば、所定の発話文に対して関連元になるか否かの観点から関連度を分析した後、当該関連元にならなかった他の発話文を所定の発話文として、当該所定の発話文に対して関連先になるか否かの観点から関連度を分析する。したがって、働き掛けに対して必ずしも応答が存在するとは限らないというチャットログの特性を考慮して、無駄な分析処理が行われることを回避する(つまり、すべての発話文についてリンク元決定処理を最初に行って、リンク元が発見された発話文に対しては逆方向からリンク先も決定し、リンク元が決まらなかった発話文のみについてリンク先決定処理を行うため、無駄なリンク先決定処理を行わなくて済む)とともに、チャットの進行に伴ったリアルタイムの分析処理を行うことが可能になる。
【0031】
また、請求項10に係る発明は、複数人の文字による発話文が記録された文字発話記録を分析する文字発話記録の分析方法であって、前記文字発話記録の発話文から各発話文間の関連度を分析する際に利用可能な所定の手がかりを取得する手がかり取得工程と、前記手がかり取得工程によって取得された所定の手がかりを利用して、所定の発話文と他の発話文との間における関連度を分析する関連度分析工程と、を含んだことを特徴とする。
【0032】
この発明によれば、文字発話記録の発話文から各発話文間の関連度を分析する際に利用可能な所定の手がかりを取得し、取得された所定の手がかりを利用して、所定の発話文と他の発話文との間における関連度を分析する。したがって、各発話文が複雑に関連して複雑な構造を有するチャットログにおいて各発話文間の関連度を把握することが可能になる。
【0033】
また、請求項11に係る発明は、複数人の文字による発話文が記録された文字発話記録を分析する分析方法をコンピュータに実行させる文字発話記録の分析プログラムであって、前記文字発話記録の発話文から各発話文間の関連度を分析する際に利用可能な所定の手がかりを取得する手がかり取得手順と、前記手がかり取得手順によって取得された所定の手がかりを利用して、所定の発話文と他の発話文との間における関連度を分析する関連度分析手順と、をコンピュータに実行させることを特徴とする。
【0034】
この発明によれば、文字発話記録の発話文から各発話文間の関連度を分析する際に利用可能な所定の手がかりを取得し、取得された所定の手がかりを利用して、所定の発話文と他の発話文との間における関連度を分析する。したがって、各発話文が複雑に関連して複雑な構造を有するチャットログにおいて各発話文間の関連度を把握することが可能になる。
【0035】
また、請求項12に係る発明は、請求項11に記載の発明において、記手がかり取得手順は、前記所定の手がかりとして、発話文の発話行為に基づく特徴を示す発話行為属性、発話文の発話者を示す発話者属性、発話文に含まれる発話者指定に関する発話者指定情報、発話文に含まれる照応に関する照応情報、発話文に含まれる話題の切替若しくは継続を示す接続属性、発話文に含まれる主題に関する主題情報、発話文に含まれる命題に関する命題情報、および/または、前記文字発話記録における発話位置に関する発話位置情報を取得し、前記関連度分析手順は、前記所定の発話文および他の発話文が有する前記発話行為属性、発話者属性、発話者指定情報、照応情報、接続属性、主題情報、命題情報、および/または、発話位置情報の関連性に応じて前記関連度を分析することを特徴とする。
【0036】
この発明によれば、所定の手がかりとして、発話文の発話行為に基づく特徴を示す発話行為属性、発話文の発話者を示す発話者属性、発話文に含まれる発話者指定に関する発話者指定情報、発話文に含まれる照応に関する照応情報、発話文に含まれる話題の切替若しくは継続を示す接続属性、発話文に含まれる主題に関する主題情報、発話文に含まれる命題に関する命題情報、および/または、文字発話記録における発話位置に関する発話位置情報を取得し、所定の発話文および他の発話文が有する発話行為属性、発話者属性、発話者指定情報、照応情報、接続属性、主題情報、命題情報、および/または、発話位置情報の関連性に応じて関連度を分析する。
【0037】
したがって、所定の発話文と他の発話文との間でいわゆるアクトが所定の関連性を有するか否かの観点、所定の発話文と他の発話文との間で発話者が共通するか否かの観点、所定の発話文と他の発話文との間で発話者指定が行われているか否かの観点、所定の発話文と他の発話文との間で照応が生じているか否かの観点、所定の発話文と他の発話文との間で話題を継続しているか否か、所定の発話文と他の発話文との間で主題が共通しているか否かの観点、所定の発話文と他の発話文との間で命題が共通するか否かの観点、および/または、所定の発話文と他の発話文との間で発話位置が近いか否かの観点から、各発話文間の関連度を把握することが可能になる。
【0038】
また、請求項13に係る発明は、請求項11または12に記載の発明において、前記関連度分析手順は、前記所定の発話文に対する複数の他の発話文それぞれに対して前記関連度の強弱を表すポイントを付与することを特徴とする。
【0039】
この発明によれば、所定の発話文に対する複数の他の発話文それぞれに対して関連度の強弱を表すポイントを付与する。したがって、所定の発話文に対する複数の他の発話文それぞれの関連度を強弱のポイントによって把握することが可能になる。
【0040】
また、請求項14に係る発明は、請求項13に記載の発明において、前記関連度分析手順によって付与されたポイントに基づいて、前記複数の他の発話文のなかから所定の他の発話文を選択する関連発話文選択手順をさらにコンピュータに実行させることを特徴とする。
【0041】
この発明によれば、所定の発話文に対する複数の他の発話文それぞれに対して付与された関連度の強弱を表すポイントに基づいて、複数の他の発話文のなかから所定の他の発話文を選択する。したがって、各発話文に付与されたポイントに応じて、所定の発話文に対して所定の強さで関連する関連発話文を抽出することが可能になる。
【0042】
また、請求項15に係る発明は、請求項14に記載の発明において、前記関連発話文選択手順は、前記ポイントの数が最大である他の発話文を選択することを特徴とする。
【0043】
この発明によれば、ポイントの数が最大である他の発話文を選択する。したがって、所定の発話文に対して最も強く関連する関連発話文を一意に抽出することが可能になる。
【0044】
また、請求項16に係る発明は、請求項14に記載の発明において、前記関連発話文選択手順は、前記ポイントの数が所定の数以上である他の発話文を選択することを特徴とする。
【0045】
この発明によれば、ポイントの数が所定の数以上である他の発話文を選択する。したがって、所定の発話文に対して所定の強さで関連する一群の関連発話文を抽出することが可能になる。
【0046】
また、請求項17に係る発明は、複数の情報が記録された情報群を分析する情報群の分析装置であって、前記情報群の情報から各情報間の関連度を分析する際に利用可能な所定の手がかりを取得する手がかり取得手段と、前記手がかり取得手段によって取得された所定の手がかりを利用して、所定の情報と他の情報との間における関連度を分析する関連度分析手段と、を備えたことを特徴とする。
【0047】
この発明によれば、情報群の情報から各情報間の関連度を分析する際に利用可能な所定の手がかりを取得し、取得された所定の手がかりを利用して、所定の情報と他の情報との間における関連度を分析する。したがって、各情報が複雑に関連して複雑な構造を有する情報群において各情報間の関連度を把握することが可能になる。
【0048】
また、請求項18に係る発明は、複数の情報が記録された情報群を分析する情報群の分析方法であって、前記情報群の情報から各情報間の関連度を分析する際に利用可能な所定の手がかりを取得する手がかり取得工程と、前記手がかり取得工程によって取得された所定の手がかりを利用して、所定の情報と他の情報との間における関連度を分析する関連度分析工程と、を含んだことを特徴とする。
【0049】
この発明によれば、情報群の情報から各情報間の関連度を分析する際に利用可能な所定の手がかりを取得し、取得された所定の手がかりを利用して、所定の情報と他の情報との間における関連度を分析する。したがって、各情報が複雑に関連して複雑な構造を有する情報群において各情報間の関連度を把握することが可能になる。
【0050】
また、請求項19に係る発明は、複数の情報が記録された情報群を分析する分析方法をコンピュータに実行させる情報群の分析プログラムであって、前記情報群の情報から各情報間の関連度を分析する際に利用可能な所定の手がかりを取得する手がかり取得手順と、前記手がかり取得手順によって取得された所定の手がかりを利用して、所定の情報と他の情報との間における関連度を分析する関連度分析手順と、をコンピュータに実行させることを特徴とする。
【0051】
この発明によれば、情報群の情報から各情報間の関連度を分析する際に利用可能な所定の手がかりを取得し、取得された所定の手がかりを利用して、所定の情報と他の情報との間における関連度を分析する。したがって、各情報が複雑に関連して複雑な構造を有する情報群において各情報間の関連度を把握することが可能になる。
【0052】
【発明の実施の形態】
以下に添付図面を参照して、この発明に係る文字発話記録の分析装置、分析方法および分析プログラム、情報群の分析装置、分析方法および分析プログラムの好適な実施の形態を詳細に説明する。なお、以下においては、本実施の形態で用いる主要な用語を「1:用語の説明」として先ず最初に説明し、続いて本発明に係る実施の形態を「2:本実施の形態に係るチャットログ処理装置」として説明し、最後に種々の変形例を「3:他の実施の形態」として説明することとする。
【0053】
[1:用語の説明]
以下に、本実施の形態で用いる主要な用語を簡単に説明する。先ず最初に、本実施の形態で用いる「チャットログ」とは、図44に示すように、複数人の文字による発話文が発話者ごとに時系列に組分け記録(例えば、改行記録)された文字発話記録を言い、特許請求の範囲に記載の「文字発話記録」および「情報群」の一例である。なお、本実施の形態で用いる「文字」には、特記する場合を除いて図6(b)に示すような絵文字も含まれる。
【0054】
また、本実施の形態で用いる「一発話文」とは、図10に示すように、所定の属性(例えば、発話行為を表す最小単位であるアクト)付与が可能な単位にある一つの発話文を言い、特許請求の範囲に記載の「発話文」および「情報」の一例である。なお、質問や相槌、依頼などを単位とする発話行為、すなわちアクト(Dialogue Act)は一発話文の中に複数存在する場合もあるが、本実施の形態では、簡略したモデルを採用するため、発話文イコール発話行為(複数可能)として説明することとする。
【0055】
また、本実施の形態で用いる「アクト」とは、図15に示すように、例えば、質問・確認、同意・肯定など、各一発話文の発話行為に基づく特徴を示す属性を言い、特許請求の範囲に記載の「発話行為属性」の一例である。さらに、本実施の形態で用いる「役割属性」とは、例えば、議長、事務局、参加者など、各一発話文の発話者に基づく特徴を示す属性を言い、特許請求の範囲に記載の「発話者属性」の一例である。
【0056】
また、本実施の形態で用いる「会議セクション」とは、どの会議にも存在し、かつ、局所(やりとり)・中位(話題)の談話構造より大きな内容単位を基準として、チャットログを分割することで得られる各セクションのことを言う。さらに、本実施の形態で用いる「会議セクション種別」とは、図14に示すように、例えば、開始の挨拶、レビュー実施宣言など、チャットログにおける各セクションの構造を示す属性(構造属性)を言う。
【0057】
また、本実施の形態で用いる「会議タイプ」とは、図16に示すように、例えば、情報収集、情報共有など、各セクションの型を示す属性(型属性)を言う。さらに、本実施の形態で用いる「手がかり表現」とは、図14〜図16や図21、図22に示すように、セクション分割や属性付与、発話文抽出などの処理に際して手がかりとなる特徴表現(属性の成員)を言う。
【0058】
また、本実施の形態で用いる「リンク元」とは、チャットログにおける所定の発話文にリンクする(最も関連する)過去の発話文を言い、「リンク先」とは、チャットログの所定の発話文からリンクする未来の発話文を言う(図26参照)。さらに、本実施の形態で用いる「リンク分析」とは、所定の発話文と他の発話文との間における関連度を分析する処理を言い、この処理の結果として、上記の「リンク元」や「リンク先」が決定される。なお、かかる「リンク分析」に利用するために発話文から取得される情報として、図29に示すような「手がかり」と呼ばれるものがある。
【0059】
[2:本実施の形態に係るチャットログ処理装置]
次に、本発明に係る文字発話記録の分析装置、分析方法および分析プログラム、情報群の分析装置、分析方法および分析プログラムの好適な実施の形態として、本実施の形態に係るチャットログ処理装置を説明する。なお、ここでは、以下に示すように、「2−1:チャットログ処理装置の概略および主たる特徴」、「2−2:発話文取得部の構成」、「2−3:発話文取得処理の手順」、「2−4:発話文取得処理の効果等」、「2−5:属性付与部の構成」、「2−6:属性付与処理の手順」、「2−7:属性付与処理の効果等」、「2−8:議事録作成部の構成および処理手順」、「2−9:議事録作成処理の効果等」、「2−9:リンク分析部の構成」、「2−10:リンク分析処理の手順」、「2−11:リンク分析処理の効果等」に区分けして説明することとする。
【0060】
(2−1:チャットログ処理装置の概略および主たる特徴)
図1は、チャットログ処理装置の概略構成を示すブロック図であり、図2〜図4は、チャットログ処理装置の概略処理を説明するための図である。図1に示すように、本実施の形態に係るチャットログ処理装置10は、入力部11と、出力部12と、入出力制御IF部13と、発話文取得部20と、属性付与部30と、議事録作成部40と、リンク分析部50とから構成される。
【0061】
このチャットログ処理装置10は、概略的に、チャットログ(図44参照)から議事録(図23参照)を作成する装置であり、発話文取得部20が、複数の一発話文が所定の属性付与単位とは無関係に記録されているチャットログから一発話文を順次取得する点、属性付与部30が、一発話文ごとに分割されたチャットログを複数のセクションに分割しつつ各セクションに対してチャットログ構造に適合した所定の属性を付与する点、議事録作成部40が、複数のセクションに分割されて所定の属性がそれぞれ付与されたチャットログから所望の議事録を作成する点、さらに、リンク分析部50が、議事録作成部40の処理対象であるチャットログにおいて各発話文間の関連度を分析する点に、それぞれ主たる特徴がある。以下に、これらの主たる特徴を簡単に説明する。
【0062】
(1)発話文取得部20の主たる特徴
チャットログは、図2(a)に示すように、複数人の文字による発話文が発話者ごとに時系列に改行記録されて構成される。すなわち、複数の一発話文がアクト付与単位(発話行為を表す最小単位であるアクトの付与が可能な単位)とは無関係に改行され、一行で一発話文となる場合だけでなく、一行に複数の一発話文が存在する場合や、発話文が途中で改行されている場合、文途中で他の話者の発話が挿入されている場合などもある。
【0063】
そこで、発話文取得部20では、一発話文の文末を特定するための文末ルール(図7参照)を参照し、チャットログの所定箇所を一発話文の文末として特定し、各行の文末のうちで一発話文の文末として特定されなかった文末を当該行の後方に記録されている同一発話者の行の文頭と結合するとともに、一発話文の文末として特定された所定箇所にてチャットログを分割するようにしている。
【0064】
したがって、図2(b)に示すように、複数の一発話文がアクト付与単位とは無関係に記録されているチャットログから一発話文を順次取得することが可能になり、後述するように、各一発話文に役割属性やアクトを付与したり、一発話文を議事録項目として抽出するなど、チャットログを一発話文単位で確実に処理することも可能になる。
【0065】
また、チャットログには、相手話者名指定(>氏名)、括弧、比較的自由な句読点、顔文字、笑いマーク、日時表示、矢印、http/メールアドレス、計算式、資料形式入力などの特殊な文字表現や、さらに、話し言葉と書き言葉の変形表現が登場する場合も多く、一発話文を順次取得する際の妨げになっていた。
【0066】
そこで、発話文取得部20では、このようなチャットログに登場し得る特定表現と当該特定表現の変換後の統制された表現とを対応付けた変換ルール(図6参照)を参照し、チャットログ内の特定表現を統制された表現に変換し、かかる変換後のチャットログに対して一発話文の文末特定を行うようにもしている。したがって、一発話文を取得する際の妨げとなる特定表現をチャットログから排除することができ、一発話文を確実に取得することが可能になる。
【0067】
(2)属性付与部30の主たる特徴
また、チャットログ処理装置10の属性付与部30では、発話文取得部20によって一発話文ごとに分割されたチャットログの各一発話文に対して役割属性(例えば、議長、事務局、参加者など、発話者に基づく特徴を示す発話者属性)を付与するとともに、この役割属性を参照してチャットログを複数のセクションに分割し、各セクションに対して会議セクション種別(例えば、開始の挨拶、レビュー実施宣言など、チャットログにおける各セクションの構造を示す構造属性)を付与するようにしている。
【0068】
したがって、図3(c)に示すように、一発話文ごとに分割されたチャットログを複数のセクションに分割しつつ各セクションに対してチャットログ構造に適合した所定の属性を付与することが可能になり、さらに、後述するように、各セクションに会議タイプを付与したり、各セクションに付与された属性に基づいて所望の議事録を作成するなど、チャットログ構造に適合したセクション単位でチャットログを処理することも可能になる。
【0069】
また、属性付与部30では、各一発話文に対してアクト(例えば、質問・確認、同意・肯定など、各発話文の発話行為に基づく特徴を示す発話行為属性)を付与するとともに、各セクションに付与された会議セクション種別、各一発話文に付与された役割属性およびアクトを参照し、各セクションに対して会議タイプ(例えば、情報収集、情報共有など、各セクションの型を示す型属性)を付与するようにもしている。
【0070】
したがって、図3(c)に示すように、各セクションに対してチャットログ構造に一層適合した所定の属性を付与することが可能になり、さらに、後述するように、各セクションに付与された属性や各一発話文に付与されたアクトに基づいて一層所望の議事録を作成するなど、チャットログ構造に適合したセクション単位でチャットログを処理することも可能になる。
【0071】
(3)議事録作成部40の主たる特徴
また、チャットログ処理装置10の議事録作成部40では、属性付与部30によって各セクションおよび各一発話文に所定の属性が付与されたチャットログについて、この各セクションおよび各一発話文の属性に基づいて議事録を作成するようにしている。より詳細には、各セクションおよび一発話文に付与され得る属性に対応付けてチャットログから抽出する一発話文が規定されたルールを参照し、当該ルールに規定された属性が付与されているセクションのなかから当該ルールに規定された属性が付与されている一発話文を抽出することによって議事録を作成するようにしている。
【0072】
したがって、複数のセクションに分割されて所定の属性がそれぞれ付与されたチャットログから所望の議事録を自動的に作成することが可能になる。より詳細には、図3(d)に示すように、チャットログから決定事項、宿題、今後の課題などの議事録項目に対応する発話文を抽出することができ、かかる議事録項目をフォームに備える議事録(図45参照)を自動的に作成することが可能になる。
【0073】
(4)リンク分析部50の主たる特徴
ところで、図3(d)に示すような重要発話文を抽出した議事録では、議事録項目ごとに重要発話文が一つずつ列挙されるだけであり、照応代名詞の照応先、対応する質問や回答文などがないので、議事録の内容を容易に理解することができない場合もある。このため、議事録の理解を容易にするには、重要発話文に関連する他の関連発話文も一緒に列挙することが望まれる。
【0074】
しかしながら、チャットログは、例えば、話題という観点から考察しても、一つの話題から複数の話題が生まれたり、複数の話題が並行に入り組んで進行したり、複数の話題が結合して一つの話題になったり、一つの話題のなかで中位・下位の話題が枝分かれ状に進行したりなど、極めて複雑な構造を有するものである。言い換えれば、チャットログおける各発話文は、「開始、応答、補足」といった機能で括られるグループ内の各発話文同士だけで関連するといったものではなく、チャットログにおける他の全ての発話文との間で強弱はあれども何かしらの関連性を有するものである。
【0075】
このようなことから、各発話文が複雑に関連して複雑な構造を有するチャットログにおいて、重要発話文に関連する他の関連発話文を的確に抽出するには、各発話文の間における関連度を把握することが前提条件として必要になる。そこで、チャットログ処理装置10のリンク分析部50では、チャットログの発話文から各発話文間の関連度を分析する際に利用可能な所定の手がかり(図27参照)を取得し、所定の発話文と他の発話文との間における関連度を分析するようにしている。
【0076】
より詳細には、取得した手がかりとヒューリスティックス(図33参照)を利用して、所定の発話文に対する複数の他の発話文それぞれに対して関連度の強弱を表すポイントを付与する(図27参照)。したがって、各発話文が複雑に関連して複雑な構造を有するチャットログにおいて各発話文間の関連度を強弱のポイントによって把握することが可能になる。
【0077】
また、リンク分析部50では、上記の付与されたポイントに基づいて、所定の発話文に対してリンク元となる他の発話文(最も関連する過去の発話文)若しくはリンク先となる他の発話文(最も関連する未来の発話文)を選択決定する。したがって、所定の発話文に対して最も強く関連する関連発話文を的確に抽出することが可能になる。さらに、これを利用して、議事録作成部40によって抽出された重要発話文に対して最も強く関連する関連発話文を的確に抽出して、図4に示すように、重要発話文および関連発話文の両者が列挙された理解が容易な議事録を作成することも可能になる。
【0078】
なお、チャットログ処理装置10において、入力部11は、各種の情報の入力を外部から受付ける入力手段であり、出力部12は、各種の情報を外部へ出力する出力手段であり、入出力制御IF部13は、これら入力部11および出力部12によるデータの入出力や、発話文取得部20、属性付与部30、議事録作成部40およびリンク分析部50の間におけるデータの入出力を制御する制御手段である。
【0079】
具体的には、これらの入力部11および出力部12は、キーボードやマウス、マイク、モニタ、スピーカなどのユーザインターフェースの他に、記録媒体による入出力を受け付ける媒体用インターフェースや、ネットワーク(図示せず)を介した入出力を受け付ける通信用インターフェースを備えて構成され、チャットログの入力や、議事録の出力、チャットログ処理装置10内の各種ルールの入力などを行う。
【0080】
なお、このチャットログ処理装置10は、既知のパーソナルコンピュータ、ワークステーション、PHS端末、携帯端末、移動体通信端末またはPDAなどの情報処理装置に、上記した発話文取得部20、属性付与部30、議事録作成部40およびリンク分析部50の各機能を搭載することによって実現することもできる。
【0081】
(2−2:発話文取得部の構成)
次に、図1に示した発話文取得部20の構成を説明する。図5は、発話文取得部20の構成を示すブロック図である。同図において、発話文取得部20の記憶部21は、制御部22による各種処理に必要なデータおよびプログラムを格納する格納手段(記憶手段)であり、機能的に、チャットログメモリ21aと、一時メモリ21bと、取得後メモリ21cとを備えて構成される。
【0082】
このうち、チャットログメモリ21aは、一発話文取得処理前のチャットログ(図8および図9参照)を記憶するメモリであり、取得後メモリ21cは、一発話文取得処理後のチャットログ(図10および図11参照)を記憶するメモリであり、一時メモリ21bは、処理途中のデータを記憶するメモリである。
【0083】
つまり、一発話文取得処理では、チャットログから一行ずつ発話文を分割して切り出した後、これを同一発話者の後続の行文頭と結合したりしながら一発話文の文末を特定し、この特定した文末でチャットログを分割しているが、この最初の切り出しから最後の分割までの間、各行の発話文を発話者毎に記憶管理するのが一時メモリ21bである。
【0084】
また、図5において、発話文取得部20の制御部22は、OS(Operating System)などの制御プログラム、各種の処理手順などを規定したプログラムおよび所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する処理部であり、機能的に、変換部23と、文末特定部24と、分割部25と、結合部26とを備えて構成される。
【0085】
このうち、変換部23は、チャットログに登場し得る特定表現と当該特定表現の変換後の統制された表現とを対応付けた変換ルール23aを参照し、チャットログに登場する特定表現を統制された表現に変換する変換手段である。具体的には、この変換ルール23aは、図6(a)および(b)に示すように、話者指定、自由な句読点、顔文字、笑いマーク、サイズ、感動詞、フィラー、接続詞、変形表現などについて、その変換対象と変換後表現とを対応付けて構成されるものであり、例えば、話者指定などは、後述する文末特定処理の便宜のために、後述する文末ルール24aに規定された文字列と同様の文字列「。」が規定されている。
【0086】
文末特定部24は、一発話文の文末を特定するための文末ルール24aを参照し、チャットログの所定箇所を一発話文の文末として特定する文末特定手段である。具体的には、この文末ルール24aは、図7に示すように、チャットログの行末に登場し一発話文の文末になり得る文字列を規定した「行末特定ルール」と、チャットログの行頭から行末の間に登場し一発話文の文末になり得る文字列を規定した「行内特定ルール」と、チャットログの行頭から文末に至る一文として一発話文の文頭および文末となり得る文字列の組み合わせを規定した「一行特定ルール(略語ルールを除く)」と、チャットログの行頭から行末に至る一文字列として一発話文となり得る文字列を規定した「一行特定ルール(略語ルール)」と、チャットログの行頭に登場し一発話文の文頭となり得る文字列を規定した「行接続関係に基づく前文特定ルール」と、所定の組同士の発話間隔を規定した「発話間隔に基づく前文特定ルール」とから構成される。
【0087】
そして、文末特定部24は、これらの文末ルール24aを参照し、例えば、チャットログの各行末のうちで「行末特定ルール」に規定された文字列が存在する行末を一発話文の文末として特定し、また、各行の行頭から行末の間で「行内特定ルール」に規定された文字列が存在する箇所を一発話文の文末として特定し、また、「一行特定ルール(略語ルールを除く)」に規定された文字列の組み合わせが一文として行頭および行末に存在する行の当該行末を一発話文の文末として特定し、また、「一行特定ルール(略語ルール)」に規定された文字列が一文字列として行頭から行末に至っている行の行末を一発話文の文末として特定し、また、「行接続関係に基づく前文特定ルール」に規定された文字列が行頭に存在する行の前方に記録されている同一発話者の行の行末を一発話文の文末として特定し、さらに、所定の行と行との間の発話間隔が「発話間隔に基づく前文特定ルール」に規定された発話間隔を超える場合に、前の行の行末を一発話文の文末として特定する。
【0088】
分割部25は、文末特定部24によって一発話文の文末として特定された所定箇所にてチャットログを分割する分割手段である。具体的には、上記した一時メモリ21bに記憶されたチャットログの一部について文末が特定された場合に、分割部25は、かかる特定された文末にてチャットログを分割しつつ取得後メモリ21cに格納する。
【0089】
結合部26は、チャットログの各行の行末のうちで文末特定部24によって一発話文の文末として特定されなかった文末と、当該行の後方に記録されている同一発話者の行の行頭とを結合する結合手段である。具体的には、チャットログは一発話文取得処理において一行ずつ分割されて発話者毎の一時メモリ21bに格納されて処理されるが、結合部26は、一発話文が途中で改行されている場合の同一話者の各行同士や、一発話文の途中で他の話者の発話が挿入されている場合の同一話者の各行同士を一時メモリ21b内で結合する。
【0090】
(2−3:発話文取得処理の手順)
次に、上記のように構成される発話文取得部20による発話文取得処理の手順を説明する。図12は、発話文取得処理を示すフローチャートである。同図に示すように、発話文取得部20は、チャットログメモリ21aに格納されたチャットログから一行ずつ発話文を取得し、該当する発話者の一時メモリ21bに格納する(ステップS1201)。
【0091】
続いて、変換部23は、変換ルール23aを参照し、ステップS1201において一時メモリ21bに格納されたばかりの発話文(以下、この一行の発話文を現在文と言う。)に存在する特定表現を統制された表現に変換する(ステップS1201)。なお、図12には明示していないが、かかる変換処理に合わせて、現在文から発話時刻、発話者、相手発話者に関する情報が抽出される。
【0092】
そして、現在文が格納された一時メモリ21bに前文(未だ文末が特定されていない同一発話者の発話文)が既に格納されている場合には(ステップS1203肯定)、文末特定部24は、現在文と前文との間の発話間隔が「発話間隔に基づく前文特定ルール」に規定された発話間隔を超える否か、さらには、「行接続関係に基づく前文特定ルール」に規定された文字列が現在文の行頭に存在するか否かを判定する(ステップS1204および2705)。
【0093】
この判定により、前文の行末が一発話文の文末として特定されなかった場合には(ステップS1204否定、かつ、ステップS1205否定)、結合部26は、前文の行末と現在文の行頭とを一時メモリ21b内で結合する(ステップS1209)。なお、結合後は前文も含んで「現在文」として処理される(ステップS1212〜2715)。
【0094】
これとは反対に、前文の行末が一発話文の文末として特定された場合には(ステップS1204肯定、または、ステップS1205肯定)、前文と現在文との結合は行われず、前文の分割処理が行われた後に(ステップS1206〜2708)、現在文の分割処理が行われる(同図A参照)。すなわち、この場合、文末特定部24は、一時メモリ21bに格納されている前文について、「行内特定ルール」に規定された文字列が存在する箇所を一発話文の文末として特定する(ステップS1206)。
【0095】
そして、前文の行内でも文末が特定できた場合には(ステップS1206肯定)、分割部25は、かかる特定された文末にて前文を分割しつつ取得後メモリ21cに格納する(ステップS1207)。一方、前文の行内では文末が特定できなかった場合には(ステップS1206否定)、分割部25は、前文をそのまま一時メモリ21bから取り出して取得後メモリ21cに格納する(ステップS1208)。なお、ステップS1207および2708による処理を経ることで、一時メモリ21bには現在文のみが格納されている状態となる。
【0096】
ここで、ステップS1207による処理の説明に戻ると、現在文が格納された一時メモリ21bに前文が格納されていない場合には(ステップS1203肯定または同図A)、文末特定部24は、現在文が「一行特定ルール(略語ルールを除く)」に規定された文字列の組み合わせまたは「一行特定ルール(略語ルール)」に規定された文字列であるか否かを判定する(ステップS1210)。
【0097】
この判定により、現在文の行末を一行の発話文の文末として特定できた場合には(ステップS1210肯定)、分割部25は、現在文をそのまま一時メモリ21bから取り出して取得後メモリ21cに格納する(ステップS1211)。そして、チャットログメモリ21aに格納されたチャットログの全ての行について処理を行っている場合には(ステップS1216肯定)、発話文取得処理を終了し、そうでない場合には(ステップS1216否定)、ステップS1201に戻って、現在文の次に記録されている行について処理を開始する。
【0098】
一方、ステップS1210の判定において現在文の行末を一行の発話文の文末として特定できた場合(ステップS1210肯定)や、ステップS1209を経て現在文が前文と結合された場合には、文末特定部24は、現在文の行末が「行末特定ルール」に規定された文字列であるか否かを判定する(ステップS1212)。そして、現在文の行末を文末として特定できなかった場合には(ステップS1212否定)、現在文を一時メモリ21bに格納した状態で、ステップS1201に戻り、現在文の次に記録されている行について処理を開始する。
【0099】
これとは反対に、現在文の行末を文末として特定できた場合には(ステップS1212肯定)、文末特定部24は、一時メモリ21bに格納されている現在文について、「行内特定ルール」に規定された文字列が存在する箇所を一発話文の文末として特定する(ステップS1213)。
【0100】
そして、現在文の行内でも文末が特定できた場合には(ステップS1213肯定)、分割部25は、かかる特定された文末にて現在文を分割しつつ取得後メモリ21cに格納する(ステップS1214)。一方、現在文の行内では文末が特定できなかった場合には(ステップS1213否定)、分割部25は、現在文をそのまま一時メモリ21bから取り出して取得後メモリ21cに格納する(ステップS1215)。
【0101】
続いて、かかるステップS1214または2715の処理の後、チャットログメモリ21aに格納されたチャットログの全ての行について処理を行っている場合には(ステップS1216肯定)、発話文取得処理を終了し、そうでない場合には(ステップS1216否定)、ステップS1201に戻って、現在文の次に記録されている行について処理を開始する。
【0102】
(2−4:発話文取得処理の効果等)
上述してきたように、発話文取得部20では、文末ルール24aを参照し、チャットログの所定箇所を一発話文の文末として特定するとともに、各行の文末のうちで一発話文の文末として特定されなかった文末を当該行の後方に記録されている同一発話者の行の文頭と結合し、一発話文の文末として特定された所定箇所にてチャットログを分割する。したがって、複数の一発話文がアクト付与単位とは無関係に記録されているチャットログ(図8および図9参照)から、一発話文ごとに分割整理されたチャットログ(図10および図11参照)を得ることが可能になる。この結果、各一発話文に役割属性やアクトを付与したり、一発話文を議事録項目として抽出するなど、チャットログを一発話文単位で確実に処理することも可能になる。そして、かかる発話文取得処理によって、多人数の話者による不規則で、一見複雑に見えるチャットログから、適切に発話文単位を取得することも可能になる。
【0103】
また、発話文取得部20では、チャットログの行末に登場し一発話文の文末になり得る文字列を「行末特定ルール」として規定し、チャットログの各行末のうちで「行末特定ルール」に規定された文字列が存在する行末を一発話文の文末として特定する。したがって、各行の行末でチャットログを分割するのか結合するのかを確実に判定することが可能になる。
【0104】
また、発話文取得部20では、チャットログの行頭から行末の間に登場し一発話文の文末になり得る文字列を「行内特定ルール」として規定し、各行の行頭から行末の間で「行内特定ルール」に規定された文字列が存在する箇所を一発話文の文末として特定する。したがって、一行に複数の一発話文が存在する場合でも確実に一発話文を取得することが可能になる。
【0105】
また、発話文取得部20では、チャットログの行頭から文末に至る一文として一発話文の文頭および文末となり得る文字列の組み合わせを「一行特定ルール(略語ルールを除く)」として規定し、「一行特定ルール(略語ルールを除く)」に規定された文字列の組み合わせが一文として行頭および行末に存在する行の当該行末を一発話文の文末として特定する。したがって、ドキュメントとしての特徴を備えた一発話文(例えば、日時表示、計算式、httpアドレス、メールアドレスなど)などがチャットログに存在する場合でも、かかる一発話文を確実に取得することが可能になる。
【0106】
また、発話文取得部20では、チャットログの行頭から行末に至る一文字列として一発話文となり得る文字列を「一行特定ルール(略語ルール)」として規定し、「一行特定ルール(略語ルール)」に規定された文字列が一文字列として行頭から行末に至っている行の行末を一発話文の文末として特定する。したがって、文字対話としての特徴を備える一発話文(例えば、OK、NGといった略語など)がチャットログに存在する場合でも、かかる一発話文を確実に取得することが可能になる。
【0107】
また、発話文取得部20では、チャットログの行頭に登場し一発話文の文頭となり得る文字列を「行接続関係に基づく前文特定ルール」として規定し、「行接続関係に基づく前文特定ルール」に規定された文字列が行頭に存在する行の前方に記録されている同一発話者の行の行末を一発話文の文末として特定する。したがって、上記の「行末特定ルール」や「一行特定ルール」によって文末として特定されなかった行末を備える一発話文であっても、後続との関係から遡って一発話文として取得することが可能になる。
【0108】
また、発話文取得部20では、所定の組同士の発話間隔を「発話間隔に基づく前文特定ルール」として規定し、所定の行と行との間の発話間隔が「発話間隔に基づく前文特定ルール」に規定された発話間隔を超える場合に、前の行の文末を一発話文の文末として特定する。したがって、離席などによって一発話文の入力が途中で終ったような場合でも、これが他の発話文と結合されることを回避することが可能になる。
【0109】
また、発話文取得部20では、チャットログに登場し得る特定表現と当該特定表現の変換後の統制された表現とを対応付けた変換ルール23aを参照し、チャットログに登場する特定表現を統制された表現に変換し、かかる変換後のチャットログについて一発話文の文末特定を行う。したがって、一発話文を取得する際の妨げとなる特定表現をチャットログから排除することができ、一発話文を確実に取得することが可能になる。
【0110】
また、発話文取得部20では、変換後の統制された表現として文末ルール24aに規定された文字列と同様の文字列を変換ルール23aとして規定する。したがって、チャットログ内の特定表現を一発話文の文末特定に役立つ統制された表現に変換することができ、チャットログから一発話文を確実に取得することが可能になる。
【0111】
ところで、発話文取得部20では、特定表現の変換を行った後に一発話文の文末特定を行うこととしたが、本発明はこれに限定されるものではなく、一発話文の文末特定を行った後に特定表現の変換を行うようにしてもよい。ただし、この場合には、文末ルール24aに規定される各ルールも、変換処理前のチャットログに登場する特定表現を想定したものとなる。なお、特定表現は変換しないで、一発話文の文末特定のみを行うようにしてもよい。
【0112】
また、発話文取得部20では、図12に示した手順で発話文取得処理を行うこととしたが、本発明はこれに限定されるものではなく、かかる処理の順序は任意であり、例えば、各種の判定処理を並列的に行うことによって一発話文の文末を高速に特定するようにしてもよい。
【0113】
(2−5:属性付与部の構成)
次に、図1に示した属性付与部30の構成を説明する。図13は、属性付与部30の構成を示すブロック図である。同図において、属性付与部30の記憶部31は、制御部32による各種処理に必要なデータおよびプログラムを格納する格納手段(記憶手段)であり、具体的には、発話文取得部20による発話文取得処理後のチャットログや、属性付与部30による属性付与処理途中のチャットログ、さらには、この属性付与処理後のチャットログなどを記憶する。
【0114】
また、図13において、属性付与部30の制御部32は、OS(Operating System)などの制御プログラム、各種の処理手順などを規定したプログラムおよび所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する処理部であり、機能的に、役割属性付与部33と、会議セクション種別付与部34と、アクト付与部35と、会議タイプ付与部36とを備えて構成される。
【0115】
このうち、役割属性付与部33は、役割属性付与ルール33aを参照して、発話文取得部20によって一発話文ごとに分割されたチャットログの各一発話文に対して役割属性(例えば、議長、事務局、参加者など、発話者に基づく特徴を示す発話者属性)を付与する発話者属性付与手段である。具体的には、チャットログ内にチャットプロトコルとしてメンバー情報(チャットログに登場する各発話者と、議長、事務局、参加者などの役割属性とを対応付けた情報)を予め記録させておき、この議長・メンバー情報を抽出した後に、役割属性付与ルール33aを参照して各一発話文にそれぞれ対応する役割属性を付与する。
【0116】
なお、このメンバー情報をチャットログに予め記録させるのではなく、入力部11を介して属性付与部30に別途入力させるようにしてもよく、さらには、かかるメンバー情報を予め記録したり別途入力させるのではなく、チャットログの解析によって役割属性付与部33がメンバー情報を自動的に導き出し(どの発話者が議長であるか等をチャットログ解析で導き出し)、これを用いて役割属性を付与するようにしてもよい。つまり、この役割属性についてのメンバー情報がチャットログに存在しない場合は、議長が発言する可能性がある手がかり表現に基づき、メンバーのなかから最も議長としてふさわしい発言をしている人を自動推定する。なお、この手がかり表現としては、図14(b)に示す会議セクション特有の表現を用いる。
【0117】
会議セクション種別付与部34は、役割属性付与部33によって付与された役割属性および会議セクション種別付与ルール34aを参照し、チャットログを複数のセクションに分割しつつ各セクションに対して会議セクション種別(例えば、開始の挨拶、レビュー実施宣言など、チャットログにおける各セクションの構造を示す構造属性)を付与する構造属性付与手段である。
【0118】
具体的には、この会議セクション識別付与ルール34aは、図14(b)に示すように、会議セクション種別(同図(a)参照)ごとに「議長」の手がかり表現を対応付けて規定したものである。そして、会議セクション種別付与部34は、「議長」の役割属性が付与された一発話文のなかに手がかり表現が存在するか否かをチェックし、手がかり表現が存在する場合には、その一発話文を境にしてチャットログをセクションに分割するとともに、手がかり表現に対応した会議セクション種別を付与する。
【0119】
また、会議セクション種別付与部34は、会議セクション識別付与ルール34aを参照し、各セクションに付与された会議セクション種別の連接関係、重複関係または前後関係に基づいて、各セクションの会議セクション種別を修正する構造属性修正手段でもある。つまり、図14(b)に示したルールに基づくと、各セクションに複数の会議セクション種別が誤って付与されることがあるため、誤って重複付与された会議セクション種別を削除して、一つのセクションには一つの会議セクション種別が付与されている状態に修正する趣旨である。
【0120】
具体的には、会議セクション識別付与ルール34aには、図14(c)に示すように、会議セクション連鎖構造ルールとして、会議セクション種別(同図(a)参照)の組み合わせごとに修正条件および修正内容が規定される。なお、同図において、「+」は前後連接関係を示し、「&」は重複関係を示し、「:」は離れた前後関係を示し、「(数字)」は削除すべき会議セクション種別を示し、「1」であればルールで指定した前方、「2」であれば後方の会議セクションを削除する。
【0121】
そして、会議セクション種別付与部34は、かかる会議セクション識別付与ルール34aに規定された修正条件を具備する会議セクション種別の組み合わせを検出して、いずれかの会議セクション種別を削除する。つまり、図14(c)の例で言えば、「テーマ実施(報告指示)」および「開始の挨拶」という会議セクション種別が前後に連接するセクション間で付与されている場合には、「テーマ実施(報告指示)」の後に「開始の挨拶」が行われるのは一般的でないため、後のセクションに付与されている「開始の挨拶」は誤って付与されたものとして削除する。
【0122】
図13の説明に戻ると、アクト付与部35は、アクト付与ルール35aを参照して、各一発話文に対してアクト(例えば、質問・確認、同意・肯定など、各発話文の発話行為に基づく特徴を示す発話行為属性)を付与する発話行為属性付与手段である。具体的には、このアクト付与ルール35aは、図15(b)に示すように、アクト(同図(a)参照)ごとに手がかり表現を対応付けて規定したものである。なお、同図において、「*」は任意の文字列を示し、「^」は一発話文の文頭を示し、「$」は一発話文の文末を示す。
【0123】
そして、アクト付与部35は、各一発話文のなかにルールに規定する手がかり表現がルールに規定する態様で存在するか否かをチェックし、対応するアクトを各一発話文に対して付与する。なお、このアクトは、一つの一発話文に対して複数付与されることもある。
【0124】
会議タイプ付与部36は、会議タイプ付与ルール36aを参照するとともに、各セクションに付与された会議セクション種別、各一発話文に付与された役割属性およびアクトを参照し、各セクションに対して会議タイプ(例えば、情報収集、情報共有など、各セクションの型を示す型属性)を付与する型属性付与手段である。
【0125】
具体的には、この会議タイプ付与ルール36aは、図16(b)に示すように、会議タイプ(同図(a)参照)ごとに、役割属性、会議セクション種別およびアクトを対応付けて規定したものである。ここで、同図において、「(数字)」は一発話文の数を示し、「M(メンバー)、H(ホスト)、O(オーナー)」は役割属性を示す。なお、ホストは事務局とも呼ばれ、オーナーは議長とも呼ばれる。
【0126】
つまり、例えば、会議タイプ「情報収集」が付与されるためには、会議セクション種別「開始の挨拶」または「テーマの実施(開始)」が付与されたセクションにおいて、役割属性「メンバー」およびアクト「undef」を付与された7つの一発話文が存在することが条件となる。そして、会議タイプ付与部36は、このような会議タイプ付与ルール36aに規定された条件を各セクションが満たすか否かをチェックし、条件を満たす場合には、その条件に対応した会議タイプを付与する。なお、会議タイプ付与は、その会議タイプの典型的なコミュニケーションタイプをルールとして表現したものであり、発話数、アクト、役割情報、発話の連続性(発話数に+があれば連続発話)、同一話者のみの発話列か(役割情報のO、H、Mに+があれば同一話者のみ)によりルールは構成される。また、否定ルール(図16(b)のルールの先頭に!が付けられているもの)とマッチすれば、その会議タイプは割当てられない。
【0127】
また、会議タイプ付与部36は、会議タイプ付与ルール36aを参照し、各セクションに付与された会議タイプの重複関係に基づいて、各セクションの会議タイプを修正する型属性修正手段でもある。つまり、上記した会議セクション種別付与部34と同様の趣旨から、誤って重複付与された会議タイプを削除して、一つのセクションには一つの会議タイプが付与されている状態に修正する。
【0128】
具体的には、会議タイプ付与ルール36aには、図16(c)に示すように、会議タイプ排他ルールとして、会議タイプ(同図(a)参照)の組み合わせごとに修正条件および修正内容が規定される。なお、同図において、「&」は重複関係を示し、「(数字)」は削除すべき会議タイプ種別を示す。
【0129】
そして、会議タイプ付与部36は、かかる会議タイプ付与ルール36aに規定された修正条件を具備する会議タイプの組み合わせを検出して、いずれかの会議タイプを削除する。つまり、図16(c)の例で言えば、「情報収集」および「決議」という会議タイプが同一のセクションに重複付与されている場合には、「決議」と「情報収集」が一緒に行われることは一般的でないため、「情報収集」は誤って付与されたものとして削除する。
【0130】
(2−6:属性付与処理の手順)
次に、上記したように構成される属性付与部30による属性付与処理の手順を説明する。図17は、属性付与処理を示すフローチャートである。同図に示すように、属性付与部30において、役割属性付与部33は、役割属性付与ルール33aを参照して、発話文取得部20によって一発話文ごとに分割されたチャットログ(図18(a)参照)の各一発話文に対して役割属性を付与する(ステップS1701)。これにより、一発話文ごとに役割属性が付与されたチャットログが得られる(図18(b)参照)。なお、図18には明示的に書かれていないが、チャットログに基づき、発話者名、発話相手名、発話時刻についても各発話文の属性として取得され、メモリ上に保持されている。
【0131】
続いて、会議セクション種別付与部34は、役割属性付与部33によって付与された役割属性および会議セクション種別付与ルール34aを参照し、チャットログを複数のセクションに分割しつつ各セクションに対して会議セクション種別を付与する(ステップS1702)。さらに、会議セクション種別付与部34は、会議セクション識別付与ルール34aを参照し、各セクションに付与された会議セクション種別の連接関係、重複関係または前後関係に基づいて、各セクションの会議セクション種別を修正する(ステップS1703)。これにより、セクションごとに分割されて会議セクション種別が付与されたチャットログが得られる(図18(c)参照)。
【0132】
その後、アクト付与部35は、アクト付与ルール35aを参照して、各一発話文に対してアクトを付与する(ステップS1704)。これにより、各一発話文ごとにアクトが付与されたチャットログが得られる(図18(d)参照)。
【0133】
そして、会議タイプ付与部36は、会議タイプ付与ルール36aを参照するとともに、各セクションに付与された会議セクション種別、各一発話文に付与された役割属性およびアクトを参照し、各セクションに対して会議タイプを付与する(ステップS1705)。さらに、会議タイプ付与部36は、会議タイプ付与ルール36aを参照し、各セクションに付与されたタイプの重複関係に基づいて、各セクションの会議タイプを修正する(ステップS1706)。これにより、セクションごとに会議セクション種別および会議タイプが付与され、かつ、一発話文ごとに役割属性およびアクトが付与されたチャットログが得られる(図18(e)参照)。
【0134】
(2−7:属性付与処理の効果等)
上述してきたように、属性付与部30では、発話文取得部20によって一発話文ごとに分割されたチャットログの各一発話文に対して役割属性(例えば、議長、事務局、参加者など)を付与するとともに、この役割属性を参照してチャットログを複数のセクションに分割し、各セクションに対して会議セクション種別(例えば、開始の挨拶、レビュー実施宣言など)を付与する。したがって、チャットログを複数のセクションに分割しつつ各セクションに対してチャットログ構造に適合した所定の属性を付与することが可能になる。その結果、各セクションに会議タイプを付与したり、各セクションに付与された属性に基づいて所望の議事録を作成するなど、チャットログ構造に適合したセクション単位でチャットログを処理することも可能になる。
【0135】
また、属性付与部30では、各一発話文に対してアクト(例えば、質問・確認、同意・肯定など)を付与するとともに、各セクションに付与された会議セクション種別、各一発話文に付与された役割属性およびアクトを参照し、各セクションに対して会議タイプ(例えば、情報収集、情報共有など)を付与する。したがって、各セクションに対してチャットログ構造に一層適合した所定の属性を付与することが可能になり、さらに、各セクションに付与された属性や各一発話文に付与されたアクトに基づいて一層所望の議事録を作成するなど、チャットログ構造に適合したセクション単位でチャットログを処理することも可能になる。
【0136】
また、属性付与部30では、会議セクション種別ごとに「議長」の手がかり表現を対応付けて会議セクション識別付与ルール34aを規定し、「議長」の役割属性が付与された一発話文のなかに手がかり表現が存在するか否かをチェックする。そして、手がかり表現が存在する場合には、その一発話文を境にしてチャットログをセクションに分割するとともに、手がかり表現に対応した会議セクション種別を付与する。したがって、会議セクション識別付与ルール34aに規定された手がかり表現に着目することで、会議セクション種別を簡単に精度良く付与することが可能になる。
【0137】
また、属性付与部30では、会議セクション識別付与ルール34aを参照し、各セクションに付与された会議セクション種別の連接関係、重複関係または前後関係に基づいて、各セクションの会議セクション種別を修正する。したがって、各セクションに複数の会議セクション種別が誤って付与された場合でも、誤って重複付与された会議セクション種別を削除し、会議セクション種別を精度良く付与することが可能になる。
【0138】
また、属性付与部30では、会議タイプごとに、役割属性、会議セクション種別およびアクトを対応付けた条件として会議タイプ付与ルール36aを規定し、会議タイプ付与ルール36aに規定された条件を各セクションが満たすか否かをチェックし、条件を満たす場合には、その条件に対応した会議タイプを付与する。したがって、会議タイプ付与ルール36aに規定された各属性の対応条件に着目することで、会議セクション種別を簡単に精度良く付与することが可能になる。
【0139】
また、属性付与部30では、会議タイプ付与ルール36aを参照し、各セクションに付与されたタイプの重複関係に基づいて、各セクションの会議タイプを修正する。したがって、各セクションに複数の会議タイプが誤って付与された場合でも、誤って重複付与された会議タイプを削除し、会議タイプを精度良く付与することが可能になる。
【0140】
ところで、属性付与部30では、各一発話文に役割属性およびアクトを付与するとともに、各セクションに会議セクション種別および会議タイプを付与することとしたが、本発明はこれに限定されるものではなく、その数や種類は任意であって、各一発話文それぞれを特徴付ける所定の属性や、各セクションそれぞれを特徴付ける所定の属性であればよい。
【0141】
また、属性付与部30では、役割属性「議長」が付与された発話文の手がかり表現を基にしてセクションの分割および会議セクション種別の付与を行うこととしたが、本発明はこれに限定されるものではなく、他の役割属性が付与された発話文の手がかり表現を組み合わせて分割や付与を行うようにしてもよい。
【0142】
また、属性付与部30では、一旦付与した会議セクション種別および会議タイプを修正することとしたが、本発明はこれに限定されるものではなく、一旦付与されたアクトをも修正するようにしてもよい。なお、一旦付与されたこれらの属性を修正することなく処理を継続するようにしてもよい。
【0143】
また、属性付与部30では、発話文取得部20による発話文取得処理後のチャットログ(一発話文ごとに分割されたチャットログ)に対して属性を付与することとしたが、本発明はこれに限定されるものではなく、入力部11を介して外部から入力された発話文取得処理後のチャットログに対して属性を付与するようにしてもよい。
【0144】
(2−8:議事録作成部の構成および処理手順)
次に、図1に示した議事録作成部40の構成および処理手順を説明する。図19は、議事録作成部40の構成を示すブロック図である。同図において、議事録作成部40の記憶部41は、制御部42による各種処理に必要なデータおよびプログラムを格納する格納手段(記憶手段)であり、具体的には、属性付与部30による属性付与処理後のチャットログや、議事録作成部40によって作成された議事録などを記憶する。
【0145】
また、図19において、議事録作成部40の制御部42は、OS(Operating System)などの制御プログラム、各種の処理手順などを規定したプログラムおよび所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する処理部であり、機能的に、属性取得部43と、重要発話文抽出部44とを備えて構成される。
【0146】
このうち、属性取得部43は、記憶部41に記憶されたチャットログから各セクションおよび各一発話文に付与されている属性を取得する属性取得手段である。具体的には、記憶部41には、セクションごとに会議セクション種別および会議タイプが付与され、かつ、一発話文ごとに役割属性およびアクトが付与されたチャットログが記憶されているので、属性取得部43は、これら会議セクション種別、会議タイプ、役割属性およびアクトを取得することとなる。
【0147】
そして、重要発話文抽出部44は、重要発話文抽出ルール44aを参照し、属性取得部43によって取得された各属性(各セクションに付与された会議セクション種別および会議タイプ、さらには、各一発話文に付与された役割属性およびアクト)に基づいて議事録を作成する手段である。
【0148】
具体的には、重要発話文抽出ルール44aは、図20(b)および図21に示すように、議事録項目(図20(a)参照)ごとに、会議セクション種別、会議タイプ、役割属性、アクトおよび手がかり表現(図22参照)を対応付けて規定したものである。つまり、重要文抽出のルールは、図20(b)に示すように、議事録項目毎に複数存在し(OR条件として作用し)、また否定ルール(先頭に!が与えられたルール)に一つでもマッチした場合、発話文の抽出は行わない。そして、重要発話文処理部44は、例えば、議事録項目「決定事項」の一つのルールは、役割情報がオーナー(議長)で、かつ会議セクション種別「開始の挨拶」であり、かつ会議タイプ「定例報告」であり、かつ別途用意した「決定事項手がかり表現」のなかのどれかの表現にマッチすることを要求する。一方で、アクト「発言終了」である発話文は否定ルールによって抽出はされない。
【0149】
このような処理を経て、重要発話文抽出部44は、「決定事項、課題、宿題、討議内容、今後の予定」などの議事録項目ごとに重要発話文を抽出する。そして、その結果として、議事録作成部40は、図23に示すように、議事録項目ごとに対応する発話文が抽出された議事録を自動的に作成することとなる。
【0150】
(2−9:議事録作成処理の効果等)
上述してきたように、議事録作成部40では、属性付与部30によって各セクションおよび各一発話文に属性が付与されたチャットログについて、この各セクションおよび各一発話文の属性に基づいて議事録を作成する。したがって、複数のセクションに分割されて所定の属性がそれぞれ付与されたチャットログから所望の議事録を自動的に作成することが可能になる。
【0151】
より詳細には、議事録作成部40では、各セクションおよび一発話文に付与され得る属性に対応付けてチャットログから抽出する一発話文が規定された重要発話文抽出ルール44aを参照し、当該ルールに規定された属性が付与されているセクションのなかから当該ルールに規定された属性が付与されている一発話文を抽出することによって議事録を作成する。したがって、例えば、チャットログから決定事項、宿題、今後の課題などの議事録項目に対応する発話文を抽出することができ、かかる議事録項目をフォームに備える議事録を自動的に作成することが可能になる。
【0152】
ところで、議事録作成部40では、チャットログに付与された会議セクション種別、会議タイプ、役割属性、アクトといった属性を利用して議事録を作成することとしたが、本発明はこれに限定されるものではなく、これらの属性を任意に取捨選択して議事録を作成するようにしてもよく、さらに他の属性をも利用して議事録を作成するようにしてもよい。
【0153】
また、議事録作成部40では、決定事項、宿題、今後の課題といった議事録項目を備える議事録を作成することとしたが、本発明はこれに限定されるものではなく、重要発話文抽出ルール44aを任意に規定することで、任意の議事録項目を備える議事録を作成するようにしてもよい。さらに、チャットログから定型項目(定型フォーマット)に抽出してターゲットドキュメントを作成する形態として、上記のような議事録を作成する場合に本発明は限定されるものではなく、例えば以下に説明する仕様書や手順書など、定型のフォーマットを有するあらゆる文書を作成する場合にも同様に適用することができる。
【0154】
すなわち、「特定の複数人によるチャットにより、分散された情報を整理し、チャットにより成立したコンセンサスに基づいて共有化し、ターゲットドキュメントに対してアウトプットする」という観点から、例えば、ひとつのシステム(スーパーコンピュータ等)の仕様書や操作マニュアル、手順書などの作成あるいは改版にも本発明を同様に適用することができる。つまり、仕様書や手順書などの作成あるいは改版を想定した場合、通常は「ドラフト回覧し、各々(各技術者の担当モジュール)のエンハンス情報を寄せ集めて、整合性をとってドキュメントにまとめる」という作業が発生するが、図42に示すように、チャットによる決定確認事項を上記議事録作成と同様の手順で抽出し、予めタグ付けしたターゲットドキュメントに自動挿入するよう出力させることで、自動的にエンハンス事項を網羅した改版ドキュメントを得ることが可能になる。
【0155】
また、議事録作成部40では、属性付与部30による属性付与処理後のチャットログ(セクションおよび一発話文ごとに属性が付与されたチャットログ)について議事録を作成することとしたが、本発明はこれに限定されるものではなく、入力部11を介して外部から入力された属性付与処理後のチャットログについて議事録を作成するようにしてもよい。
【0156】
また、議事録作成部40では、重要発話文を抽出することで議事録を作成することとしたが、本発明はこれに限定されるものではなく、いわゆるアジェンダ(議題)などの特定の文字列をチャットログに挿入することで議事録を作成するようにしてもよい。すなわち、チャットログの各セクションおよび各一発話文の属性を参照してアジェンダの挿入箇所を特定し、当該特定した挿入箇所にアジェンダを挿入することによって議事録を作成する。これによって、アジェンダが挿入された議事録を自動的に作成することも可能になる。
【0157】
さらに、議事録作成部40では、各セクションおよび各一発話文の属性を参照してチャットログを要約することによって議事録を作成するようにしてもよい。つまり、話題推移ややりとりなどの局所・中位の談話構造を考慮した要約型モデルの議事録を作成するようにしてもよい。
【0158】
なお、議事録作成部40では、議事録項目ごとに重要発話文が一つずつ列挙された議事録(図3(d)や図23参照)を作成するだけでなく、後述するリンク分析部50による処理結果を利用して、重要発話文に対して最も強く関連する関連発話文を抽出することで、図4に示すように、重要発話文および関連発話文の両者が列挙された理解が容易な議事録を作成するようにしてもよい。
【0159】
(2−9:リンク分析部の構成)
次に、図1に示したリンク分析部50の構成を説明する。図24は、リンク分析部50の構成を示すブロック図である。このリンク分析部50は、OS(Operating System)などの制御プログラム、各種の処理手順などを規定したプログラムおよび所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する処理部であり、同図に示すように、機能的に、手がかり取得部51と、リンク元分析部52と、リンク元選択部53と、リンク先分析部54と、リンク先選択部55とを備えて構成される。
【0160】
ここで、各部の説明に入る前に、図25〜図28を用いて、リンク分析部50によるリンク分析処理の概略を説明する。かかるリンク分析処理は、概略的には、図25に示すように、発話文からの手がかり取得、発話文のリンク元探索(リンク元分析およびリンク元選択)、発話文のリンク先探索(リンク先分析およびリンク先選択)という各処理を通じて行われる。
【0161】
すなわち、リンク分析部50は、まず最初の処理として、各発話文間の関連度を分析する際に利用可能な所定の手がかり(図29〜図32参照)を発話文から取得する。そして、リンク分析部50は、図26〜28に示すように、取得した手がかりとヒューリスティックス(図33参照)を利用して、各発話文間の関連度を分析し、所定の発話文に対してリンク元若しくはリンク先となる他の発話文を探索する。
【0162】
なお、リンク元とは、現在の発話文にリンクする(最も関連する)過去の発話文を意味し、リンク先とは、現在の発話文からリンクする未来の発話文を意味する。また、以下の説明および参照図面において、添字「c」は現在発話文を指し、添字「−1」および「+1」はそれぞれ現在発話文の一つ後方(過去)と一つ前方(未来)の他の発話文を指す。さらに、「X=Y」は「XはYである」または「XはYと等しい」を表し、「X≠Y」は「XはYでない」または「XはYと等しくない」を表す。
【0163】
リンク分析部50の各部の説明に入ると、手がかり取得部51は、各発話文間の関連度を分析する際に利用可能な所定の手がかり(図29〜図32参照)を発話文から取得する手がかり取得手段である。具体的には、手がかり取得部51は、図29に示すように、発話文の発話行為に基づく特徴を示すアクト(発話行為属性)、発話文の発話者を示す発話者属性、発話文に含まれる発話者指定に関する発話者指定情報、発話文に含まれる照応に関する照応情報、発話文に含まれる話題の切替若しくは継続を示す接続属性、発話文に含まれる主題に関する主題情報、発話文に含まれる命題に関する命題情報などを各発話文から取得する。
【0164】
なお、手がかり取得部51によって取得される「アクト」とは、図15などで説明したものと同様であるが、ここでは、図30に示すように、リンク元若しくはリンク先の発話文を探索する際に、話者(自分/相手/なし)とリンク可能アクトNo(ナンバー)による制約を与えるものとして利用される。
【0165】
リンク元分析部52は、手がかり取得部51によって取得された手がかりを利用して、所定の発話文に対して関連元になるか否かの観点から所定の発話文と他の発話文との間における関連度を分析する関連度分析手段である。具体的には、所定の発話文から後方探索を行いながら、図33に示すヒューリスティックスを参照して、所定の発話文に対する複数の他の発話文それぞれに対して関連度の強弱を表すポイントを加算する。その結果、図27に示したように、所定の発話文(現在発話文)から後方(過去)に位置する各発話文ごとに、現在発話文との関連度がポイントによって表される。なお、リンク元分析部52は、上記した分析処理の前に、図27に示すような「リンク元探索の実行判断」を行って、リンク元を分析する必要がない発話文については、分析処理を行うことなく処理を抜けさせる。
【0166】
リンク元選択部53は、リンク元分析部52によって付与されたポイントに基づいて、複数の他の発話文のなかからリンク元の発話文を選択する関連発話文選択手段である。具体的には、このリンク元選択部53は、図27に示すような「ポイントに基づくリンク元選択」を行って、所定の発話文に対して最も強く関連する関連発話文(例えば、ポイント数が最大の発話文など)をリンク元として選択する。その結果、図34に示すように、各発話文ごとにリンク元の発話文が特定される(同図の各矢印を参照)。
【0167】
リンク先分析部54は、手がかり取得部51によって取得された手がかりを利用して、所定の発話文に対して関連先になるか否かの観点から所定の発話文と他の発話文との間における関連度を分析する関連度分析手段である。具体的には、リンク元選択部53によってリンク先が決定できなかった発話文についてのみ、そこから前方探索をしながら、図28に示すような「指定話者とアクト制約」に基づいた分析を行う。なお、リンク先分析部54も、上記した分析処理の前に、図28に示すような「リンク先探索の実行判断」を行って、リンク先を分析する必要がない発話文については、分析処理を行うことなく処理を抜けさせる。
【0168】
リンク先選択部55は、リンク先分析部54による分析結果に応じて、複数の他の発話文のなかからリンク先の発話文を選択する関連発話文選択手段である。具体的には、このリンク先選択部55は、図28に示すような「リンク先選択」および「リンク先選択可否判断」を行って、所定の発話文に対して最も強く関連する関連発話文をリンク先として選択する。
【0169】
(2−10:リンク分析処理の手順)
次に、上記したように構成されるリンク分析部50によるリンク分析処理の手順を説明する。図35〜図39は、リンク分析処理(リンク元探索およびリンク先探索)の流れを示すフローチャートである。図35に示すように、まず最初に、リンク分析部50は、リンク元探索に必要な各種の情報を取得する(ステップS3501〜S3505)。なお、同図に示す処理に先立って、図29〜図32に示したような「手がかり」が既に発話文から取得されているものとする。
【0170】
より詳細に説明すると、先ずは探索範囲の決定を行う(ステップS3501)。つまり、例を挙げれば、チャットログに発話時刻が存在する場合には、2分以内の発話文で、かつ、接続手がかりが話題切替型の発話文までの範囲を探索範囲とし、チャットログに発話時刻が存在しない場合には、15回分の発話文で、かつ、接続手がかりが話題切替型の発話文までの範囲を探索範囲とする。
【0171】
続いて、相手先指定から現在文のリンク先(可能性)情報を取得する(ステップS3502)。つまり、現在の発話文処理の後で利用するために、相手先指定が“全員”の場合は、自分以外の会議参加者全員の発話文へリンクする可能性を取得し、相手先指定が特定の名前の場合には、その名前の人の発話文へリンクする可能性を取得する。
【0172】
そして、発話文のアクトを取得してからリンク元探索の手がかりと現在文のリンク元情報を取得する(ステップS3503)。つまり、図30に示されたアクトのリンク元情報(話者、アクト)から、どのアクトの誰の発話文に対してリンクできるかのリンク元情報を取得するとともに、同図に示されたアクトのリンク先情報(話者、アクト)から、どのアクトの誰の発話文に対してリンクできるかのリンク先情報を取得する。
【0173】
また、自分(現在発話文)を相手先指定した発話文を探索して、自分指定の発話文として取得する(ステップS3505)。つまり、自分を相手先に指定した発話文を探索範囲内で調べ、そのなかから現在の発話文に最も位置が近い発話文を自分指定発話文として取得する。なお、この場合、相手先指定が“全員”の場合も、自分に対する指定と見なす。さらに、直前の発話文のアクト情報を取得する(ステップS3505)。つまり、直前の発話文がリンク先を要求するアクト(図30参照)であれば、その情報を取得する。
【0174】
そして、上記してきたような処理(ステップS3501〜S3505)に続いて、リンク元探索行うか否かの判断が行われる(ステップS3506)。つまり、(1)接続手がかりが話題切替型の場合や、(2)接続手がかりが話題接続型でなく、命題が含まれ、直前話者リンク先要求がなく、照応手がかりがなく、現在文のリンク元情報がなく、自分指定発話文がない場合には、リンク元探索を行うことなく処理を抜ける。
【0175】
これとは反対に、これらの条件に該当しない場合には、図36および図37に示すようなリンク元探索が実行される。以下に、かかるリンク元探索の処理(図36に示すステップS3601〜S3607、図37に示すS3701〜S3704)を説明する。
【0176】
リンク分析部50は、リンク元探索として、先ずは自分(現在発話文)に対して相手指定を行っている発話文へポイントを加算する(ステップS3601)。つまり、現在発話文のアクトがリンク元を要求している場合であるが、(1)自分に対する相手先指定のある最も近い発話文に1ポイントを加算し、(2)自分に対する相手先指定の発話文に1ポイントを加算し、さらに、(3)現在の会議セクションが“決議”タイプであれば、自分に対する相手先指定の発話文に2ポイントを加算し、(4)直前の発話文が自分に対して相手先指定をしていれば、直前の発話文に1ポイントを加算する。
【0177】
そして、かかるポイント付与に続いて、直前発話文が現在発話文と同一話者の場合のポイント付与を行う(ステップS3602)。つまり、直前発話文が現在発話文と同一話者で、かつ、アクトによるリンク先指定がなければ、直前発話文に1ポイントを加算する。さらに、リンク分析部50は、直前発話文の話者への相手先指定の場合のポイント付与を行う(ステップS3603)。つまり、直前発話文の話者へ現在発話文で相手先指定していれば、直前発話文に1ポイントを加算する。
【0178】
また、このようなポイント付与に続いて、アクトのリンク関係によるポイント付与を行う(ステップS3604)。すなわち、図30に示したアクトの対応関係を参照しながら、現在発話文のアクトのリンク元情報(話者、アクト)と探索範囲内の発話文のアクトのリンク先情報(話者、アクト)を照合し、互いのリンク元情報とリンク先情報がマッチしていれば、探索範囲内のかかる発話文に1ポイントを加算する。
【0179】
さらに、リンク分析部50は、接続手がかりによるポイント付与を行う(ステップS3605)。つまり、直前発話文の接続手がかりが話題継続型であれば、直前発話文に1ポイントを加算する。そして、かかるポイント付与に続いて、照応手がかりと名詞集合によるポイント付与を行う(ステップS3606)。すなわち、(1)現在発話文にコソアの照応や修辞的照応がある場合に、探索範囲内の発話文内の名詞集合に照応名詞が発見されれば、その発話文に1ポイントを加算し、(2)現在発話文にある照応が代用の照応である場合には、直前発話文に1ポイントを加算する。
【0180】
続いて、主題手がかりと名詞集合によるポイント付与を行い(ステップS3607)、さらに、かかるポイント付与の最後の態様として、命題含有によるポイント付与を行う(ステップS3701)。すなわち、現在文に主題名詞が存在した場合に、探索範囲内の発話文に主題と一致する名詞が発見されれば、その発話文に1ポイントを加算し、さらに、現在発話文に命題がなく、アクトがリンク先アクトを必要としている場合には、直前発話文に1ポイントを加算する。
【0181】
このような上記してきた処理(ステップS3601〜S3607およびS3701)を経て、所定の発話文(現在発話文)から後方(過去)の探索範囲に位置する各発話文に、現在発話文との関連度を示すポイントが付与される。そして、かかるポイント付与に続いて、以下に述べるようにして、リンク元が決定される(ステップS3702〜3704)。
【0182】
リンク分析部50は、先ずは各発話文に付与されたポイントに基づいてリンク元を決定する(ステップS3702)。つまり、探索範囲内の発話文に対して与えられたポイントを参照し、現在発話文のリンク元を1つだけ決定する。この場合に、ポイントが最大の発話文をリンク先とするが、ポイント数が同じであれば、現在発話文に近い方を選択する。ただし、既に現在発話文の発話者と同じ発話者からのリンクがある発話文はリンク元対象から外す。なお、ポイント合計が0であれば、リンク元なしとする。
【0183】
続いて、リンク分析部50は、決定したリンク元からリンク先情報をコピーする(ステップS3703)。つまり、リンク元が決定されていれば、リンク元から見たリンク先をセットする。そして、最後に、調整によるリンク元の決定を行う(ステップS3704)。すなわち、ポイントによってリンク元が決まらなかった場合において、現在発話文のアクトがリンク元を必要としているのであれば、直前の発話文をリンク元として選択する。
【0184】
このようにして、各発話文に対してリンク元の発話文が決定されるが、上述したように、必ずしも全ての発話文についてリンク元が決定されるわけではないので、上述した処理に続いて、図38に示すようなリンク先探索の処理(同図に示すステップS3801〜S3803)が実行される。
【0185】
かかるリンク先探索の処理を説明すると、リンク分析部50は、先ずはリンク先決定処理の必要性を確認する(ステップS3801)。つまり、現在発話文にリンク先が割当てられている場合や、アクトが示唆するリンク先可能性がない場合には、リンク先探索の処理を行うことなく処理を抜ける。
【0186】
一方、これらの条件に該当しない場合には、話者指定とアクトによるリンク先の決定を行う(ステップS3802)。つまり、例を挙げれば、現在文が話者指定を持つのであれば、後に発話された8発話文を探索範囲として、指定した話者で、かつ、現在発話文のアクトのリンク先(図30参照)として可能な発話文を検索し、これをリンク先として決定する。
【0187】
さらに、上記の条件によってもリンク先が決まらない場合には、アクトのリンク先話者指定のみによる直後の発話文に対するリンク先決定を行う(ステップS3803)。すなわち、現在文のアクトのリンク先話者指定が直後の発話文とマッチすれば、直後の発話文をリンク先とする。この場合、リンク先のアクト種類はマッチングに使わない。なお、仮にリンクできなければ、リンク先なしとして処理を抜ける。
【0188】
(2−11:リンク分析処理の効果等)
上述してきたように、リンク分析部50では、チャットログの発話文から各発話文間の関連度を分析する際に利用可能な所定の手がかり(図27参照)を取得し、取得した手がかりとヒューリスティックス(図33参照)を利用して、所定の発話文に対する複数の他の発話文それぞれに対して関連度の強弱を表すポイントを加算する(図27参照)。したがって、各発話文が複雑に関連して複雑な構造を有するチャットログにおいて、各発話文間の関連度を強弱のポイントによって把握することが可能になる。
【0189】
また、リンク分析部50では、上記の付与されたポイントに基づいて、所定の発話文に対してリンク元となる他の発話文(最も関連する過去の発話文)若しくはリンク先となる他の発話文(最も関連する未来の発話文)を選択決定する。したがって、所定の発話文に対して最も強く関連する関連発話文を的確に抽出することが可能になる。さらに、これを利用して、議事録作成部40によって抽出された重要発話文に対して最も強く関連する関連発話文を的確に抽出することで、図4に示すように、重要発話文および関連発話文の両者が列挙された理解が容易な議事録を作成することも可能になる。
【0190】
また、リンク分析部50では、リンク元探索による関連度の分析を行った後に、リンク元を決定できなかった発話文に対してのみ、リンク先探索による関連度の分析を行う。したがって、働き掛けに対して必ずしも応答が存在するとは限らないというチャットログの特性を考慮して、無駄な分析処理が行われることを回避する(つまり、すべての発話文についてリンク元決定処理を最初に行って、リンク元が発見された発話文に対しては逆方向からリンク先も決定し、リンク元が決まらなかった発話文のみについてリンク先決定処理を行うため、無駄なリンク先決定処理を行わなくて済む)とともに、チャットの進行に伴ったリアルタイムの分析処理を行うことが可能になる。
【0191】
ところで、リンク分析部50では、図29に示すような手がかりを利用して関連度を分析することとしたが、本発明はこれに限定されるものではなく、これらの手がかりを任意に取捨選択して利用するようにしてもよく、さらに他の手がかり情報(例えば、属性付与部30によって付与される各種の属性情報)を利用するようにしてもよい。
【0192】
また、リンク分析部50では、図33に示すようなヒューリスティックスにしたがって関連度のポイントを加算することとしたが、本発明はこれに限定されるものではなく、各条件のポイント付与の量に異なる重み付けを行ってもよく、他の条件を含んだヒューリスティックスを利用するようにしてもよい。
【0193】
また、リンク分析部50では、付与されたポイントに基づいて所定の発話文に対してリンク元若しくはリンク先となる発話文を一つだけ選択することとしたが、本発明はこれに限定されるものではなく、ポイントの数が所定の数以上である他の発話文を選択するここで、所定の発話文に対して所定の強さで関連する一群の関連発話文を抽出するようにしてもよい。
【0194】
また、リンク分析部50では、付与されたポイントをリンク元若しくはリンク先の探索に利用することとしたが、これに留まらず、付与されたポイントをチャットログの構造解析に利用することもできる。すなわち、所定の発話文からリンク元を順に辿って行くことや、所定のポイント数以上の一群の発話文を抽出することなどによって、図39に示すように、関連性が強い複数の発話文からなるリンク構造をチャットログから抽出することもできる。なお、かかるリンク構造は、発話の局所的結束性に基づく応答関係や修辞的関連でリンクした談話単位(いわゆる談話の局所・中位の構造単位を含む。)にも対応し得る構造である。
【0195】
さらに、かかるチャットログの構造解析に際して、抽出しようとする一群の発話文のポイント数を設定調整することによって、例えば、一つの話題のなかで中位・下位の話題が進行しているチャットログ(図40参照)や、一つの話題から複数の話題が生まれたり、複数の話題が並行に入り組んで進行するチャットログ(図41)など、極めて複雑な構造を有するチャットログにおいても、所望のリンク構造を抽出することができる。なお、議事録作成部40によって抽出された重要発話文に対して、上記したようなリンク構造を有する一群の発話文を関連発話文として抽出することで、図4に示すような議事録を作成するようにしてもよい。
【0196】
[3:他の実施の形態]
さて、これまで本発明の実施の形態について説明したが、本発明は上述した実施の形態以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてもよいものである。
【0197】
例えば、本実施の形態では、図1に示したようなチャットログを処理対象とする場合を説明したが、本発明はこれに限定されるものではなく、例えば、メールやインスタント・メッセージによる情報のやり取りなど、複数人の文字による発話文が発話者ごとに時系列に組分け記録された文字発話記録であれば、同様に適用することができる。
【0198】
さらに、かかる文字発話記録を処理対象とするものに本発明は限定されるものではなく、所定の属性付与が可能な単位にある複数の一情報が当該単位とは無関係に組分けされてなる情報群であれば同様に適用することができる。すなわち、かかる情報群を所定箇所にて結合または分割して一情報をそれぞれ取得する場合や、かかる情報群を複数のセクションに分割しつつ各セクションに対して所定の属性を付与する場合、複数のセクションに分割されて所定の属性を付与された情報群を加工する場合、さらには、複数の情報が記録された情報群において所定の情報と他の情報との間の関連度を分析する場合に、本発明を同様に適用することができる。
【0199】
また、本実施の形態では、チャットログ処理装置10が外部からチャットログを入力して処理する場合を説明したが、本発明はこれに限定されるものではなく、内部で生成したチャットログを処理するようにしてもよい。すなわち、図43に示すように、インターネットなどのネットワーク1を介して複数のクライアント装置2の間でチャットを行わせるチャットサーバ60において、チャット処理部61によって生成したチャットログをそのまま処理するようにしてもよい。
【0200】
また、図示した各装置の各構成要素は機能的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のもの(図1および図43のもの)に限られず、例えば、図43に示すクライアント装置2などのユーザ端末が発話文取得処理、属性付与処理、議事録作成処理およびリンク分析処理を実行するなど、その全部または一部の機能を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラム(例えば、発話文取得処理、属性付与処理、議事録作成処理およびリンク分析処理の各方法を実行するプログラムなど)にて実現され、あるいは、ワイヤードロジック(結線論理)によるハードウェアとして実現され得る。
【0201】
また、本実施の形態において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0202】
なお、本実施の形態で説明した発話文取得処理、属性付与処理、議事録作成処理およびリンク分析処理の各方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。このプログラムは、インターネットなどのネットワークを介して配布することができる。また、このプログラムは、ハードディスク、フレキシブルディスク(FD)、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行することもできる。
【0203】
【発明の効果】
以上説明したように、請求項1、10または11の発明によれば、各発話文が複雑に関連して複雑な構造を有するチャットログにおいて各発話文間の関連度を把握することが可能になる。
【0204】
また、請求項2または12の発明によれば、所定の発話文と他の発話文との間でいわゆるアクトが所定の関連性を有するか否かの観点、所定の発話文と他の発話文との間で発話者が共通するか否かの観点、所定の発話文と他の発話文との間で発話者指定が行われているか否かの観点、所定の発話文と他の発話文との間で照応が生じているか否かの観点、所定の発話文と他の発話文との間で話題を継続しているか否か、所定の発話文と他の発話文との間で主題が共通しているか否かの観点、所定の発話文と他の発話文との間で命題が共通するか否かの観点、および/または、所定の発話文と他の発話文との間で発話位置が近いか否かの観点から、各発話文間の関連度を把握することが可能になる。
【0205】
また、請求項3または13の発明によれば、所定の発話文に対する複数の他の発話文それぞれの関連度を強弱のポイントによって把握することが可能になる。
【0206】
また、請求項4または14の発明によれば、各発話文に付与されたポイントに応じて、所定の発話文に対して所定の強さで関連する関連発話文を抽出することが可能になる。
【0207】
また、請求項5または15の発明によれば、所定の発話文に対して最も強く関連する関連発話文を一意に抽出することが可能になる。
【0208】
また、請求項6または16の発明によれば、所定の発話文に対して所定の強さで関連する一群の関連発話文を抽出することが可能になる。
【0209】
また、請求項7の発明によれば、所定の発話文に対してリンク元になり得るか否かの観点から、各発話文間の関連度を把握することが可能になる。
【0210】
また、請求項8の発明によれば、所定の発話文に対してリンク先になり得るか否かの観点から、各発話文間の関連度を把握することが可能になる。
【0211】
また、請求項9の発明によれば、働き掛けに対して必ずしも応答が存在するとは限らないというチャットログの特性を考慮して、無駄な分析処理が行われることを回避する(つまり、すべての発話文についてリンク元決定処理を最初に行って、リンク元が発見された発話文に対しては逆方向からリンク先も決定し、リンク元が決まらなかった発話文のみについてリンク先決定処理を行うため、無駄なリンク先決定処理を行わなくて済む)とともに、チャットの進行に伴ったリアルタイムの分析処理を行うことが可能になる。
【0212】
また、請求項17、18または19の発明によれば、各発話文が複雑に関連して複雑な構造を有するチャットログにおいて各発話文間の関連度を把握することが可能になる。
【図面の簡単な説明】
【図1】チャットログ処理装置の概略構成を示すブロック図である。
【図2】チャットログ処理装置の概略処理を説明するための図である。
【図3】チャットログ処理装置の概略処理を説明するための図である。
【図4】チャットログ処理装置の概略処理を説明するための図である。
【図5】発話文取得部の構成を示すブロック図である。
【図6】変換ルールを説明するための図である。
【図7】文末ルールを説明するための図である。
【図8】チャットログの一例を示す図である。
【図9】チャットログの一例を示す図である。
【図10】発話文取得処理後のチャットログの一例を示す図である。
【図11】発話文取得処理後のチャットログの一例を示す図である。
【図12】発話文取得処理を示すフローチャートである。
【図13】属性付与部の構成を示すブロック図である。
【図14】会議セクション種別付与ルールを説明するための図である。
【図15】アクト付与ルールを説明するための図である。
【図16】会議タイプ付与ルールを説明するための図である。
【図17】属性付与処理を示すフローチャートである。
【図18】属性付与処理を説明するための図である。
【図19】議事録作成部の構成を示すブロック図である。
【図20】重要発話文抽出ルールを説明するための図である。
【図21】重要発話文抽出ルールを説明するための図である。
【図22】重要発話文抽出ルールを説明するための図である。
【図23】議事録の一例を示す図である。
【図24】リンク分析部の構成を示すブロック図である。
【図25】
リンク分析処理の概略を説明するための図である。
【図26】リンク分析の概念を説明するための図である。
【図27】リンク元探索の流れを示す図である。
【図28】リンク先探索の流れを示す図である。
【図29】発話文から取得する手がかりを説明するための図である。
【図30】アクトタグの一例を示す図である。
【図31】主題取得および照応手がかり取得を説明するための図である。
【図32】接続手がかり取得を説明するための図である。
【図33】ヒューリスティクス(リンク元探索用)の一例を示す図である。
【図34】リンク元探索の一例を示す図である。
【図35】リンク元探索の処理手順の流れを示すフローチャートである。
【図36】リンク元探索の処理手順の流れを示すフローチャートである。
【図37】リンク元探索の処理手順の流れを示すフローチャートである。
【図38】リンク先探索の処理手順の流れを示すフローチャートである。
【図39】リンク構造の一例を示す図である。
【図40】リンク構造の一例を示す図である。
【図41】リンク構造の一例を示す図である。
【図42】仕様書の一例を示す図である。
【図43】チャットシステムの概略構成を示すブロック図である。
【図44】チャットログの一例を示す図である。
【図45】議事録フォームの一例を示す図である。
【符号の説明】
10 チャットログ処理装置
11 入力部
12 出力部
13 入出力制御IF部
20 発話文取得部
21 記憶部
21a チャットログメモリ
21b 一時メモリ
21c 取得後メモリ
22 制御部
23 変換部
23a 変換ルール
24 文末特定部
24a 文末ルール
25 分割部
26 結合部
30 属性付与部
31 記憶部
32 制御部
33 役割属性付与部
33a 役割属性付与ルール
34 会議セクション種別付与部
34a 会議セクション種別付与ルール
35 アクト付与部
35a アクト付与ルール
36 会議タイプ付与部
36a 会議タイプ付与
40 議事録作成部
41 記憶部
42 制御部
43 属性取得部
44 重要発話文抽出部
45 重要発話文抽出ルール
50 リンク分析部
51 手がかり取得部
52 リンク元分析部
53 リンク元選択部
54 リンク先分析部
55 リンク先選択部
60 チャットサーバ
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to, for example, a chat log analysis device, an analysis method, and an analysis program in which utterance sentences of a plurality of characters are recorded, and particularly relates to a chat log in which each utterance sentence has a complicated structure with a complicated structure. The present invention relates to an analysis device, an analysis method, and an analysis program that can grasp the degree of association between utterance sentences.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, there is a technique for recognizing a relationship between mutually exchanged utterances in a dialogue between humans. For example, in Japanese Patent Application Laid-Open No. H10-69292 (Patent Literature 1), it is determined whether each utterance fulfills the function of “start, response, supplement”, and the function of “start, response, supplement” is determined. It recognizes the relationship between the utterances as having a close relationship between the three uttered utterances.
[0003]
In recent years, meetings using chat have become popular even in business situations, and the minutes of a meeting are automatically recorded from a text chat log (see FIG. 44) obtained as a result of the chat meeting. There are also attempts to create one. That is, as an example, an important utterance sentence corresponding to a minutes item such as a decision item, a homework, a future task, etc. is automatically extracted from the chat log, and the minutes including the minutes item in a form (see FIG. 45) ).
[0004]
However, in the minutes in which only one important utterance sentence is enumerated for each of these minutes items, the utterance sentence of the anaphoric pronoun included in the important utterance sentence, the question corresponding to the important utterance sentence, Because there is no utterance of the answer, the contents of the minutes may not be easily understood. For this reason, in order to facilitate understanding of the minutes, it is desirable to enumerate other related utterances related to the important utterance together.
[0005]
Here, considering how to extract another related utterance sentence from the chat log, a method of using the above-described technique for recognizing the relationship between utterances is considered first. That is, after extracting the important utterances corresponding to the minutes of the meeting from the chat log, the other two utterances which are grouped by the “start, response, supplement” function for the important utterances are related utterances. It is a technique of extracting.
[0006]
[Patent Document 1]
JP-A-10-69292
[0007]
[Problems to be solved by the invention]
[0008]
However, the chat log is not a simple one-on-one conversation, but is made up of utterances composed of a plurality of characters. Even if the above-described conventional technology is applied, other related utterances related to the important utterances are used. It is difficult to accurately extract.
[0009]
To explain this more specifically, for example, even if you consider from the viewpoint of topics, a single topic can generate multiple topics, multiple topics can progress in parallel, They have an extremely complicated structure, such as being combined into one topic, or middle and lower topics proceeding in a branch in one topic. For this reason, even when focusing only on the functional structure such as “start, response, supplement” as in the above-described related art, there is naturally a limit in accurately extracting other related utterance sentences related to the important utterance sentence. .
[0010]
In other words, each utterance in the chat log is not related only to each utterance in the group grouped by functions such as "start, answer, supplement", but is related to all other utterances in the chat log. The strengths between them have something to do with them. Therefore, in order to accurately extract other related utterances related to important utterances in a chat log where each utterance is complicatedly related and has a complicated structure, the degree of association between the utterances is grasped. Is required as a precondition.
[0011]
Therefore, the present invention has been made to solve the above-described problem of the related art, and grasps a degree of association between utterance sentences in a chat log in which utterance sentences are complicatedly related and has a complicated structure. An object of the present invention is to provide a character utterance record analysis device, an analysis method, and an analysis program that can perform the analysis. Further, the present invention also provides an information group analysis device, an analysis method, and an analysis program that can grasp the degree of association between pieces of information in an information group having a complicated structure in which each piece of information is complicatedly related. Aim.
[0012]
[Means for Solving the Problems]
In order to solve the above-mentioned problems and achieve the object, the invention according to claim 1 is a character utterance record analysis device that analyzes a character utterance record in which utterance sentences of a plurality of characters are recorded, A clue acquiring unit that acquires a predetermined clue that can be used when analyzing the degree of association between the respective utterance sentences from the utterance sentences of the utterance record, and a predetermined clue obtained by using the predetermined clue acquired by the clue acquiring unit; Relevance analysis means for analyzing the relevance between an utterance sentence and another utterance sentence.
[0013]
According to the present invention, a predetermined clue that can be used when analyzing the degree of association between each utterance sentence is acquired from the utterance sentence of the character utterance record, and the obtained utterance clue is used to obtain a predetermined utterance sentence. Analyze the degree of association between the utterance and other utterance sentences. Therefore, it is possible to grasp the degree of relevance between utterance sentences in a chat log in which utterance sentences are complicatedly related and have a complicated structure.
[0014]
The invention according to claim 2 is the invention according to claim 1, wherein the clue acquiring means includes, as the predetermined clue, a speech act attribute indicating a feature based on the speech act of the speech sentence, a speaker of the speech sentence. , Utterance designation information related to utterer designation included in the utterance sentence, anaphora information related to anaphor included in the utterance sentence, connection attribute indicating switching or continuation of a topic included in the utterance sentence, included in the utterance sentence Subject information on the subject, proposition information on a proposition included in the utterance sentence, and / or utterance position information on the utterance position in the character utterance record, and the relevance analyzing means obtains the predetermined utterance sentence and another utterance Relationship between the utterance act attribute, utterer attribute, utterer designation information, anaphor information, connection attribute, subject information, proposition information, and / or utterance position information included in the sentence Characterized by analyzing the relevance according to.
[0015]
According to the present invention, as predetermined clues, a utterance act attribute indicating a feature based on the utterance act of the utterance sentence, a utterer attribute indicating the utterer of the utterance sentence, utterer designation information regarding utterer designation included in the utterance sentence, Anaphor information about anaphor included in the utterance sentence, connection attribute indicating switching or continuation of a topic included in the utterance sentence, subject information on a subject included in the utterance sentence, proposition information on a proposition included in the utterance sentence, and / or a character Acquires utterance position information related to the utterance position in the utterance record, and utterance act attributes, utterer attributes, utterer designation information, anaphoric information, connection attributes, subject information, proposition information, and a predetermined utterance sentence and other utterance sentences have And / or analyze the degree of relevance according to the relevance of the utterance position information.
[0016]
Therefore, in view of whether or not a so-called act has a predetermined relationship between a predetermined utterance sentence and another utterance sentence, whether or not the utterer is common between the predetermined utterance sentence and another utterance sentence Viewpoint, whether a speaker is designated between a predetermined utterance sentence and another utterance sentence, and whether or not anaphoresis occurs between the predetermined utterance sentence and another utterance sentence Point of view, whether or not the topic continues between a predetermined utterance sentence and another utterance sentence, and whether or not the subject is common between the predetermined utterance sentence and another utterance sentence. From the viewpoint of whether the proposition is common between the utterance sentence of the utterance sentence and another utterance sentence, and / or from the viewpoint of whether or not the utterance position is close between the predetermined utterance sentence and the other utterance sentence. It becomes possible to grasp the degree of association between the utterance sentences.
[0017]
According to a third aspect of the present invention, in the first aspect of the present invention, the relevance analyzing means includes a point indicating the strength of the relevance for each of a plurality of other utterances with respect to the predetermined utterance. Is provided.
[0018]
According to the present invention, a point indicating the degree of relevance is given to each of a plurality of other utterance sentences for a predetermined utterance sentence. Therefore, it is possible to grasp the degree of relevance of each of a plurality of other utterance sentences to a predetermined utterance sentence based on the strength points.
[0019]
The invention according to claim 4 is the invention according to claim 3, wherein a predetermined other utterance sentence is selected from the plurality of other utterance sentences based on the points given by the relevance analysis means. It is characterized by further comprising a related utterance sentence selecting means for selecting.
[0020]
According to the present invention, a predetermined other utterance sentence is selected from among a plurality of other utterance sentences based on a point indicating the degree of relevance assigned to each of the plurality of other utterance sentences with respect to the predetermined utterance sentence. Select Therefore, it is possible to extract a related utterance sentence related to a predetermined utterance sentence with a predetermined strength according to points given to each utterance sentence.
[0021]
The invention according to claim 5 is the invention according to claim 4, wherein the related utterance sentence selecting means selects another utterance sentence having the maximum number of points.
[0022]
According to the present invention, another utterance sentence having the maximum number of points is selected. Therefore, it is possible to uniquely extract a related utterance sentence most strongly related to a predetermined utterance sentence.
[0023]
The invention according to claim 6 is the invention according to claim 4, wherein the related utterance sentence selecting means selects another utterance sentence whose number of points is equal to or more than a predetermined number. .
[0024]
According to the present invention, another utterance sentence whose number of points is equal to or more than a predetermined number is selected. Therefore, it is possible to extract a group of related utterance sentences related to a predetermined utterance sentence with a predetermined strength.
[0025]
According to a seventh aspect of the present invention, in the invention according to any one of the first to sixth aspects, the relevance analyzing unit determines whether or not the predetermined utterance sentence is an association source. And analyzing the degree of relevance.
[0026]
According to the present invention, the degree of relevance is analyzed from the viewpoint of whether or not the utterance sentence is the relevant source. Therefore, it is possible to grasp the degree of association between the utterance sentences from the viewpoint of whether or not the utterance sentence can be a link source.
[0027]
According to an eighth aspect of the present invention, in the invention according to any one of the first to sixth aspects, the relevance analysis unit determines whether or not the predetermined utterance becomes an association destination. And analyzing the degree of relevance.
[0028]
According to the present invention, the degree of relevance is analyzed from the viewpoint of whether or not a predetermined utterance sentence is the relevant destination. Therefore, it is possible to grasp the degree of association between the utterance sentences from the viewpoint of whether or not the utterance sentence can be a link destination.
[0029]
Further, according to a ninth aspect of the present invention, in the invention according to any one of the first to sixth aspects, the relevance analysis unit determines whether or not the predetermined utterance is an association source. After analyzing the relevance from the above, the other utterance sentence that did not become the relevant source as the predetermined utterance sentence, the relevance from the viewpoint of whether or not to become the relevant destination for the predetermined utterance sentence It is characterized by analyzing.
[0030]
According to the present invention, after analyzing the degree of association from the viewpoint of whether or not to become a related source for a predetermined utterance sentence, another utterance sentence that did not become the relevant source is regarded as the predetermined utterance sentence, and The relevance is analyzed from the viewpoint of whether or not the utterance sentence becomes the related destination. Therefore, in consideration of the characteristic of the chat log that there is not always a response to the action, it is possible to avoid performing unnecessary analysis processing (that is, first perform the link source determination processing for all utterance sentences). Then, for the utterance sentence where the link source is found, the link destination is also determined in the reverse direction, and the link destination determination process is performed only for the utterance sentence for which the link source was not determined, so that the useless link destination determination process is performed. It is possible to perform real-time analysis processing along with the progress of the chat.
[0031]
Further, the invention according to claim 10 is a character utterance record analysis method for analyzing a character utterance record in which utterance sentences of a plurality of characters are recorded, wherein the utterance sentence of the character utterance record includes A cue obtaining step of obtaining a predetermined cue that can be used when analyzing the degree of association, and using a predetermined cue obtained by the cue obtaining step, a predetermined cue between a predetermined utterance sentence and another utterance sentence And a relevancy analysis step of analyzing the relevance.
[0032]
According to the present invention, a predetermined clue that can be used when analyzing the degree of association between each utterance sentence is acquired from the utterance sentence of the character utterance record, and the obtained utterance clue is used to obtain a predetermined utterance sentence. Analyze the degree of association between the utterance and other utterance sentences. Therefore, it is possible to grasp the degree of relevance between utterance sentences in a chat log in which utterance sentences are complicatedly related and have a complicated structure.
[0033]
An invention according to claim 11 is a character utterance record analysis program for causing a computer to execute an analysis method for analyzing a character utterance record in which utterance sentences of a plurality of characters are recorded, wherein the utterance of the character utterance record is recorded. A cue obtaining procedure for obtaining a predetermined cue that can be used when analyzing the degree of association between each utterance sentence from the sentence, and a predetermined utterance sentence and other using the predetermined cue obtained by the cue obtaining procedure. And a relevancy analysis procedure for analyzing the relevance between the utterance sentence and the utterance sentence.
[0034]
According to the present invention, a predetermined clue that can be used when analyzing the degree of association between each utterance sentence is acquired from the utterance sentence of the character utterance record, and the obtained utterance clue is used to obtain a predetermined utterance sentence. Analyze the degree of association between the utterance and other utterance sentences. Therefore, it is possible to grasp the degree of relevance between utterance sentences in a chat log in which utterance sentences are complicatedly related and have a complicated structure.
[0035]
According to a twelfth aspect of the present invention, in the invention according to the eleventh aspect, the cue acquisition step includes, as the predetermined cue, an utterance act attribute indicating a feature based on the utterance act of the utterance sentence; , Utterance designation information related to utterer designation included in the utterance sentence, anaphora information related to anaphor included in the utterance sentence, connection attribute indicating switching or continuation of a topic included in the utterance sentence, included in the utterance sentence Acquiring subject information on the subject, proposition information on a proposition included in the utterance sentence, and / or utterance position information on the utterance position in the character utterance record, wherein the relevance analysis procedure performs the predetermined utterance sentence and other utterances The relationship between the utterance act attribute, utterer attribute, utterer designation information, anaphor information, connection attribute, subject information, proposition information, and / or utterance position information included in the sentence. Characterized by analyzing the relevance depending on sex.
[0036]
According to the present invention, as predetermined clues, a utterance act attribute indicating a feature based on the utterance act of the utterance sentence, a utterer attribute indicating the utterer of the utterance sentence, utterer designation information regarding utterer designation included in the utterance sentence, Anaphor information about anaphor included in the utterance sentence, connection attribute indicating switching or continuation of a topic included in the utterance sentence, subject information on a subject included in the utterance sentence, proposition information on a proposition included in the utterance sentence, and / or a character Acquires utterance position information related to the utterance position in the utterance record, and utterance act attributes, utterer attributes, utterer designation information, anaphoric information, connection attributes, subject information, proposition information, and a predetermined utterance sentence and other utterance sentences have And / or analyze the degree of relevance according to the relevance of the utterance position information.
[0037]
Therefore, in view of whether or not a so-called act has a predetermined relationship between a predetermined utterance sentence and another utterance sentence, whether or not the utterer is common between the predetermined utterance sentence and another utterance sentence Viewpoint, whether a speaker is designated between a predetermined utterance sentence and another utterance sentence, and whether or not anaphoresis occurs between the predetermined utterance sentence and another utterance sentence Point of view, whether or not the topic continues between a predetermined utterance sentence and another utterance sentence, and whether or not the subject is common between the predetermined utterance sentence and another utterance sentence. From the viewpoint of whether the proposition is common between the utterance sentence of the utterance sentence and another utterance sentence, and / or from the viewpoint of whether or not the utterance position is close between the predetermined utterance sentence and the other utterance sentence. It becomes possible to grasp the degree of association between the utterance sentences.
[0038]
According to a thirteenth aspect of the present invention, in the invention of the eleventh or twelfth aspect, the relevance analysis procedure determines the strength of the relevance for each of a plurality of other utterances for the predetermined utterance. Characteristic points are given.
[0039]
According to the present invention, a point indicating the degree of relevance is given to each of a plurality of other utterance sentences for a predetermined utterance sentence. Therefore, it is possible to grasp the degree of relevance of each of a plurality of other utterance sentences to a predetermined utterance sentence based on the strength points.
[0040]
The invention according to claim 14 is the invention according to claim 13, wherein a predetermined other utterance sentence is selected from the plurality of other utterance sentences based on the points given by the association degree analysis procedure. The method is further characterized by causing the computer to further execute a related utterance sentence selection procedure to be selected.
[0041]
According to the present invention, a predetermined other utterance sentence is selected from among a plurality of other utterance sentences based on a point indicating the degree of relevance assigned to each of the plurality of other utterance sentences with respect to the predetermined utterance sentence. Select Therefore, it is possible to extract a related utterance sentence related to a predetermined utterance sentence with a predetermined strength according to points given to each utterance sentence.
[0042]
The invention according to claim 15 is the invention according to claim 14, wherein the related utterance sentence selecting step selects another utterance sentence having the maximum number of points.
[0043]
According to the present invention, another utterance sentence having the maximum number of points is selected. Therefore, it is possible to uniquely extract a related utterance sentence most strongly related to a predetermined utterance sentence.
[0044]
The invention according to claim 16 is the invention according to claim 14, wherein the related utterance sentence selecting step selects another utterance sentence whose number of points is equal to or more than a predetermined number. .
[0045]
According to the present invention, another utterance sentence whose number of points is equal to or more than a predetermined number is selected. Therefore, it is possible to extract a group of related utterance sentences related to a predetermined utterance sentence with a predetermined strength.
[0046]
The invention according to claim 17 is an information group analyzing apparatus for analyzing an information group in which a plurality of pieces of information are recorded, and can be used when analyzing the degree of association between pieces of information from the information of the information group. Cue acquisition means for obtaining a predetermined cue, a relevance analysis means for analyzing the degree of relevance between the predetermined information and other information using the predetermined cue obtained by the cue acquisition means, It is characterized by having.
[0047]
According to the present invention, a predetermined clue that can be used when analyzing the degree of relevance between pieces of information is obtained from the information of the information group, and the obtained predetermined clue is used to obtain the predetermined information and other information. Analyze the degree of association between Therefore, it is possible to grasp the degree of association between pieces of information in an information group having a complicated structure in which the pieces of information are complicatedly related.
[0048]
The invention according to claim 18 is an information group analysis method for analyzing an information group in which a plurality of pieces of information are recorded, and can be used when analyzing the degree of association between pieces of information from the information of the information group. A clue acquisition step of acquiring a predetermined clue, and a relevance analysis step of analyzing the relevance between the predetermined information and other information using the predetermined clue acquired by the clue acquisition step, It is characterized by including.
[0049]
According to the present invention, a predetermined clue that can be used when analyzing the degree of relevance between pieces of information is obtained from the information of the information group, and the obtained predetermined clue is used to obtain the predetermined information and other information. Analyze the degree of association between Therefore, it is possible to grasp the degree of association between pieces of information in an information group having a complicated structure in which the pieces of information are complicatedly related.
[0050]
The invention according to claim 19 is an information group analysis program for causing a computer to execute an analysis method for analyzing an information group in which a plurality of pieces of information are recorded. Analyzing a cue that can be used when analyzing a cue, and analyzing the degree of association between predetermined information and other information using the predetermined cue obtained by the cue obtaining procedure. And an associated degree analysis procedure.
[0051]
According to the present invention, a predetermined clue that can be used when analyzing the degree of relevance between pieces of information is obtained from the information of the information group, and the obtained predetermined clue is used to obtain the predetermined information and other information. Analyze the degree of association between Therefore, it is possible to grasp the degree of association between pieces of information in an information group having a complicated structure in which the pieces of information are complicatedly related.
[0052]
BEST MODE FOR CARRYING OUT THE INVENTION
Exemplary embodiments of a character utterance record analysis apparatus, an analysis method, and an analysis program, an information group analysis apparatus, an analysis method, and an analysis program according to the present invention will be described in detail below with reference to the accompanying drawings. In the following, the main terms used in the present embodiment will be described first as “1: Explanation of terms”, and then the embodiment according to the present invention will be described as “2: Chat according to the present embodiment. It will be described as "log processing device", and finally, various modifications will be described as "3: other embodiments".
[0053]
[1: Explanation of terms]
Hereinafter, main terms used in the present embodiment will be briefly described. First, as shown in FIG. 44, the “chat log” used in the present embodiment is such that utterances of a plurality of characters are grouped and recorded in chronological order for each speaker (for example, line feed recording). A character utterance record is an example of the “character utterance record” and the “information group” described in the claims. The “characters” used in the present embodiment include pictograms as shown in FIG. 6B unless otherwise specified.
[0054]
Further, as shown in FIG. 10, “one utterance sentence” used in the present embodiment refers to one utterance sentence in a unit to which a predetermined attribute (for example, “act”, which is a minimum unit representing a utterance act) can be added. And is an example of “utterance sentence” and “information” described in the claims. Note that there may be a plurality of utterance acts in units of questions, companions, requests, and the like, that is, multiple Acts (Dialogue Acts) in one utterance sentence. However, in this embodiment, since a simplified model is used, It will be described as an utterance sentence equal utterance act (a plurality is possible).
[0055]
Further, “act” used in the present embodiment refers to an attribute indicating a feature based on the utterance act of each utterance sentence, such as a question / confirmation, an agreement / affirmation, as shown in FIG. Is an example of the “utterance act attribute” described in the range of FIG. Further, the “role attribute” used in the present embodiment refers to an attribute indicating a feature based on a speaker of each utterance sentence, such as a chairperson, a secretariat, or a participant, for example. Speaker attribute ".
[0056]
The “conference section” used in the present embodiment divides a chat log based on a content unit that exists in any conference and is larger than a local (interaction) / middle (topic) discourse structure. It refers to each section that can be obtained. Further, the “conference section type” used in the present embodiment refers to an attribute (structural attribute) indicating the structure of each section in the chat log, such as a greeting to start, a declaration of execution of a review, etc., as shown in FIG. .
[0057]
The “conference type” used in the present embodiment refers to an attribute (type attribute) indicating the type of each section, such as information collection and information sharing, as shown in FIG. Further, the “cue expression” used in the present embodiment is a feature expression (a cue expression) serving as a cue in processing such as section division, attribute assignment, and utterance sentence extraction, as shown in FIGS. 14 to 16, 21 and 22. Attribute member).
[0058]
The “link source” used in the present embodiment refers to a past utterance sentence that is linked (most relevant) to a predetermined utterance in the chat log, and the “link destination” refers to a predetermined utterance in the chat log. Say a future utterance sentence linked from the sentence (see FIG. 26). Further, “link analysis” used in the present embodiment refers to a process of analyzing the degree of association between a predetermined utterance sentence and another utterance sentence. As a result of this process, the “link source” and the "Link destination" is determined. Note that information obtained from an utterance sentence to be used for such “link analysis” includes what is called “cue” as shown in FIG.
[0059]
[2: Chat log processing device according to the present embodiment]
Next, as a preferred embodiment of the character utterance record analysis device, analysis method and analysis program, information group analysis device, analysis method and analysis program according to the present invention, a chat log processing device according to the present embodiment is described. explain. Here, as described below, “2-1: outline and main features of chat log processing device”, “2-2: configuration of utterance sentence acquisition unit”, and “2-3: utterance sentence acquisition process” Procedure "," 2-4: Effect of utterance sentence acquisition processing, etc. "," 2-5: Configuration of attribute providing unit "," 2-6: Procedure of attribute providing processing "," 2-7: Attribute providing processing " Effects, etc. "," 2-8: Configuration and Processing Procedure of Minutes Creation Unit "," 2-9: Effects of Minutes Creation Process, etc. "," 2-9: Configuration of Link Analysis Unit "," 2-10 " : Link analysis processing procedure "and" 2-11: Effect of link analysis processing, etc. "
[0060]
(2-1: Outline and Main Features of Chat Log Processing Device)
FIG. 1 is a block diagram showing a schematic configuration of the chat log processing device, and FIGS. 2 to 4 are diagrams for explaining a schematic process of the chat log processing device. As shown in FIG. 1, a chat log processing device 10 according to the present embodiment includes an input unit 11, an output unit 12, an input / output control IF unit 13, an utterance sentence acquisition unit 20, an attribute assignment unit 30, , A minutes preparing unit 40 and a link analyzing unit 50.
[0061]
The chat log processing device 10 is a device that roughly creates a minutes (see FIG. 23) from a chat log (see FIG. 44). The point that one utterance sentence is sequentially acquired from the chat log recorded irrespective of the assignment unit, and the attribute assigning unit 30 divides the chat log divided for each utterance sentence into a plurality of sections, In that a predetermined attribute suitable for the chat log structure is provided, the minutes creator 40 creates a desired minutes from a chat log divided into a plurality of sections and each of which has a predetermined attribute, and The main feature of the link analysis unit 50 is that the link analysis unit 50 analyzes the degree of association between utterance sentences in a chat log to be processed by the minutes creation unit 40. Hereinafter, these main features will be briefly described.
[0062]
(1) Main features of the utterance sentence acquisition unit 20
As shown in FIG. 2A, the chat log is formed by recording utterances of characters of a plurality of characters in a line-sequential manner for each speaker. That is, a plurality of single utterance sentences are line-breaked irrespective of the act assignment unit (a unit capable of giving an act, which is the minimum unit representing the utterance act). There is a case where there is one utterance sentence, a case where the utterance sentence is broken in the middle, and a case where another speaker's utterance is inserted in the middle of the sentence.
[0063]
Therefore, the utterance sentence acquiring unit 20 refers to the end-of-sentence rule for specifying the end of one utterance sentence (see FIG. 7), specifies a predetermined part of the chat log as the end of one utterance sentence, and At the same time, the end of the sentence that was not identified as the end of one utterance sentence is combined with the beginning of the line of the same speaker recorded behind the line, and the chat log is recorded at a predetermined place identified as the end of the one utterance sentence. I try to split it.
[0064]
Therefore, as shown in FIG. 2B, it is possible to sequentially acquire one utterance sentence from a chat log in which a plurality of one utterance sentences are recorded irrespective of the act grant unit, and as described later, It is also possible to reliably process the chat log in units of one utterance sentence, such as adding a role attribute or an act to each utterance sentence or extracting one utterance sentence as a minutes item.
[0065]
In the chat log, special characters such as designation of the other party's name (> name), parentheses, relatively free punctuation marks, emoticons, laughter marks, date and time display, arrows, http / mail addresses, calculation formulas, and material format inputs In many cases, a variety of character expressions and, in addition, modified expressions of spoken words and written words appear, which hindered the acquisition of one-uttered sentences in sequence.
[0066]
Therefore, the utterance sentence acquisition unit 20 refers to a conversion rule (see FIG. 6) that associates a specific expression that can appear in such a chat log with a controlled expression after the conversion of the specific expression, and refers to the chat log. Is converted into a controlled expression, and the end of one utterance sentence is specified for the converted chat log. Therefore, a specific expression that hinders the acquisition of the one-speech sentence can be excluded from the chat log, and the one-speech sentence can be reliably acquired.
[0067]
(2) Main features of the attribute assigning unit 30
Also, in the attribute assigning unit 30 of the chat log processing device 10, the role attribute (for example, chairperson, secretariat, participant, etc.) is assigned to each utterance sentence of the chat log divided by the utterance sentence acquisition unit 20 for each utterance sentence. , And the chat log is divided into a plurality of sections by referring to the role attributes, and a meeting section type (for example, a start greeting, A structural attribute indicating the structure of each section in the chat log, such as a review execution declaration, is added.
[0068]
Therefore, as shown in FIG. 3 (c), it is possible to divide a chat log divided for each utterance sentence into a plurality of sections and to assign a predetermined attribute suitable for the chat log structure to each section. In addition, as will be described later, the chat log is provided in units of sections suitable for the chat log structure, such as assigning a meeting type to each section and creating a desired minutes based on the attributes assigned to each section. Can also be processed.
[0069]
In addition, the attribute assigning unit 30 assigns an act (for example, a speech act attribute indicating a characteristic based on the speech act of each speech sentence such as question / confirmation, agreement / affirmation, etc.) to each one speech sentence, and assigns each section. The conference type (for example, a type attribute indicating the type of each section, such as information collection and information sharing) for each section, with reference to the conference section type assigned to the section, the role attribute and the act assigned to each utterance sentence. Is also given.
[0070]
Therefore, as shown in FIG. 3 (c), it is possible to assign a predetermined attribute that is more suitable for the chat log structure to each section, and further, as described later, an attribute assigned to each section. It is also possible to process the chat log in sections suitable for the chat log structure, for example, by creating a more desired minutes based on the action given to each utterance sentence.
[0071]
(3) Main features of the minutes creating unit 40
In the minutes creating unit 40 of the chat log processing device 10, regarding the chat log in which a predetermined attribute is added to each section and each utterance sentence by the attribute adding unit 30, the attribute of each section and each utterance sentence is added to the attribute. The minutes are prepared based on the minutes. More specifically, a section in which an attribute specified in the rule is provided by referring to a rule defining a single utterance sentence to be extracted from the chat log in association with each section and an attribute that can be added to the single utterance sentence The minutes are created by extracting a single utterance sentence to which the attribute specified in the rule is assigned from among them.
[0072]
Therefore, a desired minutes can be automatically created from a chat log that is divided into a plurality of sections and each of which has a predetermined attribute. More specifically, as shown in FIG. 3 (d), it is possible to extract utterance sentences corresponding to the minutes of the decision items, homework, future tasks, etc. from the chat log, and to record such minutes of the minutes in a form. The prepared minutes (see FIG. 45) can be automatically created.
[0073]
(4) Main features of the link analysis unit 50
By the way, in the minutes from which important utterance sentences are extracted as shown in FIG. 3D, only one important utterance sentence is enumerated for each minutes item. Because there is no answer, the contents of the minutes may not be easily understood. For this reason, in order to facilitate understanding of the minutes, it is desirable to enumerate other related utterances related to the important utterance together.
[0074]
However, even if a chat log is considered from the viewpoint of topics, for example, a single topic generates multiple topics, multiple topics progress in parallel, or multiple topics combine to form a single topic. It has a very complicated structure, such as a middle topic or middle topic / lower topic progressing in a branch in one topic. In other words, each utterance in the chat log is not related only to each utterance in the group grouped by functions such as "start, answer, supplement", but is related to all other utterances in the chat log. The strengths between them have something to do with them.
[0075]
For this reason, in a chat log in which each uttered sentence is complicatedly related and has a complicated structure, in order to accurately extract other related uttered sentences related to the important uttered sentence, it is necessary to determine the relation between each uttered sentence. Understanding the degree is necessary as a precondition. Therefore, the link analysis unit 50 of the chat log processing device 10 acquires a predetermined clue (see FIG. 27) that can be used when analyzing the relevance between the respective utterance sentences from the utterance sentences of the chat log, and obtains a predetermined utterance. The degree of relevance between a sentence and another utterance sentence is analyzed.
[0076]
More specifically, using the acquired clues and heuristics (see FIG. 33), points indicating the degree of relevance are given to each of a plurality of other utterance sentences for a predetermined utterance sentence (see FIG. 27). . Therefore, it is possible to grasp the degree of relevance between the utterance sentences in the chat log having a complicated structure in which the utterance sentences are related in a complicated manner.
[0077]
Further, the link analysis unit 50, based on the points given above, links another utterance sentence (the most relevant past utterance sentence) to a predetermined utterance sentence or another utterance to be a link destination. A sentence (the most relevant future utterance sentence) is selected and determined. Therefore, it is possible to accurately extract the related utterance sentence most strongly related to the predetermined utterance sentence. Further, using this, the related utterance sentence most strongly related to the important utterance sentence extracted by the minutes creator 40 is accurately extracted, and as shown in FIG. It is also possible to create easily understandable minutes in which both sentences are listed.
[0078]
In the chat log processing device 10, the input unit 11 is an input unit that receives input of various information from the outside, and the output unit 12 is an output unit that outputs various information to the outside. The unit 13 controls the input and output of data by the input unit 11 and the output unit 12, and the input and output of data among the utterance sentence acquisition unit 20, the attribute assignment unit 30, the minutes creation unit 40, and the link analysis unit 50. Control means.
[0079]
Specifically, the input unit 11 and the output unit 12 include a user interface such as a keyboard, a mouse, a microphone, a monitor, and a speaker, a medium interface for receiving input / output via a recording medium, and a network (not shown). ) Is provided with a communication interface that accepts input / output via the I / O interface, and performs input of a chat log, output of minutes, input of various rules in the chat log processing device 10, and the like.
[0080]
Note that the chat log processing device 10 is provided in an information processing device such as a known personal computer, workstation, PHS terminal, portable terminal, mobile communication terminal, or PDA. It can also be realized by mounting the functions of the minutes creating unit 40 and the link analyzing unit 50.
[0081]
(2-2: Speech sentence acquisition unit configuration)
Next, the configuration of the utterance sentence acquisition unit 20 shown in FIG. 1 will be described. FIG. 5 is a block diagram illustrating a configuration of the utterance sentence acquisition unit 20. In FIG. 1, a storage unit 21 of the utterance sentence acquisition unit 20 is a storage unit (storage unit) for storing data and programs necessary for various processes by the control unit 22, and functionally includes a chat log memory 21a and a temporary storage. It comprises a memory 21b and a post-acquisition memory 21c.
[0082]
Of these, the chat log memory 21a is a memory for storing a chat log before the one-speech sentence acquisition process (see FIGS. 8 and 9), and the post-acquisition memory 21c is a chat log after the one-speech sentence acquisition process (FIG. 10 and FIG. 11), and the temporary memory 21b is a memory for storing data being processed.
[0083]
In other words, in the one utterance sentence acquisition process, after the utterance sentence is divided and cut out line by line from the chat log, the end of the one utterance sentence is specified by combining this with the beginning of the subsequent line sentence of the same speaker, and Although the chat log is divided at the end of the specified sentence, the temporary memory 21b stores and manages the utterances of each line for each speaker from the first cutout to the last division.
[0084]
In FIG. 5, the control unit 22 of the utterance sentence acquisition unit 20 has a control program such as an OS (Operating System), a program defining various processing procedures, and an internal memory for storing required data. These processing units execute various processes, and are functionally configured to include a conversion unit 23, a sentence end identification unit 24, a division unit 25, and a combination unit 26.
[0085]
The conversion unit 23 controls the specific expression appearing in the chat log by referring to the conversion rule 23a that associates the specific expression that can appear in the chat log with the controlled expression after the conversion of the specific expression. This is a conversion means for converting the expression into an expression. Specifically, as shown in FIGS. 6A and 6B, the conversion rule 23a includes speaker designation, free punctuation, emoticon, laughter mark, size, inflection, filler, conjunction, and modified expression. For example, the conversion target and the converted expression are associated with each other, and, for example, the speaker designation is defined in the sentence end rule 24a described later for convenience of the sentence end specifying process described later. A character string “.” Similar to the character string is defined.
[0086]
The sentence end specifying unit 24 is an end-of-sentence specifying unit that refers to the end-of-sentence rule 24a for specifying the end of the sentence of one utterance sentence and specifies a predetermined part of the chat log as the end of one utterance sentence. More specifically, as shown in FIG. 7, the sentence end rule 24a includes a “line end specifying rule” that defines a character string that appears at the end of the line of the chat log and can end the sentence of one utterance sentence. The `` in-line specific rule '' that specifies the character string that appears between the end of the line and can be the end of one utterance sentence, and the combination of the character string that can be the beginning and end of one utterance sentence as one sentence from the beginning of the chat log line to the end of the sentence The "single line identification rule (excluding abbreviation rules)", the "single line identification rule (abbreviation rule)" that defines a character string that can be one utterance sentence as one character string from the beginning to the end of the chat log, A "preamble specifying rule based on line connection relationship" that specifies a character string that appears at the beginning of a line and can be the beginning of one utterance sentence, and a "preamble feature based on utterance interval" that specifies the utterance interval between predetermined pairs Composed from a rule ".
[0087]
The end-of-sentence specifying unit 24 refers to these end-of-sentence rules 24a, and specifies, for example, the end of a line in which the character string specified in the “end-of-line specifying rule” exists among the end of each line of the chat log as the end of one sentence sentence. In addition, the part where the character string specified in the “in-line specific rule” exists between the beginning of the line and the end of each line is specified as the end of one utterance sentence, and the “one-line specific rule (excluding the abbreviation rule)” Identifies the end of the line where the combination of character strings specified at the beginning and end of the line exists as one sentence as the end of one utterance sentence, and the character string specified by the "single line identification rule (abbreviation rule)" is one character The end of the line from the beginning of the line to the end of the line as a column is specified as the end of one utterance sentence, and the character string specified in the `` preamble identification rule based on line connection relationship '' is recorded in front of the line existing at the beginning of the line. If the end of the line of the same speaker is specified as the end of one utterance sentence, and the utterance interval between predetermined lines exceeds the utterance interval specified in the "preamble identification rule based on utterance interval" Then, the end of the previous line is specified as the end of one utterance sentence.
[0088]
The dividing unit 25 is a dividing unit that divides the chat log at a predetermined position specified as the end of one utterance sentence by the end-of-sentence specifying unit 24. Specifically, when the end of a sentence is specified for a part of the chat log stored in the above-described temporary memory 21b, the dividing unit 25 divides the chat log at the specified end of the chat and acquires the post-acquisition memory 21c. To be stored.
[0089]
The combining unit 26 determines the end of each line of the chat log that is not identified as the end of one utterance sentence by the end-of-sentence identification unit 24 and the beginning of the line of the same speaker recorded behind the line. It is a coupling means for coupling. Specifically, the chat log is divided one line at a time in the one-utterance sentence acquisition process and stored in the temporary memory 21b for each speaker, and is processed. In the temporary memory 21b, the lines of the same speaker or the lines of the same speaker in the case where another speaker's utterance is inserted in the middle of one sentence are combined.
[0090]
(2-3: Utterance sentence acquisition processing procedure)
Next, a procedure of an utterance sentence acquisition process by the utterance sentence acquisition unit 20 configured as described above will be described. FIG. 12 is a flowchart showing the utterance sentence acquisition process. As shown in the figure, the utterance sentence acquisition unit 20 acquires utterance sentences line by line from the chat log stored in the chat log memory 21a, and stores the utterance sentences in the temporary memory 21b of the corresponding speaker (step S1201).
[0091]
Subsequently, the conversion unit 23 refers to the conversion rule 23a and controls the specific expression existing in the utterance sentence that has just been stored in the temporary memory 21b in step S1201 (hereinafter, this one-line utterance sentence is referred to as the current sentence). The expression is converted into the expressed expression (step S1201). Although not explicitly shown in FIG. 12, information on the utterance time, the speaker, and the partner speaker is extracted from the current sentence in accordance with the conversion processing.
[0092]
If the previous sentence (the utterance sentence of the same utterer whose end of the sentence has not yet been identified) is already stored in the temporary memory 21b in which the current sentence is stored (Yes at Step S1203), the end-of-sentence specifying unit 24 determines Whether the utterance interval between the sentence and the preamble exceeds the utterance interval specified in the “preamble identification rule based on the utterance interval”, and further, the character string specified in the “preamble identification rule based on the row connection relationship” It is determined whether the sentence is present at the beginning of the line (steps S1204 and 2705).
[0093]
When the end of the line of the previous sentence is not identified as the end of the sentence of one utterance sentence (No at Step S1204 and No at Step S1205), the combining unit 26 stores the end of the line of the previous sentence and the beginning of the current sentence in the temporary memory. The connection is made within 21b (step S1209). It should be noted that after the combination, the sentence is processed as the "current sentence" including the preceding sentence (steps S1212 to 2715).
[0094]
Conversely, when the end of the line of the previous sentence is specified as the end of the sentence of one utterance sentence (Yes at step S1204 or Yes at step S1205), the previous sentence and the current sentence are not combined, and the previous sentence is divided. After the execution (steps S1206 to S2708), the current sentence is divided (see FIG. A). That is, in this case, the end-of-sentence specifying unit 24 specifies, as the end of one utterance sentence, a place where the character string specified in the “in-line specifying rule” exists in the preamble stored in the temporary memory 21b (step S1206). .
[0095]
Then, when the end of the sentence can be identified even in the line of the preceding sentence (Yes at Step S1206), the dividing unit 25 divides the preceding sentence at the specified end of the sentence and stores the divided sentence in the post-acquisition memory 21c (Step S1207). On the other hand, when the end of the sentence cannot be specified in the line of the preamble (No at Step S1206), the dividing unit 25 extracts the preamble from the temporary memory 21b as it is and stores it in the acquired memory 21c (Step S1208). It should be noted that, through the processing in steps S1207 and S2708, only the current sentence is stored in the temporary memory 21b.
[0096]
Here, returning to the description of the processing in step S1207, if the previous sentence is not stored in the temporary memory 21b in which the current sentence is stored (Yes in step S1203 or A in the same figure), the end-of-sentence specifying unit 24 determines the current sentence It is determined whether or not is a combination of character strings specified in “one-line specification rule (excluding abbreviation rule)” or a character string specified in “one-line specification rule (abbreviation rule)” (step S1210).
[0097]
When the end of the line of the current sentence can be identified as the end of the line of the utterance sentence of one line by this determination (Yes at Step S1210), the dividing unit 25 extracts the current sentence as it is from the temporary memory 21b and stores it in the acquired memory 21c. (Step S1211). If the process has been performed on all the lines of the chat log stored in the chat log memory 21a (Yes at Step S1216), the utterance sentence acquisition process ends, otherwise (No at Step S1216). Returning to step S1201, processing is started for the line currently recorded after the current sentence.
[0098]
On the other hand, when the end of the line of the current sentence can be identified as the end of the line of the utterance sentence of one line in the determination of step S1210 (Yes at step S1210), or when the current sentence is combined with the preceding sentence through step S1209, the end of sentence specifying unit 24 Determines whether the end of the line of the current sentence is a character string defined in the “line end specification rule” (step S1212). If the end of the line of the current sentence cannot be identified as the end of the sentence (No at Step S1212), the process returns to Step S1201 with the current sentence stored in the temporary memory 21b, and the line recorded after the current sentence is read. Start processing.
[0099]
Conversely, when the end of the line of the current sentence can be identified as the end of the sentence (Yes at step S1212), the end-of-sentence specifying unit 24 specifies the current sentence stored in the temporary memory 21b in the “in-line identification rule”. The location where the character string exists is identified as the end of one utterance sentence (step S1213).
[0100]
If the end of the sentence can be identified even within the line of the current sentence (Yes at step S1213), the dividing unit 25 divides the current sentence at the end of the specified sentence and stores the current sentence in the acquired memory 21c (step S1214). . On the other hand, when the end of the sentence cannot be specified in the line of the current sentence (No at Step S1213), the dividing unit 25 extracts the current sentence from the temporary memory 21b as it is and stores it in the acquired memory 21c (Step S1215).
[0101]
Subsequently, after the processing in step S1214 or 2715, if processing has been performed for all lines of the chat log stored in the chat log memory 21a (Yes in step S1216), the utterance sentence acquisition processing ends. If not (No at Step S1216), the process returns to Step S1201 to start the process for the line recorded next to the current sentence.
[0102]
(2-4: Effect of utterance sentence acquisition processing, etc.)
As described above, the utterance sentence acquisition unit 20 refers to the end-of-sentence rule 24a, specifies a predetermined part of the chat log as the end of one utterance sentence, and specifies the predetermined end of each utterance sentence of each line as the end of one utterance sentence. The end of the sentence that was not found is combined with the beginning of the line of the same speaker recorded after the line, and the chat log is divided at a predetermined location specified as the end of the sentence of one utterance sentence. Therefore, a chat log (see FIGS. 8 and 9) in which a plurality of one-uttered sentences are recorded independently of the act-giving unit is divided into chat logs (see FIGS. 10 and 11) divided into one-uttered sentences. Can be obtained. As a result, a chat log can be reliably processed in units of one utterance sentence, such as adding a role attribute or an act to each utterance sentence or extracting one utterance sentence as a minutes item. By this utterance sentence acquisition process, it is also possible to appropriately acquire an utterance sentence unit from an irregularly seemingly complicated chat log by a large number of speakers.
[0103]
In addition, the utterance sentence acquisition unit 20 defines a character string that appears at the end of a line of the chat log and can be the end of one utterance sentence as a “line end specification rule”, and among the line ends of the chat log, a “line end specification rule”. The end of the line where the specified character string exists is specified as the end of one utterance sentence. Therefore, it is possible to reliably determine whether to split or combine the chat logs at the end of each line.
[0104]
Further, the utterance sentence acquisition unit 20 defines a character string that appears between the beginning and the end of the line of the chat log and can be the end of one utterance sentence as an “in-line specific rule”, and the “in-line identification rule” is used between the beginning and the end of each line. The part where the character string defined in the “specific rule” exists is specified as the end of one utterance sentence. Therefore, even when there are a plurality of utterance sentences in one line, it is possible to reliably acquire one utterance sentence.
[0105]
In addition, the utterance sentence acquisition unit 20 defines a combination of character strings that can be the beginning and end of one utterance sentence as one sentence from the beginning of the chat log to the end of the sentence as “one-line specifying rule (excluding abbreviation rules)”, and The combination of character strings defined in the “specific rules (excluding abbreviation rules)” specifies the end of a line that exists at the beginning and end of the line as one sentence as the end of one utterance sentence. Therefore, even when a single utterance sentence having the characteristics as a document (for example, date and time display, calculation formula, http address, mail address, etc.) is present in the chat log, such one utterance sentence can be reliably acquired. become.
[0106]
In addition, the utterance sentence acquisition unit 20 defines a character string that can be one utterance sentence as one character string from the beginning to the end of the line of the chat log as a “one-line identification rule (abbreviation rule)”, and a “one-line identification rule (abbreviation rule)”. Is specified as the end of one utterance sentence of a line in which the character string specified in (1) extends from the beginning of the line to the end of the line as one character string. Therefore, even if a single utterance sentence (for example, an abbreviation such as OK or NG) having a feature as a character dialogue exists in the chat log, it is possible to reliably acquire the one utterance sentence.
[0107]
The utterance sentence acquiring unit 20 defines a character string that appears at the beginning of a chat log and can be the beginning of one utterance sentence as a “preamble identification rule based on line connection relationship”, and a “preamble identification rule based on line connection relationship”. Is specified as the end of one utterance sentence of the line of the same utterer recorded before the line where the character string specified in. Therefore, even a single utterance sentence having a line end that is not specified as the end of a sentence by the above “line end identification rule” or “one line identification rule” can be obtained as a single utterance sentence retroactively from the relationship with the following. Become.
[0108]
In addition, the utterance sentence acquisition unit 20 defines the utterance interval between the predetermined pairs as a “preamble identification rule based on the utterance interval”, and sets the utterance interval between predetermined lines as “a preamble identification rule based on the utterance interval”. If the utterance interval exceeds the utterance interval specified in ".", The sentence end of the previous line is specified as the end of one utterance sentence. Therefore, even if the input of one utterance sentence is terminated halfway due to a leaving or the like, it is possible to avoid that this is combined with another utterance sentence.
[0109]
In addition, the utterance sentence acquisition unit 20 controls the specific expression appearing in the chat log by referring to the conversion rule 23a that associates the specific expression that can appear in the chat log with the controlled expression after the conversion of the specific expression. The converted chat log is used to identify the end of one utterance sentence of the converted chat log. Therefore, a specific expression that hinders the acquisition of the one-speech sentence can be excluded from the chat log, and the one-speech sentence can be reliably acquired.
[0110]
In addition, the utterance sentence acquisition unit 20 defines a character string similar to the character string defined in the end-of-sentence rule 24a as a converted rule as a controlled expression after conversion. Therefore, the specific expression in the chat log can be converted into a controlled expression useful for specifying the end of the sentence of one utterance sentence, and the one utterance sentence can be reliably acquired from the chat log.
[0111]
By the way, the utterance sentence acquisition unit 20 determines the end of the sentence of one utterance sentence after performing the conversion of the specific expression. However, the present invention is not limited to this. After that, the conversion of the specific expression may be performed. However, in this case, each rule defined in the end-of-sentence rule 24a also assumes a specific expression appearing in the chat log before the conversion process. Note that the specific expression may not be converted, and only the end of the sentence of one utterance sentence may be specified.
[0112]
Further, in the utterance sentence acquisition unit 20, the utterance sentence acquisition processing is performed according to the procedure shown in FIG. 12, but the present invention is not limited to this, and the order of such processing is arbitrary. The end of one utterance sentence may be specified at high speed by performing various determination processes in parallel.
[0113]
(2-5: Configuration of Attribute Giving Unit)
Next, the configuration of the attribute assignment unit 30 shown in FIG. 1 will be described. FIG. 13 is a block diagram illustrating a configuration of the attribute assigning unit 30. In the figure, a storage unit 31 of the attribute assignment unit 30 is a storage unit (storage unit) for storing data and programs necessary for various processes by the control unit 32. Specifically, the utterance by the utterance sentence acquisition unit 20 The chat log after the sentence acquisition process, the chat log in the middle of the attribute assigning process by the attribute assigning unit 30, and the chat log after the attribute assigning process are stored.
[0114]
In FIG. 13, the control unit 32 of the attribute assigning unit 30 has an internal memory for storing a control program such as an OS (Operating System), a program defining various processing procedures, and required data. The processing unit executes various processes according to the functions, and is functionally configured to include a role attribute assigning unit 33, a conference section type assigning unit 34, an act assigning unit 35, and a meeting type assigning unit 36.
[0115]
Among them, the role attribute assigning unit 33 refers to the role attribute assigning rule 33a and assigns a role attribute (for example, chairperson) to each one utterance sentence of the chat log divided by the utterance sentence acquisition unit 20 for each utterance sentence. , A secretariat, a participant, etc.). Specifically, member information (information in which each speaker appearing in the chat log is associated with role attributes such as a chairperson, a secretariat, and a participant) is recorded in the chat log in advance, After extracting the chairperson / member information, a role attribute corresponding to each utterance sentence is assigned with reference to the role attribute assignment rule 33a.
[0116]
It should be noted that the member information may not be recorded in the chat log in advance, but may be separately input to the attribute assigning unit 30 via the input unit 11, and such member information may be recorded in advance or separately input. Instead, the role attribute assigning unit 33 automatically derives the member information by analyzing the chat log (derives which speaker is the chairperson by the chat log analysis), and assigns the role attribute by using this. It may be. In other words, when the member information about the role attribute does not exist in the chat log, the person who speaks most appropriately as the chair is automatically estimated from the members based on the clue expression that the chair may possibly speak. As the clue expression, an expression unique to the conference section shown in FIG. 14B is used.
[0117]
The conference section type assigning unit 34 refers to the role attribute assigned by the role attribute assigning unit 33 and the conference section type assigning rule 34a, and divides the chat log into a plurality of sections, and assigns a meeting section type (for example, , A start greeting, a review execution declaration, and the like, a structure attribute that indicates the structure of each section in the chat log.
[0118]
More specifically, as shown in FIG. 14B, the conference section identification granting rule 34a defines a cue expression of “chair” in association with each conference section type (see FIG. 14A). It is. Then, the conference section type assigning unit 34 checks whether or not a clue expression exists in the one utterance sentence to which the role attribute of “chair” is assigned, and if the clue expression exists, the one utterance The chat log is divided into sections at the boundaries of sentences, and a conference section type corresponding to the clue expression is given.
[0119]
In addition, the conference section type assigning unit 34 refers to the conference section identification assignment rule 34a and corrects the conference section type of each section based on the concatenation, overlap, or context of the conference section types assigned to each section. It is also a structural attribute correcting means that performs. That is, based on the rule shown in FIG. 14B, a plurality of conference section types may be erroneously assigned to each section. The purpose is to correct the section so that one conference section type is assigned to the section.
[0120]
More specifically, as shown in FIG. 14C, the conference section identification granting rule 34a includes, as a conference section chain structure rule, a modification condition and a modification for each combination of conference section types (see FIG. 14A). The content is specified. In the same figure, “+” indicates the anteroposterior relation, “&” indicates the overlapping relation, “:” indicates the distant relation, and “(number)” indicates the meeting section type to be deleted. If "1", the front meeting section specified by the rule is deleted, and if "2", the back meeting section is deleted.
[0121]
Then, the conference section type assigning unit 34 detects a combination of conference section types satisfying the modification conditions defined in the conference section identification assignment rule 34a, and deletes any one of the conference section types. In other words, in the example of FIG. 14C, if the conference section types “theme implementation (report instruction)” and “greeting to start” are given between sections connected before and after, (Reporting instructions) "followed by a" greeting of opening "is not common, so the" greeting of opening "given in a later section is deleted as incorrectly given.
[0122]
Returning to the description of FIG. 13, the act providing unit 35 refers to the act providing rule 35 a to perform an act (for example, question / confirmation, consent / affirmation, etc.) on each utterance sentence with respect to each utterance sentence. Utterance act attribute assigning means for assigning an utterance act attribute indicating a characteristic based on the utterance act. Specifically, as shown in FIG. 15B, the act assignment rule 35a defines a cue expression in association with each act (see FIG. 15A). In the figure, “*” indicates an arbitrary character string, “^” indicates the beginning of one utterance sentence, and “$” indicates the end of one utterance sentence.
[0123]
Then, the act assigning unit 35 checks whether or not the clue expression specified in the rule exists in each one-uttered sentence in a form specified in the rule, and assigns the corresponding act to each one-uttered sentence. . Note that a plurality of such acts may be given to one utterance sentence.
[0124]
The meeting type assigning unit 36 refers to the meeting type assigning rule 36a, refers to the meeting section type assigned to each section, the role attribute and the act assigned to each utterance sentence, and sets the meeting type for each section. (For example, a type attribute indicating the type of each section, such as information collection and information sharing).
[0125]
Specifically, as shown in FIG. 16B, the conference type assignment rule 36a defines a role attribute, a conference section type, and an act in association with each conference type (see FIG. 16A). Things. In this figure, “(number)” indicates the number of one utterance sentence, and “M (member), H (host), O (owner)” indicates a role attribute. The host is also called the secretariat, and the owner is also called the chair.
[0126]
That is, for example, in order to provide the conference type “information collection”, in the section to which the conference section type “greeting to start” or “implement the theme (start)” is added, the role attribute “member” and the act “ The condition is that there are seven one-utterance sentences to which "undef" is added. Then, the conference type assigning unit 36 checks whether or not each section satisfies the condition defined in the conference type assignment rule 36a, and if the condition is satisfied, assigns a conference type corresponding to the condition. I do. Note that the conference type assignment expresses a typical communication type of the conference type as a rule. The number of utterances, act, role information, continuity of utterance (continuous utterance if the number of utterances is +), the same The rule is constituted by the utterance sequence of only the speaker (if the O, H, and M of the role information have +, only the same speaker). If the rule matches a negative rule (the rule with "!" At the beginning of the rule in FIG. 16B), the conference type is not assigned.
[0127]
The conference type assigning unit 36 is also a type attribute modifying unit that refers to the conference type assigning rule 36a and modifies the conference type of each section based on the overlapping relationship of the conference types assigned to each section. That is, for the same purpose as the above-described conference section type assigning unit 34, the conference type that has been erroneously assigned is deleted and corrected to a state in which one section is assigned one conference type.
[0128]
Specifically, in the conference type assignment rule 36a, as shown in FIG. 16C, as the conference type exclusion rule, correction conditions and correction contents are defined for each combination of the conference types (see FIG. 16A). Is done. Note that, in the figure, “&” indicates an overlapping relationship, and “(number)” indicates the type of meeting type to be deleted.
[0129]
Then, the conference type assigning unit 36 detects a combination of conference types having the modification conditions defined in the conference type assignment rule 36a, and deletes one of the conference types. That is, in the example of FIG. 16C, if the meeting types “information collection” and “resolution” are assigned to the same section, “resolution” and “information collection” are performed together. Since it is not common that information is collected, "information collection" is deleted as having been given by mistake.
[0130]
(2-6: Procedure of attribute assignment processing)
Next, a procedure of an attribute assignment process by the attribute assignment unit 30 configured as described above will be described. FIG. 17 is a flowchart illustrating the attribute assignment processing. As shown in FIG. 18, in the attribute assigning unit 30, the role attribute assigning unit 33 refers to the role attribute assigning rule 33a, and the chat log divided by the utterance sentence acquiring unit 20 for each utterance sentence (see FIG. A role attribute is assigned to each one-utterance sentence of (a) (step S1701). As a result, a chat log to which a role attribute is assigned for each utterance sentence is obtained (see FIG. 18B). Although not explicitly written in FIG. 18, the speaker name, the utterance partner name, and the utterance time are also acquired as attributes of each uttered sentence based on the chat log and stored in the memory.
[0131]
Subsequently, the conference section type assigning unit 34 refers to the role attribute assigned by the role attribute assigning unit 33 and the conference section type assigning rule 34a, and divides the chat log into a plurality of sections and assigns a meeting section to each section. A type is assigned (step S1702). Further, the conference section type assigning unit 34 refers to the conference section identification assignment rule 34a, and corrects the conference section type of each section based on the concatenation, overlap, or context of the conference section types assigned to each section. (Step S1703). As a result, a chat log divided into sections and given a conference section type is obtained (see FIG. 18C).
[0132]
Thereafter, the act giving unit 35 gives an act to each utterance sentence with reference to the act giving rule 35a (step S1704). As a result, a chat log to which an act is given for each utterance sentence is obtained (see FIG. 18D).
[0133]
Then, the conference type assignment unit 36 refers to the conference type assignment rule 36a, refers to the conference section type assigned to each section, the role attribute and the act assigned to each utterance sentence, and A conference type is given (step S1705). Further, the conference type assigning unit 36 refers to the conference type assignment rule 36a and corrects the conference type of each section based on the overlapping relationship of the type assigned to each section (step S1706). Thereby, a chat log in which the conference section type and the conference type are assigned to each section and the role attribute and the act are assigned to each utterance sentence is obtained (see FIG. 18E).
[0134]
(2-7: Effect of attribute assignment processing, etc.)
As described above, the attribute assigning unit 30 assigns a role attribute (eg, chairperson, secretariat, participant, etc.) to each utterance sentence of the chat log divided for each utterance sentence by the utterance sentence acquisition unit 20. The chat log is divided into a plurality of sections by referring to the role attribute, and a conference section type (for example, a greeting to start, a review execution declaration, etc.) is given to each section. Therefore, it is possible to divide a chat log into a plurality of sections and to assign a predetermined attribute suitable for the chat log structure to each section. As a result, it is also possible to process chat logs in sections that match the chat log structure, such as assigning a meeting type to each section and creating desired minutes based on the attributes assigned to each section. Become.
[0135]
The attribute assigning unit 30 assigns an act (for example, question / confirmation, consent / affirmation, etc.) to each utterance sentence, a conference section type assigned to each section, and an attribute assigned to each utterance sentence. The conference type (for example, information collection, information sharing, etc.) is assigned to each section by referring to the role attribute and the act. Therefore, it is possible to add a predetermined attribute that is more suitable for the chat log structure to each section, and furthermore, it is possible to add a desired attribute based on the attribute given to each section or the act given to each utterance sentence. It is also possible to process chat logs in sections suitable for the chat log structure, such as by creating minutes of the meeting.
[0136]
In addition, the attribute assigning unit 30 defines a meeting section identification assigning rule 34a by associating a cue expression of “chair” with each meeting section type, and provides a clue in a single utterance sentence to which the role attribute of “chair” is assigned. Check if the expression exists. If a clue expression exists, the chat log is divided into sections at the one utterance sentence, and a conference section type corresponding to the clue expression is given. Therefore, by focusing on the cue expression defined in the conference section identification providing rule 34a, it is possible to easily and accurately allocate the conference section type.
[0137]
In addition, the attribute assigning unit 30 refers to the meeting section identification assigning rule 34a, and corrects the meeting section type of each section based on the concatenation, overlap, or context of the meeting section types assigned to each section. Therefore, even when a plurality of conference section types are erroneously assigned to each section, the erroneously overlapped conference section types can be deleted, and the conference section types can be assigned with high accuracy.
[0138]
Further, the attribute assigning unit 30 defines a meeting type assigning rule 36a as a condition in which a role attribute, a meeting section type, and an act are associated with each meeting type. Whether or not the condition is satisfied is checked. If the condition is satisfied, a conference type corresponding to the condition is assigned. Therefore, by focusing on the corresponding condition of each attribute defined in the conference type assignment rule 36a, it is possible to easily and accurately assign the conference section type.
[0139]
Further, the attribute assigning unit 30 refers to the meeting type assigning rule 36a and corrects the meeting type of each section based on the overlapping relation of the type assigned to each section. Therefore, even when a plurality of conference types are erroneously assigned to each section, it is possible to delete the erroneously overlapped conference types and to assign the conference types with high accuracy.
[0140]
By the way, the attribute assigning unit 30 assigns a role attribute and an act to each utterance sentence, and assigns a conference section type and a conference type to each section. However, the present invention is not limited to this. The number and type of the utterance sentence are arbitrary, and may be a predetermined attribute characterizing each utterance sentence or a predetermined attribute characterizing each section.
[0141]
The attribute assigning unit 30 divides the section and assigns the conference section type based on the clue expression of the utterance sentence to which the role attribute “chair” is assigned, but the present invention is not limited to this. Instead, the utterance sentence to which another role attribute is assigned may be combined with a clue expression to perform division or assignment.
[0142]
Further, the attribute assigning unit 30 corrects the once-assigned conference section type and conference type. However, the present invention is not limited to this, and may modify the once-assigned act. Good. Note that the processing may be continued without correcting these attributes once given.
[0143]
The attribute assigning unit 30 assigns an attribute to the chat log (the chat log divided for each utterance sentence) after the utterance sentence acquisition processing by the utterance sentence acquisition unit 20. However, the present invention is not limited to this, and an attribute may be given to the chat log after the utterance sentence acquisition processing input from the outside via the input unit 11.
[0144]
(2-8: Minutes Minutes Configuration and Processing Procedure)
Next, the configuration and processing procedure of the minutes creating unit 40 shown in FIG. 1 will be described. FIG. 19 is a block diagram showing the configuration of the minutes creating unit 40. In the figure, a storage unit 41 of the minutes creating unit 40 is a storage unit (storage unit) for storing data and programs required for various processes by the control unit 42. The chat log after the granting process, the minutes created by the minutes creating unit 40, and the like are stored.
[0145]
In FIG. 19, the control unit 42 of the minutes creating unit 40 has a control program such as an OS (Operating System), a program that defines various processing procedures, and an internal memory for storing required data. These processing units execute various processes, and are functionally provided with an attribute acquisition unit 43 and an important utterance sentence extraction unit 44.
[0146]
Among these, the attribute acquisition unit 43 is an attribute acquisition unit that acquires an attribute assigned to each section and each utterance sentence from the chat log stored in the storage unit 41. Specifically, the storage unit 41 stores a chat log in which a conference section type and a conference type are assigned for each section, and a role attribute and an act are assigned for each utterance sentence. The unit 43 acquires these conference section types, conference types, role attributes, and acts.
[0147]
Then, the important utterance sentence extraction unit 44 refers to the important utterance sentence extraction rule 44a, and obtains each attribute (the conference section type and the conference type assigned to each section, and further, each one utterance) acquired by the attribute acquisition unit 43. This is a means for creating the minutes based on the role attribute and the act assigned to the sentence.
[0148]
Specifically, as shown in FIG. 20B and FIG. 21, the important utterance sentence extraction rule 44a includes, for each minutes item (see FIG. 20A), a conference section type, a conference type, a role attribute, Acts and clue expressions (see FIG. 22) are defined in association with each other. In other words, as shown in FIG. 20B, there are a plurality of important sentence extraction rules for each minutes item (acting as an OR condition), and one rule for a negation rule (a rule with a leading!). If any match is found, no utterance sentence is extracted. The important utterance sentence processing unit 44 determines that, for example, one rule of the minutes item “decision item” is that the role information is the owner (chairperson), the meeting section type is “greeting to start”, and the meeting type is “ It is required to match any expression in the "regular report" and the "decision-making clue expression" prepared separately. On the other hand, the utterance sentence which is the act "end of utterance" is not extracted by the negation rule.
[0149]
After such processing, the important utterance sentence extraction unit 44 extracts an important utterance sentence for each minutes item such as “decision item, assignment, homework, discussion contents, future schedule”. Then, as a result, as shown in FIG. 23, the minutes creator 40 automatically creates minutes in which utterance sentences corresponding to each minutes item are extracted.
[0150]
(2-9: Effect of minutes creation process, etc.)
As described above, the minutes creating unit 40 uses the minutes of the minutes based on the attributes of each section and each utterance sentence for the chat log in which the attribute is added to each section and each utterance sentence by the attribute adding unit 30. Create Therefore, a desired minutes can be automatically created from a chat log that is divided into a plurality of sections and each of which has a predetermined attribute.
[0151]
More specifically, the minutes creating unit 40 refers to the important utterance sentence extraction rule 44a in which one utterance sentence to be extracted from the chat log in association with each section and an attribute that can be given to one utterance sentence is defined. The minutes are created by extracting one utterance sentence to which the attribute specified in the rule is assigned from the section to which the attribute specified in the rule is assigned. Therefore, for example, it is possible to extract an utterance sentence corresponding to the minutes, such as a decision item, a homework, and a future task, from a chat log, and automatically generate a minutes including such minutes in a form. Will be possible.
[0152]
By the way, the minutes creating unit 40 creates the minutes using attributes such as the meeting section type, the meeting type, the role attribute, and the act assigned to the chat log, but the present invention is not limited to this. Instead, the minutes may be created by arbitrarily selecting these attributes, or the minutes may be created using other attributes.
[0153]
In addition, the minutes creator 40 decides to create minutes including minutes items such as decision items, homework, and future tasks. However, the present invention is not limited to this. By arbitrarily defining 44a, a minutes including any minutes item may be created. Furthermore, the present invention is not limited to the case where the minutes described above are created as a form of extracting a fixed item (a fixed format) from a chat log to create a target document. The present invention can be similarly applied to a case where any document having a fixed format such as a book or a procedure manual is created.
[0154]
In other words, from the viewpoint of "arranging distributed information by a specific chat with a plurality of persons, sharing based on a consensus established by the chat, and outputting to a target document", for example, one system (super The present invention can be similarly applied to the creation or revision of specifications, operation manuals, procedure manuals, and the like of computers. In other words, when assuming the creation or revision of specifications and procedures, it is usually "draft-circulated, gathering the enhancement information of each (module in charge of each engineer) and compiling it in a document with consistency" However, as shown in FIG. 42, as shown in FIG. 42, the items to be confirmed by chat are extracted in the same procedure as in the above-mentioned minutes, and are output so as to be automatically inserted into the target document which has been tagged in advance. It is possible to obtain a revised document that covers the enhancement items.
[0155]
Further, the minutes creating unit 40 creates minutes of the chat log (chat log to which attributes are assigned to each section and one utterance sentence) after the attribute assigning process by the attribute assigning unit 30. However, the present invention is not limited to this, and the minutes of the chat log after the attribute assignment processing input from the outside via the input unit 11 may be created.
[0156]
Further, the minutes creating unit 40 creates the minutes by extracting important utterance sentences, but the present invention is not limited to this, and a specific character string such as a so-called agenda (agenda) is used. May be created in the chat log by creating the minutes. That is, the agenda insertion point is specified by referring to the attributes of each section and each utterance sentence of the chat log, and the minutes of the agenda are created by inserting the agenda at the specified insertion point. This makes it possible to automatically create the minutes with the agenda inserted.
[0157]
Further, the minutes creating unit 40 may create the minutes by summarizing the chat log with reference to the attributes of each section and each utterance sentence. That is, the minutes of the summary model may be created in consideration of local and medium discourse structures such as topic transitions and exchanges.
[0158]
The minutes creating unit 40 not only creates minutes (see FIGS. 3D and 23) listing one important utterance sentence for each minutes item, but also creates a link analyzing unit 50 described later. By extracting the related utterance sentence most strongly related to the important utterance sentence using the processing result of, the important utterance sentence and the related utterance sentence are enumerated as shown in FIG. The minutes may be prepared.
[0159]
(2-9: Configuration of Link Analysis Unit)
Next, the configuration of the link analysis unit 50 shown in FIG. 1 will be described. FIG. 24 is a block diagram illustrating a configuration of the link analysis unit 50. The link analysis unit 50 has a control program such as an OS (Operating System), a program defining various processing procedures and the like, and an internal memory for storing necessary data, and a processing unit that executes various processes by these. As shown in the figure, functionally, a clue acquisition unit 51, a link source analysis unit 52, a link source selection unit 53, a link destination analysis unit 54, and a link destination selection unit 55 are provided. Be composed.
[0160]
Here, before starting the description of each unit, the outline of the link analysis processing by the link analysis unit 50 will be described with reference to FIGS. As shown in FIG. 25, the link analysis process generally acquires a clue from an utterance sentence, searches for a link source of the utterance sentence (link source analysis and link source selection), and searches for a link destination of the utterance sentence (link destination). (Analysis and link destination selection).
[0161]
That is, as an initial process, the link analysis unit 50 acquires predetermined cues (see FIGS. 29 to 32) that can be used when analyzing the degree of association between utterance sentences from the utterance sentences. Then, as shown in FIGS. 26 to 28, the link analysis unit 50 analyzes the degree of association between the utterance sentences using the acquired cues and heuristics (see FIG. 33), and Search for another utterance sentence that is the link source or link destination.
[0162]
Note that the link source means a past utterance sentence that is linked (most relevant) to the current utterance sentence, and the link destination means a future utterance sentence linked from the current utterance sentence. In the following description and reference drawings, the suffix "c" indicates the current utterance sentence, and the suffixes "-1" and "+1" are one backward (past) and one forward (future) of the current utterance, respectively. Refers to another utterance. Further, “X = Y” represents “X is Y” or “X is equal to Y”, and “X ≠ Y” represents “X is not Y” or “X is not equal to Y”.
[0163]
To describe the components of the link analysis unit 50, the clue acquisition unit 51 acquires predetermined clues (see FIGS. 29 to 32) that can be used when analyzing the degree of association between the utterance sentences from the utterance sentences. It is a clue acquisition means. Specifically, as shown in FIG. 29, the clue acquisition unit 51 includes the act (utterance act attribute) indicating a feature based on the utterance act of the utterance sentence, the utterer attribute indicating the utterer of the utterance sentence, and the utterance sentence. Speaker designation information on the speaker designation, anaphora information on the anaphor contained in the utterance sentence, connection attribute indicating switching or continuation of the topic included in the utterance sentence, subject information on the subject included in the utterance sentence, included in the utterance sentence The proposition information on the proposition is acquired from each utterance sentence.
[0164]
The “act” acquired by the clue acquiring unit 51 is the same as that described with reference to FIG. 15 and the like, but here, as shown in FIG. 30, a search is made for the utterance sentence at the link source or the link destination. At this time, it is used as a device which gives a restriction by a speaker (self / partner / none) and a linkable act No. (number).
[0165]
The link source analysis unit 52 uses the clues acquired by the clue acquisition unit 51 to determine whether a given utterance sentence is related to the given utterance sentence and another utterance sentence. It is a relevance analysis means for analyzing the relevance in. Specifically, while performing a backward search from a predetermined utterance sentence, referring to the heuristic shown in FIG. 33, a point representing the degree of relevance of each of a plurality of other utterance sentences with respect to the predetermined utterance sentence is added. I do. As a result, as shown in FIG. 27, the degree of association with the current utterance sentence is represented by a point for each utterance sentence located behind (past) from a predetermined utterance sentence (current utterance sentence). Note that the link source analysis unit 52 performs “judgment of link source search” as shown in FIG. 27 before the above-described analysis process. Without performing the process.
[0166]
The link source selecting unit 53 is a related utterance sentence selecting unit that selects a link source utterance sentence from a plurality of other utterance sentences based on the points given by the link source analysis unit 52. More specifically, the link source selecting unit 53 performs “point-based link source selection” as shown in FIG. 27, and performs a related utterance sentence that is most strongly related to a predetermined utterance sentence (for example, the number of points). Is the largest utterance sentence) as the link source. As a result, as shown in FIG. 34, the utterance sentence of the link source is specified for each utterance sentence (see each arrow in FIG. 34).
[0167]
The link destination analyzing unit 54 uses the clue acquired by the clue acquiring unit 51 to determine whether a given utterance sentence is related to the given utterance sentence and another utterance sentence. It is a relevance analysis means for analyzing the relevance in. Specifically, only the utterance sentence for which the link destination cannot be determined by the link source selecting unit 53 is searched forward, and the analysis based on the “designated speaker and act constraint” as shown in FIG. 28 is performed. Do. Note that the link destination analysis unit 54 also performs “link destination search execution determination” as shown in FIG. 28 before the above-described analysis processing. Without performing the process.
[0168]
The link destination selection unit 55 is a related utterance sentence selection unit that selects a link destination utterance sentence from among a plurality of other utterance sentences according to the analysis result of the link destination analysis unit 54. More specifically, the link destination selecting unit 55 performs “link destination selection” and “link destination selection availability determination” as shown in FIG. 28, and performs a related utterance sentence that is most strongly related to a predetermined utterance sentence. Is selected as the link destination.
[0169]
(2-10: Link analysis processing procedure)
Next, a procedure of a link analysis process by the link analysis unit 50 configured as described above will be described. 35 to 39 are flowcharts showing the flow of the link analysis processing (link source search and link destination search). As shown in FIG. 35, first, the link analysis unit 50 acquires various types of information necessary for a link source search (steps S3501 to S3505). It is assumed that, prior to the processing shown in the figure, "clues" as shown in FIGS. 29 to 32 have already been obtained from the utterance sentence.
[0170]
More specifically, first, a search range is determined (step S3501). In other words, as an example, if the utterance time is present in the chat log, the utterance sentence within two minutes and the range up to the utterance sentence of which the connection clue is the topic switching type is set as the search range, and the utterance is added to the chat log. If the time does not exist, the search range is set to the utterance sentence of 15 times and the connection clue is up to the utterance sentence of the topic switching type.
[0171]
Next, the link destination (possibility) information of the current sentence is acquired from the destination designation (step S3502). In other words, in order to use after the current utterance sentence processing, if the destination designation is “all”, the possibility of linking to the utterances of all the conference participants other than yourself is obtained, and the destination designation is specified In the case of the name, the possibility of linking to the utterance sentence of the person with that name is obtained.
[0172]
Then, after acquiring the act of the utterance sentence, a clue of the link source search and the link source information of the current sentence are obtained (step S3503). That is, from the link source information (speaker, act) of the act shown in FIG. 30, link source information indicating which act can be linked to which utterance sentence is obtained, and the act shown in FIG. From the link destination information (speaker, act), the link destination information indicating which utterance sentence of which act can be linked is acquired.
[0173]
Further, the utterance sentence specifying the user (current utterance sentence) is searched for and acquired as the utterance sentence specified by the user (step S3505). That is, the utterance sentence specifying the user as the destination is searched for in the search range, and the utterance sentence closest to the current utterance sentence is obtained from the utterance sentence. In this case, the case where the destination designation is “all” is also regarded as the designation for oneself. Further, the act information of the immediately preceding utterance is acquired (step S3505). That is, if the immediately preceding utterance sentence is an act requesting a link destination (see FIG. 30), the information is acquired.
[0174]
Then, following the above-described processing (steps S3501 to S3505), it is determined whether or not to perform a link source search (step S3506). In other words, (1) the connection clue is a topic switching type, or (2) the connection clue is not a topic connection type and includes a proposition, there is no immediately preceding speaker link destination request, there is no anaphoric clue, and the link of the current sentence. If there is no original information and there is no utterance sentence designated by the user, the process exits without performing a link source search.
[0175]
Conversely, when these conditions are not met, a link source search as shown in FIGS. 36 and 37 is executed. The link search process (steps S3601 to S3607 shown in FIG. 36 and S3701 to S3704 shown in FIG. 37) will be described below.
[0176]
First, the link analysis unit 50 adds points to the utterance sentence for which the user (current utterance sentence) is designated as a partner (step S3601). In other words, in the case where the act of the utterance sentence requests the link source, one point is added to (1) the closest utterance sentence having the destination designation for oneself, and (2) the destination designation for the self is made. One point is added to the utterance sentence, and (3) if the current conference section is of the "resolution" type, two points are added to the utterance sentence specified for the other party, and (4) the utterance sentence immediately before is added. If the other party is specified, one point is added to the immediately preceding utterance sentence.
[0177]
Then, following the point assignment, point assignment is performed when the immediately preceding utterance sentence is the same speaker as the current utterance sentence (step S3602). That is, if the immediately preceding utterance sentence is the same speaker as the current utterance sentence, and there is no link destination designation by Act, one point is added to the immediately preceding utterance sentence. Further, the link analysis unit 50 gives points to the speaker of the immediately preceding utterance in the case of specifying the destination (step S3603). In other words, if the destination of the speaker of the immediately preceding utterance is specified by the current utterance, one point is added to the immediately preceding utterance.
[0178]
In addition, following such point assignment, point assignment based on the act link relationship is performed (step S3604). That is, the link source information (speaker, act) of the act of the current utterance sentence and the link destination information (speaker, act) of the act of the utterance sentence in the search range are referred to while referring to the correspondence relationship of the act shown in FIG. And if the link source information and the link destination information match each other, one point is added to the utterance sentence within the search range.
[0179]
Further, the link analysis unit 50 gives points based on the connection clue (step S3605). That is, if the connection clue of the immediately preceding utterance is a topic continuation type, one point is added to the immediately preceding utterance. Then, following the point assignment, point assignment is performed using the anaphor cue and the noun set (step S3606). That is, (1) If there is a Kosoa anaphor or rhetorical anaphor in the current utterance sentence, if an anaphor noun is found in the noun set in the utterance sentence within the search range, one point is added to the utterance sentence, (2) If the anaphor present in the utterance sentence is a substitute anaphor, one point is added to the immediately preceding utterance.
[0180]
Subsequently, points are assigned using a theme cue and a noun set (step S3607), and as the last mode of the point assignment, points are assigned based on the inclusion of a proposition (step S3701). That is, if a subject noun exists in the current sentence and a noun that matches the subject is found in the utterance sentence within the search range, one point is added to the utterance sentence, and further, there is no proposition in the current utterance sentence. If the act requires a link destination act, one point is added to the immediately preceding utterance sentence.
[0181]
Through the above-described processing (steps S3601 to S3607 and S3701), each utterance sentence located in the search range (past) from the predetermined utterance sentence (current utterance sentence) is associated with the current utterance sentence. Is given. Then, following the point provision, the link source is determined as described below (steps S3702 to S704).
[0182]
The link analysis unit 50 first determines a link source based on points given to each utterance sentence (step S3702). That is, referring to points given to the utterance sentences in the search range, only one link source of the current utterance sentence is determined. In this case, the utterance sentence having the largest point is set as the link destination. If the number of points is the same, the one closer to the current utterance sentence is selected. However, an utterance sentence that already has a link from the same utterer as the present utterance is excluded from the link source. If the point total is 0, there is no link source.
[0183]
Next, the link analysis unit 50 copies the link destination information from the determined link source (step S3703). That is, if the link source is determined, the link destination viewed from the link source is set. Finally, the link source is determined by adjustment (step S3704). That is, when the link source is not determined by the point and the act of the utterance sentence currently requires the link source, the immediately preceding utterance sentence is selected as the link source.
[0184]
In this way, the utterance sentence of the link source is determined for each utterance sentence, but as described above, the link source is not necessarily determined for all utterance sentences. 38, a link destination search process (steps S3801 to S3803 shown in FIG. 38) is executed.
[0185]
Describing the link destination search process, the link analysis unit 50 first confirms the necessity of the link destination determination process (step S3801). That is, if a link destination is currently assigned to the utterance sentence, or if there is no possibility that the act suggests a link destination, the process exits without performing the link destination search process.
[0186]
On the other hand, when these conditions are not satisfied, the link destination is determined by the speaker designation and the act (step S3802). That is, as an example, if the current sentence has the speaker designation, the link destination of the act of the designated speaker and the current speech sentence is set as the search range with eight utterance sentences uttered later (FIG. 30). A search is made for an utterance sentence that can be used as a reference, and this is determined as a link destination.
[0187]
Further, if the link destination is not determined by the above conditions, the link destination for the immediately following utterance sentence is determined only by the act link destination speaker designation (step S3803). That is, if the link destination speaker designation of the act of the current sentence matches the immediately following utterance sentence, the immediately following utterance sentence is set as the link destination. In this case, the act type of the link destination is not used for matching. If the link cannot be established, the process exits with no link destination.
[0188]
(2-11: Effect of link analysis processing, etc.)
As described above, the link analysis unit 50 acquires predetermined cues (see FIG. 27) that can be used when analyzing the relevance between utterance sentences from the utterance sentences of the chat log, and obtains the obtained cues and heuristics. Using (see FIG. 33), points representing the degree of relevance are added to each of a plurality of other utterance sentences for a predetermined utterance sentence (see FIG. 27). Therefore, in a chat log in which each utterance sentence is complicatedly related to each other and has a complicated structure, it is possible to grasp the degree of association between each utterance sentence by a point of strength.
[0189]
Further, the link analysis unit 50, based on the points given above, links another utterance sentence (the most relevant past utterance sentence) to a predetermined utterance sentence or another utterance to be a link destination. A sentence (the most relevant future utterance sentence) is selected and determined. Therefore, it is possible to accurately extract the related utterance sentence most strongly related to the predetermined utterance sentence. Further, by utilizing this, the related utterance sentence most strongly associated with the important utterance sentence extracted by the minutes creator 40 is accurately extracted, as shown in FIG. It is also possible to create easily understandable minutes in which both utterance sentences are listed.
[0190]
Further, the link analysis unit 50 analyzes the relevance by the link source search, and then analyzes the relevance by the link destination search only for the utterance sentence for which the link source could not be determined. Therefore, in consideration of the characteristic of the chat log that there is not always a response to the action, it is possible to avoid performing unnecessary analysis processing (that is, first perform the link source determination processing for all utterance sentences). Then, for the utterance sentence where the link source is found, the link destination is also determined in the reverse direction, and the link destination determination process is performed only for the utterance sentence for which the link source was not determined, so that the useless link destination determination process is performed. It is possible to perform real-time analysis processing along with the progress of the chat.
[0191]
By the way, the link analysis unit 50 analyzes the degree of relevance using a clue as shown in FIG. 29. However, the present invention is not limited to this, and these clues are arbitrarily selected. Alternatively, other clue information (for example, various types of attribute information provided by the attribute providing unit 30) may be used.
[0192]
Further, the link analysis unit 50 adds the points of the relevance according to the heuristics as shown in FIG. 33. However, the present invention is not limited to this. Weighting may be performed, or heuristics including other conditions may be used.
[0193]
Further, the link analysis unit 50 selects only one utterance sentence to be a link source or a link destination for a predetermined utterance sentence based on the given points, but the present invention is not limited to this. Instead of selecting another utterance sentence whose number of points is equal to or greater than a predetermined number, a group of related utterance sentences related to the predetermined utterance sentence with a predetermined strength may be extracted. Good.
[0194]
In the link analysis unit 50, the assigned points are used for searching for a link source or a link destination. However, the present invention is not limited to this, and the assigned points can be used for analyzing the structure of the chat log. That is, as shown in FIG. 39, by tracing the link source in order from a predetermined utterance sentence or extracting a group of utterance sentences equal to or more than a predetermined number of points, a plurality of utterance sentences having strong relevance are obtained. The link structure can be extracted from the chat log. Note that such a link structure is a structure that can correspond to a discourse unit (including a so-called local / medium structure unit of discourse) linked in a response relationship based on local cohesiveness of the utterance or a rhetorical relationship.
[0195]
Further, in the analysis of the structure of the chat log, by setting and adjusting the number of points of a group of utterance sentences to be extracted, for example, a chat log in which middle and lower topics in a single topic are progressing ( Even in a chat log having an extremely complicated structure, such as a chat log (see FIG. 40), a plurality of topics being generated from one topic, or a plurality of topics in parallel and progressing (see FIG. 41), a desired link structure can be obtained. Can be extracted. By extracting a group of utterance sentences having the above-mentioned link structure from the important utterance sentences extracted by the minutes creator 40 as related utterance sentences, the minutes as shown in FIG. You may make it.
[0196]
[3: Other embodiments]
Although the embodiments of the present invention have been described above, the present invention is not limited to the above-described embodiments, but may be implemented in various different embodiments within the scope of the technical idea described in the claims. It may be implemented.
[0197]
For example, in the present embodiment, a case has been described in which a chat log as shown in FIG. 1 is to be processed. However, the present invention is not limited to this. The present invention can be similarly applied to a character utterance record in which utterance sentences of a plurality of characters, such as exchanges, are grouped and recorded in chronological order for each speaker.
[0198]
Furthermore, the present invention is not limited to the processing of such a character utterance record, and information obtained by grouping a plurality of pieces of information in a unit to which a predetermined attribute can be assigned, independently of the unit. The same applies to groups. That is, a case where the information group is combined or divided at a predetermined position to obtain one information, or a case where the information group is divided into a plurality of sections and a predetermined attribute is given to each section, When processing an information group divided into sections and given a predetermined attribute, and further, when analyzing the degree of association between predetermined information and other information in an information group in which a plurality of pieces of information are recorded, The present invention can be similarly applied.
[0199]
Also, in the present embodiment, the case where the chat log processing device 10 inputs and processes a chat log from the outside has been described. However, the present invention is not limited to this. You may make it. That is, as shown in FIG. 43, the chat log generated by the chat processing unit 61 is processed as it is in the chat server 60 for performing a chat between a plurality of client devices 2 via the network 1 such as the Internet. Is also good.
[0200]
Each component of each device illustrated in the drawings is functional and does not necessarily need to be physically configured as illustrated. That is, the specific form of distribution / integration of each device is not limited to the illustrated one (FIGS. 1 and 43). For example, the user terminal such as the client device 2 shown in FIG. All or some of the functions, such as processing, minutes creation processing, and link analysis processing, are functionally or physically distributed and integrated in arbitrary units according to various loads and usage conditions. Can be configured. Further, all or any part of each processing function performed by each device is executed by a CPU and a program analyzed and executed by the CPU (for example, an utterance sentence acquisition process, an attribute assignment process, a minutes creation process, This can be realized by a program that executes each method of the link analysis processing, or by hardware using wired logic (connection logic).
[0201]
Further, among the processes described in the present embodiment, all or a part of the processes described as being performed automatically can be manually performed, or the processes described as being performed manually can be performed. Can be automatically or completely performed by a known method. In addition, the processing procedures, control procedures, specific names, and information including various data and parameters shown in the above document and drawings can be arbitrarily changed unless otherwise specified.
[0202]
Each method of the utterance sentence acquisition process, the attribute assignment process, the minutes creation process, and the link analysis process described in the present embodiment is executed by executing a prepared program on a computer such as a personal computer or a workstation. It can be realized by. This program can be distributed via a network such as the Internet. Further, this program is recorded on a computer-readable recording medium such as a hard disk, a flexible disk (FD), a CD-ROM, an MO, and a DVD, and can be executed by being read from the recording medium by the computer.
[0203]
【The invention's effect】
As described above, according to the first, tenth, or eleventh aspect of the present invention, it is possible to grasp the degree of association between utterance sentences in a chat log having a complicated structure in which utterance sentences are complicatedly related. Become.
[0204]
According to the second or twelfth aspect of the present invention, the viewpoint of whether or not a so-called act has a predetermined relationship between a predetermined utterance sentence and another utterance sentence is determined. From the viewpoint of whether or not the speaker is common, the viewpoint of whether or not the speaker is designated between the predetermined utterance sentence and another utterance sentence, the viewpoint of the predetermined utterance sentence and another utterance sentence From the viewpoint of whether or not an anaphor has occurred, whether or not the topic continues between a predetermined utterance sentence and another utterance sentence, and the subject between the predetermined utterance sentence and another utterance sentence From the viewpoint of whether or not a common utterance is common, the viewpoint of whether or not a proposition is common between a predetermined utterance sentence and another utterance sentence, and / or From the viewpoint of whether or not the utterance positions are close, it is possible to grasp the degree of association between the utterance sentences.
[0205]
Further, according to the third or thirteenth aspect, it is possible to grasp the degree of relevance of each of a plurality of other utterance sentences with respect to a predetermined utterance sentence based on points of strength.
[0206]
According to the fourth or fourteenth aspect of the present invention, it is possible to extract a related utterance sentence related to a predetermined utterance sentence with a predetermined strength according to a point given to each utterance sentence. .
[0207]
According to the invention of claim 5 or 15, it is possible to uniquely extract a related utterance sentence most strongly related to a predetermined utterance sentence.
[0208]
Further, according to the sixth or sixteenth aspect, it is possible to extract a group of related utterance sentences related to a predetermined utterance sentence with a predetermined strength.
[0209]
Further, according to the invention of claim 7, it is possible to grasp the degree of relevance between the respective utterance sentences from the viewpoint of whether or not a predetermined utterance sentence can be a link source.
[0210]
Further, according to the invention of claim 8, it is possible to grasp the degree of association between the respective utterance sentences from the viewpoint of whether or not the predetermined utterance sentence can be a link destination.
[0211]
According to the ninth aspect of the present invention, useless analysis processing is prevented from being performed in consideration of the characteristic of a chat log that a response is not always present to a request (that is, all utterances are not performed). To perform link source determination processing for a sentence first, determine the link destination from the opposite direction for the utterance sentence where the link source is found, and perform link destination determination processing only for the utterance sentence for which the link source was not determined In addition, unnecessary link destination determination processing need not be performed), and real-time analysis processing accompanying the progress of chat can be performed.
[0212]
Further, according to the invention of claims 17, 18 or 19, it is possible to grasp the degree of association between the utterance sentences in a chat log having a complicated structure in which the utterance sentences are complicatedly related.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a schematic configuration of a chat log processing device.
FIG. 2 is a diagram for explaining a schematic process of a chat log processing device.
FIG. 3 is a diagram illustrating a schematic process of a chat log processing device.
FIG. 4 is a diagram illustrating a schematic process of a chat log processing device.
FIG. 5 is a block diagram illustrating a configuration of an utterance sentence acquisition unit.
FIG. 6 is a diagram for explaining a conversion rule.
FIG. 7 is a diagram for explaining an end-of-sentence rule.
FIG. 8 is a diagram illustrating an example of a chat log.
FIG. 9 is a diagram illustrating an example of a chat log.
FIG. 10 is a diagram illustrating an example of a chat log after an utterance sentence acquisition process.
FIG. 11 is a diagram illustrating an example of a chat log after an utterance sentence acquisition process.
FIG. 12 is a flowchart showing an utterance sentence acquisition process.
FIG. 13 is a block diagram illustrating a configuration of an attribute assignment unit.
FIG. 14 is a diagram for explaining a conference section type assignment rule.
FIG. 15 is a diagram for explaining an act giving rule.
FIG. 16 is a diagram for explaining a conference type assignment rule.
FIG. 17 is a flowchart illustrating an attribute assignment process.
FIG. 18 is a diagram illustrating an attribute assignment process.
FIG. 19 is a block diagram illustrating a configuration of a minutes creating unit.
FIG. 20 is a diagram for explaining important utterance sentence extraction rules.
FIG. 21 is a diagram for explaining important utterance sentence extraction rules.
FIG. 22 is a diagram for explaining important utterance sentence extraction rules.
FIG. 23 is a diagram showing an example of minutes.
FIG. 24 is a block diagram illustrating a configuration of a link analysis unit.
FIG. 25
It is a figure for explaining an outline of link analysis processing.
FIG. 26 is a diagram for explaining the concept of link analysis.
FIG. 27 is a diagram showing a flow of a link source search.
FIG. 28 is a diagram showing a flow of a link destination search.
FIG. 29 is a diagram for explaining clues acquired from an utterance sentence.
FIG. 30 is a diagram illustrating an example of an act tag.
FIG. 31 is a diagram for explaining subject acquisition and anaphor cue acquisition.
FIG. 32 is a diagram for describing connection clue acquisition.
FIG. 33 is a diagram illustrating an example of heuristics (for link source search).
FIG. 34 is a diagram illustrating an example of a link source search.
FIG. 35 is a flowchart showing the flow of a link source search processing procedure.
FIG. 36 is a flowchart showing a flow of a link source search processing procedure.
FIG. 37 is a flowchart showing a flow of a link source search processing procedure.
FIG. 38 is a flowchart showing the flow of a link destination search processing procedure.
FIG. 39 is a diagram illustrating an example of a link structure.
FIG. 40 is a diagram illustrating an example of a link structure.
FIG. 41 is a diagram illustrating an example of a link structure.
FIG. 42 is a diagram showing an example of a specification document.
FIG. 43 is a block diagram illustrating a schematic configuration of a chat system.
FIG. 44 is a diagram showing an example of a chat log.
FIG. 45 is a diagram showing an example of a minutes form.
[Explanation of symbols]
10 Chat log processing device
11 Input section
12 Output unit
13 I / O control IF section
20 Utterance sentence acquisition unit
21 Storage unit
21a Chat log memory
21b temporary memory
21c Memory after acquisition
22 Control part
23 Conversion unit
23a Conversion rules
24 End of sentence identification section
24a Sentence ending rules
25 Division
26 Joint
30 Attribute assignment unit
31 Memory
32 control unit
33 Role attribute assignment unit
33a Role attribute assignment rule
34 Meeting Section Type Assignment Unit
34a Conference section type assignment rule
35 Act granting unit
35a Act grant rule
36 Conference type assigning unit
36a Conference type assignment
40 minutes preparation department
41 Memory
42 control unit
43 Attribute acquisition unit
44 important utterance sentence extraction unit
45 Important Utterance Sentence Extraction Rule
50 Link Analyzer
51 Cue acquisition unit
52 Link source analysis unit
53 Link source selection section
54 Link Analysis Department
55 Link destination selection section
60 chat server

Claims (19)

複数人の文字による発話文が記録された文字発話記録を分析する文字発話記録の分析装置であって、
前記文字発話記録の発話文から各発話文間の関連度を分析する際に利用可能な所定の手がかりを取得する手がかり取得手段と、
前記手がかり取得手段によって取得された所定の手がかりを利用して、所定の発話文と他の発話文との間における関連度を分析する関連度分析手段と、
を備えたことを特徴とする文字発話記録の分析装置。
A character utterance record analysis device for analyzing a character utterance record in which utterance sentences by a plurality of characters are recorded,
A clue acquisition unit that acquires a predetermined clue that can be used when analyzing the degree of association between the respective utterance sentences from the utterance sentences of the character utterance record,
Using a predetermined clue obtained by the clue obtaining means, a relevance analyzing means for analyzing a relevance between a predetermined utterance sentence and another utterance sentence,
A character utterance record analyzing device comprising:
前記手がかり取得手段は、前記所定の手がかりとして、発話文の発話行為に基づく特徴を示す発話行為属性、発話文の発話者を示す発話者属性、発話文に含まれる発話者指定に関する発話者指定情報、発話文に含まれる照応に関する照応情報、発話文に含まれる話題の切替若しくは継続を示す接続属性、発話文に含まれる主題に関する主題情報、発話文に含まれる命題に関する命題情報、および/または、前記文字発話記録における発話位置に関する発話位置情報を取得し、
前記関連度分析手段は、前記所定の発話文および他の発話文が有する前記発話行為属性、発話者属性、発話者指定情報、照応情報、接続属性、主題情報、命題情報、および/または、発話位置情報の関連性に応じて前記関連度を分析することを特徴とする請求項1に記載の文字発話記録の分析装置。
The cue acquiring means includes, as the predetermined cue, a utterance act attribute indicating a feature based on the utterance act of the utterance sentence, a utterer attribute indicating the utterer of the utterance sentence, and speaker designation information regarding speaker designation included in the utterance sentence Anaphor information related to anaphor included in the utterance sentence, connection attribute indicating switching or continuation of a topic included in the utterance sentence, subject information regarding a subject included in the utterance sentence, proposition information regarding a proposition included in the utterance sentence, and / or Acquiring utterance position information on an utterance position in the character utterance record,
The relevance analyzing means may include the utterance act attribute, utterer attribute, utterer designation information, anaphor information, connection attribute, subject information, proposition information, and / or utterance of the predetermined utterance sentence and another utterance sentence. The character utterance record analysis device according to claim 1, wherein the degree of relevance is analyzed according to the relevance of position information.
前記関連度分析手段は、前記所定の発話文に対する複数の他の発話文それぞれに対して前記関連度の強弱を表すポイントを付与することを特徴とする請求項1または2に記載の文字発話記録の分析装置。3. The character utterance record according to claim 1, wherein the relevance analysis unit assigns a point indicating the strength of the relevance to each of a plurality of other utterance sentences with respect to the predetermined utterance sentence. 4. Analyzer. 前記関連度分析手段によって付与されたポイントに基づいて、前記複数の他の発話文のなかから所定の他の発話文を選択する関連発話文選択手段をさらに備えたことを特徴とする請求項3に記載の文字発話記録の分析装置。4. The apparatus according to claim 3, further comprising a related utterance sentence selecting unit that selects a predetermined other utterance sentence from the plurality of other utterance sentences based on the points given by the association degree analysis unit. Analysis device for character utterance record described in 1. 前記関連発話文選択手段は、前記ポイントの数が最大である他の発話文を選択することを特徴とする請求項4に記載の文字発話記録の分析装置。The character utterance record analysis apparatus according to claim 4, wherein the related utterance sentence selecting means selects another utterance sentence having the maximum number of points. 前記関連発話文選択手段は、前記ポイントの数が所定の数以上である他の発話文を選択することを特徴とする請求項4に記載の文字発話記録の分析装置。The character utterance record analysis apparatus according to claim 4, wherein the related utterance sentence selecting means selects another utterance sentence whose number of points is equal to or more than a predetermined number. 前記関連度分析手段は、前記所定の発話文に対して関連元になるか否かの観点から前記関連度を分析することを特徴とする請求項1〜6のいずれか一つに記載の文字発話記録の分析装置。The character according to any one of claims 1 to 6, wherein the relevance analysis unit analyzes the relevance from the viewpoint of whether or not the predetermined utterance becomes a relevance source. Speech record analyzer. 前記関連度分析手段は、前記所定の発話文に対して関連先になるか否かの観点から前記関連度を分析することを特徴とする請求項1〜6のいずれか一つに記載の文字発話記録の分析装置。The character according to any one of claims 1 to 6, wherein the relevance analysis unit analyzes the relevance from a viewpoint of whether or not the predetermined utterance becomes a relevance destination. Speech record analyzer. 前記関連度分析手段は、前記所定の発話文に対して関連元になるか否かの観点から前記関連度を分析した後、当該関連元にならなかった他の発話文を前記所定の発話文として、当該所定の発話文に対して関連先になるか否かの観点から前記関連度を分析することを特徴とする請求項1〜6のいずれか一つに記載の文字発話記録の分析装置。The relevance analysis unit analyzes the relevance from the viewpoint of whether or not the predetermined utterance becomes a relevance source, and then converts the other utterances that did not become the relevance source into the predetermined utterance text. The character utterance record analysis device according to any one of claims 1 to 6, wherein the degree of association is analyzed from a viewpoint of whether or not the predetermined utterance becomes an association destination. . 複数人の文字による発話文が記録された文字発話記録を分析する文字発話記録の分析方法であって、
前記文字発話記録の発話文から各発話文間の関連度を分析する際に利用可能な所定の手がかりを取得する手がかり取得工程と、
前記手がかり取得工程によって取得された所定の手がかりを利用して、所定の発話文と他の発話文との間における関連度を分析する関連度分析工程と、
を含んだことを特徴とする文字発話記録の分析方法。
An analysis method of a character utterance record for analyzing a character utterance record in which utterance sentences by a plurality of characters are recorded,
A clue acquisition step of acquiring a predetermined clue that can be used when analyzing the degree of association between the respective utterance sentences from the utterance sentences of the character utterance record,
Utilizing the predetermined clue obtained by the clue obtaining step, a relevance analysis step of analyzing the relevance between the predetermined utterance sentence and another utterance sentence,
A method for analyzing a character utterance record, comprising:
複数人の文字による発話文が記録された文字発話記録を分析する分析方法をコンピュータに実行させる文字発話記録の分析プログラムであって、
前記文字発話記録の発話文から各発話文間の関連度を分析する際に利用可能な所定の手がかりを取得する手がかり取得手順と、
前記手がかり取得手順によって取得された所定の手がかりを利用して、所定の発話文と他の発話文との間における関連度を分析する関連度分析手順と、
をコンピュータに実行させることを特徴とする文字発話記録の分析プログラム。
A character utterance record analysis program for causing a computer to execute an analysis method for analyzing a character utterance record in which utterance sentences by a plurality of characters are recorded,
A clue acquisition procedure for acquiring a predetermined clue that can be used when analyzing the degree of association between the respective utterance sentences from the utterance sentences of the character utterance record,
Using a predetermined clue obtained by the clue acquisition procedure, a relevance analysis procedure for analyzing the relevance between a predetermined utterance sentence and another utterance sentence,
A character utterance record analysis program that causes a computer to execute the program.
前記手がかり取得手順は、前記所定の手がかりとして、発話文の発話行為に基づく特徴を示す発話行為属性、発話文の発話者を示す発話者属性、発話文に含まれる発話者指定に関する発話者指定情報、発話文に含まれる照応に関する照応情報、発話文に含まれる話題の切替若しくは継続を示す接続属性、発話文に含まれる主題に関する主題情報、発話文に含まれる命題に関する命題情報、および/または、前記文字発話記録における発話位置に関する発話位置情報を取得し、
前記関連度分析手順は、前記所定の発話文および他の発話文が有する前記発話行為属性、発話者属性、発話者指定情報、照応情報、接続属性、主題情報、命題情報、および/または、発話位置情報の関連性に応じて前記関連度を分析することを特徴とする請求項11に記載の文字発話記録の分析プログラム。
The cue obtaining step includes, as the predetermined cue, a utterance act attribute indicating a feature based on the utterance act of the utterance sentence, a utterer attribute indicating the utterer of the utterance sentence, and speaker designation information regarding speaker designation included in the utterance sentence. Anaphor information related to anaphor included in the utterance sentence, connection attribute indicating switching or continuation of a topic included in the utterance sentence, subject information regarding a subject included in the utterance sentence, proposition information regarding a proposition included in the utterance sentence, and / or Acquiring utterance position information on an utterance position in the character utterance record,
The relevance analysis procedure includes the utterance act attribute, utterer attribute, utterer designation information, anaphor information, connection attribute, subject information, proposition information, and / or utterance of the predetermined utterance sentence and other utterance sentences. The computer-readable storage medium according to claim 11, wherein the degree of association is analyzed according to the association of position information.
前記関連度分析手順は、前記所定の発話文に対する複数の他の発話文それぞれに対して前記関連度の強弱を表すポイントを付与することを特徴とする請求項11または12に記載の文字発話記録の分析プログラム。13. The character utterance record according to claim 11, wherein in the relevance analysis procedure, a point indicating the strength of the relevance is given to each of a plurality of other utterance sentences for the predetermined utterance sentence. Analysis program. 前記関連度分析手順によって付与されたポイントに基づいて、前記複数の他の発話文のなかから所定の他の発話文を選択する関連発話文選択手順をさらにコンピュータに実行させることを特徴とする請求項13に記載の文字発話記録の分析プログラム。The computer further executes a related utterance sentence selection step of selecting another predetermined utterance sentence from the plurality of other utterance sentences based on the points given by the association degree analysis procedure. Item 14. An analysis program for character utterance records according to item 13. 前記関連発話文選択手順は、前記ポイントの数が最大である他の発話文を選択することを特徴とする請求項14に記載の文字発話記録の分析プログラム。15. The storage medium according to claim 14, wherein the related utterance sentence selecting step selects another utterance sentence having the maximum number of points. 前記関連発話文選択手順は、前記ポイントの数が所定の数以上である他の発話文を選択することを特徴とする請求項14に記載の文字発話記録の分析プログラム。The computer-readable storage medium according to claim 14, wherein the related utterance sentence selecting step selects another utterance sentence having the number of points equal to or greater than a predetermined number. 複数の情報が記録された情報群を分析する情報群の分析装置であって、
前記情報群の情報から各情報間の関連度を分析する際に利用可能な所定の手がかりを取得する手がかり取得手段と、
前記手がかり取得手段によって取得された所定の手がかりを利用して、所定の情報と他の情報との間における関連度を分析する関連度分析手段と、
を備えたことを特徴とする情報群の分析装置。
An information group analysis device for analyzing an information group in which a plurality of pieces of information are recorded,
A clue acquisition unit that acquires a predetermined clue that can be used when analyzing the degree of association between pieces of information from the information of the information group,
Using a predetermined clue obtained by the clue obtaining means, a relevance analysis means for analyzing the relevance between the predetermined information and other information,
An information group analysis device, comprising:
複数の情報が記録された情報群を分析する情報群の分析方法であって、
前記情報群の情報から各情報間の関連度を分析する際に利用可能な所定の手がかりを取得する手がかり取得工程と、
前記手がかり取得工程によって取得された所定の手がかりを利用して、所定の情報と他の情報との間における関連度を分析する関連度分析工程と、
を含んだことを特徴とする情報群の分析方法。
An information group analysis method for analyzing an information group in which a plurality of pieces of information are recorded,
A clue acquisition step of acquiring a predetermined clue that can be used when analyzing the degree of association between pieces of information from the information of the information group,
Utilizing the predetermined clue obtained by the clue obtaining step, a relevance analysis step of analyzing the relevance between the predetermined information and other information,
An information group analysis method characterized by including:
複数の情報が記録された情報群を分析する分析方法をコンピュータに実行させる情報群の分析プログラムであって、
前記情報群の情報から各情報間の関連度を分析する際に利用可能な所定の手がかりを取得する手がかり取得手順と、
前記手がかり取得手順によって取得された所定の手がかりを利用して、所定の情報と他の情報との間における関連度を分析する関連度分析手順と、
をコンピュータに実行させることを特徴とする情報群の分析プログラム。
An information group analysis program for causing a computer to execute an analysis method for analyzing a plurality of information recorded information groups,
A clue acquisition procedure for acquiring a predetermined clue that can be used when analyzing the degree of association between pieces of information from the information of the information group,
Using a predetermined clue acquired by the clue acquisition procedure, a relevance analysis procedure for analyzing the relevance between the predetermined information and other information,
A computer-readable program for analyzing a group of information.
JP2003090900A 2003-03-28 2003-03-28 Analysis device, analysis method and analysis program for character speech record, and analysis device, analysis method and analysis program for information group Pending JP2004295834A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003090900A JP2004295834A (en) 2003-03-28 2003-03-28 Analysis device, analysis method and analysis program for character speech record, and analysis device, analysis method and analysis program for information group

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003090900A JP2004295834A (en) 2003-03-28 2003-03-28 Analysis device, analysis method and analysis program for character speech record, and analysis device, analysis method and analysis program for information group

Publications (1)

Publication Number Publication Date
JP2004295834A true JP2004295834A (en) 2004-10-21

Family

ID=33404404

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003090900A Pending JP2004295834A (en) 2003-03-28 2003-03-28 Analysis device, analysis method and analysis program for character speech record, and analysis device, analysis method and analysis program for information group

Country Status (1)

Country Link
JP (1) JP2004295834A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009026137A (en) * 2007-07-20 2009-02-05 Toshiba Corp Apparatus and method for supporting obtaining of discussion state
JP2019061594A (en) * 2017-09-28 2019-04-18 株式会社野村総合研究所 Conference support system and conference support program
WO2019155716A1 (en) * 2018-02-08 2019-08-15 ソニー株式会社 Information processing device, information processing system, information processing method, and program
CN110612525A (en) * 2017-05-10 2019-12-24 甲骨文国际公司 Enabling thesaurus analysis by using an alternating utterance tree
CN111797226A (en) * 2020-06-30 2020-10-20 北京百度网讯科技有限公司 Conference summary generation method and device, electronic equipment and readable storage medium
US11960844B2 (en) 2017-05-10 2024-04-16 Oracle International Corporation Discourse parsing using semantic and syntactic relations

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009026137A (en) * 2007-07-20 2009-02-05 Toshiba Corp Apparatus and method for supporting obtaining of discussion state
CN110612525A (en) * 2017-05-10 2019-12-24 甲骨文国际公司 Enabling thesaurus analysis by using an alternating utterance tree
CN110612525B (en) * 2017-05-10 2024-03-19 甲骨文国际公司 Enabling a tutorial analysis by using an alternating speech tree
US11960844B2 (en) 2017-05-10 2024-04-16 Oracle International Corporation Discourse parsing using semantic and syntactic relations
JP2019061594A (en) * 2017-09-28 2019-04-18 株式会社野村総合研究所 Conference support system and conference support program
JP7046546B2 (en) 2017-09-28 2022-04-04 株式会社野村総合研究所 Conference support system and conference support program
WO2019155716A1 (en) * 2018-02-08 2019-08-15 ソニー株式会社 Information processing device, information processing system, information processing method, and program
CN111797226A (en) * 2020-06-30 2020-10-20 北京百度网讯科技有限公司 Conference summary generation method and device, electronic equipment and readable storage medium
CN111797226B (en) * 2020-06-30 2024-04-05 北京百度网讯科技有限公司 Conference summary generation method and device, electronic equipment and readable storage medium

Similar Documents

Publication Publication Date Title
JP5897240B2 (en) Customer service system and conversation server
JP4826275B2 (en) Response generating apparatus, method, and program
US20210103607A1 (en) Generating three-dimensional scenes from natural language requests
KR101201093B1 (en) Method and system for ranking words and concepts in a text using graph-based ranking
JP5149737B2 (en) Automatic conversation system and conversation scenario editing device
US9141689B2 (en) Persona management system for communications
US7774292B2 (en) System for conditional answering of requests
US5918222A (en) Information disclosing apparatus and multi-modal information input/output system
US7552047B2 (en) Instance-based sentence boundary determination by optimization
US20050154580A1 (en) Automated grammar generator (AGG)
US20060282414A1 (en) Question answering system, data search method, and computer program
JP2017199363A (en) Machine translation device and computer program for machine translation
Chalmers Awareness, representation and interpretation
JP2008077250A (en) Information processing method, information processor, program and recording medium which records this
JP2004295834A (en) Analysis device, analysis method and analysis program for character speech record, and analysis device, analysis method and analysis program for information group
JP2002222185A (en) Structured document sharing device, method therefor, and file sharing system of structured document
JP2000172483A (en) Method and system for speech recognition by common virtual picture and storage medium stored with speech recognition program by common virtual picture
JP2004213260A (en) Speech sentence acquiring system and program, attribute giving device and program, document generating device and program, and information processing method
McShane et al. Multi-stage language understanding and actionability
JP3506058B2 (en) Semantic analysis method and apparatus, and recording medium storing semantic analysis program
Li et al. An extensible scripting language for interactive animation in a speech-enabled virtual environment
Sundblad et al. OLGA—a multimodal interactive information assistant
JP2008217370A (en) Profile registration system, method, and program
WO2019181221A1 (en) Information processing device and information processing system
Lööck Distributed annotation in virtual reality

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050511