JP2004213260A - 発話文取得装置、属性付与装置、文書作成装置、発話文取得プログラム、属性付与プログラム、文書作成プログラムおよび情報処理方法 - Google Patents

発話文取得装置、属性付与装置、文書作成装置、発話文取得プログラム、属性付与プログラム、文書作成プログラムおよび情報処理方法 Download PDF

Info

Publication number
JP2004213260A
JP2004213260A JP2002381219A JP2002381219A JP2004213260A JP 2004213260 A JP2004213260 A JP 2004213260A JP 2002381219 A JP2002381219 A JP 2002381219A JP 2002381219 A JP2002381219 A JP 2002381219A JP 2004213260 A JP2004213260 A JP 2004213260A
Authority
JP
Japan
Prior art keywords
attribute
sentence
utterance
section
assigning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002381219A
Other languages
English (en)
Inventor
Tatsuki Kobayashi
竜己 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CSK Corp
Original Assignee
CSK Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CSK Corp filed Critical CSK Corp
Priority to JP2002381219A priority Critical patent/JP2004213260A/ja
Publication of JP2004213260A publication Critical patent/JP2004213260A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Abstract

【課題】チャットログから一発話文を順次取得すること。チャットログを複数のセクションに分割しつつ各セクションに対してチャットログ構造に適合した所定の属性を付与すること。チャットログから所望の文書(例えば、議事録など)を作成すること。
【解決手段】発話文取得部20は、チャットログ内で一発話文の文末を特定し、特定された所定箇所にてチャットログを分割する。属性付与部30は、チャットログの各一発話文に対して役割属性およびアクトを付与するとともに、チャットログを複数のセクションに分割しつつ各セクションに対して会議セクション種別および会議タイプを付与する。議事録作成部40は、この各セクションおよび各一発話文の属性に基づいて議事録項目に対応する発話文を抽出し、議事録を作成する。
【選択図】 図17

Description

【0001】
【発明の属する技術分野】
この発明は、例えば、複数人の文字による発話文が発話者ごとに時系列に改行記録されたチャットログからの発話文取得処理、また、チャットログに対する属性付与処理、さらに、チャットログに基づいた文書作成処理に関する。
【0002】
【従来の技術】
従来より、会議の議事録を自動的に作成するという議事録作成技術があり、例えば、会議の各発言者から収集した音声データを仮名漢字混じりの文章に変換した後に、この変換された文章から会議の議事録を作成するというシステムも知られている(例えば、特許文献1参照)。
【0003】
ところで、最近になって、ビジネスの場においてもチャットが利用されつつある。つまり、チャットであれば、仕事場の離れた参加者同士が一つの会議室に集まることなく、いつでもどこにいてもネットワークに接続されたPCを用いて会議に参加できるというメリットから、チャット会議システムを利用した会議も一般的になりつつある。そして、上記したような議事録作成技術を利用することで、チャット会議の結果得られるテキスト形式のチャットログ(図1参照)から議事録を自動的に作成することができないかという提案もなされている。
【0004】
【特許文献1】
特開2000−112931号公報
【0005】
【発明が解決しようとする課題】
しかしながら、チャット会議に用いられる文字対話の表現形式は、口頭による音声会議に用いられる表現形式とは相違するものであり、上記したような音声会議用の議事録作成技術をそのまま利用することはできなかった。
【0006】
すなわち、チャット会議の結果得られるチャットログ(図1参照)には、発話文が途中で改行されたり、文途中の改行が複数話者で交互に行われるといった発話文に関する特徴があり、発話文を一文ずつ(例えば、発話行為を表す最小単位であるアクト単位で)取得することは容易でない。このため、チャットログそのものに対して通常のテキスト処理を適用することも困難であり、音声会議用の議事録作成技術をそのまま利用することも不可能であった。なお、質問や相槌、依頼などを単位とする発話行為、すなわちアクト(Dialogue Act)は一発話文の中に複数存在する場合もあるが、本発明では、簡略したモデルを採用するため、発話文イコール発話行為(複数可能)とする。
【0007】
このようなことから、チャットログから如何にして議事録を自動的に作成するか、特に、議事録作成に伴うテキスト処理が適用可能な状態へチャットログを如何にして持っていくかが極めて重要な課題になっており、望ましくは、チャットログから自動的に議事録を作成する手法、特に、チャットログから一発話文(上記のアクト付与単位にある発話文)を順次取得する手法が必要とされている。
【0008】
そこで、この発明は、上述した従来技術による問題点を解消するためになされたものであり、複数の一発話文が所定の属性付与単位とは無関係に記録されているチャットログから一発話文を順次取得することができる発話文取得装置および発話文取得プログラムを提供することを目的とし、さらには、チャットログに限らず、所定の属性付与が可能な単位にある複数の一情報が当該単位とは無関係に組分けされてなる情報群から一情報をそれぞれ取得することができる情報処理方法を提供することも目的とする。
【0009】
また、この発明は、一発話文ごとに分割されたチャットログを複数のセクションに分割しつつ各セクションに対してチャットログ構造に適合した所定の属性を付与することができる属性付与装置および属性付与プログラムを提供することを目的とし、さらには、チャットログに限らず、所定の属性付与が可能な単位にある複数の一情報からなる情報群を複数のセクションに分割しつつ各セクションに対して情報群の構造に適合した所定の属性を付与することができる情報処理方法を提供することも目的とする。
【0010】
さらに、この発明は、複数のセクションに分割されて所定の属性がそれぞれ付与されたチャットログから所望の文書(例えば、議事録など)を作成することができる文書作成装置および文書作成プログラムを提供することを目的とし、さらには、チャットログに限らず、複数のセクションに分割されて所定の属性を付与された複数の一情報からなる情報群を各属性に基づいて加工することができる情報処理方法を提供することを目的とする。
【0011】
【課題を解決するための手段】
上述した課題を解決し、目的を達成するため、本発明は、複数人の文字による発話文が発話者ごとに時系列に組分け記録された文字発話記録を所定箇所にて結合または分割し、所定の属性付与が可能な単位にある複数の一発話文を順次取得する発話文取得装置であって、前記一発話文の文末を特定するための文末ルールを参照し、前記文字発話記録の所定箇所を前記一発話文の文末として特定する文末特定手段と、各組の文末のうちで前記文末特定手段によって前記一発話文の文末として特定されなかった文末を当該組の後方に記録されている同一発話者の組の文頭と結合する結合手段と、前記文末特定手段によって前記一発話文の文末として特定された所定箇所にて前記文字発話記録を分割する分割手段と、を備えたことを特徴とする。
【0012】
また、本発明は、複数人の文字による発話文が所定の属性付与が可能な単位にある複数の一発話文の連なりとして記録された文字発話記録を複数のセクションに分割し、各セクションに所定の属性を付与する属性付与装置であって、前記複数の一発話文に対してそれぞれを特徴付ける所定の属性を付与する発話文属性付与手段と、前記発話文属性付与手段によって付与された属性を参照して前記文字発話記録を複数のセクションに分割し、各セクションに対してそれぞれを特徴付ける所定の属性を付与するセクション属性付与手段と、を備えたことを特徴とする。
【0013】
また、本発明は、複数人の文字による発話文が所定の属性付与が可能な単位にある複数の一発話文の連なりとして記録された文字発話記録を複数のセクションに分割し、各セクションに所定の属性を付与する属性付与装置であって、前記複数の一発話文に対してそれぞれの発話者に基づく特徴を示す発話者属性を付与する発話者属性付与手段と、前記発話者属性付与手段によって付与された発話者属性を参照して前記文字発話記録を複数のセクションに分割し、各セクションに対して前記文字発話記録における各セクションの構造を示す構造属性を付与する構造属性付与手段と、前記複数の一発話文に対してそれぞれの発話行為に基づく特徴を示す発話行為属性を付与する発話行為属性付与手段と、前記構造属性付与手段によって各セクションに付与された構造属性、前記発話者属性付与手段によって各一発話文に付与された発話者属性および前記発話行為属性付与手段によって各一発話文に付与された発話行為属性を参照し、各セクションに対して各セクションの型を示す型属性を付与する型属性付与手段と、を備えたことを特徴とする。
【0014】
また、本発明は、複数人の文字による発話文が所定の属性を付与された複数のセクションに分割され、所定の属性を付与された複数の一発話文の連なりとして記録された文字発話記録から所定の文書を作成する文書作成装置であって、前記文字発話記録の各セクションに付与された所定の属性および各一発話文に付与された所定の属性を取得する属性取得手段と、前記属性取得手段によって取得された各セクションおよび各一発話文の属性に基づいて前記文書を作成する文書作成手段と、を備えたことを特徴とする。
【0015】
また、本発明は、複数人の文字による発話文が発話者ごとに時系列に組分け記録された文字発話記録を所定箇所にて結合または分割し、所定の属性付与が可能な単位にある複数の一発話文を順次取得する方法をコンピュータに実行させる発話文取得プログラムであって、前記一発話文の文末を特定するための文末ルールを参照し、前記文字発話記録の所定箇所を前記一発話文の文末として特定する文末特定工程と、各組の文末のうちで前記文末特定工程によって前記一発話文の文末として特定されなかった文末を当該組の後方に記録されている同一発話者の組の文頭と結合する結合工程と、前記文末特定工程によって前記一発話文の文末として特定された所定箇所にて前記文字発話記録を分割する分割工程と、をコンピュータに実行させることを特徴とする。
【0016】
また、本発明は、複数人の文字による発話文が所定の属性付与が可能な単位にある複数の一発話文の連なりとして記録された文字発話記録を複数のセクションに分割し、各セクションに所定の属性を付与する方法をコンピュータに実行させる属性付与プログラムであって、前記複数の一発話文に対してそれぞれを特徴付ける所定の属性を付与する発話文属性付与工程と、前記発話文属性付与工程によって付与された属性を参照して前記文字発話記録を複数のセクションに分割し、各セクションに対してそれぞれを特徴付ける所定の属性を付与するセクション属性付与工程と、をコンピュータに実行させることを特徴とする。
【0017】
また、本発明は、複数人の文字による発話文が所定の属性付与が可能な単位にある複数の一発話文の連なりとして記録された文字発話記録を複数のセクションに分割し、各セクションに所定の属性を付与する方法をコンピュータに実行させる属性付与プログラムであって、前記複数の一発話文に対してそれぞれの発話者に基づく特徴を示す発話者属性を付与する発話者属性付与工程と、前記発話者属性付与工程によって付与された発話者属性を参照して前記文字発話記録を複数のセクションに分割し、各セクションに対して前記文字発話記録における各セクションの構造を示す構造属性を付与する構造属性付与工程と、前記複数の一発話文に対してそれぞれの発話行為に基づく特徴を示す発話行為属性を付与する発話行為属性付与工程と、前記構造属性付与工程によって各セクションに付与された構造属性、前記発話者属性付与工程によって各一発話文に付与された発話者属性および前記発話行為属性付与工程によって各一発話文に付与された発話行為属性を参照し、各セクションに対して各セクションの型を示す型属性を付与する型属性付与工程と、をコンピュータに実行させることを特徴とする。
【0018】
また、本発明は、複数人の文字による発話文が所定の属性を付与された複数のセクションに分割され、所定の属性を付与された複数の一発話文の連なりとして記録された文字発話記録から所定の文書を作成する方法をコンピュータに実行させる文書作成プログラムであって、前記文字発話記録の各セクションに付与された所定の属性および各一発話文に付与された所定の属性を取得する属性取得工程と、前記属性取得工程によって取得された各セクションおよび各一発話文の属性に基づいて前記文書を作成する文書作成工程と、をコンピュータに実行させることを特徴とする。
【0019】
また、本発明は、所定の属性付与が可能な単位にある複数の一情報が当該単位とは無関係に組分けされてなる情報群を所定箇所にて結合または分割し、前記一情報をそれぞれ取得する情報処理方法であって、前記一情報の終端を特定するための終端ルールを参照し、前記情報群の所定箇所を前記一情報の終端として特定する終端特定工程と、各組の終端のうちで前記終端特定工程によって前記一情報の終端として特定されなかった終端を当該組の後方に記録されている同一情報源の組の先端と結合する結合工程と、前記終端特定工程によって前記一情報の終端として特定された所定箇所にて前記情報群を分割する分割工程と、を含んだことを特徴とする。
【0020】
また、本発明は、所定の属性付与が可能な単位にある複数の一情報からなる情報群を複数のセクションに分割し、各セクションに所定の属性を付与する情報処理方法であって、前記複数の一情報に対してそれぞれを特徴付ける所定の属性を付与する情報属性付与工程と、前記情報属性付与工程によって付与された属性を参照して前記情報群を複数のセクションに分割し、各セクションに対してそれぞれを特徴付ける所定の属性を付与するセクション属性付与工程と、を含んだことを特徴とする。
【0021】
また、本発明は、所定の属性付与が可能な単位にある複数の一情報からなる情報群を複数のセクションに分割し、各セクションに所定の属性を付与する情報処理方法であって、前記複数の一情報に対してそれぞれの情報源に基づく特徴を示す情報源属性を付与する情報源属性付与工程と、前記情報源属性付与工程によって付与された情報源属性を参照して前記情報群を複数のセクションに分割し、各セクションに対して前記情報群における各セクションの構造を示す構造属性を付与する構造属性付与工程と、前記複数の一情報に対してそれぞれの振る舞いに基づく特徴を示す行為属性を付与する行為属性付与工程と、前記構造属性付与工程によって各セクションに付与された構造属性、前記情報源属性付与工程によって各一情報に付与された情報源属性および前記行為属性付与工程によって各一情報に付与された行為属性を参照し、各セクションに対して各セクションの型を示す型属性を付与する型属性付与工程と、を含んだことを特徴とする。
【0022】
また、本発明は、所定の属性を付与された複数のセクションに分割され、所定の属性を付与された複数の一情報からなる情報群を加工する情報処理方法であって、前記情報群の各セクションに付与された所定の属性および各一情報に付与された所定の属性を取得する属性取得工程と、前記属性取得工程によって取得された各セクションおよび各一情報の属性に基づいて前記情報群を加工する情報加工工程と、を含んだことを特徴とする。
【0023】
【発明の実施の形態】
以下に添付図面を参照して、この発明に係る発話文取得装置、属性付与装置、文書作成装置、発話文取得プログラム、属性付与プログラム、文書作成プログラムおよび情報処理方法の好適な実施の形態を詳細に説明する。なお、以下においては、本実施の形態で用いる主要な用語を「0:用語の説明」として先ず最初に説明し、続いて本発明を着想する基礎となった研究の内容を「1:研究の内容」として説明した後に、本発明に係る実施の形態を「2:本実施の形態に係るチャットログ処理装置」として説明し、最後に種々の変形例を「3:他の実施の形態」として説明することとする。
【0024】
[0:用語の説明]
以下に、本実施の形態で用いる主要な用語を簡単に説明する。先ず最初に、本実施の形態で用いる「チャットログ」とは、図1に示すように、複数人の文字による発話文が発話者ごとに時系列に組分け記録(例えば、改行記録)された文字発話記録を言い、特許請求の範囲に記載の「文字発話記録」および「情報群」の一例である。なお、本実施の形態で用いる「文字」には、特記する場合を除いて図21(b)に示すような絵文字も含まれる。
【0025】
また、本実施の形態で用いる「一発話文」とは、図25に示すように、所定の属性(例えば、発話行為を表す最小単位であるアクト)付与が可能な単位にある一つの発話文を言い、特許請求の範囲に記載の「一情報」の一例である。なお、上記従来技術でも述べたように、質問や相槌、依頼などを単位とする発話行為、すなわちアクト(Dialogue Act)は一発話文の中に複数存在する場合もあるが、本実施の形態では、簡略したモデルを採用するため、発話文イコール発話行為(複数可能)として説明することとする。
【0026】
また、本実施の形態で用いる「アクト」とは、図30に示すように、例えば、質問・確認、同意・肯定など、各一発話文の発話行為に基づく特徴を示す属性を言い、特許請求の範囲に記載の「発話行為属性」および「行為属性」の一例である。さらに、本実施の形態で用いる「役割属性」とは、例えば、議長、事務局、参加者など、各一発話文の発話者に基づく特徴を示す属性を言い、特許請求の範囲に記載の「発話者属性」および「情報源属性」の一例である。
【0027】
また、本実施の形態で用いる「会議セクション」とは、どの会議にも存在し、かつ、局所(やりとり)・中位(話題)の談話構造より大きな内容単位を基準として、チャットログを分割することで得られる各セクションのことを言い、特許請求の範囲に記載の「セクション」の一例である。さらに、本実施の形態で用いる「会議セクション種別」とは、図29に示すように、例えば、開始の挨拶、レビュー実施宣言など、チャットログにおける各セクションの構造を示す属性を言い、特許請求の範囲に記載の「構造属性」の一例である。
【0028】
また、本実施の形態で用いる「会議タイプ」とは、図31に示すように、例えば、情報収集、情報共有など、各セクションの型を示す属性を言い、特許請求の範囲に記載の「型属性」の一例である。さらに、本実施の形態で用いる「手がかり表現」とは、図29〜図31や図36、図37に示すように、セクション分割や属性付与、発話文抽出などの処理に際して手がかりとなる特徴表現(属性の成員)を言い、特許請求の範囲に記載の「特定の表現」の一例である。
【0029】
[1:研究の内容]
まず最初に、本発明を着想する基礎となった研究の内容を説明するが、ここでは、以下に示すように、「1−1:研究の方針」、「1−2:領域分析の手順」、「1−3:領域分析の結果」、「1−4:議事録作成モデルの考案」および「1−5:議事録作成モデルの問題」に区分けして説明することとする。
【0030】
(1−1:研究の方針)
近年、徐々にではあるが、ビジネスの場においてチャットが利用されつつある。すなわち、チャットであれば、仕事場の離れた参加者同士が一つの会議室に集まることなく、ネットワークに接続されたPCを用いて、いつでもどこにいても会議に参加できることから、チャット会議システムを利用した会議も一般的になりつつある。そして、これに合わせて、チャット会議の結果得られるテキスト形式のチャットログから議事録を自動的に作れないかという提案の下に、本研究(チャット会議ログからの議事録自動生成)が始められることになった。
【0031】
ここで、「チャットログ」とは、図1に示すように、複数人の文字による発話文が発話者ごとに時系列に改行記録された文字発話記録である。そして、本研究に際して対象とする議事録フォームは、図2に示すように、ISO9001に準拠した社内標準文書が選ばれ、さらに、自動生成する議事録項目として決定事項、課題、宿題、今後の予定および討議内容が選ばれた。
【0032】
なお、以下では、本研究で考案した議事録作成モデルとして、談話の大局構造である会議構造と発話行為を表す最小単位(アクト)に着目した重要文抽出型モデルを説明するが、隣接ペアや情報交換単位などの談話の局所・中位構造を利用した要約型モデルへの本研究の適用も可能である。
【0033】
(1−2:領域分析の手順)
本研究では、会議の議事録作成という特殊性を考慮し、統計的な手法にいきなり持ち込むのではなく、図3に示すように、会議特有の談話構造およびその談話構造から議事録への知識マッピングの傾向を分析し、いくつかのパラメータ感度を調べた上で要約処理のモデル化を行うというアプローチを取った。すなわち、領域分析の戦略として、通常の会話分析の手法をとるのではなく、会議構造の分析に主眼を置くことにした。
【0034】
そして、まず最初に、領域分析のパラメータとして、会議タイプおよびコミュニケーションタイプの区分を定義し(図4および図5参照)、18件の業務上の会議がチャットにより行われた。続いて、その中から、会議の主催者が指定した仮説会議タイプを手がかりに、図6に示す実験会議をピックアップし、それぞれ議事録を入手した。そして、この7件のチャットログに対して、以下に説明するように、図7に示す分析の作業手順を実施した。
【0035】
最初に実施したのは、「発話文単位への整理」である。つまり、チャットは必ずしも一行一文単位で入力されているわけではないので、まずはチャットログを発話文単位(一発話文)に整理するという作業手順である。続いて実施したのは、「議事録へ抽出された発話文の特定」である。つまり、得られた発話文単位に対して、議事録へ抽出された発話文を特定し、議事録項目別にマーキングすると同時に、発話者の役割情報(議長またはメンバー)もマーキングするという作業手順である。
【0036】
次に実施したのは、「会議内容に基づくチャットログ分割」である。つまり、どの会議にも存在し、かつ、局所(やりとり)・中位(話題)の談話構造より大きな内容単位を基準として、チャットログを分割するという作業手順である。なお、以降では、この分割単位を「会議セクション」と呼ぶことにする。
【0037】
これに続いて実施したのは、「会議セクションへの情報付与」である。つまり、得られた会議セクションに図4に示した会議タイプおよび図5に示したコミュニケーションタイプの割当てを試みるという作業手順である。このような作業手順を経て、図8に示すように、チャットログは、一発話文ごとに整理された上で各発話文に役割情報が付与され、また、議事録へ抽出された発話文が特定され、さらに、セクションに分割された上で会議セクション(コミュニケーションタイプ)および会議タイプが付与される。
【0038】
そして、最後に実施したのは、「得られた情報に基づき分析実施」である。つまり、得られたデータ(図8参照)に基づき、会議特有の談話構造および議事録作成ノウハウを分析するという作業手順である。なお、この分析実施の結果については後記の「1−3:領域分析の結果」にて説明する。
【0039】
(1−3:領域分析の結果)
上記した分析を実施した結果、実験対象のチャットログ7件から図9に示す会議セクション種別のリストを抽出することができた。そして、この会議セクションに関して、「チャット会議は、複数の会議セクションを用いて構造化できる可能性がある」、「会議セクションの境界は、議長発話(手がかり表現)によって識別できる可能性が高い」、「会議セクション種別「テーマ実施」は、議長発話以外にテーマ(またはアジェンダ)内容に依存する場合がある」という作業仮説を得ることができた。
【0040】
続いて、分割した会議セクションに上記した会議タイプとコミュニケーションタイプを割当てた結果、図10に示す関係を抽出することができた。そして、この抽出により、「コミュニケーションタイプ毎の対話のやりとりパタンを定義できれば、特定の会議セクションの会議タイプを推論できる可能性がある」、「コミュニケーションタイプは概念的に図5に示すように表現可能なことから、発話文にアクト(Dialogue Act)を割当て、アクトの出現パタンとして定義できるのではないか」という作業仮説を得ることができた。
【0041】
また、会議セクションに割当てられた会議タイプ毎に、議事録の討議内容として抽出された議長発話文の割合を求めたところ、図11に示すように、情報収集、決議の約80%、定例報告の59%が議長発話文であった。そして、この分析結果から、「会議セクション毎の会議タイプ自動判定が可能であれば、会議タイプと議長発話を手がかりにして、会議セクション毎に、議事録への発話文抽出を制御できる可能性がある」との作業仮説を得ることができた。さらに、役割情報以外にも、会議セクション、会議タイプ、テーマ依存性、手がかり表現をパラメータとして議事録作成ノウハウを調べた結果、図12および図13に示すような分析結果を得ることができた。
【0042】
そして、以上の領域分析結果として、図14(a)に示すような会議特有の談話構造を得るとともに、同図(b)に示すような知識マッピングを得ることができた。つまり、「会議の大局構造と会議セクションの組み合わせには対応関係があること」、「会議セクションと会議タイプには対応関係があること」、「会議タイプとコミュニケーションタイプの組み合わせには対応関係があること」、「コミュニケーションタイプとアクト、役割の出現パタンには対応関係があること」、「アクトと手がかり表現には対応関係があること」、「議事録項目毎の抽出文は、会議セクション、会議タイプ、役割、アクト、手がかり表現(テーマ=話題語)というパラメータでルール化できること」という領域分析結果である。
【0043】
(1−4:議事録作成モデルの考案)
上述した領域分析結果に基づき、チャットログから議事録項目への知識マッピングの形式化を行い、そのマッピング関係の自動構築をコアアルゴリズムとする図15に示す議事録作成モデルを考案した。このモデルはいくつかの仮説を組み合わせた重要文抽出型モデルであるが、以下にその処理概要を説明する。
【0044】
この議事録作成モデルでは、まず最初に、チャットログを発話文単位に分割する一発話文取得処理を行うとともに、フィラー等削除、非文削除、文末修正等の文整形処理を行う。すなわち、議事録作成に伴うテキスト処理が適用可能な状態へチャットログを持っていく処理である。
【0045】
続いて、一発話文取得処理によって一発話文ごとに分割されたチャットログに所定の属性を付与する属性付与処理を行う。すなわち、議長・メンバー情報に基づいて各発話文に役割属性情報を付与し、会議セクション種別付与用リソースに基づいてチャットログを複数の会議セクションに分割しつつ各会議セクションに会議セクション種別を付与し、アクト付与リソースに基づいて各発話文にアクトを付与し、会議用タイプ付与用リソースに基づいて各会議セクションに会議タイプを付与する。
【0046】
そして最後に、属性付与処理によって種々の属性が付与されたチャットログに基づいて議事録を作成する議事録作成処理を行う。すなわち、重要発話文抽出リソースに基づいてチャットログから議事録項目毎に重要発話文を抽出して議事録を作成する。
【0047】
(1−5:議事録作成モデルの問題)
上述してきたように、本研究では、一発話文取得処理、属性付与処理および議事録作成処理という3つの処理を経て、チャットログから議事録を作成するモデルを考案した。しかしながら、この議事録作成モデルを構築することはチャット特有の特徴から必ずしも容易ではなかった。すなわち、本モデルでは、チャットログを発話文単位に分割する一発話文取得処理の成功が議事録作成の大前提となるが、以下に述べるようなチャット特有の特徴が処理の妨げとなった。
【0048】
チャットログには、図16に示すように、一発話文に関する特徴、文字入力に関する特徴、自然な発話に関する特徴がある。それぞれを簡単に説明すると、一発話文に関する特徴として、チャットログでは、一行で一発話文(発話行為を表す最小単位であるアクト付与が可能な単位)となる場合だけでなく、一行に複数の一発話文が存在する場合や、同じ話者による連続する複数行で一発話文となる(発話文が途中で改行されている)場合、同じ話者による連続しない複数行で一発話文となる(文途中の改行が複数話者で交互に行われ、他の話者の発話が挿入されている)場合などもある。このため、チャットログから一発話文を順次取得することは必ずしも容易でなかった。
【0049】
また、文字入力に関する特徴として、チャットログには、相手話者名指定(>氏名)、括弧、比較的自由な句読点、顔文字、笑いマーク、日時表示、矢印、http/メールアドレス、計算式、資料形式入力など、特殊な文字表現が登場する場合も多く、これも一発話文取得処理の妨げになった。さらに、自然な発話に関する特徴として、チャットログには、書き言葉だけでなく話し言葉の特徴、さらには二つの言葉が混在したものが登場することがあり、この特徴も一発話文取得処理の妨げになっていた。
【0050】
そこで、このようなチャット特有の特徴に対応して、チャットログから自動的に発話文を一文ずつ取得することができ、さらに、チャットログから自動的に議事録を作成することもできる発明(なお、詳細は「2:本実施の形態に係るチャットログ処理装置」として以下に説明する。)を着想するに至った。
【0051】
[2:本実施の形態に係るチャットログ処理装置]
次に、本発明に係る発話文取得装置、属性付与装置、文書作成装置、発話文取得プログラム、属性付与プログラム、文書作成プログラムおよび情報処理方法の好適な実施の形態として、本実施の形態に係るチャットログ処理装置を説明する。なお、ここでは、以下に示すように、「2−1:チャットログ処理装置の概略および主たる特徴」、「2−2:発話文取得部の構成」、「2−3:発話文取得処理の手順」、「2−4:発話文取得処理の効果等」、「2−5:属性付与部の構成」、「2−6:属性付与処理の手順」、「2−7:属性付与処理の効果等」、「2−8:議事録作成部の構成および処理手順」、「2−9:議事録作成処理の効果等」に区分けして説明することとする。
【0052】
(2−1:チャットログ処理装置の概略および主たる特徴)
図17は、チャットログ処理装置の概略構成を示すブロック図であり、図18および図19は、チャットログ処理装置の概略処理を説明するための図である。図17に示すように、本実施の形態に係るチャットログ処理装置10は、入力部11と、出力部12と、入出力制御IF部13と、発話文取得部20と、属性付与部30と、議事録作成部40とから構成される。
【0053】
このチャットログ処理装置10は、概略的に、チャットログ(図1参照)から議事録(図38参照)を作成する装置であり、発話文取得部20が、複数の一発話文が所定の属性付与単位とは無関係に記録されているチャットログから一発話文を順次取得する点、属性付与部30が、一発話文ごとに分割されたチャットログを複数のセクションに分割しつつ各セクションに対してチャットログ構造に適合した所定の属性を付与する点、議事録作成部40が、複数のセクションに分割されて所定の属性がそれぞれ付与されたチャットログから所望の議事録を作成する点に主たる特徴がある。以下に、この主たる特徴を簡単に説明する。
【0054】
チャットログは、図18(a)に示すように、複数人の文字による発話文が発話者ごとに時系列に改行記録されて構成される。すなわち、複数の一発話文がアクト付与単位(発話行為を表す最小単位であるアクトの付与が可能な単位)とは無関係に改行され、一行で一発話文となる場合だけでなく、一行に複数の一発話文が存在する場合や、発話文が途中で改行されている場合、文途中で他の話者の発話が挿入されている場合などもある。
【0055】
そこで、発話文取得部20では、一発話文の文末を特定するための文末ルール(図22参照)を参照し、チャットログの所定箇所を一発話文の文末として特定し、各行の文末のうちで一発話文の文末として特定されなかった文末を当該行の後方に記録されている同一発話者の行の文頭と結合するとともに、一発話文の文末として特定された所定箇所にてチャットログを分割するようにしている。
【0056】
したがって、図18(b)に示すように、複数の一発話文がアクト付与単位とは無関係に記録されているチャットログから一発話文を順次取得することが可能になり、後述するように、各一発話文に役割属性やアクトを付与したり、一発話文を議事録項目として抽出するなど、チャットログを一発話文単位で確実に処理することも可能になる。
【0057】
また、チャットログには、相手話者名指定(>氏名)、括弧、比較的自由な句読点、顔文字、笑いマーク、日時表示、矢印、http/メールアドレス、計算式、資料形式入力などの特殊な文字表現や、さらに、話し言葉と書き言葉の変形表現が登場する場合も多く、一発話文を順次取得する際の妨げになっていた。
【0058】
そこで、発話文取得部20では、このようなチャットログに登場し得る特定表現と当該特定表現の変換後の統制された表現とを対応付けた変換ルール(図21参照)を参照し、チャットログ内の特定表現を統制された表現に変換し、かかる変換後のチャットログに対して一発話文の文末特定を行うようにもしている。したがって、一発話文を取得する際の妨げとなる特定表現をチャットログから排除することができ、一発話文を確実に取得することが可能になる。
【0059】
また、チャットログ処理装置10の属性付与部30では、発話文取得部20によって一発話文ごとに分割されたチャットログの各一発話文に対して役割属性(例えば、議長、事務局、参加者など、発話者に基づく特徴を示す発話者属性)を付与するとともに、この役割属性を参照してチャットログを複数のセクションに分割し、各セクションに対して会議セクション種別(例えば、開始の挨拶、レビュー実施宣言など、チャットログにおける各セクションの構造を示す構造属性)を付与するようにしている。
【0060】
したがって、図19(c)に示すように、一発話文ごとに分割されたチャットログを複数のセクションに分割しつつ各セクションに対してチャットログ構造に適合した所定の属性を付与することが可能になり、さらに、後述するように、各セクションに会議タイプを付与したり、各セクションに付与された属性に基づいて所望の議事録を作成するなど、チャットログ構造に適合したセクション単位でチャットログを処理することも可能になる。
【0061】
また、属性付与部30では、各一発話文に対してアクト(例えば、質問・確認、同意・肯定など、各発話文の発話行為に基づく特徴を示す発話行為属性)を付与するとともに、各セクションに付与された会議セクション種別、各一発話文に付与された役割属性およびアクトを参照し、各セクションに対して会議タイプ(例えば、情報収集、情報共有など、各セクションの型を示す型属性)を付与するようにもしている。
【0062】
したがって、図19(c)に示すように、各セクションに対してチャットログ構造に一層適合した所定の属性を付与することが可能になり、さらに、後述するように、各セクションに付与された属性や各一発話文に付与されたアクトに基づいて一層所望の議事録を作成するなど、チャットログ構造に適合したセクション単位でチャットログを処理することも可能になる。
【0063】
また、チャットログ処理装置10の議事録作成部40では、属性付与部30によって各セクションおよび各一発話文に所定の属性が付与されたチャットログについて、この各セクションおよび各一発話文の属性に基づいて議事録を作成するようにしている。より詳細には、各セクションおよび一発話文に付与され得る属性に対応付けてチャットログから抽出する一発話文が規定されたルールを参照し、当該ルールに規定された属性が付与されているセクションのなかから当該ルールに規定された属性が付与されている一発話文を抽出することによって議事録を作成するようにしている。
【0064】
したがって、複数のセクションに分割されて所定の属性がそれぞれ付与されたチャットログから所望の議事録を自動的に作成することが可能になる。より詳細には、図19(d)に示すように、チャットログから決定事項、宿題、今後の課題などの議事録項目に対応する発話文を抽出することができ、かかる議事録項目をフォームに備える議事録を自動的に作成することが可能になる。
【0065】
なお、チャットログ処理装置10において、入力部11は、各種の情報の入力を外部から受付ける入力手段であり、出力部12は、各種の情報を外部へ出力する出力手段であり、入出力制御IF部13は、これら入力部11および出力部12によるデータの入出力や、発話文取得部20、属性付与部30および議事録作成部40の間におけるデータの入出力を制御する制御手段である。
【0066】
具体的には、これらの入力部11および出力部12は、キーボードやマウス、マイク、モニタ、スピーカなどのユーザインターフェースの他に、記録媒体による入出力を受け付ける媒体用インターフェースや、ネットワーク(図示せず)を介した入出力を受け付ける通信用インターフェースを備えて構成され、チャットログの入力や、議事録の出力、チャットログ処理装置10内の各種ルールの入力などを行う。
【0067】
なお、このチャットログ処理装置10は、既知のパーソナルコンピュータ、ワークステーション、PHS端末、携帯端末、移動体通信端末またはPDAなどの情報処理装置に、上記した発話文取得部20、属性付与部30および議事録作成部40の各機能を搭載することによって実現することもできる。
【0068】
(2−2:発話文取得部の構成)
次に、図17に示した発話文取得部20の構成を説明する。図20は、発話文取得部20の構成を示すブロック図である。同図において、発話文取得部20の記憶部21は、制御部22による各種処理に必要なデータおよびプログラムを格納する格納手段(記憶手段)であり、機能的に、チャットログメモリ21aと、一時メモリ21bと、取得後メモリ21cとを備えて構成される。
【0069】
このうち、チャットログメモリ21aは、一発話文取得処理前のチャットログ(図23および図24参照)を記憶するメモリであり、取得後メモリ21cは、一発話文取得処理後のチャットログ(図25および図26参照)を記憶するメモリであり、一時メモリ21bは、処理途中のデータを記憶するメモリである。
【0070】
つまり、一発話文取得処理では、チャットログから一行ずつ発話文を分割して切り出した後、これを同一発話者の後続の行文頭と結合したりしながら一発話文の文末を特定し、この特定した文末でチャットログを分割しているが、この最初の切り出しから最後の分割までの間、各行の発話文を発話者毎に記憶管理するのが一時メモリ21bである。
【0071】
また、図20において、発話文取得部20の制御部22は、OS(Operating System)などの制御プログラム、各種の処理手順などを規定したプログラムおよび所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する処理部であり、機能的に、変換部23と、文末特定部24と、分割部25と、結合部26とを備えて構成される。
【0072】
このうち、変換部23は、チャットログに登場し得る特定表現と当該特定表現の変換後の統制された表現とを対応付けた変換ルール23aを参照し、チャットログに登場する特定表現を統制された表現に変換する変換手段である。具体的には、この変換ルール23aは、図21(a)および(b)に示すように、話者指定、自由な句読点、顔文字、笑いマーク、サイズ、感動詞、フィラー、接続詞、変形表現などについて、その変換対象と変換後表現とを対応付けて構成されるものであり、例えば、話者指定などは、後述する文末特定処理の便宜のために、後述する文末ルール24aに規定された文字列と同様の文字列「。」が規定されている。
【0073】
文末特定部24は、一発話文の文末を特定するための文末ルール24aを参照し、チャットログの所定箇所を一発話文の文末として特定する文末特定手段である。具体的には、この文末ルール24aは、図22に示すように、チャットログの行末に登場し一発話文の文末になり得る文字列を規定した「行末特定ルール」と、チャットログの行頭から行末の間に登場し一発話文の文末になり得る文字列を規定した「行内特定ルール」と、チャットログの行頭から文末に至る一文として一発話文の文頭および文末となり得る文字列の組み合わせを規定した「一行特定ルール(略語ルールを除く)」と、チャットログの行頭から行末に至る一文字列として一発話文となり得る文字列を規定した「一行特定ルール(略語ルール)」と、チャットログの行頭に登場し一発話文の文頭となり得る文字列を規定した「行接続関係に基づく前文特定ルール」と、所定の組同士の発話間隔を規定した「発話間隔に基づく前文特定ルール」とから構成される。
【0074】
そして、文末特定部24は、これらの文末ルール24aを参照し、例えば、チャットログの各行末のうちで「行末特定ルール」に規定された文字列が存在する行末を一発話文の文末として特定し、また、各行の行頭から行末の間で「行内特定ルール」に規定された文字列が存在する箇所を一発話文の文末として特定し、また、「一行特定ルール(略語ルールを除く)」に規定された文字列の組み合わせが一文として行頭および行末に存在する行の当該行末を一発話文の文末として特定し、また、「一行特定ルール(略語ルール)」に規定された文字列が一文字列として行頭から行末に至っている行の行末を一発話文の文末として特定し、また、「行接続関係に基づく前文特定ルール」に規定された文字列が行頭に存在する行の前方に記録されている同一発話者の行の行末を一発話文の文末として特定し、さらに、所定の行と行との間の発話間隔が「発話間隔に基づく前文特定ルール」に規定された発話間隔を超える場合に、前の行の行末を一発話文の文末として特定する。
【0075】
分割部25は、文末特定部24によって一発話文の文末として特定された所定箇所にてチャットログを分割する分割手段である。具体的には、上記した一時メモリ21bに記憶されたチャットログの一部について文末が特定された場合に、分割部25は、かかる特定された文末にてチャットログを分割しつつ取得後メモリ21cに格納する。
【0076】
結合部26は、チャットログの各行の行末のうちで文末特定部24によって一発話文の文末として特定されなかった文末と、当該行の後方に記録されている同一発話者の行の行頭とを結合する結合手段である。具体的には、チャットログは一発話文取得処理において一行ずつ分割されて発話者毎の一時メモリ21bに格納されて処理されるが、結合部26は、一発話文が途中で改行されている場合の同一話者の各行同士や、一発話文の途中で他の話者の発話が挿入されている場合の同一話者の各行同士を一時メモリ21b内で結合する。
【0077】
(2−3:発話文取得処理の手順)
次に、上記のように構成される発話文取得部20による発話文取得処理の手順を説明する。図27は、発話文取得処理を示すフローチャートである。同図に示すように、発話文取得部20は、チャットログメモリ21aに格納されたチャットログから一行ずつ発話文を取得し、該当する発話者の一時メモリ21bに格納する(ステップS2701)。
【0078】
続いて、変換部23は、変換ルール23aを参照し、ステップS2701において一時メモリ21bに格納されたばかりの発話文(以下、この一行の発話文を現在文と言う。)に存在する特定表現を統制された表現に変換する(ステップS2702)。なお、図27には明示していないが、かかる変換処理に合わせて、現在文から発話時刻、発話者、相手発話者に関する情報が抽出される。
【0079】
そして、現在文が格納された一時メモリ21bに前文(未だ文末が特定されていない同一発話者の発話文)が既に格納されている場合には(ステップS2703肯定)、文末特定部24は、現在文と前文との間の発話間隔が「発話間隔に基づく前文特定ルール」に規定された発話間隔を超える否か、さらには、「行接続関係に基づく前文特定ルール」に規定された文字列が現在文の行頭に存在するか否かを判定する(ステップS2704および2705)。
【0080】
この判定により、前文の行末が一発話文の文末として特定されなかった場合には(ステップS2704否定、かつ、ステップS2705否定)、結合部26は、前文の行末と現在文の行頭とを一時メモリ21b内で結合する(ステップS2709)。なお、結合後は前文も含んで「現在文」として処理される(ステップS2712〜2715)。
【0081】
これとは反対に、前文の行末が一発話文の文末として特定された場合には(ステップS2704肯定、または、ステップS2705肯定)、前文と現在文との結合は行われず、前文の分割処理が行われた後に(ステップS2706〜2708)、現在文の分割処理が行われる(同図A参照)。すなわち、この場合、文末特定部24は、一時メモリ21bに格納されている前文について、「行内特定ルール」に規定された文字列が存在する箇所を一発話文の文末として特定する(ステップS2706)。
【0082】
そして、前文の行内でも文末が特定できた場合には(ステップS2706肯定)、分割部25は、かかる特定された文末にて前文を分割しつつ取得後メモリ21cに格納する(ステップS2707)。一方、前文の行内では文末が特定できなかった場合には(ステップS2706否定)、分割部25は、前文をそのまま一時メモリ21bから取り出して取得後メモリ21cに格納する(ステップS2708)。なお、ステップS2707および2708による処理を経ることで、一時メモリ21bには現在文のみが格納されている状態となる。
【0083】
ここで、ステップS2707による処理の説明に戻ると、現在文が格納された一時メモリ21bに前文が格納されていない場合には(ステップS2703肯定または同図A)、文末特定部24は、現在文が「一行特定ルール(略語ルールを除く)」に規定された文字列の組み合わせまたは「一行特定ルール(略語ルール)」に規定された文字列であるか否かを判定する(ステップS2710)。
【0084】
この判定により、現在文の行末を一行の発話文の文末として特定できた場合には(ステップS2710肯定)、分割部25は、現在文をそのまま一時メモリ21bから取り出して取得後メモリ21cに格納する(ステップS2711)。そして、チャットログメモリ21aに格納されたチャットログの全ての行について処理を行っている場合には(ステップS2716肯定)、発話文取得処理を終了し、そうでない場合には(ステップS2716否定)、ステップS2701に戻って、現在文の次に記録されている行について処理を開始する。
【0085】
一方、ステップS2710の判定において現在文の行末を一行の発話文の文末として特定できた場合(ステップS2710肯定)や、ステップS2709を経て現在文が前文と結合された場合には、文末特定部24は、現在文の行末が「行末特定ルール」に規定された文字列であるか否かを判定する(ステップS2712)。そして、現在文の行末を文末として特定できなかった場合には(ステップS2712否定)、現在文を一時メモリ21bに格納した状態で、ステップS2701に戻り、現在文の次に記録されている行について処理を開始する。
【0086】
これとは反対に、現在文の行末を文末として特定できた場合には(ステップS2712肯定)、文末特定部24は、一時メモリ21bに格納されている現在文について、「行内特定ルール」に規定された文字列が存在する箇所を一発話文の文末として特定する(ステップS2713)。
【0087】
そして、現在文の行内でも文末が特定できた場合には(ステップS2713肯定)、分割部25は、かかる特定された文末にて現在文を分割しつつ取得後メモリ21cに格納する(ステップS2714)。一方、現在文の行内では文末が特定できなかった場合には(ステップS2713否定)、分割部25は、現在文をそのまま一時メモリ21bから取り出して取得後メモリ21cに格納する(ステップS2715)。
【0088】
続いて、かかるステップS2714または2715の処理の後、チャットログメモリ21aに格納されたチャットログの全ての行について処理を行っている場合には(ステップS2716肯定)、発話文取得処理を終了し、そうでない場合には(ステップS2716否定)、ステップS2701に戻って、現在文の次に記録されている行について処理を開始する。
【0089】
(2−4:発話文取得処理の効果等)
上述してきたように、発話文取得部20では、文末ルール24aを参照し、チャットログの所定箇所を一発話文の文末として特定するとともに、各行の文末のうちで一発話文の文末として特定されなかった文末を当該行の後方に記録されている同一発話者の行の文頭と結合し、一発話文の文末として特定された所定箇所にてチャットログを分割する。したがって、複数の一発話文がアクト付与単位とは無関係に記録されているチャットログ(図23および図24参照)から、一発話文ごとに分割整理されたチャットログ(図25および図26参照)を得ることが可能になる。この結果、各一発話文に役割属性やアクトを付与したり、一発話文を議事録項目として抽出するなど、チャットログを一発話文単位で確実に処理することも可能になる。そして、かかる発話文取得処理によって、多人数の話者による不規則で、一見複雑に見えるチャットログから、適切に発話文単位を取得することも可能になる。
【0090】
また、発話文取得部20では、チャットログの行末に登場し一発話文の文末になり得る文字列を「行末特定ルール」として規定し、チャットログの各行末のうちで「行末特定ルール」に規定された文字列が存在する行末を一発話文の文末として特定する。したがって、各行の行末でチャットログを分割するのか結合するのかを確実に判定することが可能になる。
【0091】
また、発話文取得部20では、チャットログの行頭から行末の間に登場し一発話文の文末になり得る文字列を「行内特定ルール」として規定し、各行の行頭から行末の間で「行内特定ルール」に規定された文字列が存在する箇所を一発話文の文末として特定する。したがって、一行に複数の一発話文が存在する場合でも確実に一発話文を取得することが可能になる。
【0092】
また、発話文取得部20では、チャットログの行頭から文末に至る一文として一発話文の文頭および文末となり得る文字列の組み合わせを「一行特定ルール(略語ルールを除く)」として規定し、「一行特定ルール(略語ルールを除く)」に規定された文字列の組み合わせが一文として行頭および行末に存在する行の当該行末を一発話文の文末として特定する。したがって、ドキュメントとしての特徴を備えた一発話文(例えば、日時表示、計算式、httpアドレス、メールアドレスなど)などがチャットログに存在する場合でも、かかる一発話文を確実に取得することが可能になる。
【0093】
また、発話文取得部20では、チャットログの行頭から行末に至る一文字列として一発話文となり得る文字列を「一行特定ルール(略語ルール)」として規定し、「一行特定ルール(略語ルール)」に規定された文字列が一文字列として行頭から行末に至っている行の行末を一発話文の文末として特定する。したがって、文字対話としての特徴を備える一発話文(例えば、OK、NGといった略語など)がチャットログに存在する場合でも、かかる一発話文を確実に取得することが可能になる。
【0094】
また、発話文取得部20では、チャットログの行頭に登場し一発話文の文頭となり得る文字列を「行接続関係に基づく前文特定ルール」として規定し、「行接続関係に基づく前文特定ルール」に規定された文字列が行頭に存在する行の前方に記録されている同一発話者の行の行末を一発話文の文末として特定する。したがって、上記の「行末特定ルール」や「一行特定ルール」によって文末として特定されなかった行末を備える一発話文であっても、後続との関係から遡って一発話文として取得することが可能になる。
【0095】
また、発話文取得部20では、所定の組同士の発話間隔を「発話間隔に基づく前文特定ルール」として規定し、所定の行と行との間の発話間隔が「発話間隔に基づく前文特定ルール」に規定された発話間隔を超える場合に、前の行の文末を一発話文の文末として特定する。したがって、離席などによって一発話文の入力が途中で終ったような場合でも、これが他の発話文と結合されることを回避することが可能になる。
【0096】
また、発話文取得部20では、チャットログに登場し得る特定表現と当該特定表現の変換後の統制された表現とを対応付けた変換ルール23aを参照し、チャットログに登場する特定表現を統制された表現に変換し、かかる変換後のチャットログについて一発話文の文末特定を行う。したがって、一発話文を取得する際の妨げとなる特定表現をチャットログから排除することができ、一発話文を確実に取得することが可能になる。
【0097】
また、発話文取得部20では、変換後の統制された表現として文末ルール24aに規定された文字列と同様の文字列を変換ルール23aとして規定する。したがって、チャットログ内の特定表現を一発話文の文末特定に役立つ統制された表現に変換することができ、チャットログから一発話文を確実に取得することが可能になる。
【0098】
ところで、発話文取得部20では、特定表現の変換を行った後に一発話文の文末特定を行うこととしたが、本発明はこれに限定されるものではなく、一発話文の文末特定を行った後に特定表現の変換を行うようにしてもよい。ただし、この場合には、文末ルール24aに規定される各ルールも、変換処理前のチャットログに登場する特定表現を想定したものとなる。なお、特定表現は変換しないで、一発話文の文末特定のみを行うようにしてもよい。
【0099】
また、発話文取得部20では、図27に示した手順で発話文取得処理を行うこととしたが、本発明はこれに限定されるものではなく、かかる処理の順序は任意であり、例えば、各種の判定処理を並列的に行うことによって一発話文の文末を高速に特定するようにしてもよい。
【0100】
(2−5:属性付与部の構成)
次に、図17に示した属性付与部30の構成を説明する。図28は、属性付与部30の構成を示すブロック図である。同図において、属性付与部30の記憶部31は、制御部32による各種処理に必要なデータおよびプログラムを格納する格納手段(記憶手段)であり、具体的には、発話文取得部20による発話文取得処理後のチャットログや、属性付与部30による属性付与処理途中のチャットログ、さらには、この属性付与処理後のチャットログなどを記憶する。
【0101】
また、図28において、属性付与部30の制御部32は、OS(Operating System)などの制御プログラム、各種の処理手順などを規定したプログラムおよび所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する処理部であり、機能的に、役割属性付与部33と、会議セクション種別付与部34と、アクト付与部35と、会議タイプ付与部36とを備えて構成される。
【0102】
このうち、役割属性付与部33は、役割属性付与ルール33aを参照して、発話文取得部20によって一発話文ごとに分割されたチャットログの各一発話文に対して役割属性(例えば、議長、事務局、参加者など、発話者に基づく特徴を示す発話者属性)を付与する発話者属性付与手段である。具体的には、チャットログ内にチャットプロトコルとしてメンバー情報(チャットログに登場する各発話者と、議長、事務局、参加者などの役割属性とを対応付けた情報)を予め記録させておき、この議長・メンバー情報を抽出した後に、役割属性付与ルール33aを参照して各一発話文にそれぞれ対応する役割属性を付与する。
【0103】
なお、このメンバー情報をチャットログに予め記録させるのではなく、入力部11を介して属性付与部30に別途入力させるようにしてもよく、さらには、かかるメンバー情報を予め記録したり別途入力させるのではなく、チャットログの解析によって役割属性付与部33がメンバー情報を自動的に導き出し(どの発話者が議長であるか等をチャットログ解析で導き出し)、これを用いて役割属性を付与するようにしてもよい。つまり、この役割属性についてのメンバー情報がチャットログに存在しない場合は、議長が発言する可能性がある手がかり表現に基づき、メンバーのなかから最も議長としてふさわしい発言をしている人を自動推定する。なお、この手がかり表現としては、図29(b)に示す会議セクション特有の表現を用いる。
【0104】
会議セクション種別付与部34は、役割属性付与部33によって付与された役割属性および会議セクション種別付与ルール34aを参照し、チャットログを複数のセクションに分割しつつ各セクションに対して会議セクション種別(例えば、開始の挨拶、レビュー実施宣言など、チャットログにおける各セクションの構造を示す構造属性)を付与する構造属性付与手段である。
【0105】
具体的には、この会議セクション識別付与ルール34aは、図29(b)に示すように、会議セクション種別(同図(a)参照)ごとに「議長」の手がかり表現を対応付けて規定したものである。そして、会議セクション種別付与部34は、「議長」の役割属性が付与された一発話文のなかに手がかり表現が存在するか否かをチェックし、手がかり表現が存在する場合には、その一発話文を境にしてチャットログをセクションに分割するとともに、手がかり表現に対応した会議セクション種別を付与する。
【0106】
また、会議セクション種別付与部34は、会議セクション識別付与ルール34aを参照し、各セクションに付与された会議セクション種別の連接関係、重複関係または前後関係に基づいて、各セクションの会議セクション種別を修正する構造属性修正手段でもある。つまり、図29(b)に示したルールに基づくと、各セクションに複数の会議セクション種別が誤って付与されることがあるため、誤って重複付与された会議セクション種別を削除して、一つのセクションには一つの会議セクション種別が付与されている状態に修正する趣旨である。
【0107】
具体的には、会議セクション識別付与ルール34aには、図29(c)に示すように、会議セクション連鎖構造ルールとして、会議セクション種別(同図(a)参照)の組み合わせごとに修正条件および修正内容が規定される。なお、同図において、「+」は前後連接関係を示し、「&」は重複関係を示し、「:」は離れた前後関係を示し、「(数字)」は削除すべき会議セクション種別を示し、「1」であればルールで指定した前方、「2」であれば後方の会議セクションを削除する。
【0108】
そして、会議セクション種別付与部34は、かかる会議セクション識別付与ルール34aに規定された修正条件を具備する会議セクション種別の組み合わせを検出して、いずれかの会議セクション種別を削除する。つまり、図29(c)の例で言えば、「テーマ実施(報告指示)」および「開始の挨拶」という会議セクション種別が前後に連接するセクション間で付与されている場合には、「テーマ実施(報告指示)」の後に「開始の挨拶」が行われるのは一般的でないため、後のセクションに付与されている「開始の挨拶」は誤って付与されたものとして削除する。
【0109】
図28の説明に戻ると、アクト付与部35は、アクト付与ルール35aを参照して、各一発話文に対してアクト(例えば、質問・確認、同意・肯定など、各発話文の発話行為に基づく特徴を示す発話行為属性)を付与する発話行為属性付与手段である。具体的には、このアクト付与ルール35aは、図30(b)に示すように、アクト(同図(a)参照)ごとに手がかり表現を対応付けて規定したものである。なお、同図において、「*」は任意の文字列を示し、「^」は一発話文の文頭を示し、「$」は一発話文の文末を示す。
【0110】
そして、アクト付与部35は、各一発話文のなかにルールに規定する手がかり表現がルールに規定する態様で存在するか否かをチェックし、対応するアクトを各一発話文に対して付与する。なお、このアクトは、一つの一発話文に対して複数付与されることもある。
【0111】
会議タイプ付与部36は、会議タイプ付与ルール36aを参照するとともに、各セクションに付与された会議セクション種別、各一発話文に付与された役割属性およびアクトを参照し、各セクションに対して会議タイプ(例えば、情報収集、情報共有など、各セクションの型を示す型属性)を付与する型属性付与手段である。
【0112】
具体的には、この会議タイプ付与ルール36aは、図31(b)に示すように、会議タイプ(同図(a)参照)ごとに、役割属性、会議セクション種別およびアクトを対応付けて規定したものである。ここで、同図において、「(数字)」は一発話文の数を示し、「M(メンバー)、H(ホスト)、O(オーナー)」は役割属性を示す。なお、ホストは事務局とも呼ばれ、オーナーは議長とも呼ばれる。
【0113】
つまり、例えば、会議タイプ「情報収集」が付与されるためには、会議セクション種別「開始の挨拶」または「テーマの実施(開始)」が付与されたセクションにおいて、役割属性「メンバー」およびアクト「undef」を付与された7つの一発話文が存在することが条件となる。そして、会議タイプ付与部36は、このような会議タイプ付与ルール36aに規定された条件を各セクションが満たすか否かをチェックし、条件を満たす場合には、その条件に対応した会議タイプを付与する。なお、会議タイプ付与は、その会議タイプの典型的なコミュニケーションタイプをルールとして表現したものであり、発話数、アクト、役割情報、発話の連続性(発話数に+があれば連続発話)、同一話者のみの発話列か(役割情報のO、H、Mに+があれば同一話者のみ)によりルールは構成される。また、否定ルール(図31(b)のルールの先頭に!が付けられているもの)とマッチすれば、その会議タイプは割当てられない。
【0114】
また、会議タイプ付与部36は、会議タイプ付与ルール36aを参照し、各セクションに付与された会議タイプの重複関係に基づいて、各セクションの会議タイプを修正する型属性修正手段でもある。つまり、上記した会議セクション種別付与部34と同様の趣旨から、誤って重複付与された会議タイプを削除して、一つのセクションには一つの会議タイプが付与されている状態に修正する。
【0115】
具体的には、会議タイプ付与ルール36aには、図31(c)に示すように、会議タイプ排他ルールとして、会議タイプ(同図(a)参照)の組み合わせごとに修正条件および修正内容が規定される。なお、同図において、「&」は重複関係を示し、「(数字)」は削除すべき会議タイプ種別を示す。
【0116】
そして、会議タイプ付与部36は、かかる会議タイプ付与ルール36aに規定された修正条件を具備する会議タイプの組み合わせを検出して、いずれかの会議タイプを削除する。つまり、図31(c)の例で言えば、「情報収集」および「決議」という会議タイプが同一のセクションに重複付与されている場合には、「決議」と「情報収集」が一緒に行われることは一般的でないため、「情報収集」は誤って付与されたものとして削除する。
【0117】
(2−6:属性付与処理の手順)
次に、上記したように構成される属性付与部30による属性付与処理の手順を説明する。図32は、属性付与処理を示すフローチャートである。同図に示すように、属性付与部30において、役割属性付与部33は、役割属性付与ルール33aを参照して、発話文取得部20によって一発話文ごとに分割されたチャットログ(図33(a)参照)の各一発話文に対して役割属性を付与する(ステップS3201)。これにより、一発話文ごとに役割属性が付与されたチャットログが得られる(図33(b)参照)。なお、図33には明示的に書かれていないが、チャットログに基づき、発話者名、発話相手名、発話時刻についても各発話文の属性として取得され、メモリ上に保持されている。
【0118】
続いて、会議セクション種別付与部34は、役割属性付与部33によって付与された役割属性および会議セクション種別付与ルール34aを参照し、チャットログを複数のセクションに分割しつつ各セクションに対して会議セクション種別を付与する(ステップS3202)。さらに、会議セクション種別付与部34は、会議セクション識別付与ルール34aを参照し、各セクションに付与された会議セクション種別の連接関係、重複関係または前後関係に基づいて、各セクションの会議セクション種別を修正する(ステップS3203)。これにより、セクションごとに分割されて会議セクション種別が付与されたチャットログが得られる(図33(c)参照)。
【0119】
その後、アクト付与部35は、アクト付与ルール35aを参照して、各一発話文に対してアクトを付与する(ステップS3204)。これにより、各一発話文ごとにアクトが付与されたチャットログが得られる(図33(d)参照)。
【0120】
そして、会議タイプ付与部36は、会議タイプ付与ルール36aを参照するとともに、各セクションに付与された会議セクション種別、各一発話文に付与された役割属性およびアクトを参照し、各セクションに対して会議タイプを付与する(ステップS3205)。さらに、会議タイプ付与部36は、会議タイプ付与ルール36aを参照し、各セクションに付与されたタイプの重複関係に基づいて、各セクションの会議タイプを修正する(ステップS3206)。これにより、セクションごとに会議セクション種別および会議タイプが付与され、かつ、一発話文ごとに役割属性およびアクトが付与されたチャットログが得られる(図33(e)参照)。
【0121】
(2−7:属性付与処理の効果等)
上述してきたように、属性付与部30では、発話文取得部20によって一発話文ごとに分割されたチャットログの各一発話文に対して役割属性(例えば、議長、事務局、参加者など)を付与するとともに、この役割属性を参照してチャットログを複数のセクションに分割し、各セクションに対して会議セクション種別(例えば、開始の挨拶、レビュー実施宣言など)を付与する。したがって、チャットログを複数のセクションに分割しつつ各セクションに対してチャットログ構造に適合した所定の属性を付与することが可能になる。その結果、各セクションに会議タイプを付与したり、各セクションに付与された属性に基づいて所望の議事録を作成するなど、チャットログ構造に適合したセクション単位でチャットログを処理することも可能になる。
【0122】
また、属性付与部30では、各一発話文に対してアクト(例えば、質問・確認、同意・肯定など)を付与するとともに、各セクションに付与された会議セクション種別、各一発話文に付与された役割属性およびアクトを参照し、各セクションに対して会議タイプ(例えば、情報収集、情報共有など)を付与する。したがって、各セクションに対してチャットログ構造に一層適合した所定の属性を付与することが可能になり、さらに、各セクションに付与された属性や各一発話文に付与されたアクトに基づいて一層所望の議事録を作成するなど、チャットログ構造に適合したセクション単位でチャットログを処理することも可能になる。
【0123】
また、属性付与部30では、会議セクション種別ごとに「議長」の手がかり表現を対応付けて会議セクション識別付与ルール34aを規定し、「議長」の役割属性が付与された一発話文のなかに手がかり表現が存在するか否かをチェックする。そして、手がかり表現が存在する場合には、その一発話文を境にしてチャットログをセクションに分割するとともに、手がかり表現に対応した会議セクション種別を付与する。したがって、会議セクション識別付与ルール34aに規定された手がかり表現に着目することで、会議セクション種別を簡単に精度良く付与することが可能になる。
【0124】
また、属性付与部30では、会議セクション識別付与ルール34aを参照し、各セクションに付与された会議セクション種別の連接関係、重複関係または前後関係に基づいて、各セクションの会議セクション種別を修正する。したがって、各セクションに複数の会議セクション種別が誤って付与された場合でも、誤って重複付与された会議セクション種別を削除し、会議セクション種別を精度良く付与することが可能になる。
【0125】
また、属性付与部30では、会議タイプごとに、役割属性、会議セクション種別およびアクトを対応付けた条件として会議タイプ付与ルール36aを規定し、会議タイプ付与ルール36aに規定された条件を各セクションが満たすか否かをチェックし、条件を満たす場合には、その条件に対応した会議タイプを付与する。したがって、会議タイプ付与ルール36aに規定された各属性の対応条件に着目することで、会議セクション種別を簡単に精度良く付与することが可能になる。
【0126】
また、属性付与部30では、会議タイプ付与ルール36aを参照し、各セクションに付与されたタイプの重複関係に基づいて、各セクションの会議タイプを修正する。したがって、各セクションに複数の会議タイプが誤って付与された場合でも、誤って重複付与された会議タイプを削除し、会議タイプを精度良く付与することが可能になる。
【0127】
ところで、属性付与部30では、各一発話文に役割属性およびアクトを付与するとともに、各セクションに会議セクション種別および会議タイプを付与することとしたが、本発明はこれに限定されるものではなく、その数や種類は任意であって、各一発話文それぞれを特徴付ける所定の属性や、各セクションそれぞれを特徴付ける所定の属性であればよい。
【0128】
また、属性付与部30では、役割属性「議長」が付与された発話文の手がかり表現を基にしてセクションの分割および会議セクション種別の付与を行うこととしたが、本発明はこれに限定されるものではなく、他の役割属性が付与された発話文の手がかり表現を組み合わせて分割や付与を行うようにしてもよい。
【0129】
また、属性付与部30では、一旦付与した会議セクション種別および会議タイプを修正することとしたが、本発明はこれに限定されるものではなく、一旦付与されたアクトをも修正するようにしてもよい。なお、一旦付与されたこれらの属性を修正することなく処理を継続するようにしてもよい。
【0130】
また、属性付与部30では、発話文取得部20による発話文取得処理後のチャットログ(一発話文ごとに分割されたチャットログ)に対して属性を付与することとしたが、本発明はこれに限定されるものではなく、入力部11を介して外部から入力された発話文取得処理後のチャットログに対して属性を付与するようにしてもよい。
【0131】
(2−8:議事録作成部の構成および処理手順)
次に、図17に示した議事録作成部40の構成および処理手順を説明する。図34は、議事録作成部40の構成を示すブロック図である。同図において、議事録作成部40の記憶部41は、制御部42による各種処理に必要なデータおよびプログラムを格納する格納手段(記憶手段)であり、具体的には、属性付与部30による属性付与処理後のチャットログや、議事録作成部40によって作成された議事録などを記憶する。
【0132】
また、図34において、議事録作成部40の制御部42は、OS(Operating System)などの制御プログラム、各種の処理手順などを規定したプログラムおよび所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する処理部であり、機能的に、属性取得部43と、重要発話文抽出部44とを備えて構成される。
【0133】
このうち、属性取得部43は、記憶部41に記憶されたチャットログから各セクションおよび各一発話文に付与されている属性を取得する属性取得手段である。具体的には、記憶部41には、セクションごとに会議セクション種別および会議タイプが付与され、かつ、一発話文ごとに役割属性およびアクトが付与されたチャットログが記憶されているので、属性取得部43は、これら会議セクション種別、会議タイプ、役割属性およびアクトを取得することとなる。
【0134】
そして、重要発話文抽出部44は、重要発話文抽出ルール44aを参照し、属性取得部43によって取得された各属性(各セクションに付与された会議セクション種別および会議タイプ、さらには、各一発話文に付与された役割属性およびアクト)に基づいて議事録を作成する手段である。
【0135】
具体的には、重要発話文抽出ルール44aは、図35(b)および図36に示すように、議事録項目(図35(a)参照)ごとに、会議セクション種別、会議タイプ、役割属性、アクトおよび手がかり表現(図37参照)を対応付けて規定したものである。つまり、重要文抽出のルールは、図35(b)に示すように、議事録項目毎に複数存在し(OR条件として作用し)、また否定ルール(先頭に!が与えられたルール)に一つでもマッチした場合、発話文の抽出は行わない。そして、重要発話文処理部44は、例えば、議事録項目「決定事項」の一つのルールは、役割情報がオーナー(議長)で、かつ会議セクション種別「開始の挨拶」であり、かつ会議タイプ「定例報告」であり、かつ別途用意した「決定事項手がかり表現」のなかのどれかの表現にマッチすることを要求する。一方で、アクト「発言終了」である発話文は否定ルールによって抽出はされない。
【0136】
このような処理を経て、重要発話文抽出部44は、「決定事項、課題、宿題、今後の予定」などの議事録項目ごとに重要発話文を抽出する。そして、その結果として、議事録作成部40は、図38に示すように、議事録項目ごとに対応する発話文が抽出された議事録を自動的に作成することとなる。
【0137】
(2−9:議事録作成処理の効果等)
上述してきたように、議事録作成部40では、属性付与部30によって各セクションおよび各一発話文に属性が付与されたチャットログについて、この各セクションおよび各一発話文の属性に基づいて議事録を作成する。したがって、複数のセクションに分割されて所定の属性がそれぞれ付与されたチャットログから所望の議事録を自動的に作成することが可能になる。
【0138】
より詳細には、議事録作成部40では、各セクションおよび一発話文に付与され得る属性に対応付けてチャットログから抽出する一発話文が規定された重要発話文抽出ルール44aを参照し、当該ルールに規定された属性が付与されているセクションのなかから当該ルールに規定された属性が付与されている一発話文を抽出することによって議事録を作成する。したがって、例えば、チャットログから決定事項、宿題、今後の課題などの議事録項目に対応する発話文を抽出することができ、かかる議事録項目をフォームに備える議事録を自動的に作成することが可能になる。
【0139】
ところで、議事録作成部40では、チャットログに付与された会議セクション種別、会議タイプ、役割属性、アクトといった属性を利用して議事録を作成することとしたが、本発明はこれに限定されるものではなく、これらの属性を任意に取捨選択して議事録を作成するようにしてもよく、さらに他の属性をも利用して議事録を作成するようにしてもよい。
【0140】
また、議事録作成部40では、決定事項、宿題、今後の課題といった議事録項目を備える議事録を作成することとしたが、本発明はこれに限定されるものではなく、重要発話文抽出ルール44aを任意に規定することで、任意の議事録項目を備える議事録を作成するようにしてもよい。さらに、チャットログから定型項目(定型フォーマット)に抽出してターゲットドキュメントを作成する形態として、上記のような議事録を作成する場合に本発明は限定されるものではなく、例えば以下に説明する仕様書や手順書など、定型のフォーマットを有するあらゆる文書を作成する場合にも同様に適用することができる。
【0141】
すなわち、「特定の複数人によるチャットにより、分散された情報を整理し、チャットにより成立したコンセンサスに基づいて共有化し、ターゲットドキュメントに対してアウトプットする」という観点から、例えば、ひとつのシステム(スーパーコンピュータ等)の仕様書や操作マニュアル、手順書などの作成あるいは改版にも本発明を同様に適用することができる。つまり、仕様書や手順書などの作成あるいは改版を想定した場合、通常は「ドラフト回覧し、各々(各技術者の担当モジュール)のエンハンス情報を寄せ集めて、整合性をとってドキュメントにまとめる」という作業が発生するが、図39に示すように、チャットによる決定確認事項を上記議事録作成と同様の手順で抽出し、予めタグ付けしたターゲットドキュメントに自動挿入するよう出力させることで、自動的にエンハンス事項を網羅した改版ドキュメントを得ることが可能になる。
【0142】
また、議事録作成部40では、属性付与部30による属性付与処理後のチャットログ(セクションおよび一発話文ごとに属性が付与されたチャットログ)について議事録を作成することとしたが、本発明はこれに限定されるものではなく、入力部11を介して外部から入力された属性付与処理後のチャットログについて議事録を作成するようにしてもよい。
【0143】
また、議事録作成部40では、重要発話文を抽出することで議事録を作成することとしたが、本発明はこれに限定されるものではなく、いわゆるアジェンダ(議題)などの特定の文字列をチャットログに挿入することで議事録を作成するようにしてもよい。すなわち、チャットログの各セクションおよび各一発話文の属性を参照してアジェンダの挿入箇所を特定し、当該特定した挿入箇所にアジェンダを挿入することによって議事録を作成する。これによって、アジェンダが挿入された議事録を自動的に作成することも可能になる。
【0144】
さらに、議事録作成部40では、各セクションおよび各一発話文の属性を参照してチャットログを要約することによって議事録を作成するようにしてもよい。つまり、話題推移ややりとりなどの局所・中位の談話構造を考慮した要約型モデルの議事録を作成するようにしてもよい。
【0145】
[3:他の実施の形態]
さて、これまで本発明の実施の形態について説明したが、本発明は上述した実施の形態以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてもよいものである。
【0146】
例えば、本実施の形態では、図1に示したようなチャットログを処理対象とする場合を説明したが、本発明はこれに限定されるものではなく、例えば、メールやインスタント・メッセージによる情報のやり取りなど、複数人の文字による発話文が発話者ごとに時系列に組分け記録された文字発話記録であれば、同様に適用することができる。
【0147】
さらに、かかる文字発話記録を処理対象とするものに本発明は限定されるものではなく、所定の属性付与が可能な単位にある複数の一情報が当該単位とは無関係に組分けされてなる情報群であれば同様に適用することができる。すなわち、かかる情報群を所定箇所にて結合または分割して一情報をそれぞれ取得する場合や、かかる情報群を複数のセクションに分割しつつ各セクションに対して所定の属性を付与する場合、さらには、複数のセクションに分割されて所定の属性を付与された情報群を加工する場合に、本発明を同様に適用することができる。
【0148】
また、本実施の形態では、チャットログ処理装置10が外部からチャットログを入力して処理する場合を説明したが、本発明はこれに限定されるものではなく、内部で生成したチャットログを処理するようにしてもよい。すなわち、図40に示すように、インターネットなどのネットワーク1を介して複数のクライアント装置2の間でチャットを行わせるチャットサーバ50において、チャット処理部51によって生成したチャットログをそのまま処理するようにしてもよい。
【0149】
また、図示した各装置の各構成要素は機能的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のもの(図17および図40のもの)に限られず、例えば、図40に示すクライアント装置2などのユーザ端末が発話文取得処理、属性付与処理および議事録作成処理を実行するなど、その全部または一部の機能を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラム(例えば、発話文取得処理、属性付与処理および議事録作成処理の各方法を実行するプログラムなど)にて実現され、あるいは、ワイヤードロジック(結線論理)によるハードウェアとして実現され得る。
【0150】
また、本実施の形態において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0151】
なお、本実施の形態で説明した発話文取得処理、属性付与処理および議事録作成処理の各方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。このプログラムは、インターネットなどのネットワークを介して配布することができる。また、このプログラムは、ハードディスク、フレキシブルディスク(FD)、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行することもできる。
【0152】
【発明の効果】
以上説明したように、本発明によれば、複数の一発話文が所定の属性付与単位とは無関係に記録されているチャットログから一発話文を順次取得することが可能になり、さらには、チャットログに限らず、所定の属性付与が可能な単位にある複数の一情報が当該単位とは無関係に組分け記録された情報群から一情報をそれぞれ取得することも可能になる。
【0153】
また、本発明によれば、一発話文ごとに分割されたチャットログを複数のセクションに分割しつつ各セクションに対してチャットログ構造に適合した所定の属性を付与することが可能になり、さらには、チャットログに限らず、所定の属性付与が可能な単位にある複数の一情報が連なって記録された情報群を複数のセクションに分割しつつ各セクションに対して情報群の構造に適合した所定の属性を付与することも可能になる。
【0154】
また、本発明によれば、複数のセクションに分割されて所定の属性がそれぞれ付与されたチャットログから所望の文書(例えば、議事録など)を作成することが可能になり、さらには、チャットログに限らず、複数のセクションに分割されて所定の属性を付与された複数の一情報の連なりとして記録された情報群を各属性に基づいて加工することも可能になる。
【0155】
さらに、本発明によれば、会議のための交通費の削減や移動時間の省略などの合理化実現に加え、既知のパーソナルコンピュータや移動体通信端末などの情報処理装置を利用することによって、新たに特別なインフラを必要とすることなく、低コストで上記の効果を享受することも可能になる。
【図面の簡単な説明】
【図1】チャットログの一例を示す図である。
【図2】議事録フォームの一例を示す図である。
【図3】領域分析のアプローチを説明するための図である。
【図4】会議タイプ区分を説明するための図である。
【図5】コミュニケーションタイプ区分を説明するための図である。
【図6】分析対象とする実験会議を示す図である。
【図7】分析の作業手順を説明するための図である。
【図8】分析のために属性を付与されたチャットログを説明するための図である。
【図9】抽出された会議セクションの種別を示すリストである。
【図10】会議セクションと会議タイプの関係を説明するための図である。
【図11】議事録に対する議長発言の貢献度を説明するための図である。
【図12】議事録作成ノウハウの分析結果を説明するための図である。
【図13】会議タイプを軸とした議事録作成ノウハウ分析結果を説明するための図である。
【図14】領域分析の結果得られた会議特有の談話構造と、会議特有の談話構造と議事録項目の知識マッピングとを説明するための図である。
【図15】議事録作成モデルを説明するための図である。
【図16】テキスト処理の妨げとなるチャットログの特徴を説明するための図である。
【図17】チャットログ処理装置の概略構成を示すブロック図である。
【図18】チャットログ処理装置の概略処理を説明するための図である。
【図19】チャットログ処理装置の概略処理を説明するための図である。
【図20】発話文取得部の構成を示すブロック図である。
【図21】変換ルールを説明するための図である。
【図22】文末ルールを説明するための図である。
【図23】チャットログの一例を示す図である。
【図24】チャットログの一例を示す図である。
【図25】発話文取得処理後のチャットログの一例を示す図である。
【図26】発話文取得処理後のチャットログの一例を示す図である。
【図27】発話文取得処理を示すフローチャートである。
【図28】属性付与部の構成を示すブロック図である。
【図29】会議セクション種別付与ルールを説明するための図である。
【図30】アクト付与ルールを説明するための図である。
【図31】会議タイプ付与ルールを説明するための図である。
【図32】属性付与処理を示すフローチャートである。
【図33】属性付与処理を説明するための図である。
【図34】議事録作成部の構成を示すブロック図である。
【図35】重要発話文抽出ルールを説明するための図である。
【図36】重要発話文抽出ルールを説明するための図である。
【図37】重要発話文抽出ルールを説明するための図である。
【図38】議事録の一例を示す図である。
【図39】仕様書の一例を示す図である。
【図40】チャットシステムの概略構成を示すブロック図である。
【符号の説明】
10 チャットログ処理装置
11 入力部
12 出力部
13 入出力制御IF部
20 発話文取得部
21 記憶部
21a チャットログメモリ
21b 一時メモリ
21c 取得後メモリ
22 制御部
23 変換部
23a 変換ルール
24 文末特定部
24a 文末ルール
25 分割部
26 結合部
30 属性付与部
31 記憶部
32 制御部
33 役割属性付与部
33a 役割属性付与ルール
34 会議セクション種別付与部
34a 会議セクション種別付与ルール
35 アクト付与部
35a アクト付与ルール
36 会議タイプ付与部
36a 会議タイプ付与
40 議事録作成部
41 記憶部
42 制御部
43 属性取得部
44 重要発話文抽出部
45 重要発話文抽出ルール
50 チャットサーバ

Claims (27)

  1. 複数人の文字による発話文が発話者ごとに時系列に組分け記録された文字発話記録を所定箇所にて結合または分割し、所定の属性付与が可能な単位にある複数の一発話文を順次取得する発話文取得装置であって、
    前記一発話文の文末を特定するための文末ルールを参照し、前記文字発話記録の所定箇所を前記一発話文の文末として特定する文末特定手段と、
    各組の文末のうちで前記文末特定手段によって前記一発話文の文末として特定されなかった文末を当該組の後方に記録されている同一発話者の組の文頭と結合する結合手段と、
    前記文末特定手段によって前記一発話文の文末として特定された所定箇所にて前記文字発話記録を分割する分割手段と、
    を備えたことを特徴とする発話文取得装置。
  2. 前記文末ルールは、前記組の文末に登場し前記一発話文の文末になり得る文字列を規定したものであって、
    前記文末特定手段は、各組の文末のうちで前記文末ルールに規定された文字列が存在する文末を前記一発話文の文末として特定することを特徴とする請求項1に記載の発話文取得装置。
  3. 前記文末ルールは、前記組の文頭から文末の間に登場し前記一発話文の文末になり得る文字列を規定したものであって、
    前記文末特定手段は、各組の文頭から文末の間で前記文末ルールに規定された文字列が存在する箇所を前記一発話文の文末として特定することを特徴とする請求項1に記載の発話文取得装置。
  4. 前記文末ルールは、前記組の文頭から文末に至る一文として前記一発話文の文頭および文末となり得る文字列の組み合わせを規定したものであって、
    前記文末特定手段は、前記文末ルールに規定された文字列の組み合わせが一文として文頭および文末に存在する組の当該文末を前記一発話文の文末として特定することを特徴とする請求項1に記載の発話文取得装置。
  5. 前記文末ルールは、前記組の文頭から文末に至る一文字列として前記一発話文となり得る文字列を規定したものであって、
    前記文末特定手段は、前記文末ルールに規定された文字列が一文字列として文頭から文末に至っている組の文末を前記一発話文の文末として特定することを特徴とする請求項1に記載の発話文取得装置。
  6. 前記文末ルールは、前記組の文頭に登場し前記一発話文の文頭となり得る文字列を規定したものであって、
    前記文末特定手段は、前記文末ルールに規定された文字列が文頭に存在する組の前方に記録されている同一発話者の組の文末を前記一発話文の文末として特定することを特徴とする請求項1に記載の発話文取得装置。
  7. 前記文末ルールは、所定の組同士の発話間隔を規定するものであって、
    前記文末特定手段は、所定の組と組との間の発話間隔が前記文末ルールに規定された発話間隔を超える場合に、前の組の文末を前記一発話文の文末として特定することを特徴とする請求項1に記載の発話文取得装置。
  8. 複数人の文字による発話文に登場し得る特定表現と当該特定表現の変換後の統制された表現とを対応付けた変換ルールを参照し、前記文字発話記録に登場する前記特定表現を前記統制された表現に変換する変換手段をさらに備え、
    前記文末特定手段は、前記変換手段によって前記特定表現が前記統制された表現に変換された文字発話記録について、当該文字発話記録の所定箇所を前記一発話文の文末として特定することを特徴とする請求項1〜7のいずれか一つに記載の発話文取得装置。
  9. 前記変換ルールは、前記統制された表現として前記文末ルールに規定された文字列と同様の文字列を規定するものであって、
    前記変換手段は、前記文字発話記録に登場する前記特定表現を前記変換ルールに規定された文字列に変換することを特徴とする請求項8に記載の発話文取得装置。
  10. 複数人の文字による発話文が所定の属性付与が可能な単位にある複数の一発話文の連なりとして記録された文字発話記録を複数のセクションに分割し、各セクションに所定の属性を付与する属性付与装置であって、
    前記複数の一発話文に対してそれぞれを特徴付ける所定の属性を付与する発話文属性付与手段と、
    前記発話文属性付与手段によって付与された属性を参照して前記文字発話記録を複数のセクションに分割し、各セクションに対してそれぞれを特徴付ける所定の属性を付与するセクション属性付与手段と、
    を備えたことを特徴とする属性付与装置。
  11. 複数人の文字による発話文が所定の属性付与が可能な単位にある複数の一発話文の連なりとして記録された文字発話記録を複数のセクションに分割し、各セクションに所定の属性を付与する属性付与装置であって、
    前記複数の一発話文に対してそれぞれの発話者に基づく特徴を示す発話者属性を付与する発話者属性付与手段と、
    前記発話者属性付与手段によって付与された発話者属性を参照して前記文字発話記録を複数のセクションに分割し、各セクションに対して前記文字発話記録における各セクションの構造を示す構造属性を付与する構造属性付与手段と、
    前記複数の一発話文に対してそれぞれの発話行為に基づく特徴を示す発話行為属性を付与する発話行為属性付与手段と、
    前記構造属性付与手段によって各セクションに付与された構造属性、前記発話者属性付与手段によって各一発話文に付与された発話者属性および前記発話行為属性付与手段によって各一発話文に付与された発話行為属性を参照し、各セクションに対して各セクションの型を示す型属性を付与する型属性付与手段と、
    を備えたことを特徴とする属性付与装置。
  12. 前記構造属性付与手段は、特定の発話者属性が付与された一発話文のなかに特定の表現が存在するか否かに着目して前記文字発話記録を複数のセクションに分割し、各セクションに対して前記特定の発話者属性および特定の表現に応じた構造属性を付与することを特徴とする請求項11に記載の属性付与装置。
  13. 前記型属性付与手段は、特定の構造属性が付与されたセクションの各一発話文に特定の発話者属性および特定の発話行為属性が付与されているか否かに着目して、各セクションに対して前記特定の構造属性、発話者属性および発話行為属性に対応した型属性を付与することを特徴とする請求項11または12に記載の属性付与装置。
  14. 前記構造属性付与手段によって各セクションに付与された構造属性の連接関係、重複関係または前後関係に基づいて、各セクションの構造属性を修正する構造属性修正手段をさらに備えたことを特徴とする請求項11、12または13に記載の属性付与装置。
  15. 前記型属性付与手段によって各セクションに付与された型属性の重複関係に基づいて、各セクションの型属性を修正する型属性修正手段をさらに備えたことを特徴とする請求項11〜14のいずれか一つに記載の属性付与装置。
  16. 複数人の文字による発話文が所定の属性を付与された複数のセクションに分割され、所定の属性を付与された複数の一発話文の連なりとして記録された文字発話記録から所定の文書を作成する文書作成装置であって、
    前記文字発話記録の各セクションに付与された所定の属性および各一発話文に付与された所定の属性を取得する属性取得手段と、
    前記属性取得手段によって取得された各セクションおよび各一発話文の属性に基づいて前記文書を作成する文書作成手段と、
    を備えたことを特徴とする文書作成装置。
  17. 前記文書作成手段は、前記セクションおよび一発話文に付与され得る属性に対応付けて前記文字発話記録から抽出する一発話文が規定されたルールを参照し、当該ルールに規定された属性が付与されているセクションのなかから当該ルールに規定された属性が付与されている一発話文を抽出することによって、前記文書を作成することを特徴とする請求項16に記載の文書作成装置。
  18. 前記文書作成手段は、前記属性取得手段によって取得された各セクションおよび各一発話文の属性を参照して前記文字発話記録に挿入する特定の文字列の挿入箇所を特定し、当該特定した挿入箇所に前記特定の文字列を挿入することによって、前記文書を作成することを特徴とする請求項16に記載の文書作成装置。
  19. 前記文書作成手段は、前記属性取得手段によって取得された各セクションおよび各一発話文の属性を参照して前記文字発話記録を要約することによって、前記文書を作成することを特徴とする請求項16に記載の文書作成装置。
  20. 複数人の文字による発話文が発話者ごとに時系列に組分け記録された文字発話記録を所定箇所にて結合または分割し、所定の属性付与が可能な単位にある複数の一発話文を順次取得する方法をコンピュータに実行させる発話文取得プログラムであって、
    前記一発話文の文末を特定するための文末ルールを参照し、前記文字発話記録の所定箇所を前記一発話文の文末として特定する文末特定工程と、
    各組の文末のうちで前記文末特定工程によって前記一発話文の文末として特定されなかった文末を当該組の後方に記録されている同一発話者の組の文頭と結合する結合工程と、
    前記文末特定工程によって前記一発話文の文末として特定された所定箇所にて前記文字発話記録を分割する分割工程と、
    をコンピュータに実行させることを特徴とする発話文取得プログラム。
  21. 複数人の文字による発話文が所定の属性付与が可能な単位にある複数の一発話文の連なりとして記録された文字発話記録を複数のセクションに分割し、各セクションに所定の属性を付与する方法をコンピュータに実行させる属性付与プログラムであって、
    前記複数の一発話文に対してそれぞれを特徴付ける所定の属性を付与する発話文属性付与工程と、
    前記発話文属性付与工程によって付与された属性を参照して前記文字発話記録を複数のセクションに分割し、各セクションに対してそれぞれを特徴付ける所定の属性を付与するセクション属性付与工程と、
    をコンピュータに実行させることを特徴とする属性付与プログラム。
  22. 複数人の文字による発話文が所定の属性付与が可能な単位にある複数の一発話文の連なりとして記録された文字発話記録を複数のセクションに分割し、各セクションに所定の属性を付与する方法をコンピュータに実行させる属性付与プログラムであって、
    前記複数の一発話文に対してそれぞれの発話者に基づく特徴を示す発話者属性を付与する発話者属性付与工程と、
    前記発話者属性付与工程によって付与された発話者属性を参照して前記文字発話記録を複数のセクションに分割し、各セクションに対して前記文字発話記録における各セクションの構造を示す構造属性を付与する構造属性付与工程と、
    前記複数の一発話文に対してそれぞれの発話行為に基づく特徴を示す発話行為属性を付与する発話行為属性付与工程と、
    前記構造属性付与工程によって各セクションに付与された構造属性、前記情報源属性付与工程によって各一発話文に付与された発話者属性および前記発話行為属性付与工程によって各一発話文に付与された発話行為属性を参照し、各セクションに対して各セクションの型を示す型属性を付与する型属性付与工程と、
    をコンピュータに実行させることを特徴とする属性付与プログラム。
  23. 複数人の文字による発話文が所定の属性を付与された複数のセクションに分割され、所定の属性を付与された複数の一発話文の連なりとして記録された文字発話記録から所定の文書を作成する方法をコンピュータに実行させる文書作成プログラムであって、
    前記文字発話記録の各セクションに付与された所定の属性および各一発話文に付与された所定の属性を取得する属性取得工程と、
    前記属性取得工程によって取得された各セクションおよび各一発話文の属性に基づいて前記文書を作成する文書作成工程と、
    をコンピュータに実行させることを特徴とする文書作成プログラム。
  24. 所定の属性付与が可能な単位にある複数の一情報が当該単位とは無関係に組分けされてなる情報群を所定箇所にて結合または分割し、前記一情報をそれぞれ取得する情報処理方法であって、
    前記一情報の終端を特定するための終端ルールを参照し、前記情報群の所定箇所を前記一情報の終端として特定する終端特定工程と、
    各組の終端のうちで前記終端特定工程によって前記一情報の終端として特定されなかった終端を当該組の後方に記録されている同一情報源の組の先端と結合する結合工程と、
    前記終端特定工程によって前記一情報の終端として特定された所定箇所にて前記情報群を分割する分割工程と、
    を含んだことを特徴とする情報処理方法。
  25. 所定の属性付与が可能な単位にある複数の一情報からなる情報群を複数のセクションに分割し、各セクションに所定の属性を付与する情報処理方法であって、
    前記複数の一情報に対してそれぞれを特徴付ける所定の属性を付与する情報属性付与工程と、
    前記情報属性付与工程によって付与された属性を参照して前記情報群を複数のセクションに分割し、各セクションに対してそれぞれを特徴付ける所定の属性を付与するセクション属性付与工程と、
    を含んだことを特徴とする情報処理方法。
  26. 所定の属性付与が可能な単位にある複数の一情報からなる情報群を複数のセクションに分割し、各セクションに所定の属性を付与する情報処理方法であって、
    前記複数の一情報に対してそれぞれの情報源に基づく特徴を示す情報源属性を付与する情報源属性付与工程と、
    前記情報源属性付与工程によって付与された情報源属性を参照して前記情報群を複数のセクションに分割し、各セクションに対して前記情報群における各セクションの構造を示す構造属性を付与する構造属性付与工程と、
    前記複数の一情報に対してそれぞれの振る舞いに基づく特徴を示す行為属性を付与する行為属性付与工程と、
    前記構造属性付与工程によって各セクションに付与された構造属性、前記情報源属性付与工程によって各一情報に付与された情報源属性および前記行為属性付与工程によって各一情報に付与された行為属性を参照し、各セクションに対して各セクションの型を示す型属性を付与する型属性付与工程と、
    を含んだことを特徴とする情報処理方法。
  27. 所定の属性を付与された複数のセクションに分割され、所定の属性を付与された複数の一情報からなる情報群を加工する情報処理方法であって、
    前記情報群の各セクションに付与された所定の属性および各一情報に付与された所定の属性を取得する属性取得工程と、
    前記属性取得工程によって取得された各セクションおよび各一情報の属性に基づいて前記情報群を加工する情報加工工程と、
    を含んだことを特徴とする情報処理方法。
JP2002381219A 2002-12-27 2002-12-27 発話文取得装置、属性付与装置、文書作成装置、発話文取得プログラム、属性付与プログラム、文書作成プログラムおよび情報処理方法 Pending JP2004213260A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002381219A JP2004213260A (ja) 2002-12-27 2002-12-27 発話文取得装置、属性付与装置、文書作成装置、発話文取得プログラム、属性付与プログラム、文書作成プログラムおよび情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002381219A JP2004213260A (ja) 2002-12-27 2002-12-27 発話文取得装置、属性付与装置、文書作成装置、発話文取得プログラム、属性付与プログラム、文書作成プログラムおよび情報処理方法

Publications (1)

Publication Number Publication Date
JP2004213260A true JP2004213260A (ja) 2004-07-29

Family

ID=32817211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002381219A Pending JP2004213260A (ja) 2002-12-27 2002-12-27 発話文取得装置、属性付与装置、文書作成装置、発話文取得プログラム、属性付与プログラム、文書作成プログラムおよび情報処理方法

Country Status (1)

Country Link
JP (1) JP2004213260A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014519262A (ja) * 2011-05-19 2014-08-07 オラクル・インターナショナル・コーポレイション 会議についての時間的に相関した活動ストリーム
JP2018045326A (ja) * 2016-09-12 2018-03-22 富士ゼロックス株式会社 記録分割装置および記録分割システム
JP2021067830A (ja) * 2019-10-24 2021-04-30 日本金銭機械株式会社 議事録作成システム
WO2021153403A1 (ja) * 2020-01-27 2021-08-05 株式会社日立製作所 テキスト情報編集装置及びテキスト情報編集方法
JP7223469B1 (ja) 2022-09-07 2023-02-16 株式会社Aces 発話情報資料化装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014519262A (ja) * 2011-05-19 2014-08-07 オラクル・インターナショナル・コーポレイション 会議についての時間的に相関した活動ストリーム
JP2016029574A (ja) * 2011-05-19 2016-03-03 オラクル・インターナショナル・コーポレイション 会議についての時間的に相関した活動ストリーム
JP2018045326A (ja) * 2016-09-12 2018-03-22 富士ゼロックス株式会社 記録分割装置および記録分割システム
JP2021067830A (ja) * 2019-10-24 2021-04-30 日本金銭機械株式会社 議事録作成システム
WO2021153403A1 (ja) * 2020-01-27 2021-08-05 株式会社日立製作所 テキスト情報編集装置及びテキスト情報編集方法
JP7223469B1 (ja) 2022-09-07 2023-02-16 株式会社Aces 発話情報資料化装置
JP2024037301A (ja) * 2022-09-07 2024-03-19 株式会社Aces 発話情報資料化装置

Similar Documents

Publication Publication Date Title
US9864742B2 (en) Persona management system for communications
US11682401B2 (en) Matching speakers to meeting audio
US20090177469A1 (en) System for recording and analysing meetings
US20030040901A1 (en) Method and apparatus for dynamic grammars and focused semantic parsing
US20180033434A1 (en) System and method for eliciting open-ended natural language responses to questions to train natural language processors
Campbell-Kibler The effect of speaker information on attitudes toward (ING)
WO2020189441A1 (ja) 情報処理装置、情報処理方法およびプログラム
JPH08106298A (ja) 対話処理装置及び対話処理方法
US20190319811A1 (en) Integrating an interactive virtual assistant into a meeting environment
CN113256262A (zh) 会议纪要的自动生成方法、系统、存储介质及电子设备
US20120185417A1 (en) Apparatus and method for generating activity history
JP2004213260A (ja) 発話文取得装置、属性付与装置、文書作成装置、発話文取得プログラム、属性付与プログラム、文書作成プログラムおよび情報処理方法
JP6511192B2 (ja) 議論支援システム、議論支援方法、及び議論支援プログラム
JP2004295834A (ja) 文字発話記録の分析装置、分析方法および分析プログラム、情報群の分析装置、分析方法および分析プログラム
JP2002344636A (ja) 音声会議システムにおける議事録自動作成方式
JP2006236037A (ja) 音声対話コンテンツ作成方法、装置、プログラム、記録媒体
US20220182253A1 (en) Supporting a meeting
CN114462376A (zh) 基于rpa和ai的庭审笔录生成方法、装置、设备及介质
Barrios-Lech Towards a comparison of Greek and Roman politeness systems
JP5856198B2 (ja) 談話要約生成システムおよび談話要約生成プログラム
Brandt et al. From writing dialogue to designing conversation: considering the potential of conversation analysis for voice user interfaces
CN113849704A (zh) 一种建立数字人物并和数字人物对话的方法和系统
WO2019181221A1 (ja) 情報処理装置、および情報処理システム
KR102383643B1 (ko) 가상 공간 기반의 보이스 데이터의 선택적 추출과 매칭 통한 커뮤니케이팅 시스템
CN112364140B (zh) 一种通过配置单实现语音识别意图定制的方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050511