JP5257330B2 - 発言記録装置、発言記録方法、プログラム及び記録媒体 - Google Patents

発言記録装置、発言記録方法、プログラム及び記録媒体 Download PDF

Info

Publication number
JP5257330B2
JP5257330B2 JP2009255361A JP2009255361A JP5257330B2 JP 5257330 B2 JP5257330 B2 JP 5257330B2 JP 2009255361 A JP2009255361 A JP 2009255361A JP 2009255361 A JP2009255361 A JP 2009255361A JP 5257330 B2 JP5257330 B2 JP 5257330B2
Authority
JP
Japan
Prior art keywords
speech
topic
voice
keyword
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009255361A
Other languages
English (en)
Other versions
JP2011100355A (ja
Inventor
誠人 新西
聡一郎 伊賀
政司 中臣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2009255361A priority Critical patent/JP5257330B2/ja
Priority to CN2010105268329A priority patent/CN102063461A/zh
Priority to US12/939,646 priority patent/US8862473B2/en
Priority to EP10251899A priority patent/EP2320333A3/en
Publication of JP2011100355A publication Critical patent/JP2011100355A/ja
Application granted granted Critical
Publication of JP5257330B2 publication Critical patent/JP5257330B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、会議における発言を記録して視覚化表示し、使用者の要求に応じて再生する発言記録装置、発言記録方法に関する。
会議における発言構造を視覚化表示し、それを記録された会議情報へのアクセスのインデックスとして利用することが可能な会議情報記録再生装置において、会議の音声または映像記録に話者特定処理をかけ、音声または映像を話者でセグメンテーションし、利用者が視覚化されたセグメンテーション結果から音声または映像のセグメントを指定して再生する会議情報記録再生装置が知られている。
例えば、特許文献1には、会議中の記録映像や音声を、自然言語処理における重要文抽出技術、音声処理における話者特定と音声Grep技術を利用して解析し、各々の話者の話題毎の発言映像や音声を自動的に抽出して、記録情報の再利用性を向上させるために、議事録から抽出される重要語および話者ごとの発言から、同じ話者の同じ話題に関する会議映像のセグメントを生成するシステムが記載されている。
しかし、特許文献1に記載の会議情報記録再生装置では、アルゴリズムとして発言者の前後の発言者などを参考にするため、話題や内容に立ち入った検索ができず、コンテクストを覚えていないと検索しにくく、また議事録を利用するため、議事録が生成される前の進行中の会議においては利用できないという問題があった。
以上の問題を鑑みて、本発明は、進行中の会議において、発話・記録された発言を、発言者毎に、議事進行の状況にあわせて簡易に表示して振り返ることが可能な発言記録装置及び発言記録方法を提供することを目的とする。
上記の課題を解決するために、請求項1の発明は、音声入力装置及び音声出力装置を備え、発言の音声を記録し、再生することが可能な発言記録装置であって、前記音声入力装置によって発言の音声を音声データとして取得し、取得した音声データを、予め話題データベースに登録された複数の話題中、話題指示手段によって指示された話題及び音声データから識別される話者ごとに音声データベースに登録する音声取得部と、前記音声データベースに登録された音声データに対して音声認識を行ってテキスト情報を取得する音声認識部と、該音声認識部によって得られたテキスト情報に対して形態素解析を行い、得られた単語から抽出したキーワードを、前記音声データベースに音声とともに登録した話題及び話者とともにキーワードデータベースに登録する形態素解析部と、前記キーワードを、話題及び話者に関連づけたマトリクス中に表示する表示生成部と、を備えた発言記録装置を特徴とする。
また、請求項2の発明は、請求項1に記載の発言記録装置において、前記キーワードは、前記テキスト情報中の名詞である発言記録装置を特徴とする。
また、請求項3の発明は、請求項1又は2に記載の発言記録装置において、前記表示生成部は、前記マトリクス中に表示されたキーワードについて、当該キーワードの前後所定数の単語からなる文章を表示する発言記録装置を特徴とする。
また、請求項4の発明は、請求項3に記載の発言記録装置において、実時間を計測する実時間計測手段と、前記音声データベースに登録された音声データを前記音声出力装置によって再生する音声再生部と、を備え、前記音声取得部は、前記音声データを、前記実時間計測手段の計測結果に基づく開始時間とともに取得し、前記形態素解析部は、前記音声データにおける各単語の開始時間を取得し、前記音声再生部は、前記文章を構成する単語の開始時間に基づいて音声データを再生する発言記録装置を特徴とする。
また、請求項5の発明は、請求項1乃至4の何れか一項に記載の発言記録装置において、現在なされている発言が前記話題指示手段により指示されていた話題とは無関係である旨指示がなされた状態で音声データが前記音声データベースに登録された場合、前記表示生成部は、当該音声データから得られるキーワードを前記マトリクス中の専用領域に区別して表示する発言記録装置を特徴とする。
また、請求項6の発明は、請求項5に記載の発言記録装置において、前記話題データベースは、話題毎に予め説明文を格納し、前記表示生成部は、前記専用領域に表示されたキーワードが、前記形態素解析部により前記説明文に対して形態素解析を行って得られる単語と合致する場合は、前記マトリクスにおける当該単語が含まれる話題に対応する箇所にも当該キーワードを表示する発言記録装置を特徴とする。
また、請求項7の発明は、請求項1乃至6の何れか一項に記載の発言記録装置において、前記マトリクス中に表示されたキーワードに基づいて、前記話題データベースに新たに話題を追加できる発言記録装置を特徴とする。
また、請求項8の発明は、請求項1乃至7の何れか一項に記載の発言記録装置において、前記マトリクス中に表示されるキーワードについて、重要度や話題との関連度を入力する手段を備えた発言記録装置を特徴とする。
また、請求項9の発明は、請求項1乃至8の何れか一項に記載の発言記録装置において、前記マトリクス中に表示されるキーワードは削除可能であり、キーワードの削除が削除されると、前記音声認識部は、再度音声認識をし直す発言記録装置を特徴とする。
また、請求項10の発明は、音声入力装置及び音声出力装置を備え、発言の音声を記録し、再生することが可能な発言記録装置の発言記録方法であって、前記発言記録装置が有する音声取得部が、前記音声入力装置によって発言の音声を音声データとして取得し、取得した音声データを、予め話題データベースに登録された複数の話題中、話題指示手段によって指示された話題及び音声データから識別される話者ごとに音声データベースに登録するステップと、前記発言記録装置が有する音声認識部が、前記音声データベースに登録された音声データに対して音声認識を行ってテキスト情報を取得するステップと、前記発言記録装置が有する形態素解析部が、該音声認識部によって得られたテキスト情報に対して形態素解析を行い、得られた単語から抽出したキーワードを、前記音声データベースに音声とともに登録した話題及び話者とともにキーワードデータベースに登録するステップと、前記発言記録装置が有する表示生成部が、前記キーワードを、話題及び話者に関連づけたマトリクス中に表示するステップと、を含む発言記録方法特徴とする。
また、請求項11の発明は、コンピュータに、請求項10に記載の発言記録方法を実行させるためのプログラムを特徴とする。
また、請求項12の発明は、請求項11に記載のプログラムを記録したコンピュータが読み取り可能な記録媒体を特徴とする。
上記のような構成を備えるので、本発明によれば、進行中の会議において、発話・記録された発言を、発言者毎に、議事進行の状況にあわせて簡易に表示し、且つ発言を再生して振り返ることが可能となる。
本実施形態に係る装置のシステム構成を示す図。 本発明の装置における基本的なインターフェイスを示す図。 話題となる議題が変わった場合、それを装置に明示的に指示する様子を示す図。 発言を記録中に、その発言が議題以外の話題になったとき、装置に対して明示的にその旨を指示する様子を示す図。 アジェンダDBに登録される内容を示す概要図。 音声DBに登録される内容を示す概要図。 音声取得部が、音声を音声DBに登録する処理を説明するフローチャート。 認識音声テキストDBに登録される内容を示す概要図。 形態素解析部が、発言中の単語を認識音声テキストDBに登録する処理を説明するフローチャート。 キーワードDB24に登録される内容を示す概要図。 形態素解析部によって、音声認識テキストDBの単語をキーワードDBに登録する処理を説明するフローチャート。 形態素解析部によって、アジェンダDB21の単語をキーワードDB24に登録する処理を説明するフローチャート。 表示生成部が、マトリクス中にタグクラウドを表示する処理を説明するフローチャート。 その他の欄に表示されたタグクラウド中の単語を明示的に議題についての欄に移動させる様子を示す図。 関連する発言キーワードが出現する状態について説明する図。 表示生成部による関連キーワードの表示処理を示すフローチャート。 発言の振り返り表示について説明する図。 表示生成部による発言の振り返り表示処理を説明するフローチャート。 記録された発言の再生について説明する図。 音声再生部による発言の再生の処理を説明するフローチャート。 新規議題の作成について説明する図。 重要性、関係性スライダーについて説明する図。 誤認識タグの削除について説明する図。
以下に、図面を参照して本発明の実施の形態を詳細に説明する。
図1は、本実施形態に係る発言記録装置のシステム構成を示す図である。
図1(a)は、本実施形態に係る発言記録装置のハードウェア構成を示す図である。
図1(a)に示すように、システム全体の動作を制御し、また、各種プログラムを地実行するコントローラ部としてのCPU(Central Processing Unit)1、実時間を測定するためのリアルタイムクロック2(RTC:Real Time Clock)2、各種プログラムやデータベースを格納する蓄積部としてのハードディスク9、ハードディスク9に格納されたプログラムが、CPU1による処理のために展開されるRAM(Random Access Memory)10を備えている。
また、マンマシンインターフェイスとして、I/O3を介して、表示装置としてのディスプレイ4、入力手段としてのキーボード5、マウス6、会議中の発言者の音声を録音するためのマイク(音声入力装置)7、録音した音声を再生するためのスピーカー(音声出力装置)8を備えている。
図1(b)は、本実施形態に係る発言記録装置のソフトウェア構成を示す図である。
図1(b)に示すように、装置に備えるハードディスク9には、会議の議題(話題)が、アジェンダID(以下、単にIDと表記する)、その詳細の内容とともに記録された話題データベースとしてのアジェンダDB(データベース)21、マイク7によって取得される音声が登録される音声DB22、音声DB22に登録された音声から認識された音声テキストに含まれる単語が登録される認識音声テキストDB23、認識音声テキストDB23に登録された音声テキスト及びアジェンダDB21に登録される議題、詳細情報から抽出される名詞が登録されるキーワードDB24が格納されている。
また、装置に備えるRAM10には、マイク7によって会議中の発言の音声を取得し、発言者、議題毎の音声データに分割して、RTC2から得られる、発言が行われた実時間とともに音声DB22に登録する音声取得部31、音声DB22に登録された音声データに対して音声認識を行って音声テキストを得る音声認識部32、得られた音声テキストについて形態素解析を行って得た単語を、認識音声テキストDB23に登録するとともに、登録した単語から名詞を取り出してキーワードDB24に登録する形態素解析部33を備える。また、形態素解析部33は、アジェンダDB21に登録される議題、詳細情報から議題ごとのキーワード(名詞)を抽出してキーワードDB24に登録する。
また、各プログラムの実行結果や各データベースに格納される情報に基づいて、ディスプレイ4にインターフェイス画面を表示し、表示内容を変更する表示生成部34、音声DB22に格納された音声データを再生し、スピーカー8から出力する処理を行う音声再生部35を備えている。
これらの各処理部としてのプログラムを、CD−ROMやメモリカードなどの記録媒体に格納することで、マイクやスピーカーを有する汎用的なあらゆるコンピュータでこれらのプログラムを実行して本実施形態の発言記録装置として使用することが可能である。
図2は、本実施形態に係る発言記録装置における基本的なインターフェイスを示す図である。
図2に示すインターフェイス画面は、表示生成部34によってディスプレイ4に表示されるものであり、予めアジェンダDB21に入力された議題と、発言者からなるマトリクス40から構成される。
図2のマトリクス40において、ID列41に、会議における議題が表示され、キーワード列42では、会議の発言者毎のセルに、キーワードDB24に登録されたキーワードが表示される。
より詳細には、マイク7によって取得された発言者の発言は、音声取得部31によって、一人の発言者の一回の発言ごとに分割され(従来から知られる音声処理における話者特定が適用可能である)、音声認識部32、形態素解析部33による処理によってキーワードが抽出され、抽出されたキーワードが、マトリクス40におけるキーワード列42中、該当する発言者の列のセルにタグクラウド43として表示される。
図2に示す例では、ID1の議題に該当する列41−1の、発言者Cに該当するセルにキーワード(納品、お客さん、バイト等)がタグクラウド43として表示されている。
なお、音声取得部31が音声DB22に、発言者の音声を議題ごとに登録するためには、現在どの議題が話題になっているのかを発言記録装置に指示する必要がある。
そこで、本実施形態の発言記録装置では、マウス6によって、話題指示手段としてのマウスポインタPを操作し、現在会議において、どの議題が話題にされているのかを発言記録装置に指示する。
図3は、話題となる議題が変わった場合、それを装置に明示的に指示する様子を示す図である。
例えば、話題がID1の議題からID2の議題に変わった場合、マウスポインタPをマトリクス40のID列41のID2の議題のセルに移動させる。
議題が移行すると、移行した先のセルでタグクラウドが生成されはじめる。もちろん、キーボードなどからの入力によって議題を移行しても良い。
より詳細には、音声取得部31は、マトリクス40におけるID列41の何れかにマウスポインタPがあるかにより、音声DB22に音声データとともに書き込む議題のIDを変更する。例えば、マウスポインタPがID2の議題に対応する列41−2にあれば、音声取得部31は、ID2の議題が話題になっていた時の発言であるとして音声DB22に登録する。列41−3、41−4についても同様である。
また、ある議題が話題になっているときに、その議題以外の話題になることがあるが、その場合にも、その旨を発言記録装置に指示を行う。
図4は、発言を記録中に、その発言が、議題以外の話題になったとき、装置に対して明示的にその旨を指示する様子を示す図である。
図4に示すように、現在話題になっている議題以外の発言がされた時には、マウスポインタPを、図2におけるマトリクス40の列41−5(その他)に置くことで、言は、ID「その他」として音声DB22に記録されていき、続く形態素解析部33、表示生成部34による処理を経て、その時に発話された発言は、その他の列41−5の、発言者に該当するセル(発言者がCであれば、セル90)にタグクラウドとして表示される。
次に、各データベースにおける登録内容と、データベースに登録を行うための各処理部(プログラム)の動作、及びマトリクス40にキーワードを表示するための処理を詳細に説明する。
図5は、アジェンダDB21に登録される内容を示す概要図である。
ID列51には、個々の議題のID、議題列52には、この議題の議題、詳細列53には、議題の詳細の内容が示される。
図6は、音声DB22に登録される内容を示す概要図である。
音声DB22は、音声取得部31によって取得された音声データを一人の発言者の一回の発言に分割して登録したものである。
列61には、発言が開始された時間、列62には、その発言が続いた時間(次の発言が始まる前の時間)、列63には発言者、列64には分割したファイルを識別するためのID、列65には、ステータスとして、どのIDの議題に関連してなされた発言であるか、が格納される。
これは、図3、4に関連して説明したマトリクス中のマウスポインタPの位置により決定されるものである。
図6において、例えば15時43分25秒01から5秒04間、発言者AによりID1の議題についてなされた発言がID56のファイルとして格納されていることを意味している。
図7は、音声取得部31が、音声を音声DB22に登録する処理を説明するフローチャートである。
図7に示すように、まず、マイク7から会議中の音声が取得され(ステップS101)、音声取得部31が、発言者ごとに音声ファイルを分割し(ステップS102)、次いで、RTC2から時間情報を取得して(ステップS103)、発言者、音声データ、時間、ファイルIDを音声DB22に登録する(ステップS104)。
図8は、認識音声テキストDB23に登録される内容を示す概要図である。
認識音声テキストDB23は、形態素解析部33が、音声DB22に登録された発言者の一回の発言に対して形態素解析を行って抽出した単語を、その発話を開始した時間、単語を発していた発話時間、その単語を発した発言者、その品詞、単語を発していた際に話題になっていた議題のIDとともに登録したものである。
図8において、列71には単語の発話が開始された時間、列72には発話時間(単位はミリ秒)、列73には、発言者、列74には単語、列75にはその単語の品詞、列76にはステータスとして、単語を発していた際に話題になっていた議題が登録されている。
図8において、例えば15時43分25秒01から84ミリ秒の間発言者Aによって「納期」という名詞がID1の話題について発話されたことが登録されている。
図9は、形態素解析部33が、発言中の単語を認識音声テキストDBに登録する処理を説明するフローチャートである。
まず、音声DB22に登録された音声データが取得され(ステップS201)、音声認識部32が音声データに対して音声認識を行い、音声テキストを取得する(ステップS202)。
その際、音声認識部32は、音声認識した認識語に対応する時間情報を取得する(ステップS203)。すなわち、音声データ中の各音に対応する、発話時間中の時点を取得する。
次に、形態素解析部33が、取得された音声テキスト情報に対して形態素解析を行って、単語に分割し、その品詞の判別をも行う(ステップS204)。
次いで、形態素解析部33は、ステップS203で得られた時間情報に基づいて、各単語の開始時間、発話時間、単語、発言者、品詞情報を認識音声テキストDB23に登録する(ステップS205)。
図10は、キーワードDB24に登録される内容を示す概要図である。
キーワードDB24は、認識音声テキストDB23に登録した単語のうち、名詞のみを、その単語が発話された議題、図2のマトリクスにおいてその単語を表示すべきID列、発言者、発話された回数とともに登録したものである。
図10において、列81には、マトリクス40において単語を表示すべき位置(ID列)、列82には、ステータスとして、単語が発話された議題のID、列83にその単語、列84にはその単語を発話した発言者、列85には議題において単語が発話された回数(すなわち、マトリクス40の表示位置中に単語が出現した回数)が格納される。
図10において、例えば、「開発環境」という単語が、ID1の議題が話題になっている際に、発言者Aによって2回発話され、その単語は、図2のマトリクスにおいて、キーワード列42中、発言者Aについての列の、ID1の議題に対応するセル中のタグクラウド43に表示すべきであることが登録されている。セル87については図11で説明する。
また、図10中、行86には、形態素解析部33によって、アジェンダDB21の議題、詳細の欄に記されたテキストを形態素解析して得られた単語(名詞)が、列51に示される対応する議題のID、出現した回数とともに登録されている。
図11は、形態素解析部33によって、音声認識テキストDB23の単語をキーワードDB24に登録する処理を説明するフローチャートである。
形態素解析部33は、認識音声テキストDB23における、品詞が名詞である単語を、発言者、ステータス(議題)とともに取得する(ステップS301)。
図4に関連して述べたように、話題になっている議題とは関係のない発言がなされた場合に、ステータスをID「その他」として音声を記録する旨発言記録装置に指示可能であることを説明したが、記録されたステータスが「その他」である場合は(ステップS302でYes)、音声認識テキストDB23に登録されている他の単語のうち、ステータスがID(「その他」以外)となっているものとマッチングを行い(ステップS303)、同じ単語が存在すれば(ステップS304でYes)、列81に、その単語のIDを、列81の該当するセルに、「その他」ととともに入力する(ステップS305)(図10のセル87を参照)。
同じ単語がない場合(ステップS304でNo)、列81のセルには「その他」を代入する(ステップS306)。
次に、キーワードDBの同じステータス(議題)に同じ単語が存在するかを検索し(ステップS307)、存在しない場合(ステップS308でNo)、キーワードDB24に行を追加し(ステップS309)、表示位置、ステータス、単語、発言者、回数を入力する。存在する場合は(ステップS308でYes)、その単語に該当する行の、列85の値に加算する(ステップS310)。
ステップS302においてNoの場合、すなわちステータスがIDである場合には、そのままステップS307に移動する。
図12は、形態素解析部33によって、アジェンダDB21の単語をキーワードDB24に登録する処理を説明するフローチャートである。
形態素解析部33は、アジェンダDB21から議題、詳細情報を取得する(ステップS401)。次に、取得した議題、詳細情報に対して形態素解析を行い(ステップS402)、その結果として得た単語から名詞のみを取得する(ステップS403)。そして、その名詞を、議題毎に、そのIDとともに、キーワードDB24に入力する(ステップS404)。
図13は、表示生成部34が、マトリクス中にタグクラウドを表示する処理を説明するフローチャートである
表示生成部34は、キーワードDB24にアクセスし、表示位置(列81)、単語(列83)、発言者(列84)、回数(列85)を取得する(ステップS502)。
次に、表示位置ごとの単語の回数を加算し、それぞれの単語の回数で割って割合を求める(ステップS502)。
さらに、表示位置、発言者を考慮して、ステップ502で求めた割合に応じた大きさのフォントで単語を生成する(ステップS503)。
以上が、本実施形態の装置における発言者の発言からのキーワードの抽出・表示の基本的な流れである。
図14は、その他の欄に表示されたタグクラウド中の単語を明示的に議題についての欄に移動させる様子を示す図である。
図14において、その他の欄のセル90に表示されているタグクラウドの中の単語100が、ID2の議題に対応すると考えられる場合は、マウスポインタPを操作して単語100を同じ発言者のID2に議題に対応するセル91にドラッグすることで、セル91のタグクラウドに、単語100を含ませることが出来る。
それに連動して、キーワードDB24の列81(表示位置)の内容が変更されることは言うまでもない。
なお、本発明の装置では、図2に示すように他の議題に移行した時、その他の列に表示されていたキーワードから、移行先の議題に関連のありそうな単語タグクラウドとして表示することが出来る。
図15は、関連する発言キーワードが出現する状態について説明する図である。
例えば、ID2の議題に移行した場合、ID「その他」の議題についてのセル90におけるID2の議題に関連する単語、「送料、トラック、倉庫、無料」がタグクラウド92として表示される。
こうすることで、単語ベースで、どのような発言があったのかを振り返ることができる。
図16は、表示生成部による関連キーワードの表示処理を示すフローチャートである。
議題が移行すると、表示生成部34は、移行先のステータス(議題)を取得する(ステップS601)。
次に、キーワードDB24にアクセスし、その他の表示位置の該当するサブ表示位置(セル87)の単語、発言者、回数を取得する(ステップS602)。
次に、取得した単語の回数を加算し、それぞれの単語の回数で割って割合を求める(ステップS603)。
そして、表示位置、発言者を考慮し、求めた割合に応じた大きさのフォントで単語を生成、表示する(ステップS604)。
図17は、発言の振り返り表示について説明する図である。
マトリクス40のセルに表示されたタグクラウド中の単語にマウスカーソルPを合わせると、表示生成部34は、認識音声テキストDBに登録されたテキストに基づいて、選択された単語が発話された前後(例えば50文字)の単語と共に文章93として列挙される。それにより、どのような発言だったのかを簡単に振り返ることができる。
もちろん、図2に示すような強調表示されたタグクラウドの中の単語をクリックしても同様の効果を得られる。
図18は、表示生成部34による発言の振り返り表示処理を説明するフローチャートである。
図18に示すように、タグクラウド中の単語がクリックされると(ステップS701でYes)、クリックされた単語と、表示位置を取得する(ステップS702)。次に、キーワードDB24からステータス(議題)を取得し(ステップS703)、認識音声テキストDB23の該当するステータスの該当する単語を検索する(ステップS704)。単語があった場合は(ステップS705でYes)、該当する単語から前後の規定数(例えば50文字)の文字列を取得し(ステップS706)、前後の規定数の文字列を生成する(ステップS707)。その際、文字列の中で、該当単語の文字色を変更したり、書体をボールドにするなどして強調表示をしても良い。
そして、ステップS705に戻り、該当する単語が無くなるまで続ける。
図19は、記録された発言の再生について説明する図である。
図19において、図17の状態で、マウスポインタPにより、更にその文章を選択(クリック)することにより、音声が再生される。これにより、発話内容を完全に振り返ることができる。
図20は、音声再生部よる発言の再生の処理を説明するフローチャートである。
マトリクス40中の文章がクリックされたことがI/O3によって検知されると(ステップS801)、音声再生部35は、クリックされた文章を取得する(ステップS802)。次に、音声認識テキストDB23にアクセスして、開始時間と発言者を取得する(ステップS803)。さらに、音声DB22から開始時間と発言者を元にファイルIDを取得する(ステップ804)。そして、ファイルIDから音声ファイルを取得し(ステップS805)、再生を行う(ステップS806)。
図21は、新規議題の作成について説明する図である。
タグクラウドの中の単語から、新たに議題を生成する場合には、その目的の単語101を、マウスなどでID列41にドラッグすることにより、アジェンダDBに議題が作成され、図2のマトリクス40における表示も変更される。
図22は、重要性、関係性スライダーについて説明する図である。
発話内容の重要性や関連性について、ファシリテータがレベルを入れながらファシリテーションできる。議題の下にある、レベル入力UI102から入力しても良いし、ホイールマウスで入力する方法も考えられる。
図23は、誤認識タグの削除について説明する図である。
誤認識され、そぐわない単語が表示されている場合には、その単語103をディスプレイ4に別途表示したゴミ箱にドラッグすることで、誤認識タグを消すことができる。また、設定により、その部分の音声認識をし直すことも可能となる。
1 CPU、2 リアルタイムクロック、3 I/O、4 ディスプレイ、5 キーボード、6 マウス、7 マイク、8 スピーカー、9 ハードディスク、10 RAM、21 アジェンダDB、22 音声DB、23 音声認識テキストDB、23 認識音声テキストDB、24 キーワードDB、31 音声取得部、32 音声認識部、33 形態素解析部、34 表示生成部、35 音声再生部、40 マトリクス
特開2004−023661公報

Claims (12)

  1. 音声入力装置及び音声出力装置を備え、発言の音声を記録し、再生することが可能な発言記録装置であって、
    前記音声入力装置によって発言の音声を音声データとして取得し、取得した音声データを、予め話題データベースに登録された複数の話題中、話題指示手段によって指示された話題及び音声データから識別される話者ごとに音声データベースに登録する音声取得部と、
    前記音声データベースに登録された音声データに対して音声認識を行ってテキスト情報を取得する音声認識部と、
    該音声認識部によって得られたテキスト情報に対して形態素解析を行い、得られた単語から抽出したキーワードを、前記音声データベースに音声とともに登録した話題及び話者とともにキーワードデータベースに登録する形態素解析部と、
    前記キーワードを、話題及び話者に関連づけたマトリクス中に表示する表示生成部と、
    を備えたことを特徴とする発言記録装置。
  2. 請求項1に記載の発言記録装置において、前記キーワードは、前記テキスト情報中の名詞であることを特徴とする発言記録装置。
  3. 請求項1又は2に記載の発言記録装置において、
    前記表示生成部は、前記マトリクス中に表示されたキーワードについて、当該キーワードの前後所定数の単語からなる文章を表示することを特徴とする発言記録装置。
  4. 請求項3に記載の発言記録装置において、
    実時間を計測する実時間計測手段と、前記音声データベースに登録された音声データを前記音声出力装置によって再生する音声再生部と、を備え、
    前記音声取得部は、前記音声データを、前記実時間計測手段の計測結果に基づく開始時間とともに取得し、
    前記形態素解析部は、前記音声データにおける各単語の開始時間を取得し、
    前記音声再生部は、前記文章を構成する単語の開始時間に基づいて音声データを再生することを特徴とする発言記録装置。
  5. 請求項1乃至4の何れか一項に記載の発言記録装置において、現在なされている発言が前記話題指示手段により指示されていた話題とは無関係である旨指示がなされた状態で音声データが前記音声データベースに登録された場合、前記表示生成部は、当該音声データから得られるキーワードを前記マトリクス中の専用領域に区別して表示することを特徴とする発言記録装置。
  6. 請求項5に記載の発言記録装置において、前記話題データベースは、話題毎に予め説明文を格納し、前記表示生成部は、前記専用領域に表示されたキーワードが、前記形態素解析部により前記説明文に対して形態素解析を行って得られる単語と合致する場合は、前記マトリクスにおける当該単語が含まれる話題に対応する箇所にも当該キーワードを表示することを特徴とする発言記録装置。
  7. 請求項1乃至6の何れか一項に記載の発言記録装置において、
    前記マトリクス中に表示されたキーワードに基づいて、前記話題データベースに新たに話題を追加できることを特徴とする発言記録装置。
  8. 請求項1乃至7の何れか一項に記載の発言記録装置において、前記マトリクス中に表示されるキーワードについて、重要度や話題との関連度を入力する手段を備えたことを特徴とする発言記録装置。
  9. 請求項1乃至8の何れか一項に記載の発言記録装置において、前記マトリクス中に表示されるキーワードは削除可能であり、キーワードの削除が削除されると、前記音声認識部は、再度音声認識をし直すことを特徴とする発言記録装置。
  10. 音声入力装置及び音声出力装置を備え、発言の音声を記録し、再生することが可能な発言記録装置の発言記録方法であって、
    前記発言記録装置が有する音声取得部が、前記音声入力装置によって発言の音声を音声データとして取得し、取得した音声データを、予め話題データベースに登録された複数の話題中、話題指示手段によって指示された話題及び音声データから識別される話者ごとに音声データベースに登録するステップと、
    前記発言記録装置が有する音声認識部が、前記音声データベースに登録された音声データに対して音声認識を行ってテキスト情報を取得するステップと、
    前記発言記録装置が有する形態素解析部が、該音声認識部によって得られたテキスト情報に対して形態素解析を行い、得られた単語から抽出したキーワードを、前記音声データベースに音声とともに登録した話題及び話者とともにキーワードデータベースに登録するステップと、
    前記発言記録装置が有する表示生成部が、前記キーワードを、話題及び話者に関連づけたマトリクス中に表示するステップと、を含むこと特徴とする発言記録方法。
  11. コンピュータに、請求項10に記載の発言記録方法を実行させるためのプログラム。
  12. 請求項11に記載のプログラムを記録したことを特徴とするコンピュータが読み取り可能な記録媒体。
JP2009255361A 2009-11-06 2009-11-06 発言記録装置、発言記録方法、プログラム及び記録媒体 Expired - Fee Related JP5257330B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2009255361A JP5257330B2 (ja) 2009-11-06 2009-11-06 発言記録装置、発言記録方法、プログラム及び記録媒体
CN2010105268329A CN102063461A (zh) 2009-11-06 2010-10-25 发言记录装置以及发言记录方法
US12/939,646 US8862473B2 (en) 2009-11-06 2010-11-04 Comment recording apparatus, method, program, and storage medium that conduct a voice recognition process on voice data
EP10251899A EP2320333A3 (en) 2009-11-06 2010-11-04 Comment recording appartus, method, program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009255361A JP5257330B2 (ja) 2009-11-06 2009-11-06 発言記録装置、発言記録方法、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2011100355A JP2011100355A (ja) 2011-05-19
JP5257330B2 true JP5257330B2 (ja) 2013-08-07

Family

ID=43638831

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009255361A Expired - Fee Related JP5257330B2 (ja) 2009-11-06 2009-11-06 発言記録装置、発言記録方法、プログラム及び記録媒体

Country Status (4)

Country Link
US (1) US8862473B2 (ja)
EP (1) EP2320333A3 (ja)
JP (1) JP5257330B2 (ja)
CN (1) CN102063461A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10366154B2 (en) 2016-03-24 2019-07-30 Kabushiki Kaisha Toshiba Information processing device, information processing method, and computer program product
US11087767B2 (en) 2018-11-16 2021-08-10 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9058814B2 (en) * 2010-11-15 2015-06-16 At&T Intellectual Property I, L.P. Mobile devices, methods, and computer program products for enhancing social interactions with relevant social networking information
US8825478B2 (en) * 2011-01-10 2014-09-02 Nuance Communications, Inc. Real time generation of audio content summaries
US20130007635A1 (en) * 2011-06-30 2013-01-03 Avaya Inc. Teleconferencing adjunct and user interface to support temporary topic-based exclusions of specific participants
JP5954771B2 (ja) * 2012-02-27 2016-07-20 東芝メディカルシステムズ株式会社 医用情報処理システム及び医用情報処理装置
US20140129221A1 (en) * 2012-03-23 2014-05-08 Dwango Co., Ltd. Sound recognition device, non-transitory computer readable storage medium stored threreof sound recognition program, and sound recognition method
US10373508B2 (en) * 2012-06-27 2019-08-06 Intel Corporation Devices, systems, and methods for enriching communications
US9495350B2 (en) 2012-09-14 2016-11-15 Avaya Inc. System and method for determining expertise through speech analytics
JP2014085998A (ja) * 2012-10-26 2014-05-12 Univ Of Yamanashi 電子ノート作成支援装置および電子ノート作成支援装置用プログラム
KR20140064246A (ko) * 2012-11-20 2014-05-28 한국전자통신연구원 착용형 디스플레이 장치
JP6232716B2 (ja) 2013-03-11 2017-11-22 株式会社リコー 情報処理装置、表示制御システムおよびプログラム
JP6375592B2 (ja) * 2013-03-12 2018-08-22 株式会社リコー 情報処理装置及び情報処理方法並びにプログラム
WO2015097702A1 (en) * 2013-12-25 2015-07-02 Heyoya Systems Ltd. System and methods for vocal commenting on selected web pages
US11043287B2 (en) * 2014-02-19 2021-06-22 Teijin Limited Information processing apparatus and information processing method
JP6027580B2 (ja) * 2014-08-27 2016-11-16 京セラドキュメントソリューションズ株式会社 情報表示システムおよび情報表示プログラム
JP2016091487A (ja) * 2014-11-11 2016-05-23 セイコーエプソン株式会社 表示装置および表示制御方法
CN107210036B (zh) * 2015-02-03 2021-02-26 杜比实验室特许公司 会议词语云
US11076052B2 (en) * 2015-02-03 2021-07-27 Dolby Laboratories Licensing Corporation Selective conference digest
US9672829B2 (en) * 2015-03-23 2017-06-06 International Business Machines Corporation Extracting and displaying key points of a video conference
WO2016163028A1 (ja) * 2015-04-10 2016-10-13 株式会社東芝 発言提示装置、発言提示方法およびプログラム
US10831996B2 (en) * 2015-07-13 2020-11-10 Teijin Limited Information processing apparatus, information processing method and computer program
CN105808733B (zh) * 2016-03-10 2019-06-21 深圳创维-Rgb电子有限公司 显示方法及装置
JP6091690B1 (ja) * 2016-08-08 2017-03-08 株式会社ミサゴ技研 議会運営支援システム及び議会運営支援方法
CN106448683A (zh) * 2016-09-30 2017-02-22 珠海市魅族科技有限公司 查看多媒体文件中录音的方法及装置
KR102444165B1 (ko) 2017-01-20 2022-09-16 삼성전자주식회사 적응적으로 회의를 제공하기 위한 장치 및 방법
JP6737398B2 (ja) 2017-03-24 2020-08-05 ヤマハ株式会社 重要単語抽出装置、関連会議抽出システム、及び重要単語抽出方法
US10679182B2 (en) 2017-05-17 2020-06-09 International Business Machines Corporation System for meeting facilitation
US10832803B2 (en) 2017-07-19 2020-11-10 International Business Machines Corporation Automated system and method for improving healthcare communication
US10825558B2 (en) * 2017-07-19 2020-11-03 International Business Machines Corporation Method for improving healthcare
US10535352B2 (en) * 2017-11-16 2020-01-14 International Business Machines Corporation Automated cognitive recording and organization of speech as structured text
JP6969040B2 (ja) * 2017-12-18 2021-11-24 一般社団法人 教育環境デザイン研究所 授業改善のためのネットワークシステム
JP6904435B2 (ja) * 2017-12-25 2021-07-14 京セラドキュメントソリューションズ株式会社 情報処理装置及び発話解析方法
CN108346034B (zh) * 2018-02-02 2021-10-15 深圳市鹰硕技术有限公司 一种会议智能管理方法及系统
US10673913B2 (en) * 2018-03-14 2020-06-02 8eo, Inc. Content management across a multi-party conference system by parsing a first and second user engagement stream and transmitting the parsed first and second user engagement stream to a conference engine and a data engine from a first and second receiver
JP6783029B2 (ja) * 2018-03-22 2020-11-11 Kddi株式会社 研修におけるユーザ同士の議論内容を分析する装置、プログラム及び方法
CN108538299A (zh) * 2018-04-11 2018-09-14 深圳市声菲特科技技术有限公司 一种自动会议记录方法
JP6937730B2 (ja) * 2018-09-10 2021-09-22 ヤフー株式会社 情報共有支援装置、情報共有支援方法、およびプログラム
TWI767189B (zh) * 2020-02-15 2022-06-11 淡江大學 工作日誌登載系統

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03185505A (ja) 1989-12-14 1991-08-13 Honda Motor Co Ltd 自走車の操向制御装置
JP2844925B2 (ja) 1990-12-13 1999-01-13 ブラザー工業株式会社 ラベルセット可能な加工布折曲げ装置
GB2285895A (en) * 1994-01-19 1995-07-26 Ibm Audio conferencing system which generates a set of minutes
JPH08317365A (ja) 1995-05-22 1996-11-29 Matsushita Electric Ind Co Ltd 電子会議装置
US5855000A (en) * 1995-09-08 1998-12-29 Carnegie Mellon University Method and apparatus for correcting and repairing machine-transcribed input using independent or cross-modal secondary input
US5794249A (en) 1995-12-21 1998-08-11 Hewlett-Packard Company Audio/video retrieval system that uses keyword indexing of digital recordings to display a list of the recorded text files, keywords and time stamps associated with the system
JPH10271430A (ja) 1997-03-26 1998-10-09 Sanyo Electric Co Ltd 情報処理装置および情報処理方法
US6850609B1 (en) * 1997-10-28 2005-02-01 Verizon Services Corp. Methods and apparatus for providing speech recording and speech transcription services
US6298129B1 (en) * 1998-03-11 2001-10-02 Mci Communications Corporation Teleconference recording and playback system and associated method
US6785429B1 (en) 1998-07-08 2004-08-31 Matsushita Electric Industrial Co., Ltd. Multimedia data retrieval device and method
US6754631B1 (en) * 1998-11-04 2004-06-22 Gateway, Inc. Recording meeting minutes based upon speech recognition
JP2000352995A (ja) * 1999-06-14 2000-12-19 Canon Inc 会議音声処理方法および記録装置、情報記憶媒体
US6996526B2 (en) * 2002-01-02 2006-02-07 International Business Machines Corporation Method and apparatus for transcribing speech when a plurality of speakers are participating
US20030187632A1 (en) * 2002-04-02 2003-10-02 Menich Barry J. Multimedia conferencing system
JP2004023661A (ja) 2002-06-19 2004-01-22 Ricoh Co Ltd 記録情報処理方法、記録媒体及び記録情報処理装置
WO2004002144A1 (ja) * 2002-06-24 2003-12-31 Matsushita Electric Industrial Co., Ltd. メタデータ作成装置、その作成方法および検索装置
US20040021765A1 (en) * 2002-07-03 2004-02-05 Francis Kubala Speech recognition system for managing telemeetings
US7466334B1 (en) * 2002-09-17 2008-12-16 Commfore Corporation Method and system for recording and indexing audio and video conference calls allowing topic-based notification and navigation of recordings
JP2004178123A (ja) * 2002-11-26 2004-06-24 Hitachi Ltd 情報処理装置、該情報処理装置を実現するためのプログラム
US7248684B2 (en) * 2002-12-11 2007-07-24 Siemens Communications, Inc. System and method for processing conference collaboration records
JP4558308B2 (ja) * 2003-12-03 2010-10-06 ニュアンス コミュニケーションズ,インコーポレイテッド 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム
US7542971B2 (en) * 2004-02-02 2009-06-02 Fuji Xerox Co., Ltd. Systems and methods for collaborative note-taking
JP4458888B2 (ja) * 2004-03-22 2010-04-28 富士通株式会社 会議支援システム、議事録生成方法、およびコンピュータプログラム
US7133513B1 (en) * 2004-07-21 2006-11-07 Sprint Spectrum L.P. Method and system for transcribing voice content of an on-going teleconference into human-readable notation
US20060074623A1 (en) * 2004-09-29 2006-04-06 Avaya Technology Corp. Automated real-time transcription of phone conversations
JP2006251898A (ja) * 2005-03-08 2006-09-21 Fuji Xerox Co Ltd 情報処理装置、情報処理方法およびプログラム
US20070106724A1 (en) * 2005-11-04 2007-05-10 Gorti Sreenivasa R Enhanced IP conferencing service
US20070185857A1 (en) * 2006-01-23 2007-08-09 International Business Machines Corporation System and method for extracting salient keywords for videos
JP4215792B2 (ja) * 2006-09-22 2009-01-28 株式会社東芝 会議支援装置、会議支援方法および会議支援プログラム
JP4466665B2 (ja) * 2007-03-13 2010-05-26 日本電気株式会社 議事録作成方法、その装置及びそのプログラム
JP4466666B2 (ja) * 2007-03-14 2010-05-26 日本電気株式会社 議事録作成方法、その装置及びそのプログラム
US7831427B2 (en) 2007-06-20 2010-11-09 Microsoft Corporation Concept monitoring in spoken-word audio
WO2009051791A2 (en) * 2007-10-16 2009-04-23 George Alex K Method and system for capturing voice files and rendering them searchable by keyword or phrase
US8214242B2 (en) * 2008-04-24 2012-07-03 International Business Machines Corporation Signaling correspondence between a meeting agenda and a meeting discussion
US20100268534A1 (en) * 2009-04-17 2010-10-21 Microsoft Corporation Transcription, archiving and threading of voice communications

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10366154B2 (en) 2016-03-24 2019-07-30 Kabushiki Kaisha Toshiba Information processing device, information processing method, and computer program product
US11087767B2 (en) 2018-11-16 2021-08-10 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Also Published As

Publication number Publication date
US8862473B2 (en) 2014-10-14
US20110112835A1 (en) 2011-05-12
EP2320333A3 (en) 2012-06-20
JP2011100355A (ja) 2011-05-19
CN102063461A (zh) 2011-05-18
EP2320333A2 (en) 2011-05-11

Similar Documents

Publication Publication Date Title
JP5257330B2 (ja) 発言記録装置、発言記録方法、プログラム及び記録媒体
TWI496012B (zh) 管理電子形式之中文、日文及韓文語言資料的模組系統與方法
TWI488174B (zh) 自動地建立文字資料與音訊資料間之映射
US10896222B1 (en) Subject-specific data set for named entity resolution
JP2007206317A (ja) オーサリング方法、オーサリング装置およびプログラム
US20080077869A1 (en) Conference supporting apparatus, method, and computer program product
JP2015531915A (ja) 対応メディアコンテンツ部分の整合
JP2001188777A (ja) 音声をテキストに関連付ける方法、音声をテキストに関連付けるコンピュータ、コンピュータで文書を生成し読み上げる方法、文書を生成し読み上げるコンピュータ、コンピュータでテキスト文書の音声再生を行う方法、テキスト文書の音声再生を行うコンピュータ、及び、文書内のテキストを編集し評価する方法
JP2006178087A (ja) 字幕生成装置、検索装置、文書処理と音声処理とを融合する方法、及びプログラム
US10997223B1 (en) Subject-specific data set for named entity resolution
JP6280312B2 (ja) 議事録記録装置、議事録記録方法及びプログラム
JP2021182438A (ja) 動画生成方法、装置、電子機器およびコンピュータ可読媒体
JP5753769B2 (ja) 音声データ検索システムおよびそのためのプログラム
JP2008083100A (ja) 音声対話装置及びその方法
JP2008083952A (ja) 辞書作成支援システム、方法及びプログラム
JP6064629B2 (ja) 音声入出力データベース検索方法、プログラム、及び装置
KR20060100646A (ko) 영상물의 특정 위치를 검색하는 방법 및 영상 검색 시스템
JP2008052676A (ja) コンピュータ実行可能なプログラム、方法、および処理装置
KR102643902B1 (ko) 회의록 관리 방법 및 장치
JP2006236037A (ja) 音声対話コンテンツ作成方法、装置、プログラム、記録媒体
WO2021153403A1 (ja) テキスト情報編集装置及びテキスト情報編集方法
JP2011113426A (ja) 辞書作成装置,辞書作成プログラムおよび辞書作成方法
JP2002268667A (ja) プレゼンテーションシステムおよびその制御方法
JP4341077B2 (ja) 文書処理装置、文書処理方法、および、文書処理プログラム
KR102446300B1 (ko) 음성 기록을 위한 음성 인식률을 향상시키는 방법, 시스템, 및 컴퓨터 판독가능한 기록 매체

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130327

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130408

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160502

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5257330

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees