JP6962849B2 - 会議支援装置、会議支援制御方法およびプログラム - Google Patents

会議支援装置、会議支援制御方法およびプログラム Download PDF

Info

Publication number
JP6962849B2
JP6962849B2 JP2018066836A JP2018066836A JP6962849B2 JP 6962849 B2 JP6962849 B2 JP 6962849B2 JP 2018066836 A JP2018066836 A JP 2018066836A JP 2018066836 A JP2018066836 A JP 2018066836A JP 6962849 B2 JP6962849 B2 JP 6962849B2
Authority
JP
Japan
Prior art keywords
unit
conference
minutes
voice
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018066836A
Other languages
English (en)
Other versions
JP2019179081A (ja
Inventor
卓 川内
一博 中臺
研郎 鵜殿
雅樹 五十嵐
智幸 佐畑
一也 眞浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2018066836A priority Critical patent/JP6962849B2/ja
Publication of JP2019179081A publication Critical patent/JP2019179081A/ja
Application granted granted Critical
Publication of JP6962849B2 publication Critical patent/JP6962849B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、会議支援装置、会議支援制御方法およびプログラムに関する。
複数人が会議をする場合において、各発言者の発話内容をテキスト化して、発話内容をテキスト化して各利用者が所有する再生装置に表示することが提案されている(例えば特許文献1参照)。なお、特許文献1に記載の技術では、発話を話題毎に音声メモとして録音し、議事録作成者が、録音された音声メモを再生してテキスト化を行う。そして、特許文献1に記載の技術では、テキスト化したものを用いて議事録を作成する。
特開平08−194492号公報
会議は、一回の開催で終了する場合もあるが、中断したり一回の開催で終了しない場合もある。このような会議では、別途、会議が再開される。
しかしながら、特許文献1に記載の技術では、会議毎に議事録を作成するため、会議を再開した場合でも異なる議事録となってしまう。
本発明は、上記の問題点に鑑みてなされたものであって、会議が中断された後に再開された場合であっても継続したい会議を音声によって選択可能な会議支援装置、会議支援制御方法およびプログラムを提供することを目的とする。
(1)上記目的を達成するため、本発明の一態様に係る会議支援装置(1)は、収音部(101)と、前記収音部にて音声入力された発話に対して音声認識用辞書(音声認識辞書DB103)を用いて音声認識を行う音声認識部(音声認識部104、テキスト変換部105、係り受け解析部106)と、前記音声認識されたテキストを議事録として表示する表示部(議事録作成部107、画像生成部110、表示部111)と、前記議事録を記憶し、中断している会議の前記議事録に対して中断していることを示す情報を前記議事録に関連付けて記憶する記憶部(議事録記憶部108)と、中断された会議を再開する場合において、前記中断された会議の候補を表示し、表示した前記会議の候補を、音声発話を音声認識した結果に基づいて継続したい会議の候補を絞り込む選択部(議事録選択部109)と、を備える。
(2)また、本発明の一態様に係る会議支援装置において、前記選択部は、継続したい会議の絞込みを、前記会議の出席者、前記会議に関する時刻、および前記議事録から抽出されたキーワードのうち少なくとも1つで絞込みを行うようにしてもよい。
(3)また、本発明の一態様に係る会議支援装置において、前記音声認識部は、継続する会議で使用された音声認識用辞書を用いるようにしてもよい。
(4)また、本発明の一態様に係る会議支援装置において、前記選択部は、継続したい会議の2回目以降の絞り込みの際に、前記会議の出席者を追加して提示、および前記議事録から抽出されたキーワードを追加して提示のうち少なくとも1つを行うようにするようにしてもよい。
(5)また、本発明の一態様に係る会議支援装置において、前記会議支援装置に通信によって接続される子機(3、3a、3b、・・・)であって、前記子機が、収音部(301)と子機表示部(表示部304)と操作部(302)とを備え、前記音声認識部は、前記子機が送信した音声信号に対して前記音声認識用辞書を用いて音声認識を行い、前記収音部が収音した音声信号と、前記子機の収音部が収音した音声新語とに対して音声認識した結果を、前記表示部と前記子機表示部とに表示させるようにしてもよい。
(6)上記目的を達成するため、本発明の一態様に係る会議支援制御方法は、会議の議事録を記憶する記憶部を備える会議支援装置における会議支援方法であって、収音部が、音声入力された発話を取得する収音ステップと、音声認識部が、前記収音ステップにて音声入力された発話に対して音声認識用辞書を用いて音声認識を行う音声認識ステップと、議事録作成部が、前記音声認識ステップによって音声認識されたテキストの議事録を作成し、前記会議が中断された場合に中断されたことを示す情報を前記議事録に関連付けて記憶させる議事録作成ステップと、選択部が、中断された会議を再開する場合において、前記中断された会議の候補を表示し、表示した前記会議の候補を、音声発話を音声認識した結果に基づいて継続したい会議の候補を絞り込む選択ステップと、を含む。
(7)上記目的を達成するため、本発明の一態様に係るプログラムは、会議の議事録を記憶する記憶部を備える会議支援装置のコンピュータに、音声入力された発話を取得する収音ステップと、前記収音ステップにて音声入力された発話に対して音声認識用辞書を用いて音声認識を行う音声認識ステップと、前記音声認識ステップによって音声認識されたテキストの議事録を作成し、前記会議が中断された場合に中断されたことを示す情報を前記議事録に関連付けて記憶させる議事録作成ステップと、中断された会議を再開する場合において、前記中断された会議の候補を表示し、表示した前記会議の候補を、音声発話を音声認識した結果に基づいて継続したい会議の候補を絞り込む選択ステップと、を実行させる。
上述した(1)または(6)あるいは(7)によれば、音声入力によって簡単な手法にて継続したい会議を選択することができる。
上述した(2)によれば、絞込みがしやすくなるという効果を奏する。
上述した(3)によれば、同音異義語等の変換等を適切に行わせることができる。
上述した(4)によれば、一回の音声入力によって候補を絞り込めなかった場合に、会議に関する情報を追加して提示できるので、絞込みがしやすくなるという効果を奏する。
上述した(5)によれば、子機にも会議の議事録を表示させることができるので、健聴者と聴覚障がい者とが一緒に会議に参加しやすくすることができる。
本実施形態に係る会議支援装置の構成例を示すブロック図である。 本実施形態に係る議事録記憶部が記憶する情報例を示す図である。 本実施形態に係る会議状態と議事録の作成例を示す図である。 本実施形態に係る中断した会議を再開する際に表示部に提示される情報例を示す図である。 本実施形態に係る会議録記憶部が記憶する情報を説明するための図である。 本実施形態に係る会議開始時に会議支援装置が行う処理手順例を示すフローチャートである。 本実施形態に係る会議中と会議終了時に表示部上に表示される画像例を示す図である。 図7において、会議終了または会議継続が選択された場合に表示部上に表示される画像例である。 本実施形態に係る会議開始時に表示部上に表示される画像例を示す図である。 本実施形態に係る中断された会議リストの画像の他の例である。 本実施形態の第1変形例における会議継続時に議事録を絞り込めなかった際に表示される画像例を示す図である。 本実施形態に係る第2変形例における会議支援システムの構成例を示すブロック図である。
以下、本発明の実施の形態について図面を参照しながら説明する。
まず、本実施形態の会議支援装置が使用される状況例を説明する。
本実施形態の会議支援装置は、例えば2人以上が参加して行われる会議で用いられる。会議支援装置は、会議の終了時に、その会議が中断なのか終了なのかフラグを付与して記憶する。そして、会議支援装置は、会議に関する情報(参加者、キーワード等)を議事録に関連づけて記憶する。会議支援装置は、会議が再開される際に、利用者の音声を音声認識した結果に基づいて中断されている会議の議事録から候補の議事録を提示する。会議支援装置は、利用者の音声によって、候補の中から再開したい会議を選び、再開された会議の議事録の作成を継続する。
図1は、本実施形態に係る会議支援装置1の構成例を示すブロック図である。
図1に示すように、会議支援装置1は、収音部101、取得部102、音声認識辞書DB103(音声認識用辞書)、音声認識部104、テキスト変換部105(音声認識部)、係り受け解析部106(音声認識部)、議事録作成部107(キーワード抽出部)、議事録記憶部108、議事録選択部109(選択部)、画像生成部110、表示部111、および操作部112を備える。
会議支援装置1は、例えばタブレット端末、スマートフォン、ノートパソコン等である。
収音部101は、マイクロフォンである。収音部101は、利用者の音声信号を収音し、収音した音声信号を取得部102に出力する。なお、収音部101は、参加者毎に装着される。また、収音部101は、マイクロフォンアレイであってもよい。
取得部102は、収音部101が出力する音声信号をアナログ信号からデジタル信号に変換して、デジタル信号に変換した音声信号を音声認識部104に出力する。なお、収音部101が複数の場合、取得部102は、収音部101毎に例えば時分割処理を行う。
音声認識辞書DB103は、例えば音響モデル、言語モデル、単語辞書等を格納しているデータベースである。音響モデルとは、音の特徴量に基づくモデルであり、言語モデルとは、単語とその並び方の情報のモデルである。また、単語辞書とは、多数の語彙による辞書であり、例えば大語彙単語辞書である。なお、会議支援装置1は、音声認識辞書DB103に格納されていない単語等を格納して更新するようにしてもよい。なお、音声認識辞書DB103は、例えば会議毎にDB(データベース)を備えている。例えば、第1のDBが一般の会議用で有り、第2のDBが発表会用であり、第3のDBが国際会議用である。このように会議に合わせたDBを用いることで、同音異義語等の変換等を適切に行わせることができる。
音声認識部104は、取得部102が出力する音声信号を取得する。音声認識部104は、音声信号から発話区間の音声信号を検出する。発話区間の検出は、例えば所定のしきい値以上の音声信号を発話区間として検出する。なお、音声認識部104は、発話区間の検出を周知の他の手法を用いて行ってもよい。音声認識部104は、検出した発話区間の音声信号に対して、音声認識辞書DB103を参照して、周知の手法を用いて音声認識を行う。なお、音声認識部104は、例えば特開2015−64554号公報に開示されている手法等を用いて音声認識を行う。音声認識部104は、認識した認識結果と音声信号をテキスト変換部105に出力する。なお、音声認識部104は、認識結果と音声信号とを、例えば1文毎、または発話句間毎、または話者毎に対応つけて出力する。
なお、音声認識部104は、音声信号が同時に入力された場合、例えば時分割処理によって収音部101毎に音声認識を行う。また、音声認識部104は、マイクロフォンがマイクロフォンアレイの場合、音源分離処理、音源定位処理、音源同定処理等、周知の音声認識処理も行う。
音声認識部104は、議事録選択部109が出力する使用する音声認識辞書DB103を示す情報に基づいて、音声認識処理等に使用する音声認識辞書DB103を切り替える。
テキスト変換部105は、音声認識部104が出力する認識結果に対して、音声認識辞書DB103を参照して、テキストに変換する。なお、テキスト情報は、少なくとも1文字の情報を含む。テキスト変換部105は、変換したテキスト情報と、取得した音声信号を係り受け解析部106に出力する。なお、テキスト変換部105は、発話情報を認識した結果から「あー」、「えーと」、「えー」、「まあ」等の間投詞を削除してテキストに変換するようにしてもよい。
係り受け解析部106は、テキスト変換部105が出力したテキスト情報に対して、音声認識辞書DB103を参照して、形態素解析と係り受け解析を行う。なお、係り受け解析には、例えば、Shift−reduce法や全域木の手法やチャンク同定の段階適用手法においてSVM(Support Vector Machines)を用いる。
係り受け解析部106は、会議を再開する際、形態素解析と係り受け解析を行ったテキスト情報と、解析した結果を議事録選択部109に出力する。
なお、議事録の作成は、例えば、「会議を開始します」等、予め定められたキーワードを検出した後に開始される。または、議事録の作成は、表示部111上に表示されるアイコン(例えば図7参照)を利用者が操作部112を操作した結果に基づいて開始される。会議開始後に、係り受け解析部106は、形態素解析と係り受け解析を行ったテキスト情報と、解析した結果を議事録作成部107に出力する。なお、係り受け解析部106は、テキスト変換部105が出力する音声信号も議事録作成部107に出力する。
また、係り受け解析部106は、議事録作成部107が会議の終了または中断後に議事録を作成する場合、解析した結果に発話者と発話時間を付与して画像生成部110に出力する。なお、発話者(参加者)名は、参加者が使用する収音部101毎に予め係り受け解析部106が記憶していてもよく、会議開始時に参加者が発話によって入力してもよい。
議事録作成部107は、係り受け解析部106が出力したテキスト情報に基づいて、発話者毎に分けて、議事録を作成する。議事録作成部107は、作成した議事録(テキスト情報)と対応する音声信号を議事録記憶部108に記憶させる。なお、議事録作成部107は、会議の開催中に議事録を作成するようにしてもよく、会議が終了または中断された後に議事録を作成するようにしてもよい。議事録作成部107は、議事録を作成する際、または議事録作成後に会議におけるキーワードを抽出し、抽出したキーワードを議事録に関連づけて記憶させる。議事録作成部107は、例えばキーワードマッチングや表層パターンや特開2008−146150号公報に記載の発明の手法等を用いてキーワードを抽出する。または、議事録作成部107は、出現回数が多い言葉をキーワードとして抽出するようにしてもよい。また、議事録作成部107は、発話毎に発話者と発話日時を付与する。なお、発話者(参加者)名は、参加者が使用する収音部101毎に予め議事録作成部107が記憶していてもよく、会議開始時に参加者が発話によって入力してもよい。なお、議事録作成部107は、「あー」、「えーと」、「えー」、「まあ」等の間投詞を削除して議事録を作成するようにしてもよい。
議事録作成部107は、議事録選択部109が出力する選択された議事録を示す情報と、継続指示に応じて、選択された議事録の作成を継続する(再開する)。
議事録記憶部108は、議事録と音声信号を対応付けて記憶する。なお、議事録記憶部108は、議事録に、参加者やキーワードを関連づけて、さらに会議状態(終了か中断か)を関連づけて記憶する。なお、議事録記憶部108が記憶する情報については後述する。
議事録選択部109は、係り受け解析部106が出力する形態素解析と係り受け解析を行ったテキスト情報と、解析した結果を取得する。議事録選択部109は、取得した情報に基づいて、条件に合う議事録を、議事録記憶部108を参照して探索する。議事録選択部109は、探索した議事録に関する情報を画像生成部110に出力する。また、議事録選択部109は、会議開始前に議事録選択のために行われた発話のテキスト情報を画像生成部110に出力する。
また、議事録選択部109は、議事録作成部107が会議の開催中に議事録を作成している場合、作成させた議事録を議事録記憶部108から読み出し、読み出した議事録を画像生成部110に出力する。
議事録選択部109は、中断されている会議の中から、発話によって入力された音声信号に対して音声認識処理等を行った結果に基づいて、継続する会議を選択する。議事録選択部109は、選択した会議の議事録を示す情報と継続指示を議事録作成部107に出力する。また、議事録選択部109は、選択した会議の議事録に含まれる使用する音声認識辞書DB103を示す情報を音声認識部104に出力する。
画像生成部110は、議事録選択部109が出力する議事録に関する情報とテキスト情報とに基づいて画像データを生成する。画像生成部110は、生成した画像データを表示部111に出力する。
表示部111は、例えば液晶表示装置、有機EL表示装置、電子インク表示装置等である。表示部111は、画像生成部110が出力する画像データを表示する。
操作部112は、例えば表示部111上に設けられたタッチパネル式のセンサー、または優先接続または無線接続のキーボード等である。操作部112は、利用者の操作を検出し、検出した結果を議事録選択部109に出力する。
<議事録記憶部108が記憶する情報>
次に、議事録記憶部108が記憶する情報例を説明する。
図2は、本実施形態に係る議事録記憶部108が記憶する情報例を示す図である。
図2に示すように、議事録記憶部108は、会議の名称に、番号と、出席者と、議事録の最終更新日時と、会議状態と、キーワードと、を関連付けて記憶する。例えば、議事録記憶部108は、会議の名称が「経営会議A」に、番号「1」と、出席者「山田、佐藤、竹田」と、最終更新日時「2018.1.13 17:30」と、会議状態「中断」と、キーワード「開発方針、経費削減、業務改善、・・・」を関連付けて記憶する。なお、会議の名称は、利用者が音声で入力してもよく、操作部112を操作して入力してもよい。また、キーワードは、利用者が音声で入力してもよく、操作部112を操作して入力してもよい。なお、最終更新日時は、例えば会議が終了または中断された日時である。
<会議状態>
次に、会議状態と議事録の作成例を説明する。
図3は、本実施形態に係る会議状態と議事録の作成例を示す図である。図3において、横軸は時間tである。
符号g11の示す例では、新規会議が時刻t1に開始され時刻t2に終了した例である。
符号g12の示す例では、新規会議が時刻t11に開始され時刻t12に中断され、時刻12〜t13の期間に休憩が入り、時刻t13に再開され時刻t14に終了した例である。
符号g13の示す例では、新規会議Aが時刻t21に開始され時刻t22に中断され、時刻22〜t23の期間に休憩が入り、新規会議Bが時刻t23に開始され時刻t24に中断され、時刻24〜t25の期間に休憩が入り、新規会議Aが翌日の時刻t25に再開され時刻t26に終了した例である。
このように、会議によっては、再開が別の日になる場合がある。また、中断された会議の間に、他の会議が行われ、その他の会議も中断状態の場合もあり得る。符号g13の場合、中断された会議が2つあるため、会議を再開する際に、どの会議を再開するか選択する必要が生じる。中断された会議が多数の場合や、中断された日時が数日前や数週間前の場合、継続したい会議のデータである議事録を探すのは会議名称だけでは困難である。
このため、本実施形態では、利用者の音声入力に応じて、中断されている会議の議事録に関する情報(会議の名称、出席者、議事録の最終更新日時、会議状態、キーワード)を提示し、更に提示された情報から利用者の音声入力によって絞り込みを行う。
<中断した会議を再開する際に表示部に提示される情報>
次に、中断した会議を再開する際に表示部に提示される情報例を説明する。
図4は、本実施形態に係る中断した会議を再開する際に表示部に提示される情報例を示す図である。
画像g20は、中断した会議を再開する際に、まず表示部111に提示される画像例である。符号g21は、中断された会議のリストであり、右のスクロール部を操作部112を操作することで、リストを上下にスクロールさせることができる。符号g22は、利用者が、再開したい会議を選択するために入力した音声に対して音声認識処理を行った結果である。この場合、音声入力は「伊藤さんと一緒に会議をやった続きを再開したい。」である。
画像g30は、画像g20において入力された音声に基づいて抽出された議事録の候補を提示した画像である。
符号g31は、第1候補であり、番号、会議の名称、参加者、最終更新日時およびキーワードを含む。符号g32は、第2候補であり、番号、会議の名称、参加者、最終更新日時およびキーワードを含む。
符号g33は、利用者が入力した音声に対して音声認識処理を行った結果である。この場合、音声入力は「管理職会議Bをお願いします。」である。
画像g40は、画像g30において入力された音声に基づいて抽出された議事録の候補を提示した画像である。
符号g41は、候補であり、番号、会議の名称、参加者、最終更新日時およびキーワードを含む。
符号g42は、利用者が、利用者が入力した音声に対して音声認識処理を行った結果である。この場合、音声入力は「それでお願いします。」である。
画像g50は、再開したい会議の議事録が選択された後、会議が再開した際に、表示部111上に表示される画像である。
符号g51は、会議の参加者の発話を音声認識した結果のテキスト情報である。テキスト情報には、例えば、発話者と発話日時が含まれている。
なお、図4に示した表示例は一例であり、これに限らない。
図5は、本実施形態に係る会議録記憶部118が記憶する情報を説明するための図である。
図5に示すように、会議状態が終了の場合、会議録記憶部118は、その会議の議事録を記憶(保存)するが、その議事録に対して継続して記録することができない。
また、会議状態が中断の場合、会議録記憶部118は、その会議の議事録を記憶(保存)し、その議事録に対して再開が選択された場合、中断された議事録に再開された会議に議事録を追加して記録することができる。
<会議支援装置1の処理>
次に、会議支援装置1が行う処理手順例を説明する。
図6は、本実施形態に係る会議開始時に会議支援装置1が行う処理手順例を示すフローチャートである。
(ステップS1)利用者は、音声入力によって、ログイン手続きを行う。例えば、利用者は、利用者を識別する識別情報(利用者ID)とパスワードを入力する。または、利用者は、操作部112を操作して、ログイン手続きを行う。会議支援装置1は、参加者毎にログイン手続きを行う。
(ステップS2)議事録選択部109は、参加者の音声、または操作部112が操作指された結果に基づいて、新規の会議を行うのか、中断された会議を再開するのかを設定する。なお、ステップS3〜S11の処理は、会議を再開する際の処理である。新規の会議の場合は、ステップS3〜S1の処理が行われない。また、会議支援装置1は、その会議に参加する参加者名の登録、参加者が使用する収音部101の登録等、会議の設定を行う。会議の設定には、収音部101がピンマイクであるのかマイクロフォンアレイであるか等の設定も含まれている。なお、議事録作成部107は、これらの会議の設定情報を議事録に対応付けて、議事録記憶部108に記憶させる。なお、議事録作成部107は、終了した会議については、会議の設定情報を記憶させないようにしてもよい。
(ステップS3)議事録選択部109は、議事録記憶部108が記憶する情報を探索して、中断されている会議の議事録のリストの画像データ(例;図4、画像g20、符号g21)を生成し、生成した画像データを画像生成部110に出力して表示部111上に表示させる。続けて、議事録選択部109は、どの会議を継続するか選択するため、発話を促す画像データ(例;図4、画像g20の「継続中の会議は以下のとおりです。音声を発話してください」)を生成し、生成した画像データを画像生成部110に出力して表示部111上に表示させる。
(ステップS4)参加者は、発話(例;図4、画像g20、「伊藤さんと一緒に会議をやった続きを再開したい。」)を行う。収音部101は、発話された音声を取得する。
(ステップS5)会議支援装置1は、収音部101が収音した音声信号に対して、音声認識処置、テキスト変換処理、係り受け解析処理を行う。
(ステップS6)議事録選択部109は、ステップS5の処理により取得したテキスト情報(例;「伊藤さんと一緒に会議をやった続きを再開したい。」)に基づいて、その条件に合う中断されている会議の議事録を絞り込んで議事録記憶部108から読み出す。なお、絞り込みに使用するワードは、参加者名、会議に関する時刻(開催開始日時、または終了日時)、および会議で用いられたキーワードのうちの少なくとも1つである。
(ステップS7)議事録選択部109は、読み出した条件に合う会議の議事録の画像データ(例;図5、画像g30、符号g31、符号g32)を生成し、生成した画像データを画像生成部110に出力して表示部111上に表示させる。
(ステップS8)参加者は、発話(例;図4、画像g30の符号g33「管理職会議Bを御願いします。」または図4、画像g40の符号42「それで御願いします。」)を行う。収音部101は、発話された音声を取得する。
(ステップS9)会議支援装置1は、収音部101が収音した音声信号に対して、音声認識処置、テキスト変換処理、係り受け解析処理を行う。
(ステップS10)議事録選択部109は、再開したい(継続したい)会議を絞り込めたか否かを判定する。例えば、議事録選択部109は、表示した結果に対して同意する発話内容であった場合に絞り込めたと判定し、同意しない発話であった場合に絞り込めていないと判定する。または、議事録選択部109は、ステップS7で表示部111上に表示させた候補の議事録が1つであった場合、再開したい(継続したい)会議を絞り込めたと判定し、ステップS7で表示部111上に表示させた候補の議事録が2つ以上であった場合、再開したい(継続したい)会議を絞り込めていないと判定する。議事録選択部109は、再開したい(継続したい)会議を絞り込めたと判定した場合(ステップS10;YES)、ステップS11の処理に進め、再開したい(継続したい)会議を絞り込めていないと判定した場合(ステップS10;NO)、ステップS7の処理に戻す。
(ステップS11)会議支援装置1は、会議の再開が音声入力または操作部112の操作によって行われたとき、選択した議事録に対して議事録の作成を再開する。なお、会議支援装置1は、会議が再開された場合、ステップS2で設定された会議の設定を議事録記憶部108から読み出す。これにより、参加者は、再開する会議の再設定を行わずに済む。続けて、会議支援装置1は、会議を継続し、選択した議事録に継続した会議の内容を使いして1つの議事録として作成を継続する。続けて、会議支援装置1は、会議の終了時に会議を終了するか中断するかを示す情報を表示させる(図7参照)。続けて、会議支援装置1は、会議を中断する際に、議事録に会議が中断されたことを示す情報(フラグ)を付加して議事録記憶部108に記憶させる。なお、会議支援装置1は、会議の設定情報を表示部111上に表示させる。これにより、参加者は、参加者の確認、参加者が使用する収音部101の番号を確認することができる。
<会議中と会議終了時に表示部111上に表示される画像>
次に、会議中と会議終了時に表示部111上に表示される画像例を説明する。
図7は、本実施形態に係る会議中と会議終了時に表示部111上に表示される画像例を示す図である。
画像g100は、表示部111上に表示される画像である。
領域g101は、参加者情報編集を行う領域である。領域g101の画像には、参加者に対応したアイコン画像、参加者の名前、参加者が使用するマイクロフォンの番号(または識別情報)等が含まれている。
領域g102は、議事録を表示する領域である。なお、図7では、ログイン後の状態を示している。領域g102の画像には、ログイン/ログアウトのボタン画像、会議の開始/終了のボタン画像、会議の開催中に点灯する表示、議事録の表示や音声信号の再生を行うボタン画像、収音部101の使用有無を選択するボタン画像、参加者の人数を示す画像、参加者の音声入力を音声認識処理した結果の画像等が含まれている。
会議の終了が指示された場合、例えば操作部112の操作によって会議終了のボタン画像g103が選択された場合、議事録選択部109は、画像g110を表示させる指示を画像生成部110に出力することで、画像g110を表示部111上に表示させる。
画像g110には、会議の中断のボタン画像g111、会議終了のボタン画像g112、および会議終了の選択をキャンセルのボタン画像g113が含まれている。参加者は、操作部112を操作して、または音声入力によって、これら3つのうちから1つを選択する。
なお、会議開催中は、画像g110が表示されず、領域g101と領域g102の画像が表示部111上に表示される。聴覚障がい者の参加者は、表示部111上に表示される音声認識されて結果を見ることで、他の参加者の発話内容を理解することができる。
図8は、図7において、会議終了または会議継続が選択された場合に表示部111上に表示される画像例である。
画像g200は、表示部111上に表示される画像である。
画像g210は、ログアウト処理を開始することを示す画像である。画像g210には、処理に同意するOKのボタン画像g211が含まれている。なお、OKのボタン画像g211が選択されない場合であっても、会議支援装置1は、所定の時間(例えば3秒)後にログアウト処理を行う。
なお、図7と図8に示した画像は一例であり、表示部111上に表示される画像は、会議によって異なる。また、画像g110や画像g210も一例であり、画像は異なっていてもよい。例えば画像g210にはキャンセルのボタン画像が含まれていてもよい。
<会議開始時に表示部111上に表示される画像>
次に、会議開始時に表示部111上に表示される画像例を説明する。
図9は、本実施形態に係る会議開始時に表示部111上に表示される画像例を示す図である。利用者は、操作部112を操作して、各設定を行う。画像g300は、表示部111上に表示される画像である。
領域g301の画像は、会議設定を行う画像である。領域g301の画像には、例えば、音声認識を行うマイクロフォンの設定領域、音声録音の選択を行う設定領域、および会議形態(会議、テレビ会議、ワイガヤ、発表会等)を選択する設定領域等が含まれている。なお、「ワイガヤ」とは、ワイワイガヤガヤの略であり、自由に発言を行う会議である。
なお、各設定領域は一例であり、これに限らない。
また、図9に示すように、会議支援装置1は、会議の開始時に、画像g310の画像を表示させる。画像g310の画像には、新規の会議を開催する際に選択される新規のボタン画像g311、中断していた会議を再開する際に選択される継続のボタン画像g312が含まれる。
利用者は、操作部112を操作、または音声入力により、新規の会議を行うのか、中断されている会議を継続するのかを選択する。継続が選択された場合、図4に示した画像g20が表示される。
図10は、本実施形態に係る中断された会議リストの画像の他の例である。
画像g400は、表示部111上に表示される画像である。
領域301は、図9と同様に会議設定の領域の画像である。
符号g410は、中断された会議リストの画像の他の例である。中断された会議リストは、会議の名称、会議が行われた場所、開催日時(開始時間)との情報を含んでいてもよい。なお、図10に示した画像は一例であり、中断された会議リストに含まれる情報は、これに限らない。
上述した実施形態によれば、中断されている会議の中から再開したい(継続したい)会議を、参加者の発話に基づいて絞って提示するようにした。これにより、参加者は、中断されている会議の中から再開したい(継続したい)会議を音声によって選択することができる。
<第1変形例>
図4に示した例では、画像g30において音声入力によって画像g40のように1つの議事録に絞り込めた(会議を絞り込めた)例を説明したが、この処理によっても議事録を絞り込めない場合もあり得る。変形例では、このような場合の処理例を説明する。
図11は、本実施形態の第1変形例における会議継続時に議事録を絞り込めなかった際に表示される画像例を示す図である。
画像g30aは、例えば2回の音声入力によっても会議を絞り込めなかった例に表示される画像例である。画像g30aには、第1の候補の画像g31aと、第2の候補の画像g32aが含まれている。参加者は、この画像からでは、再開したい会議を絞り込めなかったため、音声入力「絞り込めません。」(画像g33a)を行う。
議事録選択部109は、音声入力「絞り込めません。」に基づいて、第1の候補と第2の候補について、情報を追加して再表示させる。画像g30bは、情報を追加して再表示させた画像例である。画像g30bでは、第1の候補の画像g31aに対して画像g31bのように、参加者として「鈴木」が追加され、キーワードとして「課題、欧州」が追加されている。また、画像g30bでは、第2の候補の画像g32aに対して画像g32bのように、参加者として「渡辺」が追加され、キーワードとして「米国、中国」が追加されている。
なお、追加される情報の個数は1つ以上であればよい。また、議事録選択部109は、追加した情報のみを表示させるようにしてもよい。
利用者は、この追加された情報によって、継続したい会議を1つに絞り込みことができる。なお、参加者である利用者は、画像g30aの表示の際、追加してほしい情報を音声によって入力するようにしてもよい。利用者は、例えば、「絞り込めないので、キーワードをもっと表示してください。」等の発話を行うようにしてもよい。会議支援装置1は、この発話に対して音声認識等の処理を行い、画像g30bを表示させるようにしてもよい。
第1変形例によれば、参加者が発話した内容で会議を絞りきれなかった場合に、候補の会議の議事録の情報を追加して提示する。これにより、参加者は、中断されている会議の中から再開したい(継続したい)会議を音声によって選択することができる。
<第2変形例>
上述した会議支援装置1では、図1に示す構成例を説明したが、会議支援装置に子機が接続されていてもよい。
この場合は、例えば会議の進行者が会議支援装置を使用し、他の参加者が子機を使用する。
参加者のうち、発話が不自由な人が会議に参加していてもよい。発話可能な参加者は、参加者毎に収音部を装着するか、収音部を備える端末(スマートフォン、タブレット端末、パーソナルコンピュータ等)を用いる。聴覚障がいの参加者は、テキストを入力可能な端末を用いる。会議支援装置は、参加者の発話した音声信号に対して音声認識、テキスト化して、各自の端末にテキストを表示させる。また、会議支援装置は、聴覚障がい者が入力したテキスト情報を各自の端末にテキストを表示させる。
図12は、本実施形態に係る第2変形例における会議支援システム2の構成例を示すブロック図である。
図12に示すように、会議支援システム2は、会議支援装置1Aと、子機3a、3b、・・・を備える。なお、子機3a、子機3b、・・・のうち1つを特定しない場合は、単に子機3という。
会議支援装置1Aと子機3とは、有線または無線のネットワークを介して接続されている。
会議支援装置1Aは、収音部101、取得部102A、音声認識辞書DB103、音声認識部104、テキスト変換部105、係り受け解析部106A、議事録作成部107A、議事録記憶部108、議事録選択部109、画像生成部110A、表示部111、操作部112、および通信部113を備える。なお、会議支援装置1と同様の機能を有する機能部には同じ符号を用いて説明を省略する。
子機3は、収音部301、操作部302(テキスト入力部)、処理部303、表示部304、および通信部305を備える。収音部301、操作部302、処理部303、表示部304(子機表示部)、および通信部305は、バス306を介して接続されている。
子機3は、例えばスマートフォン、タブレット端末、パーソナルコンピュータ等である。なお、子機3は、音声出力部、モーションセンサー、GPS(Global Positioning System;全地球測位システム)等を備えていてもよい。
収音部301は、マイクロフォンである。収音部301は、利用者の音声信号を収音し、収音した音声信号をアナログ信号からデジタル信号に変換して、デジタル信号に変換した音声信号を処理部303に出力する。
操作部302は、利用者の操作を検出し、検出した結果を処理部303に出力する。操作部302は、例えば表示部304上に設けられたタッチパネル式のセンサー、または優先接続または無線接続のキーボード等である。
処理部303は、操作部302が操作された操作結果に基づいて設定情報を生成し、生成した設定情報を通信部305に出力する。ここで、設定情報には、参加者の識別情報が含まれている。処理部303は、操作部302が操作された操作結果に基づいてログイン指示を生成し、生成したログイン指示を通信部305に出力する。ここで、ログイン指示には、参加者の識別情報、子機3の識別情報が含まれている。処理部303は、操作部302が操作された操作結果に基づくテキスト情報に識別情報を付加して通信部305に出力する。処理部303は、収音部301が出力する音声信号に識別情報を付加して通信部305に出力する。処理部303は、通信部305が出力する画像データを取得し、取得した画像データを表示部304に出力する。処理部303は、通信部305が出力するログインを許可する情報に基づいて、会議支援装置1Aとの通信を確立する。処理部303は、会議支援装置1Aから発言制限指示(入力制限指示)を受信した場合、テキスト入力に対して制限を行う。また、処理部303は、会議支援装置1Aから発言制限指示を受信した場合、音声入力に対しても制限を行うようにしてもよい。
表示部304は、処理部303が出力した画像データを表示する。表示部304は、例えば液晶表示装置、有機EL(エレクトロルミネッセンス)表示装置、電子インク表示装置等である。なお、表示部304上に表示される画像については後述する。
通信部305は、処理部303が出力する設定情報を、ネットワークを介して会議支援装置1Aへ送信する。通信部305は、処理部303が出力するログイン指示を、ネットワークを介して会議支援装置1Aへ送信する。通信部305は、処理部303が出力するテキスト情報または音声信号を、ネットワークを介して会議支援装置1Aへ送信する。なお、送信するテキスト情報または音声信号には、利用者の識別情報と子機3の識別情報が含まれている。通信部305は、会議支援装置1Aが送信した画像データを受信し、受信した画像データを処理部303に出力する。通信部305は、会議支援装置1Aが送信したログインを許可する情報を受信した場合、受信したログインを許可する情報を処理部303に出力する。
取得部102Aは、取得部102が行う処理に加えて、通信部113が出力する子機3が送信した音声信号を取得する。
係り受け解析部106Aは、係り受け解析部106が行う処理に加えて、通信部113が出力する子機3が送信したテキスト情報を取得する。
議事録作成部107Aは、議事録作成部107が行う処理に加えて、通信部113が出力する子機3が送信した設定情報を取得する。
画像生成部110Aは、生成した画像データを通信部113に出力する。画像データには、会議中に参加者が発話した結果を音声認識等の処理を行った結果(例えば図7の符号g102の領域)が含まれている。
通信部113は、子機3が送信した設定情報を取得し、取得した設定情報を議事録作成部107Aに出力する。通信部113は、子機3が送信したログイン指示を受信する。会議支援装置1Aは、受信したログイン指示に応じて、子機3のログイン手続きを行う。通信部113は、子機3から受信した音声信号を取得部102Aに出力する。通信部113は、子機3から受信した音声信号を係り受け解析部106Aに出力する。通信部113は、画像生成部110Aが出力する画像データを子機3へ送信する。
この構成によって、第2変形例によれば、参加者は、他の参加者の発話内容を子機3の表示部304の表示によって理解することができる。この結果、第2変形例によれば、健聴者と聴覚障がい者とが一緒に会議に参加しやすくすることができる。
なお、本発明における会議支援装置1(または1A)の機能の全てまたは一部を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより会議支援装置1(または1A)が行う処理の全てまたは一部を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形および置換を加えることができる。
1,1A…会議支援装置、2…会議支援システム、101…収音部、102,102A…取得部、103…音声認識辞書DB、104…音声認識部、105…テキスト変換部、106,106A…係り受け解析部、107,107A…議事録作成部、108…議事録記憶部、109…議事録選択部、110,110A…画像生成部、111…表示部、112…操作部、113…通信部、3…子機、301…収音部、302…操作部、303…処理部、304…表示部、305…通信部

Claims (7)

  1. 収音部と、
    前記収音部にて音声入力された発話に対して音声認識用辞書を用いて音声認識を行う音声認識部と、
    前記音声認識されたテキストを議事録として表示する表示部と、
    前記議事録を記憶し、中断している会議の前記議事録に対して中断していることを示す情報を前記議事録に関連付けて記憶する記憶部と、
    中断された会議を再開する場合において、前記中断された会議の候補を表示し、表示した前記会議の候補を、音声発話を音声認識した結果に基づいて継続したい会議の候補を絞り込む選択部と、
    を備える会議支援装置。
  2. 前記選択部は、継続したい会議の絞込みを、前記会議の出席者、前記会議に関する時刻、および前記議事録から抽出されたキーワードのうち少なくとも1つで絞込みを行う、請求項1に記載の会議支援装置。
  3. 前記音声認識部は、継続する会議で使用された音声認識用辞書を用いる、請求項1または請求項2に記載の会議支援装置。
  4. 前記選択部は、継続したい会議の2回目以降の絞り込みの際に、前記会議の出席者を追加して提示、および前記議事録から抽出されたキーワードを追加して提示のうち少なくとも1つを行うようにする、請求項1から請求項3のいずれか1項に記載の会議支援装置。
  5. 前記会議支援装置に通信によって接続される子機であって、前記子機が、収音部と子機表示部と操作部とを備え、
    前記音声認識部は、前記子機が送信した音声信号に対して前記音声認識用辞書を用いて音声認識を行い、
    前記収音部が収音した音声信号と、前記子機の収音部が収音した音声新語とに対して音声認識した結果を、前記表示部と前記子機表示部とに表示させる、請求項1から請求項4のいずれか1項に記載の会議支援装置。
  6. 会議の議事録を記憶する記憶部を備える会議支援装置における会議支援方法であって、
    収音部が、音声入力された発話を取得する収音ステップと、
    音声認識部が、前記収音ステップにて音声入力された発話に対して音声認識用辞書を用いて音声認識を行う音声認識ステップと、
    議事録作成部が、前記音声認識ステップによって音声認識されたテキストの議事録を作成し、前記会議が中断された場合に中断されたことを示す情報を前記議事録に関連付けて記憶させる議事録作成ステップと、
    選択部が、中断された会議を再開する場合において、前記中断された会議の候補を表示し、表示した前記会議の候補を、音声発話を音声認識した結果に基づいて継続したい会議の候補を絞り込む選択ステップと、
    を含む会議支援方法。
  7. 会議の議事録を記憶する記憶部を備える会議支援装置のコンピュータに、
    音声入力された発話を取得する収音ステップと、
    前記収音ステップにて音声入力された発話に対して音声認識用辞書を用いて音声認識を行う音声認識ステップと、
    前記音声認識ステップによって音声認識されたテキストの議事録を作成し、前記会議が中断された場合に中断されたことを示す情報を前記議事録に関連付けて記憶させる議事録作成ステップと、
    中断された会議を再開する場合において、前記中断された会議の候補を表示し、表示した前記会議の候補を、音声発話を音声認識した結果に基づいて継続したい会議の候補を絞り込む選択ステップと、
    を実行させるプログラム。
JP2018066836A 2018-03-30 2018-03-30 会議支援装置、会議支援制御方法およびプログラム Active JP6962849B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018066836A JP6962849B2 (ja) 2018-03-30 2018-03-30 会議支援装置、会議支援制御方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018066836A JP6962849B2 (ja) 2018-03-30 2018-03-30 会議支援装置、会議支援制御方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2019179081A JP2019179081A (ja) 2019-10-17
JP6962849B2 true JP6962849B2 (ja) 2021-11-05

Family

ID=68278548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018066836A Active JP6962849B2 (ja) 2018-03-30 2018-03-30 会議支援装置、会議支援制御方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6962849B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022030754A (ja) * 2020-08-07 2022-02-18 株式会社東芝 入力支援システム、入力支援方法およびプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3592004B2 (ja) * 1996-10-31 2004-11-24 キヤノン株式会社 情報共有管理システム及び情報共有システム管理装置と方法
JP2007233075A (ja) * 2006-03-01 2007-09-13 Murata Mach Ltd 議事録作成装置
JP2012208630A (ja) * 2011-03-29 2012-10-25 Mizuho Information & Research Institute Inc 発言管理システム、発言管理方法及び発言管理プログラム
JP6007670B2 (ja) * 2012-08-20 2016-10-12 株式会社リコー 情報処理装置、電子会議システム、プログラム及び電子会議方法

Also Published As

Publication number Publication date
JP2019179081A (ja) 2019-10-17

Similar Documents

Publication Publication Date Title
JP6738445B2 (ja) デジタルアシスタントサービスの遠距離拡張
CN110634483B (zh) 人机交互方法、装置、电子设备及存储介质
US9053096B2 (en) Language translation based on speaker-related information
US8385588B2 (en) Recording audio metadata for stored images
US9245254B2 (en) Enhanced voice conferencing with history, language translation and identification
JP5123591B2 (ja) 発想支援装置、発想支援システム、発想支援プログラム及び発想支援方法
US20130144619A1 (en) Enhanced voice conferencing
CN117033578A (zh) 基于设备间对话通信的主动协助
US20070174326A1 (en) Application of metadata to digital media
JP6280312B2 (ja) 議事録記録装置、議事録記録方法及びプログラム
KR20210137118A (ko) 대화 단절 검출을 위한 글로벌 및 로컬 인코딩을 갖는 컨텍스트 풍부 주의 기억 네트워크를 위한 시스템 및 방법
US20220231873A1 (en) System for facilitating comprehensive multilingual virtual or real-time meeting with real-time translation
CN111813301B (zh) 内容播放方法、装置、电子设备及可读存储介质
JP2018174442A (ja) 会議支援システム、会議支援方法、会議支援装置のプログラム、および端末のプログラム
JP2018170743A (ja) 会議支援システム、会議支援方法、会議支援装置のプログラム、および端末のプログラム
JPWO2018043138A1 (ja) 情報処理装置および情報処理方法、並びにプログラム
US20240055003A1 (en) Automated assistant interaction prediction using fusion of visual and audio input
JP6962849B2 (ja) 会議支援装置、会議支援制御方法およびプログラム
JPWO2018043137A1 (ja) 情報処理装置及び情報処理方法
WO2019235013A1 (ja) 情報処理装置および情報処理方法
WO2020026799A1 (ja) 情報処理装置、情報処理方法、およびプログラム
WO2019146199A1 (ja) 情報処理装置、及び情報処理方法
US20230153061A1 (en) Hierarchical Context Specific Actions from Ambient Speech
US20210304767A1 (en) Meeting support system, meeting support method, and non-transitory computer-readable medium
JP7000547B1 (ja) プログラム、方法、情報処理装置、システム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180607

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201019

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211014

R150 Certificate of patent or registration of utility model

Ref document number: 6962849

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350