JP2009053342A

JP2009053342A - 議事録作成装置

Info

Publication number: JP2009053342A
Application number: JP2007218441A
Authority: JP
Inventors: Junichi Shibuya; 純一澁谷
Original assignee: Individual
Current assignee: Individual
Priority date: 2007-08-24
Filing date: 2007-08-24
Publication date: 2009-03-12

Abstract

【課題】議事録に必要なデータ量を節約することができ、議事録を作成するときの処理効率を高めることができる議事録作成装置を提供すること。
【解決手段】電子会議の各参加者のうち発言が記録される対象参加者の情報および発言が記録されない参加者の情報を指定させる参加者指定部１１と、参加者が発言したときの音声データを受信する音声データ受信部１２と、音声データ受信部１２によって受信された音声データのうち、参加者指定部１１で指定された対象参加者に対応する音声データを検出する音声データ検出部１３と、音声データ検出部１３によって検出された音声データを保存する音声データ保存部１４と、音声データ保存部１４によって保存された音声データをテキストデータに変換する音声認識部１５と、音声認識部１５で変換されたテキストデータに基づいて議事録を作成する議事録作成部１６とを備えて構成する。
【選択図】図２

Description

本発明は、議事録を作成する議事録作成装置に関する。

従来、会議の議事録は、会議の参加者の発言内容を議事録作成者がメモし、会議後にそのメモに基づいた清書あるいはワードプロセッサを用いてタイプするなどして、議事録の体裁を整えた形で作成されていた。このようなメモに頼った議事録の作成においては、通常、参加者が自由に発言するため、発言内容のメモをとるには多大な労力を要し、議事録作成者が会議に参加できなくなる恐れがある。議事録作成者が会議の全ての発言内容を録音することにより、会議後、録音した発言内容を聴きながら議事録を作成する場合も、議事録作成者には多くの負担が生じるという問題があった。

そこで、音声認識技術を用いて、コンピュータが参加者の発言内容を認識し、認識した発言内容をテキストに変換し、電子的な議事録を作成する技術が示されている（例えば、特許文献１、２参照）。

また、従来の電子会議システムとしては、電子会議に参加する各参加者のためのクライアント装置、および、電子会議を管理する会議サーバ装置がネットワークを介して接続され、参加者はクライアント装置を用いて自らの会議中の発言のデータを会議サーバ装置に送信し、会議サーバ装置が、発言データを議事進行中に記録するものが知られている（例えば、特許文献３参照）。なお、発言データは、ネットワークを介して送受信される音声データである。

会議サーバ装置は、記録した参加者の発言データから音声認識技術でテキストデータに変換することで、発言履歴による議事録を作成するようになっている。ここで、複数の参加者が、同時に発言した場合、複数の発言を１つの音声データとして記録してしまうと、人が正しく認識できる程度のテキストデータに変換することが困難になるため、会議サーバ装置が参加者毎に発言内容を記録するのが一般的である。
特開平０２−２０６８２５号公報特開平０７−１４６９１９号公報特開２００６−０５０５００号公報

しかしながら、上述した会議サーバ装置などの議事録作成装置は、参加者毎に発言内容を記録しているが、会議中に議題に関係のない発言ばかりする参加者や特に興味のない参加者がいることがしばしばあるため、従来の議事録作成装置がそのような参加者の発言内容までも記録に残して議事録を作成してしまうと、議事録に必要なデータ量が膨大なものとなってしまい、議事録を作成するときの処理効率が低下してしまうという問題があった。

そこで、本発明は、議事録に必要なデータ量を節約することができ、議事録を作成するときの処理効率を高めることができる議事録作成装置を提供することを目的としたものである。

本発明の議事録作成装置は、電子会議の各参加者のうち発言が記録される対象参加者の情報および発言が記録されない参加者の情報を指定させる参加者指定部と、前記参加者が発言したときの音声データを受信する音声データ受信部と、前記音声データ受信部によって受信された音声データのうち、前記参加者指定部で指定された対象参加者に対応する音声データを検出する音声データ検出部と、前記音声データ検出部によって検出された音声データを保存する音声データ保存部と、前記音声データ保存部によって保存された音声データをテキストデータに変換する音声認識部と、前記音声認識部で変換されたテキストデータに基づいて議事録を作成する議事録作成部と、を備えた構成を有している。
この構成により、電子会議の各参加者のうち発言が記録される対象参加者の情報を指定させ、受信された音声データのうち指定された対象参加者に対応する音声データを保存し、保存した音声データを音声認識して議事録を作成することで、発言が記録されない参加者に対応する音声データを保存することがなくなるため、議事録に必要なデータ量を節約することができ、議事録を作成するときの処理効率を高めることができる。

また、本発明の議事録作成装置は、前記参加者指定部が、前記対象参加者の情報を指定させる際に前記対象参加者に対応する登録音声データを指定させ、前記音声認識部が、前記参加者指定部で指定された対象参加者の登録音声データに従って前記音声データをテキストデータに変換する構成を有している。
この構成により、対象参加者の登録音声データに従って音声データをテキストデータに変換するため、音声認識の精度を向上させることができる。

また、本発明の議事録作成装置は、前記参加者指定部が、前記対象参加者の情報を指定させる際に前記対象参加者の音声データを保存するときの最大保存容量を指定させ、前記音声データ保存部が、前記音声データ検出部によって検出された音声データを、前記参加者指定部で指定された最大保存容量以内になるように保存する構成を有している。
この構成により、検出された音声データに対応する最大保存容量以内になるように検出された音声データを保存するため、議事録に必要なデータ量を有効に使用することができる。

また、本発明の議事録作成装置は、前記参加者指定部が、前記対象参加者の情報を指定させる際に前記対象参加者に対応する音声データの音量を指定させ、前記音声データ検出部が、前記音声データ検出部によって検出された音声データの音量を、前記参加者指定部で指定された音量になるように調整する構成を有している。
この構成により、検出された音声データの音量を、指定された音量になるように調整することで、適正な音声データが保存されることになるため、議事録を正確に作成することができる。

また、本発明の議事録作成装置は、音声データを再生する音声データ再生部を備え、前記音声データ検出部が、前記音声データ受信部によって受信された音声データのうち、前記参加者指定部で指定された対象参加者に対応する音声データを検出すると共に、前記音声データ受信部によって受信された音声データを前記音声データ再生部に再生させる構成を有している。
この構成により、指定された対象参加者に対応する音声データを検出しながら、音声データを再生させるため、議事録を作成すると共に、利用者に議事の内容を聴き取らせることができる。

以上のように本発明は、議事録に必要なデータ量を節約することができ、議事録を作成するときの処理効率を高めることができる議事録作成装置を提供するものである。

以下、本発明の実施の形態について、図面を用いて説明する。

図１は、本発明の実施の形態に係る会議システムを表す図である。図１に示した会議システムでは、ネットワークを介して４つの会議端末１０が互いに接続されている。以降、会議端末１０の各々を区別する場合、会議端末１０Ａ〜会議端末１０Ｄとして記載し、区別しない場合、会議端末１０として記載する。

電子会議を行う際には、参加者Ａ〜参加者Ｄまで参加者がいるとすれば、参加者Ａ〜参加者Ｄのそれぞれは、会議端末１０Ａ〜会議端末１０Ｄのそれぞれを使用することになる。なお、本発明の実施の形態に係る会議システムでは、従来のような会議を管理するためのクライアントおよびサーバは特に持たない。

会議端末１０は、パソコンなどである。電子会議を行う際に、破線で示しているようにネットワークに接続された会議端末１０同士がデータを送受信することができる。例えば、会議端末１０は、電子会議中に、電子会議の参加者の発言を表した音声データを、ネットワークを介して自身の会議端末１０を除く参加中の会議端末１０全てに送信したり、他の会議端末１０から受信した発言の音声データを再生するようになっている。

本発明の実施の形態では、図１に示した会議システムで用いられるデータの送受信は、ＩＰ（Internet Protocol）に準拠して行われるため、会議端末１０には、ＩＰアドレスが登録されている。

また、会議端末１０は、音声認識技術を用いて、他の会議端末１０から受信した発言の音声データをテキストデータに変換することで、議事録を作成するようになっている。なお、本発明の議事録作成装置は例示すれば会議端末１０であるため、本発明の実施の形態では、会議端末１０について説明する。

図２は、本発明の実施の形態に係る会議端末のブロック図である。会議端末１０は、一般的なコンピュータの構成を有しており、詳細には、図示していないＣＰＵ（Central Processing Unit）、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）、およびハードディスク、さらに、ネットワークに接続するためのネットワークインタフェース２１、電子会議の参加者の音声を出力するスピーカ２２、参加者の音声を入力するマイクロホン２３、参加者からの情報を入力するキーボードやマウスなどの入力機器２４、情報を表示するディスプレイ２５を有している。

なお、通話時に周囲の雑音が混入してしまうことを防止するため、マイクロホン２３およびスピーカ２２を、マイクロホンとイヤホンとが一体型となっているイヤホンマイクに替えてもよい。

また、図２に示すように、会議端末１０は、参加者指定部１１、音声データ受信部１２、音声データ検出部１３、音声データ保存部１４、音声認識部１５、議事録作成部１６、音声データ再生部１７、音声変換部１８、および音声データ送信部１９を備えており、例えば、これらの機能部は、ＣＰＵが実行するプログラムのモジュールなどで実施されてもよい。

参加者指定部１１は、電子会議の各参加者のうち、電子会議の議事録の記録をとるのに必要な少なくとも１名以上の対象参加者の情報を会議端末１０の利用者に指定させるようになっている。対象参加者は、電子会議の各参加者のうち発言が記録される参加者である。対象参加者の情報を指定させるタイミングとしては、電子会議の開始前でもよいし、電子会議の途中でもよい。

図３は、利用者に参加者の情報を指定させる画面のイメージ図であり、図３（Ａ）は、利用者に参加者の情報を指定させる指定ウインドウ３０を表している。参加者指定部１１は、指定ウインドウ３０をディスプレイ２５に表示するようになっている。図３（Ａ）の指定ウインドウ３０は、例えば最大８名が電子会議に参加する場合において、８名までの参加者の情報を、入力機器２４を介して指定させるものである。

指定ウインドウ３０は、参加者の情報を指定させるための指定項目３１を参加者毎に有している。図３（Ｂ）は、指定項目３１だけを拡大して表した図である。

利用者が指定する項目としては、参加者の名前を表す参加者名項目３３、音声認識時に必要となる登録音声データ識別項目３４、参加者が使用する機器を識別するための識別情報項目３５、参加者の音声データを保存するかしないかを指定する保存是非項目３６がある。参加者名項目３３、登録音声データ識別項目３４、識別情報項目３５、および保存是非項目３６は、利用者によって指定される。

会議端末１０がＩＰに準拠したネットワークを使用して電子会議を行う場合、識別情報項目３５は、会議端末１０のＩＰアドレスである。参加者指定部１１は、指定された識別情報項目３５の情報を、図４に示す制御情報の識別情報に登録するようになっている。

図４に示す制御情報は、指定された参加者の情報に基づいたものであり、ＲＡＭやハードディスクに記憶されている。なお、図４（Ａ）では、会議端末１０Ｄが有する制御情報の例を示している。本発明の実施の形態では、識別情報については、ＩＰアドレスが登録される。

図４（Ａ）の制御情報の参加者については、図３（Ｂ）に示したように参加者名項目３３で指定されたものが登録され、図４（Ａ）の制御情報の登録音声データについては、図３（Ｂ）に示したように男性用または女性用の音声かを識別する登録音声データ識別項目３４で指定されたものが登録される。また、保存実施の是非について、図３（Ｂ）に示したように保存是非項目３６で指定されたものが登録される。

図４（Ｂ）の制御情報については、図４（Ａ）に加えてスピーカ出力の有無および最大保存容量が含まれている。スピーカ出力の有無および最大保存容量については後述するが、スピーカ出力の有無を指定するスピーカ出力有無項目、最大保存容量を指定する最大保存容量項目が、新たに指定項目３１に追加され（図示していない）、スピーカ出力有無項目および最大保存容量項目でそれぞれ指定されたものが、図４（Ｂ）の制御情報のスピーカ出力の有無および最大保存容量のそれぞれに登録される。

音声データ受信部１２は、参加者が発言したときの音声データをネットワークインタフェース２１を介して受信し、受信した音声データを音声データ検出部１３に出力するようになっている。例えば、８名が電子会議に参加する場合において、音声データ受信部１２は、自己の会議端末１０の参加者の音声データを除く７名の音声データを受信するようになっている。

なお、ＩＰに準拠したネットワークを使用して電子会議を行う場合、音声データは、ＩＰパケットのペイロード部に設定されているものであり、ＲＴＰ（Real-time Transport Protocol）等に準拠した技術に従ってリアルタイムに受信される。音声データ受信部１２は、リアルタイムに受信された音声データを音声データ検出部１３に出力するようになっている。

音声データ検出部１３は、音声データ受信部１２によって受信された音声データを音声データ再生部１７に出力するようになっている。音声データ再生部１７は、音声データ検出部１３によって出力された音声データをデジタルアナログ変換するなどして音声データを再生し、再生したものをスピーカ２２に出力するようになっている。

参加者の発言による音声のうち自己の会議端末１０の参加者の音声データを除く参加者の音声データが、スピーカ２２を介して聴覚される。

また、音声データ検出部１３は、音声データ受信部１２によって受信された音声データのうち、参加者指定部１１で指定された対象参加者に対応する音声データを検出するようになっている。

例えば、ＩＰに準拠したネットワークを使用して電子会議を行う場合、参加者指定部１１から音声データ検出部１３にＩＰアドレス等が出力されているため、音声データ検出部１３は、図４に示した制御情報の識別情報に設定されてあるＩＰアドレスのうち、音声データが含まれているＩＰパケットのヘッダ部のＩＰアドレスに一致するものがあるか否かを判定する。音声データ検出部１３は、一致したときのＩＰアドレスに対応する図４に示した制御情報の保存実施の是非が「保存する」になっているかを判定し、「保存する」になっている参加者である対象参加者の音声データを音声データ保存部１４に保存させる。

また、音声データ検出部１３は、音声変換部１８によって出力された音声データに対応する図４に示した制御情報の保存実施の是非が「保存する」になっているかを判定し、「保存する」になっている参加者である対象参加者の音声データを音声データ保存部１４に保存させる。

また、音声データ検出部１３は、音声データ受信部１２によって受信された音声データを音声データ再生部１７に出力するとしたが、図４（Ｂ）の制御情報のスピーカ出力の有無に従って、スピーカ出力の有となっている音声データだけを音声データ再生部１７に出力する。特定の参加者の発言を聴きたくない場合などには、図４（Ｂ）の制御情報のスピーカ出力の有無が無しに登録され、音声データの再生を停止することで、不要な音声データの再生処理を省略して、その分議事録を作成するときの処理効率を上げることもできる。

ところで、図３（Ｂ）に示した指定項目３１内にある音量メータ３２は、対象参加者の音声データの音量を表すものであり、例えば、電子会議の開始前などに音量を調整するときに参照される。

音量メータ３２に関する使用方法としては、利用者が、保存是非項目３６が保存するとなっている指定項目３１を選択して開始ボタン４１を押下したとき、選択された指定項目３１の会議端末１０から発言の音量のレベルが音量メータ３２に表示される。開始ボタン４１が押下されたとき、例えば、音声データ検出部１３は、対象参加者の音声データの音量のレベルを検出し、検出した音量のレベルを、該当する指定項目３１の音量メータ３２に表示させる。

音量のレベルが音量メータ３２に表示されている最中に、参加者指定部１１は、音量調整ボタン４３で音量を利用者に指定させることで、音声データ検出部１３が、該当する音声データの音量を、参加者指定部１１で指定された音量になるように調整するようになっている。また、利用者が、音量のレベルの表示を停止したい場合は、停止ボタン４２を押下する。

なお、クリアボタン４４は、選択された指定項目３１の各種項目に設定された内容をクリアするものであり、保存ボタン４５は、各指定項目３１に設定された内容を図４に示す制御情報に登録するものである。

ここで、各参加者の発言による音声データの流れを表す図を図５に例示する。会議端末１０Ａの参加者は、時刻ｔ１から発言し、その後に発言をやめて無言の状態があり、また時刻ｔ４から発言した様子を表している。会議端末１０Ｂの参加者は、時刻ｔ３から発言し、その後に発言をやめて無言の状態があり、また時刻ｔ６から発言した様子を表している。会議端末１０Ｄの参加者は、時刻ｔ２から発言し、その後に発言をやめて無言の状態があり、また時刻ｔ５から発言した様子を表している。なお、会議端末１０Ｃの参加者の発言については、図４の制御情報で保存しない設定にしているため、省略している。

音声データ保存部１４は、音声データ検出部１３によって検出された音声データを保存するようになっている。例えば、図５に示したように、各対象参加者の発言による音声データが音声データ検出部１３によって検出された場合、音声データ保存部１４は、各対象参加者の発言の無音部分を検出し、発言のあった期間の音声データを電子ファイルとして保存するようになっている。

なお、無音部分を検出する方法としては、例えば、所定時間内に一定の音量レベルに達しない場合において無音とみなす等の方法がある。

例えば、図６に示すように、音声データ保存部１４は、発言の開始時刻を音声データに設定し、発言が開始された後に発言の無音部分を検出した際、発言が開始されてから無言の状態になるまでの音声データを、対象参加者が識別可能なように電子ファイルとして保存する。

会議端末１０Ａの対象参加者が時刻ｔ１から発言したときの音声データを音声データＡ１とする。音声データＡ１は、音声データ保存部１４によって電子ファイルＡ１としてハードディスクなどの記録媒体に記憶される。また、会議端末１０Ａの対象参加者が時刻ｔ４から発言したときの音声データを音声データＡ２とする。音声データＡ２は、音声データ保存部１４によって電子ファイルＡ２としてハードディスクなどの記録媒体に記憶される。

会議端末１０Ｂの対象参加者が時刻ｔ３から発言したときの音声データを音声データＢ１とする。音声データＢ１は、音声データ保存部１４によって電子ファイルＢ１としてハードディスクなどの記録媒体に記憶される。また、会議端末１０Ｂの対象参加者が時刻ｔ６から発言したときの音声データを音声データＢ２とする。音声データＢ２は、音声データ保存部１４によって電子ファイルＢ２としてハードディスクなどの記録媒体に記憶される。

会議端末１０Ｄの対象参加者が時刻ｔ２から発言したときの音声データを音声データＤ１とする。音声データＤ１は、音声データ保存部１４によって電子ファイルＤ１としてハードディスクなどの記録媒体に記憶される。また、会議端末１０Ｄの対象参加者が時刻ｔ５から発言したときの音声データを音声データＤ２とする。音声データＤ２は、音声データ保存部１４によって電子ファイルＤ２としてハードディスクなどの記録媒体に記憶される。

なお、音声データ保存部１４が付与する電子ファイルのファイル名は、開始時刻と参加者を識別する情報とを組み合わせたものでもよい。

音声認識部１５は、音声データ保存部１４によって保存された音声データを認識することでテキストデータに変換するようになっている。図７に示すように、音声認識部１５は、学習機能を有する音声認識エンジンを有しており、同じ対象参加者の音声データをできるだけ一度に音声認識することで、音声認識の精度（音声認識率）を向上させるようになっている。

例えば、図７に示すように、音声認識部１５は、一定時間内に会議端末１０Ａの対象参加者の音声データだけを音声認識し、次の一定時間内に会議端末１０Ｂの対象参加者の音声データだけを音声認識し、さらに次の一定時間内に会議端末１０Ｄの対象参加者の音声データだけを音声認識し、音声認識した結果をテキストデータに変換するようになっている。

また、音声認識部１５は、図４（Ｂ）の制御情報に設定されている登録音声データ識別項目３４が示す登録音声データを有しており、参加者指定部１１で指定された対象参加者の登録音声データに基づいて音声認識し、音声認識した結果をテキストデータに変換することで、さらに音声認識の精度（音声認識率）を向上させるようになっている。

図４では、登録音声データ識別項目３４については、音声認識の効率化を図るため、男性用の音声か女性用の音声かを識別する情報が指定されるが、最も音声認識の効率化を図るには、予め参加者の音声を録音して得られた登録音声データを登録しておき、登録音声データ識別項目３４に登録音声データを設定させることが望ましい。このようにすれば音声認識部１５は、参加者毎の登録音声データに基づいて音声認識することで、認識率を向上させるようになっている。

議事録作成部１６は、音声認識部１５で音声データから変換されたテキストデータに基づいて議事録を作成するようになっている。図６に示すように、音声データ保存部１４が保存した音声データには開始時刻が設定されているため、開始時刻の順番に、音声データから変換されたテキストデータを並び替えて議事録を作成するようになっている。

議事録作成部１６が作成した議事録をディスプレイ２５に表示させたときの図を図８に示す。図８（Ａ）は、ＨＴＭＬ（Hyper Text Markup Language）形式に対応した議事録であり、図８（Ｂ）は、テキスト形式に対応した議事録である。

なお、議事録作成部１６は、電子会議の途中でリアルタイムに議事録を作成するようにしてもよいし、電子会議が終わった場合など任意の時点で議事録を作成するようにしてもよい。

図８（Ａ）では、発言者と発言内容とを対応させて表示させている。さらに、図８（Ａ）では、発言内容に対応する再生ボタンを押下すれば発言内容の音声データを再生するようになっている。例えば、再生ボタンが押下されたとき、音声データ再生部１７は、押下された再生ボタンに対応する音声データの電子ファイルを音声データ保存部１４から取得して再生するようになっている。

図８（Ｂ）では、発言者および発言開始時刻が括弧の中に表示されており、発言者と発言内容とを対応させて表示させている。なお、図３（Ｂ）の参加者名項目３３で指定された参加者名は、図８（Ａ）および図８（Ｂ）の発言者として表示される。

音声変換部１８は、参加者の発言をマイクロホン２３が収音したときの音声信号を、アナログデジタル変換し、変換されたデジタルの音声データを音声データ送信部１９および音声データ検出部１３に出力するようになっている。

音声データ送信部１９は、音声変換部１８によって音声データが出力されたとき、音声データを自身の会議端末１０を除く電子会議に参加している会議端末１０全てにネットワークインタフェース２１を介して送信するようになっている。

以上のように構成された会議端末１０の動作の一例について図９を用いて以下に説明する。図９（Ａ）は、電子会議を開始する前の段階で電子会議の参加者の情報を登録する動作の流れを示すフローチャートである。

まず、電子会議を開始する前に、会議端末１０を利用する利用者が電子会議の参加者を指定すると共に、参加者の情報が会議端末１０に登録される。例えば、図３に示したように、参加者指定部１１が指定ウインドウ３０をディスプレイ２５に表示し、利用者が指定ウインドウ３０を介して指定項目３１内の各種項目に対し情報を入力機器２４で入力する。指定された項目に対する情報が、参加者指定部１１によって図４の制御情報に登録される（ステップＳ１）。

図９（Ｂ）は、電子会議が開始した後に音声データを受信した場合の動作の流れを示すフローチャートである。

電子会議が開始した後に、音声データ受信部１２は、ネットワークインタフェース２１を介して受信したとき（ステップＳ１１）、受信した音声データを音声データ検出部１３に出力する。音声データ検出部１３は、出力された音声データが含まれているＩＰパケットのヘッダ部からＩＰアドレスを取得する（ステップＳ１２）。

音声データ検出部１３は、ステップＳ１２で取得したＩＰアドレスと同じものが、図４に示した制御情報の識別情報にある場合で、識別情報と対応する音声データの保存の是非を判定する（ステップＳ１３）。ステップＳ１２で取得したＩＰアドレスが、図４に示した制御情報の識別情報の中に一致するものがあって、識別情報と対応する音声データの保存の是非が「保存する」である場合、音声データ検出部１３は、音声データを音声データ保存部１４に出力する。

音声データ保存部１４は、各対象参加者の発言の無音部分を検出した場合、発言のあった期間の音声データをそれぞれ分離し（ステップＳ１４）、分離した各音声データに発言の開始時刻の情報を設定する（ステップＳ１５）。次に、音声データ保存部１４は、時刻情報を設定した音声データを記録媒体に保存する（ステップＳ１６）。

なお、図４（Ｂ）に示した制御情報の最大保存容量に、最大保存容量を表す値が設定されている場合には、音声データ保存部１４は、設定された最大保存容量に到達するまで対象参加者の音声データを保存する。保存した音声データの容量が、対象参加者に対応した制御情報の最大保存容量に到達した場合、音声データ保存部１４は、音声データの保存を停止する。また、制御情報の最大保存容量に「制限なし」が設定されている場合には、音声データ保存部１４は、無制限に対象参加者の音声データを保存する。

一方、音声データ受信部１２で受信した音声データは、ステップＳ１３で音声データの保存の是非に関わらず、音声データ再生部１７によって再生され（ステップＳ１７）、再生されたものがスピーカ２２を介して音声として出力される。

なお、図４（Ｂ）に示した制御情報のスピーカ出力の有無は、参加者が発言した音声をスピーカ２２に出力するか否かを表す情報であり、制御情報のスピーカ出力の有無が「無し」に設定されている参加者の音声データは、音声データ再生部１７によって再生されない。

図９（Ｃ）は、音声データを保存した場合の動作の流れを示すフローチャートである。図９（Ｃ）に示したフローチャートは、リアルタイムに議事録を作成する場合の動作を示したものである。

音声データが音声データ保存部１４によって記録媒体に記憶されたとき（ステップＳ２１）、音声認識部１５は、図４（Ｂ）の制御情報に設定されている登録音声データ識別項目３４が示す登録音声データに基づいて、音声データ保存部１４によって保存された音声データを音声認識してテキストデータに変換する（ステップＳ２２）。

次に、議事録作成部１６は、開始時刻から古いものから順番に、音声データから変換されたテキストデータを並び替えて議事録を作成し（ステップＳ２３）、作成した議事録を図８で示したようにディスプレイ２５に表示させる（ステップＳ２４）。

以上説明したように、会議端末１０は、電子会議の各参加者のうち発言が記録される対象参加者の情報を指定させ、受信された音声データのうち指定された対象参加者に対応する音声データだけを保存し、保存した音声データを音声認識して議事録を作成することで、発言が記録されない参加者に対応する音声データを保存することがなくなるため、議事録に必要なデータ量を節約することができる。

また、会議端末１０は、必要のある参加者の発言の音声データだけで議事録を作成することで、不要な参加者の発言の音声データを音声認識する必要もなくなるため、議事録を作成するときの処理効率を高めることができる。

また、対象参加者の登録音声データが会議端末１０に登録されており、音声認識部１５が、登録された登録音声データに従って音声認識し、音声データをテキストデータに変換するため、会議端末１０は、音声認識の精度を向上させることができる。対象参加者の登録音声データだけを登録しておけばよいため、発言を記録しない不要な登録音声データを登録する必要はない。

また、音声データ保存部１４が、設定された最大保存容量に到達するまで対象参加者の音声データを保存し、最大保存容量を超えて保存しないため、会議端末１０は、議事録に必要なデータ量を有効に使用することができる。

また、音声データ検出部１３が、該当する音声データの音量を、参加者指定部１１で指定された音量になるように調整することで、適正な音声データが保存されることになるため、会議端末１０は、議事録を正確に作成することができる。

なお、本発明の実施の形態では、会議端末１０Ａ〜会議端末１０Ｄの全てが議事録を取っていてもよいし、１つ以上の会議端末１０が取ってもよいし、議事録を取る会議端末１０の個数が限定されることはない。また、本発明の実施の形態に係る会議端末は、会議端末１０個々に必要のある参加者の発言だけで議事録を作成するため、同じ会議でも会議端末１０毎に様々な議事録を作成することができる。また、議事録を取る端末を会議端末１０Ｄとし、会議端末１０Ａ〜会議端末１０Ｃを一般的なパソコンに替えてもよく、すなわち、会議用の端末のうち１つを会議端末１０とし、残りの端末を一般的なパソコンにするような構成でもよい。

また、図１０に示すように、会議端末１０がＵＳＢハブ４０に接続され、各イヤホンマイク５０がＵＳＢハブ４０に接続されていてもよい。本発明の実施の形態では、識別情報をＩＰアドレスとして説明したが、図１０に示す形態で実施する際の識別情報はイヤホンマイク５０のデバイス識別子とする。

また、電子会議の途中で、利用者が指定ウインドウ３０を介して指定項目３１内にある情報を消去することで、参加者指定部１１は、制御情報に登録してある参加者を解除することもできる。

また、電子会議の途中で、利用者が指定ウインドウ３０を介して指定項目３１内の保存実施の是非を「保存する」から「保存しない」に変更することで、参加者指定部１１は、利用者が変更した保存実施の是非を「保存しない」に登録することもできる。逆に、電子会議の途中で、利用者が指定ウインドウ３０を介して指定項目３１内の保存実施の是非を「保存しない」から「保存する」に変更することで、参加者指定部１１は、利用者が変更した保存実施の是非を「保存する」に登録することもできる。

以上のように、本発明は、議事録に必要なデータ量を節約することができ、議事録を作成するときの処理効率を高めることができるという効果を有し、電子会議用のパソコンなどに有用である。

本発明の実施の形態に係る会議システムを表す図本発明の実施の形態に係る会議端末のブロック図利用者に参加者の情報を指定させる画面のイメージ図指定された参加者の情報に基づいた制御情報を示す図各参加者の発言による音声データの流れを表す図発言が開始された後に発言の無音部分を検出した際、発言が開始されてから無言の状態になるまでの音声データを電子ファイルとして保存するときの図同じ参加者の音声データをできるだけ一度に音声認識させるイメージ図音声データから変換されたテキストデータを開始時刻の順番に並び替えた議事録を示す図本発明の実施の形態に係る会議端末の動作の一例を示すフローチャート本発明の実施の形態と異なる形態に係る会議システムを表す図

符号の説明

１０会議端末
１１参加者指定部
１２音声データ受信部
１３音声データ検出部
１４音声データ保存部
１５音声認識部
１６議事録作成部
１７音声データ再生部
１８音声変換部
１９音声データ送信部
２１ネットワークインタフェース
２２スピーカ
２３マイクロホン
２４入力機器
２５ディスプレイ
３０指定ウインドウ
３１指定項目
３２音量メータ
３３参加者名項目
３４登録音声データ識別項目
３５識別情報項目
３６保存是非項目
４０ＵＳＢハブ
４１開始ボタン
４２停止ボタン
４３音量調整ボタン
４４クリアボタン
４５保存ボタン
５０イヤホンマイク

Claims

電子会議の各参加者のうち発言が記録される対象参加者の情報および発言が記録されない参加者の情報を指定させる参加者指定部と、
前記参加者が発言したときの音声データを受信する音声データ受信部と、
前記音声データ受信部によって受信された音声データのうち、前記参加者指定部で指定された対象参加者に対応する音声データを検出する音声データ検出部と、
前記音声データ検出部によって検出された音声データを保存する音声データ保存部と、
前記音声データ保存部によって保存された音声データをテキストデータに変換する音声認識部と、
前記音声認識部で変換されたテキストデータに基づいて議事録を作成する議事録作成部と、を備えたことを特徴とする議事録作成装置。
前記参加者指定部が、前記対象参加者の情報を指定させる際に前記対象参加者に対応する登録音声データを指定させ、
前記音声認識部が、前記参加者指定部で指定された対象参加者の登録音声データに従って音声データをテキストデータに変換することを特徴とする請求項１に記載の議事録作成装置。
前記参加者指定部が、前記対象参加者の情報を指定させる際に前記対象参加者の音声データを保存するときの最大保存容量を指定させ、
前記音声データ保存部が、前記音声データ検出部によって検出された音声データを、前記参加者指定部で指定された最大保存容量以内になるように保存することを特徴とする請求項１または請求項２に記載の議事録作成装置。
前記参加者指定部が、前記対象参加者の情報を指定させる際に前記対象参加者に対応する音声データの音量を指定させ、
前記音声データ検出部が、前記音声データ検出部によって検出された音声データの音量を、前記参加者指定部で指定された音量になるように調整することを特徴とする請求項１から請求項２までの何れかに記載の議事録作成装置。
音声データを再生する音声データ再生部を備え、
前記音声データ検出部が、前記音声データ受信部によって受信された音声データのうち、前記参加者指定部で指定された対象参加者に対応する音声データを検出すると共に、前記音声データ受信部によって受信された音声データを前記音声データ再生部に再生させることを特徴とする請求項１に記載の議事録作成装置。