JP2008160667A - 通信会議装置 - Google Patents

通信会議装置 Download PDF

Info

Publication number
JP2008160667A
JP2008160667A JP2006349444A JP2006349444A JP2008160667A JP 2008160667 A JP2008160667 A JP 2008160667A JP 2006349444 A JP2006349444 A JP 2006349444A JP 2006349444 A JP2006349444 A JP 2006349444A JP 2008160667 A JP2008160667 A JP 2008160667A
Authority
JP
Japan
Prior art keywords
voice
signal
video
speaker
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006349444A
Other languages
English (en)
Other versions
JP4850690B2 (ja
Inventor
Yoshimi Watanabe
芳美 渡辺
Takayuki Hashimoto
孝幸 橋本
Kazuto Tazaki
和人 田崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Communication Technologies Ltd
Original Assignee
Hitachi Communication Technologies Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Communication Technologies Ltd filed Critical Hitachi Communication Technologies Ltd
Priority to JP2006349444A priority Critical patent/JP4850690B2/ja
Publication of JP2008160667A publication Critical patent/JP2008160667A/ja
Application granted granted Critical
Publication of JP4850690B2 publication Critical patent/JP4850690B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】話者を表示し、聞き逃した発言内容を知ることができ、重要な内容を議事録データに残すことができる通信会議装置を提供する。
【解決手段】通信会議装置1が、アナログ音声信号をディジタル音声信号に変換する音声A/D変換機能111Mと、音声信号から話者識別情報を取得する話者識別処理機能113Mと、話者情報を付加した情報付加音声信号を得る話者識別情報付加機能114Mと、情報付加音声信号を圧縮して送出するとともに受信した圧縮音声情報を伸張して情報付加音声信号とする音声データ送受信処理機能115Mと、ディジタル音声信号をアナログ音声信号に変換する音声D/A変換手段112Mと、音声信号を文字データに変換する音声―文字データ変換機能332Mと、ディジタル映像信号に文字データを重畳させるOSD処理機能331Mと、映像および文字データを表示させるモニタ194と、話者を撮像するカメラ193とを備えた。
【選択図】図2

Description

本発明は、聞き手が、話者の発言内容をもれなく知ることができ、議事録を容易に作成できる通信会議装置、例えば、テレビ会議装置または音声会議装置に関する。
本発明は、地理的に離れた地点間でリアルタイムに会議を行うことができる通信会議システム(例えば、音声会議システムやテレビ会議システム)において、特に聞き手が容易に話者を区別することができ、発言内容を聞き逃すことがないように配慮した通信会議システム(テレビ会議装置、音声会議装置)に関する。
近年、通信会議システムの重要性が高まっている中で、テレビ会議システムの場合は、聞き手は通信相手の表情を見ながら会議できるので、話者を識別するのは容易である。しかし、多地点での会議の場合では、話者が複数となり、議論が白熱した際等に、参加者は、全ての話者の発言内容を聞きとれないままに会議が進行してしまうことがある。
また、音声会議では、通信相手が見えず、聞き手は話者を識別するのが困難であり、参加者は、テレビ会議以上に、全ての話者の発言内容を聞きとれないままに会議が進行してしまうことがある。
この問題を解決するための技術として、話者の識別が容易であり、また、音声信号を議事録として記録する音声会議システム(例えば、特許文献1参照)が提案されている。
特開平2005−080110号公報
従来の技術では、会議中に話者の発言内容を聞きとれなかった場合、同席者に発言内容を尋ねたり、会議後に議事録を見ることによってしか発言内容を理解することができなかった。また、数時間に及ぶ会議の議事録を作成する際、保存した議事録の音声データを文書に変換しても会議の要点が分かりにくく、そのままでは議事録として使用できず、全体的に見直す必要がある。
本発明は、上記の事情に鑑みて、通信会議中に、聞き逃した発言内容を知ることができ、また、誰の発言であるかを知ることができ、かつ、議事録に残す発言を選択することによって、重要な内容のみを議事録データに残すことを容易とした通信会議システムを構成する通信会議装置(テレビ会議装置、音声会議装置)を提供することを課題とする。
上記課題を解決するために、本発明は、通信会議システムにおいて、モニタ画面に発言者の発言内容を発言者識別情報および文字データとして表示画面上に所望の時間遅れて表示する追いかけ表示を行い、さらに、パソコン等の設定手段からの設定により、議事録に残すデータを選択することを特徴とする。
本発明は、モニタ画面に相手の映像を表示するとともに、発言内容の文字データをモニタ画面に追いかけて表示するので、話者の声が聞き取りにくい場合でも、会議の参加者が、話者の発言内容を常に把握できるという利点がある。
さらに、本発明によれば、通信会議中、発言内容を文字データとしてモニタ画面の一部に追いかけ表示することにより、万が一聞き逃した発言内容を知ることができる。さらに、話者識別機能により、モニタ画面に表示した発言内容が誰の発言であるか表示することができ、通信会議装置に接続されたパソコンからの設定により、議事録に残す発言を選択することによって、重要な内容のみを議事録データに残すことが容易になる。
本発明は、テレビ会議システムおよび音声会議システムなどの通信会議システムにおいて、音声の発言内容を文字データに変換する文字データ変換機能と、話者を識別する話者識別機能と、モニタ画面上に文字データを表示する機能と、文字データを所望の時間遅延させてモニタ画面に表示させる遅延表示機能とを備えることを特徴とする。さらに、本発明のテレビ会議装置は、一つのモニタ画面に、相手の画像と、話者識別情報および発言内容の文字データを追いかけて表示する構成とした。したがって、本発明は、従来のテレビ会議システムに文字データ変換機能と、文字データ表示機能と、遅延表示機能を付加することにより、実現することができる。
すなわち、本発明は、話者の音声を集音したマイクロホンからのアナログ音声信号をディジタル音声信号に変換する音声A/D変換手段と、音声信号から話者を識別し特定する話者識別情報を取得する話者識別処理手段と、ディジタル音声信号に話者情報を付加して情報付加音声信号に変換する話者識別情報付加手段と、情報付加音声信号を圧縮して通信網へ送信する送信手段と、通信網から圧縮音声情報を受信する受信手段と、受信した圧縮音声信号を伸張して情報付加音声信号とし話者識別情報を抽出した後ディジタル音声信号とする音声データ処理手段と、ディジタル音声信号をアナログ音声信号に変換してスピーカから出力する音声D/A変換手段と、を有する通信会議装置であって、音声信号を文字データに変換する音声―文字データ変換手段と、文字データを画面に表示させる映像D/A変換手段と、文字データを表示させる画面とを有する。
本発明は、上記通信会議装置において、文字データを話者の発言より遅れて追っかけ表示する文字データ表示手段を有する。また、本発明は上記通信会議装置において、音声データまたは文字データの発言のはじめに遡って議事録採用処理を行うマーキング遡り手段を有する。さらに本発明は、上記通信会議装置において、話者を撮影するカメラと、カメラで撮影した話者のアナログ映像信号をディジタル映像信号に変換する映像A/D変換手段と、ディジタル映像信号を圧縮して圧縮映像信号としこの圧縮映像信号を通信網へ送信する映像信号送信手段と、通信網から受信した圧縮映像信号を伸張してディジタル映像信号に変換する映像信号伸張手段と、映像を表示するモニタと、ディジタル映像信号に話者識別情報と発言内容の文字データを重畳させモニタに表示させるOSD機能部とを有する。
本発明は、上記通信会議装置において、識別情報付加音声信号を、議事録データとして蓄積する記憶手段を有する。また、本発明は、上記通信会議装置が、テレビ会議装置または音声会議装置であることを特徴とする。
図1を用いて、通信会議システムのひとつである本発明にかかるテレビ会議システムを構成するテレビ会議装置1のハードウエア構成を、図2を用いてテレビ会議装置1の機能構成を説明する。図1は本発明にかかるテレビ会議システムのハードウエアの構成を説明する図である。図2は図1に示したテレビ会議システムの機能構成を説明する図である。図3は図1に示したテレビ会議装置の複数台を互いに通信網に接続してテレビ会議システムを構成した例を示す図である。
テレビ会議装置1は、音声処理部11と、映像処理部13と、記憶部14と、通信網インタフェース15と、CPU16と、バス17とを備えて構成される。さらに、テレビ会議装置1には、通信網(インターネット、構内LANなど)3と、パソコン18と、複数のマイクロホン191と、スピーカ192と、カメラ194と、モニタ193が接続される。
音声処理部11は、複数の音声A/D変換回路111と、音声D/A変換回路112と、音声CODEC115とを有している。
映像処理部13は、映像D/A変換回路131と、映像A/D変換回路132と、OSD機能回路133と、映像CODEC134とを有している。
記憶部14は、主メモリ141と、音声一時記録メモリ142と、音声記録メモリ143と、文字データメモリ144を有している。
音声CODEC115と、映像CODEC134と、OSD機能部133と、CPU16と、主メモリ141と、音声一時記録メモリ142と、音声記録メモリ143と、文字データメモリ144は、それぞれバス17によって接続され、バス17を介して相互にデータや信号を交換する。
音声A/D変換回路111は、複数のマイクロホン191からのアナログ音声信号をそれぞれA/D変換してディジタル音声信号を得る手段である。このディジタル音声信号は、音声CODEC115に出力される。
音声D/A変換回路112は、音声CODEC115からのディジタル音声信号をD/A変換してアナログ音声信号を得て、スピーカ192へ出力する。
音声CODEC115は、複数のアナログ音声信号のうちもっとも大きな出力の音声信号を主マイクロホンの位置と認識し、このマイクロホンに対応した話者に関する情報を話者識別情報とするとともに、この話者識別情報と現在時刻を音声A/D変換回路111からのディジタル音声信号に付加して情報付加音声信号に変換し、この情報付加映像信号を圧縮して圧縮音声信号としてバス17に出力する。さらに、音声CODEC115は、通信網3から通信インタフェース15を介して受信した圧縮音声信号を伸張して情報付加音声信号を得、この情報付加音声信号から話者識別情報と現在時刻を抜き取った後のディジタル音声信号を音声D/A変換回路112に出力する。音声D/A変換回路112では、ディジタル音声信号にD/A変換処理を行ない、アナログ音声信号としてスピーカ192へ出力する。音声CODEC115は、同時にCPU16からの情報付加音声信号を記憶部14の音声一時記録メモリ142に記録する。
映像D/A変換回路131は、ディジタル映像信号にD/A変換処理を行なってモニタ出力用のアナログ映像信号に変換し、アナログ映像信号をモニタ193へ出力する。
映像A/D変換回路132は、カメラ194からのアナログ映像信号をディジタル映像信号にA/D変換する。
OSD機能部133は、音声信号の内容を認識して文字データに変換する音声−文字データ変換機能を有しており、CPU16からのオーダにより、音声一時記録メモリ142から音声信号と話者識別情報を読み出し、音声信号をモニタ表示用の文字データに変換して、話者識別情報とともに、映像CODEC134に出力する。また、OSD機能部133は、変換した文字データおよび識別情報を文字データメモリ144に出力する。
映像CODEC134は、映像A/D変換回路132からのディジタル映像信号を圧縮して圧縮映像信号としてバス17に出力する。また、映像CODEC134は、バス17から受信した圧縮映像信号を伸長してディジタル映像信号に変換する。さらに、映像CODEC134は、伸長変換したディジタル映像信号に、OSD機能部133からのモニタ表示用の文字データおよび話者識別情報を重畳させて情報付加ディジタル映像信号とし、映像D/A変換回路131においてD/A変換を行なって、文字データおよび話者識別情報が付加されたアナログ映像信号に変換して、モニタ193の画面に表示させる。このようにしてモニタ193の画面に表示したカメラ映像の一部に、話者識別情報と発言内容を順次表示させる。
主メモリ141は、本装置の主メモリであり、CPU16を動作させるためのプログラムの格納や、動作中の一時的な保持メモリとして動作する部分である。
音声一時記録メモリ142は、話者識別情報と現在時刻を付加した情報付加音声信号を一時記録する手段である。音声一時記録メモリ142に記録された情報付加音声信号は、パソコン18からの指定により、通信網インタフェース15→CPU16→音声一時記録メモリ142とアクセスされ、指定された音声データのみが音声一時記録メモリ142から音声記録メモリ143に、議事録データとして順次格納されていく。
音声記録メモリ143は、音声一時記録メモリ142からの音声データのうち、パソコン18から指定された音声データを話者識別情報とともに議事録データとして順次格納する。
文字データメモリ144は、OSD機能部133において音声−文字データ変換処理した文字データおよび話者識別情報を格納する。
通信網インタフェース15は、通信網3との間で送受信する圧縮映像信号または圧縮音声信号の電気インタフェースを変換して、通信網3に送出し、通信網3から受信した圧縮映像信号または圧縮音声信号の電気インタフェースを変換して装置内に取り込む手段である。すなわち、通信網インタフェース15は、通信網3のインタフェースに合わせたデータフォーマットに変換された圧縮映像信号または圧縮音声信号の電気インタフェースを変換して、通信網3にデータを送信し、通信網3から圧縮映像信号または圧縮音声信号を受信して、装置内でのデータフォーマットに電気インタフェースを変換する。
CPU16は、情報付加音声信号を通信網3のインタフェースに合わせたデータフォーマットの圧縮音声信号に変換するよう音声CODEC115に指示する。さらに、CPU16は、受信した圧縮音声信号を通信網3のデータフォーマットから装置内の情報付加音声信号に変換するよう音声CODEC115に指示する。また、CPU16は、圧縮映像信号を通信網3のインタフェースに合わせたデータフォーマットに変換するよう映像CODEC134に指示する。また、CPU16は、受信した通信網3の電気インタフェースを変換した圧縮映像信号のデータフォーマットを装置内のディジタル映像信号に変換する。
音声記録メモリ143に記録されたデータの中から必要な情報を読み出す場合は、パソコン18から識別信号、記録時間、発言内容の一部等のキーワードを指定し、音声記録メモリ143を検索することにより必要な情報を読み出すことができる。検索した結果は、モニタ193に表示する。結果が複数の場合、記録時間の早いものから順に話者の識別情報と発言内容を表示する。
会議終了後、保存された議事録音声データを、パソコン18からの操作により、通信網インタフェース15→CPU16→音声記録メモリ143とアクセスし、パソコン18へ読み出すことができる。読み出した議事録データをパソコンの文字変換ソフト等により文書化し、議事録を作成する。
上述のような議事録音声データを読み出す手法に代えて、パソコン18からの操作により、通信網インタフェース15→CPU16→文字データメモリ144とアクセスし、パソコン18へ議事録文字データを読み出し、この議事録文字データを用いて議事録を作成することができる。
図2を用いて、本発明にかかるテレビ会議システムを構成するテレビ会議装置の機能構成の1実施例を説明する。
まず、図2を用いてテレビ会議装置の機能構成の概要を説明する。テレビ会議装置1は、音声処理部11と、議事録作成処理部12と、映像処理部13と、記憶部14と、通信処理部15とを有している。さらに、テレビ会議装置1は、複数のマイクロホン191と、スピーカ192と、モニタ193と、カメラ194と、パソコン18が接続される。テレビ会議装置1は、通信網3を介して他のテレビ会議装置と接続される。
音声処理部11は、マイクロホン191から入力されたアナログ音声信号をディジタル音声信号に変換する音声A/D変換処理機能111Mと、ディジタル音声信号をアナログ音声信号に変換してスピーカ192に出力する音声D/A変換処理機能112Mと、音声信号が入力されたマイクロホン191の位置から話者を識別する話者識別機能113Mと、ディジタル音声信号に話者識別情報および現在時刻を付加する話者識別・現在時刻付加処理機能114Mと、ディジタル音声信号を通信網3に送り出すのに適した音声データ形式に変換するとともに通信網3から受信した音声信号を内部処理に適した音声データ形式に変換する音声データ送受信処理機能115Mとを有している。
音声処理部11は、マイクロホン191から入力されたアナログ音声信号をディジタル音声信号に変換した後、話者識別処理機能113Mで取得した話者識別情報および現在時刻情報をディジタル音声信号に付加して情報付加音声信号とし、さらにこの情報付加音声信号を通信網(インターネット、構内LANなど)3へ送り出すに適した音声データ形式にした圧縮音声信号に変換して通信処理部15へ送り出す働きを有している。また、音声処理部11は、通信網3から通信処理部15を介して受信した圧縮音声信号を伸張して情報付加音声信号とした後、話者識別情報および現在時刻情報を取り除いてディジタル音声信号とし、音声D/A変換処理機能112Mでアナログ音声信号に変換してスピーカ192から出力する働きを有している。
議事録作成処理部12は、マーキング遡り処理機能121Mを有しており、パソコン18からの指示によって、音声記録メモリ143に格納された音声データもしくは文字データメモリ144に格納された文字データに、議事録として採用することを示すマーキングをデータを遡ってマーキングする働きを有している。
映像処理部13は、通信網3から受信した圧縮映像信号から変換されたディジタル映像信号に話者識別情報および文字データを付加した情報付加映像信号を、モニタ193に表示するアナログ信号に変換処理する映像D/A変換処理機能131Mと、表示画面内に文字データを表示させる処理を行うOSD(On Screen Display)処理機能133Mと、映像A/D変換処理機能132Mからのディジタル映像信号を通信網3に送り出すのに適した画像データ形式とした圧縮映像信号に変換するとともに、通信網3から受信した圧縮映像信号を内部処理に適した映像データ形式に変換する映像データ送受信処理機能134Mとを有している。
映像A/D変換処理機能132Mと、OSD処理機能133Mと、映像データ送受信処理機能134Mは、映像CODEC部134がCPU16と共同して実現される機能である。OSD処理機能133Mは、OSD処理機能331Mと、音声−文字データ変換処理機能332Mとから成る。音声―文字データ変換処理機能332Mは、音声一時記憶メモリ142に記憶された音声データを読出し、その内容を認識して文字データに変換する機能を有している。この音声−文字データ変換処理は相当の処理時間を必要とするので、OSD機能によってモニタの画面に表示するときは、話者の発言から少し遅れて表示されるが、聞き逃しなどを確認するには具合のよい表示タイミングになる。音声−文字データ変換処理に要する時間が短い場合には、文字データのOSD表示に遅延を入れて表示タイミングを望みの時間遅らせて表示する。OSD処理機能331Mは、音声−文字データ変換処理機能332Mが変換した文字データを話者識別情報とともにディジタル映像信号に重畳し、情報付加映像信号とする機能である。
OSD処理機能133Mの情報付加映像信号力は、映像D/A変換処理機能131Mに出力される。
記憶部14は、主メモリ141と、音声一時記録メモリ142と、音声記録メモリ143と、文字データメモリ144を有している。各メモリの働きは、図1の説明と同じであるので説明を省略する。
このようなテレビ会議装置1において、議事録作成者がテレビ会議における発言内容を聞き取りながらまたは文字化された発言内容を読み取りながら議事録として採用すべきと判断したときに、例えばパソコン18から議事録として採用することを示すマーキング信号を入力することによって、音声記録メモリ143に格納された音声データ(発言内容)または文字データメモリ144に格納された文字化された発言内容の先頭に遡って音声議事録に採用のフラグを立てる。このフラグは、記憶部14の音声メモリ142または文字データメモリ144に記録されたデータの先頭に付与される。
議事録作成時には、音声記録メモリ143および/または文字データメモリ144にパソコン18からアクセスし、その内容を確認しながら議事録を作成することができる。
通信処理部(通信網インタフェース)15は、自己のテレビ会議装置1に通信網3を介して対向して設けられた少なくとも一つのテレビ会議装置との間で音声データおよび画像データならびに文字データをそれぞれ異なる帯域を用いて送受信するための処理を行う。さらに、通信処理部15は、一部に設けたパソコン18との間の通信のための処理を実行する。
以下、テレビ会議装置1の動作について説明する。まず、音声信号の処理について述べる。複数のマイクロホン191からのアナログ音声信号を音声A/D変換機能111MでA/D変換してディジタル音声信号とし、話者識別処理機能113Mによりアナログ音声信号の主マイクロホン191の位置から話者を識別して話者識別情報を取得し、話者識別・現在時刻付加処理機能114Mにより、話者識別情報と現在時刻をディジタル音声信号に付加して情報付加音声信号とし、この情報付加音声信号を音声データ送受信処理機能115Mと音声一時記録メモリ142へ送出する。
情報付加音声信号を受信した音声データ送受信処理機能115Mは、情報付加音声信号を通信網3のインタフェースに合わせたデータフォーマットに圧縮変換処理して圧縮音声信号として通信処理部15へ送り出す。通信処理部15は、通信網3に合わせて電気インタフェースを変換して、通信網3にデータを送信する。同時に音声データ送受信処理機能115Mにより話者識別情報と現在時刻を付加したディジタル音声信号を記憶部14に設けた音声一時記録メモリ142に記録する。
また、通信網3からのディジタル音声信号を通信処理部15で受信し、電気インタフェースを変換して圧縮音声信号とした後、音声データ送受信処理機能115Mに出力する。
音声データ送受信処理機能115Mは、通信網のデータフォーマットから装置内のデータフォーマットに変換して話者識別情報と現在時刻を付加した情報付加音声信号に変換し、話者識別情報と現在時刻を抜き取ったディジタル音声信号を音声D/A変換処理機能112Mに送出する。同時に、音声データ送受信処理機能115Mは、話者識別情報と現在時刻を付加したディジタル音声信号を記憶部14の音声一時記録メモリ142に記録する。
音声D/A変換処理機能112Mは、ディジタル音声信号をD/A変換してアナログ音声信号とし、スピーカ192へ出力する。
次に、映像信号の処理について述べる。映像A/D変換処理機能132Mは、カメラ194からのアナログ映像信号をA/D変換してディジタル映像信号を得て映像データ送受信処理機能134Mへ送出する。映像データ送受信処理機能134Mは、このディジタル映像信号を、通信網3のインタフェースに合わせたデータフォーマットの圧縮映像信号に圧縮変換した後、通信処理部15に送信する。通信処理部15は、圧縮映像信号の電気インタフェースを変換して通信網内圧縮映像信号を得て、通信網3に送信する。
一方、通信網3からの通信網内圧縮映像信号を受信した通信処理部15は、電気インタフェースを変換した後、通信網3のデータフォーマットを装置内のデータフォーマットに変換して圧縮映像信号とした後、映像データ送受信処理機能134Mに送信する。映像データ送受信処理機能134Mは、圧縮映像信号を伸長変換してディジタル映像信号を得て、OSD処理機能133Mへ送出する。OSD処理機能133Mは、文字データおよび話者識別情報を付加して情報付加映像信号として映像D/A変換処理機能131Mへ出力する。映像D/A変換処理機能131Mは、情報付加映像信号をアナログ映像信号に変換してモニタ193へ出力する。
OSD処理機能133Mは、CPU16からのオーダにより、記憶部14の音声一時記録メモリ142から音声信号と話者識別情報を読み出し、モニタ表示用の文字データに変換する。OSD処理機能133Mは、ディジタル映像信号に、OSD処理機能133Mからのモニタ表示用の文字データと話者識別情報を重畳させて、モニタ画面に表示するカメラ映像の一部に、話者識別情報と発言内容の文字データを順次表示させる。
モニタ193に表示させる映像は、自己のテレビ会議装置のカメラで撮影した映像と文字データなどを表示するほかに、通信網3を介して取得した他のテレビ会議装置からの映像と文字データなどを表示させることができる。また、自己テレビ会議装置の映像と他テレビ会議装置の映像を、後述する分割表示方式で同一画面上に分割表示させ、さらに、話者の文字データを画面上に文字データとして表示することができる。
記憶部14の音声一時記録メモリ142は、音声データを一時記録し、パソコン18からの指定により、通信処理部15→CPU16→記憶部14の音声一時記録メモリ142とアクセスし、指定された音声データのみを音声一時記録メモリ142から音声記録メモリ143に、議事録データとして格納していく。
また、音声記録メモリ143に記録されたデータの中から、必要な情報を読み出すときには、パソコン18から識別信号、記録時間、発言内容の一部等のキーワードを指定し、検索することができる。検索した結果は、パソコン18のモニタに表示する。結果が複数の場合、記録時間の早いものから順に話者の識別情報と発言内容を表示する。
会議終了後、保存された議事録データを、パソコン18からの操作により、通信処理部15→CPU16→音声記録メモリ142とアクセスし、パソコン18へ読み出すことができる。読み出した議事録データをパソコン18の文字変換ソフト等により文書化し、議事録を作成する。
次に、図3を用いて、上記テレビ会議装置1を用いて、A地点およびB地点ならびにC地点の3地点間でテレビ会議を行う場合のテレビ会議システムの構成を説明する。図3は、テレビ会議システムの一例を示し、本発明のテレビ会議装置1を用いたテレビ会議システムは、3地点間のみでなく、2地点間や4、5地点間での接続も可能である。また、2地点間の場合、通信網3におけるMCU(多地点接続装置)31は不要である。
まず、3地点のテレビ会議装置1A〜1C間を、通信網3を介して互いに接続する。各テレビ会議装置1A〜1Cを通信網3に接続した後、A地点のマイクロホン191Aから発言した内容は、B地点およびC地点のそれぞれのスピーカ192B、192Cで再生される。また、A地点のカメラ194Aで撮影した映像は、それぞれB地点およびC地点のモニタ193B,193Cに表示される。確認のために、A地点の映像をモニタ193Aに表示することができる。
B地点およびC地点の発言内容および画像についても、それぞれ同じようにマイクロホン191B、191Cから発言し、他地点の音声をスピーカ192A〜192Cで再生し、カメラ194B,194Cの映像をモニタ193A〜193Cに表示する。
このようにして、A、B、Cの3地点間で互いに相手の映像を見ながら発言内容を聴取してテレビ会議を進めることができる。
本発明においては、A地点の複数のマイクロホン191Aのうち、ある一つのマイクロホン191Aから発言した内容は、文字データに変換され話者識別情報と共に、A、B、C地点の各々のモニタ193A〜193Cの映像表示中の一部に、追いかけて文字表示される。同様に、B、C地点の複数のマイクロホン192B、192Cから発言した内容を、文字データに変換し話者識別情報と共に、A、B、C地点の各々のモニタ193A〜193Cの映像表示中の一部に、追いかけて文字表示する。
会議の参加者は、発言内容を万が一聞き逃した場合にも、後からモニタ193A〜193Cに発言者と発言内容が文字で表示されるので、その発言内容を知ることができる。
また、会議の参加者のうち、議事録作成の担当者は、発言内容をスピーカ192で聞いた後、このモニタ193に表示された文字による発言内容を見て、議事録に残したい内容をパソコン18にて選択し、テレビ会議装置1の記憶部142にマーキングしてその他の音声データまたは文字データとともに保存する。パソコン18での議事録作成用の選択動作は、このように会議中にも行なうことができるが、会議終了後に会議の内容を再生して選択して議事録を作成することができる。また、このような議事録作成者の選択によらずに、議事録の選択内容を、予め議事録に残す発言者をマイクロホンの位置(音声の識別信号)で設定したり、声(ボリューム)の大きさで設定したりする等により、設定することができる。
図4および図5を用いて本発明にかかる音声会議システムの構成を説明する。図4は音声会議装置のハードウエア構成の例であり、図5は音声会議装置を互いに通信網に接続して構成した音声会議システムの例示す図である。図4に示す音声会議装置1´は、図1に示したテレビ会議装置の構成から、映像処理部13の映像A/D変換処理回路132およびカメラ194の機能を省いた構成となっており、映像信号を通信網3へ送受信する機能を持っていないのを除いて、テレビ会議装置1と同様の機能動作を実行できる。図5に示す音声会議システムでは、OSD機能部133は、マイクロホンからの音声信号に基づいて発言内容を文字データ化し、これをモニタ193に表示させる。各地点のモニタ193には、話者識別情報と同時に、発言内容が文字表示されるのみである。
この実施例にかかる音声会議装置1´の機能構成は、図2に示したテレビ会議装置1の機能構成からカメラからの映像をA/D変換する映像A/D変換処理機能132Mを除いた構成となる。議事録の作成は、テレビ会議装置における処理と同じ処理を行うことができる。
図6は、図5に示した音声会議装置1´の3地点間を接蔵した音声会議システムの接続構成において、外部にモニタ18を接続しない場合の構成例を示す。この構成の場合、外部モニタ194の代用として、パソコン18のモニタを使用する。その際の表示動作は、図4において、OSD機能部13が、CPU16からのオーダにより、音声一時記録メモリ142から音声信号を読み出し、モニタ表示用の文字データに変換して、映像CODEC134に出力し、モニタ表示用の文字データのみCPU16でパソコン18のモニタ表示のインタフェースに合わせたデータフォーマットに変換し、通信網インタフェース15で電気インタフェースを変換して、パソコン18に送信することによって、話者識別情報と発言内容を、順次、パソコン18のモニタに表示させる。
図7を用いて、3地点間のテレビ会議におけるA地点でのモニタに映像を分割表示する表示例を説明する。モニタ194の表示部194Dには、例えば、A地点の映像194Aと、B地点の映像194Bと、C地点の映像194Cが分割表示され、画面下部に話者識別情報から作成した話者名と音声−文字データ変換処理機能132Mで作成した文字データが表示される。文字データは、画面に表示された映像よりも遅延した後追いで表示される。
このように、本発明にかかる通信会議システムは、発言内容を後追いで画面上で確認することができ、従来のテレビ会議システムや音声会議システムと同等の接続および同等の使用方法で操作することが可能となり、システムの導入が容易である。
テレビ会議装置のハードウエア構成を説明する図 図1のテレビ会議装置の機能構成を説明する図 テレビ会議装置を互いに接続したテレビ会議システムの構成を説明する図 音声会議装置のハードウエア構成を説明する図 図4の音声会議装置を互いに接続した音声会議システムの構成を説明する図 音声会議システムの他の構成を説明する図 モニタに表示する分割画面および文字表示例を説明する図
符号の説明
1:テレビ会議装置、1´:音声会議装置、11:音声処理部、111:音声A/D変換回路、111M:音声A/D変換処理機能、112:音声D/A変換回路、112M:音声D/A変換処理機能、113M話者識別処理機能、114M:話者識別・現在時刻付加処理機能、115:音声CODEC部、115M:音声データ送受信処理機能、12:議事録作成処理部、121M:マーキング遡り処理機能、13:映像処理部、131:映像D/A変換回路、131M:映像D/A変換処理機能、132:映像A/D変換回路、132M:映像A/D変換処理機能、133:OSD機能部、134:映像CODEC部、134M:映像データ送受信処理機能、14:記憶部、141:主メモリ、142:音声一時記録メモリ、143:音声記録用メモリ、144:文字データメモリ、15:通信網インタフェース(通信処理部)、16:中央処理装置(CPU)、17:バス、18:パソコン、191:マイクロホン、192:スピーカ、194:カメラ、193:モニタ、3:通信網、31:多地点接続装置(MCU)、331M:OSD処理機能、332M:音声―文字データ変換処理機能。

Claims (6)

  1. 話者の音声を集音したマイクロホンからのアナログ音声信号をディジタル音声信号に変換する音声A/D変換手段と、音声信号から話者を識別し特定する話者識別情報を取得する話者識別処理手段と、ディジタル音声信号に話者情報を付加して情報付加音声信号に変換する話者識別情報付加手段と、情報付加音声信号を圧縮して通信網へ送信する送信手段と、通信網から圧縮音声情報を受信する受信手段と、受信した圧縮音声信号を伸張して情報付加音声信号とし話者識別情報を抽出した後ディジタル音声信号とする音声データ処理手段と、ディジタル音声信号をアナログ音声信号に変換してスピーカから出力する音声D/A変換手段と、を有する通信会議装置であって、
    音声信号を文字データに変換する音声―文字データ変換手段と、
    文字データを画面に表示させる映像D/A変換手段と、
    文字データを表示させる画面と
    を有することを特徴とする通信会議装置。
  2. 請求項1に記載の通信会議装置において、
    文字データを話者の発言より遅れて追っかけ表示する文字データ表示手段を有することを特徴とする通信会議装置。
  3. 請求項1記載の通信会議装置において、
    音声データまたは文字データの発言のはじめに遡って議事録採用処理を行うマーキング遡り手段を有することを特徴とする通信会議装置。
  4. 請求項1記載の通信会議装置において、
    話者を撮影するカメラと、
    カメラで撮影した話者のアナログ映像信号をディジタル映像信号に変換する映像A/D変換手段と、
    ディジタル映像信号を圧縮して圧縮映像信号としこの圧縮映像信号を通信網へ送信する映像信号送信手段と、通信網から受信した圧縮映像信号を伸張してディジタル映像信号に変換する映像信号伸張手段と、
    映像を表示するモニタと、
    ディジタル映像信号に話者識別情報と発言内容の文字データを重畳させモニタに表示させるOSD機能部と
    を有することを特徴とする通信会議装置。
  5. 請求項1記載の通信会議装置において、
    識別情報付加音声信号を、議事録データとして蓄積する記憶手段を有することを特徴とする通信会議装置。
  6. 請求項1記載の通信会議装置が、テレビ会議装置または音声会議装置であることを特徴とする通信会議装置。
JP2006349444A 2006-12-26 2006-12-26 通信会議装置 Expired - Fee Related JP4850690B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006349444A JP4850690B2 (ja) 2006-12-26 2006-12-26 通信会議装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006349444A JP4850690B2 (ja) 2006-12-26 2006-12-26 通信会議装置

Publications (2)

Publication Number Publication Date
JP2008160667A true JP2008160667A (ja) 2008-07-10
JP4850690B2 JP4850690B2 (ja) 2012-01-11

Family

ID=39661045

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006349444A Expired - Fee Related JP4850690B2 (ja) 2006-12-26 2006-12-26 通信会議装置

Country Status (1)

Country Link
JP (1) JP4850690B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011199327A (ja) * 2010-03-17 2011-10-06 Brother Industries Ltd 通信装置、および記録用音声受信装置の選定方法
WO2011149647A3 (en) * 2010-05-24 2012-02-23 Microsoft Corporation Voice print identification
JP2015015632A (ja) * 2013-07-05 2015-01-22 株式会社リコー 議事録生成装置、議事録生成方法、議事録生成プログラムおよび通信会議システム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0792993A (ja) * 1993-09-20 1995-04-07 Fujitsu Ltd 音声認識装置
JP2003339034A (ja) * 2002-05-17 2003-11-28 Pioneer Electronic Corp ネットワーク会議システム、ネットワーク会議方法およびネットワーク会議プログラム
JP2004165954A (ja) * 2002-11-13 2004-06-10 Canon Inc 発言記録装置
JP2005109929A (ja) * 2003-09-30 2005-04-21 Dowango:Kk 電子会議システム及び会議管理方法
JP2005295017A (ja) * 2004-03-31 2005-10-20 Hitachi Kokusai Electric Inc 映像会議システム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0792993A (ja) * 1993-09-20 1995-04-07 Fujitsu Ltd 音声認識装置
JP2003339034A (ja) * 2002-05-17 2003-11-28 Pioneer Electronic Corp ネットワーク会議システム、ネットワーク会議方法およびネットワーク会議プログラム
JP2004165954A (ja) * 2002-11-13 2004-06-10 Canon Inc 発言記録装置
JP2005109929A (ja) * 2003-09-30 2005-04-21 Dowango:Kk 電子会議システム及び会議管理方法
JP2005295017A (ja) * 2004-03-31 2005-10-20 Hitachi Kokusai Electric Inc 映像会議システム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011199327A (ja) * 2010-03-17 2011-10-06 Brother Industries Ltd 通信装置、および記録用音声受信装置の選定方法
WO2011149647A3 (en) * 2010-05-24 2012-02-23 Microsoft Corporation Voice print identification
CN102985965A (zh) * 2010-05-24 2013-03-20 微软公司 声纹标识
US8606579B2 (en) 2010-05-24 2013-12-10 Microsoft Corporation Voice print identification for identifying speakers
US9691393B2 (en) 2010-05-24 2017-06-27 Microsoft Technology Licensing, Llc Voice print identification for identifying speakers at an event
JP2015015632A (ja) * 2013-07-05 2015-01-22 株式会社リコー 議事録生成装置、議事録生成方法、議事録生成プログラムおよび通信会議システム

Also Published As

Publication number Publication date
JP4850690B2 (ja) 2012-01-11

Similar Documents

Publication Publication Date Title
US10732924B2 (en) Teleconference recording management system
JP2002504273A (ja) オーディオおよびマルチメディア会議を記録して索引をつける方法と装置
US11115765B2 (en) Centrally controlling communication at a venue
WO2019029073A1 (zh) 传屏方法、装置、电子设备及计算机可读存储介质
EP2924985A1 (en) Low-bit-rate video conference system and method, sending end device, and receiving end device
JP2010157906A (ja) 映像表示装置
JP4850690B2 (ja) 通信会議装置
US10468029B2 (en) Communication terminal, communication method, and computer program product
US8451317B2 (en) Indexing a data stream
CN109802968B (zh) 一种会议发言系统
JP2007259293A (ja) 多者間通話システム、通話機能付き端末装置、多者間通話方法、プログラム及び記録媒体
US7912454B2 (en) Method and system for archiving data in real-time communications
JP2000324463A (ja) テレビ会議システム
JP2019176375A (ja) 動画出力装置、動画出力方法および動画出力プログラム
JP3031320B2 (ja) ビデオ会議装置
US11089164B2 (en) Teleconference recording management system
JP2017163466A (ja) 情報処理装置および会議システム
JP2003339034A (ja) ネットワーク会議システム、ネットワーク会議方法およびネットワーク会議プログラム
JP2015173433A (ja) 端末装置及び通信システム
JP2008228014A (ja) 映像会議システム、会議映像処理方法、プログラム及び記録媒体
CN113096674B (zh) 一种音频处理方法、装置及电子设备
JP2013201505A (ja) テレビ会議システム及び多地点接続装置並びにコンピュータプログラム
US20230035219A1 (en) Teleconference method and teleconference system
JP2005151231A (ja) 映像通信方法、映像通信装置とこの装置で使用される映像作成プログラム及びこのプログラムを記録した記録媒体
JP2023120068A (ja) 音声処理システム、デバイス、音声処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090623

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20100113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110426

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110719

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110915

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111018

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111019

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141028

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees