JP2020136904A - スピーカ装置、ビデオ会議装置及び電子黒板 - Google Patents

スピーカ装置、ビデオ会議装置及び電子黒板 Download PDF

Info

Publication number
JP2020136904A
JP2020136904A JP2019027888A JP2019027888A JP2020136904A JP 2020136904 A JP2020136904 A JP 2020136904A JP 2019027888 A JP2019027888 A JP 2019027888A JP 2019027888 A JP2019027888 A JP 2019027888A JP 2020136904 A JP2020136904 A JP 2020136904A
Authority
JP
Japan
Prior art keywords
sound
speaker
voice
machine
adjustment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019027888A
Other languages
English (en)
Other versions
JP7251200B2 (ja
Inventor
未来 袴谷
Miku Hakamatani
未来 袴谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2019027888A priority Critical patent/JP7251200B2/ja
Publication of JP2020136904A publication Critical patent/JP2020136904A/ja
Application granted granted Critical
Publication of JP7251200B2 publication Critical patent/JP7251200B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】 臨場感のある音声を出力する。【解決手段】 本発明による、対象に対して複数台で使用されるスピーカ装置が、前記複数台のスピーカ装置のうち、自機と異なる他機を検出する他機検出部と、前記他機の位置である他機位置を検出する他機位置検出部と、前記対象を検出する対象検出部と、前記対象の位置である対象位置を検出する対象位置検出部と、前記他機位置及び前記対象位置に基づいて、入力音声に基づいて生成される第1音声及び第2音声を調整して第1調整音声及び第2調整音声を生成する調整部と、前記第1調整音声を出力する音声出力部と、前記第2調整音声を前記他機に出力させる音声出力指示部とを備える。【選択図】図1

Description

本発明は、スピーカ装置、ビデオ会議装置及び電子黒板に関する。
近年、複数のスピーカ装置を用いることで、いわゆるステレオ出力をする方法が知られている。
例えば、ステレオ出力が可能なテレビ会議装置が、モノラルの音声信号に基づいて、ステレオ化させた音声信号を生成する。このステレオ化させた音声信号を用いると、左右のスピーカによりステレオ再生が可能となる方法知られている(例えば、特許文献1参照)。
しかしながら、2 台以上のスピーカ装置又はスピーカ装置を有する装置を2 台以上並べて用いる場合等では、従来の方法は、それぞれのスピーカ装置を連携させて臨場感のある音声を出力できない。
本発明の一態様は、臨場感のある音声を出力させることを目的とする。
本発明の一実施形態による、対象に対して複数台で使用されるスピーカ装置は、
前記複数台のスピーカ装置のうち、自機と異なる他機を検出する他機検出部と、
前記他機の位置である他機位置を検出する他機位置検出部と、
前記対象を検出する対象検出部と、
前記対象の位置である対象位置を検出する対象位置検出部と、
前記他機位置及び前記対象位置に基づいて、入力音声に基づいて生成される第1音声及び第2音声を調整して第1調整音声及び第2調整音声を生成する調整部と、
前記第1調整音声を出力する音声出力部と、
前記第2調整音声を前記他機に出力させる音声出力指示部と
を備えることを特徴とする。
本発明の実施形態によって、臨場感のある音声を出力できる。
スピーカ装置のハードウェア構成例を示すブロック図である。 スピーカ装置の使用例を示すブロック図である。 スピーカシステムにおけるデータの送受信例を示すブロック図である。 全体処理例を示すフローチャートである。 他機位置及び対象位置の検出例である。 第2実施形態における全体処理例を示すフローチャートである。 第2実施形態におけるスピーカ装置の使用例を示すブロック図である。 機能構成例を示す機能ブロック図である。 ビデオ会議端末のハードウェア構成例を示す図である。 電子黒板のハードウェア構成例を示す図である。
以下、発明を実施するための最適な形態について、図面を参照して説明する。
<第1実施形態>
<スピーカ装置の例>
スピーカ装置は、例えば、以下のようなハードウェア構成の装置である。
<ハードウェア構成例>
図1は、スピーカ装置のハードウェア構成例を示すブロック図である。例えば、スピーカ装置10は、入力インタフェース(以下「入力I/F10H1」という。)と、音声出力装置10H2と、カメラ10H3と、CPU(Central Processing Unit、(以下「CPU10H4」という。)と、記憶装置10H5と、出力I/F10H6とを有する。
入力I/F10H1は、無線、ネットワーク又はケーブル等によって、外部装置からデータを入力する装置である。具体的には、入力I/F10H1は、コネクタ、アンテナ及び処理用のIC等の組み合わせである。
音声出力装置10H2は、音声を対象に対して出力する装置である。例えば、音声出力装置10H2は、スピーカ等である。
カメラ10H3は、周辺を撮像して画像データを生成する撮像装置の例である。
CPU10H4は、演算装置及び制御装置の例である。
記憶装置10H5は、データを記憶する主記憶装置等である。また、記憶装置10H5は、ハードディスク又はSSD(Solid State Drive)等の補助記憶装置を有してもよい。
出力I/F10H6は、無線、ネットワーク又はケーブル等によって、外部装置にデータを出力する装置である。具体的には、出力I/F10H6は、コネクタ、アンテナ及び処理用のIC等の組み合わせである。
なお、スピーカ装置10には、マイク等の入力装置があってもよい。すなわち、スピーカ装置10は、内部又は外部に接続される装置があってもよい。
<スピーカ装置の使用例>
図2は、スピーカ装置の使用例を示すブロック図である。例えば、スピーカ装置は、図示するように、スピーカシステム1において、対象の例である傍聴者LRに対して、右側及び左側となるように配置されて使用される。以下、図示するように、傍聴者LRの位置から見て右側に配置されるスピーカ装置を「右側装置10R」という。一方で、傍聴者LRの位置から見て左側に配置されるスピーカ装置を「左側装置10L」という。すなわち、以下に説明する例は、右側装置10Rが自機となる例であり、かつ、左側装置10Lが他機となる例である。
図示するように、右側装置10R及び左側装置10Lは、2 台で1つの音声を分けて出力し、傍聴者LRに音声を伝える。例えば、スピーカシステム1において、発言者SPが発言した音声がマイク11によって、音声信号に変換される。そして、音声信号は、ネットワークNW等を介して、右側装置10Rに入力される。
また、発言者SPは、スピーカシステム1が有するネットワークカメラ12が撮像する。そして、右側装置10Rには、ネットワークカメラ12が生成した画像データがネットワークNWを介して送信される。
以下、発言者の発声(以下「入力音声」という。)が音源となり、右側装置10Rが、音声信号に対する処理を行う場合を例に説明する。ただし、スピーカ装置の接続構成、処理を行う装置及びスピーカシステム1の構成は、図示するような構成に限られない。すなわち、処理は、右側装置10R以外の装置が行ってもよい。具体的には、左側装置10L又はスピーカシステム1が有する情報処理装置等が処理を行って右側装置10R及び左側装置10Lが音声を出力する構成でもよい。このように、処理は、右側装置10R以外の情報処理装置が分散等して行ってもよい。
したがって、スピーカシステム1では、例えば、以下のようなデータが送受信される。
図3は、スピーカシステムにおけるデータの送受信例を示すブロック図である。例えば、図示するように、スピーカシステム1では、発信側からネットワークNWを介して受信側に送信される。
まず、入力音声SDIは、マイク11によって、入力音声データD1に変換される。そして、入力音声データD1は、ネットワークNWを介して、右側装置10Rに送信される。そして、右側装置10Rは、入力音声SDIを元にして、右側装置10Rが出力する音声を出力するための音声データと、入力音声SDIを元にして、左側装置10Lが出力する音声を出力するための音声データを生成する。このように、右側装置10R及び左側装置10Lが割り振られた音声データに基づいて、音声をそれぞれ出力すると、入力音声SDIを再現した音声をステレオ出力で行うことができる。
また、右側装置10Rは、発言者を撮像した画像データD2に基づいて、発言者の位置(方向等を含む。)及びマイク11に対する距離等を認識する。例えば、右側装置10Rは、画像データD2に対して顔認識処理等を行うと、発言者の認識、位置及びマイク11に対する距離等を検出できる。
なお、発言者の認識、位置及びマイク11に対する距離等は、画像データD2以外のデータに基づいて検出されてもよい。例えば、入力音声データD1に基づいて、検出は行われてもよい。このような位置等を検出する場合には、マイク11は、いわゆるマイクアレイであるのが望ましい。このように、マイクアレイを用いる構成であると、音源が位置する音源位置(マイクに対する位置及び方向等が含まれる。)を精度よく検出できる。
なお、データの送受信は、双方向に行われてもよい。また、データの処理は、右側装置10Rが行うに限られず、発信側等で行われてもよい。
<全体処理例>
図4は、全体処理例を示すフローチャートである。例えば、図2に示すような構成、すなわち、偶数台のスピーカ装置を使用する場合には、右側装置10Rは、以下のような全体処理を行う。
ステップS01では、右側装置10Rは、他機を検出する。すなわち、右側装置10Rは、左側装置10Lのように、右側装置10Rと連携して音声を出力する装置を検出する。なお、他機は、左側装置10Lのように、右側装置10Rと同機種でなくともよい。
ステップS02では、右側装置10Rは、他機位置及び対象位置等を検出する。具体的には、右側装置10Rは、例えば、左側装置10L等から画像データを取得し、それぞれの画像データを比較する。そして、それぞれの画像データに、同じ被写体が撮像されていると、画像における同じ被写体の位置等から、他機位置が分かる。すなわち、例えば、右側装置10Rは、左側装置10Lより、対象に対して右側にある、及び、対象が右側装置10Rから見て左にいる等の位置関係が分かる。
また、それぞれの画像データに、例えば、人が写っていると、右側装置10Rは、人を検出して対象と認識する。このように、検出を行うと、右側装置10Rは、対象に対する位置関係を把握できる。
なお、他機位置及び対象位置の検出は、左側装置10Lによる画像データを用いる方法に限られない。例えば、他機位置及び対象位置の検出は、他のカメラ等といった外部装置が生成するセンサデータを利用して行われてもよい。また、他機位置及び対象位置は、右側装置10Rに設定する等でもよい。
ステップS03では、右側装置10Rが対象に対して、右側となるか否かを判断する。すなわち、他機位置及び対象位置を検出して位置関係が分かると、右側装置10Rは、連携する複数台のスピーカ装置が「右側」となるか、又は、「左側」となるかが判断できる。
次に、自機が右側であると(ステップS03でYES)、右側装置10Rは、ステップS04に進む。一方で、自機が右側でない、すなわち、左側であると(ステップS03でNO)、右側装置10Rは、ステップS05に進む。
ステップS04では、右側装置10Rは、自機を右側のスピーカ装置と決定し、かつ、右側装置10Rは、他機を左側のスピーカ装置と決定する。
ステップS05では、右側装置10Rは、自機を左側のスピーカ装置と決定し、かつ、右側装置10Rは、他機を右側のスピーカ装置と決定する。
以下、ステップS04が行われる場合、すなわち、図2のような配置を例に説明する。
ステップS06では、右側装置10Rは、入力音声を取得する。具体的には、右側装置10Rは、図3における構成では、入力音声データを入力することで入力音声を取得する。
そして、左側装置10L及び右側装置10Rは、連携してステレオ出力を行うために、例えば、以下のように処理を行う。
ステップS07では、右側装置10Rが対象に対して、右側となるか否かを判断する。
次に、自機が右側であると(ステップS07でYES)、右側装置10Rは、ステップS08に進む。一方で、自機が右側でない、すなわち、左側であると(ステップS07でNO)、右側装置10Rは、ステップS09に進む。
以下、右側装置10Rが出力する音声を生成するのに、基準となる音声を「第1音声」という。同様に、左側装置10Lが出力する音声を生成するのに、基準となる音声を「第2音声」という。例えば、第1音声及び第2音声は、入力音声と同じ音声である。すなわち、第1音声及び第2音声は、例えば、入力音声をコピーして生成される。なお、第1音声及び第2音声は、入力音声と同一に限られない。例えば、第1音声及び第2音声は、入力音声に対してノイズ除去等を行って、品質を良くする処理が行われた音声等でもよい。
ステップS08では、右側装置10Rは、第1音声の音量を上げ、かつ、第2音声が第1音声より遅延して出力されるように音声を調整して、第1音声を調整した音声(以下「第1調整音声」という。)と、第2音声を調整した音声(以下「第2調整音声」という。)とを生成する。すなわち、右側装置10Rは、第1音声の音量を高くした第1調整音声を生成する。このようにすると、第1調整音声及び第2調整音声の間で音圧に差がつく。さらに、右側装置10Rは、第2音声を遅延させた第2調整音声を生成するのが望ましい。
このように、右側装置10Rは、音源位置に基づいて、いずれかの音声を遅延させるのが望ましい。この場合には、第1音声を出力する側に、音源があると検出された場合である。すなわち、右側装置10Rは、音源に近い方の音声が早く出力されるように調整を行う。具体的には、例えば、音源位置がマイクに対して右側にある「右寄り」であるとする。このような場合には、音源位置が右側に近いと判定される。そして、右側装置10Rは、第2音声より早く出力される第1音声を出力する。この場合には、右側装置10Rは、例えば、第2音声を第1音声より10 ミリ秒遅延させる。
人は、先に音声が届く方に音源があると感じる。そのため、このように、音源位置に基づいて、音声が出力されるタイミングが調整されると、疑似的にステレオ感を作り出して、より臨場感のある音声を出力できる。
ステップS09では、右側装置10Rは、第2音声の音量を上げ、かつ、第1音声が第2音声より遅延して出力されるように、音声を調整して第1調整音声及び第2調整音声を生成する。すなわち、右側装置10Rは、ステップS08とは逆となるように調整する。したがって、この場合には、音源位置が左側に近いと判定された場合である。
以上のように、右側装置10Rは、第1音声及び第2音声に対して、位置関係に基づいて、右側装置10Rは、ステップS08又はステップS09によって、音量、音圧、出力タイミング又はこれらの組み合わせを調整して、第1調整音声及び第2調整音声を生成する。次に、右側装置10Rは、例えば、調整された音声、すなわち、第1調整音声及び第2調整音声を連携するスピーカ装置と連携して出力する。
ステップS10では、右側装置10Rは、第2調整音声の出力指示を行う。具体的には、右側装置10Rは、第2調整音声を示すデータを左側装置10Lに送信する。すなわち、右側装置10Rは、ステップS08又はステップS09で調整された音声を左側装置10Lに出力させる。
ステップS11では、右側装置10Rは、第1調整音声を出力する。
<他機位置及び対象位置の検出例>
他機位置及び対象位置の検出、すなわち、ステップS02、ステップS03及びステップS07は、例えば、以下のように行われる。
図5は、他機位置及び対象位置の検出例である。まず、図5(A)のように、右側装置10R及び左側装置10Lが配置され、かつ、対象となる人が5 人いる場合であるとする。また、傍聴者となる人(以下単に「人」という。)M1乃至M5は、図示するような配置であるとする。さらに、この例では、左側装置10Lは、図示するような範囲(以下「第1範囲RG1」という。)を撮像して画像データ(以下「第1画像データIMG1」という。)を生成する。一方で、この例では、右側装置10Rは、図示するような範囲(以下「第2範囲RG2」という。)を撮像して画像データ(以下「第2画像データIMG2」という。)を生成する。
図示するように、第1範囲RG1及び第2範囲RG2には、共通領域がある。したがって、第1画像データIMG1は、例えば、図5(B)に示すように生成される。同様に、第2画像データIMG2は、例えば、図5(C)に示すように生成される。
例えば、右側装置10Rは、第1画像データIMG1及び第2画像データIMG2を比較して、自機位置及び他機位置、すなわち、自機及び他機の相対的な位置関係を決定する。例えば、右側装置10Rは、まず、同じ被写体が写っていると認識する等の処理を行うと、共通領域CMを第1画像データIMG1及び第2画像データIMG2のどちらの画像データでも抽出できる。次に、中央線CLと比較すると、第1画像データIMG1では、共通領域CMは、右に偏っている。一方で、第2画像データIMG2では、共通領域CMは、中央線CLに対して左に偏っている。このような処理から、第1画像データIMG1は、「左側」で撮像され、かつ、第2画像データIMG2は、「右側」で撮像されたと判定できる。このような判定結果に基づいて、右側装置10Rは、左側装置10Lを対象に対して左側とし、かつ、右側装置10Rを対象に対して右側と決定する(ステップS04)。
なお、右側装置10Rは、共通領域CM以外を利用して決定を行ってもよい。具体的には、例えば、顔認識処理等を行うと、第1画像データIMG1及び第2画像データIMG2において、共通して写っている人を検出できる。例えば、人M3等が、第1画像データIMG1及び第2画像データIMG2のどちらでも認識することができる。このように、右側装置10Rは、被写体を利用して位置関係を決定してもよい。
なお、他機位置及び対象位置等は、図示する方法に限られない。例えば、画像データに他機が写っているのを認識して、他機が自機に対してどの方向にあるかが認識されてもよい。
<第2実施形態>
第2実施形態は、例えば、第1実施形態と同一のハードウェア構成となるスピーカ装置を用いて実現される。以下、同一の構成要素には、同一の符号を付して説明を省略し、重複する説明を省略する。
第2実施形態では、スピーカ装置が、3 台以上、すなわち、奇数台となる点が異なる。したがって、第2実施形態では、対象に対して、位置関係は、左側、中央又は右側のいずれかになる点が異なる。ゆえに、全体処理は、例えば、以下のようになる。
<全体処理例>
図6は、第2実施形態における全体処理例を示すフローチャートである。第1実施形態と比較すると、ステップS201乃至ステップS206が異なる。
ステップS201では、右側装置10Rは、それぞれのスピーカ装置を左側、中央又は右側のいずれかに決定する。すなわち、画像データの比較等によって、右側装置10Rは、それぞれのスピーカ装置が、左側に配置されているか、中央に配置されているか、又は、右側に配置されているかのいずれか判定する。この判定結果に基づいて、右側装置10Rは、それぞれのスピーカ装置の位置関係を決定する。
ステップS202では、第1音声の音量を上げ、かつ、第2音声を遅延させる等の調整によって第1調整音声及び第2調整音声を生成する。例えば、右側装置10Rは、ステップS08と同様に、第1調整音声及び第2調整音声を生成する。
ステップS203では、右側装置10Rは、右側に決定されたスピーカ装置に第1調整音声を出力するように指示する。
ステップS204では、右側装置10Rは、左側に決定されたスピーカ装置に第2調整音声を出力するように指示する。
ステップS205では、右側装置10Rは、中央に決定されたスピーカ装置に消音にするように指示する。
ステップS206では、右側装置10Rは、自機に決定された位置関係に基づいて音声を出力する。具体的には、自機が右側と決定された場合には、右側装置10Rは、第1調整音声を出力する。
<スピーカ装置の使用例>
第2実施形態では、例えば、スピーカ装置は、以下のように使用される。
図7は、第2実施形態におけるスピーカ装置の使用例を示すブロック図である。第1実施形態と比較すると、第2実施形態は、中央装置10Cに決定されるスピーカ装置がある点が異なる。
図示するように、中央装置10Cは、ミュート等によって、消音とする。一方で、右側装置10R及び左側装置10Lは、第1実施形態と同様に、右側装置10Rが調整して生成し、位置関係に基づいて分けた音声を出力する。
<機能構成例>
図8は、機能構成例を示す機能ブロック図である。例えば、スピーカ装置の例である、右側装置10Rは、他機検出部FN1と、他機位置検出部FN2と、対象検出部FN3と、対象位置検出部FN4と、調整部FN5と、音声出力部FN6と、音声出力指示部FN7とを備える機能構成である。
他機検出部FN1は、他機を検出する他機検出手順を行う。例えば、他機検出部FN1は、カメラ10H3等によって実現される。
他機位置検出部FN2は、他機位置を検出する他機位置検出手順を行う。例えば、他機位置検出部FN2は、カメラ10H3等によって実現される。
対象検出部FN3は、傍聴者LRを検出する対象検出手順を行う。例えば、対象検出部FN3は、カメラ10H3等によって実現される。
対象位置検出部FN4は、傍聴者LRの位置を示す対象位置を検出する。例えば、対象位置検出部FN4は、カメラ10H3等によって実現される。
調整部FN5は、他機位置及び対象位置等、すなわち、位置関係に基づいて、入力音声に基づいて生成される第1音声及び第2音声を調整して第1調整音声SD1及び第2調整音声SD2を生成する調整手順を行う。例えば、調整部FN5は、CPU10H4等によって実現される。
音声出力部FN6は、第1調整音声SD1を出力する音声出力手順を行う。例えば、音声出力部FN6は、音声出力装置10H2等によって実現される。
音声出力指示部FN7は、第1調整音声SD1を他機に出力させる音声出力手順を行う。例えば、音声出力指示部FN7は、出力I/F10H6等によって実現される。
以上のような機能構成であると、複数台で使用すれば、それぞれのスピーカ装置がいわゆるモノラルスピーカとなるハードウェア構成であっても、自機と他機で出力する音声を分けて出力すると、ステレオ出力が可能となる。
装置に音声出力装置を搭載するのに、例えば、部品の厚み、重さ、コスト又はアンプの消費電力等の制約により、1つの装置に複数の音声出力装置を搭載するが難しい場合がある。一方で、音声出力装置を1つ搭載する、すなわち、モノラルスピーカとすると、スピーカ装置は、装置の薄型化、軽量化、コストダウン、部品点数の削減又は部品が占有する面積の削減等とすることができる。さらに、1つ1つのスピーカ装置が、モノラルスピーカのようなハードウェア構成であっても、ステレオ出力によって、臨場感のある音声を出力させることができる。
そして、他機及び他機位置が検出でき、かつ、対象及び対象位置が検出できると、右側又は左側のように、位置関係を決定して出力する音声を分けることができる。すなわち、ステレオ出力における、位置関係が決まると、対象に対して適した位置にあるスピーカ装置から音声を出力させて、ステレオ出力を実現できる。
<変形例>
なお、スピーカ装置は、スピーカ装置から対象までの距離を計測してもよい。そして、スピーカ装置は、距離に合わせて音圧、音量、出力タイミング又はこれらの組み合わせを更に調整してもよい。同様に、スピーカ装置は、スピーカ装置の間の距離を計測し、利用してもよい。
位置の検出、方向の検出及び認識には、カメラ及びマイク以外のセンサが用いられてもよい。すなわち、スピーカ装置は、温度及び電波等を利用して検出等を行ってもよい。
また、画像データは、スピーカ装置が有する撮像装置等が生成するに限られない。例えば、スピーカ装置に、広角な撮像が可能な外部撮像装置等が接続され、画像データが外部装置等から取得されてもよい。
また、実施形態は、本実施形態に係るスピーカ装置を有する又は外部に接続させる情報処理装置でもよい。ほかにも、例えば、実施形態は、以下のような構成であってもよい。
<ビデオ会議装置の例>
図9は、ビデオ会議端末のハードウェア構成例を示す図である。図示するように、ビデオ会議装置の例である、ビデオ会議端末7は、CPU701、ROM702、RAM703、フラッシュメモリ704、SSD705、メディアI/F707、操作ボタン708、電源スイッチ709、バスライン710、ネットワークI/F711、CMOS(Complementary Metal Oxide Semiconductor)センサ(以下「CMOSセンサ712」という。)、撮像素子I/F、マイク714、スピーカ715、音入出力I/F716、ディスプレイI/F717、外部機器接続I/F718、近距離通信回路719、近距離通信回路719のアンテナ719aを備えている。これらのうち、CPU701は、ビデオ会議端末7全体の動作を制御する。ROM702は、IPL等のCPU701の駆動に用いられるプログラムを記憶する。RAM703は、CPU701のワークエリアとして使用される。フラッシュメモリ704は、通信用プログラム、画像データ、及び音データ等の各種データを記憶する。SSD705は、CPU701の制御に従ってフラッシュメモリ704に対する各種データの読み出し又は書き込みを制御する。なお、SSDに代えてHDDを用いてもよい。メディアI/F707は、フラッシュメモリ等の記録メディア706に対するデータの読み出し又は書き込み(記憶)を制御する。操作ボタン708は、ビデオ会議端末7の宛先を選択する場合等に操作されるボタンである。電源スイッチ709は、ビデオ会議端末7の電源のON/OFFを切り換えるためのスイッチである。
また、ネットワークI/F711は、インターネット等の通信ネットワークを利用してデータ通信をするためのインターフェースである。CMOSセンサ712は、CPU701の制御に従って被写体を撮像して画像データを得る内蔵型の撮像手段の一種である。なお、CMOSセンサではなく、CCD(Charge Coupled Device)センサ等の撮像手段であってもよい。撮像素子I/F713は、CMOSセンサ712の駆動を制御する回路である。マイク714は、音を電気信号に変える内蔵型の回路である。スピーカ715は、電気信号を物理振動に変えて、音楽又は音声等の音を生み出す内蔵型の回路である。音入出力I/F716は、CPU701の制御に従ってマイク714及びスピーカ715との間で音信号の入出力を処理する回路である。ディスプレイI/F717は、CPU701の制御に従って外付けのディスプレイに画像データを送信する回路である。外部機器接続I/F718は、各種の外部機器を接続するためのインターフェースである。近距離通信回路719は、NFC(Near Field Communication)又はBluetooth(登録商標)等の通信回路である。
また、バスライン710は、図2に示されているCPU701等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
ディスプレイ720は、被写体の画像又は操作用アイコン等を表示する液晶や有機EL(Electro Luminescence)等によって構成された表示手段の一種である。また、ディスプレイ720は、ケーブルによってディスプレイI/F717に接続される。このケーブルは、アナログRGB(VGA)信号用のケーブルであってもよいし、コンポーネントビデオ用のケーブルであってもよいし、HDMI(登録商標)(High−Definition Multimedia Interface)又はDVI(Digital Video Interactive)信号用のケーブルであってもよい。
なお、CMOSセンサ712は、CPU401の制御に従って被写体を撮像して画像データを得る内蔵型の撮像手段の一種である。なお、CMOSセンサではなく、CCDセンサ等の撮像手段であってもよい。外部機器接続I/F718には、USBケーブル等によって、外付けカメラ、外付けマイク、及び外付けスピーカ等の外部機器がそれぞれ接続可能である。外付けカメラが接続された場合には、CPU701の制御に従って、内蔵型のCMOSセンサ712に優先して、外付けカメラが駆動する。同じく、外付けマイクが接続された場合や、外付けスピーカが接続された場合には、CPU701の制御に従って、それぞれが内蔵型のマイク714や内蔵型のスピーカ715に優先して、外付けマイク又は外付けスピーカが駆動する。
また、記録メディア706は、ビデオ会議端末7に対して着脱自在な構成となっている。また、CPU701の制御に従ってデータの読み出し又は書き込みを行う不揮発性メモリであれば、フラッシュメモリ704に限らず、EEPROM等を用いてもよい。
<電子黒板の例>
図10は、電子黒板のハードウェア構成例を示す図である。図示するように、電子黒板2は、CPU201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、SSD204、ネットワークI/F205、及び、外部機器接続I/F206を備える。
これらのうち、CPU201は、電子黒板2全体の動作を制御する。ROM202は、CPU201やIPL(Initial Program Loader)等のCPU201の駆動に用いられるプログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。SSD204は、電子黒板用のプログラム等の各種データを記憶する。ネットワークI/F205は、通信ネットワークとの通信を制御する。外部機器接続I/F206は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリ230、外付け機器(マイク240、スピーカ250、カメラ260)である。
また、電子黒板2は、キャプチャデバイス211、GPU212、ディスプレイコントローラ213、接触センサ214、センサコントローラ215、電子ペンコントローラ216、近距離通信回路219、及び近距離通信回路219のアンテナ219a、電源スイッチ222及び選択スイッチ類223を備える。
これらのうち、キャプチャデバイス211は、外付けのPC(Personal Computer)270のディスプレイに対して映像情報を静止画又は動画として表示させる。GPU(Graphics Processing Unit)212は、グラフィクスを専門に扱う半導体チップである。ディスプレイコントローラ213は、GPU212からの出力画像をディスプレイ280等へ出力するために画面表示の制御及び管理を行う。接触センサ214は、ディスプレイ280上に電子ペン290やユーザの手H等が接触したことを検知する。センサコントローラ215は、接触センサ214の処理を制御する。接触センサ214は、赤外線遮断方式による座標の入力及び座標の検出を行う。この座標の入力及び座標の検出する方法は、ディスプレイ280の上側両端部に設置された2つ受発光装置が、ディスプレイ280に平行して複数の赤外線を放射し、ディスプレイ280の周囲に設けられた反射部材によって反射されて、受光素子が放射した光の光路と同一の光路上を戻って来る光を受光する方法である。接触センサ214は、物体によって遮断された2つの受発光装置が放射した赤外線のIDをセンサコントローラ215に出力し、センサコントローラ215が、物体の接触位置である座標位置を特定する。電子ペンコントローラ216は、電子ペン290と通信することで、ディスプレイ280へのペン先のタッチやペン尻のタッチの有無を判断する。近距離通信回路219は、NFC又はBluetooth(登録商標)等の通信回路である。電源スイッチ222は、電子黒板2の電源のON/OFFを切り換えるためのスイッチである。選択スイッチ類223は、例えば、ディスプレイ280の表示の明暗や色合い等を調整するためのスイッチ群である。
更に、電子黒板2は、バスライン210を備えている。バスライン210は、図2に示されているCPU201等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
なお、接触センサ214は、赤外線遮断方式に限らず、静電容量の変化を検知することにより接触位置を特定する静電容量方式のタッチパネル、対向する2つの抵抗膜の電圧変化によって接触位置を特定する抵抗膜方式のタッチパネル、接触物体が表示部に接触することによって生じる電磁誘導を検知して接触位置を特定する電磁誘導方式のタッチパネル等の種々の検出手段を用いてもよい。また、電子ペンコントローラ216が、電子ペン290のペン先及びペン尻だけでなく、電子ペン290のユーザが握る部分、又は、その他の電子ペンの部分のタッチの有無を判断するようにしてもよい。
<その他の実施形態>
なお、本発明に係る各処理の全部又は一部は、低水準言語又は高水準言語で記述され、コンピュータに音声処理方法を実行させるためのプログラムによって実現されてもよい。すなわち、プログラムは、スピーカ装置又はスピーカシステム等のコンピュータに各処理を実行させるためのコンピュータプログラムである。
したがって、プログラムに基づいて音声処理方法が実行されると、コンピュータが有する演算装置及び制御装置は、各処理を実行するため、プログラムに基づいて演算及び制御を行う。また、コンピュータが有する記憶装置は、各処理を実行するため、プログラムに基づいて、処理に用いられるデータを記憶する。
また、プログラムは、コンピュータが読み取り可能な記録媒体に記録されて頒布することができる。なお、記録媒体は、磁気テープ、フラッシュメモリ、光ディスク、光磁気ディスク又は磁気ディスク等のメディアである。さらに、プログラムは、電気通信回線を通じて頒布することができる。
なお、本発明に係る実施形態は、スピーカシステムによって実現されてもよい。また、スピーカシステムは、複数の情報処理装置等によって、各処理を冗長、分散、並列、仮想化又はこれらを組み合わせて実行してもよい。
以上、実施形態における一例について説明したが、本発明は、上記実施形態に限定されない。すなわち、本発明の範囲内で種々の変形及び改良が可能である。
1 スピーカシステム
2 電子黒板
7 ビデオ会議端末
10 スピーカ装置
10C 中央装置
10H2 音声出力装置
10H3 カメラ
10H5 記憶装置
10L 左側装置
10R 右側装置
11 マイク
12 ネットワークカメラ
205 ネットワークI/F
210 バスライン
211 キャプチャデバイス
213 ディスプレイコントローラ
214 接触センサ
215 センサコントローラ
216 電子ペンコントローラ
219 近距離通信回路
219a アンテナ
222 電源スイッチ
223 選択スイッチ類
230 USBメモリ
240 マイク
250 スピーカ
260 カメラ
280 ディスプレイ
290 電子ペン
704 フラッシュメモリ
706 記録メディア
708 操作ボタン
709 電源スイッチ
710 バスライン
712 CMOSセンサ
714 マイク
715 スピーカ
719 近距離通信回路
719a アンテナ
720 ディスプレイ
CL 中央線
CM 共通領域
D1 入力音声データ
D2 画像データ
FN1 他機検出部
FN2 他機位置検出部
FN3 対象検出部
FN4 対象位置検出部
FN5 調整部
FN6 音声出力部
FN7 音声出力指示部
H 手
IMG1 第1画像データ
IMG2 第2画像データ
LR 傍聴者
M1、M2、M3、M4、M5 人
NW ネットワーク
RG1 第1範囲
RG2 第2範囲
SD1 第1調整音声
SD2 第2調整音声
SDI 入力音声
SP 発言者
特開平10−84539号公報

Claims (10)

  1. 対象に対して複数台で使用されるスピーカ装置であって、
    前記複数台のスピーカ装置のうち、自機と異なる他機を検出する他機検出部と、
    前記他機の位置である他機位置を検出する他機位置検出部と、
    前記対象を検出する対象検出部と、
    前記対象の位置である対象位置を検出する対象位置検出部と、
    前記他機位置及び前記対象位置に基づいて、入力音声に基づいて生成される第1音声及び第2音声を調整して第1調整音声及び第2調整音声を生成する調整部と、
    前記第1調整音声を出力する音声出力部と、
    前記第2調整音声を前記他機に出力させる音声出力指示部と
    を備えるスピーカ装置。
  2. 前記調整部は、
    前記他機位置に基づいて、音圧に差をつける、音声が出力されるタイミングを決定する又はこれらの組み合わせを行って、前記第1調整音声及び前記第2調整音声を生成する
    請求項1に記載のスピーカ装置。
  3. 偶数台で使用する場合には、
    前記他機位置及び前記対象位置に基づいて、前記対象に対して、左側となるか、又は、右側となるかの位置関係が決定され、
    前記位置関係に基づいて、出力する音声が分けられる
    請求項1又は2に記載のスピーカ装置。
  4. 入力音声を発生させる音源が位置する音源位置を更に検出し、
    前記音源位置が左側に近いか、又は、右側に近いかが判定され、
    前記音源位置が近いと判定された方であると、前記調整部は、前記第2音声より早く前記第1音声を出力するように調整して前記第1調整音声及び前記第2調整音声を生成する
    請求項3に記載のスピーカ装置。
  5. 前記複数台のスピーカ装置は、撮像装置をそれぞれ有し、
    前記他機位置、前記対象位置又は前記位置関係は、前記撮像装置が生成する画像データに基づいて定まる
    請求項3又は4に記載のスピーカ装置。
  6. 奇数台で使用する場合には、
    前記他機位置及び前記対象位置に基づいて、前記対象に対して、左側となるか、中央となるか、又は、右側となるかの位置関係が決定され、
    前記位置関係に基づいて、出力する音声が分けられる
    請求項1又は2に記載のスピーカ装置。
  7. 入力音声を発生させる音源が位置する音源位置を更に検出し、
    前記音源位置が左側に近いか、又は、右側に近いかが判定され、
    前記調整部は、前記音源位置に基づいて前記第1調整音声及び前記第2調整音声を生成して、右側又は左側に決定されたスピーカ装置が前記第1調整音声及び前記第2調整音声を出力するように調整し、
    中央と決定されたスピーカ装置が消音するように調整する
    請求項6に記載のスピーカ装置。
  8. 前記複数台のスピーカ装置は、撮像装置をそれぞれ有し、
    前記他機位置検出部は、前記撮像装置が生成する画像データに基づいて、前記他機位置を検出する
    請求項1乃至7のいずれか1項に記載のスピーカ装置。
  9. 請求項1乃至8のいずれか1項に記載のスピーカ装置を有するビデオ会議装置。
  10. 請求項9に記載のビデオ会議装置を有する電子黒板。
JP2019027888A 2019-02-19 2019-02-19 スピーカ装置、ビデオ会議装置及び電子黒板 Active JP7251200B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019027888A JP7251200B2 (ja) 2019-02-19 2019-02-19 スピーカ装置、ビデオ会議装置及び電子黒板

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019027888A JP7251200B2 (ja) 2019-02-19 2019-02-19 スピーカ装置、ビデオ会議装置及び電子黒板

Publications (2)

Publication Number Publication Date
JP2020136904A true JP2020136904A (ja) 2020-08-31
JP7251200B2 JP7251200B2 (ja) 2023-04-04

Family

ID=72263845

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019027888A Active JP7251200B2 (ja) 2019-02-19 2019-02-19 スピーカ装置、ビデオ会議装置及び電子黒板

Country Status (1)

Country Link
JP (1) JP7251200B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01303852A (ja) * 1988-05-31 1989-12-07 Toshiba Corp ステレオ音声伝送システム
JP2009218888A (ja) * 2008-03-11 2009-09-24 Yamaha Corp 放音システム
JP2010245771A (ja) * 2009-04-03 2010-10-28 Sony Corp 音声再生装置および映像音声再生装置
JP2015507864A (ja) * 2011-12-19 2015-03-12 クゥアルコム・インコーポレイテッドQualcomm Incorporated 分散マルチセンサ環境でオーディオ性能をカスタマイズするためのユーザ/センサ配置認識

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01303852A (ja) * 1988-05-31 1989-12-07 Toshiba Corp ステレオ音声伝送システム
JP2009218888A (ja) * 2008-03-11 2009-09-24 Yamaha Corp 放音システム
JP2010245771A (ja) * 2009-04-03 2010-10-28 Sony Corp 音声再生装置および映像音声再生装置
JP2015507864A (ja) * 2011-12-19 2015-03-12 クゥアルコム・インコーポレイテッドQualcomm Incorporated 分散マルチセンサ環境でオーディオ性能をカスタマイズするためのユーザ/センサ配置認識

Also Published As

Publication number Publication date
JP7251200B2 (ja) 2023-04-04

Similar Documents

Publication Publication Date Title
US11061643B2 (en) Devices with enhanced audio
US10206030B2 (en) Microphone array system and microphone array control method
EP4054177B1 (en) Audio processing method and device
US8254605B2 (en) Binaural recording for smart pen computing systems
US20100302401A1 (en) Image Audio Processing Apparatus And Image Sensing Apparatus
US20170084287A1 (en) Electronic device and method of audio processing thereof
KR20130050987A (ko) 엔터테인먼트 디바이스들 및 시스템들의 음향 관리를 위한 기술들
JP2005250397A (ja) ロボット
WO2018000764A1 (zh) 一种声道自动匹配的方法、装置以及耳机
US10761333B2 (en) Head mounted display device, sound transmission system, and control method for head mounted display device
CN113014983A (zh) 视频播放方法、装置、存储介质及电子设备
KR102643055B1 (ko) 헤드셋 전자 장치 및 그와 연결되는 전자 장치
JP2004120459A (ja) 音声出力装置
US10225670B2 (en) Method for operating a hearing system as well as a hearing system
WO2023231787A1 (zh) 音频处理方法和装置
KR20110065052A (ko) 이동통신 단말기
JP7251200B2 (ja) スピーカ装置、ビデオ会議装置及び電子黒板
US11054621B2 (en) Camera, and image display apparatus including the same
JP2010193017A (ja) 映像通信装置
US10993064B2 (en) Apparatus and associated methods for presentation of audio content
JP7111202B2 (ja) 収音制御システム及び収音制御システムの制御方法
US20240080406A1 (en) Video Conference Calls
US11768792B2 (en) Signal receiver and electronic apparatus including the same
KR20220022315A (ko) 카메라 및 마이크를 포함하는 전자 장치
KR20230099580A (ko) 영상 통화 중 영역 별로 노이즈를 처리하는 전자 장치 및 이의 동작 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230306

R151 Written notification of patent or utility model registration

Ref document number: 7251200

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151