JP2007129623A - 情報伝達システム及び音声可視化装置 - Google Patents

情報伝達システム及び音声可視化装置 Download PDF

Info

Publication number
JP2007129623A
JP2007129623A JP2005322094A JP2005322094A JP2007129623A JP 2007129623 A JP2007129623 A JP 2007129623A JP 2005322094 A JP2005322094 A JP 2005322094A JP 2005322094 A JP2005322094 A JP 2005322094A JP 2007129623 A JP2007129623 A JP 2007129623A
Authority
JP
Japan
Prior art keywords
sound
visualization
volume
visual pattern
receiver
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005322094A
Other languages
English (en)
Other versions
JP4708960B2 (ja
Inventor
Atsunobu Kimura
篤信 木村
Masayuki Ihara
雅行 井原
Minoru Kobayashi
稔 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005322094A priority Critical patent/JP4708960B2/ja
Publication of JP2007129623A publication Critical patent/JP2007129623A/ja
Application granted granted Critical
Publication of JP4708960B2 publication Critical patent/JP4708960B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】送話者、受話者の双方で音声の伝達具合を容易に把握することを可能にする。
【解決手段】受話側システム100の可視化装置120は、スピーカ113から出力される送話者の音声をマイク部121により集音し、集音した音声をもとに音量及び方向を検出する。処理部122では、上記検出された音声の音量及び方向に基づいて視覚パターンに可視化エフェクトを施し、プロジェクタ123は、可視化エフェクトが施された視覚パターンをもとに可視化エフェクト像を投影する。また、投影された可視化エフェクト像は、受話側システム100のカメラ112により撮影され、この撮影画像は、送話者側システム200に送られ、送話者側システム200のディスプレイ224に表示される。これにより、受話者は、送話者の発話の意図を把握することが可能となり、送話者は、受話者への音声の伝達具合を確認しながら発話を行うことができる。
【選択図】 図1

Description

この発明は、送話者と受話者との間で情報を伝達する情報伝達システム及び音声可視化装置に関する。
音声を用いるコミュニケーションにおいて、音量は重要であり、送話者が発する音声の伝わる各地点での音量を可視化することで、送話者が自分の声の伝わり具合を容易に把握することができる。例えば、映像音声通信装置において、送話側装置に入力する音量を可視化する手法として、マイクロホンに入力される音量に対して反応するピークメータを用いる手法がある。しかし、この手法では、通信相手先の受話側装置のスピーカから出力されている音量を把握することができないため、送話者は、自分の発した音声が受話者に到達しているか否かがわからない。
そこで、送話側装置に入力された音声が受話側空間に伝播する音量を可視化するために、受話側空間が撮影された画像を取得し、受話側空間で伝播する音量を表す可視化エフェクトを上記画像に重畳させる手法が提案されている。この手法では、受話側装置のマイクロホンでスピーカから出力される送話者の発話を収録し、その収録音声の音量を元に受話側空間における送話者の音の伝播を、受話側空間の環境と受話側空間にある通信システムのシステム設定に依存するキャリブレーションデータにより推測し、送話者に可視化エフェクトを用いてフィードバックしている。これにより、送話者は、例えば、受話者に明確に伝えたい場合や送話者側でひそひそ話をする場合など、意図的に受話者に伝わる音量を制御することが可能となる(例えば、非特許文献1を参照。)。
「Atsunobu K.,Yoshihiro S.,Minoru K.,"Ambient Pre-Communication −A study of voice volume control method on tele-communication" ,Proceedings of the Workshop Ambient Intelligence and (Everyday) Life,Spain,July,21-22,2005」
ところが、上記手法では、受話者側には可視化エフェクトが提示されないため、受話者は送話者がどの程度の音量で話そうとしているのか、という送話者の意図を把握することはできない。また、送話者は、受話側空間でどのくらいの騒音があるのか、周囲の人たちはどのくらいの音量で話しているのかを知ることはできないので、送話者は、受話側空間の周囲の状況に配慮して発話することができない。
この発明は、上記事情に着目してなされたもので、その目的とするところは、送話者から受話者に音声による情報伝達を行う場合に、送話者、受話者の双方で音声の伝達具合を容易に把握することができる情報伝達システム及び音声可視化装置を提供することにある。
上記目的を達成するためにこの発明に係る情報伝達システムは、撮像装置とスピーカとが配置される受話側空間に設けられる受話側装置と、モニタ装置とマイクロホンとが配置される送話側空間に設けられる送話側装置とを通信ネットワークを介して接続し、前記撮像装置により撮像された受話側空間の映像情報を前記受話側装置から送話側装置へ伝送してモニタ装置に表示すると共に、前記マイクロホンにより集音された送話側空間の音声情報を前記送話側装置から受話側装置へ伝送してスピーカに出力することにより、前記受話側装置と送話側装置との間で情報を伝達する情報伝達システムであって、前記受話側空間に配置される音声可視化装置を備える。そして、前記音声可視化装置は、前記スピーカから出力される音声を集音する集音手段と、前記集音された音声の音量を検出する検出手段と、前記音量に基づいて任意の視覚パターンにエフェクトをかける可視化エフェクト手段と、前記可視化エフェクト手段により可視化された視覚パターンを前記受話側空間に表示する表示手段とを備える。また、前記送話側装置は、前記撮像装置により撮像された視覚パターンを前記モニタ装置に表示することを特徴とする。
上記構成による情報伝達システムでは、受話側空間において、スピーカから出力される音声を集音し、集音された音声の音量を検出して、この検出された音量に応じた視覚パターンが受話側空間に表示される。また、撮像装置により撮像された視覚パターンが送話側空間に配置されるモニタ装置に表示される。これにより、例えば、送話側でひそひそ話が行われている状態のように、受話側で送話者がどの程度の音量で話そうとしているかという送話者の意図を把握することが可能となる。また、送話者は、会話開始前に呼びかけを行ったときにその声の届く様子を確認することができるので、声が伝わっている事を実感しながら受話者に声を伝えることができる。受話者周辺の騒音や会話音量なども視覚的に提示されるため、送話者は、受話者側の状況に応じて、受話者に届く音量を調節しながら呼びかけを行うことができる。周囲に声を漏らしたくない場合、周囲に漏れずに必要な相手には聴こえるように音量を調節することができる。
また、この発明に係る情報伝達システムは、前記表示手段は、前記視覚パターンを赤外線で前記受話側空間に投影する赤外線投影手段をさらに備え、前記受話側空間に配置される撮像装置は、前記受話側空間に赤外線で投影された視覚パターンの赤外線画像を撮像することを特徴とする。
このようにすると、受話者側には視覚パターンを提示することなく、送話者側のみに視覚パターンを提示することが可能となる。これにより、送話者は、可視化エフェクトに対する受話者の反応などを気にすることなく、発話することが可能となる。
また、この発明に係る音声可視化装置は、音声を集音する集音手段と、前記集音された音声の音量を検出する検出手段と、前記音量に基づいて任意の視覚パターンにエフェクトをかける可視化エフェクト手段と、前記可視化エフェクト手段により可視化された視覚パターンを表示する表示手段とを備えることを特徴とする。
上記構成による音声可視化装置によれば、集音された音声の音量が検出され、この音量に応じたエフェクトが施された視覚パターンが表示される。これにより、発話音声の伝達具合や受話者周辺の騒音状況を確認しながら会話等を行うことが可能となる。
また、この発明の音声可視化装置は、次のような各種構成を備えることも特徴とする。
第1の構成は、前記集音手段が複数方向に指向性を有し、各方向の音声をそれぞれ集音する場合に、前記検出手段は、前記集音された各方向の音声により音量と方向とを検出し、前記可視化エフェクト手段は、前記音量及び方向に基づいて前記視覚パターンを変化させる。
上記構成では、例えば、上記集音手段に複数のマイクロホンを用いて複数方向からの音声を集音し、集音された音声の音量と方向とを表す視覚パターンを表示するようにする。これにより、音声がどの方向からどの程度の音量で伝播してきたかを詳細に把握することができる。
第2の構成は、前記可視化エフェクト手段は、前記検出された音声の音量及び方向をもとに、最大音量となる方向を求め、その方向を示すように前記視覚パターンを変化させるようにする。
このように構成すると、音源に近い位置に視覚パターンが表示されるため、より確実に音声の伝播を把握することができる。
第3の構成は、前記検出手段は、前記音声が出力されない状態で、音声を一定時間集音してノイズレベルを算出し、前記集音された音声の音量と前記ノイズレベルとを比較し、前記表示手段は、前記音量が前記ノイズレベルより大きいと判定される場合に、前記表示手段は、前記視覚パターンを表示する。
上記構成では、受話側空間のノイズレベルを求め、求められたノイズレベルより大きい発話が検出された場合に視覚パターンが表示される。これにより、発話者は、受話側の騒音や周囲の会話などの状況に配慮して発話することが可能となる。
第4の構成は、前記表示手段は、前記視覚パターンを投影する投影手段をさらに備えることを特徴とする。
このようにすると、プロジェクタ等の投影装置により受話側空間の床や壁や天井などに視覚パターンを表示することができる。
第5の構成は、前記表示手段は、前記投影手段により前記視覚パターンが投影されるスクリーンをさらに備えるようにする。
このようにスクリーンを設けて提示する場所を制御することにより、例えば、視覚パターンを送話者のみに提示することが可能となる。
第6の構成は、前記可視化エフェクト手段は、前記視覚パターンとして照明装置の照度を変化させることを特徴とする。
例えば、検出された音量が大きいときは、照明を明るくし、音量の小さいときは暗くするようにする。これにより、簡易な構成で可視化エフェクトを提示することができる。
要するにこの発明によれば、送話者から受話者に音声による情報伝達を行う場合に、送話者、受話者の双方で音声の伝達具合を容易に把握することができる情報伝達システム及び音声可視化装置を提供することができる。
以下、図面を参照してこの発明の実施の形態について詳細に説明する。
図1は、この発明に係わる情報伝達システムの一実施形態を示す構成図である。
このシステムは、受話者側に配置される受話側システム100と送話者側に配置される送話側システム200との間を通信ネットワークNWを介して接続したものである。通信ネットワークNWは、例えば、LAN(Local Area Network)やインターネットを含むWAN(Wide Area Network)により構成される。また、本実施形態では、受話側システム100と送話側システム200は、同一構成であるため、ここでは、受話側システム100について説明し、送話側システム200については構成の説明を省略する。
図2は、受話側システム100の構成を示すブロック図である。受話側システム100は、受話側装置110と可視化装置120とを備える。受話側装置110は、マイクロホン111と、カメラ112と、スピーカ113と、ディスプレイ114と、通信処理部115とを備える。マイクロホン111は、受話者により発せられる音声を集音する。カメラ112は、受話者及び受話側システム100に配置される可視化装置120を含む受話側空間を撮像する。上記集音された音声及び撮像された画像は、通信処理部115により通信ネットワークNWを介して送話側システム200に向けそれぞれ送信される。また、通信処理部115は、送話側システム200から通信ネットワークNWを介して送信される送話側空間で集音された音声及び送話側空間の撮像画像を受信し、スピーカ113及びディスプレイ114にそれぞれ出力する。
可視化装置120は、マイク部121と、処理部122と、プロジェクタ部123とを備える。マイク部121には、少なくとも3本以上のマイクロホンを設置すればよく、本実施形態では、例えば、指向性を有する4本のマイクロホン121A,121B,121C,121Dが、互いに異なる方向に向けて配置される。これらのマイクロホンは、それぞれスピーカ113から出力される発話者の音声や受話者周辺の騒音や会話音声を集音する。処理部122は、上記マイク部121により収集された音声の音量及び方向を検出し、この音声及び方向に基づいて、任意の視覚パターン(例えば、波紋など)に視覚的効果(可視化エフェクト)を施す。プロジェクタ部123は、処理部122の制御の下、上記可視化エフェクトが施された視覚パターンを受話側空間に投影する。
ここで、図3を参照して可視化装置120の構成例を具体的に説明する。例えば、ランプスタンド型で構成される可視化装置120において、マイク部121は、マイクの本数分で等分された方向に向けてマイクロホンを配置し、プロジェクタ部123は、床を投影面とするように下向きに配置される。このように構成すると、該可視化装置120に近い周辺のユーザにしか視覚パターンを見えないようにすることができる。また、処理部122の設置位置は、可視化装置120の内側でも外側でも構わなく、上記マイク部121とプロジェクタ部123とに接続される。
次に、このように構成される可視化装置120の動作について説明する。図4は、可視化装置120の動作の手順とその内容を示すフローチャートである。
先ず、ステップS1において、マイク部121により集音された音声の音量が、処理部122に入力される。例えば、4本の指向性マイクロホン121A,121B,121C,121Dが設置されている場合は、各マイクロホンで集音された音声の音量を検出し、処理部122にそれぞれ入力する。
処理部122は、ステップS2において、入力された音声の音量と予め初期値が設定されるノイズ閾値とを比較する。入力音量がノイズ閾値より大きいと判定された場合は、マイク部121に発話などが入力された可能性が高いと判別し、ステップS5に移行する。一方、入力音量がノイズ閾値より小さいと判定された場合は、マイク部121にはノイズしか入力されていないと判別し、ステップS3に移行する。例えばノイズ閾値が50dBで入力音量が40dBである場合、40dBの入力音量はノイズとして判別される。ステップS3では、ノイズとして判別された入力音量をもとにノイズ閾値の更新を行う。
ステップS3では、例えば、過去10秒間に、ノイズと判別されず発話の可能性が高いと判別される入力音量があった場合、発話の可能性が高い入力音量が入力される前のノイズ閾値をそのまま利用し続け、ノイズ閾値は更新されない。一方で、例えば、過去10秒間に、ノイズと判別される入力音量が続いた場合、その10秒間における入力音量の平均値をノイズ閾値として更新する。ノイズ閾値の初期値は、利用される空間で生じるノイズレベルよりも大きな設定値、例えば90dBに設定される。
次に、ステップS4において、処理部122は、上記ステップS1でマイク部121から入力された音量と、予め、処理部122が備える記憶部に記憶された各マイクロホン毎の指向性の方向のデータとを対応付ける。
ステップS5では、発話の可能性が高い入力があった場合に、その入力音声の到来方向の推定を行う。マイク部121の各マイクの指向性の方向と入力音量のデータを元に、推定を行う。到来方向の推定方法としては、一般的な音源推定方法である遅延和法(複数個のマイクロホンを用い、各々のマイクに到達した音の相互相関によって時間差を求める方法)や、MUSIC(multiple signal classification)、ESPRIT(Estimation of Signal Parameters via Rotational Invariance Techniques)、“菊間信良:「アダプティブアンテナ技術」、オーム社”、“菊間信艮、「アレーアンテナによる適応信号処理」、科学技術出版”を用いる方法と、音声の入力音量とマイクの指向性の方向により簡易に求める方法とがある。簡易に求める方法としては、例えば、最も大きな音量を入力された上位2つのマイクロホン、例えば、マイクロホン121A、マイクロホン121Bの音量の関係により、2つのマイクロホンの間のどの位置から音声が到来したかを決定し、推定する方法が考えられる。
そして、ステップS6において、処理部122は、入力音声の音声及び到来方向に基づく可視化エフェクト画像を生成する。可視化エフェクト画像とは、例えば、波紋等の任意の視覚パターンに音声に応じた視覚的効果を施した投影画像であり、音が一定のdB以上の大きさで伝達されている範囲を示すもので、詳細は後述する。プロジェクタ部123は、ステップS7において、上記生成された可視化エフェクト画像をもとに床面に可視化エフェクト像を投影する。
ここで、図5を参照して、可視化エフェクトの提示方法について説明する。図5において、測定された音量と推定された到来方向を元に、可視化装置120の位置での音声情報として、可視化エフェクト像501が投影される。音量の大小は、可視化エフェクト像501における、波紋を描く線の太さ、色の濃淡や明るさ、提示される範囲の大小などによって表現される。到来方向は、音波の進行方向を知覚できる可視化エフェクト像501の形状によって表現される。図4において、それぞれの可視化エフェクト像501での音量の大小による違い、可視化エフェクト像501の音波の進行方向を示す。また、他にも、入力音声の周波数成分ごとの大きさを例えば、色を変えて提示する可視化エフェクト像501や、ある特定の周波数帯の音の大きさのみを提示する可視化エフェクト像501などが考えられ、音の持つ様々な特性を視覚的な特徴に変換して表示することが可能である。
図5では、発話等の入力のない場合の定常的な入力音量からノイズレベルを求め、そのノイズレベルに基づいて算出される可視化装置120の位置での人の一般的な最小可聴閾を閾値とし、最小可聴閾以上の音声入力があるときに、可視化装置120の位置から、音波の進行方向に向けて閾値以上の音が届いていることを、波紋を模した波の線によって示す可視化エフェクト像501を投影するものである。
また、可視化エフェクトの表現には、可視化エフェクト像501の他にも次のようなパターンが考えられる。
図6は、発話等の入力のない場合の定常的な入力音量からノイズレベルを求め、そのノイズレベルに基づいて算出される可視化装置120の位置より音声の音源位置に近い地点D(最大音量となる方向)における、人の一般的な最小可聴閾を閾値とし、可視化装置120のマイク部121で集音された音量をもとに、地点Dにおける音量を音のパワーが距離の2乗に反比例して減衰するという原理を用いて推定する。そして、地点Dにおいて、最小可聴閥以上の音量が推定されたときに、地点Dから可視化装置120の方向に向けて閾値以上の音が届いていることを波紋を模した波の線によって示す可視化エフェクト像601を投影するものである。
図7は、発話等の入力のない場合の定常的な入力音量からノイズレベルを求め、そのノイズレベルに基づいて算出される可視化装置120の位置での人の一般的な最小可聴閾を閾値とし、最小可聴閾以上の音声入力があるときに、可視化装置120の位置から音波の進行方向に向けて閾値以上の音が届いていることを、それぞれの地点に届いている音量に応じた明るさによって示す可視化エフェクト像701を投影するものである。
図8は、発話等の入力のない場合の定常的な入力音量からノイズレベルを求め・そのノイズレベルに基づいて算出される可視化装置120の位置での人の一般的な最小可聴閾を閾値とし、最小可聴閾以上の音声入力があるときに、可視化装置120の位置に、例えば電球の明るさと暗さによって音量の大小を示すエフェクトを投影するものである。
図9は、発話等の入力のない場合の定常的な入力音量から可視化装置120が設置される空間のノイズレベルを求め、そのノイズレベルに基づいて算出される可視化装置120が設置される空間の各地点での人の一般的な最小可聴閾を閾値とし、可視化装置120のマイク部121で集音された音量より空間の各地点における音量を音のパワーが距離の2乗に反比例して減衰するという原理を用いる方法、あるいは可視化装置120を利用する前に可視化装置120にある音量が伝わっているときにその空間の各地点に伝わる音量を計測してその空間の音伝播に関するキャリブレーションデータを用いる方法によって推定し、空間の各地点に最小可聴閾以上の音量が推定されたときに、該当する各地点にまで及ぶように可視化エフェクト像901を投影するものである。
音のパワーが距離の2乗に反比例して減衰するという原理を用いる例の特徴は、正確でない音伝播の可視化を行うことになるが、非常に簡易である。可視化装置120を利用する前に可視化装置120にある音量が伝わっているときに、その空間の各地点に伝わる音量を計測してその空間の音伝播に関するキャリブレーションデータを用いる例の特徴は、正確な音伝播の可視化を行うことができるが、準備までに時間がかかる。
次に、可視化装置120の他の構成例を示す。図10は、ランプスタンド型の可視化装置120において、ランプシェード124の上面を投影面として、プロジェクタ123により可視化エフェクト像を投影するものである。このようにすると、受話側のカメラ112を上方からランプシェード124の上面を撮影可能なように設置し、可視化エフェクト像をランプシェード124の上面のみに投影することで、送話側空間にいる送話者のみに可視化エフェクト像が見えるように制御することができる。
また、可視化エフェクト像を赤外線で投影することも可能である。例えば、プロジェクタ123は、投射口に赤外線透過フィルタ(図示せず)が配設され、可視光成分と赤外線成分とを含む光を発光する光源を内蔵し、この光源から可視化エフェクト像を発光させる。赤外線透過フィルタは、上記プロジェクタ123から発光された光の波長成分のうち、可視光成分を遮断して赤外線成分のみを透過するため、受話側空間に赤外線による可視化エフェクト像が投影される。一方、受話側通信装置110のカメラ112は、赤外線画像を撮像可能な赤外線カメラで構成され、上記投影された赤外線による可視化エフェクト像をカメラ112で撮像することにより、送話側のディスプレイ224には可視化エフェクト像が撮像された赤外線画像が表示される。このようにしても、受話者側には可視化エフェクトを提示することなく、送話者側のみに可視化エフェクトを提示することが可能となる。
上述したように、受話者側に、可視化エフェクト像を見せないように制御することよって、送話者は、受話者と可視化エフェクトの相互作用(例えば、可視化エフェクトに対する受話者の反応など)を気にせずに呼びかけることが可能になる。
また、図11のように、ハーフミラ125やミラー126を用いて床面とランプシェード124の上面の両方に可視化エフェクト像を投影することで、該装置に近い周辺の受話者と通信システムを介して遠隔から受話側空間を見ている送話者との両方から見えるように制御することも可能である。送話者と可視化装置120の付近にいる受話者だけに可視化エフェクトを提示することによって、受話者の遠巻きにいる人たちに、会話中の音量調節のやり取り等を知られることがない。
その他に、受話側空間が高い天井を持つ場合に、部屋の天井面に可視化エフェクト像を投影することで、該可視化装置120の設置された空間にいる受話者全員に提示することも可能である。
図12に可視化装置120の設置の一例を示す。可視化装置120は、基本的に受話者が存在する範囲周辺に自由に配置することで効果を得ることできる。しかし、複数の可視化装置120を分散して配置することによる効果を効率的に得るために、推奨される設置の方針があるので以下に示す。推奨される可視化装置120の配置は、図12に示すように、各装置が正三角形の頂点に位置するように配置することである。これによって、可視化装置120の位置を頂点とする正三角形で囲まれた領域が推定可能領域120となる。推定可能領域1201は、その領域の内部に人がいる場合、最も正確にその人に伝わる音量を補完して推定することができる領域である。本実施形態のように、通信システムを用いる場合は、スピーカ113の前方に可視化装置120を1台設置し、これを含めて最低3台以上の可視化装置120を設置する事を推奨する。
また、図13に示すように、さらに、可視化装置120の設置台数を増やすことによって、推定可能領域1302,推定可能領域1303のように広範囲に可視化エフェクト像を投影することができる。また、各デバイスを近づけて設置することによって高密度な可視化エフェクト像を投影することも可能である。
以上述べたように、上記実施形態では、受話側システム100の可視化装置120は、スピーカ113から出力される送話者の音声をマイク部121により集音し、集音した音声をもとに音量及び方向を検出する。処理部122では、上記検出された音声の音量及び方向に基づいて視覚パターンに可視化エフェクトを施し、プロジェクタ123は、可視化エフェクトが施された視覚パターンをもとに可視化エフェクト像を投影する。また、投影された可視化エフェクト像は、受話側システム100のカメラ112により撮影され、この撮影画像は、送話者側システム200に送られ、送話者側システム200のディスプレイ224に表示される。
したがって上記実施形態によれば、受話者は、送話者がどの程度の音量で話しているのかという、送話者の発話の意図を把握することが可能となる。また、送話者は、受話者への音声の伝達具合を確認しながら、発話を行うことができる。また、受話者周辺の騒音や会話音量なども視覚的に提示されるため、送話者は、受話者側の状況に応じて、受話者に届く音量を調節しながら呼びかけを行うことができる。これにより、送話者から受話者に音声による情報伝達を行う場合に、送話者、受話者の双方で音声の伝達具合を容易に把握することができるため、円滑なコミュニケーションを図ることができる。
なお、この発明は上記実施形態に限定されるものではない。例えば、受話側システム100及び送話側システム200のシステム構成、可視化装置120の構成、及びその動作手順とその内容についても、この発明の要旨を逸脱しない範囲で種々変形して実施できる。
要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
この発明の一実施形態に係る情報通信システムを示す全体構成図。 図1に示す通信装置及び可視化装置の構成を示すブロック図。 図2に示す可視化装置の形状を示す図。 図2に示す可視化装置の動作手順とその内容を示すフローチャート。 図3に示す可視化装置が表示する可視化エフェクトの提示例を示す図。 図3に示す可視化装置が表示する可視化エフェクトの他の提示例を示す図。 図3に示す可視化装置が表示する可視化エフェクトの他の提示例を示す図。 図3に示す可視化装置が表示する可視化エフェクトの他の提示例を示す図。 図3に示す可視化装置が表示する可視化エフェクトの他の提示例を示す図。 図3に示す可視化装置の他の形状を示す図。 図3に示す可視化装置の他の形状を示す図。 上記実施形態の可視化装置の設置例を示す図。 上記実施形態の可視化装置の設置例を示す図。
符号の説明
100…受話側システム、200…送話側システム、NW…通信ネットワーク、110,210…通信装置、111,211…マイクロホン、112,212…カメラ、113,213…スピーカ、114,214…ディスプレイ、115,215…通信処理部、120,220…可視化装置、121,221…マイク部、122,222…処理部、123,223…プロジェクタ部。

Claims (9)

  1. 撮像装置とスピーカとが配置される受話側空間に設けられる受話側装置と、モニタ装置とマイクロホンとが配置される送話側空間に設けられる送話側装置とを通信ネットワークを介して接続し、前記撮像装置により撮像された受話側空間の映像情報を前記受話側装置から送話側装置へ伝送してモニタ装置に表示すると共に、前記マイクロホンにより集音された送話側空間の音声情報を前記送話側装置から受話側装置へ伝送してスピーカに出力することにより、前記受話側装置と送話側装置との間で情報を伝達する情報伝達システムであって、
    前記受話側空間に配置される音声可視化装置を備え、
    前記音声可視化装置は、
    前記スピーカから出力される音声を集音する集音手段と、
    前記集音された音声の音量を検出する検出手段と、
    前記音量に基づいて任意の視覚パターンにエフェクトをかける可視化エフェクト手段と、
    前記可視化エフェクト手段により可視化された視覚パターンを前記受話側空間に表示する表示手段と
    を備え、
    前記送話側装置は、前記撮像装置により撮像された視覚パターンを前記モニタ装置に表示することを特徴とする情報伝達システム。
  2. 前記表示手段は、前記視覚パターンを赤外線で前記受話側空間に投影する赤外線投影手段をさらに備え、
    前記受話側空間に配置される撮像装置は、前記受話側空間に赤外線で投影された視覚パターンの赤外線画像を撮像することを特徴とする請求項1記載の情報伝達システム。
  3. 音声を集音する集音手段と、
    前記集音された音声の音量を検出する検出手段と、
    前記音量に基づいて任意の視覚パターンにエフェクトをかける可視化エフェクト手段と、
    前記可視化エフェクト手段により可視化された視覚パターンを表示する表示手段と
    を備えることを特徴とする音声可視化装置。
  4. 前記集音手段が複数方向に指向性を有し、各方向の音声をそれぞれ集音する場合に、前記検出手段は、前記集音された各方向の音声により音量と方向とを検出し、前記可視化エフェクト手段は、前記音量及び方向に基づいて前記視覚パターンを変化させることを特徴とする請求項3記載の音声可視化装置。
  5. 前記可視化エフェクト手段は、前記検出された音声の音量及び方向をもとに、最大音量となる方向を求め、その方向を示すように前記視覚パターンを変化させることを特徴とする請求項4記載の音声可視化装置。
  6. 前記検出手段は、前記音声が出力されない状態で、音声を一定時間集音してノイズレベルを算出し、
    前記集音された音声の音量と前記ノイズレベルとを比較し、前記表示手段は、前記音量が前記ノイズレベルより大きいと判定される場合に、前記表示手段前記視覚パターンを表示することを特徴とする請求項3記載の音声可視化装置。
  7. 前記表示手段は、前記視覚パターンを投影する投影手段をさらに備えることを特徴とする請求項3記載の音声可視化装置。
  8. 前記表示手段は、前記投影手段により前記視覚パターンが投影されるスクリーンをさらに備えることを特徴とする請求項7記載の音声可視化装置。
  9. 前記可視化エフェクト手段は、前記視覚パターンとして照明装置の照度を変化させることを特徴とする請求項3記載の音声可視化装置。
JP2005322094A 2005-11-07 2005-11-07 情報伝達システム及び音声可視化装置 Expired - Fee Related JP4708960B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005322094A JP4708960B2 (ja) 2005-11-07 2005-11-07 情報伝達システム及び音声可視化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005322094A JP4708960B2 (ja) 2005-11-07 2005-11-07 情報伝達システム及び音声可視化装置

Publications (2)

Publication Number Publication Date
JP2007129623A true JP2007129623A (ja) 2007-05-24
JP4708960B2 JP4708960B2 (ja) 2011-06-22

Family

ID=38151890

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005322094A Expired - Fee Related JP4708960B2 (ja) 2005-11-07 2005-11-07 情報伝達システム及び音声可視化装置

Country Status (1)

Country Link
JP (1) JP4708960B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009128366A1 (ja) * 2008-04-16 2009-10-22 コニカミノルタホールディングス株式会社 コミュニケーションシステム及びコミュニケーションプログラム
JP2011171864A (ja) * 2010-02-17 2011-09-01 Nec Access Technica Ltd テレビ電話装置及びその音量制御方法
JP2013012971A (ja) * 2011-06-30 2013-01-17 Noritz Corp リモコンシステム
JP2013258591A (ja) * 2012-06-13 2013-12-26 Sony Corp エフェクト制御装置、エフェクト制御方法、およびプログラム
US11959296B2 (en) 2019-05-30 2024-04-16 Gravetime Inc. Graveside memorial telepresence method, apparatus and system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07245748A (ja) * 1994-03-02 1995-09-19 Nippon Telegr & Teleph Corp <Ntt> 音響信号を用いた通信装置
JP2004120460A (ja) * 2002-09-27 2004-04-15 Hitachi Information Systems Ltd ビデオ会議システムとビデオ会議端末装置およびプログラム
JP2004186870A (ja) * 2002-12-02 2004-07-02 Nippon Telegr & Teleph Corp <Ntt> テレビ会議方法、利用者端末装置の処理方法、利用者端末装置、プログラム及び記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07245748A (ja) * 1994-03-02 1995-09-19 Nippon Telegr & Teleph Corp <Ntt> 音響信号を用いた通信装置
JP2004120460A (ja) * 2002-09-27 2004-04-15 Hitachi Information Systems Ltd ビデオ会議システムとビデオ会議端末装置およびプログラム
JP2004186870A (ja) * 2002-12-02 2004-07-02 Nippon Telegr & Teleph Corp <Ntt> テレビ会議方法、利用者端末装置の処理方法、利用者端末装置、プログラム及び記録媒体

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009128366A1 (ja) * 2008-04-16 2009-10-22 コニカミノルタホールディングス株式会社 コミュニケーションシステム及びコミュニケーションプログラム
JP2011171864A (ja) * 2010-02-17 2011-09-01 Nec Access Technica Ltd テレビ電話装置及びその音量制御方法
JP2013012971A (ja) * 2011-06-30 2013-01-17 Noritz Corp リモコンシステム
JP2013258591A (ja) * 2012-06-13 2013-12-26 Sony Corp エフェクト制御装置、エフェクト制御方法、およびプログラム
CN103489464A (zh) * 2012-06-13 2014-01-01 索尼公司 效果控制装置、效果控制方法和程序
CN103489464B (zh) * 2012-06-13 2018-04-13 索尼公司 效果控制装置、效果控制方法和程序
US10467785B2 (en) 2012-06-13 2019-11-05 Sony Corporation Effect control device and effect control method
US11959296B2 (en) 2019-05-30 2024-04-16 Gravetime Inc. Graveside memorial telepresence method, apparatus and system

Also Published As

Publication number Publication date
JP4708960B2 (ja) 2011-06-22

Similar Documents

Publication Publication Date Title
US20220171594A1 (en) Earphone software and hardware
JP5654513B2 (ja) 音識別方法および装置
US9008320B2 (en) Apparatus, system, and method of image processing, and recording medium storing image processing control program
JP2019518985A (ja) 分散したマイクロホンからの音声の処理
US20150172814A1 (en) Method and system for directional enhancement of sound using small microphone arrays
US11900016B2 (en) Multi-frequency sensing method and apparatus using mobile-clusters
JP4708960B2 (ja) 情報伝達システム及び音声可視化装置
CN114727212B (zh) 音频的处理方法及电子设备
CN111800696B (zh) 听力辅助方法、耳机及计算机可读存储介质
CN116324969A (zh) 具有定位反馈的听力增强和可穿戴系统
EP3614692A1 (en) Information processing device, information processing method, speech output device, and speech output method
JP4474488B1 (ja) 音声受信装置、音声処理方法、プログラムおよび音声受信システム
JP2010103853A (ja) 音量監視装置及び音量監視方法
JP5120020B2 (ja) 画像付音声通信システム、画像付音声通信方法およびプログラム
WO2018198790A1 (ja) コミュニケーション装置、コミュニケーション方法、プログラム、およびテレプレゼンスシステム
WO2021090702A1 (ja) 情報処理装置、情報処理方法、およびプログラム
WO2021220665A1 (ja) 仮想的空間接続装置
WO2018173139A1 (ja) 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法
US11150868B2 (en) Multi-frequency sensing method and apparatus using mobile-clusters
JP2006339869A (ja) 映像信号と音響信号の統合装置
WO2018088210A1 (ja) 情報処理装置および方法、並びにプログラム
JP2003244669A (ja) 視線検出機能を有するテレビ会議システム
JP2010185974A (ja) 雑音抑圧装置および雑音抑圧方法
JP7111202B2 (ja) 収音制御システム及び収音制御システムの制御方法
JP2006114942A (ja) 音声提示システム、音声提示方法、この方法のプログラム、および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110209

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110317

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees