JP2017212610A - 端末、通信システム、及びプログラム - Google Patents

端末、通信システム、及びプログラム Download PDF

Info

Publication number
JP2017212610A
JP2017212610A JP2016104706A JP2016104706A JP2017212610A JP 2017212610 A JP2017212610 A JP 2017212610A JP 2016104706 A JP2016104706 A JP 2016104706A JP 2016104706 A JP2016104706 A JP 2016104706A JP 2017212610 A JP2017212610 A JP 2017212610A
Authority
JP
Japan
Prior art keywords
terminal
unpleasant sound
data
information
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016104706A
Other languages
English (en)
Other versions
JP2017212610A5 (ja
Inventor
健一郎 森田
Kenichiro Morita
健一郎 森田
拓也 今井
Takuya Imai
拓也 今井
翔 永峯
Sho Nagamine
翔 永峯
惇平 三神
Jumpei Mikami
惇平 三神
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2016104706A priority Critical patent/JP2017212610A/ja
Publication of JP2017212610A publication Critical patent/JP2017212610A/ja
Publication of JP2017212610A5 publication Critical patent/JP2017212610A5/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】音声データに含まれる不快な音の影響を適切に評価し、利用者に認識させる。【解決手段】ネットワークを介して複数の端末間で、音声データを含むデータを相互に送受信する通信システムにおける端末であって、前記端末と通信中の他の端末により検出された前記音声データに含まれる不快音の情報を、該他の端末から受信する受信部と、受信した前記不快音の情報を、画面に表示する表示制御部と、を有する端末が提供される。【選択図】図11

Description

本発明は、端末、通信システム、及びプログラムに関する。
インターネット等の通信ネットワークを介して、企業等の拠点間で遠隔会議を行うテレビ会議システムが普及している。このようなテレビ会議システムでは、各拠点に設置された端末が通信ネットワークを介して、音声データ及び映像データの送受信をする。音声データ及び映像データを受信した端末は、これらのデータを出力する。
拠点間で良好な音質でテレビ会議を行うために、一の端末からテスト用の音声データを他の端末に送信し、他の端末でテスト用の音声データを再生し、音声データの品質の評価をすることが提案されている(例えば、特許文献1)。
提案されているテスト用の音声データを用いて音声の品質を確認する場合、端末間の通信ネットワークの状況、及び端末のハードウエアの特性等による音声データへの影響を評価することができるものの、端末の周辺の環境や利用状況から発生する不快な音がマイクに集音されることによる影響を評価し、利用者に認識させることができなかった。
本発明は上記の課題に鑑みてされたものであって、音声データに含まれる不快な音の影響を適切に評価し、利用者に認識させることを目的とする。
一つの態様によれば、ネットワークを介して複数の端末間で、音声データを含むデータを相互に送受信する通信システムにおける端末であって、前記端末と通信中の他の端末により検出された前記音声データに含まれる不快音の情報を、該他の端末から受信する受信部と、受信した前記不快音の情報を、画面に表示する表示制御部と、を有する端末が提供される。
音声データに含まれる不快な音の影響を適切に評価し、利用者に認識させることができる。
一実施形態に係る通信システムのシステム構成図の一例を示す図である。 一実施形態に係る端末のハードウエア構成の一例を示す図である。 一実施形態に係る中継装置のハードウエア構成の一例を示す図である。 一実施形態に係る通信システムの機能構成の一例を示す図である。 一実施形態に係る受信優先度管理DBの一例を示す図である。 一実施形態に係る不快音情報DBの一例を示す図である。 一実施形態に係るセッション管理DBの一例を示す図である。 一実施形態に係る転送要求管理DBの一例を示す図である。 一実施形態に係るセッションの確立シーケンスの一例を示す図である。 一実施形態に係るデータの送受信シーケンスの一例を示す図である。 一実施形態に係る不快音の情報の送信シーケンスの一例を示す図である。 一実施形態に係る不快音の検出結果の記載の一例を示す図である。 一実施形態に係る不快音の検出の動作フローの一例を示す図である。 一実施形態に係るバックグラウンドノイズの検出処理の動作フローの一例を示す図である。 一実施形態に係る衝撃性ノイズの検出処理の動作フローの一例を示す図である。 一実施形態に係る高周波ノイズの検出処理の動作フローの一例を示す図である。 一実施形態に係る不快音の検出結果の画面表示の一例を示す図である。
<システム構成>
図1を用いて実施形態に係る通信システム1のシステム構成について説明する。通信システム1には、一方の伝送端末から他方の伝送端末に一方向でコンテンツデータを伝送するデータ提供システムや、複数の伝送端末10間で情報や感情等を相互に伝達するコミュニケーションシステムが含まれる。このコミュニケーションシステムは、複数のコミュニケーション端末(「伝送端末」に相当)間で情報や感情等を相互に伝達するためのシステムであり、テレビ会議システムやテレビ電話システム等が例として挙げられる。
実施形態では、コミュニケーションシステムの一例としてのテレビ会議システム、及びコミュニケーション端末の一例としてのテレビ会議端末を想定した上で、通信システム1、及び伝送端末について説明するが、伝送端末及び通信システム1は、テレビ会議システムへの適用に限定されないことは勿論である。
通信システム1は、複数の伝送端末(10ac、10ab等)、複数の伝送端末に接続されるディスプレイ(120ac、120ab等)、及び中継装置30を有する。以下では、「伝送端末」を「端末」と記載する。また、複数の端末のうち任意の端末を端末10と記載し、複数のディスプレイ120のうち任意のディスプレイをディスプレイ120と記載する。テレビ会議の開始を要求する端末10は、要求元端末10と表される。
複数の端末10の各々、及び中継装置30は、通信ネットワーク2を介して接続される。複数の端末10の各々は、通信ネットワーク2を介して、コンテンツデータの送受信を行う。ここで、コンテンツデータとは、例えば、画像データ及び音声データ等である。画像データには、静止画データと、動画データとを含む。
中継装置30は、複数の端末10の間で送受信されるコンテンツデータの中継を行う。なお、テレビ会議に参加する端末10が少ない場合、システム構成を簡略化するため、中継装置30を介さずに、端末10間で直接コンテンツデータの送受信を行ってもよい。
通信ネットワーク2は、各地域(地域A、地域B)にLAN(Local Area Network、2a、2b、2c、2d)が構築され、LANの間は専用線(2ab、2cd)、及びインターネット2i等を用いて接続される。また、通信ネットワーク2内には、コンテンツデータを転送するためのルータ(70a、70b、70c等)が設けられる。なお、以下では任意のルータは、単にルータ70と記載する。
地域は、国単位等の地理的に広い領域を表している。例えば、地域Aは、「日本」であり、地域Bは、「米国」である。LANは、地域内の拠点単位に構築される。例えば、LAN2aは東京の事業所に構築され、LAN2bは大阪の事業所に構築される。また、例えば、LAN2cはニューヨークの事業所に構築され、LAN2dはワシントンD.C.の事業所に構築される。
なお、通信ネットワーク2には、有線だけでなく、WiFi(Wireless Fidelity)、及びBluetooth(登録商標)、携帯電話網等の無線によりデータが送受信される区間がある場合がある。
図1において、端末10、中継装置30、及びルータ70の下に示されている4組の数字は、IPv4によるIPアドレスを簡易的に示している。例えば、端末10acのIPアドレスは「1.2.1.5」である。各装置にIPv6のIPアドレスが割り当てられてもよいことは勿論である。
各端末10は、複数の事業所間での通信に加えて、事業者内での通信も可能である。
テレビ会議中に、端末10は、不快音を収集し、収集した不快音に係る情報を他の端末10に送信する。他の端末10は、受信した不快音に係る情報をディスプレイ120に表示する。不快音とは、端末10の周辺の環境や、利用状況から発生する音であって、テレビ会議の利用者が不快と感じる音のことである。不快音の収集及びディスプレイ120への表示方法については後述する。
<ハードウエア構成>
次に、実施形態に係る装置のハードウエア構成について説明する。
(1)端末
図2は、実施形態に係る端末10のハードウエア構成の一例を示す図である。なお、端末10のハードウエア構成は図2の構成に限定されない。例えば、端末10には、図2に記載されていない構成が含まれていても、図2に記載の構成の一部が含まれていなくても良い。また、図2に記載の構成の一部は端末10に接続可能な外部装置等であっても良い。
図2に示されているように、本実施形態の端末10は、端末10全体の動作を制御するCPU(Central Processing Unit)101、IPL(Initial Program Loader)等のCPU101の駆動に用いられるプログラムを記憶したROM(Read Only Memory)102、CPU101のワークエリアとして使用されるRAM(Random Access Memory)103、端末10の各種端末用のプログラム、画像データ、及び音データ等の各種データを記憶するフラッシュメモリ104、CPU101の制御にしたがってフラッシュメモリ104に対する各種データの読み出し又は書き込みを制御するSSD(Solid State Drive)105、フラッシュメモリやICカード(Integrated Circuit Card)等の記録メディア106に対するデータの読み出し又は書き込み(記憶)を制御するメディアI/F107、宛先を選択する場合などに操作される操作ボタン108、端末10の電源のON/OFFを切り換えるための電源スイッチ109、通信ネットワーク2を利用してデータ伝送をするためのネットワークI/F(Interface)111を備えている。
また、端末10は、CPU101の制御に従って被写体を撮像して画像データを得る内蔵型のカメラ112、このカメラ112の駆動を制御する撮像素子I/F113、音を入力する内蔵型のマイク114、音を出力する内蔵型のスピーカ115、CPU101の制御に従ってマイク114及びスピーカ115との間で音信号の入出力を処理する音入出力I/F116、CPU101の制御に従って外付けのディスプレイ120に画像データを伝送するディスプレイI/F117、各種の外部機器を接続するための外部機器接続I/F118、及び上記各構成要素を図2に示されているように電気的に接続するためのアドレスバスやデータバス等のバスライン110を備えている。
ディスプレイ120は、被写体の画像や操作部等を表示する液晶や有機EL(Organic Electroluminescence)によって構成された表示部である。また、ディスプレイ120は、ケーブル120cによってディスプレイI/F117に接続される。このケーブル120cは、アナログRGB(VGA)信号用のケーブルであってもよいし、コンポーネントビデオ用のケーブルであってもよいし、HDMI(登録商標)(High−Definition Multimedia Interface)やDVI(Digital Video Interactive)信号用のケーブルであってもよい。
カメラ112は、レンズや、光を電荷に変換して被写体の画像(映像)を電子化する固体撮像素子を含み、固体撮像素子として、CMOS(Complementary Metal Oxide Semiconductor)や、CCD(Charge Coupled Device)等が用いられる。
外部機器接続I/F118には、筐体1100の接続口1132に差し込まれたUSB(Universal Serial Bus)ケーブル等によって、外付けカメラ、外付けマイク、及び外付けスピーカ等の外部機器がそれぞれ電気的に接続可能である。外付けカメラが接続された場合には、CPU101の制御に従って、内蔵型のカメラ112に優先して、外付けカメラが駆動する。同じく、外付けマイクが接続された場合や、外付けスピーカが接続された場合には、CPU101の制御に従って、それぞれが内蔵型のマイク114や内蔵型のスピーカ115に優先して、外付けマイクや外付けスピーカが駆動する。
なお、記録メディア106は、端末10に対して着脱自在な構成となっている。また、CPU101の制御にしたがってデータの読み出し又は書き込みを行う不揮発性メモリであれば、フラッシュメモリ104に限らず、EEPROM(Electrically Erasable and Programmable ROM)等を用いてもよい。
(2)中継装置
図3は、実施形態に係る中継装置30のハードウエア構成の一例を示す図である。中継装置30は、中継装置30全体の動作を制御するCPU201、IPL等のCPU201の駆動に用いられるプログラムを記憶したROM202、CPU201のワークエリアとして使用されるRAM203、中継装置30用のプログラム等の各種データを記憶するHD204、CPU201の制御にしたがってHD204に対する各種データの読み出し又は書き込みを制御するHDD(Hard Disk Drive)205、フラッシュメモリ等の記録メディア206に対するデータの読み出し又は書き込み(記憶)を制御するメディアドライブ207、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示するディスプレイ208、通信ネットワーク2を利用してデータ通信するためのネットワークI/F209、文字、数値、各種指示などの入力のための複数のキーを備えたキーボード211、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行うマウス212、着脱可能な記録媒体の一例としてのCD−ROM(Compact Disc Read Only Memory)213に対する各種データの読み出し又は書き込みを制御するCD−ROMドライブ214、及び、上記各構成要素を図3に示されているように電気的に接続するためのアドレスバスやデータバス等のバスライン210を備えている。
<機能構成>
次に、図4を用いて実施形態に係る通信システム1の機能構成について説明する。図4は、実施形態に係る通信システム1の機能構成の一例を示す図である。
(1)端末
端末10は、送受信部11、操作受付部12、セッション制御部13、撮像部14、音声入力部15a、音声出力部15b、表示制御部17、記憶・読出処理部19、優先順位決定部20、不快音検出部21を有する。これらの機能は、ROM102等に格納された1以上のプログラムをCPU101に実行させることにより実現される。また、端末10は記憶部1000を有し、記憶部1000は、受信優先度管理DB(Data Base)1002、及び不快音情報DB1003を有する。記憶部1000は、例えば、RAM103及びフラッシュメモリ104により実現される。
送受信部11は、通信ネットワーク2を介して他の端末10、及び中継装置30等と各種データの送受信を行う。
操作受付部12は、利用者による各種操作を受け付ける。例えば、送受信部11は、利用者から端末10の起動指示、テレビ会議の開始指示、及びテレビ会議の接続先の選択指示等を受け付ける。
セッション制御部13は、他の端末10との間で、音声データ、及び画像データ等の送受信を行うときの、セッション制御を行う。具体的には、セッション制御部13は、中継装置30、及び他の端末10との間でセッションの確立処理、セッションの維持に係る処理、及び、セッションの解放処理を実行する。また、セッション制御部13は、セッションの確立に伴い、データの送受信のための通信経路の設定を行う。
セッション制御部13は、他の端末10宛ての音声データ及び画像データを、送受信部11に送信させる。
セッション制御部13は、他の端末10宛ての不快音に係る情報(不快音の発生状況)を、送受信部11に送信させる。また、他の端末10から不快音に係る情報を受信すると、セッション制御部13は、受信した不快音に係る情報を、不快音情報DB1003に記憶させる。
撮像部14は、被写体を撮像して、撮像により得られた画像データを生成する。生成された画像データは、送受信部11を介して他の端末10に送信される。また、生成された画像データは、ディスプレイ120に表示される。
音声入力部15aは、マイク114により変換された利用者の音声信号を取得する。音声入力部15aは、取得した音声信号に係る音声データを送受信部11、及び不快音検出部21等に入力する。
音声出力部15bは、音声データに係る音声信号をスピーカに出力する。
表示制御部17は、画像データをディスプレイ120に表示させる。また、表示制御部17は、テレビ会議の操作、及び実行状態を示す情報を、ディスプレイ120に表示する。表示制御部17は、他の端末10から受信した不快音に関する情報を、ディスプレイ120に表示させる。
記憶・読出処理部19は、記憶部1000に各種データを記憶したり、記憶部1000から各種データを読み出したりする処理を行う。
優先順位決定部20は、参加中のテレビ会議において共有されているデータに対する受信優先度を決定し、受信優先度管理DB1002に記憶させる。受信優先度を決定するときに、優先順位決定部20は、利用者の入力操作、及び参加者の通話履歴等を基に受信優先度を決定する。受信優先度は動的に変更される。
不快音検出部21は、入力された音声データを分析する。不快音検出部21は、音声データの中に、他の端末10で該音声データが出力された場合に、不快音となり得る成分を検出する。不快音とは、利用者が不快に感じる音声であり、例えば、聞き取り理解の妨げの要因になり得る音である。
不快音検出部21は、1以上の種類の不快音の成分の抽出し、不快音の発生状態を検出する。例えば、不快音検出部21は、広い周波数成分を有するバックグラウンドノイズ、キーボードの打鍵音や物を落としたときに生じる衝撃性ノイズ、及びハウリング等の高周波数成分のノイズ(高周波ノイズ)等の検出を行う。不快音検出部21は、不快音の検出処理を、所定のタイミングで実行してもよいし、定期的に実行してもよいし、操作受付部12が利用者からの指示を受けたことに応じて実行してもよい。
記憶部1000は、各種データを記憶する。記憶部1000は、端末10を識別するための端末ID(Identification)等を記憶する。更に、記憶部1000は、他の端末10から受信した音声データ及び画像データを記憶する。記憶部1000は、他の端末10から新たに音声データ及び画像データを受信する度に、受信されている音声データ及び画像データを上書きする。上書きされる前の画像データがディスプレイ120に表示され、上書きされる前の音声データがスピーカ115から出力される。
受信優先度管理DB1002は、端末10が参加しているテレビ会議において接続されている端末10の各々において共有しているデータの一覧と、優先度とが対応付けられて記憶される。
図5は、実施形態に係る受信優先度管理DB1002の一例を示す図である。図5の受信優先度管理DB1002では、IPアドレス「4.0.0.2」の送信元の端末10のデータIDが「RS002」であり、優先度が最も高い(優先度1)であることを示している。また、図5の受信優先度管理DB1002では、IPアドレス「4.0.0.3」の送信元の端末10のデータIDが「RS003」であり、優先度が2番目に高い(優先度2)であることを示している。受信優先度管理DB1002では、映像データの優先順位を管理してもよいし、映像データに加えて、音声データ、その他コンテンツの優先順位を管理してもよい。
不快音情報DB1003は、他の端末10から受信した不快音に係る情報を記憶する。新たな不快音に係る情報を受信した場合、不快音情報DB1003は、記憶している情報を更新する。不快音に係る情報が更新されたタイミングで、表示制御部17は、不快音に係る情報を画面に表示してもよい。図6は、実施形態に係る不快音情報DB1003の一例を示す図である。データIDがRS001、及びRS002で特定されるデータの不快音に係る情報が記憶されている。不快音のレベルが所定のレベルより大きい場合は、「問題あり」と記憶され、不快音のレベルが所定のレベルより小さい場合は、「問題なし」と記憶される。
(2)中継装置
中継装置30は、送受信部31、転送制御部32、及び記憶・読出管理部39を有する。これらの機能は、HD204に記憶された1以上のプログラムをCPU201に実行させることにより実現される。また、中継装置30は、記憶部3000を有する。記憶部3000は、転送要求管理DB3003、及びセッション管理DB3002を有する。記憶部3000は、例えば、HD204により実現される。
送受信部31は、通信ネットワーク2を介して他の端末10等と各種データの送受信を行う。
転送制御部32は、端末10から受信したデータを他の端末10への転送する制御を実行する。具体的には、転送制御部32は、転送先に関する情報を記憶しているDBである転送要求管理DB3003を参照して、端末10から受信したデータの転送先の端末10を特定し、データを転送する。また、転送制御部32は、セッションに関する情報を記憶しているDBであるセッション管理DB3002を参照して、端末10との間で、セッションの確立、維持、及び解放等に関する処理を実行する。
記憶・読出管理部39は、記憶部3000に各種データを記憶したり、記憶部3000から各種データを読み出したりする処理を行う。
記憶部3000は、各種データを記憶する。セッション管理DB3002は、中継装置30でセッションの管理及びデータの転送の処理が行われているセッションに関する情報を記憶している。図7は、実施形態に係るセッション管理DB3002の一例を示す図である。中継装置30で管理しているセッションの識別子が「選択用セッションID」の欄に記憶され、各セッションに参加している端末10のIPアドレスが「参加端末IPアドレス」の欄に記憶されている。
転送要求管理DB3003は、中継装置30において管理及びデータの転送の処理が行われているセッションに参加する端末10間で送受信しているデータの扱いに関する情報が記憶される。具体的には、転送要求管理DB3003は、各セッションで送受信されるデータの転送の停止を要求している端末10のIPアドレスを記憶している。図8は、実施形態に係る転送要求管理DB3003の一例を示す図である。セッションの識別子である「セッションID」と、セッションで送受信されるデータの識別子「データID」と、転送の要求を停止している「転送停止要求端末IPアドレス」とが対応付けられて記憶されている。「転送停止要求端末IPアドレス」の欄にIPアドレスが設定されている端末10には、セッションに係るデータが転送されない。
<動作シーケンス>
(1)セッションの確立シーケンス
図9を用いて、複数の端末10間で、テレビ会議等のコミュニケーションを行うためのセッションを確立するシーケンスについて説明する。図9は、実施形態に係るセッションの確立シーケンスの一例を示す図である。図9では2台の端末10の間でテレビ会議に係るセッションが確立されるまでのシーケンスを示しているが、3台以上の端末10の間でセッションが確立される場合であっても同様のシーケンスが適用できる。
ステップS11で、端末10aaは、利用者から接続先の選択を受け付ける。この際に、任意の中継装置30と、任意のセッションIDが選択されたものとする。
ステップS12で、端末10aaは、セッションの開始要求を中継装置30に送信する。開始要求には、セッションIDと、要求元端末IPアドレスを含む。ここで要求元端末IPアドレスは、端末10aaに割り当てられているIPアドレスである。
ステップS13で、中継装置30は、セッション参加処理を実行する。具体的には、中継装置30は、セッション管理DB5005を検索し、要求されたセッションIDがセッション管理DB5005に記憶されているか否かを判断する。要求されたセッションIDが存在する場合、中継装置30は、要求元端末IPアドレスを、セッションIDへの参加端末10として、該セッションIDと要求元端末IPアドレスとを対応付けて、セッション管理DB5005に記憶させる。
一方、要求されたセッションIDが存在しない場合、中継装置30は、セッションIDを新たに生成し、セッション管理DB5005にセッションIDと要求元端末IPアドレスとを対応付けて記憶させる。
ここでセッション管理DB5005は、セッションIDとセッションに参加する端末10のIPアドレスを対応付けて記憶するデータベースであって、通信ネットワーク2内に配備される。
ステップS14で、中継装置30は、セッションの開始要求応答を、端末10aaに送信する。開始要求応答には、セッションID及び参加処理結果を含む。ここでは、正常に参加処理が完了したものとする。
ステップS15乃至ステップS18では、中継装置30と端末10dbとの間でステップS11乃至ステップS14と同様の処理が実行される。ステップS11で受け付けたセッションIDとステップS15で受け付けたセッションIDとが同じ場合、端末10aaと端末10dbとの間でセッションが確立される。
(2)データ転送のシーケンス
図10を用いて、セッション確立中の複数の端末10間で、データを送受信する処理について説明する。図10は、実施形態に係るデータの送受信シーケンスの一例を示す図である。
ステップS21で、端末10aaは、中継装置30に映像データを送信する。
ステップS22で、中継装置30は、映像データを端末10dbに送信する。
図10では、端末10aaから端末10dbに映像データが送信される様子を示しているが、端末10dbから端末10aaにも同様に映像データが送信される。
端末10では、利用者の操作を受けて、データの優先順位を動的に変更し、変更結果を受信優先度管理DB1002に記憶させる。
また、端末10は、利用者によって指定されたレイアウトモードと、通信ネットワーク2の利用可能帯域と、受信優先度管理DB1002で記憶されている優先順位とを基に、受信する映像データと、受信を停止するデータとを決定する。
ここで、レイアウトモードとは、ディスプレイ120に、一拠点から受信した映像データを表示するか、複数の拠点から受信した映像データを表示するかを設定するモードである。また、利用可能帯域は、端末10がリアルタイムに利用可能な通信ネットワーク2の帯域を推定することにより特定されてもよい。
例えば、受信する映像データの数については次のように求められる。端末10は、利用可能帯域から制御信号及び音声の受信に必要な帯域を減算し、映像データに利用可能な帯域を算出する。次に、端末10は、映像データに利用可能な帯域を所定の値で除算して、受信可能な映像データ数N(Nは自然数)を特定する。ここで、所定の値は、1つの映像データを受信した際に占有する帯域等も基に設定されてもよい。そして、端末10は、受信優先度管理DB1002で記憶されている優先順位に従って、受信可能な映像データ数Nの範囲内で映像データを受信すること、及び、優先順位がN+1以降に設定されている映像データを受信しないことを決定する。
ここでは、端末10dbで、端末10aaからの映像データの受信を停止することが決定されたものとして説明を進める。
ステップS23で、端末10dbは、転送停止要求を中継装置30に送信する。転送停止要求には、要求元端末IPアドレスと、受信を停止する映像データのIDであるデータIDとを含む。この場合、要求元端末IPアドレスは、端末10dbに割り当てられているIPアドレスであり、データIDは、端末10aaから送信される映像データのIDである。
ステップS24で、中継装置30は、転送停止処理を実行する。具体的には、中継装置30は、端末10dbに端末10aaから送信される映像データを送信しないように、転送要求管理DB3003に記憶し、端末10aaからの映像データの端末10dbへの転送を停止する。
ステップS25で、端末10aaは、中継装置30に端末10db宛ての映像データを送信する。この場合、転送停止処理が実行中であるため、中継装置30は、受信した映像データを端末10dbに転送しない。
その後、端末10dbが利用者から端末10aaからの映像データの受信を再開する指示を受け付けたものとして、以降の説明を続ける。
ステップS26で、端末10dbは、転送開始要求を、中継装置30に送信する。転送開始要求には、要求元端末IPアドレス、及びデータIDを含む。この場合、要求元端末IPアドレスは、端末10dbに割り当てられているIPアドレスであり、データIDは、端末10aaから送信される映像データのIDである。
ステップS27で、中継装置30は、転送再開処理を実行する。具体的には、中継装置30は、端末10dbに端末10aaから送信される映像データを送信するように、転送要求管理DB3003に記憶されているデータを更新する。
ステップS28で、端末10aaは、中継装置30に端末10db宛ての映像データを送信する。
ステップS29で、転送再開処理が実行されているため、中継装置30は、映像データを端末10dbに送信する。
(3)不快音の情報の送信シーケンス
次に、図11を用いて、不快音の情報の送信シーケンスについて説明する。図11は、実施形態に係る不快音の情報の送信シーケンスの一例を示す図である。
ステップS31で、端末10aaは、不快音の検出処理を実行する。端末10aaは、音声入力部15aで収集された一定期間の音声データに対して不快音の検出処理を行う。処理の詳細については後述する。
ステップS32で、端末10aaは、不快音の検出処理の実行対象となった音声データを、中継装置30に送信する。
ステップS33で、端末10aaは、不快音の検出結果を送信する。不快音の検出結果には、データIDと、検出結果とを含む。データIDは、不快音の検出処理を実行した音声データを特定する識別子である。検出結果には、不快音の種類毎に、所定のレベル以上の不快音が含まれているか否かを示す情報が含まれる。
ステップS34で、中継装置30は、ステップS32で受信した音声データを端末10dbに転送する。
ステップS35で、中継装置30は、ステップ33で受信した不快音の検出結果を端末10dbに転送する。
ステップS36で、不快音の検出結果を受信すると、端末10dbは、受信した不快音の検出結果を、不快音情報DB1003に記憶する。また、端末10dbは、ディスプレイ120に不快音の検出結果を表示する。
上述した動作シーケンスを実行することにより、端末10dbの利用者は自身が聞いている音を不快に感じる場合、不快に感じる音の音声データを送信している端末10を容易に特定することが可能になる。そして、不快に感じる音を発生している端末10の利用者に対して、場所の移動、端末10の変更、及び端末10のマイクのミュート等をさせることにより、不快に感じる音の発生を抑えることが可能となる。
不快音の検出結果の情報フォーマットは任意のフォーマットを用いることができるが、JSON(JavaScript(登録商標) Object Notation)形式のフォーマットを用いてもよい。図12に、不快音の検出結果をJSON形式で記載したフォーマット例を示す。図12では、バックグラウンドノイズ(BackgroundNoise)と、衝撃性ノイズ(ImpulseNoise)と、高周波ノイズ(HighFrequencyNoise)の検出結果が送信される場合の情報フォーマットを示している。値が「0」と設定されている場合、不快音が所定のレベルより小さい、つまり、不快音を発生していない(問題ない)ことを示しており、値が「1」と設定されている場合、不快音が所定のレベル以上である、つまり、不快音を発生していることを示している。
なお、上述した動作シーケンスでは、音声データと不快音の検出結果とが、端末10aaから端末10dbに送信される場合について説明したが、その他の端末10がセッションに参加している場合、その他の端末10にも音声データと不快音の検出結果とが送信され、他の端末10において、ステップS36と同様の処理が実行される。また、端末10は、不快音の検出結果の送信の処理を、不快音の発生状況が変わったときのみに実行し、冗長な処理を削減してもよいし、所定のタイミングで実行してもよい。
<動作フロー>
次に、端末10における不快音の検出の動作フローについて説明する。
(1)全体動作フロー
図13を用いて、端末10で実行される不快音の検出の動作フローについて説明する。図13は、不快音の検出の動作フローの一例を示す図である。
不快音検出部21は、音声入力部15aから入力された所定の時間単位の音データに対して、複数の不快音検出の処理を実行する。
ステップS41で、不快音検出部21は、バックグラウンドノイズの検出処理を実行する。
ステップS42で、不快音検出部21は、衝撃性ノイズの検出処理を実行する。
ステップS43で、不快音検出部21は、高周波ノイズの検出処理を実行する。
ステップS44で、不快音の検出結果を生成する。例えば、不快音の検出結果は、JSON形式で生成される(図12参照)。
ステップS41乃至ステップS43の処理は、同じ音に対して行う。また、ステップS41乃至ステップS43の処理は順序が入れ替わってもよいし、一部の処理が省略されてもよいし、他の種類の不快音の検出の処理が追加されてもよい。
以降、各々の不快音の検出処理について説明する。
(2)バックグラウンドノイズの検出処理
図14を用いて、端末10で実行されるバックグラウンドノイズの検出処理について説明する。図14は、バックグラウンドノイズの検出処理の動作フローの一例を示す図である。
ステップS51で、不快音検出部21は、所定の時間帯の音声データに対して周波数成分に変換する処理を実行する。例えば、不快音検出部21は、高速フーリエ変換を用いて、所定の時間帯の音声データを周波数成分に変換する。
ステップS52で、不快音検出部21は、周波数成分のボリューム(周波数成分の大きさ)が、所定の値を上回るか否かを判断する。全周波数成分で、ボリュームが所定の値を越えている場合(ステップS52 Yes)、ステップS54に進む。全周波数成分で、ボリュームが所定の値以下の場合(ステップS52 No)、ステップS53に進む。
ステップS53で、不快音検出部21は、バックグラウンドノイズが発生していないと判定する。
ステップS54で、不快音検出部21は、バックグラウンドノイズが発生していると判定する。
バックグラウンドノイズの中でも特にホワイトノイズと呼ばれるノイズが全周波数成分に対して一定のボリュームを有するという特性を持つため、上述したバックグラウンドノイズの検出処理の方法を実行することにより、適切にバックグラウンドノイズの検出処理を実行することができる。
(3)衝撃性ノイズの検出処理
図15を用いて、端末10で実行される衝撃性ノイズの検出処理について説明する。図15は、衝撃性ノイズの検出処理の動作フローの一例を示す図である。
ステップS61で、不快音検出部21は、所定の時間帯の音声データに対して周波数成分に変換する処理を実行する。例えば、不快音検出部21は、高速フーリエ変換を用いて、所定の時間帯の音声データを周波数成分に変換する。
ステップS62で、不快音検出部21は、所定の時間帯の音声データを周波数成分に変換した結果であるボリュームを、周波数と時間とを対応付けて記憶部1000に記憶させる。ここで、時間t、周波数fにおけるボリュームはV(t、f)で表されるものとする。また、t=0のV(0、f)が最新の周波数成分への変換結果のボリュームVを表し、t=1のV(1、f)が1回前の周波数成分への変換結果を表すものとする。
ステップS63で、周波数f=iの周波数成分に対する衝撃性ノイズ検出処理を開始する。ここで、周波数fは0〜M(最大値)で表され、iの初期値は0とする。
ステップS64で、不快音検出部21は、t=0において、V(0、i)が所定の閾値Th1以上であるか否かを判断する。V(0、i)が所定の閾値Th1以上の場合(ステップS64 Yes)、ステップS65に進む。一方、V(0、i)が所定の閾値Th1を下回る場合(ステップS64 No)、ステップS66に進む。
ステップS65で、不快音検出部21は、V(0、i)に隣接する周波数及び隣接する時間におけるボリュームVが所定の閾値Th2を下回るか否かを判断する。所定の閾値Th2を下回ると判断された場合(ステップS65 Yes)、ステップS69に進む。一方、所定の閾値Th2を下回ると判断されなかった場合(ステップS65 No)、ステップS66に進む。
例えば、不快音検出部21は、V(1、i)が所定の閾値Th2を下回るか否かを判断し(判断1)、V(0、i+1)が所定の閾値Th2を下回るか否かを判断し(判断2)、V(0、i―1)が所定の閾値Th2を下回るか否かを判断し(判断3)してもよい。そして、判断1乃至判断3の全てで、閾値Th2を下回ると判断された場合、不快音検出部21は、隣接する周波数及び隣接する時間におけるボリュームVが、所定の閾値Th2を下回ると判断してもよい。ここで閾値Th1と閾値Th2とは異なる値であっても、同じ値であってもよい。
ステップS66で、不快音検出部21は、iの値を1増加させる。
ステップS67で、不快音検出部21は、iの値が最大値Mを上回るか否かを判断する。ここで、iの値が最大値を上回る場合、t=0における全周波数(0〜M)で、衝撃性ノイズ検出処理が実行されたことを示している。iの値が最大値Mを上回る場合(ステップS67 Yes)、ステップS68に進む。iの値が最大値Mを上回らない場合(ステップS67 No)、ステップS63に戻り、不快音検出部21は、他の周波数における衝撃性ノイズ検出処理を実行する。
ステップS68で、不快音検出部21は、衝撃性ノイズ無しと判定し、処理を終了する。
ステップS69で、不快音検出部21は、衝撃性ノイズ有りと判定し、処理を終了する。
上述した、衝撃性ノイズの検出処理を実行することにより隣接する時間及び隣接する周波数におけるボリュームVに対して、突出しているボリュームVを特定することができる。これにより、衝撃性ノイズの有無を適切に判断することができる。
(4)高周波ノイズの検出処理
図16を用いて、端末10で実行される衝撃性ノイズの検出処理について説明する。図16は、高周波ノイズの検出処理の動作フローの一例を示す図である。
ステップS71で、不快音検出部21は、所定の時間帯の音声データに対して周波数成分に変換する処理を実行する。例えば、不快音検出部21は、高速フーリエ変換を用いて、所定の時間帯の音声データを周波数成分に変換する。
ステップS72で、不快音検出部21は、所定の周波数Fより高い周波数成分において、ボリュームが所定の閾値を超えているか否かを判断する。ボリュームが所定の閾値を超えている場合(ステップS72 Yes)、ステップS73に進む。一方、ボリュームが所定の閾値を超えていない場合(ステップS72 No)、ステップS74に進む。所定の周波数Fは、例えば、10kHz等に設定される。
ステップS73で、不快音検出部21は、高周波ノイズ有りと判定する。
ステップS74で、不快音検出部21は、高周波ノイズ無しと判定する。
通常の会話に必要がない周波数帯において、ボリュームが大きい周波数成分が存在する場合、利用者が不快音と感じるおそれがある。上述した、高周波ノイズの検出処理を実行することにより、高周波ノイズの有無を適切に判断することができる。
<画面表示例>
次に、図17を用いて、不快音の検出結果の画面表示について説明する。図17は、不快音の検出結果の画面表示の一例を示す図である。
図17は、拠点Aに配置された端末10aaが、他の拠点Bに配置された端末10db及び他の拠点Cに配置された端末10ccとテレビ会議に係るセッションを確立しているときの、端末10aaのディスプレイ120aaの画面の一例を示している。端末10aaにより撮影された映像データが、ディスプレイ120aaの領域81Aに表示され、端末10dbから受信した映像データ等が領域81Bに表示され、端末10ccから受信した映像データ等が領域81Cに表示される。
端末10dbから受信した不快音の検出結果は、領域82Bに表示され、端末10ccから受信した不快音の検出結果は、領域82Cに表示される。図17では、領域82Bに「衝撃性ノイズ:大 高周波ノイズ:大」と表示され、領域82Cに「高周波ノイズ:大」と表示されている。例えば、端末10aaは、端末10dbから{"BackgroundNoise":0,"ImpulseNoise":1,"HighFrequencyNoise":1}との不快音の検出結果を受信し、端末10ccから{"BackgroundNoise":0,"ImpulseNoise":0,"HighFrequencyNoise":1}との不快音の検出結果を受信した場合にこれらの警告を表示する。
領域82B及び領域82Cに表示される不快音の検出結果は、新たな検出結果を受信する度に更新される。
[その他]
送受信部11は、送信部又は受信部の一例である。不快音検出部21は、検出部の一例である。
上述した実施の形態の機能を実現するソフトウエアのプログラムコードを記録した記憶媒体を、端末10に供給してもよい。そして、端末10が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、上述の実施形態が、達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は、いずれかの実施の形態を構成することになる。ここで、記憶媒体は、記録媒体または非一時的な記憶媒体である。
また、コンピュータ装置が読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけではない。そのプログラムコードの指示に従って、コンピュータ装置上で動作しているオペレーティングシステム(OS)等が実際の処理の一部または全部を行ってもよい。さらに、その処理によって前述した実施形態の機能が実現されてもよいことは言うまでもない。
以上、本発明の好ましい実施形態について説明したが、本発明はこうした実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1 通信システム
2 通信ネットワーク
10 伝送端末
11 送受信部
12 操作受付部
13 セッション制御部
14 撮像部
15a 音声入力部
15b 音声出力部
17 表示制御部
19 記憶・読出処理部
20 優先順位決定部
21 不快音検出部
30 中継装置
31 送受信部
32 転送制御部
39 記憶・読出管理部
70 ルータ
1000 記憶部 (伝送端末)
3000 記憶部 (中継装置)
特許第4567543号公報

Claims (9)

  1. ネットワークを介して複数の端末間で、音声データを含むデータを相互に送受信する通信システムにおける端末であって、
    前記端末と通信中の他の端末により検出された前記音声データに含まれる不快音の情報を、該他の端末から受信する受信部と、
    受信した前記不快音の情報を、画面に表示する表示制御部と、を有する端末。
  2. 前記表示制御部は、前記他の端末の各々から受信した前記不快音の情報を、前記他の端末の各々に対応付けられた前記画面の領域に表示する、請求項1に記載の端末。
  3. 前記不快音は、前記他の端末が集音時した音の信号に含まれ、
    前記不快音の情報には、検出された複数の種類の不快音の発生状態を含む、請求項1又は2に記載の端末。
  4. 前記不快音の情報には、バックグラウンドノイズの発生状態、衝撃性ノイズの発生状態、高周波ノイズの発生状態、又はこれらの一以上の発生状態の組み合わせを含む、請求項3に記載の端末。
  5. ネットワークを介して複数の端末間で、音声データを含むデータを相互に送受信する通信システムにおける端末であって、
    他の端末に送信する前記音声データに含まれる不快音を検出する検出部と、
    検出された前記不快音の情報を前記他の端末に送信する送信部と、を有し、
    前記不快音の情報には、複数の種類の不快音の発生状態を含む、端末。
  6. 前記検出部は、所定のタイミングで、前記不快音を検出する処理を実行し、
    前記不快音の発生状態が変化した場合、前記送信部は、前記不快音の情報を前記他の端末に送信する、請求項5に記載の端末。
  7. ネットワークを介して複数の端末間で、音声データを含むデータを相互に送受信する通信システムであって、
    第1の端末は、
    第2の端末に送信する前記音声データに含まれる不快音を検出する検出部と、
    検出された前記不快音の情報を前記第2の端末に送信する送信部と、を有し、
    前記第2の端末は、
    前記第2の端末と通信中の前記第1の端末から、前記音声データに含まれる前記不快音の情報を受信する受信部と、
    受信した前記不快音の情報を、画面に表示する表示制御部と、を有する、通信システム。
  8. ネットワークを介して複数の端末間で、音声データを含むデータを相互に送受信する通信システムにおける端末に実行させるプログラムであって、
    前記端末と通信中の他の端末により検出された前記音声データに含まれる不快音の情報を、該他の端末から受信するステップと、
    受信した前記不快音の情報を、画面に表示するステップと、を端末に実行させるプログラム。
  9. ネットワークを介して複数の端末間で、音声データを含むデータを相互に送受信する通信システムにおける端末に実行させるプログラムであって、
    他の端末に送信する前記音声データに含まれる不快音を検出するステップと、
    前記不快音の情報を前記他の端末に送信するステップと、を端末に実行させ、
    前記不快音の情報には、検出された複数の種類の不快音の発生状態を含む、プログラム。
JP2016104706A 2016-05-25 2016-05-25 端末、通信システム、及びプログラム Pending JP2017212610A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016104706A JP2017212610A (ja) 2016-05-25 2016-05-25 端末、通信システム、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016104706A JP2017212610A (ja) 2016-05-25 2016-05-25 端末、通信システム、及びプログラム

Publications (2)

Publication Number Publication Date
JP2017212610A true JP2017212610A (ja) 2017-11-30
JP2017212610A5 JP2017212610A5 (ja) 2019-11-14

Family

ID=60475738

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016104706A Pending JP2017212610A (ja) 2016-05-25 2016-05-25 端末、通信システム、及びプログラム

Country Status (1)

Country Link
JP (1) JP2017212610A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008061060A (ja) * 2006-09-01 2008-03-13 Matsushita Electric Ind Co Ltd 会議システム
JP2012257186A (ja) * 2010-07-29 2012-12-27 Ricoh Co Ltd コミュニケーション端末およびプログラム
JP2014509467A (ja) * 2011-01-11 2014-04-17 イナ インダストリー パートナーシップ インスティテュート モバイルデバイスにおけるオーディオ信号の品質測定
JP2015019162A (ja) * 2013-07-09 2015-01-29 大日本印刷株式会社 会議支援システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008061060A (ja) * 2006-09-01 2008-03-13 Matsushita Electric Ind Co Ltd 会議システム
JP2012257186A (ja) * 2010-07-29 2012-12-27 Ricoh Co Ltd コミュニケーション端末およびプログラム
JP2014509467A (ja) * 2011-01-11 2014-04-17 イナ インダストリー パートナーシップ インスティテュート モバイルデバイスにおけるオーディオ信号の品質測定
JP2015019162A (ja) * 2013-07-09 2015-01-29 大日本印刷株式会社 会議支援システム

Similar Documents

Publication Publication Date Title
EP2681909B1 (en) Transmission management apparatus
JP6398343B2 (ja) 通信管理システム、通信管理方法、及びプログラム
JP6361268B2 (ja) 通信管理システム、通信管理方法、及びプログラム
JP6269609B2 (ja) 情報処理装置、画像表示方法、通信システム、プログラム
JP2016012843A (ja) 伝送管理システム、伝送システム、伝送管理方法、伝送方法、及びプログラム
JP6252740B2 (ja) 伝送管理システム、管理方法、及びプログラム
JP2015056860A (ja) 伝送端末、通信方法、及びプログラム
JP2015056733A (ja) 通信端末、通信管理システム、通信システム、及びプログラム
US9648276B2 (en) Transmission management apparatus, transmission system, transmission management method and recording medium
JP6661915B2 (ja) 通信管理システム、通信システム、中継装置制御方法、及びプログラム
JP2017092844A (ja) 通信端末、通信システム、通信制御方法、及びプログラム
US9578286B2 (en) Communication management system, communication terminal, communication system, communication control method, and recording medium
JP6515436B2 (ja) 伝送システム、伝送端末、及びプログラム
JP2017028660A (ja) 情報処理装置、画像表示方法、通信システム、プログラム
WO2015151958A1 (ja) 伝送端末、伝送システム、及び中継装置の選択方法
JP2017212610A (ja) 端末、通信システム、及びプログラム
JP2016067001A (ja) 伝送管理システム、伝送システム、管理方法、及びプログラム
JP2017034374A (ja) 伝送管理システム、伝送システム、情報処理装置、伝送管理方法、及びプログラム
JP6492460B2 (ja) 伝送端末、伝送方法、及びプログラム
JP6451253B2 (ja) 伝送管理システム、伝送システム、中継装置制御方法、及びプログラム
JP6326973B2 (ja) 伝送端末、伝送システム、中継装置の選択方法、プログラム、及びメンテナンスシステム
JP6540039B2 (ja) 伝送管理システム、通信方法、及びプログラム
JP2016195389A (ja) 通信管理システム、通信システム、通信管理方法、及びプログラム
JP2016194915A (ja) 通信端末、通信システム、通信方法、及びプログラム
JP2016195386A (ja) 通信システム、通信方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191004

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200305

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200317