JP2014064093A - 信号処理装置およびプログラム - Google Patents

信号処理装置およびプログラム Download PDF

Info

Publication number
JP2014064093A
JP2014064093A JP2012206849A JP2012206849A JP2014064093A JP 2014064093 A JP2014064093 A JP 2014064093A JP 2012206849 A JP2012206849 A JP 2012206849A JP 2012206849 A JP2012206849 A JP 2012206849A JP 2014064093 A JP2014064093 A JP 2014064093A
Authority
JP
Japan
Prior art keywords
user
signal processing
voice
unit
information corresponding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012206849A
Other languages
English (en)
Inventor
Yoichiro Sako
曜一郎 佐古
Tomoya Onuma
智也 大沼
Kazuyuki Sakota
和之 迫田
Akira Tange
明 丹下
Kohei Asada
宏平 浅田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2012206849A priority Critical patent/JP2014064093A/ja
Priority to US14/022,786 priority patent/US9253303B2/en
Priority to CN201310413000.XA priority patent/CN103685673A/zh
Publication of JP2014064093A publication Critical patent/JP2014064093A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/274Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
    • H04M1/2745Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
    • H04M1/27453Directories allowing storage of additional subscriber data, e.g. metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72457User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to geographic location

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】ユーザの状況に応じて通話状態を変更することが可能な信号処理装置およびプログラムを提供する。
【解決手段】第1ユーザの状態、第2ユーザの状態、および第1ユーザと第2ユーザの関係のうち、少なくとも1つを認識する認識部と、前記第1ユーザが発した音声に対応する音声情報、または遠隔より伝送された前記第2ユーザが発した音声に対応する音声情報に対して信号処理を行う信号処理部と、前記認識部による認識結果に応じて、前記第1ユーザが発した音声に対応する音声情報、および遠隔より伝送された前記第2ユーザが発した音声に対応する音声情報のうち、少なくともいずれか一方に対して信号処理を行うよう前記信号処理部を制御する制御部と、を備える、信号処理装置。
【選択図】図1

Description

本開示は、信号処理装置およびプログラムに関する。
一般的に、携帯電話、スマートフォン、PHS(Personal Handy−phone System)、固定電話等で通話する際、受話音量を手動で調整することが可能であるが、受話音量の設定は、全ての通話に共通して一設定しかできなかった。よって、ユーザは、通話開始直後に、通話相手に合わせて受話音量の設定を変更する必要があった。
ここで、下記特許文献1では、通話相手の電話番号と受話音量を対応付けて、通話相手に応じた受話音量のレベルを自動的に設定し、スムーズに会話を開始する技術が開示されている。
また、下記特許文献2では、操作音量設定値を予め複数段階設定し、これを電話番号と紐付けた送話音量フラグを利用して、通話中の送話音量変更を可能とする技術が開示されている。
特開2010−135978号公報 特開2010−141806号公報
しかしながら、上述したいずれの特許文献も、電話番号に予め対応付けられた受話/送話音量レベルに基づいて設定するものであって、予め受話/送話音量レベルが対応付けられていない場合は音量変更できなかった。
また、予め対応付けられる受話/送話音量レベルは、1つの電話番号に対して一設定であるので、ユーザの通話時の状況や、ユーザと相手ユーザ(通話相手)との関係に応じて受話/送話音量レベルを変更することは困難であった。
そこで、本開示では、ユーザの状況に応じて通話状態を変更することが可能な、新規かつ改良された照明装置およびプログラムを提案する。
本開示によれば、第1ユーザの状態、第2ユーザの状態、および第1ユーザと第2ユーザの関係のうち、少なくとも1つを認識する認識部と、前記第1ユーザが発した音声に対応する音声情報、または遠隔より伝送された前記第2ユーザが発した音声に対応する音声情報に対して信号処理を行う信号処理部と、前記認識部による認識結果に応じて、前記第1ユーザが発した音声に対応する音声情報、および遠隔より伝送された前記第2ユーザが発した音声に対応する音声情報のうち、少なくともいずれか一方に対して信号処理を行うよう前記信号処理部を制御する制御部と、を備える、信号処理装置を提案する。
本開示によれば、コンピュータを、第1ユーザの状態、第2ユーザの状態、および第1ユーザと第2ユーザの関係のうち、少なくとも1つを認識する認識部と、前記第1ユーザが発した音声に対応する音声情報、または遠隔より伝送された前記第2ユーザが発した音声に対応する音声情報に対して信号処理を行う信号処理部と、前記認識部による認識結果に応じて、前記第1ユーザが発した音声に対応する音声情報、および遠隔より伝送された前記第2ユーザが発した音声に対応する音声情報のうち、少なくともいずれか一方に対して信号処理を行うよう前記信号処理部を制御する制御部、として機能させるための、プログラムを提案する。
以上説明したように本開示によれば、ユーザの状況に応じて通話状態を変更することが可能となる。
本開示の一実施形態による信号処理システムの概要を説明するための図である。 第1の実施形態による携帯電話端末の構成を説明するためのブロック図である。 第1の実施形態による携帯電話端末の第1の動作処理を示すフローチャートである。 第1の実施形態による携帯電話端末の第2の動作処理を示すフローチャートである。 携帯電話端末の他の使用例を示す図である。 本実施形態による記憶部に記憶される関係情報デーブルの一例を示す図である。 本実施形態による携帯電話端末の第3の動作処理を示すフローチャートである。 パーソナルスペースとユーザBの音像定位位置について説明するための図である。 第2の実施形態による信号処理システムの概要について説明するための図である。 第2の実施形態による信号処理装置の構成を示すブロック図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、説明は以下の順序で行うものとする。
1.本開示の一実施形態による信号処理システムの概要
2.各実施形態
2−1.第1の実施形態
2−2.第2の実施形態
3.まとめ
<1.本開示の一実施形態による信号処理システムの概要>
まず、本開示の一実施形態による信号処理システムの概要について、図1を参照して説明する。
図1は、本開示の一実施形態による信号処理システムの概要を説明するための図である。図1に示すように、本実施形態では、ユーザA、ユーザBが、信号処理装置の一例である携帯電話端末2A、2Bにより通話している際の通話状態を、各ユーザの状態や、各ユーザの関係に応じて変更する。携帯電話端末2A、2Bは、図1に示すように、マイクロフォン(以下、マイクとも称す)23A、23B、スピーカ24A、24B、表示部21A、21B、および操作入力部22A、22Bを有する。
ここで、上述したように、通常の携帯電話端末やスマートフォン、固定電話等では、受話音量の制御はユーザ自身が手動で行うが、全ての通話に共通して一設定しかできないので、通話の度に通話相手に合わせて受話音量の設定を変更する必要があった。
また、上述した特許文献1、2には、電話番号に予め対応付けられた受話/送話音量レベルに基づいて自動設定する通話端末装置が開示されているが、予め受話/送話音量レベルが対応付けられていない場合は音量変更できなかった。また、ユーザの通話時の状況や、ユーザと相手ユーザ(通話相手)との関係に応じて受話/送話音量レベルを変更することは困難であった。
そこで、上記事情を一着眼点にして本開示の各実施形態による信号処理システム(信号処理装置)を創作するに至った。本開示の各実施形態による信号処理システムは、ユーザの状況に応じて通話状態を自動的に変更することができる。
例えば、ユーザBが、耳が遠い人であったり、通信状態が悪かったりした場合、ユーザAの声が聞き取りにくいために、自分の声が大きくなってしまう現象が起こる。このような場合、ユーザAは、ユーザBの音声(受話音声)が大きすぎて不快に感じることがある。
よって、例えば携帯電話端末2Aは、例えば耳が遠い人であるといったユーザBの状態を認識し、携帯電話端末2Bのマイク23Bから集音されて送信されたユーザBの音声(受話音声)の音量を下げてスピーカ24Aから出力する。また、携帯電話端末2Aは、マイク23Aにより集音したユーザAの音声(送話音声)の音量を上げて携帯電話端末2Bに送信してもよい。
以上、本開示の一実施形態における信号処理システムの概要について説明した。続いて、本実施形態による信号処理システムについて、複数の実施形態を挙げて詳細に説明する。なお、図1に示す例では、本開示による信号処理装置の一例として携帯電話端末を挙げたが、本開示による信号処理装置はこれに限定されず、例えばスマートフォン、タブレット端末、PHS、または固定電話であってもよい。また、本開示による信号処理装置は、インターネット電話サービスを提供する情報処理装置であってもよい。
<2.各実施形態>
[2−1.第1の実施形態]
第1の実施形態による信号処理システムは、図1に示す携帯電話端末2において、ユーザAの状態、ユーザBの状態、またはユーザAとユーザBの関係を認識し、認識結果に基づいて通話状態を自動的に変更する。以下、第1の実施形態による携帯電話端末2の構成について図2を参照して具体的に説明する。
(2−1−1.構成)
図2は、本実施形態による携帯電話端末の構成を説明するためのブロック図である。図2に示すように、本実施形態による携帯電話端末2は、制御部20、表示部21、操作入力部22、マイクロフォン23(以下、マイク23と称す)、スピーカ24、アンプ・ADC(アナログ−デジタルコンバータ)部25、DAC(デジタル−アナログコンバータ)・アンプ部26、信号処理部27、カメラモジュール28、記憶部29、および通信I/F(インタフェース)30を有する。
(表示部)
表示部21は、制御部20の制御に従って、メニュー画面や各種操作画面等を表示する。また、表示部21は、例えばLCD(Liquid Crystal Display)またはOLED(Organic Light−Emitting Diode)などにより実現される。
(操作入力部)
操作入力部22は、ユーザによる操作入力を検出する。具体的には、操作入力部22は、図1に示すような携帯電話端末2に物理的に設けられた各種のボタンにより実現されてもよいし、表示部21に表示される画面に対するユーザのタッチ位置を検知するタッチパネルにより実現されてもよい。
(マイク)
マイク23は、ユーザの音声を集音し、ユーザの音声に対応する音声情報(オーディオ信号)をアンプ・ADC部25に出力する。
(アンプ・ADC部)
アンプ・ADC部25は、マイク23から出力された音声情報を増幅するアンプと、アンプにより増幅された音声情報を、アナログ電気信号からデジタル電気信号に変換するADCを有する。また、アンプ・ADC部25は、デジタル電気信号に変換した音声情報を信号処理部27に出力する。
(DAC・アンプ部)
DAC・アンプ部26は、信号処理部27から出力された通話相手の音声情報を、デジタル電気信号からアナログ電気信号に変換するADCと、アナログ電気信号に変換された音声情報を増幅するアンプを有する。また、DAC・アンプ部26は、アナログ電気信号に変換し、増幅した音声情報をスピーカ24に出力する。
(スピーカ)
スピーカ24は、DAC・アンプ部26から出力された音声情報を出力(再生)する機能を有する。
(信号処理部)
信号処理部27は、制御部20による制御にしたがって、マイク23で集音されアンプ・ADC部25から出力された音声情報(送話音声)、または通信I/F30により受信した音声情報(受話音声)に対して、所定の信号処理(通話状態の変更)を行う機能を有する。より具体的には、本実施形態による信号処理部27は、図2に示すように、送話/受話音量処理部271、ノイズ除去処理部273、およびオーディオ信号処理部275として機能する。
・送話/受話音量処理部
送話/受話音量処理部271は、音声情報(送話音声/受話音声)の音量を変更する機能を有する。
・ノイズ除去処理部
ノイズ除去処理部273は、音声情報のうち背景雑音等のノイズを除去して、S/N(シグナル/ノイズ)比を向上させる機能を有する。具体的には、例えばノイズ除去処理部273は、低域通過フィルタ(LPF)、帯域除去フィルタ(BEF)、帯域通過フィルタ(BPF)、または高域通過フィルタ(HPF)等のフィルタ回路により実現される。
・オーディオ信号処理部
オーディオ信号処理部275は、音声情報(オーディオ信号)に対して、符号化処理、復号化処理、加工処理、または音像定位を実現するための信号処理(音像定位処理)等を行う。例えば、オーディオ信号処理部275は、マイク23により集音したユーザAの音声に対応する音声情報(送話音声)を符号化した上で、通信I/F30に出力する。また、オーディオ信号処理部275は、通信I/F30により受信したユーザBの音声に対応する音声情報(受話音声)を復号化した上で、DAC・アンプ部26に出力する。
また、加工処理の具体例としては、音声情報の一部を強調する加工や、音声情報を変声させる加工が挙げられる。例えば、オーディオ信号処理部275は、マイク23により集音した音声情報を周波数に変換した上で、ユーザAの特徴を示す周波数成分を抽出し、抽出した周波数成分の電力値を高めることで、ユーザAの音声を強調させる。
(カメラモジュール)
カメラモジュール28は、撮像素子、撮像レンズを含む撮像光学系、および撮像画像信号処理部を含み、デジタル信号とされた撮像画像のデータを出力する。なお、撮像素子は、例えばCCD(Charge Coupled Device)イメージャやCMOS(Complementary Metal Oxide Semiconductor)イメージャにより実現される。
また、カメラモジュール28は、携帯電話端末2の表示部21が設けられている面と反対側の面(外側)に設けられてもよいし、表示部21が設けられている面と同じ面(内側)にインカメラとして設けられてもよい。
(記憶部)
記憶部29は、氏名と電話番号が対応付けられたアドレスデータや、制御部20による各種制御を実行するためのプログラム等を記憶する。
(通信I/F)
通信I/F30は、外部装置とデータを送受信する機能を有する。具体的には、本実施形態による通信I/F30は、信号処理部27から出力された符号化済みの音声情報(送話音声)を、通話相手の通信端末に送信する。また、通信I/F30は、通話相手の通信端末から通話相手の音声情報(受話音声)を受信し、信号処理部27に出力する。
(制御部)
制御部20は、携帯電話端末2の各構成を制御する機能を有する。具体的には、本実施形態による制御部20は、図2に示すように、認識部201および信号処理制御部203として機能する。
・認識部
認識部201は、ユーザAの状態、通話相手であるユーザBの状態、またはユーザAとユーザBとの関係を認識する。具体的には、本実施形態による認識部201は、例えばカメラモジュール28から出力されるユーザAの顔を撮影した撮影画像や、マイク23により集音されるユーザAの音声情報に基づいて、ユーザAの状態(良好、不調、耳が悪い、聞こえ難い状態、年齢等)を認識する。また、認識部201は、例えば通信I/F30により受信したユーザBの音声情報やユーザBの顔を撮影した撮影画像に基づいて、ユーザBの状態(耳が悪い、聞こえ難い状態、年齢等)を認識する。さらに、認識部201は、ユーザAにより入力されたユーザBに対する関係情報に基づいて、ユーザAとユーザBとの関係(友達、特別(夫婦、恋人)、会社、良好/不調、好意/悪意等)を認識する。
・信号処理制御部
信号処理制御部203は、信号処理部27により音声情報に対して所定の信号処理を行うよう制御する。また、信号処理制御部203は、認識部201による認識結果に応じて、音声情報に対して所定の信号処理を行うよう信号処理部27を制御してもよい。なお、認識結果に応じた所定の信号処理については、続く本実施形態の動作処理において詳細に説明する。
以上、本実施形態による携帯電話端末2の具体的な構成について詳細に説明した。続いて、本実施形態による携帯電話端末2の動作処理について説明する。本実施形態による携帯電話端末2は、上述したように、ユーザの状況(ユーザAの状態、ユーザBの状態、またはユーザAとユーザBとの関係)に応じて通話状態を自動的に変更することができる。以下、このような携帯電話端末2によるユーザの状況に応じた通話状態の変更処理に関し、第1〜第3の動作処理を用いて具体的に説明する。
(2−1−2.第1の動作処理)
第1の動作処理によれば、携帯電話端末2は、通話相手であるユーザBが、耳が遠い状態(難聴、聴力が低い状態)であるか否かを認識し、認識結果に応じて通話状態を変更することができる。
一般的に、耳が遠い人は、相手の声が聞き取りにくいために、自分の声が大きくなってしまう現象が起こる。よって、携帯電話端末2は、例えば通話相手であるユーザBの音声の大きさ(受話音量の大きさ)に基づいて、通話相手が耳が遠い状態であるか否かを認識することができる。以下、図3を参照して具体的に説明する。
図3は、本実施形態による携帯電話端末2の第1の動作処理を示すフローチャートである。図3に示すように、まず、ステップS103において、携帯電話端末2は、ユーザBの携帯電話端末と通話を開始する。具体的には、携帯電話端末2の制御部20は、マイク23で集音したユーザAの音声情報を符号化してユーザBの携帯電話端末に送信し、また、ユーザBの携帯電話端末から受信した音声情報を復号化して、スピーカ24から出力するよう制御する。
次いで、ステップS106において、制御部20の認識部201は、受信したユーザBの音声情報(受話音声)の音量が所定値より大きいか否かを判断する。受話音声が所定値を下回る場合、認識部201は、ユーザBは耳が遠い状態ではないと認識する。一方、受話音声が所定値を上回る場合、認識部201は、ユーザBは耳が遠い状態であると認識する。
次に、受話音声が所定値を下回る場合、すなわち認識部201により、ユーザBは耳が遠い状態ではないと認識された場合(S106/NO)、ステップS109において、制御部20は、特に受話/送話音声の音量は変更しない。
次いで、受話音声が所定値を上回る場合、すなわち認識部201により、ユーザBは耳が遠い状態であると認識された場合(S106/YES)、ステップS112において、制御部20は、送話音量を自動変更するか否かを判断する。例えば、制御部20は、送話音量の自動変更がON(またはOK)に設定されている場合、送話音量の自動変更を行うと判断する。また、送話音量の自動変更がOFF(またはNO)に設定されている場合、制御部20は、送話音量の自動変更は行わないと判断する。
次に、送話音量の自動変更を行うと判断された場合(S112/YES)、ステップS115において、信号処理制御部203は、送話音量を上げて、受話音量を下げるよう、信号処理部27を制御する。これに応じて、信号処理部27の送話/受話音量処理部271は、ユーザBに送信するユーザAの音声(送話音声)の音量を上げるよう信号処理し、また、受信したユーザBの音声(受話音声)の音量を下げるよう信号処理する。
これにより、ユーザA側の携帯電話端末2は、耳が悪いために大きくなってしまったユーザBの音声(受話音声)の音量を小さくして再生することができ、また、ユーザAの音声(送話音声)の音量を大きくして耳が悪いユーザBに送信することができる。よって、ユーザAおよびユーザBの双方にストレスを感じさせないよう、互いのニーズに合った通話状態に変更(改善)することができる。
一方、送話音量の自動変更は行わないと判断された場合(S112/NO)、ステップS118において、信号処理制御部203は、送話音量については特に信号処理せず、受話音量を下げるよう信号処理する。これにより、ユーザA側の携帯電話端末2は、耳が悪いために大きくなってしまったユーザBの音声(受話音声)の音量を小さくして再生することができ、少なくともユーザAにストレスを感じさせないようユーザAのニーズに合った通話状態に変更(改善)することができる。
以上、第1の動作処理について詳細に説明した。これによれば、本実施形態による携帯電話端末2は、通話相手であるユーザBが、耳が遠い状態であるか否かを認識することができる。そして、携帯電話端末2は、ユーザBが耳が遠い状態である場合、集音したユーザAの音声情報の音量を上げてユーザBに送信し、また、受信したユーザBの音声情報の音量を下げて再生することで、通話状態を改善することができる。
なお、図3に示すフローチャートでは、認識部201は、ユーザBの耳が遠い状態であるか否かを、ユーザBの音声情報(受話音声)の音量の大きさに基づいて認識しているが、本開示による認識方法はこれに限定されない。例えば、認識部201は、ユーザBの年齢に基づいて、耳が遠い状態であるか否かを判断してもよい。一般的に、難聴は加齢によって始まり、多くの場合は50歳〜60歳頃から始まる。そこで、例えば認識部201は、ユーザBの年齢が50歳〜60歳以上の場合、耳が遠い状態であると判断する。また、認識部201は、ユーザBの年齢を、ユーザBの音声情報を解析することにより判断してもよいし、ユーザBの顔画像に基づいて判断してもよいし、予め入力されたユーザBの年齢情報に基づいて判断してもよい。
また、図3に示すフローチャートでは、認識部201は、通話相手であるユーザBが、耳が遠い状態であるか否かを認識しているが、本開示による認識対象は通話相手に限定されず、通話している本人であるユーザAが認識対象であってもよい。具体的には、例えば認識部201は、マイク23で集音したユーザAの音声(送話音声)の音量の大きさに基づいて、ユーザAが、耳が悪い状態(難聴)であるか否かを認識する。そして、ユーザAが耳が悪い状態であると認識された場合、携帯電話端末2は、集音したユーザAの音声情報の音量を下げてユーザBに送信し、また、受信したユーザBの音声情報の音量を上げて再生することで、通話状態を改善することができる。
(2−1−3.第2の動作処理)
次に、第2の動作処理について説明する。一般的に、耳が悪い人でなくても、通話中に通信状態の悪化や、背景雑音が大きいことにより、音声が聞こえ難い(聴力が低い)状態となる場合がある。そこで、第2の動作処理によれば、携帯電話端末2は、通話相手であるユーザBが聞こえ難い状態であるか否かを認識し、認識結果に応じて通話状態を変更することができる。以下、図4を参照して具体的に説明する。
図4は、本実施形態による携帯電話端末2の第2の動作処理を示すフローチャートである。図4に示すように、まず、ステップS103において、携帯電話端末2は、ユーザBの携帯電話端末と通話を開始する。
次いで、ステップS107において、制御部20の認識部201は、受信したユーザBの音声情報(受話音声)に、繰り返し表現等が含まれているか否かを判断する。繰り返し表現等とは、「え?」「もう一度」等の繰り返しを要求する表現や、「聞こえない」「聞こえ難い」「もう少し大きい声で」等の聞こえ難さを示す表現である。認識部201は、受信したユーザBの音声情報(受話音声)を解析し、このような繰り返し表現等が含まれているか否かを判断する。繰り返し表現等が含まれている場合、認識部201は、ユーザBが聞こえ難い状態であると認識することができる。
次に、受話音声に繰り返し表現等が含まれていないと判断された場合、すなわち認識部201により、ユーザBが聞こえ難い状態ではないと認識された場合(S107/NO)、ステップS110において、制御部20は、特に通話状態の変更は行わない。
次いで、受話音声に繰り返し表現等が含まれていると判断された場合、すなわち認識部201により、ユーザBが聞こえ難い状態であると認識された場合(S107/YES)、ステップS113において、制御部20は、送話状態を自動変更するか否かを判断する。例えば、制御部20は、送話状態の自動変更がON(またはOK)に設定されている場合、送話状態の自動変更を行うと判断する。また、送話状態の自動変更がOFF(またはNO)に設定されている場合、制御部20は、送話状態の自動変更は行わないと判断する。
次に、送話状態の自動変更を行うと判断された場合(S113/YES)、ステップS116において、信号処理制御部203は、送話音量を上げる信号処理および/または、送話音声から背景雑音を除去する信号処理を行うよう信号処理部27を制御する。これに応じて、信号処理部27の送話/受話音量処理部271は、ユーザBに送信するユーザAの音声(送話音声)の音量を上げるよう信号処理する。また、信号処理部27のノイズ除去処理部273は、ユーザBに送信するユーザAの音声(送話音声)から、背景雑音を除去するよう信号処理する。
これにより、ユーザBはユーザAの音声が聞こえやすくなり、また、ユーザAはユーザBに何度も聞き返されることが無くなるので、互いのストレスが削減され、通話状態が改善される。
一方、送話状態の自動変更は行わないと判断された場合(S113/NO)、ステップS119において、信号処理制御部203は、送話音量については特に信号処理しない。
以上、第2の動作処理について詳細に説明した。これによれば、本実施形態による携帯電話端末2は、通話相手であるユーザBが、聞こえ難い状態であるか否かを認識することができる。そして、携帯電話端末2は、ユーザBが聞こえ難い状態である場合、集音したユーザAの音声情報の音量を上げたり、ユーザAの音声情報から背景雑音を除去したりした上でユーザBに送信することで、通話状態を改善することができる。
なお、図3に示すフローチャートでは、認識部201は、通話相手であるユーザBが、聞こえ難い状態であるか否かを認識しているが、本開示による認識対象は通話相手に限定されず、通話している本人であるユーザAが認識対象であってもよい。具体的には、例えば認識部201は、マイク23で集音したユーザAの音声(送話音声)を解析し、繰り返し表現等が含まれているか否かに基づいて、ユーザAが、聞こえ難い状態であるか否かを認識する。そして、ユーザAが聞こえ難い状態であると認識された場合、携帯電話端末2は、受信したユーザBの音声情報の音量を上げたり、ユーザBの音声情報から背景雑音を除去したりした上で再生することで、通話状態を改善することができる。
(2−1−4.第3の動作処理)
次に、第3の動作処理について説明する。一般的に、好意的な相手の声は、近くで聞こえても不快ではないが、嫌悪感のある相手の声は、近くで聞こえると不快である。そこで、第3の動作処理によれば、携帯電話端末2は、ユーザAと、通話相手であるユーザBとの関係を認識し、認識結果に応じて通話状態を変更することで、快適な通話状態を提供することができる。具体的には、本実施形態による信号処理部27のオーディオ信号処理部275が、ユーザAとユーザBとの関係に応じた距離からユーザBの音声が聞こえるようユーザBの音声(受話音声)を信号処理し、音像を定位させる。以下、図5〜図8を参照して詳細に説明する。
・音像定位処理
オーディオ信号処理部275は、図1に示すような携帯電話端末2の単一のスピーカ24から音声情報が再生される場合にも、音声情報のうち高域成分を減衰することで、距離感を演出することが可能である。
また、図5に示すように、携帯電話端末2にヘッドホン32が接続された状態でユーザAが通話している状況も想定される。ここで、ヘッドホン32は、例えば図5に示すように、コードの途中にマイク23’が配置され、コードの終端に複数のスピーカ24’が設けられている。これにより、ユーザAの音声はマイク23’により集音され、また、通話相手(ユーザB)の音声(音声情報)は、複数のスピーカ24’から出力(再生)される。この場合、オーディオ信号処理部275は、モノラルの音源に対してHRTF(Head Related Transfer Function;頭部伝達関数)を畳み込むことで、音像定位処理を実現することが可能である。なお、ヘッドホン32は、図5に示すようなインナーイヤー型/カナル型の他、ヘッドバンド型やネックバンド型等であってもよい。
・音像定位位置
また、オーディオ信号処理部275は、音像定位位置については、ユーザAとユーザBとの関係に応じて決定してもよい。ここで、ユーザAとユーザBとの関係は、認識部201により認識されるところ、認識部201は、図5に示すように、携帯電話端末2に設けられたカメラモジュール28(インカメラ)によりユーザAの顔を撮影した撮影画像に基づいて認識してもよい。具体的には、例えばユーザAが笑顔であれば、認識部201は、ユーザAが通話相手であるユーザBに対して好意的であると認識する。
また、認識部201は、ユーザAにより入力されたユーザAとユーザBとの関係情報に基づいて認識してもよい。ここで、記憶部29に記憶される関係情報デーブルの一例を図6に示す。図6に示すように、例えばユーザAとユーザBとの関係は友達であって、また、ユーザAとユーザCとの関係は特別(夫婦、恋人等)であって、また、ユーザAとユーザDとの関係は会社関係であるといった情報が、関係情報テーブル291として登録されている。
なお、認識部201は、ユーザAにより設定されたアドレスデータのグループ分け(友達グループ、会社グループ、特別グループ等)に基づいて、ユーザAとユーザBとの関係を認識してもよい。
このように認識部201により認識されたユーザAとユーザBとの関係に応じて、信号処理制御部203は、ユーザBの音像が所定の位置に定位されるよう、オーディオ信号処理部275を制御する。ユーザBの音像定位位置は、例えばユーザAとユーザBとの関係が良好であるほどユーザAに近く、ユーザAとユーザBとの関係が不調であるほどユーザAから遠くしてもよい。
さらに、信号処理制御部203は、ユーザAとユーザBの関係に応じたユーザAのパーソナルスペースを考慮してユーザBの音像定位位置を制御してもよい。以下、図7〜図8を参照して具体的に説明する。
・パーソナルスペースを考慮した音像定位位置の制御
図7は、本実施形態による携帯電話端末2の第3の動作処理を示すフローチャートである。図7に示すように、まず、ステップS103において、携帯電話端末2は、ユーザBの携帯電話端末と通話を開始する。
次いで、ステップS108において、制御部20の認識部201は、ユーザAとユーザBとの関係を認識する。具体的には、認識部201は、上述したように、例えばユーザAにより予め登録された関係情報テーブル291を参照して関係を認識してもよい。
次に、ステップS120において、信号処理制御部203は、ユーザAとユーザBの関係に応じたユーザAのパーソナルスペースを考慮した適切な位置に音像定位されているか否かを判断する。例えば、制御部20は、デフォルトでは、受信したユーザBの音声情報に対して音像定位処理をせずにスピーカ24から再生するよう制御する。そして、制御部20は、ユーザBの音像定位位置が、両者の関係に応じたパーソナルスペースを考慮した場合、適切な位置であるか否かを判断する。
ここで、パーソナルスペースとは、他人に近付かれると不快に感じる空間のことで、親密な相手ほど狭く、敵視している相手ほど広い。また、一般的に、パーソナルスペースは、密接距離、固体距離、社会距離、公衆距離といった4つのゾーンに大別される。以下、図8を参照して具体的に説明する。
図8は、パーソナルスペース(エリアP1〜P4)と、ユーザBの音像40の定位位置について説明するための図である。図8に示すように、ユーザAを中心とした密接距離(約0〜45センチ)のエリアP1は、ごく親しい人に許される空間である。また、ユーザAを中心とした固体距離(約45〜120センチ)のエリアP2は、個人的に親しい人と路上での立ち話ができる程度の空間である。また、ユーザAを中心とした社会距離(約120〜360センサ)のエリアP3は、ビジネス上の間合いで用いられる空間である。また、ユーザAを中心とした公衆距離(約360〜750センチ)のエリアP4は、複数の相手が見渡せて、一方的なコミュニケーション(講演者と聴衆といった関係)になりやすい空間である。
このように、相手との関係に応じてパーソナルスペースの広さが異なるので、信号処理制御部203は、ユーザAとユーザBの関係に応じた適切なパーソナルスペースに基づいて音像40の定位位置を判断することで、より快適な通話状態をユーザAに提供する。
次いで、ユーザBの音像定位位置が、適切な位置である場合(S120/YES)、ステップS123において、制御部20は、特に通話状態の変更は行わない。
次に、ユーザBの音像定位位置が、適切な位置でない場合(S120/NO)、ステップS126において、信号処理制御部203は、ユーザBの音像定位位置が、ユーザAのパーソナルスペースに侵入しているか否かを判断する。
例えば、ユーザAとユーザBの関係が「会社」であって、ユーザBの音像定位位置が、ごく親しい人に許される空間であるエリアP1に含まれる場合、信号処理制御部203は、パーソナルスペースに侵入していると判断する(S126/YES)。この場合、ユーザAは不快に感じることが想定されるので、続くステップS129において、信号処理制御部203は、ユーザBの音像定位位置(受話音声の音像定位位置)を、遠距離化するよう(希薄化対応するよう)オーディオ信号処理部275を制御する。例えば、信号処理制御部203は、ユーザBの音像40の定位位置を、エリアP3に定位させることで、ユーザAにとって快適な通話状態を提供することができる。
一方、ユーザAとユーザBの関係が図6に示すように「友達」であって、ユーザBの音像40の定位位置が、図8に示すようにエリアP4に含まれる場合、信号処理制御部203は、パーソナルスペースに侵入していないと判断する(S126/NO)。この場合、続くステップS132において、信号処理制御部203は、ユーザBの音像定位位置(受話音声の音像定位位置)を、近接化するよう(親密化対応するよう)オーディオ信号処理部275を制御する。例えば、信号処理制御部203は、ユーザBの音像40の定位位置を、図8に示すように、エリアP2に定位させることで、ユーザAにとって快適な通話状態を提供することができる。
以上、第3の動作処理について詳細に説明した。これによれば、本実施形態による携帯電話端末2は、通話相手であるユーザBの音像定位位置を、ユーザAとユーザBとの関係に応じて制御することができる。
なお、ユーザAとユーザBとの関係は、ユーザAおよびユーザBにとって必ずしも同じとは限らないので、通話相手の音像定位位置の制御は、ユーザA側で、ユーザAが入力した関係情報について行われる。すなわち、例えばユーザAの携帯電話端末2Aでは、ユーザBの音像定位位置がエリアP1に含まれるよう制御されている場合でも、ユーザBの携帯電話端末2Bでは、ユーザAの音像定位位置がP2に含まれるよう制御される場合がある。これにより、本実施形態による携帯電話端末2は、互いに嫌悪感を抱かせることなく、通話状態を各ユーザのニーズに応じた状態に改善することができる。また、携帯電話端末2は、記憶部29に記憶される関係情報テーブル291が他人に漏洩しないようセキュリティをかけてもよい。
また、以上説明した第3の動作処理では、ユーザAとユーザBとの関係に基づいて、ユーザB(通話相手)の音像定位位置を制御しているが、本開示による音像定位位置の制御はこれに限定されない。例えば、信号処理制御部203は、ユーザAの状態(良好/不調、機嫌が良い/悪い)に応じて音像定位位置を制御してもよい。具体的には、ユーザAの状態が良好(機嫌が良い)場合程、ユーザAの近くに音像定位し、ユーザAの状態が不調(機嫌が悪い)場合程、ユーザAから遠くに音像定位する。なお、このようなユーザAの状態は、例えば認識部201により、カメラモジュール28でユーザAの顔をリアルタイムで撮影した撮影画像に基づいて認識してもよいし、時間帯(深夜・早朝は一般的に不快に感じる)に基づいて認識してもよい。
また、上述した第3の動作処理では、ユーザAとユーザBとの関係が予めユーザAにより登録されている場合を例に説明したが、本開示による音像定位位置の制御はこれに限定されない。例えば、認識部201は、リアルタイムでユーザAとユーザBとの関係を認識してもよい。具体的には、認識部201は、例えばカメラモジュール28でユーザAの顔をリアルタイムで撮影した撮影画像に基づいてユーザBとの関係を認識してもよいし、マイク23で集音したユーザAの音声情報を解析することによりユーザBとの関係を認識してもよい。
また、上述した第3の動作処理では、最初は特に音像定位されず、ユーザBとの関係やユーザAの状態(気分)に応じて、音像定位位置を制御する場合について説明したが、本開示による音声定位位置の制御はこれに限定されない。例えば、信号処理制御部203は、通話相手に応じて予め設定した位置(例えば3段階。パーソナルスペースの概念を考慮してもよい)に音像定位させ、さらにユーザAの通話時の状態(気分)や通話の内容に応じて、音像定位位置をリアルタイムで制御してもよい。
また、信号処理制御部203は、デフォルトは一番遠くに音像を定位させておいて、通話相手との関係や、ユーザAの状態に応じて、通話開始後、徐々に近づけていくよう制御してもよい。
[2−2.第2の実施形態]
以上説明した第1の実施形態では、信号処理装置の一例として携帯電話端末2を用いたが、本開示による信号処理装置(信号処理システム)は、携帯電話端末2のような通信端末に限定されない。
例えば、本開示による信号処理システムは、屋外や屋内の至る所に、複数のマイク・スピーカ・カメラ等が配置されることにより、ユーザが通信端末を所持していなくても遠隔地に居る相手ユーザと通話ができる新たなコミュニケーションシステムにも適用され得る。以下、本開示がこのような新たなコミュニケーションシステムに適用される場合の第2の実施形態について、図9〜図10を参照して具体的に説明する。
(2−2−1.システム概要)
図9は、第2の実施形態による信号処理システムの概要について説明するための図である。図9に示すように、本実施形態による信号処理システムでは、例えば屋内の壁、床、天井に複数のマイク23a〜23N、スピーカ24a〜24N、カメラモジュール(以下、カメラと称す)28a〜28Nが配置されている。なお、本実施形態による信号処理システムでは、図9に示すマイク、スピーカ、カメラの他、さらに人感センサ等の各種センサが配置されていてもよい。
また、複数のマイク23a〜23N、スピーカ24a〜24N、カメラ28a〜28Nは、信号処理装置3と接続し、信号処理装置3により情報の入出力が行われる。
壁や天井に配置された複数のマイク23a〜23Nは、ユーザAが発する音声を集音し、集音した音声情報を信号処理装置3に出力する。信号処理装置3は、マイク23a〜23Nから出力されたユーザAの音声に対して所定の信号処理(例えば、符号化処理)を行った上で、通話相手のユーザBが居るエリアに配置されているマイク・スピーカと情報の入出力を行う信号処理装置(不図示)に送信する。
そして、ユーザBが居るエリアの信号処理装置は、信号処理装置3から送信されたユーザAの音声に対し、所定の信号処理(例えば、復号化処理)を行った上で、ユーザBが居るエリアに配置された複数のスピーカから再生する。さらに、ユーザBが居るエリアの信号処理装置は、ユーザBが居るエリアに配置された複数のマイクにより集音されたユーザBの音声に対し、所定の信号処理(例えば、符号化処理)を行った上で、ユーザAが居るエリアの信号処理装置3に送信する。
そして、ユーザAが居るエリアの信号処理装置3は、受信したユーザBの音声に対し、所定の信号処理(例えば、復号化処理)を行った上で、ユーザAが居るエリアに配置された複数のスピーカ24a〜24Nから再生する。
これにより、ユーザAは、携帯電話端末2のような通信端末を所持していなくても、遠隔地に居る相手ユーザBと通話ができる。なお、上述したシステムでは、ユーザB側もユーザAが居るエリアと同様に複数のマイク・スピーカが配置されて手ぶらで相手ユーザと通話ができる新たなコミュニケーションシステムが構築されている場合について説明したが、本実施形態はこれに限定されない。例えば、ユーザB側の信号処理装置は、第1の実施形態で説明した携帯電話端末2のような通信端末であってもよい。
また、本実施形態による信号処理システムでは、図9に示すように、壁や天井に複数のカメラ28a〜28Nも配置されている。これにより、信号処理装置3は、ユーザAの位置を把握し、把握したユーザAの位置情報を、ユーザBの音像41を定位する制御を行う際に利用したりする。
以上、本実施形態による信号処理システムの概要について説明した。続いて、図10を参照して本実施形態による信号処理装置3の構成について具体的に説明する。
(2−2−2.構成)
図10は、第2の実施形態による信号処理装置3の構成を示すブロック図である。図10に示すように、本実施形態による信号処理装置3は、制御部20’、信号処理部27、記憶部29、および通信I/F(インタフェース)30を有する。
また、マイク23a〜23N、スピーカ24a〜24N、アンプ・ADC部25、DAC・アンプ部26、カメラ28a〜28Nは、図10に示す例では、信号処理装置3と別に構成されているが、信号処理装置3に含まれていてもよい。
また、マイク23a〜23N、アンプ・ADC部25、スピーカ24a〜24N、DAC・アンプ部26、信号処理部27、カメラ28a〜28N、記憶部29、および通信I/F30は、図2を参照して説明した第1の実施形態による携帯電話端末2の各構成と同様であるので、ここでの説明は省略する。
(制御部)
制御部20’は、信号処理装置3の各構成を制御する機能を有する。具体的には、本実施形態による制御部20’は、図10に示すように、状態・関係認識部202、信号処理制御部203’、コマンド認識部204、および同定部205として機能する。
・状態・関係認識部
状態・関係認識部202は、図2を参照して説明した認識部201と同様に、ユーザAの状態、通話相手であるユーザBの状態、またはユーザAとユーザBとの関係を、撮影画像、音声解析、または関係情報テーブル291等に基づいて認識する。
・信号処理制御部
信号処理制御部203’は、状態・関係認識部202による認識結果に応じて、音声情報に対して所定の信号処理を行うよう信号処理部27を制御する。
・コマンド認識部
コマンド認識部204は、複数のマイク23a〜23Nにより収音されたユーザの音声を解析し、コマンドを認識する。例えば、コマンド認識部204は、「Bさんと話したい」というユーザAの音声を形態素解析し、発呼要求コマンドを認識する。
・同定部
同定部205は、コマンド認識部204により認識されたコマンドに応じて、ユーザAがコンタクトを要求する対象に対応する音声や画像を取得するための接続先を同定(決定)する機能を有する。具体的には、例えば同定部205は、通信I/F30から管理サーバ(不図示)に問い合わせを行い、コンタクトを要求する対象(例えばユーザB)に対応する接続先(例えばユーザBが居るエリアの信号処理装置のIPアドレス等)を取得する。
以上、第2の実施形態による信号処理装置3について説明した。このような構成により、本実施形態による信号処理装置3も、第1の実施形態で説明したユーザの状況に応じた通話状態の改善を実施することができる。
例えば、信号処理装置3は、状態・関係認識部202により通話相手(ユーザB)が耳が遠い状態であると認識した際、送話音声(ユーザAの音声情報)の音量を上げ、また、受話音声(ユーザBの音声情報)の音量を下げることで、通話状態を改善できる。
また、信号処理装置3は、状態・関係認識部202により通話相手(ユーザB)が聞こえ難い状態であると認識した際、送話音声(ユーザAの音声情報)の音量を上げ、また、送話音声から背景雑音を除去ることで、通話状態を改善できる。
また、信号処理装置3は、状態・関係認識部202により認識されたユーザAとユーザBとの関係に基づいて、適切な距離に通話相手の音像を定位させるよう受話音声を信号処理して、複数のスピーカ24a〜24Nから再生することができる。また、本実施形態では、ユーザAの周囲に配置されている複数のスピーカ24a〜24Nを利用することで、パーソナルスペースをも考慮した通話相手の音像定位制御を、より正確に行うことができる。なお、マイク、スピーカ、カメラについて、同一の個数(台数)を示す付番Nを用いたが、異なる個数(台数)であってもよいのはもちろんである。
<3.まとめ>
上述したように、本実施形態による信号処理装置(携帯電話端末2、信号処理装置3)では、ユーザの状況に応じて通話状態を変更することができる。
より具体的には、本実施形態による携帯電話端末2は、ユーザAとユーザBが通話している際に、ユーザA/ユーザBの状態、またはユーザAとユーザBとの関係に応じて、通話状態を自動的に変更(改善)することができる。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本技術はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
例えば、本開示による信号処理装置は、ユーザAとユーザBとの関係が不調である場合、通話相手(ユーザB)の音声情報を、ユーザAの好みのキャラクター等の声色に変声する信号処理を行って再生することで、ユーザAの嫌悪感を低減させることができる。
また、本開示による信号処理装置は、ユーザ操作に応じて通話状態を変更することも可能である。例えば、信号処理制御部203、203’により自動的に通話状態が変更された場合でも、ユーザの任意で(手動)で、通話状態を元に戻したり、さらに変更することが可能である。
なお、本技術は以下のような構成も取ることができる。
(1)
第1ユーザの状態、第2ユーザの状態、および第1ユーザと第2ユーザの関係のうち、少なくとも1つを認識する認識部と、
前記第1ユーザが発した音声に対応する音声情報、または遠隔より伝送された前記第2ユーザが発した音声に対応する音声情報に対して信号処理を行う信号処理部と、
前記認識部による認識結果に応じて、前記第1ユーザが発した音声に対応する音声情報、および遠隔より伝送された前記第2ユーザが発した音声に対応する音声情報のうち、少なくともいずれか一方に対して信号処理を行うよう前記信号処理部を制御する制御部と、
を備える、信号処理装置。
(2)
前記認識部は、前記第1ユーザの状態、または前記第2ユーザの状態を、前記第1ユーザが発した音声に対応する音声情報、または前記第2ユーザが発した音声に対応する音声情報を分析することにより認識する、前記(1)に記載の信号処理装置。
(3)
前記認識部は、前記第1ユーザと前記第2ユーザの関係を、当該第1ユーザにより入力された第2ユーザに対する関係情報に基づいて認識する、前記(1)または(2)に記載の信号処理装置。
(4)
前記認識部は、前記第1ユーザまたは前記第2ユーザの顔を撮影した顔画像に基づいて、撮影されたユーザの状態、または当該ユーザと相手ユーザとの関係を認識する、前記(1)〜(3)のいずれか1項に記載の信号処理装置。
(5)
前記制御部は、前記認識部による認識結果に応じて、音声情報の音量制御、音声情報の背景雑音除去制御、または音像定位位置制御を行うよう前記信号処理部を制御する、前記(1)〜(4)のいずれか1項に記載の信号処理装置。
(6)
前記認識部は、前記第1ユーザまたは前記第2ユーザが発した音声に対応する音声情報を分析し、当該音声情報の音量が所定値を上回る場合、当該音声を発したユーザの聴力が低い状態であると認識する、前記(1)〜(5)のいずれか1項に記載の信号処理装置。
(7)
前記認識部は、前記第1ユーザまたは前記第2ユーザの年齢が所定値を上回る場合、ユーザの聴力が低い状態であると認識する、前記(1)〜(6)のいずれか1項に記載の信号処理装置。
(8)
前記認識部は、前記第1ユーザまたは前記第2ユーザが発した音声に対応する音声情報を分析し、当該音声情報に聞き返しの表現が含まれている場合、当該音声を発したユーザの聴力が低い状態であると認識する、前記(1)〜(7)のいずれか1項に記載の信号処理装置。
(9)
前記制御部は、前記認識部より聴力が低い状態であると認識されたユーザが発した音声に対応する音声情報の音量を所定値より下げ、相手側ユーザが発した音声に対応する音声情報の音量を所定値以上に上げるよう前記信号処理部を制御する、前記(1)〜(8)のいずれか1項に記載の信号処理装置。
(10)
前記制御部は、前記認識部より聴力が低い状態であると認識されたユーザに伝送される相手側ユーザが発した音声に対応する音声情報の背景雑音を除去するよう前記信号処理部を制御する、前記(1)〜(9)のいずれか1項に記載の信号処理装置。
(11)
前記制御部は、前記第1ユーザの状態または前記第1ユーザと前記第2ユーザとの関係が良好または親密である程、前記第2ユーザが発した音声の音像定位位置が前記第1ユーザの近くになるよう前記信号処理部を制御する、前記(1)〜(10)のいずれか1項に記載の信号処理装置。
(12)
前記制御部は、前記第1ユーザと前記第2ユーザとの関係に応じて予め設定される音像定位位置に、前記第2ユーザが発した音声の音像を定位させるよう前記信号処理部を制御する、前記(1)〜(11)のいずれか1項に記載の信号処理装置。
(13)
前記予め設定される音像定位位置は、前記第1ユーザのパーソナルスペースを考慮して設定される、前記(12)に記載の信号処理装置。
(14)
前記制御部は、通話開始時には前記第2ユーザが発した音声の音像が所定距離より遠くに定位するよう前記信号処理部を制御し、その後、前記第1ユーザの状態または通話内容が良好である程、前記第2ユーザが発した音声の音像を前記第1ユーザの近くに定位するよう前記信号処理部を制御する、前記(1)〜(13)のいずれか1項に記載の信号処理装置。
(15)
前記制御部は、ユーザ指示に応じて、前記信号処理部による音声情報の信号処理を制御する、前記(1)〜(14)のいずれか1項に記載の信号処理装置。
(16)
前記信号処理装置は、携帯電話、スマートフォン、タブレット端末、PHS、または固定電話である、前記(1)〜(15)のいずれか1項に記載の信号処理装置。
(17)
前記制御部は、前記第1ユーザの周辺に配置される複数のマイクロフォンにより集音された前記第1ユーザが発した音声に対応する音声情報を、遠隔に伝送し、また、遠隔から伝送された前記第2ユーザが発した音声に対応する音声情報を、前記第1ユーザの周辺に配置される複数のスピーカから出力するよう制御する、前記(1)〜(15)のいずれか1項に記載の信号処理装置。
(18)
コンピュータを、
第1ユーザの状態、第2ユーザの状態、および第1ユーザと第2ユーザの関係のうち、少なくとも1つを認識する認識部と、
前記第1ユーザが発した音声に対応する音声情報、または遠隔より伝送された前記第2ユーザが発した音声に対応する音声情報に対して信号処理を行う信号処理部と、
前記認識部による認識結果に応じて、前記第1ユーザが発した音声に対応する音声情報、および遠隔より伝送された前記第2ユーザが発した音声に対応する音声情報のうち、少なくともいずれか一方に対して信号処理を行うよう前記信号処理部を制御する制御部、
として機能させるための、プログラム。
2 携帯電話端末
20、20’ 制御部
201 認識部
202 状態・関係認識部
203、203’ 信号処理制御部
204 コマンド認識部
205 同定部
21 表示部
22 操作入力部
23、23’、23a〜23N マイクロフォン(マイク)
24、24’、24a〜24N スピーカ
25 アンプ・ADC部
26 DAC・アンプ部
27 信号処理部
271 送話/受話音量処理部
273 ノイズ除去処理部
275 オーディオ信号処理部
28、28a〜28N カメラモジュール
29 記憶部
30 通信I/F

Claims (18)

  1. 第1ユーザの状態、第2ユーザの状態、および第1ユーザと第2ユーザの関係のうち、少なくとも1つを認識する認識部と、
    前記第1ユーザが発した音声に対応する音声情報、または遠隔より伝送された前記第2ユーザが発した音声に対応する音声情報に対して信号処理を行う信号処理部と、
    前記認識部による認識結果に応じて、前記第1ユーザが発した音声に対応する音声情報、および遠隔より伝送された前記第2ユーザが発した音声に対応する音声情報のうち、少なくともいずれか一方に対して信号処理を行うよう前記信号処理部を制御する制御部と、
    を備える、信号処理装置。
  2. 前記認識部は、前記第1ユーザの状態、または前記第2ユーザの状態を、前記第1ユーザが発した音声に対応する音声情報、または前記第2ユーザが発した音声に対応する音声情報を分析することにより認識する、請求項1に記載の信号処理装置。
  3. 前記認識部は、前記第1ユーザと前記第2ユーザの関係を、当該第1ユーザにより入力された第2ユーザに対する関係情報に基づいて認識する、請求項1に記載の信号処理装置。
  4. 前記認識部は、前記第1ユーザまたは前記第2ユーザの顔を撮影した顔画像に基づいて、撮影されたユーザの状態、または当該ユーザと相手ユーザとの関係を認識する、請求項1に記載の信号処理装置。
  5. 前記制御部は、前記認識部による認識結果に応じて、音声情報の音量制御、音声情報の背景雑音除去制御、または音像定位位置制御を行うよう前記信号処理部を制御する、請求項1に記載の信号処理装置。
  6. 前記認識部は、前記第1ユーザまたは前記第2ユーザが発した音声に対応する音声情報を分析し、当該音声情報の音量が所定値を上回る場合、当該音声を発したユーザの聴力が低い状態であると認識する、請求項1に記載の信号処理装置。
  7. 前記認識部は、前記第1ユーザまたは前記第2ユーザの年齢が所定値を上回る場合、ユーザの聴力が低い状態であると認識する、請求項1に記載の信号処理装置。
  8. 前記認識部は、前記第1ユーザまたは前記第2ユーザが発した音声に対応する音声情報を分析し、当該音声情報に聞き返しの表現が含まれている場合、当該音声を発したユーザの聴力が低い状態であると認識する、請求項1に記載の信号処理装置。
  9. 前記制御部は、前記認識部より聴力が低い状態であると認識されたユーザが発した音声に対応する音声情報の音量を所定値より下げ、相手側ユーザが発した音声に対応する音声情報の音量を所定値以上に上げるよう前記信号処理部を制御する、請求項1に記載の信号処理装置。
  10. 前記制御部は、前記認識部より聴力が低い状態であると認識されたユーザに伝送される相手側ユーザが発した音声に対応する音声情報の背景雑音を除去するよう前記信号処理部を制御する、請求項1に記載の信号処理装置。
  11. 前記制御部は、前記第1ユーザの状態または前記第1ユーザと前記第2ユーザとの関係が良好または親密である程、前記第2ユーザが発した音声の音像定位位置が前記第1ユーザの近くになるよう前記信号処理部を制御する、請求項1に記載の信号処理装置。
  12. 前記制御部は、前記第1ユーザと前記第2ユーザとの関係に応じて予め設定される音像定位位置に、前記第2ユーザが発した音声の音像を定位させるよう前記信号処理部を制御する、請求項1に記載の信号処理装置。
  13. 前記予め設定される音像定位位置は、前記第1ユーザのパーソナルスペースを考慮して設定される、請求項12に記載の信号処理装置。
  14. 前記制御部は、通話開始時には前記第2ユーザが発した音声の音像が所定距離より遠くに定位するよう前記信号処理部を制御し、その後、前記第1ユーザの状態または通話内容が良好である程、前記第2ユーザが発した音声の音像を前記第1ユーザの近くに定位するよう前記信号処理部を制御する、請求項1に記載の信号処理装置。
  15. 前記制御部は、ユーザ指示に応じて、前記信号処理部による音声情報の信号処理を制御する、請求項1に記載の信号処理装置。
  16. 前記信号処理装置は、携帯電話、スマートフォン、タブレット端末、PHS、または固定電話である、請求項1に記載の信号処理装置。
  17. 前記制御部は、前記第1ユーザの周辺に配置される複数のマイクロフォンにより集音された前記第1ユーザが発した音声に対応する音声情報を、遠隔に伝送し、また、遠隔から伝送された前記第2ユーザが発した音声に対応する音声情報を、前記第1ユーザの周辺に配置される複数のスピーカから出力するよう制御する、請求項1に記載の信号処理装置。
  18. コンピュータを、
    第1ユーザの状態、第2ユーザの状態、および第1ユーザと第2ユーザの関係のうち、少なくとも1つを認識する認識部と、
    前記第1ユーザが発した音声に対応する音声情報、または遠隔より伝送された前記第2ユーザが発した音声に対応する音声情報に対して信号処理を行う信号処理部と、
    前記認識部による認識結果に応じて、前記第1ユーザが発した音声に対応する音声情報、および遠隔より伝送された前記第2ユーザが発した音声に対応する音声情報のうち、少なくともいずれか一方に対して信号処理を行うよう前記信号処理部を制御する制御部、
    として機能させるための、プログラム。

JP2012206849A 2012-09-20 2012-09-20 信号処理装置およびプログラム Pending JP2014064093A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012206849A JP2014064093A (ja) 2012-09-20 2012-09-20 信号処理装置およびプログラム
US14/022,786 US9253303B2 (en) 2012-09-20 2013-09-10 Signal processing apparatus and storage medium
CN201310413000.XA CN103685673A (zh) 2012-09-20 2013-09-12 信号处理设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012206849A JP2014064093A (ja) 2012-09-20 2012-09-20 信号処理装置およびプログラム

Publications (1)

Publication Number Publication Date
JP2014064093A true JP2014064093A (ja) 2014-04-10

Family

ID=50274466

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012206849A Pending JP2014064093A (ja) 2012-09-20 2012-09-20 信号処理装置およびプログラム

Country Status (3)

Country Link
US (1) US9253303B2 (ja)
JP (1) JP2014064093A (ja)
CN (1) CN103685673A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016152121A1 (ja) * 2015-03-23 2016-09-29 日本電気株式会社 電話機、電話システム、電話機の音量設定方法、及びプログラムが格納された非一時的なコンピュータ可読媒体
JP2020086027A (ja) * 2018-11-20 2020-06-04 東京瓦斯株式会社 音声再生システムおよびプログラム
JP6764214B1 (ja) * 2020-07-21 2020-09-30 アースアイズ株式会社 混雑情報報知システム
JP6892173B1 (ja) * 2020-10-19 2021-06-23 シンメトリー・ディメンションズ・インク コミュニケーションシステム、管理サーバ、およびそれらの制御方法

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2876847A1 (en) * 2013-11-21 2015-05-27 Nokia Corporation Establishment of an association between an object and a mood media item
CN103905650A (zh) * 2014-04-28 2014-07-02 深圳市中兴移动通信有限公司 移动终端及基于语音识别调节通话音量的方法
JP2015219768A (ja) * 2014-05-19 2015-12-07 ソニー株式会社 情報処理システム、記憶媒体及び情報処理方法
CN104299622A (zh) * 2014-09-23 2015-01-21 深圳市金立通信设备有限公司 一种音频处理方法
CN104284018A (zh) * 2014-09-23 2015-01-14 深圳市金立通信设备有限公司 一种终端
US9609436B2 (en) * 2015-05-22 2017-03-28 Microsoft Technology Licensing, Llc Systems and methods for audio creation and delivery
CN105282345B (zh) * 2015-11-23 2019-03-15 小米科技有限责任公司 通话音量的调节方法和装置
US9900735B2 (en) * 2015-12-18 2018-02-20 Federal Signal Corporation Communication systems
US9591427B1 (en) * 2016-02-20 2017-03-07 Philip Scott Lyren Capturing audio impulse responses of a person with a smartphone
CN107454244A (zh) * 2016-05-31 2017-12-08 宇龙计算机通信科技(深圳)有限公司 语音处理方法、语音处理装置和设备
CN108235204A (zh) * 2016-12-12 2018-06-29 塞舌尔商元鼎音讯股份有限公司 取得听力数据的电子装置及听力数据取得的方法
US10372234B2 (en) * 2017-05-09 2019-08-06 Lenovo (Singapore) Pte Ltd Calculating a social zone distance
CN107580113B (zh) * 2017-08-18 2019-09-24 Oppo广东移动通信有限公司 提示方法、装置、存储介质及终端
EP3664291A4 (en) 2017-08-18 2020-08-19 Guangdong Oppo Mobile Telecommunications Corp., Ltd. METHOD AND DEVICE FOR AUDIO SIGNAL ADAPTATION, STORAGE MEDIUM AND TERMINAL DEVICE
CN109510907B (zh) * 2017-09-14 2021-04-30 中兴通讯股份有限公司 铃音设置方法及装置
CN107919138B (zh) * 2017-11-30 2021-01-08 维沃移动通信有限公司 一种语音中的情绪处理方法及移动终端

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6766176B1 (en) * 1996-07-23 2004-07-20 Qualcomm Incorporated Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone
JP5114981B2 (ja) * 2007-03-15 2013-01-09 沖電気工業株式会社 音像定位処理装置、方法及びプログラム
US8345848B1 (en) * 2007-08-30 2013-01-01 At&T Intellectual Property I, L.P. Multi-channel telephony
US8270593B2 (en) * 2007-10-01 2012-09-18 Cisco Technology, Inc. Call routing using voice signature and hearing characteristics
JP2010135978A (ja) 2008-12-03 2010-06-17 Hitachi Ltd 通話装置および通話装置の呼毎の受話音量制御方法
JP2010141806A (ja) 2008-12-15 2010-06-24 Hitachi Ltd 通話中に送話音量を調整できる通話端末装置および通話端末装置における送話音量増大方法
US20110044474A1 (en) * 2009-08-19 2011-02-24 Avaya Inc. System and Method for Adjusting an Audio Signal Volume Level Based on Whom is Speaking
US8131848B1 (en) * 2009-09-29 2012-03-06 Jason Adam Denise Image analysis and communication device control technology
CN103282960B (zh) * 2011-01-04 2016-01-06 富士通株式会社 声音控制装置、声音控制方法以及声音控制程序

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016152121A1 (ja) * 2015-03-23 2016-09-29 日本電気株式会社 電話機、電話システム、電話機の音量設定方法、及びプログラムが格納された非一時的なコンピュータ可読媒体
JP2016178596A (ja) * 2015-03-23 2016-10-06 日本電気株式会社 電話機、電話システム、電話機の音量設定方法、及びプログラム
JP2020086027A (ja) * 2018-11-20 2020-06-04 東京瓦斯株式会社 音声再生システムおよびプログラム
JP7284570B2 (ja) 2018-11-20 2023-05-31 東京瓦斯株式会社 音声再生システムおよびプログラム
JP6764214B1 (ja) * 2020-07-21 2020-09-30 アースアイズ株式会社 混雑情報報知システム
JP2022020891A (ja) * 2020-07-21 2022-02-02 アースアイズ株式会社 混雑情報報知システム
JP6892173B1 (ja) * 2020-10-19 2021-06-23 シンメトリー・ディメンションズ・インク コミュニケーションシステム、管理サーバ、およびそれらの制御方法
JP2022066779A (ja) * 2020-10-19 2022-05-02 シンメトリー・ディメンションズ・インク コミュニケーションシステム、管理サーバ、およびそれらの制御方法

Also Published As

Publication number Publication date
US20140079212A1 (en) 2014-03-20
US9253303B2 (en) 2016-02-02
CN103685673A (zh) 2014-03-26

Similar Documents

Publication Publication Date Title
JP2014064093A (ja) 信号処理装置およびプログラム
CN110138937B (zh) 一种通话方法、设备及系统
US10499136B2 (en) Providing isolation from distractions
CN105814913B (zh) 对名字敏感的收听装置
US9071900B2 (en) Multi-channel recording
US12047760B2 (en) Bluetooth communication method and apparatus
US20220369034A1 (en) Method and system for switching wireless audio connections during a call
EP3038255B1 (en) An intelligent volume control interface
WO2011050682A1 (zh) 一种实现可视电话的方法和装置
US20160088403A1 (en) Hearing assistive device and system
KR101450014B1 (ko) 블루투스를 이용한 스마트 사용자 보조 장치
CN105407368A (zh) 多媒体播放方法、装置及系统
KR20230009487A (ko) 능동 잡음 제거 방법 및 장치
WO2017113695A1 (zh) 一种智能电视音视频通信的方法、终端设备及智能电视
CN114371824A (zh) 一种音频处理方法、系统及相关装置
US12080278B2 (en) Bone conduction transducers for privacy
US20220368554A1 (en) Method and system for processing remote active speech during a call
CN115243134A (zh) 信号处理方法、装置、智能头戴设备及介质
CN109618062B (zh) 语音交互方法、装置、设备以及计算机可读存储介质
TW201530537A (zh) 電話語音輸出之方法及耳機
US20180070184A1 (en) Sound collection equipment having a function of answering incoming calls and control method of sound collection
WO2024152690A1 (zh) 声道模式切换方法、设备及存储介质
JP7390582B2 (ja) 通話システム、制御方法及びプログラム
US20230209239A1 (en) Wireless headphone system with standalone microphone functionality
CN116996725A (zh) 音画同步方法及装置、电子设备、存储介质