JP2006229356A - 音声会議用の通信制御装置,通信制御方法,プログラム及び記録媒体 - Google Patents
音声会議用の通信制御装置,通信制御方法,プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2006229356A JP2006229356A JP2005038246A JP2005038246A JP2006229356A JP 2006229356 A JP2006229356 A JP 2006229356A JP 2005038246 A JP2005038246 A JP 2005038246A JP 2005038246 A JP2005038246 A JP 2005038246A JP 2006229356 A JP2006229356 A JP 2006229356A
- Authority
- JP
- Japan
- Prior art keywords
- communication
- voice
- meeting
- identification information
- conference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
【課題】 音声会議において、会議の相手は同じであるが相手の場所が会議のたびに一定していない場合にも、容易に相手の場所との通信を開始して会議を行えるようにする。
【解決手段】 マイクロフォンからの音声信号を音声認識し(S2,S5)、認識した音声に少なくともいずれかの会議出席者の名称が含まれているか否かを、会議に使用される複数の場所のうち会議出席者が使用する予定の場所とその会議出席者の名称とを対応させたスケジュールデータを参照して判別する(S6)。含まれている場合には、その含まれている名称の会議出席者に対応する場所をスケジュールデータから確認する(S9)とともに、確認した場所の通信手段の識別情報を、これらの複数の場所における通信手段の識別情報を記憶した記憶手段から取得する(S10)。そして、通信回線を介して通信を行うための通信手段を制御して、その取得した識別情報宛ての通信を開始させる(S11)。
【選択図】 図7
Description
DSP52は、A/D変換器511〜516によりディジタル信号に変換された6本のマイクロフォンMC1〜MC6からの音声信号に基づいて、一つのマイクロフォンの音声信号を選択する処理(マイクロフォン選択処理)等の各種の信号処理を行う。DSP52の内部処理については後述する。
無指向性のマイクロフォンを用いた場合には、マイクロフォン周辺の全ての音を集音するので、発言者の音声と周辺ノイズとのS/Nが混同してあまり良い音が集音できない。これを避けるために、全方位音声入力装置2では、指向性マイクロフォンで集音することにより、周辺のノイズとのS/Nを改善している。
DSP52で行われる主な処理は、マイクロフォン(以下、単にマイクと称する場合もある)の選択・切替え処理である。
すなわち、各マイクロフォンからの音声に基づいて、一つのマイクロフォンを特定し、特定したマイクロフォンからの音声を選択・出力する処理を行う。その際、全方位音声入力部3を使用する複数の会議参加者が同時に話をすると、音声が入り交じり相手方にとって聞きにくくなるため、選択されたマイクからの音声信号のみが出力される。
(a)マイク信号の帯域分離とピークホールド処理
(b)発言の開始、終了の判定処理
(c)発言者方向マイクの検出処理
(d)マイク信号の選択切替え処理
図4に示すように、DSP52は、各マイク信号に対してBPF処理を行い、音圧レベルデータを生成するBPF5211〜5216からなるBPFブロック521と、BPF処理された各マイクの音圧レベルデータに対してPH処理を行い、後述するピーク値を生成するPH5221〜5226からなるPHブロック522と、各マイクのピーク値に対して、後述する発言の開始判定やマイクの切替え処理などの各処理を実行する判定処理部523と、を含んで構成される。
(a)マイク信号の帯域分離とピ−クホールド処理
本処理は、図4に示すBPFブロック521及びPHブロック522によって行われる。
BPFブロック521の各BPF処理は、後述する発言の開始、終了判定等に必要な所定の帯域通過特性(例えば、100〜600Hz)に基づいて行われる。
PH処理は、BPF処理された音圧レベルデータ(マイク信号)の最大値を保持(ピークホールド)する処理を行った後のデータであるピーク値を生成する。
以降の処理、すなわち、上記(b)〜(d)の処理については、各マイク信号に基づいて算出されたピーク値を入力する判定処理部523により実行される。
発言の開始判定、終了判定処理は、各マイク毎に独立に、例えば、所定の閾値と音圧レベルを比較することにより、発言の開始/終了を判定する。また、定常的な騒音レベルを逐次測定し、上記所定の閾値を可変とするように構成してもよい。
DSP52は、例えば、マイクロフォンMC1の発言の開始を判定すると、マイクロフォンMC1に設定された出力ゲインを増加させる。逆に、マイクロフォンMC1の発言の終了を判定すると、マイクロフォンMC1に設定された出力ゲインを減少させる。
本処理は、各マイクに対向するそれぞれの話者が同時に発言する場合に、音圧レベルの大きい一つのマイクを選択する処理である。すなわち、1人の話者が発言を開始する場合には、一つのマイクからの音圧レベルデータに基づいて、上述した処理を行えばよいが、複数の話者が同時に発言することもあり得るので、その場合に主たる話者に係るマイクを特定する。
なお、発言者方向のマイクの検出処理に必要な各マイクの音圧レベルデータは、図4に示すように、各マイクを通して入力する音圧レベルデータに対して、バンドパス・フィルタ(BPF)処理及びピークホールド(PH)処理を行うことにより得られるピーク値である。
本処理では、(c)発言者方向マイクの検出処理により選択されたマイクにDSP52の出力を切り替える処理を行う。
具体的には、各マイク毎に設定する出力ゲインを変化させることにより行う。例えば、図5に示すように、マイク信号の選択切替え処理は、6回路の乗算器と6入力の加算器により構成され、選択されたマイク信号が接続されている乗算器のチャンネルゲイン(CH Gain)を「1」に、その他の乗算器のチャンネルゲインを「0」とすることにより、加算器には〔選択されたマイク信号×1〕と〔他のマイク信号×0〕の処理結果が加算される。これにより、選択されたマイク信号(選択マイク信号)が後段のDSP53(図3)に送出される。
なお、この単位時間は、発話者が複数存在し、発話者が切り替わる場合等を考慮すると、発話者特定精度の観点から、パーソナルコンピュータ3のCPUの処理能力が許せば、極力短い時間が望ましい。
(1)声紋モデルの生成
音声データを単位時間分毎にスペクトル分析し、声紋の特徴を抽出することで、声紋モデルを作成する。すなわち、声紋モデルは、音声に含まれる様々な音の集まりを、時間、周波数および音の強さの三次元のパターンで表現したものである。
上記(1)の処理で生成した声紋モデルと、予め声紋レジスタ(パーソナルコンピュータ3内の記憶領域)に声紋認証対象者のIDとともに登録されている声紋モデルとを比較照合し、モデルの特徴量が近似する度合いに応じた照合スコアSCR(特徴量が近似するほど大きい)を算出する。そして、声紋レジスタ内の声紋モデルのうち、上記(1)の処理で生成した声紋モデルに最も近似する声紋モデルに対応するIDを特定する。
上記(2)の処理で算出した照合スコアSCRを所定の閾値THDと比較し、照合スコアSCRが閾値THDを越える場合には、上記(2)の処理で特定したIDを有効なものと判断する。
Claims (7)
- マイクロフォンからの音声信号を音声認識する音声認識手段と、
会議に使用される複数の場所における通信手段の識別情報を記憶した記憶手段と、
前記複数の場所のうち会議出席者が使用する予定の場所と該会議出席者の名称とを対応させたスケジュールデータを参照して、前記音声認識手段によって認識された音声に少なくともいずれかの会議出席者の名称が含まれているか否かを判別し、含まれている場合に、該含まれている名称の会議出席者に対応する場所を前記スケジュールデータから確認するとともに、該確認した場所の通信手段の識別情報を前記記憶手段から取得する処理手段と、
通信回線を介して通信を行うための通信手段を制御して、前記処理手段によって取得された識別情報宛ての通信を開始させる制御手段と
を備えたことを特徴とする音声会議用の通信制御装置。 - 請求項1に記載の音声会議用の通信制御装置において、
前記処理手段は、前記スケジュールデータを参照して、前記音声認識手段によって認識された音声に少なくともいずれかの前記場所の名称が含まれているか否かを判別し、含まれている場合に、該含まれている名称の場所の通信手段の識別情報を前記記憶手段から取得する処理をさらに行う
ことを特徴とする音声会議用の通信制御装置。 - 請求項1に記載の音声会議用の通信制御装置において、
前記マイクロフォンからの音声信号から声紋データを抽出し、該抽出した声紋データを、予め登録された声紋データと比較照合して発話者を特定する声紋認証手段
をさらに備え、
前記処理手段は、前記スケジュールデータを参照して、前記声紋認証手段によって特定された発話者が、当該通信制御装置が設置されている場所を使用する予定の会議出席者であるか否かを判別し、該場所を使用する予定の会議出席者でない場合には、前記記憶手段から前記識別情報を取得しないことを特徴とする音声会議用の通信制御装置。 - 請求項1に記載の音声会議用の通信制御装置において、
音声合成手段をさらに備え、
前記処理手段は、前記音声認識手段によって認識された音声に含まれている名称の会議出席者が前記スケジュールデータにおいて複数の場所に対応している場合に、場所を選択させる音声を前記音声合成手段で合成させて出力させ、その後前記音声認識手段によって認識された音声から選択結果を判別して、選択された場所の通信手段の識別情報を前記記憶手段から取得することを特徴とする音声会議用の通信制御装置。 - マイクロフォンからの音声信号を音声認識する第1のステップと、
会議に使用される複数の場所のうち会議出席者が使用する予定の場所と該会議出席者の名称とを対応させたスケジュールデータを参照して、前記音声認識手段によって認識された音声に少なくともいずれかの会議出席者の名称が含まれているか否かを判別し、含まれている場合に、該含まれている名称の会議出席者に対応する場所を前記スケジュールデータから確認するとともに、該確認した場所の通信手段の識別情報を、前記複数の場所における通信手段の識別情報を記憶した記憶手段から取得する第2のステップと、
通信回線を介して通信を行うための通信手段を制御して、前記第2のステップで取得した識別情報宛ての通信を開始させる第3のステップと
を有することを特徴とする音声会議用の通信制御方法。 - コンピュータに、
マイクロフォンからの音声信号を音声認識する第1の手順と、
会議に使用される複数の場所のうち会議出席者が使用する予定の場所と該会議出席者の名称とを対応させたスケジュールデータを参照して、前記音声認識手段によって認識された音声に少なくともいずれかの会議出席者の名称が含まれているか否かを判別し、含まれている場合に、該含まれている名称の会議出席者に対応する場所を前記スケジュールデータから確認するとともに、該確認した場所の通信手段の識別情報を、前記複数の場所における通信手段の識別情報を記憶した記憶手段から取得する第2の手順と、
通信回線を介して通信を行うための通信手段を制御して、前記第2の手順で取得した識別情報宛ての通信を開始させる第3の手順と
を実行させるためのプログラム。 - コンピュータに、
マイクロフォンからの音声信号を音声認識する第1の手順と、
会議に使用される複数の場所のうち会議出席者が使用する予定の場所と該会議出席者の名称とを対応させたスケジュールデータを参照して、前記音声認識手段によって認識された音声に少なくともいずれかの会議出席者の名称が含まれているか否かを判別し、含まれている場合に、該含まれている名称の会議出席者に対応する場所を前記スケジュールデータから確認するとともに、該確認した場所の通信手段の識別情報を、前記複数の場所における通信手段の識別情報を記憶した記憶手段から取得する第2の手順と、
通信回線を介して通信を行うための通信手段を制御して、前記第2の手順で取得した識別情報宛ての通信を開始させる第3の手順と
を実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005038246A JP4507905B2 (ja) | 2005-02-15 | 2005-02-15 | 音声会議用の通信制御装置,通信制御方法,プログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005038246A JP4507905B2 (ja) | 2005-02-15 | 2005-02-15 | 音声会議用の通信制御装置,通信制御方法,プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006229356A true JP2006229356A (ja) | 2006-08-31 |
JP4507905B2 JP4507905B2 (ja) | 2010-07-21 |
Family
ID=36990354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005038246A Expired - Fee Related JP4507905B2 (ja) | 2005-02-15 | 2005-02-15 | 音声会議用の通信制御装置,通信制御方法,プログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4507905B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013546282A (ja) * | 2010-12-03 | 2013-12-26 | クゥアルコム・インコーポレイテッド | 会議情報を提供するためのシステムおよび方法 |
US9143571B2 (en) | 2011-03-04 | 2015-09-22 | Qualcomm Incorporated | Method and apparatus for identifying mobile devices in similar sound environment |
JP7404568B1 (ja) | 2023-01-18 | 2023-12-25 | Kddi株式会社 | プログラム、情報処理装置、及び情報処理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0832949A (ja) * | 1994-07-20 | 1996-02-02 | Fujitsu Ltd | 多地点テレビ会議システム |
JP2004146999A (ja) * | 2002-10-23 | 2004-05-20 | Osaka Gas Co Ltd | 電話転送システムおよびプログラム |
JP2004185088A (ja) * | 2002-11-29 | 2004-07-02 | Fujitsu Ltd | マルチチャネル会話システム |
JP2006524962A (ja) * | 2003-04-16 | 2006-11-02 | モトローラ・インコーポレイテッド | 動的カスタマイズ可能なスマート電話帳のための方法および装置 |
-
2005
- 2005-02-15 JP JP2005038246A patent/JP4507905B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0832949A (ja) * | 1994-07-20 | 1996-02-02 | Fujitsu Ltd | 多地点テレビ会議システム |
JP2004146999A (ja) * | 2002-10-23 | 2004-05-20 | Osaka Gas Co Ltd | 電話転送システムおよびプログラム |
JP2004185088A (ja) * | 2002-11-29 | 2004-07-02 | Fujitsu Ltd | マルチチャネル会話システム |
JP2006524962A (ja) * | 2003-04-16 | 2006-11-02 | モトローラ・インコーポレイテッド | 動的カスタマイズ可能なスマート電話帳のための方法および装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013546282A (ja) * | 2010-12-03 | 2013-12-26 | クゥアルコム・インコーポレイテッド | 会議情報を提供するためのシステムおよび方法 |
US9143571B2 (en) | 2011-03-04 | 2015-09-22 | Qualcomm Incorporated | Method and apparatus for identifying mobile devices in similar sound environment |
JP7404568B1 (ja) | 2023-01-18 | 2023-12-25 | Kddi株式会社 | プログラム、情報処理装置、及び情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4507905B2 (ja) | 2010-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102223017B1 (ko) | 공유된 음성 작동 디바이스상의 호출 핸들링 | |
JP5134876B2 (ja) | 音声通信装置及び音声通信方法並びにプログラム | |
JP4085924B2 (ja) | 音声処理装置 | |
US5594784A (en) | Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls | |
JP5533854B2 (ja) | 音声認識処理システム、および音声認識処理方法 | |
US20070263823A1 (en) | Automatic participant placement in conferencing | |
JP2008061241A (ja) | 周囲情報を連続的に記録する方法及び通信システム | |
EP1170932B1 (en) | Audible identification of caller and callee for mobile communication device | |
US6563911B2 (en) | Speech enabled, automatic telephone dialer using names, including seamless interface with computer-based address book programs | |
US11516599B2 (en) | Personal hearing device, external acoustic processing device and associated computer program product | |
US6671354B2 (en) | Speech enabled, automatic telephone dialer using names, including seamless interface with computer-based address book programs, for telephones without private branch exchanges | |
JP4507905B2 (ja) | 音声会議用の通信制御装置,通信制御方法,プログラム及び記録媒体 | |
JP2019184809A (ja) | 音声認識装置、音声認識方法 | |
JP4640801B2 (ja) | 電話機 | |
JPH11112672A (ja) | 多地点通話装置 | |
JP2006201496A (ja) | フィルタリング装置 | |
CN111800700B (zh) | 环境中对象提示方法、装置、耳机设备及存储介质 | |
JP2005055667A (ja) | 音声処理装置 | |
JP2005055666A (ja) | 音声処理装置 | |
JP2008124597A (ja) | 音声会議システム | |
JP2006171226A (ja) | 音声処理装置 | |
JP2006154484A (ja) | 音声処理装置,音声処理方法,プログラム及び記録媒体 | |
JP2007259427A (ja) | 携帯端末装置 | |
JP3828185B2 (ja) | 会議支援システムおよび会議支援システムの制御方法 | |
JP6392161B2 (ja) | 音声会議システム、音声会議装置、その方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090915 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100413 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100426 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130514 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130514 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |