JP5216114B2 - 通話区間検出装置、その方法、及びプログラム - Google Patents
通話区間検出装置、その方法、及びプログラム Download PDFInfo
- Publication number
- JP5216114B2 JP5216114B2 JP2011044156A JP2011044156A JP5216114B2 JP 5216114 B2 JP5216114 B2 JP 5216114B2 JP 2011044156 A JP2011044156 A JP 2011044156A JP 2011044156 A JP2011044156 A JP 2011044156A JP 5216114 B2 JP5216114 B2 JP 5216114B2
- Authority
- JP
- Japan
- Prior art keywords
- call
- voice
- section
- time
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Telephone Function (AREA)
Description
本発明は、複数の通話端末装置間で行われる通話の通話区間を検出する発明であり、何れかの通話端末装置を基準とした送話側チャネルの音声信号と受話側チャネルの音声信号とが入力され、入力された複数チャネルの音声信号を用い、チャネル毎の音声区間と非音声区間とを検出し、検出した複数チャネルの音声区間と非音声区間との情報を用い、通話区間を検出する発明である。しかし、以下では説明の簡略化のため、一例として2個の通話端末装置間で行われる通話の通話区間を検出する形態について説明する。すなわち、以下では、何れかの通話端末装置を基準とした送話側チャネルの音声信号と受話側チャネルの音声信号とが入力され、入力された2チャネルの音声信号を用い、チャネル毎の音声区間と非音声区間とを検出し、検出した2チャネルの音声区間と非音声区間との情報を用い、通話区間を検出する実施形態について説明する。本発明は以下の各実施形態に限定されない。
まず、本発明の第1実施形態について説明する。
<通話区間推定装置の構成>
図1は、本形態の通話区間推定装置10の機能構成を例示したブロック図である。また、図2は、本形態の通話区間推定装置10を構成するためのハードウェア構成を例示したブロック図である。
図2に例示するように、この例の通話区間推定装置10を構成するためのハードウェアは、CPU(Central Processing Unit)10aと、入力部10bと、出力部10cと、RAM(Random Access Memory)10dと、ROM(Read Only Memory)10eと、補助記憶装置10fと、バス10gとを有している。この例のCPU10aは、制御部10aa、演算部10ab及びレジスタ10acを有している。また、入力部10bは、例えば、音声信号が入力される入力ポート、マイクロホン等であり、出力部10cは、音声信号その他のデータを出力する出力ポート等である。補助記憶装置10fは、例えば、ハードディスク、MO(Magneto-Optical disc)、半導体メモリ等であり、本形態の通話区間推定装置10の処理をCPU10aに実行させるための通話区間推定プログラムが格納されるプログラム領域10fa、音声信号その他のデータが格納されるデータ領域10fbを有している。また、RAM10dは、SRAM (Static Random Access Memory)、DRAM (Dynamic Random Access Memory)等であり、通話区間推定プログラムが格納されるプログラム領域10da、音声信号その他のデータが格納されるデータ領域10dbを有している。また、バス10gは、CPU10aと、入力部10bと、出力部10cと、RAM10dと、ROM10eと、補助記憶装置10fとを通信可能に接続している。
図1に例示するように、本形態の通話区間推定装置10は、音声入力部11と音声検出部12と通話区間推定部13と制御部14と記憶部15とを有する。また、通話区間推定部13は、通話区間開始判定部13aと通話区間終了判定部13bとデータ制御部13cとメモリ13dとを有する。
本形態の通話区間推定装置10は、複数の通話端末装置間で通話がなされる通話システムに適用される。図3は、このような通話システム100に通話区間推定装置10を適用した例を示したブロック図である。
図3の例の通話システム100は、2つの電話機101、102(「通話端末装置」の一例)と、音声出力装置120と、上述のように計算機(PC)上で構成される通話区間推定装置10と、計算機(PC)上で構成される音声認識装置131と、音声を録音する音声録音装置132とを有している。なお、音声出力装置120は、例えば、電話機102から出力されたアナログ音声信号をデジタル信号に変換して出力する音声アダプター等である。ここで、電話機102と音声出力装置120と通話区間推定装置10とは、それぞれ、電話機102を基準とした送話側チャネル51と受話側チャネル52とを持つ回線によって直列に接続される。なお、回線の例としては、例えば、USB(universal serial bus)ケーブルやLAN(Local Area Network)やWAN(Wide Area Network)がある。さらに、通話区間推定装置10は、当該両チャネルのデータを音声認識装置131と音声録音装置132に転送可能なようにこれらと接続されている。
なお、図3の構成はあくまで一例である。例えば、図3の変形例として、通話区間推定装置10や音声認識装置131を1台の計算機(PC)上で実現してもよいし、音声認識装置131や音声録音装置132が存在しない構成であってもよい。
次に、本形態の通話区間推定処理について説明する。
[処理の概要]
図4は、本形態の通話区間推定処理の概要を説明するためのフローチャートである。なお、図4の各ステップはそれぞれ並列に実行可能であるが、以下では、説明の便宜上、各ステップを順次説明していく。
まず、ステップS1(音声入力過程)では、何れかの通話端末装置を基準とした送話側チャネル51の音声信号と受話側チャネル52の音声信号とが通話区間推定装置10の音声入力部11に入力される(ステップS1)。図3の例では、電話機101,102間の通話音声である送話側チャネル51の音声信号s1(t)と受話側チャネル52の音声信号s2(t)とが音声入力部11に入力される。より具体的な例として、電話機102を用いるオペレータと電話機101を用いる顧客とが通話を行う場合には、送話側チャネル51のオペレータの音声信号s1(t)と、受話側チャネル52の顧客の音声信号s2(t)とが音声入力部11に入力される。
次に、本形態の処理の詳細を説明する。
前述のように、音声入力部11に入力された送話側チャネル51の音声信号s1(t)と受話側チャネル52の音声信号s2(t)とは、それぞれ音声検出部12に入力され、音声検出部12は、音声信号s1(t),s2(t)から切り出した各フレームが音声区間であるか非音声区間であるかをチャネル毎に判別する。以下では、送話側チャネル51の音声区間判別結果をx1(n)と表現し、受話側チャネル52の音声区間判別結果をx2(n)と表現する。ここで、nは切り出されたフレームの番号を示し、フレーム番号nのフレームを「フレームn」と表現する。また、x1(n)=1は送話側チャネル51のフレームnが音声区間であることを示し、x2(n)=1は受話側チャネル52のフレームnが音声区間であることを示す。一方、x1(n)=0は送話側チャネル51のフレームnが非音声区間であることを示し、x2(n)=0は受話側チャネル52のフレームnが非音声区間であることを示す。
以下、通話区間推定部13の通話区間推定処理(ステップS3)の詳細を説明する。
図5は、通話区間推定処理(ステップS3)の詳細を説明するためのフローチャートである。
まず、通話区間開始判定部13a(図1)が、音声検出部12から転送された送話側チャネル51の音声区間判別結果x1(n)と受話側チャネル52の音声区間判別結果x2(n)とを用い、当該処理対象のフレームnについて、何れかのチャネルに音声区間が検出されたか否かを判定する(ステップS11)。
次に、通話区間推定処理(ステップS3)のアルゴリズムを例示する。
図6,図7は、通話区間推定処理(ステップS3)のアルゴリズム例を説明するためのフローチャートである。
まず、通話区間開始判定部13a(図1)が、音声検出部12から転送された送話側チャネル51の音声区間判別結果x1(n)と受話側チャネル52の音声区間判別結果x2(n)とを用い、両チャネルについて、処理対象のフレームy(n)の音声信号が音声区間のものであるか否かを判定する(ステップS31)。
一方、何れかのチャネルで音声区間が検出された場合(x1(n)=1及び/又はx2(n)=1)(ステップS32)、通話区間開始判定部13aは、音声区間が検出されたチャネルを示す情報である音声区間開始チャネルcsと、音声区間であると判断したフレームの開始時刻である音声区間開始時刻nsとをメモリ13dに格納する。また、この場合、通話区間開始判定部13aは、音声区間開始時刻nsをデータ制御部13cに送る。データ制御部13cは、送られた音声区間開始時刻ns以降のフレームn の音声信号s1(n),s2(n)の処理開始指示を出力する(ステップS34)。
次に、上述のような通話区間推定処理によって通話区間を正しく推定できる理由について説明する。
図8〜図11は、本形態の通話区間推定処理によって通話区間の開始を正しく推定できる理由を説明するための図である。以下、これらの図を用いて通話区間の開始を正しく推定できる理由を説明する。
図3に例示した通話システム100において、電話機102を使用する送話者と、電話機101を使用する受話者のうちどちらか1話者の発話が開始された場合を想定する。この場合、図8に例示するように、発話が開始した側のチャネルAの音声区間が検出され(図4:ステップS11)、その音声区間開始時刻ns以降のフレームnの音声信号s1(n),s2(n)の音声認識処理や音声録音処理等の開始指示が出される(ステップS13)。そして、その音声区間の開始時刻nsからわずかな一定時間T3(例えば0.2秒。ただし0秒でも良い。)の後を起点とし、そこから一定時間T1(例えば20秒)以内に別のチャネルBにも音声区間があるため(発話があるため)(ステップS14)、その時点でチャネルAで検出された音声区間は確かに通話区間に含まれると判断し、音声区間の開始時刻nsを通話区間の開始時刻と推定する(ステップS16)。この場合、音声認識処理や音声録音処理等の処理が継続される。
図3に例示した通話システム100において、電話機102を使用する送話者が通話を行っていないときに咳払いを行った状況を想定する。この場合、図9に例示するように、咳払いを行った話者側のチャネルAの音声区間が検出され(図4:ステップS11)、その音声区間開始時刻ns以降のフレームnの音声信号s1(n),s2(n)の音声認識処理や音声録音処理等の開始指示が出される(ステップS13)。そして、その音声区間の開始時刻nsからわずかな一定時間T3(例えば0.2秒。ただし0秒でも良い。)の後を起点とし、そこから一定時間T1(例えば20秒)以内に別のチャネルBに音声区間は存在しないため(発話がないため)(ステップS14)、その時点でチャネルAで検出された音声区間は通話区間ではないと判断され、音声認識処理や音声録音処理等の処理が中止される(ステップS15)。この場合、音声認識装置131の処理をT1が経過した時点で停止し、また、音声録音装置132で記録した録音データを棄却すれば、誤検出による音声録音処理の演算量の無駄やデータ記憶領域の無駄を軽減することができる。また、このような本形態の特徴は、一方のチャネルに高いレベルの周囲雑音等が長時間入力される場合に特に効果的である。このような場合、非特許文献1の従来方式では、長時間の周囲雑音等の区間を全て通話区間と誤認し、その区間に対して音声認識処理等を実行してしまうが、本形態ではそのような誤作動区間を一定時間T1に抑制できるからである。
図3に例示した通話システム100において、両チャネルに同時に突発的な雑音(例えば、電話機102に図示していないヘッドセットのピンジャック端子を抜き差しする際に発生するノイズなど)が発生してしまった状況を想定する。また、当該突発的な雑音の継続時間はT3未満であるとする。この場合、図10に例示するように、まずチャネルAの音声区間が検出され(図4:ステップS11)、その音声区間開始時刻ns以降のフレームnの音声信号s1(n),s2(n)の音声認識処理や音声録音処理等の開始指示が出される(ステップS13)。そして、その音声区間の開始時刻nsからわずかな一定時間T3(例えば0.2秒)の後を起点とし、そこから一定時間T1(例えば20秒)以内に別のチャネルBに音声区間は存在しないため(ステップS14)、その時点でチャネルAで検出された音声区間は通話区間ではないと判断され、音声認識処理や音声録音処理等の処理が中止される(ステップS15)。図11に、この場合の全体の流れを示す。
次に、通話区間の終了を正しく推定できる理由について説明する。図12に例示するように、本形態では、通話であると判断(ステップS16)された後、通話区間に含まれると決定された音声区間が終了した時点から一定時間T2(例えば60秒)以内に両チャネルともに音声区間が存在しなければ(ステップS17)、最後の音声区間の終了時刻ne(T2のカウント開始時)又はT2時間が経過した時点(T2のカウント終了時)で通話が終了したと判断する(ステップS19)。この判断は「両チャネルともに長時間無音が続く状態は通話終了後に違いない」という経験的事実によるものであり、妥当なものである。なお、通話終了と判断した後には音声認識装置131における音声認識処理を終了したり、音声録音装置132における通話録音処理を終了して録音データを保存したりすればよい。
次に、本発明の第2実施形態について説明する。
<通話区間推定装置の構成>
本形態は第1実施形態の変形例であり、通話区間の終了を判断する際、特定の1チャネルの音声区間判別結果のみを用いる点が第1実施形態と相違する。以下では第1実施形態との第1実施形態との相違点を中心に説明し、第1実施形態と共通する事項については説明を省略する。
図15に例示するように、本形態の通話区間推定装置200は、音声入力部11と音声検出部12と通話区間推定部213と制御部14と記憶部15とを有する。また、通話区間推定部13は、通話区間開始判定部13aと通話区間終了判定部213bとデータ制御部13cとメモリ13dとを有する。すなわち、第1実施形態の通話区間終了判定部13bが通話区間終了判定部213bに置換された構成である。
次に、本形態の通話区間推定処理について説明する。
処理の全体は第1実施形態で図4に例示したものと同様である。相違点は、通話区間推定処理(図4:ステップS3)における、通話区間の終了時点の判断のみである。
以下、通話区間推定部213の通話区間推定処理(ステップS3)の詳細を説明する。
図16は、本形態の通話区間推定処理(ステップS3)の詳細を説明するためのフローチャートである。
本形態の通話区間の開始を判定するための処理(ステップS101からS106までの処理)は、第1実施形態の処理(図5:ステップS11からS16までの処理)と同じであるため説明を省略する。
次に、本形態の通話区間推定処理(ステップS3)のアルゴリズムを例示する。
本形態の通話区間の開始を判定するためのアルゴリズムは、第1実施形態の処理(図6:ステップS31からS38までの処理)と同じであるため説明を省略する。以下では、通話区間の終了を判定するためのアルゴリズム例について説明する。
図17は、本形態の通話区間推定処理(ステップS3)の通話区間の終了を判定するためのアルゴリズム例を説明するためのフローチャートである。
一方、何れのチャネルにも音声区間が検出されなかった場合(x1(n)=0かつx2(n)=0)には(ステップS133)、制御部14は、n+1を新たなnとして処理対象のフレームnを更新し(ステップS135)、通話区間終了判定部13bが、音声区間判別結果x1(n)又は音声区間判別結果x2(n)の何れかを用い、特定の1つのチャネルについて、処理対象のフレームy(n)の音声信号が音声区間のものであるか否かを判定する(ステップS136)。
次に、本形態において通話区間の終了を正しく推定できる理由について説明する。
図18は、本形態において通話区間の終了を正しく推定できる理由を説明するための図である。図18に例示するように、本形態では、通話であると判断(ステップS106)された後、通話区間に含まれると決定された音声区間が終了した時点から一定時間T2(例えば60秒)以内に特定の1つのチャネルAに音声区間が存在しなければ(ステップS107)、最後の音声区間の終了時刻ne(T2のカウント開始時)又はT2時間が経過した時点(T2のカウント終了時)で通話が終了したと判断する(ステップS109)。本形態の方法は、「通常の音声通話ならばどちらの話者も長時間黙っていることはないため、1話者において長時間無音が観測されれば通話は終了していると判断してよい」との経験的事実に基づくものである。
次に、本発明の第3実施形態について説明する。
本形態は、第1,2実施形態の変形例であり、突発性雑音を音声区間と誤って検出することを防ぐことが可能な形態である。第1,2実施形態では、音声検出部12(図1,図15)が、各チャネルでフレーム毎に音声区間(x1(n)=1,x2(n)=1)であるか非音声区間(x1(n)=0,x2(n)=0)であるかを判別する方法を説明した。しかし、このような方法では突発性の雑音(短時間に大きな電力が集中する雑音)を音声として誤検出してしまう場合がある。第3実施形態では、このような誤検出を防ぐために、同じチャネルの複数フレームで連続して音声が検出された場合にのみ、当該チャネルに音声区間が存在すると判断する。これは、突発性の雑音と比べ、音声が長時間にわたって連続して安定した大きなパワーを持つという性質を利用したものである。
以下では、このような方法について2つの実施例を説明する。
まず、制御部14がi=0とし(ステップS151)、音声検出部がフレームy(n)の音声信号が音声区間であるか否かを判定する(ステップS152)。なお、この判定には、例えば非特許文献1のような公知の方法を用いることができる。ここで、フレームy(n)の音声信号が音声区間でないと判断された場合、制御部14がn+1を新たなnとして処理対象のフレームnを更新し(ステップS154)、処理をステップS151に戻す。一方、フレームy(n)の音声信号が音声区間であると判定された場合、制御部14がi+1を新たなiとし(ステップS155)、i≧Tを満たすか否かを判定する(ステップS156)。なお、この例のTは2以上の自然数である。ここで、i≧Tを満たさないと判定された場合、制御部14がn+1を新たなnとして処理対象のフレームnを更新し(ステップS157)、処理をステップS152に戻す。一方、i≧Tを満たすと判定された場合、音声検出部がフレームy(n),y(n-1),…,y(n-i+1)は音声区間であると判定し、その判定結果を出力する(ステップS158)。
図21(a)のように、同一チャネルにおいて複数フレームで連続して一定時間以上音声区間が存在する場合にのみ、本実施例の音声検出部は、それらの連続した複数フレームを音声区間と判断する。一方、図21(b)のように、同一チャネルにおいて複数フレームで連続して一定時間(Tフレーム以上)以上音声区間が存在しない場合、本実施例の音声検出部は、音声区間と判断しない(非音声区間と判断する)。
まず、通話区間開始判定部が、音声検出部12から転送された送話側チャネル51の音声区間判別結果x1(n)と受話側チャネル52の音声区間判別結果x2(n)とを用い、フレームy(n),…,y(n+T-1)が連続して音声区間であるか否かを、両チャネルについてそれぞれ判定する(ステップS231)。
一方、何れかのチャネルで、フレームy(n),…,y(n+T-1)が連続した連続した音声区間であった場合(ステップS232)、通話区間推定部は、音声区間が検出されたチャネルを示す情報である音声区間開始チャネルcsと、音声区間であると判断したフレームの開始時刻である音声区間開始時刻nsとをメモリ13dに格納する。また、この場合、通話区間開始判定部13aは、音声区間開始時刻nsをデータ制御部13cに送る。データ制御部13cは、送られた音声区間開始時刻ns以降のフレームn の音声信号s1(n),s2(n)の処理開始指示を出力する(ステップS234)。
一方、何れのチャネルでもフレームy(n),…,y(n+T-1)が連続して音声区間となっていなかった場合(ステップS243)、制御部14は、n+1を新たなnとして処理対象のフレームnを更新し(ステップS245)、通話区間終了判定部が、音声区間判別結果x1(n)と音声区間判別結果x2(n)とを用い、フレームy(n),…,y(n+T-1)が連続して音声区間であるか否かを両チャネルについてそれぞれ判定する(ステップS246)。
次に、本発明の第4実施形態について説明する。
本形態は上述の各実施形態の変形例であり、図25のように、或るチャネルの音声区間の開始時刻から一定時間T3(T3は正の値でもよいし0でもよい)後を起点とし、当該起点から一定時間T1以内に別のチャネルの音声区間が存在する場合に、当該起点の一定時間T4(例えば1秒)前を通話区間の開始時刻として決定する。これにより、通話開始時点の推定誤りによる通話区間の始端欠けを防ぐことができる。
以上説明した各実施形態によれば、雑音や雑談などの非通話時の音声を通話音声として誤検出しても、それを早期に検出できるため、通話区間を高精度で検出することができる。
通常、音声通話では話者が交互に発話している。各実施形態では、一人の音声(送話音又は受話音)だけを検出するのではなく、複数人の音声(送話音および受話音)を検出してそれらを通話区間の推定に用いる。これにより、図8,図9等を用いて説明したように、通話開始や通話終了のタイミングを正確に推定できるとともに、咳払い等の雑音等を通話として誤検出してしまう問題を減らすことができる。また、図10等を用いて説明したように、T3を0より大きな一定値に設定することで、両チャネルで同時刻に発生する短時間雑音を通話と誤認することを防止できる。そして、このように通話でないと判断した場合に、誤って音声録音した咳払い等の音声データを破棄することで記憶装置の容量も節約できる。
Claims (14)
- 複数の通話端末装置間で通話が開始されてから終了するまでの区間である通話区間の開始を推定する通話区間検出装置であって、
何れかの上記通話端末装置を基準とした送話側チャネルの音声信号と受話側チャネルの音声信号とが入力される音声入力部と、
上記音声入力部に入力された複数チャネルの音声信号を用い、チャネル毎の音声区間と非音声区間とを検出する音声検出部と、
上記音声検出部が検出した複数チャネルの音声区間と非音声区間との情報を用い、上記通話区間の開始を推定する通話区間推定部と、
を有し、
上記通話区間推定部は、
或るチャネルの音声区間の開始時刻を第1起点とし、当該音声区間の開始時刻を除く或る時刻を第2起点とし、当該第2起点から一定時間T1以内に別のチャネルの音声区間が存在しない場合に、上記或るチャネル音声区間の音声は通話の音声ではないと判断し、当該第2起点から一定時間T1以内に別のチャネルの音声区間が存在する場合に、上記第1起点又は上記第1起点の一定時間T4前の時刻を通話区間の開始時刻として決定する、
ことを特徴とする通話区間検出装置。 - 請求項1に記載の通話区間検出装置であって、
上記第2起点は、前記音声区間の開始時刻から一定時間T3後の時刻である、
ことを特徴とする通話区間検出装置。 - 請求項1に記載の通話区間検出装置であって、
上記第2起点は、前記音声区間の中点である、
ことを特徴とする通話区間検出装置。 - 請求項1に記載の通話区間検出装置であって、
上記第2起点は、前記音声区間の終了点である、
ことを特徴とする通話区間検出装置。 - 請求項1から4の何れかに記載の通話区間検出装置であって、
上記通話区間推定部は、
通話区間の開始時刻以降の或る音声区間内の或る時点から、一定時間T2以内に何れのチャネルにも他の音声区間が存在しないならば、当該或る音声区間の終了時刻を当該通話区間の終了時刻として決定し、当該或る音声区間内の或る時点から一定時間T2以内に何れかのチャネルに他の音声区間が存在するならば、少なくとも当該他の音声区間までが通話区間に含まれると決定する、
ことを特徴とする通話区間検出装置。 - 請求項1から4の何れかに記載の通話区間検出装置であって、
上記通話区間推定部は、
通話区間の開始時刻以降の或る音声区間内の或る時点から、一定時間T2以内に特定の1チャネルに他の音声区間が存在しないならば、当該或る音声区間の終了時刻を当該通話区間の終了時刻として決定し、当該或る音声区間内の或る時点から一定時間T2以内に当該特定の1チャネルに他の音声区間が存在するならば、少なくとも当該他の音声区間までが通話区間に含まれると決定する、
ことを特徴とする通話区間検出装置。 - 請求項5又は6に記載の通話区間検出装置であって、
上記或る音声区間内の或る時点は、
上記或る音声区間の終了時刻である、
ことを特徴とする通話区間検出装置。 - 請求項5から7の何れかに記載の通話区間検出装置であって、
上記通話区間推定部は、
上記通話区間の終了時刻が決定されるまで、異なる上記或る音声区間について、順次、請求項5又は6に記載の上記通話区間推定部の処理を実行する、
ことを特徴とする通話区間検出装置。 - 請求項1から8の何れかに記載の通話区間検出装置であって、
上記音声検出部は、
所定の時間区間であるフレームの単位でチャネル毎の音声の有無を検出し、
上記通話区間推定部は、
同じチャネルの複数フレームで連続して音声が検出された場合にのみ、当該チャネルに音声区間が存在すると判断する、
ことを特徴とする通話区間検出装置。 - 複数の通話端末装置間で通話が開始されてから終了するまでの区間である通話区間の開始を推定する通話区間検出方法であって、
何れかの上記通話端末装置を基準とした送話側チャネルの音声信号と受話側チャネルの音声信号とが音声入力部に入力される音声入力過程と、
上記音声入力過程で入力された複数チャネルの音声信号を用い、チャネル毎の音声区間と非音声区間とを検出する音声検出過程と、
上記音声検出過程で検出された複数チャネルの音声区間と非音声区間との情報を用い、上記通話区間の開始を推定する通話区間推定過程と、
を有し、
上記通話区間推定過程は、
或るチャネルの音声区間の開始時刻を第1起点とし、当該音声区間の開始時刻を除く或る時刻を第2起点とし、当該第2起点から一定時間T1以内に別のチャネルの音声区間が存在しない場合に、上記或るチャネル音声区間の音声は通話の音声ではないと判断し、当該第2起点から一定時間T1以内に別のチャネルの音声区間が存在する場合に、上記第1起点又は上記第1起点の一定時間T4前を通話区間の開始時刻として決定する過程を有する、
ことを特徴とする通話区間検出方法。 - 請求項10に記載の通話区間検出方法であって、
上記第2起点は、前記音声区間の開始時刻から一定時間T3後の時刻である、
ことを特徴とする通話区間検出方法。 - 請求項10に記載の通話区間検出方法であって、
上記第2起点は、前記音声区間の中点である、
ことを特徴とする通話区間検出方法。 - 請求項10に記載の通話区間検出方法であって、
上記第2起点は、前記音声区間の終了点である、
ことを特徴とする通話区間検出方法。 - 請求項1から9の何れかの通話区間検出装置の各部の処理をコンピュータに実行させるための通話区間検出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011044156A JP5216114B2 (ja) | 2011-03-01 | 2011-03-01 | 通話区間検出装置、その方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011044156A JP5216114B2 (ja) | 2011-03-01 | 2011-03-01 | 通話区間検出装置、その方法、及びプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007049150A Division JP4825153B2 (ja) | 2007-02-28 | 2007-02-28 | 通話区間検出装置、その方法、プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011155665A JP2011155665A (ja) | 2011-08-11 |
JP5216114B2 true JP5216114B2 (ja) | 2013-06-19 |
Family
ID=44541233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011044156A Active JP5216114B2 (ja) | 2011-03-01 | 2011-03-01 | 通話区間検出装置、その方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5216114B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5892597B2 (ja) | 2012-02-24 | 2016-03-23 | 株式会社Screenホールディングス | 検査装置および検査方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6029800A (ja) * | 1983-07-29 | 1985-02-15 | 株式会社東芝 | 音声分析方式 |
JPH08160985A (ja) * | 1994-12-09 | 1996-06-21 | Dainippon Printing Co Ltd | 音声処理システム |
JPH10326100A (ja) * | 1997-05-26 | 1998-12-08 | Kokusai Electric Co Ltd | 音声録音方法及び音声再生方法及び音声録音再生装置 |
JP4682700B2 (ja) * | 2005-05-26 | 2011-05-11 | パナソニック電工株式会社 | 音声認識装置 |
-
2011
- 2011-03-01 JP JP2011044156A patent/JP5216114B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011155665A (ja) | 2011-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9571638B1 (en) | Segment-based queueing for audio captioning | |
AU2016260156B2 (en) | Method and device for improving audio processing performance | |
RU2439716C2 (ru) | Детектирование автоответчика путем распознавания речи | |
US7155018B1 (en) | System and method facilitating acoustic echo cancellation convergence detection | |
US9583108B2 (en) | Voice detection for automated communication system | |
US8786659B2 (en) | Device, method and computer program product for responding to media conference deficiencies | |
US9293147B2 (en) | Selective voice transmission during telephone calls | |
JP5058736B2 (ja) | 固定電力信号を検出する効率的な音声アクティビティ検出器 | |
US20120166188A1 (en) | Selective noise filtering on voice communications | |
US8380253B2 (en) | Voice switching for voice communication on computers | |
US20060282265A1 (en) | Methods and apparatus to perform enhanced speech to text processing | |
JP4825153B2 (ja) | 通話区間検出装置、その方法、プログラム及び記録媒体 | |
CN108540680B (zh) | 讲话状态的切换方法及装置、通话系统 | |
JP5216114B2 (ja) | 通話区間検出装置、その方法、及びプログラム | |
CN110225213B (zh) | 一种语音通话场景的识别方法以及音频策略服务端 | |
US20130151248A1 (en) | Apparatus, System, and Method For Distinguishing Voice in a Communication Stream | |
JP5191638B2 (ja) | 音声通信装置および音声通信システム | |
CN112929777B (zh) | 音频信号的处理方法、装置及电子设备 | |
JP6544439B2 (ja) | 困惑状態判定装置、困惑状態判定方法、及びプログラム | |
US11595462B2 (en) | In-call feedback to far end device of near end device constraints | |
CN115706875A (zh) | 对讲语音质量优化方法、装置、设备及存储介质 | |
JP6396829B2 (ja) | 情報処理装置、判定方法及びコンピュータプログラム | |
US10554822B1 (en) | Noise removal in call centers | |
JP4230982B2 (ja) | 通話補助装置、通話補助方法、通話補助プログラムおよび通話補助システム | |
US11924368B2 (en) | Data correction apparatus, data correction method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110301 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110617 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130301 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5216114 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |