JP5176391B2 - 音声送信装置 - Google Patents

音声送信装置 Download PDF

Info

Publication number
JP5176391B2
JP5176391B2 JP2007137476A JP2007137476A JP5176391B2 JP 5176391 B2 JP5176391 B2 JP 5176391B2 JP 2007137476 A JP2007137476 A JP 2007137476A JP 2007137476 A JP2007137476 A JP 2007137476A JP 5176391 B2 JP5176391 B2 JP 5176391B2
Authority
JP
Japan
Prior art keywords
pitch
signal
transmission
sound
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007137476A
Other languages
English (en)
Other versions
JP2008292720A (ja
Inventor
紀行 畑
卓朗 曽根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2007137476A priority Critical patent/JP5176391B2/ja
Publication of JP2008292720A publication Critical patent/JP2008292720A/ja
Application granted granted Critical
Publication of JP5176391B2 publication Critical patent/JP5176391B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Description

この発明は、収音信号に基づく送信音声信号を生成してネットワーク網に送信する音声送信装置、特に、発話時にのみにネットワークのリソースを確保して送信する音声送信装置に関するものである。
従来、ネットワーク等を用いて複数の放収音装置を接続し、これら複数の放収音装置間で会話する音声通信システムが一般に普及している。例えば、それぞれに異なる拠点に配置された複数の音声会議装置をネットワーク接続して、多地点会議を行う会議システムが普及している。このような音声通信システムで用いられる放収音装置では、マイク等で収音した音声から収音信号を生成し、ネットワーク形式の送信音声信号に変換して送信する。この際、放収音装置は、送信音声信号に話者音声が最初から含まれるように話者音声検出を行う。そして、特許文献1に示すように、発話タイミングと送信タイミングとの差を解消するために、送信音声信号の最初の部分を縮めるように話速変換する方法がある。
特許第3553828号公報
しかしながら、特許文献1の方法では、音声信号を所定のフレーム単位に分解し、各フレームの音素分析を行って子音部、母音部、無音部を特定し、それぞれの部分に対して予め設定した適当な割合で、フレーム単位で間引くことにより話速変換を行っている。
このため、フレームの設定によっては、間引いて圧縮合成した際に、間引いた前後のフレーム間で音声がうまく繋がらず、聴者に違和感を与える可能性がある。
また、ピッチも変わって音質が変化することもある。
したがって、本発明の目的は、発話タイミングと送信開始タイミングとの差を解消するとともに、送信先の聴者に違和感を与えず、話者音声の頭切れの無い送信音声信号を生成する音声送信装置を提供することにある。
この発明の放収音装置は、
音声を収音し、収音信号を生成する収音手段と、
前記収音信号をバッファリングするバッファリング手段と、
前記収音信号に含まれる、ピッチ情報を検出するための所定時間のピッチ検出区間及び話者音声区間を検出する音声区間検出手段と、
前記音声区間検出手段が前記ピッチ検出区間を検出すると、前記バッファリング手段から順次前記収音信号を取得して送信音声信号を生成し、送信する送信音声信号生成手段と、
前記ピッチ情報を一時記憶するピッチ情報一時記憶手段と、を備え、
前記送信音声信号生成手段は、前記音声区間検出手段が前記ピッチ検出区間を検出した時点で、前記収音手段が生成した収音信号に対し、前記送信音声信号生成手段で生成した送信音声信号に遅延が存在する場合、前記ピッチ検出区間の前記収音信号に対してピッチ数を減少させる間引き処理を行って送信音声信号を生成し、前記遅延が存在しない場合、前記収音手段が生成した収音信号を送信音声信号とし、
前記音声区間検出手段は、前記送信音声信号生成手段が前記間引き処理を行って生成した送信音声信号の送信を終了した時点で前記ピッチ検出区間の再検出を開始し、前回のピッチ検出区間の後に前記収音手段が生成した収音信号の時間長が前記所定時間長よりも短い場合に、前記ピッチ情報一時記憶手段から前記ピッチ情報を読み出して、今回のピッチ検出区間の検出に用いることを特徴としている。
この構成では、発話(収音)タイミングと送信タイミングとの差がある時点では、同じピッチ波形が連続している区間を検出して、これら連続するピッチの数を減らすことで収音信号を間引きする。これにより、発話(収音)タイミングと送信タイミングとの差が縮小される。この際、同じ音を表すピッチの数を減らす処理を行うだけであるので、送信され放音された音の違和感が殆ど無い。
この構成では、第一回目以降のピッチ情報の取得時に、ピッチの間引き処理が行われれば、この間引き処理に対応する送信音声信号の時間長が、元の収音信号の時間長よりも短くなるので、同じ時間間隔で話者音声区間を検出すると、前回の送信音声信号成分と、今回の送信音声信号成分との間に時間的空白が生じる。このため、この構成を用いることで、前回の送信音声信号成分が途切れる前に、今回の送信音声信号成分が生成され、送信音声信号が継続的に生成される。このため、前述の音声品質を維持しながら、途切れることの無い送信音声信号を出力することができる。すなわち、送信先の聴者に違和感を与えない。
この発明によれば、送信先の聴者に対して違和感を与えることなく、発話(収音)タイミングと送信タイミングとの差を無くして、発話の始めの言葉から確実に入っている音声を提供することができる。
本発明の実施形態に係る音声送信装置について図を参照して説明する。
図1は本実施形態の音声送信装置10の主要構成を示すブロック図である。
図1に示すように、本実施形態の音声送信装置10は、収音信号制御部11、収音信号分析部12、送信制御部13を備える。
音声送信装置10には、マイクMICで収音され収音部20で生成された収音信号が入力され、音声送信装置10は、当該収音信号に基づいて、以下に示す方法で送信音声信号を生成して出力する。
収音信号制御部11はバッファメモリ110を備え、収音部20から入力した収音信号をバッファメモリ110に記憶する。また、収音信号制御部11は、送信制御部13からの収音信号出力ON信号を受け付けると、送信制御部13の送信音声信号生成部130へ出力する。
収音信号分析部12はメモリ120を備え、収音部20から入力した収音信号をメモリ120に一時記憶する。収音信号分析部12は、メモリ120に一時記憶された収音信号を所定単位毎に読み出して、ピッチ情報を検出するとともに、発話区間すなわち話者音声区間を検出する。ここで、発話区間(話者音声区間)の検出方法としては、例えば、取得したピッチ情報の内の最初のピッチから予め所定時間長分だけ前の時点を発話タイミングとし、この発話タイミング以降の連続する時間を発話区間として検出するものである。なお、発話区間(話者音声区間)の終了検出は、例えば、所定時間以上ピッチ情報が検出されない時点を発話区間(話者音声区間)の終了点とすることで得られる。
収音信号分析部12は、このようなピッチ検出、発話区間検出を音声送信装置10の始動時から常時行い、その都度、検出した発話区間情報とピッチ情報とを送信制御部13へ与える。
ところで、このようなピッチ情報の検出や発話区間の検出は、所定量以上の情報量が必要であるとともに、解析に或程度の時間(例えば、それぞれ100msec.程度)がかかるので、ピッチ情報や発話区間情報を送信制御部13へ出力するタイミングは、収音信号の取得タイミングよりも遅れる。このため、発話開始タイミング直後では、送信音声信号の送信タイミングが収音信号の取得タイミングよりもこの解析等の時間長分だけ遅れる。
送信制御部13は、収音信号分析部12から発話区間情報とピッチ情報とを取得すると、収音信号制御部11に対して収音信号出力ON信号を与える。
送信制御部13は、収音信号の取得タイミングと送信音声信号の送信タイミングとの差を音声送信装置10の始動時から常時検出する。そして、送信制御部13は、例えば前述の発話開始直後のように、収音信号の取得タイミングと送信音声信号の送信タイミングとの差があることを検出すると、ピッチ情報を解析して、同じピッチ波形が連続する部分を検出すると、当該連続する同じピッチ波形の内の所定率のピッチ波形を間引く処理を行う。これにより、送信音声信号は、これに対応する収音信号よりも短い時間長からなる音声信号となる。すなわち、前述のように送信音声信号の送信タイミングが収音信号の取得タイミングよりも遅れている場合に、遅れ量を少なくすることができる。送信制御部10は、収音信号の取得タイミングと送信音声信号の送信タイミングとの差が無くなるまで、このような間引き処理を継続して行う。これにより、発話開始タイミングで収音信号の収音タイミングに対して遅れていた送信音声信号の送信タイミングを、収音タイミングに略一致させることができる。そして、このように収音タイミングと送信タイミングとが略一致した後には、送信制御部13は、収音信号をそのまま送信音声信号として出力する。
これにより、発話開始タイミングで収音タイミングに対して遅れていた送信タイミングを徐々に収音タイミングと略同じにしていき、ある時点で収音信号を送信音声信号として遅延無く出力することができる。この結果、送信先の聴者に対して、発話の開始時点から言葉の頭抜けが無い音声を、違和感無く、略リアルタイムに提供することができる。この際、同じピッチ波形の繰り返し数を減少させる処理を行うことで、送信音声信号を放音しても、元の収音信号と殆ど変わらない音で聴者に提供することができる。
次に、収音タイミングと送信タイミングとの時間差の解消方法およびこれに用いる間引き処理のフローについて、図2を参照して詳しく説明する。
図2は本実施形態の音声送信装置10の間引き処理のフローを示すフローチャートである。
音声送信装置10は、電源スイッチオンで始動するとともに、収音を開始する。そして、収音信号は、所定形式のディジタルデータに変換され、収音信号制御部11のバッファメモリ110および収音信号分析部12のメモリ120に順次記憶される。図3の例であれば、(B)に示す収音信号が順に記憶される。音声送信装置10の収音信号分析部12は、ピッチ・発話解析可能時間長だけ収音信号が得られると、ピッチ検出を行う(S101)。ここで、ピッチが検出されれば、最初に検出されたピッチから所定時間だけ前の時点を発話開始タイミングに設定し、発話区間情報を取得する。ここで、発話タイミングの設定に利用する、遡る時間長は、例えば、子音の長さ等に基づいて設定される。
音声送信装置10の収音信号分析部12は、ピッチ情報および発話区間情報を検出、取得すると、送信制御部13へ与える(S101:Y→S102)。一方、収音信号分析部12は、ピッチおよび発話区間情報を検出しなければ、ピッチ・発話解析可能時間長だけ待機し、ピッチおよび発話区間の検出する処理を繰り返す(S101:N)。
収音信号分析部12は、取得したピッチ情報および発話区間情報を送信制御部13へ与え、送信制御部13は、ピッチ情報および発話区間情報を記憶するとともに、同じピッチ波形が連続するかどうかを判定する(S102)。送信制御部13は、同じピッチ波形が連続することを検出すると、予め設定した間引き率に準じてピッチの間引き処理を行って、送信音声信号を生成する(S102:Y→S103→S104)。ここで、間引き率とは、連続する同じピッチ波形の内で、どの割合のピッチ波形を削除するかを指定するものであり、例えば、同じピッチ波形の全体数の50%を間引きしたり、25%を間引きする等の指定を行うものである。なお、間引き率が高いほど早く収音タイミングと送信タイミングとの時間差は解消される。一方で、間引き率が高いと「おおさか(おーさか)」のように、長音を含む場合に短くしすぎると、「おさか」となってしまい、収音音声と放音音声とで異なる意味になってしまうので、間引き率は或程度低くしておく方がより正確に収音音声を再生することができる。この場合、例えば、間引き率は前述の25%程度にしておくとよい。また、予め収音タイミングと送信タイミングとの差を解消するまでの時間を設定しておき、当該設定時間に応じた間引き率を設定しても良い。また、この説明では、ピッチの間引き率、すなわち母音部分の間引き率を設定する例を示したが、ピッチ(母音)部分とともに、無音(空白)部を検出して当該無音部を大幅に間引き処理するようにしてもよい。これにより、さらに差の解消を早くすることができる。
一方、送信制御部13は、例えば子音部等が極短い間隔で挿入する等で、同じピッチ波形が連続していないことを検出すると、間引き処理を行わずに送信音声信号を生成する(S102:N→S104)。
送信制御部13は、このように生成した送信音声信号を出力するとともに、この時点での送信音声信号の送信タイミングと収音信号の収音タイミングとの時間差を検出する(S105)。ここで、送信制御部13は、検出した時間差が「0」でなければ、今回出力する送信音声信号の終了タイミングを取得する(S106:N→S107)。送信制御部13は、終了タイミングに基づいて、次のピッチ・発話区間検出タイミングを決定する(S108)。ここで、間引き処理が行われている場合、送信音声信号の時間長は、対応する収音信号の時間長よりも短くなる。このため、間引き処理した送信音声信号の終了タイミングでは、新規に取得した収音信号量がピッチ・発話検出のための最短時間長に対応する必要情報量よりも少なくなる。従って、新規に取得した収音信号量だけでは必要情報量を得ることができず、ピッチ・発話検出を行うことができない。これを解決するため、収音信号分析部12は、間引き処理がされて必要情報量が不足することを検出すると、既知のピッチ・発話検出処理で得られたピッチ情報を直前のものから順に読み出し、新規に取得した収音信号量に加えることで、必要情報量を確保して、新たなピッチ・発話検出を行う(S109:N→S110→S101)。一方、間引き処理が行われなかった場合等では、送信音声信号の時間長と収音信号の時間長とが同じであるので、送信音声信号の終了タイミングおよびピッチ・発話検出タイミングは、ピッチ・発話検出のための最短時間長後となる(S107→S108)。このため、この時点で必要情報量は得られているので、新たなピッチ・発話検出がそのまま行われる(S109:Y→S101)。
上述のような処理を繰り返し、送信制御部13は、送信タイミングと収音タイミングとの時間差が「0」となることを検出すると、間引き処理を停止する(S106:Y→S120)。具体的には、送信制御部13は、収音制御部11に対して遅延処理の停止を指示する。収音制御部11は、遅延処理の停止指示に応じて、入力された収音信号をそのまま送信制御部13へ出力し、送信制御部13は、収音信号をそのまま送信音声信号として出力する。
このような処理を行うことで、ピッチ・発話検出で収音タイミングから遅延した送信タイミングを、ピッチの間引き処理により収音タイミングに一致させることができるとともに、ピッチの間引き処理を行っても、送信音声信号が途切れることなく生成される。すなわち、送信先の装置に在席する聴者に対して、違和感の無い話者音声を提供することができる。
次に、本実施形態の音声送信装置の間引き処理の概念を、図3を参照して説明する。
図3は本実施形態の音声送信装置10で実行する間引き処理の概念を説明する説明図である。なお、本図および以下の説明では、説明をわかりやすくするために、同じ母音ピッチが発話開始タイミングから継続している場合を示す。ここで、子音や無音部がある場合も考えられるが、これらの部分はピッチの間引き処理には直接関係しないので、子音や無音部が入る場合も以下の処理は適用できる。(A)は発話、ピッチ検出可能な最短時間長を示し、(B)は収音信号波形を示す。(C)は第一回の発話・ピッチ解析を示し、(D)は第二回の発話・ピッチ解析を示し、(E)は第三回の発話・ピッチ解析を示し、(F)は第四回の発話・ピッチ解析を示す。(G)は送信音声信号波形を示す。(H)は収音信号の取得経過時間と送信音声信号の送信経過時間との関係を示す。
図3に示すように、音声送信装置10(以下、説明を簡略化するため、音声送信装置10の詳細な部分での記載は行わず、一括して音声送信装置10とする)は、ピッチ波形の4個分を取得することで、ピッチ検出および発話検出ができるものとする。音声送信装置10は、収音信号の取得開始時間を時間「0」として、時間「0」からピッチ波形の4個分の時間が経過した、第一検出時間ta1にて、第一回目のピッチ・発話検出を実行する。この際、同じ波形のピッチ信号T101〜T104がバッファリングされており、音声送信装置10は、ピッチ信号T101〜T104を解析し、同じ波形のピッチ信号が4連続していることを検出する。これにより、音声送信装置10は、ピッチ情報と発話区間情報とを取得し、記憶する。
音声送信装置10は、同じ波形が連続していることを検出し、ピッチ信号の間引き処理を行う。ここでは、間引き率を50%としており、音声送信装置10は、ピッチ信号T101〜T104の内、半分のピッチ信号T102,T104を削除する。ここで、ピッチ信号の削除方法としては、解析に用いた最初のピッチ信号を優先的に残し、残りのピッチ信号から適宜必要数だけ残すようにするものである。また、間引き処理を行う際には、収音信号すなわち各ピッチ信号のゼロクロス点を検出し、当該ゼロクロス点を削除基準タイミングとして間引き処理を行う。
音声送信装置10は、ピッチ信号T101,T103からなる信号を送信音声信号として、第一検出時間ta1と略同タイミングの間引き処理開始時間tsで送信開始する。
音声送信装置10は、ピッチ信号T101,T103からなる送信音声信号の送信終了タイミングを検出し、当該タイミングに対して略同時間以前の第二回検出時間ta2を取得する。この時間は、ピッチ信号二個分(T101,T103分)であり、新たに取得できるピッチ信号も二個分であり、音声送信装置10は、この時点ta2でピッチ信号T105,T106を取得する。これと同時に、音声送信装置10は、ピッチ・発話検出に必要なピッチ信号4個分を得るため、直前の二個のピッチ信号T104,T103を読み出す。この際、音声送信装置10は、ピッチ信号そのものを読み出しても良く、ピッチ情報を読み出しても良い。このように、音声送信装置10は、第二回検出時間ta2において、ピッチ信号T103〜T106に基づく、ピッチ信号T105,T106のピッチ検出および発話検出を行い、ピッチ情報および発話区間情報を取得する。
音声送信装置10は、新たに得た二つのピッチ信号が同波形であることを検出すると、間引き率50%に基づいて、ピッチ信号T106を削除する。音声送信装置10は、ピッチ信号T105のみからなる送信音声信号を、ピッチ信号T101,T103からなる送信音声信号に連続するように送信する。
音声送信装置10は、ピッチ信号T105からなる送信音声信号の送信終了タイミングを検出し、当該タイミングに対して略同時間以前の第三回検出時間ta3を取得する。この時間は、ピッチ信号一個分(T105分)であり、新たに取得できるピッチ信号も一個分であり、音声送信装置10は、この時点ta3でピッチ信号T107を取得する。これと同時に、音声送信装置10は、ピッチ・発話検出に必要なピッチ信号4個分を得るため、直前の三個のピッチ信号T106,T105,T104を読み出す。この際、音声送信装置10は、ピッチ信号そのものを読み出しても良く、ピッチ情報を読み出しても良い。このように、音声送信装置10は、第三回検出時間ta3において、ピッチ信号T104〜T107に基づく、ピッチ信号T107のピッチ検出および発話検出を行い、ピッチ情報および発話区間情報を取得する。
音声送信装置10は、新たに得たピッチ信号が今回の検出に用いた直前のピッチ信号と同波形であることを検出すると、間引き率50%に基づいて、ピッチ信号T107を半波長で削除しなければならない。しかしながら、ピッチ信号一個を半分に削除すると信号波形が変化してしまうので、ピッチ信号T107をそのまま送信音声信号として、ピッチ信号T101,T103,T105からなる送信音声信号に連続するように送信する。
音声送信装置10は、第三回検出時間での検出において間引き処理を実行しなかったことを記憶しておく。
音声送信装置10は、ピッチ信号T107からなる送信音声信号の送信終了タイミングを検出し、当該タイミングに対して略同時間以前の第四回検出時間ta4を取得する。この時間は、ピッチ信号一個分(T107分)であり、新たに取得できるピッチ信号も一個分であり、音声送信装置10は、この時点ta4でピッチ信号T108を取得する。これと同時に、音声送信装置10は、ピッチ・発話検出に必要なピッチ信号四個分を得るため、直前の三個のピッチ信号T107,T106,T105を読み出す。この際、音声送信装置10は、ピッチ信号そのものを読み出しても良く、ピッチ情報を読み出しても良い。このように、音声送信装置10は、第四回検出時間ta4において、ピッチ信号T105〜T108に基づく、ピッチ信号T108のピッチ検出および発話検出を行い、ピッチ情報および発話区間情報を取得する。
音声送信装置10は、新たに得たピッチ信号が今回の検出に用いた直前のピッチ信号と同波形であることを検出し、且つ直前の検出時間ta3で間引き処理を行っていないことを検出すると、間引き率50%に基づいてピッチ信号T108を削除する。すなわち、音声送信装置10は、ピッチ信号T107,T108を一組として、ピッチ信号T108のみを削除する処理を行う。これにより、音声送信装置10は、第四回検出時間ta4での送信音声信号の出力は行わない。
音声送信装置10は、この時点ta4で、収音信号の収音タイミングと送信音声信号の送信タイミングとが一致することを検出する。すなわち、音声送信装置10は、ピッチ信号四個分からなる最初の検出区間に対して、ピッチ信号四個分を間引き処理したことを検出する。
音声送信装置10は、収音タイミングと送信タイミングとが一致したことを検出すると、この時点ta4を間引き処理終了時間teとして、間引き処理を終了し、以降は、取得した収音信号、図3であればピッチ信号T109以降の信号を、そのまま送信音声信号として出力する。
このような処理を行うことで、図3(H)に示すように、時間「0」から間引き処理開始時間「ts」までの検出期間分だけ、収音タイミングに対して送信タイミングが遅延した状況を、間引き処理開始時間tsから間引き処理終了時間teまでの間引き処理期間で回復することができる。これにより、間引き処理終了時間te以降では、通常送信期間として、収音に対して遅延することなくリアルタイムに送信することができる。この際、ピッチ間引き処理を用いることで、音質を変化させることなく遅延を回復することができる。さらに、ゼロクロス点を削除タイミングに設定することで、間引き後の送信音声信号の不連続を防止し、ノイズの発生を抑圧でき、さらに高い音質を確保することができる。
次に、前述の音声送信装置10を備える音声通話装置の一例について説明する。
図4は音声通話装置1の一例を示すブロック図である。
音声通話装置1は、前述の音声送信装置10、収音部20とともに、音声通信装置1の全体制御を行うメイン制御部50、放音部30、通信制御部40を備え、通信制御部40を介して通信網500に接続する構成からなる。なお、本実施例では、通信網500は三チャンネルCH1〜CH3を備えるものとして説明する。
放音部30は、スピーカSPを備え、受信部430で受信した他装置からの音声信号を放音する。
通信制御部40は、チャンネル制御部410、送信部420、受信部430を備える。チャンネル制御部410は、通信網500の各チャンネルCH1〜CH3の使用状況を監視し、音声送信装置10の送信制御部13から送信出力制御を受け付けると、空きチャンネルを検出する。チャンネル制御部410は、空きチャンネルが有ることを確認すると、当該チャンネルを獲得する制御を通信網500に接続する各装置に対して行う。そして、獲得したチャンネルを送信部420に指示する。一方、チャンネル制御部410は、音声送信装置10の送信制御部13から送信出力停止制御を受け付けると、獲得していたチャンネルの開放を通信網500に接続する各装置に通知する。ここで、送信出力停止制御は、送信制御部13が発話区間の終了を検出した時点でチャンネル制御部410へ与えられる。
また、チャンネル制御部410は、使用中のチャンネルを検出すると、当該チャンネルの使用情報、例えば、チャンネルを使用している装置ID等を取得して、受信部430へ与える。
送信部420は、チャンネル制御部410で指定されたチャンネルに対して、音声送信装置10で生成した送信音声信号を出力する。
受信部430は、チャンネル制御部410で指定されたチャンネルから、他装置による音声信号を受信して放音部30へ与える。
このような音声通話装置1を用いることで、チャンネル数が少ない場合でも通信網500のリソースを有効に分け合って利用することができる。この際、本発明の音声送信装置10を備えることで、発話が検出され、チャンネルが獲得された直後においても、話者の発言の頭切れを防止し、且つ音質を維持しながら収音タイミングと送信タイミングとの時間差を回復し、所定時間後にはリニアな収音−送信処理を行うことができる。
本発明の実施形態の音声送信装置の主要構成を示すブロック図である。 本実施形態の音声送信装置10の間引き処理のフローを示すフローチャートである。 本実施形態の音声送信装置10で実行する間引き処理の概念を説明する説明図である。 音声通話装置1の一例を示すブロック図である。
符号の説明
1−音声通話装置、10−音声送信装置、11−収音信号制御部、110−バッファメモリ、12−収音信号分析部、120−メモリ、13−送信制御部、130−送信音声信号生成部、20−収音部、30−放音部、40−通信制御部、410−チャンネル制御部、420−通信制御部40の送信部、430−通信制御部40の受信部、50−メイン制御部、500−通信網

Claims (1)

  1. 音声を収音し、収音信号を生成する収音手段と、
    前記収音信号をバッファリングするバッファリング手段と、
    前記収音信号に含まれる、ピッチ情報を検出するための所定時間のピッチ検出区間及び話者音声区間を検出する音声区間検出手段と、
    前記音声区間検出手段が前記ピッチ検出区間を検出すると、前記バッファリング手段から順次前記収音信号を取得して送信音声信号を生成し、送信する送信音声信号生成手段と、
    前記ピッチ情報を一時記憶するピッチ情報一時記憶手段と、を備え、
    前記送信音声信号生成手段は、前記音声区間検出手段が前記ピッチ検出区間を検出した時点で、前記収音手段が生成した収音信号に対し、前記送信音声信号生成手段で生成した送信音声信号に遅延が存在する場合、前記ピッチ検出区間の前記収音信号に対してピッチ数を減少させる間引き処理を行って送信音声信号を生成し、前記遅延が存在しない場合、前記収音手段が生成した収音信号を送信音声信号とし、
    前記音声区間検出手段は、前記送信音声信号生成手段が前記間引き処理を行って生成した送信音声信号の送信を終了した時点で前記ピッチ検出区間の再検出を開始し、前回のピッチ検出区間の後に前記収音手段が生成した収音信号の時間長が前記所定時間長よりも短い場合に、前記ピッチ情報一時記憶手段から前記ピッチ情報を読み出して、今回のピッチ検出区間の検出に用いることを特徴とする音声送信装置。
JP2007137476A 2007-05-24 2007-05-24 音声送信装置 Expired - Fee Related JP5176391B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007137476A JP5176391B2 (ja) 2007-05-24 2007-05-24 音声送信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007137476A JP5176391B2 (ja) 2007-05-24 2007-05-24 音声送信装置

Publications (2)

Publication Number Publication Date
JP2008292720A JP2008292720A (ja) 2008-12-04
JP5176391B2 true JP5176391B2 (ja) 2013-04-03

Family

ID=40167494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007137476A Expired - Fee Related JP5176391B2 (ja) 2007-05-24 2007-05-24 音声送信装置

Country Status (1)

Country Link
JP (1) JP5176391B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112334981A (zh) 2018-05-31 2021-02-05 舒尔获得控股公司 用于自动混合的智能语音启动的系统及方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07129190A (ja) * 1993-09-10 1995-05-19 Hitachi Ltd 話速変換方法及び話速変換装置並びに電子装置
JPH1069295A (ja) * 1996-08-28 1998-03-10 Sony Corp データ再生方法およびデータ処理装置
JPH11338496A (ja) * 1998-05-21 1999-12-10 Seiko Epson Corp 話速変換方法および話速変換処理プログラムを記録した記録媒体
JP3553828B2 (ja) * 1999-08-18 2004-08-11 日本電信電話株式会社 音声蓄積再生方法および音声蓄積再生装置
JP2002091470A (ja) * 2000-09-20 2002-03-27 Fujitsu Ten Ltd 音声区間検出装置
JP2003223199A (ja) * 2002-01-28 2003-08-08 Telecommunication Advancement Organization Of Japan 字幕用書き起こしテキストの作成支援システム及び半自動型字幕番組制作システム

Also Published As

Publication number Publication date
JP2008292720A (ja) 2008-12-04

Similar Documents

Publication Publication Date Title
JP4245060B2 (ja) サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム
CA2253749C (en) Method and device for instantly changing the speed of speech
JP4630876B2 (ja) 話速変換方法及び話速変換装置
JP2009139592A (ja) 音声処理装置、音声処理システム及び音声処理プログラム
WO2010024426A1 (ja) 録音装置
JP2017507602A (ja) 遠隔会議における知覚的に連続的な混合
JP2013025299A (ja) 書き起こし支援システムおよび書き起こし支援方法
JP2008090296A (ja) 音声スクランブル信号作成方法と装置及び音声スクランブル方法と装置
JP5727777B2 (ja) 会議支援装置および会議支援方法
JP5176391B2 (ja) 音声送信装置
JP3553828B2 (ja) 音声蓄積再生方法および音声蓄積再生装置
JP2009021923A (ja) 音声通信装置
JP2007158526A (ja) 発話抑制装置、発話抑制方法および発話抑制装置のプログラム
JP4127155B2 (ja) 聴覚補助装置
JP2009075280A (ja) コンテンツ再生装置
JP2019176375A (ja) 動画出力装置、動画出力方法および動画出力プログラム
JP2015215503A (ja) 音声認識方法、音声認識装置および音声認識プログラム
JP4212253B2 (ja) 話速変換装置
JP4381108B2 (ja) 話速変換装置における時報処理装置
JP4134844B2 (ja) 聴覚補助装置
JP5533503B2 (ja) 通信装置、通信方法、および通信プログラム
JPH04357735A (ja) 音声パケット通信装置
JP2007086592A (ja) 音声出力装置および音声出力方法
JPH11331321A (ja) 対話型通信装置
JP2004240920A (ja) 校正システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100315

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111121

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20111121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121009

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121224

R150 Certificate of patent or registration of utility model

Ref document number: 5176391

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees