JP2009244912A - 音声信号処理装置及び音声信号処理方法 - Google Patents

音声信号処理装置及び音声信号処理方法 Download PDF

Info

Publication number
JP2009244912A
JP2009244912A JP2009176279A JP2009176279A JP2009244912A JP 2009244912 A JP2009244912 A JP 2009244912A JP 2009176279 A JP2009176279 A JP 2009176279A JP 2009176279 A JP2009176279 A JP 2009176279A JP 2009244912 A JP2009244912 A JP 2009244912A
Authority
JP
Japan
Prior art keywords
speech
speed conversion
speech speed
signal
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009176279A
Other languages
English (en)
Other versions
JP4894896B2 (ja
Inventor
Hiroyuki Takeishi
浩幸 武石
Yutaka Ichii
豊 一井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2009176279A priority Critical patent/JP4894896B2/ja
Publication of JP2009244912A publication Critical patent/JP2009244912A/ja
Application granted granted Critical
Publication of JP4894896B2 publication Critical patent/JP4894896B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】受信側での話速変換機能に加えて、放送などにおいて番組によっては送信側でも話速変換処理が行われると、話速変換が二重にかかってしまうことが起こり得る。
【解決手段】受信部11は、複数の音声信号と、前記複数の音声信号のそれぞれに送信側で音声ピッチを変えることなく、時間軸を変化させる話速変換処理に適合する音声であるか否かを示す話速変換適合情報とが多重された多重信号を受信する。マイクロプロセッサ17は、多重信号中から前記話速変換適合情報を検出して、その内容を判別する。話速変換処理14は、話速変換適合情報の内容が話速変換に適合している場合には、音声信号デコーダ12により再生する音声信号の話速変換処理を行い、話速変換適合情報の内容が話速変換に適合していないと判定された場合には、音声信号の話速変換処理を行うことなく出力する。
【選択図】図4

Description

本発明は音声信号処理装置及び音声信号処理方法に係り、特に高齢者に音声を聞き易くする、いわゆる話速変換機能を備えた音声信号処理装置及び音声信号処理方法に関する。
一般に、高齢者においては早口で喋る音声から内容を聞き取ることが若い時よりも困難になる傾向があることがわかっている。このため、入力音声信号から発声の途切れる箇所を見つけて、この期間の時間を減らす替わりに、発声している期間の音声をピッチを変えずに時間軸上で引き伸ばして、全体としてゆっくりとした発声に変換する、いわゆる話速変換の機能を備えた音声信号処理装置及び音声信号処理方法が従来より知られている(例えば、特許文献1参照)。
この特許文献1記載の音声信号処理装置では、予め送信データ、録音メディア等に話速を制御するための話速制御情報を入れておき、送信データを受信して再生する再生装置または録音メディアの再生装置において、話速制御情報に基づいて話速を制御する。また、話速変換機能を搭載したラジオも開発されている(例えば、非特許文献1参照)。
特開平8−146985号公報
今井、都木、蓮田、武石著:「聴取補助機能を備えたラジオの開発」、電子情報通信学会、信学技報TL2003−7、2003年6月
ところで、この様な話速変換技術は、放送業者によっても精力的に研究されており、将来はテレビジョン放送の音声信号やラジオ放送において、送信側で話速変換処理を行った音声信号を送信し、高齢者の視聴に便宜を図ることが考えられる。このため、受信側での話速変換機能に加えて、放送などにおいて番組によっては送信側でも話速変換処理が行われる様になると、話速変換が二重にかかってしまうことも起こり得る様になる。
その場合、すでに話速変換がかけられた音声信号にさらに話速変換を施すことになり、必要以上にゆっくりした音声になってしまったりして、かえって聞き苦しい音になるという問題がある。これに関しては、従来の受信機では、ユーザが手動で話速変換機能をオフにすればよいが、番組によってその都度話速変換の有無の切り換え操作を行わなければならず、操作が煩わしいという問題点が考えられる。また、高齢者自身がこれを切り換えることは実使用において考えづらい。
本発明は以上の点に鑑みなされたもので、放送された音声信号に付随する情報を利用して、話速変換が送信側と受信側で二重に処理が行われてしまうことを自動的に防止し得る音声信号処理装置及び音声信号処理方法を提供することを目的とする。
また、本発明の他の目的は、受信する番組に応じた話速変換の有無の切り換え操作を不要とし得る音声信号処理装置及び音声信号処理方法を提供することにある。
上記の目的を達成するため、本発明の音声信号処理装置は、複数の音声信号と、前記複数の音声信号のそれぞれに送信側で音声ピッチを変えることなく、時間軸を変化させる話速変換処理に適合する音声であるか否かを示す話速変換適合情報とが多重された多重信号を受信する受信手段と、前記受信手段により受信した多重信号中から前記話速変換適合情報を検出して、その内容を判別する検出手段と、前記受信手段により受信した多重信号中から前記音声信号を再生する再生手段と、前記検出手段により検出した前記話速変換適合情報の内容が前記話速変換に適合していると判定された場合には、前記再生手段により再生する前記音声信号の話速変換処理を行い、前記話速変換適合情報の内容が話速変換に適合していないと判定された場合には、前記再生手段により再生する前記音声信号の話速変換処理を行うことなく出力する話速変換処理手段とを備えることを特徴とする。
この発明では、送信側から送信された複数の音声信号と、その音声信号が話速変換に適合する音声であるか否かを示す話速変換適合情報とを受信し、話速変換適合情報の内容が話速変換に適合していると判定された場合にのみ、そのとき再生手段により再生される音声信号の話速変換処理を行うことができる。
また、上記の目的を達成するため、本発明の音声信号処理方法は、複数の音声信号と、前記複数の音声信号のそれぞれについて、少なくとも音声ピッチを変えることなく、時間軸を変化させる話速変換に適合する音声であるか否かを示す話速変換適合情報とが多重された多重信号を受信する受信ステップと、前記受信ステップにて受信した前記多重信号中から前記複数の音声信号のうちのいずれかの音声信号を選択する選択ステップと、前記選択ステップにて選択した音声信号の前記話速変換適合情報を検出して、話速変換に適合する音声であるか否かを判定する第1の判定ステップと、前記第1の判定ステップにて、前記選択した音声信号が話速変換に適合する音声であると判定された場合に、前記選択した音声信号に対応し、話速変換された別の音声信号が前記多重信号中に含まれているか否か判定する第2の判定ステップと、前記第2の判定ステップにて前記多重信号中に前記別の音声信号が含まれていると判定された場合に、前記選択した音声信号を前記別の音声信号へと切り換える切換ステップと、前記第1の判定ステップにて前記選択した音声信号が話速変換に適合する音声ではないと判定された場合、及び、前記切換ステップにて前記別の音声信号へと切り換えた場合に、前記選択した音声信号または前記別の音声信号を、話速変換処理を行うことなく再生する第1の再生ステップと、前記第2の判定ステップにて前記多重信号中に前記別の音声信号が含まれていないと判定された場合に、前記選択した音声信号を、話速変換処理を行って再生する第2の再生ステップとを含むことを特徴とする。
この発明では、送信側から送信された複数の音声信号と、その音声信号が話速変換に適合する音声であるか否かを示す話速変換適合情報とを受信し、再生手段により再生された音声信号に付随する話速変換適合情報の内容が話速変換に適合していると判定され、かつ、再生手段により再生された音声信号に対応する話速変換された別の音声信号が、受信された多重信号中に含まれていない場合にのみ、そのとき再生手段により再生される音声信号の話速変換処理を行うことができる。
本発明によれば、送信側から送信された音声信号と話速変換に関する付随情報とを受信し、話速変換に関する付随情報に基づき、再生された音声信号の話速変換処理を行うか否かを自動的に判別するようにしたため、受信側の音声信号処理装置のユーザがその都度切り替えを行わなくても、受信した音声信号の話速変換について常に最適な設定で聞くことができる。
また、本発明によれば、話速変換済みの受信音声信号に対しては、話速変換処理を行わないようにしたため、ユーザが選局受信する毎に話速変換の切り換えを行わなくても、話速変換が送信側と受信側で二重に処理が行われてしまうことを自動的に防止できる。
また、本発明によれば、送信装置から送信されている話速変換を行った音声信号を極力利用するようにしたため、受信側の音声信号処理装置で話速変換を行ったときに、音の途切れる個所が無く、話速変換そのものがうまくいかないという現象を極力回避できると共に、音声信号処理装置の消費電力を低減することができる。
さらに、本発明によれば、送信側から送信された複数の音声信号と、その音声信号が話速変換に適合する音声であるか否かを示す話速変換適合情報とを受信し、話速変換適合情報の内容が話速変換に適合していると判定された場合にのみ、そのとき再生手段により再生される音声信号の話速変換処理を行うようにしたため、話速変換処理を行うのが好適な音声信号のみを自動的に判別して話速変換を行うことができる。
本発明の音声信号処理装置の第1の実施の形態のブロック図である。 図1の実施の形態で送受信される話速変換済情報の一例を示す図である。 図1の話速変換処理部の動作説明用フローチャートである。 本発明の音声信号処理装置の第2の実施の形態のブロック図である。 音声の組の例、対応話速変換音声情報、及び話速変換適合情報の各例を示す図である。 図4の実施の形態の動作説明用フローチャートである。 本発明の第3の実施の形態の動作説明用フローチャートである。
次に、本発明を実施するための最良の形態について、図面と共に説明する。本発明の音声信号処理装置及び音声信号処理方法は、放送側で音声信号に付随する情報が送られてきているのを前提に、それを用いて話速変換機能のオン・オフを制御するものである。以下、いくつかの考えられる実施の形態について述べる。
図1は本発明になる音声信号処理装置の第1の実施の形態のブロック図を示す。図1において、第1の実施の形態の音声信号処理装置10Aは、送信装置1に伝送路3を介して接続されており、送信装置1から送信された、多数の音声信号がパケット多重化された信号を伝送路3を介して受信し、さらにその受信信号中から所望の音声信号を選択受信してデコードして音声出力を得ると共に、その音声出力の話速変換機能を有している。
ここで、送信装置1は、パケット化部2において、各音声信号(図1では第1から第5までの音声信号が示されている)をそれぞれ音声パケットにパケット化した後、各音声パケットに含まれているパケット識別のためのパケットID(PID)により区別して送信すると共に、音声パケットの他に、制御情報/番組情報のパケットを送信する。受信側で所望の音声信号が選択できる様に、上記の制御情報/番組情報の一種としては、例えば、MPEG(Moving Picture Experts Group)に規定されているプログラム・アソシエーション・テーブル(PAT:Program Association Table)及びプログラム・マップ・テーブル(PMT:Program Map Table)という情報が送られる。
特定のPIDを持つPATにおいて、番組を構成する映像や音声のパケットの情報を伝送するPMTのPIDの情報が送られ、PMTは各番組毎にその番組を構成する映像や音声のパケットのPIDが記されているため、これらを辿って所望の番組の映像や音声の信号のうちの特定のものを抽出することができる。
さらに、本実施の形態では、音声信号に付随する情報として、各音声信号が話速変換が送信側あるいはさらに前の音源ですでに施された信号であるか否かの情報(図2に示す話速変換済情報)を送信するようにしている。この話速変換済情報は、特別に常に所定のPIDで送信するようにしてもよく、PMT等においてそのPIDの情報が記される様にして、この情報が受信側で取り出せる様にしてもよい。図2では、各音声パケットのPIDに対して、その音声パケットが話速変換済みであるときは「1」、話速変換が施されていないときは「0」とした情報を表にして送っている。
音声信号処理装置10Aは、話速変換済情報を含む制御情報/番組情報と音声パケットとの多重信号を伝送路3を介して受信部11で受信し、受信信号中の音声パケットは音声信号デコーダ12でデコードし、また、受信信号中の話速変換済情報のパケットが話速変換情報検出部13においてPIDから抜き取られ、話速変換済情報が検出される。
話速変換処理部14は、話速変換情報検出部13において検出された話速変換済情報に基づき、音声信号デコーダ12から出力されたデコード後の音声信号に対して図3のフローチャートに従った話速変換処理を行う。すなわち、話速変換処理部14は、検出された上記話速変換済情報に基づき、音声信号デコーダ12から出力されたデコード後の選択された音声信号の話速変換が送信前で既に施されているか否かを判定し(図3のステップS101)、話速変換が送信前に施されている場合は話速変換処理動作をオフとして話速変換処理を行うことなく受信音声信号を出力端子15へ出力し(図3のステップS102)、話速変換が送信前に施されていない場合は話速変換処理動作をオンとして受信音声信号に対して、音声区間の信号の時間軸を圧縮/伸張し、さらに所定長さ以上の無音区間は削除する公知の話速変換処理を行ってから出力端子15へ出力する(図3のステップS103)。
このように、本実施の形態では、音声信号が話速変換が送信側あるいはさらに前の音源ですでに施された信号であるか否かの話速変換済情報を送信し、音声信号処理装置10Aが上記の話速変換済情報に基づき、受信音声信号が話速変換済みであるか否かを自動判別し、話速変換済みの受信音声信号に対しては、話速変換処理を行わないようにしたため、ユーザが選局受信する毎に話速変換の切り換えを行わなくても、話速変換が送信側と受信側で二重に処理が行われてしまうことを自動的に防止できる。
次に、本発明の第2の実施の形態について説明する。図4は本発明になる音声信号処理装置の第2の実施の形態のブロック図を示す。同図中、図1と同一構成部分には同一符号を付し、その説明を省略する。図4において、本発明の第2の実施の形態の音声信号処理装置10Bは、伝送路3を介して送信装置4に接続されており、送信装置4から特に映像と複数の音声が組となって構成された番組を複数送信されて、これを受信する。
図4に示すように、送信装置4は一つの映像信号と、複数の音声信号からなる番組を、番組#01、番組#02という様に複数送信する。ここで、各番組の映像信号及び音声信号は、それぞれPIDで区別されてパケット化部5においてパケット化されて多重化されるが、各番組のPMTの情報がPATにより送られ、各番組についてその中に含まれる映像及び音声信号のPIDの対応表がPMTとして送られるので、音声信号処理装置10Bではこれらを辿って所望の番組の映像信号や音声信号の入ったパケットを特定でき、それらのパケットの中の情報をデコードすることにより映像や音声を得ることができる。
ここで、音声信号処理装置10Bは、その受信部11においてパケット多重された伝送信号を受信するが、受信されたパケット中の信号の中でPAT、PMT等の制御用信号がマイクロプロセッサ17に供給され、これらの情報とヒューマンインターフェイス手段(ボタンやキーボード、表示とカーソルキーなどを適宜用いればよい)16によりユーザが入力した情報とにより、ユーザにとって所望の番組の映像及び音声信号が抽出され、受信部11内の誤り訂正などを経て音声信号は音声信号デコーダ12に供給され、映像信号は映像信号デコーダ18に供給される。ここで、各番組に音声信号は複数あるが、それらの中のどれをデコードし出力するかについてもユーザにより選択が可能であるとする。
こうして選択された映像信号は映像信号デコーダ18により、例えばMPEG2などの方式でエンコードされた信号をデコードして、映像信号として映像出力端子19へ出力する。一方、選択された音声信号は、音声信号デコーダ12によりデコードされて、話速変換処理部14に入力されるが、ここでは後述する様に、場合によって、話速変換が施されるか、あるいは、話速変換処理をオフにしたり、話速変換処理部14をバイパスする等により、実質上ここでは音声信号に話速変換が施されない様にするか、いずれかに切り換えられる。話速変換処理部14から出力された音声信号は、図示せぬDA変換部を経てアナログ音声信号として音声出力端子15へ出力される。
図5(a)は番組内の音声信号の組の例を示す。この例では、日本語主音声、日本語副音声、英語の3つの基本的な音声信号があり、それらの中で日本語主音声及び英語については、送信側ですでに話速変換を施された音声信号がこれらの音声信号とは別に送られている。さらにBGM(バックグラウンドミュージック)としてこの番組の映像と共に再生するのに好適な音楽のみの音声信号や、新番組情報や番組時間変更などの「局からのお知らせ」の音声信号もあり、合計7種類の音声信号が送られる。
これらの音声信号について、対応話速変換音声情報として、元の音声信号に対して話速変換された音声情報があるときは、それらの対応関係を表にして送ることにする。その例が図5(b)である。ここで、図5(b)において、右側の数字は、同図(a)で各音声信号の左側につけられたこの番組内での音声信号番号に対応する。元の音声と、対応する話速変換音声が順に並べられており、この様な対応関係のある音声信号全てについて記述した後にEND情報があってこの情報の終わりであることを示している。
この対応話速変換音声情報は、PMTの中に記述されるこの伝送において特有のPIDを持つことにより、他の情報と区別して送ることができる。これに加えて図2の話速変換済情報が送られているとして、これらの情報も音声信号処理装置10Bはマイクロプロセッサ17に供給して処理する。
音声信号に関して、音声信号処理装置10Bにおいてマイクロプロセッサ17が行う動作の一例を図6に示す。なお、各ステップについて、図3と同じステップについては同じ記号で表すことにする。まず、マイクロプロセッサ17は、検出された上記話速変換済情報に基づき、音声信号デコーダ12から出力されたデコード後の選択された番組の選択された音声信号の話速変換が送信前で既に施されているか否かを判定する(図6のステップS201)。
話速変換が送信前に施されていると判定した場合は、話速変換処理動作をオフとして話速変換処理を行うことなく受信音声信号を出力端子15へ出力する(図6のステップS102)。他方、ステップS201において、話速変換済情報より、話速変換済みではないと判定した場合には、マイクロプロセッサ17は、選択された音声信号に対して対応する話速変換済み音声が送信されているか否かを判定する(図6のステップS202)。この判定は図5(b)に示した「対応話速変換音声情報」を参照して行えばよい。
ステップS202で対応する話速変換音声信号が送信されていることがわかった場合には、受信部11で抽出する音声信号をその音声信号に切り換える(図6のステップS203)。この場合、音声信号デコーダ12でデコードして再生する音声信号は、既に話速変換されているものとなるため、ステップS102に移行して、話速変換処理部14の話速変換処理をオフとされる。一方、ステップS202で対応する話速変換音声信号が送信されていないと判定した場合には、マイクロプロセッサ17は、ステップS103に移行して、話速変換処理部14により音声信号デコーダ12から出力される音声信号の話速変換処理を行う。
このように、本実施の形態では、送信装置4から話速変換を行った音声が送られているときには、極力それを利用することにしたのは、次の理由からである。送信装置4で話速変換を行うのであれば、アナウンサーや出演者の声を集録した音声に対して話速変換を行い、背景の音楽などは話速変換済み音声に対して後から付加することも可能である。これに対して、受信側の音声信号処理装置10Bで背景音楽などを含んだ音声に対して話速変換を行うと、背景音楽が乱れたり、背景音楽のレベルによっては音の途切れる個所が無く、話速変換そのものがうまくいかないことも起こるので、できるならば送信側で話速変換を行うのが望ましいからである。また、受信側の音声信号処理装置10Bとしては、話速変換機能を動作させないことで消費電力の低減にもなるからである。
次に、本発明の第3の実施の形態について説明する。本実施の形態では、第1の実施の形態で送信していた「話速変換済情報」の代わりに、図5(b)に示した「対応話速変換音声情報」と、図5(c)に示す「話速変換適合情報」を送信することにより、受信側の音声信号処理装置では話速変換が送信側では施されておらず、しかも話速変換に適している音声のみに対して話速変換をかけることができるようにしたものである。
図5(c)は、同図(a)に示した番組の各音声について話速変換に適合する場合は「1」、適合しない場合は「0」として表した話速変換適合情報の例を示す。ここでは日本語主音声(音声1)、日本語副音声(音声2)、英語音声(音声3)については話速変換適合とされている。また、4番目と5番目の音声は、それぞれ日本語主音声と英語についての話速変換を施された結果の音声であるため、受信側では話速変換を行わない方がよく、「0」とされている。さらに、6番目の「BGM」(音声6)の内容は音楽で、人の話し声ではないため、話速変換には適合しない。7番目の「局からのお知らせ」(音声7)はアナウンサーの声での案内であるため、話速変換は適合とされている。
このような話速変換適合信号が送信される場合の受信側の音声信号処理装置内のマイクロプロセッサの処理の一例について図7のフローチャートと共に説明する。なお、図7中、図3及び図6と同一の処理ステップには同一の符号を付してある。まず、上記のマイクロプロセッサは、選択された音声が受信側での話速変換に好適か否かを判定する(図7のステップS301)。これは伝送された上記の話速変換適合情報を抽出して参照することにより行われる。
マイクロプロセッサは、ステップS301で好適ではないと判定した場合には、話速変換は行わない(図7のステップS102)。図5(c)に示した例では、既に話速変換が施された第4あるいは第5番目の音声信号が選択されている場合や、送信側で話速変換処理は施されていないが、元々音楽情報で話速変換には適さない第6番目の音声信号(BGM)が選択されている場合がこれに相当する。
一方、マイクロプロセッサは、ステップS301で話速変換に好適と判定した場合には、その音声に対応する話速変換済み音声が送信されているか否かを判定する(図7のステップS202)。この判定は、受信した信号中の図5(b)に示した「対応話速変換音声情報」を抽出して参照すればよい。
このステップS202以後の処理は第2の実施の形態と同様であり、対応する話速変換音声が送信されている場合には、その音声に切り換えて受信側では話速変換処理は行わず(図7のステップS203、S102)、送信されていない場合には、受信側の話速変換処理を行う(図7のステップS103)。
従って、本実施の形態によれば、図5(b)の例では、1番目の日本語主音声、3番目の英語については対応する話速変換音声が存在し(それぞれについて4番目、5番目の音声信号が相当)、それらへの切り換えが行われる。一方、2番目の日本語副音声、及び7番目の「局からのお知らせ」については図5(c)に示したように、話速変換に適合するが、送信側では話速変換は施されていないので、受信側の音声信号処理装置で話速変換が行われる。
このように、本実施の形態によれば、送信側での話速変換処理が施されていない場合、その音声信号が話速変換に適合するか否かまで判定して、受信側で話速変換処理を行うのが好適な音声信号のみを自動的に判別して話速変換を行うことができる。
なお、本発明は以上の実施の形態に限定されるものではなく、例えば、図7において、ステップS202及びS203を削除し、選択された音声が話速変換に好適であるときは、ステップS103に進んで話速変換処理を行うようにしてもよい。また、本発明は音声信号処理装置10A及び10Bをコンピュータにより実現するコンピュータプログラムも含むものである。この場合、コンピュータプログラムは、記録媒体からコンピュータに取り込まれてもよいし、通信ネットワークを介してコンピュータにダウンロードしてもよい。
以上のように、第1の発明の音声信号処理装置は、音声信号と、音声信号に対し送信側で音声ピッチを変えることなく、時間軸を変化させる話速変換処理が施されているか否かを示す話速変換に関する付随情報とが多重された多重信号を受信する受信手段と、受信手段により受信された多重信号中から話速変換に関する付随情報を検出して、その内容を判別する検出手段と、受信手段により受信された多重信号中から音声信号を再生する再生手段と、検出手段により検出された話速変換に関する付随情報の内容が送信側で既に話速変換が施されていると判定された場合には、再生手段により再生された音声信号の話速変換処理は行わず、話速変換に関する付随情報の内容が送信側で話速変換が施されていないと判定された場合には、再生手段により再生された音声信号の話速変換処理を行う話速変換処理手段とを有する構成としたものである。
この発明では、送信側から送信された音声信号と話速変換に関する付随情報とを受信し、話速変換に関する付随情報に基づき、再生された音声信号の話速変換処理を行うか否かを自動的に判別することができる。
また、上記の目的を達成するため、第2の発明の音声信号処理装置は、第1の音声信号と、第1の音声信号に対応する第2の音声信号に対し送信側で音声ピッチを変えることなく、時間軸を変化させる話速変換処理が施されているか否かを示す対応話速変換音声の有無情報とが多重された多重信号を受信する受信手段と、受信手段により受信された多重信号中から対応話速変換音声の有無情報を検出して、その内容を判別する検出手段と、受信手段により受信された多重信号中から第1の音声信号又は第2の音声信号を再生する再生手段と、再生手段により再生された第1の音声信号に付随し、検出手段により検出された対応話速変換音声の有無情報の内容が、再生された第1の音声信号が送信側で話速変換が施されておらず、かつ、その第1の音声信号に対応する第2の音声信号が送信側で話速変換が施されて送信されていると判定された場合には、再生手段により再生された第2の音声信号を切り替えて出力し、対応話速変換音声の有無情報の内容が、再生された第1の音声信号が送信側で話速変換が施されておらず、かつ、その第1の音声信号に対応する第2の音声信号も送信されていないと判定された場合には、再生手段により再生された第1の音声信号の話速変換処理を行う話速変換処理手段とを有する構成としたものである。
この発明では、送信側から送信された第1の音声信号と、その第1の音声信号に対応し、かつ、話速変換された第2の音声信号が共に送信されているか否かを示す対応話速変換音声の有無情報とを受信し、再生された第1の音声信号が送信側で話速変換されていないときには、対応話速変換音声の有無情報に基づき、第1の音声信号に対応した話速変換された第2の音声信号を出力し、第2の音声信号が受信されないときにのみ第1の音声信号の話速変換を行うようにしたため、送信側から送信された話速変換された音声信号を極力用いることができる。
第3の発明の音声信号処理装置は、複数の音声信号と、複数の音声信号のそれぞれについて、音声ピッチを変えることなく、時間軸を変化させる話速変換に適合する音声であるか否かを示す話速変換適合情報とが多重された多重信号を受信する受信手段と、受信手段により受信された多重信号中から話速変換適合情報を検出して、その内容を判別する検出手段と、受信手段により受信された多重信号中から音声信号を再生する再生手段と、検出手段により検出された話速変換適合情報の内容が話速変換に適合していると判定された場合には、再生手段により再生された音声信号の話速変換処理を行い、話速変換適合情報の内容が話速変換に適合していないと判定された場合には、再生手段により再生された音声信号の話速変換処理を行うことなく出力する話速変換処理手段とを有することを特徴とする。
この発明では、送信側から送信された複数の音声信号と、その音声信号が話速変換に適合する音声であるか否かを示す話速変換適合情報とを受信し、話速変換適合情報の内容が話速変換に適合していると判定された場合にのみ、そのとき再生手段により再生される音声信号の話速変換処理を行うことができる。
第4の発明の音声信号処理方法は、音声信号と、音声信号に対し送信側で音声ピッチを変えることなく、時間軸を変化させる話速変換処理が施されているか否かを示す話速変換に関する付随情報とが多重された多重信号を受信する第1のステップと、受信された多重信号中から話速変換に関する付随情報を検出して、その内容を判別する第2のステップと、受信された多重信号中から音声信号を再生する第3のステップと、第2のステップにより検出された話速変換に関する付随情報の内容が送信側で話速変換が施されていないと判定された場合には、再生された音声信号の話速変換処理を行う第4のステップと、第2のステップにより検出された話速変換に関する付随情報の内容が送信側で既に話速変換が施されていると判定された場合には、再生された音声信号の話速変換処理は行うことなく出力する第5のステップとを含むことを特徴とする。
この発明では、送信側から送信された音声信号と話速変換に関する付随情報とを受信し、話速変換に関する付随情報に基づき、再生された音声信号の話速変換処理を行うか否かを自動的に判別することができる。
第5の発明の音声信号処理方法は、複数の音声信号と、複数の音声信号のそれぞれについて、少なくとも音声ピッチを変えることなく、時間軸を変化させる話速変換に適合する音声であるか否かを示す話速変換適合情報とが多重された多重信号を受信する第1のステップと、受信された多重信号中から話速変換適合情報を検出して、その内容を判別する第2のステップと、受信された多重信号中から音声信号を再生する第3のステップと、第2のステップにより検出された話速変換適合情報の内容が話速変換に適合していると判定された場合には、再生手段により再生された音声信号に対応する話速変換された別の音声信号が、受信された多重信号中に含まれているか否か判定する第4のステップと、第4のステップにより別の音声信号が、受信された多重信号中に含まれていると判定した場合は、多重信号中から再生手段により別の音声信号を再生して切り替える第5のステップと、第4のステップにより別の音声信号が、受信された多重信号中に含まれていないと判定した場合は、再生手段により再生された音声信号の話速変換処理を行う第6のステップと、第2のステップにより検出された話速変換適合情報の内容が話速変換に適合していないと判定されたときの再生手段により再生された音声信号、又は第5のステップにより切り替え出力された別の音声信号に対して話速変換処理を行うことなく出力する第7のステップとを含むことを特徴とする。
この発明では、送信側から送信された複数の音声信号と、その音声信号が話速変換に適合する音声であるか否かを示す話速変換適合情報とを受信し、再生手段により再生された音声信号に付随する話速変換適合情報の内容が話速変換に適合していると判定され、かつ、再生手段により再生された音声信号に対応する話速変換された別の音声信号が、受信された多重信号中に含まれていない場合にのみ、そのとき再生手段により再生される音声信号の話速変換処理を行うことができる。
本発明の音声信号処理方法は、放送において話速変換音声を送信するサービスも行う場合の受信機側の対応において適用できる。
1,4 送信装置
2,5 パケット化部
3 伝送路
10A,10B 音声信号処理装置
11 受信部
12 音声信号デコーダ
13 話速変換情報検出部
14 話速変換処理部
15 音声出力端子
16 ヒューマンインターフェイス手段
17 マイクロプロセッサ
18 映像信号デコーダ
19 映像出力端子

Claims (2)

  1. 複数の音声信号と、前記複数の音声信号のそれぞれに送信側で音声ピッチを変えることなく、時間軸を変化させる話速変換処理に適合する音声であるか否かを示す話速変換適合情報とが多重された多重信号を受信する受信手段と、
    前記受信手段により受信した多重信号中から前記話速変換適合情報を検出して、その内容を判別する検出手段と、
    前記受信手段により受信した多重信号中から前記音声信号を再生する再生手段と、
    前記検出手段により検出した前記話速変換適合情報の内容が前記話速変換に適合していると判定された場合には、前記再生手段により再生する前記音声信号の話速変換処理を行い、前記話速変換適合情報の内容が話速変換に適合していないと判定された場合には、前記再生手段により再生する前記音声信号の話速変換処理を行うことなく出力する話速変換処理手段と
    を備えることを特徴とする音声信号処理装置。
  2. 複数の音声信号と、前記複数の音声信号のそれぞれについて、少なくとも音声ピッチを変えることなく、時間軸を変化させる話速変換に適合する音声であるか否かを示す話速変換適合情報とが多重された多重信号を受信する受信ステップと、
    前記受信ステップにて受信した前記多重信号中から前記複数の音声信号のうちのいずれかの音声信号を選択する選択ステップと、
    前記選択ステップにて選択した音声信号の前記話速変換適合情報を検出して、話速変換に適合する音声であるか否かを判定する第1の判定ステップと、
    前記第1の判定ステップにて、前記選択した音声信号が話速変換に適合する音声であると判定された場合に、前記選択した音声信号に対応し、話速変換された別の音声信号が前記多重信号中に含まれているか否か判定する第2の判定ステップと、
    前記第2の判定ステップにて前記多重信号中に前記別の音声信号が含まれていると判定された場合に、前記選択した音声信号を前記別の音声信号へと切り換える切換ステップと、
    前記第1の判定ステップにて前記選択した音声信号が話速変換に適合する音声ではないと判定された場合、及び、前記切換ステップにて前記別の音声信号へと切り換えた場合に、前記選択した音声信号または前記別の音声信号を、話速変換処理を行うことなく再生する第1の再生ステップと、
    前記第2の判定ステップにて前記多重信号中に前記別の音声信号が含まれていないと判定された場合に、前記選択した音声信号を、話速変換処理を行って再生する第2の再生ステップと
    を含むことを特徴とする音声信号処理方法。
JP2009176279A 2009-07-29 2009-07-29 音声信号処理装置及び音声信号処理方法 Expired - Fee Related JP4894896B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009176279A JP4894896B2 (ja) 2009-07-29 2009-07-29 音声信号処理装置及び音声信号処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009176279A JP4894896B2 (ja) 2009-07-29 2009-07-29 音声信号処理装置及び音声信号処理方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2003345147A Division JP4385710B2 (ja) 2003-10-03 2003-10-03 音声信号処理装置及び音声信号処理方法

Publications (2)

Publication Number Publication Date
JP2009244912A true JP2009244912A (ja) 2009-10-22
JP4894896B2 JP4894896B2 (ja) 2012-03-14

Family

ID=41306767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009176279A Expired - Fee Related JP4894896B2 (ja) 2009-07-29 2009-07-29 音声信号処理装置及び音声信号処理方法

Country Status (1)

Country Link
JP (1) JP4894896B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014505898A (ja) * 2010-12-03 2014-03-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 複数のメディア処理ノードによる適応処理
CN110853619A (zh) * 2018-08-21 2020-02-28 上海博泰悦臻网络技术服务有限公司 人机交互方法、控制装置、被控装置及存储介质
CN114566060A (zh) * 2022-02-23 2022-05-31 成都智元汇信息技术股份有限公司 公共交通消息通知处理方法、装置、系统、电子设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08146985A (ja) * 1994-11-17 1996-06-07 Sanyo Electric Co Ltd 話速制御システム
JPH0983673A (ja) * 1995-09-19 1997-03-28 Hitachi Ltd 音声通信システム、音声通信方法および送受信装置
JP2001242890A (ja) * 2000-02-28 2001-09-07 Kanaasu Data Kk 音声データのデータ構造、生成方法、再生方法、記録方法、記録媒体、配信方法、及びマルチメディアの再生方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08146985A (ja) * 1994-11-17 1996-06-07 Sanyo Electric Co Ltd 話速制御システム
JPH0983673A (ja) * 1995-09-19 1997-03-28 Hitachi Ltd 音声通信システム、音声通信方法および送受信装置
JP2001242890A (ja) * 2000-02-28 2001-09-07 Kanaasu Data Kk 音声データのデータ構造、生成方法、再生方法、記録方法、記録媒体、配信方法、及びマルチメディアの再生方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014505898A (ja) * 2010-12-03 2014-03-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 複数のメディア処理ノードによる適応処理
JP2016136256A (ja) * 2010-12-03 2016-07-28 ドルビー ラボラトリーズ ライセンシング コーポレイション 複数のメディア処理ノードによる適応処理
US9842596B2 (en) 2010-12-03 2017-12-12 Dolby Laboratories Licensing Corporation Adaptive processing with multiple media processing nodes
CN110853619A (zh) * 2018-08-21 2020-02-28 上海博泰悦臻网络技术服务有限公司 人机交互方法、控制装置、被控装置及存储介质
CN110853619B (zh) * 2018-08-21 2022-11-25 上海博泰悦臻网络技术服务有限公司 人机交互方法、控制装置、被控装置及存储介质
CN114566060A (zh) * 2022-02-23 2022-05-31 成都智元汇信息技术股份有限公司 公共交通消息通知处理方法、装置、系统、电子设备及介质
CN114566060B (zh) * 2022-02-23 2023-03-24 成都智元汇信息技术股份有限公司 公共交通消息通知处理方法、装置、系统、电子设备及介质

Also Published As

Publication number Publication date
JP4894896B2 (ja) 2012-03-14

Similar Documents

Publication Publication Date Title
JP6721510B2 (ja) 2つの電子デバイスにおいて再生を同期させるための方法及び装置
JP2010187158A (ja) コンテンツ処理装置
JP2009111777A (ja) デジタル放送受信装置
JP2004151614A (ja) 文字データ修正装置、その方法及びそのプログラム、並びに、字幕の生成方法
JP4894896B2 (ja) 音声信号処理装置及び音声信号処理方法
JP2008061000A (ja) 放送受信装置、放送受信装置の制御方法、及び、プログラム
JP4385710B2 (ja) 音声信号処理装置及び音声信号処理方法
US20050075860A1 (en) Apparatus for processing speech signal and method thereof as well as method for communicating speech and apparatus thereof
JP2009277277A (ja) 音声処理装置
JP3550110B2 (ja) 信号処理回路および信号処理方法
JP2008167143A (ja) 記録装置、記録制御方法、記録制御プログラムおよび記録媒体
JP6733990B2 (ja) 解説音声再生装置、解説音声生成装置及び解説音声再生プログラム
JP3825589B2 (ja) マルチメディア端末機器
US8892229B2 (en) Audio apparatus
KR101262949B1 (ko) 디지털 방송수신기의 서비스채널 변경 장치 및 방법
JP6440314B2 (ja) 受信装置、受信方法、及びプログラム
KR100782830B1 (ko) 디지털 멀티미디어 방송 오디오 데이터를 저장하는 방송수신 장치 및 방법
JP3794565B2 (ja) オーディオ再生装置
KR101358709B1 (ko) 디지털 방송수신기의 서비스채널 변경 장치 및 방법
JP6559542B2 (ja) 受信装置、受信方法およびプログラム
JP2006050013A (ja) テレビ放送受信装置、記録再生装置
JP2008141483A (ja) ツリー型配信システム、ノード装置、情報処理プログラム及び情報配信方法
JP6436573B2 (ja) 受信装置、受信方法、及びプログラム
KR100703002B1 (ko) 선택적 인코딩이 가능한 신호처리장치 및 그의 선택적인코딩 방법
KR100835862B1 (ko) Tv의 오디오 재생 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090729

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110927

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20111012

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111129

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111212

R150 Certificate of patent or registration of utility model

Ref document number: 4894896

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150106

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees