JP3999812B2 - 音復元装置および音復元方法 - Google Patents
音復元装置および音復元方法 Download PDFInfo
- Publication number
- JP3999812B2 JP3999812B2 JP2007500432A JP2007500432A JP3999812B2 JP 3999812 B2 JP3999812 B2 JP 3999812B2 JP 2007500432 A JP2007500432 A JP 2007500432A JP 2007500432 A JP2007500432 A JP 2007500432A JP 3999812 B2 JP3999812 B2 JP 3999812B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- information
- characteristic
- restored
- restoration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 44
- 239000000284 extract Substances 0.000 claims description 36
- 238000000926 separation method Methods 0.000 description 64
- 238000000605 extraction Methods 0.000 description 53
- 238000010586 diagram Methods 0.000 description 36
- 230000015572 biosynthetic process Effects 0.000 description 22
- 238000003786 synthesis reaction Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 12
- 230000007613 environmental effect Effects 0.000 description 10
- 239000000463 material Substances 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 230000003595 spectral effect Effects 0.000 description 9
- 238000012544 monitoring process Methods 0.000 description 8
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 235000009508 confectionery Nutrition 0.000 description 5
- 238000012880 independent component analysis Methods 0.000 description 5
- 230000003252 repetitive effect Effects 0.000 description 3
- 241000282693 Cercopithecidae Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000036651 mood Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000033764 rhythmic process Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 241001122315 Polites Species 0.000 description 1
- 206010039740 Screaming Diseases 0.000 description 1
- 208000003028 Stuttering Diseases 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
野口、外3名、"1チャネル入力信号中の突発性雑音の判別と除去"、2004年3月、日本音響学会講演論文集、pp.665−656
図4は、本発明の実施の形態1における音復元装置の全体構成を示すブロック図である。ここでは、本発明に係る音復元装置がヘッドホン装置101に組み込まれた例を用いて説明する。
混合音分離部103は、混合音S101から復元する音の材料、すなわち分離された音の波形に関する情報および音の欠落に関する情報を分離音情報S102として抽出する。
〈i〉欠落部分の音声を復元する方法
利用者は、駅のホームで自分の乗る電車がホームに何時に到着するのかを確認するために駅のアナウンスに耳を傾けている。しかし、突然チャイムがなりアナウンスの音声が部分的に欠落してしまっている。そこで本発明の音復元装置を用いることでアナウンスの音声を復元する方法について述べる。
音復元部108は、復元する音の欠落部分の音を、音構造情報S103および音特性情報S105に基づいて復元を行い、それ以外の音を、分離音情報S102を用いて作成する。
利用者は、交差点で友達2人と話しをしている。しかし、自動車の騒音や周りの人の話し声などで友達の音声が聞こえにくくなっているものとする。そこで本発明の音復元装置を用いることで友達2人の音声を復元する方法について述べる。この例では、図4において、混合音S101に対応するものは、友達の話し声と、自動車の騒音や周囲の人の声が重なった混合音であり、復元音S106に対応するものは、友達2人の話し声である。〈I〉の〈i〉の例と異なる点は、混合音分離部103の動作、同一音特性領域分析部106の動作、音特性抽出部107の動作、音復元部108の動作である。そこで、図15に示すように、混合音分離部103を混合音分離部103A、同一音特性領域分析部106を同一音特性領域分析部106A、音特性抽出部107を音特性抽出部107A、音復元部108を音復元部108Aとする。音復元部108Aは、欠落した部分の音と欠落した部分以外の音とを合わせた復元対象音全体を、上述の音構造分析手段で作成された音素系列、文字系列および音符系列のうちの少なくとも1つと抽出された音特性とを用いて復元する音復元手段の一例である。
〈i〉欠落部分の楽音を復元する方法
利用者は、街角でながれる街角BGM(Back Ground Music)を聞いている。しかし、自動車のクラクションがなり街角BGMの楽音が部分的に欠落してしまっている。そこで本発明の音復元装置を用いることで街角BGMを復元する方法について述べる。この例では、図4において、混合音S101に対応するものは、街角BGMと自動車のクラクションが重なった混合音であり、復元音S106に対応するものは、街角BGMである。〈I〉の〈i〉の例と異なる点は、音構造知識データベース105の記憶内容、音構造分析部104の動作、同一音特性領域分析部106の動作、音特性抽出部107の動作、音復元部108の動作である。そこで、図19に示すように、音構造知識データベース105を音構造データベース105B、音構造分析部104を音構造分析部104B、同一音特性領域分析部106を同一音特性領域分析部106B、音特性抽出部107を音特性抽出部107B、音復元部108を音復元部108Bとする。また、混合音S101を混合音S101B、分離音情報S102を分離音情報S102B、音構造情報S103を音構造情報S103B、同一音特性領域情報S104を同一音特性領域情報S104B、音特性情報S105を音特性情報S105B、復元音S106を復元音S106Bとする。ここでは、音声ではなく楽音を復元する。音復元部108Bは、復元する楽音の欠落部分の音を、音構造情報S103Bおよび音特性情報S105Bに基づいて復元を行い、それ以外の音を分離音情報S102Bにより作成する。
利用者は、コンサート会場でクラシック音楽を聞いている。しかし、隣の人がお菓子をボリボリ食べ始めたために音楽が聞こえにくくなっているものとする。そこで本発明の音復元装置を用いることでクラシック音楽を復元する方法について述べる。この例では、図4において、混合音S101に対応するものは、クラシック音楽にお菓子をボリボリ食べる音が重なった混合音であり、復元音S106に対応するものは、クラシック音楽である。図19の〈II〉の〈i〉の例と異なる点は、混合音分離部103の動作、音特性抽出部107Bの動作、音復元部108Bの動作である。そこで、図22に示すように、混合音分離部103Bは混合音分離部103A(〈I〉の〈ii〉の例を参照)を用い、音特性抽出部107Bを音特性抽出部107C、音復元部108Bを音復元部108Cとする。また、混合音S101Bを混合音S101C、分離音情報S102Bを分離音情報S102C、音構造情報S103Bを音構造情報S103C、同一音特性領域情報S104Bを同一音特性領域情報S104C、音特性情報S105Bを音特性情報S105C、復元音S106Bを復元音S106Cとする。ここで音復元部108Cは、〈I〉の〈ii〉の例と同様に、復元する音の欠落部分を含む全体の音を、音構造情報S103Cおよび音特性情報S105Cに基づいて復元を行う。このとき、全体の音のバランス情報に基づいて音全体を復元する。ここで〈I〉の〈ii〉の例と異なる点は、復元する音が音声ではなく楽音であることである。
込んだ混合音S101Cを用いて分離音情報S102Cを抽出する(図5のステップ401に対応)。ここでは、抽出する分離音情報は音声に関するものではなく楽音に関するものである。ここでは、図17と同様な形式の分離音情報が抽出できる。ただし、この例では、音声波形ではなく楽音波形である。
クラシック音楽の音構造情報S103Cを作成する(図5のステップ402に対応)。
性領域情報S104Cを作成する(図5のステップ403に対応)。
異なり、図17のような歪み度合いを含む分離音情報S102Cを用いて、歪み度合いの小さいフレームの音特性を利用して音特性を推定する。なお、歪み度合いの大きさに比例した重み付けで音特性の量を線形加算して推定してもよい。
利用者は、街角を友達と話しをしながら歩いている。しかし、自動車の騒音や周りの人の話し声で友達の声が聞き取りにくい。そのとき、自転車が後ろからきて自転車のベルの音がなった。しかし、周りの騒音で自転車のベルの音が聞き取りにくくなっているものとする。そこで本発明の音復元装置を用いることで友達の話し声と自転車のベルの音を復元する方法について述べる。この例では、図4において、混合音S101に対応するものは、友達の話し声と自転車のベルの音と周囲の騒音が重なった混合音であり、復元音S106に対応するものは、友達の話し声と自転車のベルの音である。〈I〉の〈i〉の例と異なる点は、復元する音が音声だけではなく音声と環境音の2つであり、しかも、復元したい音である音声と環境音が一部重なっていることである。
実施の形態2では、音特性一部変更部により音特性を一部変更することで、利用者に聞きやすくかつ自然な音で復元できることについて述べる。ここでは、本発明に係る音復元装置が音編集装置に組み込まれた例で説明する。復元する音として、〈IV〉音声を復元する場合、〈V〉楽音を復元する場合、について述べる。
図29は、本発明の実施の形態2における〈IV〉の例の音復元装置の全体構成を示すブロック図である。図29において、音編集装置201は、テレビ、パソコン、DVD(Digital Versatile Disc)編集器などに組み込むことも可能であり、混合音の中から利用者が必要とする音を、音特性の一部を変更して聞きやすい音で復元するという音復元機能を実装している。音編集装置201は、データ読み取り部202と、混合音分離部103と、音構造分析部104と、音構造知識データベース105と、同一音特性領域分析部106と、音特性抽出部107と、音特性一部変更部203と、音復元部204と、記憶部205と、スピーカ206とを備える。
図31は、本発明の実施の形態2における〈V〉の例の音復元装置の全体構成を示すブロック図である。図31において、〈IV〉の例と同じように、音編集装置201は、テレビ、パソコン、DVD編集器などに組み込むことも可能であり、混合音の中から利用者が必要とする音を、音特性の一部を変更して聞きやすい音で復元するという音復元機能を実装している。音編集装置201は、データ読み取り部202と、混合音分離部103と、音構造分析部104Bと、音構造知識データベース105Bと、同一音特性領域分析部106Bと、音特性抽出部107Bと、音特性一部変更部203Bと、音復元部204Bと、記憶部205と、スピーカ206とを備える。
合音分離部103が抽出した分離音情報S102Bと同一音特性領域分析部106Bが作成した同一音特性領域情報S104Bとに基づいて復元する街角BGMの音特性を同一の音特性より成る領域ごとに抽出して音特性情報S105Bを作成する(図30のステップ404に対応)。ここでは、音特性として、音量、音質、残響特性、音色を抽出する。
音構造一部変更部により音構造情報を一部変更することで、利用者にわかりやすくかつ自然な音で復元できることについて述べる。ここでは、本発明に係る音復元装置が携帯型テレビ電話装置に組み込まれた例で説明する。復元する音として、〈VI〉音声を復元する場合、〈VII〉楽音を復元する場合、について述べる。
図32は、本発明の実施の形態3における〈VI〉の例の音復元装置の全体構成を示すブロック図である。図32において、携帯型テレビ電話装置301は、混合音の中から利用者が必要とする音を、音構造の一部を変更してわかりやすい音で復元するという音復元機能を実装している。携帯型テレビ電話装置301は、受信部302と、混合音分離部103と、音構造分析部104と、音構造知識データベース105と、音構造一部変更部303と、同一音特性領域分析部106と、音特性抽出部107と、音復元部204と、スピーカ305とを備える。
図34は、本発明の実施の形態3における〈VII〉の例の音復元装置の全体構成を示すブロック図である。図34において、〈VI〉の例と同じように、携帯型テレビ電話装置301は、混合音の中から利用者が必要とする音を、音構造の一部を変更してわかりやすい音で復元するという音復元機能を実装している。携帯型テレビ電話装置301は、受信部302と、混合音分離部103と、音構造分析部104Bと、音構造知識データベース105Bと、音構造一部変更部303Bと、同一音特性領域分析部106Bと、音特性抽出部107Bと、音復元部304Bと、スピーカ305とを備える。
して、混合音分離部103が抽出した分離音情報S102Bに基づいて同一の音特性から成る領域を求めて同一音特性領域情報S104Bを作成する(図33のステップ403に対応)。
復元してもよい。たとえば、聴覚の時間分解能などを考慮して音構造を変更してもよい。なお、〈VI〉、〈VII〉の例で、実施の形態1の〈I〉の〈i〉、〈II〉の〈i〉を一部として用いて説明を行ったが、この形態に限らず、〈I〉の〈ii〉、〈II〉の〈ii〉、〈IV〉を一部として用いて音を復元してもよい。
102 マイク
103、103A、103D 混合音分離部
104、104B、104D 音構造分離部
105、105B、105D 音構造知識データベース
106、106Z、106A、106B、106D 同一音特性領域分析部
107、107A、107B、107C、107D 音特性抽出部
108、204、304、108A、108B、108C、108D、204B、304B 音復元部
109、206、305 スピーカ
201 音編集装置
202 データ読み取り部
203、203B 音特性一部変更部
205 記憶部
301 携帯型テレビ電話装置
302 受信部
303、303B 音構造一部変更部
S101、S101A、S101B、S101C、S101D 混合音
S102、S102A、S102B、S102C、S102D 分離音情報
S103、S103A、S103B、S103C、S103D 音構造情報
S104、S104A、S104B、S104C、S104D 同一音特性領域情報
S105、S105A、S105B、S105C、S105D 音特性情報
S106、S202、S302、S106A、S106B、S106C、S106D、S202B、S302B 復元音
S201、S201B 変更音特性情報
S301、S301B 変更音構造情報
3301 放送局
3302 受信装置
3303 音声認識装置
3304 言語分析装置
3305 音声合成器
3306 スピーカ
3401 入力部
3402 音声認識用音響モデル
3403 言語モデル
3404 音声認識部
3405 音声合成用音響モデル
3406 音声合成部
3407 モニタ部
3408 バッファ
3409 信号混合部
Claims (5)
- 混合音に含まれる、音の一部が欠落した復元対象音を復元する音復元装置であって、
前記混合音に含まれる復元対象音を抽出する混合音分離手段と、
音の意味内容が登録されている音構造知識データベースに基づいて、前記抽出された復元対象音の音が欠落した部分の音素系列、文字系列および音符系列のうちの少なくとも1つを作成する音構造分析手段と、
前記抽出された復元対象音を、同一の音特性を有する時間領域に区分けする同一音特性領域分析手段と、
前記区分けされた時間領域の中から欠落された部分が位置する時間領域を特定し、当該特定された時間領域において、前記欠落された部分以外の音から、前記復元対象音の音特性を抽出する音特性抽出手段と、
前記音構造分析手段で作成された前記音素系列、文字系列および音符系列のうちの少なくとも1つと前記抽出された音特性とを用いて、復元対象音において欠落した部分の音を復元する音復元手段と
を備える音復元装置。 - 前記同一音特性領域分析手段は、声質の変化、口調の変化、音色の変化、音量の変化、残響特性の変化および音質の変化のうちの少なくとも1つに基づいて、音特性が同一である時間領域を決定する
請求項1に記載の音復元装置。 - 前記音復元手段は、前記欠落した部分の音と前記欠落した部分以外の音とを合わせた復元対象音全体を、前記音構造分析手段で作成された前記音素系列、文字系列および音符系列のうちの少なくとも1つと前記抽出された音特性とを用いて復元する
請求項1に記載の音復元装置。 - 混合音に含まれる音の一部が欠落した復元対象音を復元する音復元方法であって、
前記混合音に含まれる復元対象音を抽出し、
音の意味内容が登録されている音構造知識データベースに基づいて、前記抽出された復元対象音の音が欠落した部分の音素系列、文字系列および音符系列のうちの少なくとも1つを作成し、
前記抽出された復元対象音を、同一の音特性を有する時間領域に区分けし、
前記区分けされた時間領域の中から欠落された部分が位置する時間領域を特定し、当該特定された時間領域において、前記欠落された部分以外の音から、前記復元対象音の音特性を抽出し、
作成された前記音素系列、文字系列および音符系列のうちの少なくとも1つと前記抽出された音特性とを用いて、復元対象音において欠落した部分の音を復元する
音復元方法。 - 混合音に含まれる音の一部が欠落した復元対象音を復元するプログラムであって、
前記混合音に含まれる復元対象音を抽出するステップと、
音の意味内容が登録されている音構造知識データベースに基づいて、前記抽出された復元対象音の音が欠落した部分の音素系列、文字系列および音符系列のうちの少なくとも1つを作成するステップと、
前記抽出された復元対象音を、同一の音特性を有する時間領域に区分けするステップと、
前記区分けされた時間領域の中から欠落された部分が位置する時間領域を特定し、当該特定された時間領域において、前記欠落された部分以外の音から、前記復元対象音の音特性を抽出するステップと、
作成された前記音素系列、文字系列および音符系列のうちの少なくとも1つと前記抽出された音特性とを用いて、復元対象音において欠落した部分の音を復元するステップと
をコンピュータに実行させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005017424 | 2005-01-25 | ||
JP2005017424 | 2005-01-25 | ||
PCT/JP2005/022802 WO2006080149A1 (ja) | 2005-01-25 | 2005-12-12 | 音復元装置および音復元方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP3999812B2 true JP3999812B2 (ja) | 2007-10-31 |
JPWO2006080149A1 JPWO2006080149A1 (ja) | 2008-06-19 |
Family
ID=36740183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007500432A Expired - Fee Related JP3999812B2 (ja) | 2005-01-25 | 2005-12-12 | 音復元装置および音復元方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7536303B2 (ja) |
JP (1) | JP3999812B2 (ja) |
WO (1) | WO2006080149A1 (ja) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100555287C (zh) * | 2007-09-06 | 2009-10-28 | 腾讯科技(深圳)有限公司 | 互联网音乐文件排序方法、系统和搜索方法及搜索引擎 |
US20090129605A1 (en) * | 2007-11-15 | 2009-05-21 | Sony Ericsson Mobile Communications Ab | Apparatus and methods for augmenting a musical instrument using a mobile terminal |
US8103511B2 (en) * | 2008-05-28 | 2012-01-24 | International Business Machines Corporation | Multiple audio file processing method and system |
US8892228B2 (en) * | 2008-06-10 | 2014-11-18 | Dolby Laboratories Licensing Corporation | Concealing audio artifacts |
CN101304391A (zh) * | 2008-06-30 | 2008-11-12 | 腾讯科技(深圳)有限公司 | 一种基于即时通讯系统的语音通话方法及系统 |
KR101042515B1 (ko) * | 2008-12-11 | 2011-06-17 | 주식회사 네오패드 | 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법 |
US8611558B2 (en) | 2009-02-26 | 2013-12-17 | Adobe Systems Incorporated | System and method for dynamic range extension using interleaved gains |
GB0919672D0 (en) * | 2009-11-10 | 2009-12-23 | Skype Ltd | Noise suppression |
CN102834842B (zh) * | 2010-03-23 | 2016-06-29 | 诺基亚技术有限公司 | 用于确定用户年龄范围的方法和装置 |
JP5529635B2 (ja) * | 2010-06-10 | 2014-06-25 | キヤノン株式会社 | 音声信号処理装置および音声信号処理方法 |
US9330675B2 (en) | 2010-11-12 | 2016-05-03 | Broadcom Corporation | Method and apparatus for wind noise detection and suppression using multiple microphones |
US8571873B2 (en) * | 2011-04-18 | 2013-10-29 | Nuance Communications, Inc. | Systems and methods for reconstruction of a smooth speech signal from a stuttered speech signal |
US8682678B2 (en) * | 2012-03-14 | 2014-03-25 | International Business Machines Corporation | Automatic realtime speech impairment correction |
JP6056172B2 (ja) * | 2012-03-30 | 2017-01-11 | ソニー株式会社 | データ処理装置、データ処理方法、及び、プログラム |
US10452986B2 (en) | 2012-03-30 | 2019-10-22 | Sony Corporation | Data processing apparatus, data processing method, and program |
JP2014106247A (ja) * | 2012-11-22 | 2014-06-09 | Fujitsu Ltd | 信号処理装置、信号処理方法および信号処理プログラム |
KR101475894B1 (ko) * | 2013-06-21 | 2014-12-23 | 서울대학교산학협력단 | 장애 음성 개선 방법 및 장치 |
CN105335592A (zh) * | 2014-06-25 | 2016-02-17 | 国际商业机器公司 | 生成时间数据序列的缺失区段中的数据的方法和设备 |
US10140089B1 (en) * | 2017-08-09 | 2018-11-27 | 2236008 Ontario Inc. | Synthetic speech for in vehicle communication |
WO2020226001A1 (ja) * | 2019-05-08 | 2020-11-12 | ソニー株式会社 | 情報処理装置および情報処理方法 |
US11727949B2 (en) * | 2019-08-12 | 2023-08-15 | Massachusetts Institute Of Technology | Methods and apparatus for reducing stuttering |
CN111556254B (zh) * | 2020-04-10 | 2021-04-02 | 早安科技(广州)有限公司 | 利用视频内容进行视频切割的方法、系统、介质及智能设备 |
CN113612808B (zh) * | 2021-10-09 | 2022-01-25 | 腾讯科技(深圳)有限公司 | 音频处理方法、相关设备、存储介质及程序产品 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2543577B2 (ja) | 1988-06-20 | 1996-10-16 | 沖電気工業株式会社 | 音声パケット補間方法 |
FI97758C (fi) * | 1992-11-20 | 1997-02-10 | Nokia Deutschland Gmbh | Järjestelmä audiosignaalin käsittelemiseksi |
US5673210A (en) * | 1995-09-29 | 1997-09-30 | Lucent Technologies Inc. | Signal restoration using left-sided and right-sided autoregressive parameters |
JP2000222682A (ja) | 1999-02-01 | 2000-08-11 | Honda Motor Co Ltd | 道路交通情報報知装置 |
JP3594514B2 (ja) * | 1999-07-12 | 2004-12-02 | 株式会社ソニー・コンピュータエンタテインメント | エンコーダ、デコーダ、音声データ処理装置、音声データ処理システム、音声データ圧縮方法、音声データ伸張方法、音声データ処理方法及び記録媒体 |
US7031980B2 (en) * | 2000-11-02 | 2006-04-18 | Hewlett-Packard Development Company, L.P. | Music similarity function based on signal analysis |
GB0202386D0 (en) * | 2002-02-01 | 2002-03-20 | Cedar Audio Ltd | Method and apparatus for audio signal processing |
JP2003295880A (ja) * | 2002-03-28 | 2003-10-15 | Fujitsu Ltd | 録音音声と合成音声を接続する音声合成システム |
US7243060B2 (en) * | 2002-04-02 | 2007-07-10 | University Of Washington | Single channel sound separation |
JP3950930B2 (ja) * | 2002-05-10 | 2007-08-01 | 財団法人北九州産業学術推進機構 | 音源の位置情報を利用した分割スペクトルに基づく目的音声の復元方法 |
JP3898660B2 (ja) * | 2003-03-12 | 2007-03-28 | 株式会社国際電気通信基礎技術研究所 | 音声信号の復元装置及びコンピュータプログラム |
US7024360B2 (en) * | 2003-03-17 | 2006-04-04 | Rensselaer Polytechnic Institute | System for reconstruction of symbols in a sequence |
EP1630791A4 (en) * | 2003-06-05 | 2008-05-28 | Kenwood Corp | SPEECH SYNTHESIS DEVICE, SPEECH SYNTHESIS METHOD, AND PROGRAM |
JP4287785B2 (ja) | 2003-06-05 | 2009-07-01 | 株式会社ケンウッド | 音声合成装置、音声合成方法及びプログラム |
WO2005122143A1 (ja) * | 2004-06-08 | 2005-12-22 | Matsushita Electric Industrial Co., Ltd. | 音声認識装置および音声認識方法 |
WO2007023660A1 (ja) * | 2005-08-24 | 2007-03-01 | Matsushita Electric Industrial Co., Ltd. | 音識別装置 |
KR100733965B1 (ko) * | 2005-11-01 | 2007-06-29 | 한국전자통신연구원 | 객체기반 오디오 전송/수신 시스템 및 그 방법 |
US8019089B2 (en) * | 2006-11-20 | 2011-09-13 | Microsoft Corporation | Removal of noise, corresponding to user input devices from an audio signal |
-
2005
- 2005-12-12 WO PCT/JP2005/022802 patent/WO2006080149A1/ja not_active Application Discontinuation
- 2005-12-12 JP JP2007500432A patent/JP3999812B2/ja not_active Expired - Fee Related
-
2006
- 2006-04-11 US US11/401,263 patent/US7536303B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPWO2006080149A1 (ja) | 2008-06-19 |
US7536303B2 (en) | 2009-05-19 |
WO2006080149A1 (ja) | 2006-08-03 |
US20060193671A1 (en) | 2006-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3999812B2 (ja) | 音復元装置および音復元方法 | |
US10789290B2 (en) | Audio data processing method and apparatus, and computer storage medium | |
McLoughlin | Applied speech and audio processing: with Matlab examples | |
US8898062B2 (en) | Strained-rough-voice conversion device, voice conversion device, voice synthesis device, voice conversion method, voice synthesis method, and program | |
RU2294565C2 (ru) | Способ и система динамической адаптации синтезатора речи для повышения разборчивости синтезируемой им речи | |
US6865533B2 (en) | Text to speech | |
Airas et al. | Emotions in vowel segments of continuous speech: analysis of the glottal flow using the normalised amplitude quotient | |
CN104081453A (zh) | 用于声学变换的系统和方法 | |
JPH10507536A (ja) | 言語認識 | |
JP2007086316A (ja) | 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体 | |
CN110663080A (zh) | 通过频谱包络共振峰的频移动态修改语音音色的方法和装置 | |
CN112289300B (zh) | 音频处理方法、装置及电子设备和计算机可读存储介质 | |
US11727949B2 (en) | Methods and apparatus for reducing stuttering | |
JP2002366173A (ja) | 感性データ算出方法および感性データ算出装置 | |
Hinterleitner | Quality of Synthetic Speech | |
WO2011122522A1 (ja) | 感性表現語選択システム、感性表現語選択方法及びプログラム | |
JP2005070430A (ja) | 音声出力装置および方法 | |
JP2000152394A (ja) | 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置 | |
JP2007025042A (ja) | 音声合成装置および音声合成プログラム | |
EP1271469A1 (en) | Method for generating personality patterns and for synthesizing speech | |
JP3914612B2 (ja) | 通信システム | |
CN114783408A (zh) | 一种音频数据处理方法、装置、计算机设备以及介质 | |
Laaksonen | Artificial bandwidth extension of narrowband speech-enhanced speech quality and intelligibility in mobile devices | |
US7092884B2 (en) | Method of nonvisual enrollment for speech recognition | |
Ferris | Techniques and challenges in speech synthesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070717 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070809 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 3999812 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100817 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110817 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110817 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120817 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130817 Year of fee payment: 6 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |