JP2001242890A - 音声データのデータ構造、生成方法、再生方法、記録方法、記録媒体、配信方法、及びマルチメディアの再生方法 - Google Patents

音声データのデータ構造、生成方法、再生方法、記録方法、記録媒体、配信方法、及びマルチメディアの再生方法

Info

Publication number
JP2001242890A
JP2001242890A JP2000051801A JP2000051801A JP2001242890A JP 2001242890 A JP2001242890 A JP 2001242890A JP 2000051801 A JP2000051801 A JP 2000051801A JP 2000051801 A JP2000051801 A JP 2000051801A JP 2001242890 A JP2001242890 A JP 2001242890A
Authority
JP
Japan
Prior art keywords
audio data
data
information
sound
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000051801A
Other languages
English (en)
Other versions
JP3620787B2 (ja
Inventor
Hiroshi Sekiguchi
博司 関口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KANAASU DATA KK
Original Assignee
KANAASU DATA KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KANAASU DATA KK filed Critical KANAASU DATA KK
Priority to JP2000051801A priority Critical patent/JP3620787B2/ja
Priority to PCT/JP2001/007252 priority patent/WO2003019535A1/ja
Publication of JP2001242890A publication Critical patent/JP2001242890A/ja
Application granted granted Critical
Publication of JP3620787B2 publication Critical patent/JP3620787B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

(57)【要約】 【課題】 聞き取り易さを損なうことなく、利用者側で
再生速度が変更された音声データの復号化を可能にする
音声データのデータ構造等を提供する。 【解決手段】 合成部(260)が、符号化部(210)が音声信
号から所定の規則に従って符号化した符号化音声データ
に、解析部(250)により特定された該符号化音声データ
の復号化の際に参照される発生音を構成する各部の音の
種類等を含む復号化補助情報を付加する。これにより、
利用者側にて任意の再生速度の音声データの復号化が可
能となり、情報通信技術を利用したデータ配信サービス
等のコンテンツとして有望な音声データとなり得る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、聞き取り易さを
損なうことなく、利用者側で任意に再生速度が変更され
た再生用音声データの復号化を可能にする音声データの
データ構造、生成方法、再生方法、記録方法、記録媒
体、配信方法、及び該音声データの再生速度に同期した
マルチメディアの再生方法に関するものである。
【0002】
【従来の技術】従来から、英会話等の語学の独習用、詩
吟の練習用、法律の独習用、歌の練習、その他の目的の
ために、カセットテープ等の記録媒体に音楽とともに音
声情報が記録された教材が種々提供されている。ここ
で、英会話の独習用の教材を例に説明すると、従来の主
な記録媒体は、例えば一連の英語の発声(音声情報)が
記録されてたカセットテープ(又はCD)であり、学習
者はこのテープ教材とテキストとを組み合せて使用して
いた。なお、このような教材には、初級用から上級用ま
で種々のレベルが用意されている。
【0003】また、日本国特許第2581700号に
は、複数の区画に区分された上級者学習用に適した音声
情報列(ナチュラル・スピードの発生音を構成する各部
の音)が記録された第1領域と、これら各区画に対応し
た等価な区画からなる初級者学習用に適した音声情報列
(はっきりとした発生音を構成する各部の音であって、
言語学上は同一の意味で派生の異なる音声)が記録され
た第2領域と、該上級者学習用及び初級者学習用の各音
声情報列の対応する各区画の関係を、これら音声情報列
の各区画の記録媒体における記録位置で示す情報が記録
された第3領域とを、少なくとも備えたCD−ROM等
の情報記録媒体、及びこのような構造を備えた情報記録
媒体の対応する区画間での切替え再生等を含む再生方法
が提案されている。
【0004】
【発明が解決しようとする課題】上述のように、日本国
特許第2581700号の情報記録媒体には、該媒体上
の第1領域にネイティブスピーカーの発生音を構成する
各部の音が記録され、また第2領域に言語上は同一の意
味で遅緩した発音で構成された音声情報列が記録されて
いる。したがって、第1領域に記録された音声情報列が
再生されている最中に再生音を聞き取れなかった場合、
第2領域に記録された同一内容の音声情報列(第1音声
情報列の再生中の区画と第2音声情報列の再生すべき区
画との対応は第3領域に記録されている)を切替えて再
生することにより、学習者は聞き取れなかった音声を認
知することができる。また、近年のパーソナル・コンピ
ュータ等の情報処理機器の普及・高性能化を考慮すれ
ば、制作時間の短縮や制作コストの削減のため、上記第
1領域に記録される音声情報列から遅緩した第2領域に
記録される音声情報列を生成することも不可能ではな
い。
【0005】しかしながら、単にネイティブ・スピーカ
ーの音声を時間軸に沿って均一に伸張させたのでは、利
用者の聞き取り易さを損なってしまう。すなわち、主と
して日本人がナチュラル・スピードの英語を単にゆっく
り再生して聴けるようにした場合であっても、各周波数
成分について単純にかつ一様に音声再生時間を伸ばした
り短縮したのでは不充分であり、発生音を構成する各部
の音、例えば子音部のスペクトルの時間変化が言語上の
音として別の音を意味する可能性があるからである。例
えば、BA(バ)とPA(パ)の発音は、前者のスペク
トル変化が速く、後者は遅いだけでスペクトルそのもの
はほとんど同じ形をしており、BA(バ)という発音の
子音部も含めて時間を伸長するとPA(パ)と聴こえる
ことになる。
【0006】一方、学習者のヒヤリング・レベルも、例
えば上記第2領域に記録された音声再生速度でも十分に
聞き取れない者、提供されたナチュラル・スピードでは
満足できない者など様々であり、このように異なるヒヤ
リング・レベルの学習者を個々に満足させようとする
と、各学習者のヒヤリング・レベルに応じた複数種類の
音声情報を予め用意しなければならない。しかしなが
ら、現状では学習者側で自分のヒヤリング・レベルに合
った音声情報を選択できず、また、各学習者のヒヤリン
グ・レベルに合った複数種類の音声情報を用意すること
は、CD等の記録媒体の記録容量に限界があるため現実
的ではない。
【0007】さらに、近年の情報通信技術の発達によ
り、インターネット等のコンピュータ・ネットワークを
利用したデータ配信も注目されている。このようなデー
タ配信を利用した音声情報の提供を考える場合、大量の
データを送信するにはまだまだ通信時間や通信コストの
面で実用レベルに達しているとは言えない。
【0008】この発明は上述のような課題を解決するた
めになされたもので、聞き取り易さを損なうことなく、
利用者側で希望する再生速度の再生用音声データの復号
化を可能にする音声データのデータ構造、生成方法、該
音声データから利用者側で希望する再生スピードの新た
な再生用音声データを復号化するための音声データの再
生方法、該音声データを所定の記録媒体に記録するため
の音声データの記録方法、該音声データが記録された記
録媒体、該音声データをコンピュータ・ネットワークや
衛生通信システムを利用して利用者に提供するための音
声データの配信方法、及び該音声データの再生動作に同
期した画像表示を可能にするためのマルチメディアの再
生方法を提供することを目的としている。
【0009】
【課題を解決するための手段】上述の課題を解決するた
め、この発明に係る音声データのデータ構造は、音声信
号から所定の規則に従って符号化された符号化音声デー
タと、該符号化音声データの復号化の際に参照される復
号化補助情報とを備える。
【0010】特に、上記復号化補助情報は、音声信号の
波動に関する物理量、例えば周波数スペクトル情報など
から特定された、少なくとも発生音を構成する各部の音
の種類に関する情報を含む。これは、上述のような子音
部の変化により異なる音に聞こえてしまう不具合を解消
するためである。子音部の伸長度をBA(バ)と聴こえ
る限界に留め、母音部のみ望みの音声再生時間に伸長あ
るいは短縮するようにすれば、BA(バ)のままに聴こ
えることになる。母音部はいくら伸長あるいは短縮して
もその母音のままで聴こえるから望みの長さ(望みの再
生時間)に設定できる。
【0011】一方、非英語圏の国民には弱すぎて聴き取
りにくい音声や特定の周波数成分だけを選択的に2倍と
か3倍に強調して聴かせることも語学学習等には必要で
ある。母音部も含めて強調したのでは全体が大きくなり
過ぎて効果がない。どうしても選択的に強調しなければ
ならない。そこで、上記復号化補助情報は、強調すべき
位置を指示するための強調位置識別情報を含むのが好ま
しい。また、この復号化補助情報は、復号化された音声
データの周波数成分のうち、強調すべき周波数成分を個
別に指示する情報を含むようにしてもよい。
【0012】なお、上記符号化音声データを得るための
符号化としては、異なる再生速度でも聞き取り易くする
ため、予め符号化対象の音声信号を周波数成分に分解
し、該分割された周波数成分ごとにその振幅情報等をデ
ータ化する特願平10−249672号記載の符号化が
適している。また、符号化対象である音声信号は、ディ
ジタル化された電気信号であり、その情報源としては、
マイクを介して取り込まれたアナログ音声情報、磁気テ
ープ等から読み出されたアナログ音声情報、MO、C
D、ハードディスク等に記録されたディジタル音声情報
のいずれであってもよい。ただし、アナログ音声情報の
場合は、一旦A/D変換される必要がある。また、CD
等に記録されたデータが圧縮符号化されている場合に
は、該圧縮データを伸張(解凍)する必要がある。
【0013】近年普及し始めたインターネット等のコン
ピュータネットワーク、ケーブルTVネットワーク、衛
生通信などの分野に着目すると、文字データ、音声デー
タ、静止画データ、動画データなどのマルチメディアに
よる情報提供サービスも広く行われるようになってきて
おり、このような情報通信技術を利用した情報提供サー
ビスの1つとして、この発明を適用させるためには、画
像データの表示タイミングの調節が不可欠となる。そこ
で、上述のようなデータ構造を備えた音声データに、所
定の表示手段に表示されるべき画像データの表示タイミ
ングを指示する情報を含めることにより、音声データの
再生動作に同期させた画像表示(特に、動画表示)が可
能になる。
【0014】また、この発明に係る音声データの生成方
法は、上記符号化音声データを生成する第1行程と、上
記復号化補助情報を特定する第2行程と、該符号化音声
データに復号化補助情報を付加する第3行程とを備え
る。上記第1行程では、例えば特願平10−24967
2号に記載された符号化技術のように、所定の規則に従
って音声信号の符号化が行われる。上記第2行程では、
符号化音声データの復号化の際に参照される復号化補助
情報として、音声信号の波動に関する物理量(例えば周
波数スペクトル情報)から少なくとも発生音を構成する
各部の音の種類に関する情報が特定される。なお、上記
第1及び第2行程は並行して実施することも可能であ
る。
【0015】以上のように生成された音声データ(符号
化音声データを含む)を利用することにより、該音声デ
ータの復号化において、指定された再生速度情報に基づ
いた発生音を構成する各部の音ごとに調節された各学習
者のヒヤリング・レベルに合った再生用音声データの復
号化が可能になる。このように復号化された再生用音声
データを再生することにより、学習者は自己の指定した
速度に調節された再生音声を聴くことができる。すなわ
ち、この発明に係る音声データの再生方法は、上述のよ
うに生成された音声データから復号化補助情報を抽出す
る第1行程と、抽出された抽出された復号化補助情報に
含まれる少なくとも発生音を構成する各部の音に関する
情報を参照しながら、発生音を構成する各部の音ごとに
再生速度を決定する第2行程と、決定された再生速度に
相当するよう符号化音声データの該当部分に対して伸張
処理(弛緩した音声の再生のため)短縮処理(より早い
音声の再生のため)を施しながら、該符号化音声データ
を復号化する第3行程とを備える。
【0016】なお、当該再生方法は、聞き取り易さを損
なうことなく、再生速度の異なる複数種類の再生用音声
データが用意できるため、生成された再生速度の異なる
再生用音声データ間での切り替え再生を行いながらの学
習も可能になる。また、上記発生音を構成する各部の音
には、音声スペクトルにおける母音部、該母音部の前後
に現れる子音部、該母音部と子音部との間に現れる移行
部、音声の切れ目(ポーズ)などが含まれる。
【0017】加えて、上述のようなデータ構造を備えた
音声データの提供は、一旦CD等の記録媒体に記録され
た形態で利用者に提供される場合と、情報通信手段を介
して利用者に提供される場合が考えられる。情報通信技
術を利用する場合でも音声データの取り扱いはハードデ
ィスク等への一時記録が不可欠であり、この発明に係る
音声データの記録方法では、聞き取り易さを損なうこと
なく、利用者側で再生速度が変更された再生用音声デー
タの復号化が可能になるよう、符号化音声データととも
に復号化補助情報が所定の記録媒体に記録される。な
お、以上の記録方法により得られる音声データの記録媒
体において、符号化音声データが記録される領域と復号
化補助情報が記録される領域は、異なっていてもよい。
【0018】上述のようなデータ構造を備えた音声デー
タを有線又は無線の情報伝達手段を介して通信相手に送
信するデータ配信方法として、この発明に係る音声デー
タの配信方法では、音声信号から所定の規則に従って符
号化された符号化音声データと、該符号化音声データの
復号化の際に参照される情報であって、音声信号の波動
に関する物理量から少なくとも発生音を構成する各部の
音の種類に関する情報を含む復号化補助情報とを、通信
相手に送信する。なお、この発明に係る音声データの配
信方法では、送信される符号化音声データと復号化補助
情報とを別個に通信相手に送信する構成であってもよ
い。
【0019】加えて、上述のようなデータ構造を備えた
音声データの再生動作を文字データ、画像データ(静止
画と動画)などのマルチメディア再生に対応させる場
合、特に動画再生と、再生速度が自由に変更された音声
の再生との同期をとることが重要である。すなわち、動
画は例えば1秒間に20フレーム程度の画像データをデ
ィスプレイに順次表示していくが、音声の再生動作との
表示タイミングとの同期がとれていないと不自然な表示
動作になってしまう。
【0020】そこで、この発明に係るマルチメディアの
再生方法は、1又はそれ以上の画像データを一旦メモリ
上に展開し、該メモリ上に格納された画像データのうち
1フレーム分の画像データを、上述のようなデータ構造
を備えた音声データの再生動作に同期して、順次所定の
表示手段に表示することを特徴としている。
【0021】具体的に、当該マルチメディアの再生方法
は、メモリに格納される複数の画像データのうち1フレ
ーム分又はそのN倍(正の有理数)の画像データの基準
書き換え周期をTv、音声のディジタル化サンプリング
周期に基づいて決定された基準再生時間周期をTa、そ
して、指示された再生速度情報に基づいて発生音を構成
する各部の音ごとに決定された再生時間周期をTa´
(>Ta)とするとき、所定タイミングでの画像データ
書き換え動作の終了時点からTv×((Ta´/Ta)
−1)まで、次回の画像データ書き換え動作を休止させ
る。
【0022】なお、画像データの表示タイミングの調節
は、音声のディジタル化サンプリング周期に基づいて決
定された基準再生時間周期をTa、そして、指示された
再生速度情報に基づいて発生音を構成する各部の音ごと
に決定された再生時間周期をTa´(>Ta)とすると
き、メモリに格納される画像データの平均書き換え周波
数を、予め指定された書き換え周波数の(Ta´/T
a)倍に設定するようにしても、音声データの再生動作
に同期した画像表示が可能になる。
【0023】
【発明の実施の形態】以下、この発明に係る音声データ
のデータ構造等の各実施形態を図1〜図13を用いて説
明する。なお、図面の説明において同一部分には同一符
号を付して重複する説明は省略する。
【0024】この発明に係るデータ構造を備えた音声デ
ータは、再生時の聞き取り易さを損なうことなく、利用
者が自由に設定した再生速度の新たな再生用音声データ
の復号化を、該利用者側で行うことを可能にする。この
ような音声データの利用形態は、近年のディジタル技術
の発達やデータ通信環境の整備により種々の態様が考え
られる。図1は、この発明に係るデータ構造を備えた音
声データがどのように産業上利用されるかを説明するた
めの概念図である。
【0025】図1(a)に示されたように、この発明に
係るデータ構造を備えた音声データの生成に利用される
情報源10としては、例えばマイクを介して直接取り込
まれたり、既に磁気テープなどに記録されたアナログ音
声情報、さらにはMO、CD(DVDを含む)、H/D
(ハードディスク)等に記録されているディジタル音声
情報が利用可能であり、具体的には、市販されている教
材やテレビ局、ラジオ局などから提供される音声情報な
どでも利用可能である。編集者100は、このような情
報源10を利用して音声データ生成装置200により、
この発明に係るデータ構造を備えた音声データを生成す
る。なお、この際、現状のデータ提供方法を考えると、
生成された音声データはCD(DVDを含む)、H/D
などの記録媒体20に一旦記録された状態で利用者に提
供される場合が多い。また、これらCDやH/Dには当
該音声データとともに関連する画像データが記録される
場合も十分に考えられる。
【0026】上記音声データ生成装置200により生成
される音声データは、上記情報源10から取り出された
ディジタル音声信号から所定の規則に従って符号化され
た符号化音声データと、この符号化音声データの復号化
の際に参照される情報であって、該音声信号の波動に関
する物理量から特定された、少なくとも発生音を構成す
る各部の音の種類に関する情報を含む復号化補助情報と
を備えた新たな音声データである。なお、符号化音声デ
ータを得るための符号化としては、例えば、異なる再生
速度でも聞き取り易くするため、予め符号化対象の音声
信号を周波数成分に分解し、該分割された周波数成分ご
とにその振幅情報等をデータ化する特願平10−249
672号記載の符号化が利用可能である。生成された符
号化音声データ及び復号化補助情報は、音声データ生成
装置200により、記録媒体20に格納される。これに
より、CD、DVD、H/D等の記録媒体には上述の符
号化音声データ、復号化補助情報とともに画像データ、
文字データなどのマルチメディアが記録される。
【0027】特に、記録媒体20としてのCDやDVD
は、雑誌の付録として利用者に提供されたり、コンピュ
ータ・ソフト、音楽CDなどと同様に店舗にて販売され
るのが一般的である(市場での流通)。また、生成され
た音声データはサーバ300から有線、無線を問わず、
インターネット、衛生通信などの情報通信手段を介して
利用者に配信される場合も十分に考えられる。
【0028】データ配信の場合、上記音声データ生成装
置200により生成された音声データは、サーバ300
の記憶装置310(例えばH/D)に画像データなどと
ともに一旦蓄積される。そして、H/D310に一旦蓄
積された音声データは、送受信装置320(図中のI/
O)を介して利用者端末400に送信される。利用者端
末400側では、送受信装置450を介して受信された
音声データが一旦H/D(外部記憶装置30に含まれ
る)に格納される。一方、CDやDVD等を利用したデ
ータ提供では、利用者が購入したCDを端末装置400
のCDドライブやDVDドライブに装着することにより
該端末装置の外部記録装置30として利用される。
【0029】通常、利用者側の端末装置400には入力
装置460、CRT、液晶などのディスプレイ470、
スピーカー480が装備されており、外部記憶装置30
0に画像データなどとともに記録されている音声データ
は、当該端末装置400の復号化部410(ソフトウエ
アによっても実現可能)によって、利用者自身が指示し
た再生速度の音声データに一旦復号化された後、スピー
カー480がら出力される。一方、外部記憶装置300
に格納された画像データは一旦VRAM432に展開さ
れた後にディスプレイ470に各フレームごと表示され
る(ビットマップ・ディスプレイ)。なお、復号化部4
10により復号化された再生用音声データを上記外部記
憶装置30内に順次蓄積することにより、該外部記憶装
置30内には再生速度の異なる複数種類の再生用音声デ
ータを用意すれば、日本国特許第2581700号に記
載された技術を利用して再生速度の異なる複数種類の音
声データ間の切り替え再生が利用者側で可能になる。
【0030】利用者は、図1(b)に示されたように、
ディスプレイ470上に関連する画像471を表示させ
ながらスピーカー480から出力される音声を聴くこと
になる。この際、音声のみ再生速度が変更されていたの
では、画像の表示タイミングがずれてしまう可能性があ
る。そこで、復号化部410が画像データの表示タイミ
ングを制御できるよう、上記音声データ生成装置200
において生成される符号化音声データに画像表示タイミ
ングを指示する情報を予め付加しておくのが好ましい。
【0031】次に、図1(a)に示された音声データ生
成装置200及び音声データ再生装置(端末装置40
0)の詳細な構造を図2を用いて説明する。なお、図2
(a)は、音声データ生成装置200の構成を示す図で
あり、図2(b)は、音声データ再生装置としての端末
装置400の構成を示す図である。
【0032】図2(a)に示されたように、音声データ
生成装置200に取り込まれる音声信号は情報源10か
ら提供される。なお、この情報源10から提供される音
声情報のうち、マイクから取り込まれる音声情報及び磁
気テープからの音声情報は、ともにアナログ音声データ
であるため、当該音声データ生成装置200へ入力され
る前にA/Dコンバータ11(I/O12に含まれる)
によりPCMデータに変換される。また、MO、CD
(DVD含む)、H/Dに既に格納された音声情報は、
PCMデータとしてI/O12を介して当該音声データ
生成装置200に取り込まれる。取り込まれた音声デー
タが圧縮されている場合には、一旦ソフトウエア等の解
凍しておく必要がある。
【0033】音声データ生成装置200は、上述のよう
に前処理された情報源10からの音声信号(電気信号)
から所定の規則に従って符号化された符号化音声データ
を生成する符号化部210と、この符号化音声データの
復号化の際に参照される復号化補助情報として、音声信
号の波動に関する物理量(例えば周波数スペクトル情
報)から少なくとも発生音を構成する各部の音の種類に
関する情報を特定する解析部250と、符号化部210
により符号化された符号化音声データに、解析部250
により特定された復号化補助情報を付加する合成部26
0とを備える。この合成部260から出力された符号化
音声データと復号化補助情報は、CD、DVD、H/D
等の記録媒体20に記録される。なお、上記符号化音声
データと復号化補助情報は、記録媒体20内の異なる領
域にそれぞれ記録されてもよい。
【0034】一方、利用者側では、図2(b)に示され
たように、データ配信やCD等の形態で提供された音声
データが端末装置400の外部記憶装置30内に格納さ
れる。復号化部410は、キーボードや、マウス等のポ
インティング・デバイスなどの入力手段460を介して
入力された利用者の指示内容に従って、外部記憶装置3
0からI/O31を介して読み出されたディジタルデー
タを所定の速度で再生可能な再生用音声データとして復
号化するとともに、画像同期信号Dも出力する。復号化
された再生用音声データはアナログデータに変換された
後、スピーカー480から音声として出力される。
【0035】なお、上記復号化部410は、外部記憶装
置30からI/O31を介して読み出された音声データ
を読み込み、この読み出された音声データから、符号化
音声データの復号化の際に参照される復号化補助情報を
抽出するとともに、抽出された復号化補助情報に含まれ
る少なくとも発生音を構成する各部の音に関する情報を
参照しながら上記符号化音声データに含まれる該発生音
を構成する各部の音ごとに音声再生に適した再生速度
を、利用者が指定した再生速度情報を基準にして決定す
る。この復号化部410における符号化音声データの復
号化は、該符号化音声データに含まれる発生音を構成す
る各部の音ごとに、上述のように決定された再生速度に
相当するよう該符号化音声データの該当部分に対して伸
長処理又は短縮処理を施しながら行われる。
【0036】図3は、上述の音声データ生成装置200
における符号化部210の構造を示す図である。符号化
部210は、まず、マイク等により、例えば音楽CDの
音響クロック44.1KHzでサンプリングされたネイ
ティブ・スピーカーのナチュラル・スピードの音声に相
当する音声信号を取り込む。この取り込まれた音声信号
は、一旦、各チャネルCH#1〜CH#85(周波数成
分)に分割するためフィルタリングされる。なお、取り
込まれた音声信号の周波数範囲は75Hz〜10,00
0Hz、また、サンプリング周波数は音楽CDの音響ク
ロックに合わせて44.1kHz(22.68μs)で
ある。分割するチャネル数は85(7オクターブ+1
音)とし、各チャネル#1〜#85の中心周波数(中心
f)は平均律(1オクターブ当り12平均律とする)の
半音列になるように設定される(77.78Hz(D
#)〜9,960Hz(D#))。
【0037】以上のように各チャネル#1〜#85にそ
れぞれ分割されたデータは、その振幅情報が2.268
msごと(44.1kHzサンプリングの100データ
に相当、ただし100データで1波形が形成できない場
合にはデータ数を増やす)に抽出される。したがって、
この実施形態では、各チャネル#1〜#85における振
幅情報のサンプリングレート(第2周期)は441サン
プル/s(2.268ms)である。なお、サンプリン
グレートは、規則性のある周期であればよく、例えば1
00データ分取り込んだ次に、120データ分取り込ん
で処理するなど、これら異なるレートで交互に処理を繰
り返すような実施形態であってもよい。
【0038】符号化部210は、2.268msごとに
サンプリングされた各チャネル#1〜#85の振幅情報
をそれぞれ1バイト(8ビット)で表現し、85バイト
(85チャネル×1バイト)の符号化音声データa1,
a2,a3,…,anを生成する。なお、符号化音声デ
ータa1,a2,a3,…,anには、該符号化音声デ
ータに相当する音声の再生時に表示される動画像との表
示タイミングを制御するため、画像同期信号D(1バイ
ト)が付加される。
【0039】一方、図3に示された音声データ生成装置
200の解析部250は、上記符号化部210において
生成された符号化音声データの復号化の際に参照される
復号化補助情報を特定する。
【0040】復号化補助情報には、取り込まれた音声信
号のスペクトル情報から発生音を構成する各部の音や、
強調すべき部位を示す強調位置識別情報、強調すべき周
波数成分等が含まれる。
【0041】例えば、この実施形態において、発生音を
構成する各部の音は、図4に示されたように、母音部
(V)と、この母音部(V)を挟んで前後に現れる子音
部(図中、前子音部がCF、後子音部がCRで示されてい
る)と、母音部(V)と前後の各子音部CF、CRとの間
に現れる移行部(図中、前移行部がTF、後移行部がTR
で示されている)と、各音声の間に現れる無音期間を示
すポーズ(P)とに分類される。なお、ポーズ(P)
は、再生音声の遅延の際に他の発生音を構成する各部の
音と同様に延伸されたのでは、利用者の聞き取り易さを
損なう可能性がある。そこで、この実施形態においてポ
ーズ(P)は、音節の間で発生することを示す場合(P
1)と、句間で発生する場合(P2)と、文間で発生す
る場合(P3)とにさらに分類され、それぞれ特定すべ
き発生音を構成する各部の音に含められている。
【0042】上記復号化補助情報s1,s2,s3,
…,snおのおのは、符号化音声データa1,s2,s
3,…,snの各サンプリング間隔ごとに用意されるデ
ータ列であって、上記発生音を構成する各部の音に関す
る情報として3ビット、強調位置識別情報として1ビッ
トの計4ビット程度のデータである。また、この復号化
補助情報には、非英語圏の民族には第3フォルマントの
ように聞き取りにくい周波数があるため、強調すべき周
波数帯(特に中心周波数)の指定情報が個別に含まれて
もよい。
【0043】合成部260は、以上のように符号化部2
10により生成された符号化音声データa1,a2,a
3,…,anに、解析部250により特定された復号化
補助情報s1,s2,s3,…,snを付加し、記録媒
体20にそれぞれを書き込む。なお、合成部260によ
り新たに生成された音声データは、図5(a)〜図5
(c)に示されたような種々の論理構造を備えることが
可能である。例えば、図5(a)に示されたように、生
成された音声データは、符号化音声データa1,a2,
a3,…,anの各データごとに対応する復号化補助情
報s1,s2,s3,…,snが付加された構造であっ
てもよい。また、図5(b)に示されたように、生成さ
れた音声データは、符号化音声データa1,a2,a
3,…,anと復号化補助情報s1,s2,s3,…,
snとがそれぞれ異なるグループのデータとして取り扱
われる構造であってもよい。さらに、図5(c)に示さ
れたように、生成された音声データは、符号化音声デー
タa1,a2,a3,…,anを構成する複数のグルー
プと、復号化補助情報s1,s2,s3,…,snの対
応する複数のグループとの対により構成されてもよい。
【0044】次に、この発明に係るデータ構造を備えた
音声データの復号化及び再生を行う利用者側の端末装置
400の構造について説明する。
【0045】図6は、端末装置400の復号化部410
の構造を示す図であり、図7は、図6に示された符号化
部410におけるPCMデータ生成部415の構造を示
す図である。
【0046】図6に示されたように、外部記憶装置30
からI/O31を介して音声データが復号化部410に
取り込まれる。なお、外部記憶装置30に格納された音
声データは、コンピュータ・ネットワークや衛星などの
情報通信手段を介して配信されたり、利用者が購入した
CD等に格納されているデータであり、その他画像デー
タも該外部記憶装置30内には記録されている。また、
外部記憶装置30内に格納された音声データが圧縮され
ている場合には、ソフトウエア等によるデータ伸長が復
号化の前処理として行われる。
【0047】復号化部410では、まず抽出部411
が、外部記憶装置30から読み出された音声データから
復号化補助情報s1,s2,s3,…,snを抽出す
る。抽出された復号化補助情報s1,s2,s3,…,
snのうち、発生音を構成する各部の音に関する情報
(V、CF、CR、TF、TR、P1、P2、P3)は、入
力手段460から入力された利用者からの指示情報とと
もに時間係数生成部412に入力される。また、抽出さ
れた復号化補助情報s12,s2,s3,…,snのう
ち、強調位置識別情報は、入力処理手段460から入力
された利用者の指示情報とともに振幅強調係数生成部4
12に入力される。さらに、抽出された復号化補助情報
s12,s2,s3,…,snのうち、強調すべき周波
数成分(中心CH)に関する情報は、入力処理手段46
0から入力された利用者の指示情報とともに強調バンド
データ生成部414に入力される。
【0048】また、この実施形態では、入力手段460
から入力される利用者の再生速度指示情報としては、図
8の表に示されたように、複数の再生レベルH3〜S6
が用意されている。図8の表からも分かるように、この
実施形態では、再生レベルNを標準の再生速度(ナチュ
ラル・スピード)とし、H3に向かうほど再生速度を早
く、逆にS6に向かうほど再生速度を遅くするように、
該ナチュラル・スピードを基準とした再生時間の比及び
再生速度の倍率で指示される。
【0049】上記時間係数生成部411は、図9に示さ
れたような、再生レベル(利用者が指示)と発生音を構
成する各部の音の種類との関係によって決定される再生
速度倍率が予め設定された表を備えており、この表に基
づいて、再生速度倍率をPCMデータ生成部415に出
力する。
【0050】上記振幅強調係数生成部412は、図10
に示されたような2種類の表を備える。図10(a)
は、抽出部411によって抽出された復号化補助情報s
1,s2,s3,…,snに強調位置識別情報が含まれ
ていない場合(強調指示がない場合)に適用される表で
あり、図10(b)は、復号化補助情報s1,s2,s
3,…,snに強調位置識別情報が含まれている場合
(強調指示がない場合)に適用される表である。なお、
これらの表に示されたパラメータは、抽出部411にお
いて復号化補助情報と分離された符号化音声データの各
周波数成分の振幅を基準とした倍率を意味する。
【0051】上記強調バンドデータ生成部414は、復
号化補助情報s1,s2,s3,…,snに強調すべき
周波数帯(中心CHで指定)の指示情報が含まれている
場合、図11(a)に示されたように、中心CHに隣接
する低周波数成分側5CH及び高周波数成分側5CHの
合計11CHについて、各周波数成分の振幅を変更する
パラメータを生成する。なお、強調バンドデータ生成部
414は、図11(b)に示されたように、再生レベル
に応じた中心CHの振幅倍率が予め設定された表を備え
ており、中心CHの振幅倍率は、入力手段460から入
力された再生速度指示情報に従って決定される。また、
中心CHに隣接する各CHの振幅倍率は、この中心CH
の振幅倍率を基準にして、図11(a)のように直線近
似できるようにそれぞれ設定され、PCMデータ生成部
415に出力される。
【0052】PCMデータ生成部415は、図7に示さ
れたように、各チャネルに相当する周波数成分を発生さ
せる正弦波ジェネレータ422を備える。制御部421
は、抽出部411からの符号化音声データから各周波数
成分の振幅情報と強調バンドデータ生成部414からの
振幅倍率データに基づいて新たに振幅係数を生成し、こ
の生成された振幅係数を乗算器423において正弦波ジ
ェネレータ422からのデータ(基準振幅を示す)に乗
算させる。そして、得られた各周波数成分のデータが加
算器424で加算させることにより復号化されたPCM
データが得られる。さらに、制御部421は、時間係数
生成部412からの再生速度倍率データに基づいて、該
各符号化音声データa1,a2,a3,…,anの出力
回数を調節することにより、復号化される音声データの
間延びや短縮を行う。このとき、各符号化音声データa
1,a2,a3,…,anごとに出力される画像同期信
号Dの出力回数も同時に調節されることとなるため、音
声データの再生側において画像の表示タイミング制御が
可能になる。
【0053】以上のようにPCMデータ生成部415に
おいて復号化されたデータは、利用者の再生速度指示情
報に従って時間軸に沿って調節された復号化データとな
る。このPCMデータ生成部415で復号化されたデー
タは、図10(a)あるいは図10(b)のいずれかの
表から振幅強調係数生成部412が決定した倍率パラメ
ータと乗算器416において乗算される。これにより、
再生用音声データが得られる。得られた再生用音声デー
タはD/A変換器417によりアナログデータに変換さ
れ、利用者が指示した再生速度の音声としてスピーカー
480から出力される。
【0054】一方、端末装置400では外部記憶装置3
0から読み出された画像データの表示も可能である。図
12は、ビットマップ・ディスプレイの構造を示す図で
ある。
【0055】ビットマップ・ディスプレイは、1又はそ
れ以上のフレームを格納するメモリ432(VRAM)
を備えており、描画部431が、外部記憶装置30から
I/O32を介して読み出された画像データ(圧縮され
ている場合にはソフトウエア等32によりデータ伸長さ
れる)をこれらメモリ432に書き込んでいく。メモリ
432に書き込まれた画像データは1フレームごとにス
イッチS/W433を介してディスプレイ470に表示
される。なお、これら描画部431の書き込みタイミン
グ及びS/W433の切り替えタイミングはタイミング
コントローラ434により行われる。
【0056】音声再生と画像表示とのタイミングは、こ
の実施形態では図13(a)に示されたようにPCMデ
ータ生成部415から出力された画像同期信号Dをカウ
ントすることにより行われる。すなわち、ナチュラル・
スピードでの音声再生の場合、例えば、3クロックごと
にメモリ432のデータ書き換えを行うことにしておけ
ば、図13(b)に示されたように、PCMデータ生成
部415が再生速度の遅い再生用音声出たを生成する場
合にも、該音声データの遅延タイミングに合ったデータ
書き換えが可能になる(画像の表示タイミングを音声再
生のタイミングに一致させることが可能になる)。
【0057】すなわち、この実施形態では、メモリ43
2に格納される複数の画像データのうち1フレーム分又
はそのN倍(正の有理数であって、Nは1/2や2/3
であってもよい)の画像データの基準書き換え周期をT
v、音声のディジタル化サンプリング周期(例えば、音
楽CDの音響クロック)に基づいて決定された基準再生
時間周期をTa、そして、指示された再生速度情報に基
づいて発生音を構成する各部の音ごとに決定された再生
時間周期をTa´(>Ta)とするとき、所定タイミン
グでの画像データ書き換え動作の終了時点からTv×
((Ta´/Ta)−1)まで、次回の画像データ書き
換え動作を休止させることを特徴としている。
【0058】なお、音声再生と画像表示とのタイミング
調整は、上述の実施形態に限定されるものではない。例
えば、音声のディジタル化サンプリング周期に基づいて
決定された基準再生時間周期をTa、そして、指示され
た再生速度情報に基づいて発生音を構成する各部の音ご
とに決定された再生時間周期をTa´(>Ta)とする
とき、前記メモリに格納される画像データの平均書き換
え周波数は、予め指定された書き換え周波数の(Ta´
/Ta)倍に設定されてもよい。
【0059】
【発明の効果】以上のようにこの発明によれば、マイク
等から取り込まれたり、過去に蓄積された音声信号から
所定の規則に従って符号化した符号化音声データと、該
符号化音声データの復号化の際に参照される発生音を構
成する各部の音の種類等を含む復号化補助情報とにより
音声データが構成されている。このような音声データを
所定の記録媒体や配信方法により利用者に提供すること
により、利用者側では任意に設定された速度の異なる複
数種類の再生用音声データを復号化することができる。
これにより、データ提供者から利用者へ提供すべき音声
データのデータ量を低減することができ、記録媒体の記
録量の節約や、データ配信時間の短縮が実現される。
【0060】さらに、上記符号化音声データに復号化補
助情報とともに画像同期信号を付加することにより、復
号化された再生用音声データの再生速度に合った画像再
生も可能になる。
【図面の簡単な説明】
【図1】この発明の各実施形態を概念的に説明するため
の図である。
【図2】(a)は、この発明に係る音声データの生成方
法を実現する音声データ生成装置の概略構成を示すブロ
ック図であり、(b)は、この発明に係る音声データの
再生方法を実現する音声データ再生装置の概略構成を示
すブロック図である。
【図3】図2(a)に示された音声データ生成装置にお
ける符号化部の構成を示すブロック図である。
【図4】符号化された音声データの復号化に必要な復号
化補助情報の一部を概念的に説明するための図である。
【図5】この発明に係る音声データのデータ構造を概念
的に説明するための図である。
【図6】この発明に係る音声データの再生方法を実現す
る音声データ再生装置(端末装置)の構成を示すブロッ
ク図である。
【図7】図6に示された音声データ再生装置におけるP
CMデータ生成部の構成を示すブロック図である。
【図8】再生レベルごとに設定された、ナチュラル・ス
ピードの再生レベルを基準とした再生時間の比率及び再
生速度の倍率の一例を示す表である。
【図9】図6に示された時間係数生成部において参照さ
れる表であって、発生音を構成する各部の音の種類ごと
に設定された再生速度の一例を、ナチュラル・スピード
の再生レベルを基準とした倍率で示した表である。
【図10】図6に示された振幅強調係数生成部において
参照される表であって、発生音を構成する各部の音の種
類ごとに設定される振幅の一例を、ナチュラル・スピー
ドの再生レベルを基準とした倍率で示した表である。
【図11】(a)は、図6に示された強調バンドデータ
生成部において参照される表であって、指示された周波
数バンドデータの編集動作を説明するための図であり、
(b)は、指示された周波数バンド(中心CH)の振幅
を、ナチュラル・スピードの再生レベルを基準とした倍
率で示した表である。
【図12】図6に示された音声データ再生装置(端末装
置)による音声再生に同期して画像データを表示する表
示装置の構成を示す図である。
【図13】音声再生動作に同期した画像表示タイミング
を説明するためのタイムチャートである。
【符号の説明】
10…情報源、20、30、310…記録媒体、200
…音声データ生成装置、210…符号化部、250…解
析部、260…合成部、400…端末装置(PC)、4
10…復号化部。
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) // H04N 7/173 630 H04N 5/92 H 5D080 9A001 Fターム(参考) 2C028 AA03 BA01 BB04 BB07 BD03 CA11 CA13 CB03 5C053 FA22 FA24 FA29 GA11 GB11 JA07 JA12 KA04 LA11 LA15 5C064 BA01 BB07 BC16 BC23 BC25 BD02 BD07 BD08 5D044 AB05 BC01 BC04 CC01 CC04 CC09 DE17 DE49 EF05 FG18 GL50 5D045 DA20 5D080 BA01 BA03 FA39 GA16 GA22 9A001 EE01 HH15 JJ19 KK09

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 音声信号から所定の規則に従って符号化
    された符号化音声データと、 前記符号化音声データの復号化の際に参照される情報で
    あって、前記音声信号の波動に関する物理量から特定さ
    れた、少なくとも発生音を構成する各部の音の種類に関
    する情報を含む復号化補助情報とを備えた音声データの
    データ構造。
  2. 【請求項2】 前記音声信号の波動に関する物理量に
    は、前記音声信号の周波数スペクトル情報が含まれるこ
    とを特徴とする請求項1記載の音声データのデータ構
    造。
  3. 【請求項3】 前記復号化補助情報には、振幅方向に強
    調すべき時間軸方向の位置を指示するための強調位置識
    別情報が含まれることを特徴とする請求項1又は2記載
    の音声データのデータ構造。
  4. 【請求項4】 前記復号化補助情報には、前記復号化さ
    れた音声データの周波数成分のうち、強調すべき周波数
    成分を個別に指示する情報が含まれることを特徴とする
    請求項1〜3のいずれか一項記載の音声データのデータ
    構造。
  5. 【請求項5】 所定の表示手段に表示されるべき画像デ
    ータの表示タイミングを指示する情報を含むことを特徴
    とする請求項1〜4のいずれか一項記載の音声データの
    データ構造。
  6. 【請求項6】 音声信号から所定の規則に従って符号化
    された符号化音声データを生成する第1行程と、 前記符号化音声データの復号化の際に参照される復号化
    補助情報として、前記音声信号の波動に関する物理量か
    ら少なくとも発生音を構成する各部の音の種類に関する
    情報を特定する第2行程と、 前記第1行程において生成された前記符号化音声データ
    に前記第2行程において特定された前記復号化補助情報
    を付加することにより、前記音声データとして新たな合
    成データを生成する第3工程とを備えた音声データの生
    成方法。
  7. 【請求項7】 請求項1記載のデータ構造を有する音声
    データを、予め指定された再生速度情報に基づいて発生
    音を構成する各部の音ごとに調節された速度で音声を再
    生する音声データの再生方法であって、 前記音声データから、前記符号化音声データの復号化の
    際に参照される復号化補助情報を抽出する第1行程と、 前記第1行程において抽出された復号化補助情報に含ま
    れる少なくとも発生音を構成する各部の音に関する情報
    を参照しながら、前記符号化音声データに含まれる該発
    生音を構成する各部の音ごとに音声再生に適した再生速
    度を前記予め指定された再生速度情報を基準にして決定
    する第2行程と、 前記符号化音声データに含まれる発生音を構成する各部
    の音ごとに、前記決定された再生速度に相当するよう該
    符号化音声データの該当部分に対して伸長処理又は短縮
    処理を施しながら、該符号化音声データを復号化する第
    3行程とを備えた音声データの再生方法。
  8. 【請求項8】 音声信号から所定の規則に従って符号化
    された符号化音声データと、 前記符号化音声データの復号化の際に参照される情報で
    あって、前記音声信号の波動に関する物理量から特定さ
    れた、少なくとも発生音を構成する各部の音の種類に関
    する情報を含む復号化補助情報とを、所定の記録媒体に
    記録する音声データの記録方法。
  9. 【請求項9】 音声信号から所定の規則に従って符号化
    された符号化音声データと、 前記符号化音声データの復号化の際に参照される情報で
    あって、前記音声信号の波動に関する物理量から特定さ
    れた、少なくとも発生音を構成する各部の音の種類に関
    する情報を含む復号化補助情報とが記録された音声デー
    タの記録媒体。
  10. 【請求項10】 音声信号から所定の規則に従って符号
    化された符号化音声データと、 前記符号化音声データの復号化の際に参照される情報で
    あって、前記音声信号の波動に関する物理量から特定さ
    れた、少なくとも発生音を構成する各部の音の種類に関
    する情報を含む復号化補助情報とを、有線又は無線の情
    報伝達手段を介して通信相手に送信する音声データの配
    信方法。
  11. 【請求項11】 1又はそれ以上の画像データを一旦メ
    モリ上に展開し、該メモリ上に格納された画像データの
    うち1フレーム分の画像データを、請求項1記載のデー
    タ構造を有する音声データの再生動作に同期して、順次
    所定の表示手段に表示するマルチメディアの再生方法で
    あって、 前記メモリに格納される前記複数の画像データのうち1
    フレーム分又はそのN倍(正の有理数)の画像データの
    基準書き換え周期をTv、音声のディジタル化サンプリ
    ング周期に基づいて決定された基準再生時間周期をT
    a、そして、指示された再生速度情報に基づいて発生音
    を構成する各部の音ごとに決定された再生時間周期をT
    a´(>Ta)とするとき、 所定タイミングでの画像データ書き換え動作の終了時点
    からTv×((Ta´/Ta)−1)まで、次回の画像
    データ書き換え動作を休止させるマルチメディアの再生
    方法。
  12. 【請求項12】 1又はそれ以上の画像データを一旦メ
    モリ上に展開し、該メモリ上に格納された画像データの
    うち1フレーム分の画像データを、請求項1記載の音声
    データの記録媒体に記録されている音声データの再生動
    作に同期して、順次表示手段に表示するマルチメディア
    の再生方法であって、 音声のディジタル化サンプリング周期に基づいて決定さ
    れた基準再生時間周期をTa、そして、指示された再生
    速度情報に基づいて発生音を構成する各部の音ごとに決
    定された再生時間周期をTa´(>Ta)とするとき、 前記メモリに格納される画像データの平均書き換え周波
    数を、予め指定された書き換え周波数の(Ta´/T
    a)倍に設定するマルチメディアの再生方法。
JP2000051801A 2000-02-28 2000-02-28 音声データの符号化方法 Expired - Fee Related JP3620787B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000051801A JP3620787B2 (ja) 2000-02-28 2000-02-28 音声データの符号化方法
PCT/JP2001/007252 WO2003019535A1 (fr) 2000-02-28 2001-08-24 Structure de donnees, procede de production, procede de lecture, procede d'enregistrement, support d'enregistrement et procede de distribution de donnees vocales, et procede de lecture de donnees multimedia

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000051801A JP3620787B2 (ja) 2000-02-28 2000-02-28 音声データの符号化方法
PCT/JP2001/007252 WO2003019535A1 (fr) 2000-02-28 2001-08-24 Structure de donnees, procede de production, procede de lecture, procede d'enregistrement, support d'enregistrement et procede de distribution de donnees vocales, et procede de lecture de donnees multimedia

Publications (2)

Publication Number Publication Date
JP2001242890A true JP2001242890A (ja) 2001-09-07
JP3620787B2 JP3620787B2 (ja) 2005-02-16

Family

ID=26345129

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000051801A Expired - Fee Related JP3620787B2 (ja) 2000-02-28 2000-02-28 音声データの符号化方法

Country Status (2)

Country Link
JP (1) JP3620787B2 (ja)
WO (1) WO2003019535A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009244912A (ja) * 2009-07-29 2009-10-22 Victor Co Of Japan Ltd 音声信号処理装置及び音声信号処理方法
JP2015111771A (ja) * 2013-12-06 2015-06-18 ヤマハ株式会社 情報提供システム、通信端末及び管理装置
CN113112993A (zh) * 2020-01-10 2021-07-13 阿里巴巴集团控股有限公司 一种音频信息处理方法、装置、电子设备以及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010283605A (ja) 2009-06-04 2010-12-16 Canon Inc 映像処理装置及び方法

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06162168A (ja) * 1992-11-20 1994-06-10 Fujitsu Ltd 合成画像表示システム
JPH06167999A (ja) * 1992-11-30 1994-06-14 Matsushita Electric Ind Co Ltd 情報記録再生装置
JPH06233269A (ja) * 1993-02-03 1994-08-19 Nec Corp 映像音声同期システム
JPH0756494A (ja) * 1993-08-10 1995-03-03 Oki Electric Ind Co Ltd 発音訓練装置
JPH08102908A (ja) * 1994-10-03 1996-04-16 Canon Inc 再生装置
JPH08140054A (ja) * 1994-11-10 1996-05-31 Matsushita Electric Ind Co Ltd オーディオ信号及びビデオ信号同期再生方法
JPH09330097A (ja) * 1996-06-10 1997-12-22 Nec Corp 音声再生装置
JPH1011097A (ja) * 1996-06-19 1998-01-16 Yamaha Corp カラオケ装置
JPH10117327A (ja) * 1996-09-17 1998-05-06 Sony Corp 映像信号の再生時間可変方法
JPH10126745A (ja) * 1996-10-22 1998-05-15 Nec Corp 可変速再生映像伸長装置
JPH10200862A (ja) * 1997-01-09 1998-07-31 Nec Corp オーディオ・ビデオ同期再生装置
JPH10210422A (ja) * 1997-01-21 1998-08-07 Yamaha Corp 画像記録再生装置
JPH10285558A (ja) * 1997-04-03 1998-10-23 Sony Corp 記録再生装置および映像情報の変速再生方法
JPH11145842A (ja) * 1997-11-05 1999-05-28 Nec Corp 音声帯域分割復号装置
JPH11265195A (ja) * 1998-01-14 1999-09-28 Sony Corp 情報配信システム、情報送信装置、情報受信装置、情報配信方法
JPH11308573A (ja) * 1998-04-20 1999-11-05 Asahi Chem Ind Co Ltd 画像再生装置
JP2000013750A (ja) * 1998-06-25 2000-01-14 Sony Corp 情報再生装置および方法、並びに提供媒体

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2758688B2 (ja) * 1990-03-08 1998-05-28 日本電気株式会社 音声合成器
JP2992324B2 (ja) * 1990-10-26 1999-12-20 株式会社リコー 音声区間検出方法
JPH05224689A (ja) * 1992-02-13 1993-09-03 Nippon Telegr & Teleph Corp <Ntt> 音声合成装置
JPH06289897A (ja) * 1993-03-31 1994-10-18 Sony Corp 音声信号処理装置
JPH08146985A (ja) * 1994-11-17 1996-06-07 Sanyo Electric Co Ltd 話速制御システム
JPH09152889A (ja) * 1995-11-29 1997-06-10 Sanyo Electric Co Ltd 話速変換装置
JP3730764B2 (ja) * 1997-09-12 2006-01-05 日本放送協会 話速/画速同時変換装置
JP2000099097A (ja) * 1998-09-24 2000-04-07 Sony Corp 信号再生装置及び方法、音声信号再生装置、並びに、音声信号の速度変換方法

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06162168A (ja) * 1992-11-20 1994-06-10 Fujitsu Ltd 合成画像表示システム
JPH06167999A (ja) * 1992-11-30 1994-06-14 Matsushita Electric Ind Co Ltd 情報記録再生装置
JPH06233269A (ja) * 1993-02-03 1994-08-19 Nec Corp 映像音声同期システム
JPH0756494A (ja) * 1993-08-10 1995-03-03 Oki Electric Ind Co Ltd 発音訓練装置
JPH08102908A (ja) * 1994-10-03 1996-04-16 Canon Inc 再生装置
JPH08140054A (ja) * 1994-11-10 1996-05-31 Matsushita Electric Ind Co Ltd オーディオ信号及びビデオ信号同期再生方法
JPH09330097A (ja) * 1996-06-10 1997-12-22 Nec Corp 音声再生装置
JPH1011097A (ja) * 1996-06-19 1998-01-16 Yamaha Corp カラオケ装置
JPH10117327A (ja) * 1996-09-17 1998-05-06 Sony Corp 映像信号の再生時間可変方法
JPH10126745A (ja) * 1996-10-22 1998-05-15 Nec Corp 可変速再生映像伸長装置
JPH10200862A (ja) * 1997-01-09 1998-07-31 Nec Corp オーディオ・ビデオ同期再生装置
JPH10210422A (ja) * 1997-01-21 1998-08-07 Yamaha Corp 画像記録再生装置
JPH10285558A (ja) * 1997-04-03 1998-10-23 Sony Corp 記録再生装置および映像情報の変速再生方法
JPH11145842A (ja) * 1997-11-05 1999-05-28 Nec Corp 音声帯域分割復号装置
JPH11265195A (ja) * 1998-01-14 1999-09-28 Sony Corp 情報配信システム、情報送信装置、情報受信装置、情報配信方法
JPH11308573A (ja) * 1998-04-20 1999-11-05 Asahi Chem Ind Co Ltd 画像再生装置
JP2000013750A (ja) * 1998-06-25 2000-01-14 Sony Corp 情報再生装置および方法、並びに提供媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009244912A (ja) * 2009-07-29 2009-10-22 Victor Co Of Japan Ltd 音声信号処理装置及び音声信号処理方法
JP2015111771A (ja) * 2013-12-06 2015-06-18 ヤマハ株式会社 情報提供システム、通信端末及び管理装置
CN113112993A (zh) * 2020-01-10 2021-07-13 阿里巴巴集团控股有限公司 一种音频信息处理方法、装置、电子设备以及存储介质
CN113112993B (zh) * 2020-01-10 2024-04-02 阿里巴巴集团控股有限公司 一种音频信息处理方法、装置、电子设备以及存储介质

Also Published As

Publication number Publication date
JP3620787B2 (ja) 2005-02-16
WO2003019535A1 (fr) 2003-03-06

Similar Documents

Publication Publication Date Title
US5943648A (en) Speech signal distribution system providing supplemental parameter associated data
KR100582154B1 (ko) 시퀀스 데이터의 데이터 교환 포맷, 음성 재생 장치 및서버 장치
KR100240637B1 (ko) 다중매체와의 연동을 위한 텍스트/음성변환 구현방법 및 그 장치
US20080275700A1 (en) Method of and System for Modifying Messages
KR0129829B1 (ko) 음향 변속 재생장치
JP4174940B2 (ja) カラオケ装置
EP0999538A4 (en) METHOD AND DEVICE FOR DIGITAL SIGNAL PROCESSING, METHOD AND DEVICE FOR GENERATING CONTROL DATA AND MEDIUM FOR RECORDING PROGRAMS
KR100710600B1 (ko) 음성합성기를 이용한 영상, 텍스트, 입술 모양의 자동동기 생성/재생 방법 및 그 장치
JP3620787B2 (ja) 音声データの符号化方法
JP3617603B2 (ja) 音声情報の符号化方法及びその生成方法
KR100601748B1 (ko) 디지털 음성 데이터의 부호화 방법 및 복호화 방법
JP2000250401A (ja) 言語学習方法、言語学習装置およびプログラムを記録した媒体
JP6486582B2 (ja) 電子機器、音声制御方法、およびプログラム
KR20070008232A (ko) 디지털 멀티미디어 배속 조절 장치 및 방법
JPH10133678A (ja) 音声再生装置
JP3510493B2 (ja) 音声信号の符号/復号方法及びそのプログラムを記録した記録媒体
JP4563418B2 (ja) 音声処理装置、音声処理方法、ならびに、プログラム
JP2000305588A (ja) ユーザーデータ付加装置及びユーザーデータ再生装置
JPH0376480B2 (ja)
Imai et al. Application of speech rate conversion technology to video editing: allows up to 5 times normal speed playback while maintaining speech intelligibility
JPH07287576A (ja) 音楽再生方法
KR20010008954A (ko) 음악 파일 생성 및 재생기
JP3830200B2 (ja) 人物画像合成装置
JPH02245800A (ja) 音声再生方式
JPH117295A (ja) 音声読み上げ装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040609

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040806

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041112

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees