JP3730764B2 - 話速/画速同時変換装置 - Google Patents

話速/画速同時変換装置 Download PDF

Info

Publication number
JP3730764B2
JP3730764B2 JP24913697A JP24913697A JP3730764B2 JP 3730764 B2 JP3730764 B2 JP 3730764B2 JP 24913697 A JP24913697 A JP 24913697A JP 24913697 A JP24913697 A JP 24913697A JP 3730764 B2 JP3730764 B2 JP 3730764B2
Authority
JP
Japan
Prior art keywords
speed
speech
section
video
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP24913697A
Other languages
English (en)
Other versions
JPH1188844A (ja
Inventor
章 中村
源 曽根原
和久 井口
裕司 野尻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP24913697A priority Critical patent/JP3730764B2/ja
Publication of JPH1188844A publication Critical patent/JPH1188844A/ja
Application granted granted Critical
Publication of JP3730764B2 publication Critical patent/JP3730764B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Television Signal Processing For Recording (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、加齢ないしは何らかの障害等により低下する音声識別臨界速度(音声を正確に識別できる最大の話速)、及び映像の識別速度(映像の動きを正確に識別できる速度)等の視聴覚能力の低下を補う技術に関するもので、特に映像と音声を有するメディア(例えば、テレビジョン、VTRやDVDのような映像音声記録メディア、コンピュータ上での動画再生等)や医療機器等、発話者の声の高さ、個人性、及び音韻性を保持したまま高品質に発話速度を変換できる話速変換音声に同期し、映像も自然性を保ったまま高品質に速度の変換が可能であり、視聴者の視聴覚特性にフィッティングでき、視聴を補助することを行う、話速/画速同時変換装置に関する。
【0002】
【従来の技術】
加齢ないしは何らかの障害により、音声識別臨界速度や映像の識別速度が低下した視聴者に対し、音声及び映像の両者を同時に同期して高品質にゆっくりさせ視聴させることにより、音声や映像の了解度上げることができる。しかし、この音声と映像の両者を同期して高品質にゆっくりさせる手法が従来技術には無い。
【0003】
即ち、発話者の声の高さ、個人性、及び音韻性を保持したまま高品質に発話速度を変換できる話速変換音声に同期し、映像も自然性を保ったまま高品質に速度の変換が可能となり、視聴者の視聴覚特性にフィッティングでき、視聴を補助する方法は、発話者の声の高さ、個人性、及び音韻性を保持したまま高品質に発話速度を変換できる話速変換音声に同期し、映像の速度も自然性を保ったまま高品質に変換を可能とすることが困難であったため、開発されていない。
【0004】
高品質に話速変換のみを行う手法については幾つか開発されている。例えば、本出願人による特開平5−080796号に開示されている。
【0005】
この話速変換音声に同期(リップシンク)して映像を可変速するには簡易的に、VTRの可変速再生等がある。
【0006】
【発明が解決しようとする課題】
しかしながら、上述のような従来技術においては、簡易的に、話速変換した話速変換音声にVTRの可変再生等を擬似的に同期させたとしても、VTRの可変速再生等では、l/60秒もしくは1/50秒(例えばハイビジョン、NTCS方式:l/60秒、PAL方式:l/50秒)のフイールド単位で、同一フイールドを2度以上、繰り返し提示したり、連続するフイールドを省いたりするため、動きが不自然になったり、垂直方向に映像のジッターが生じるなどして、高品質な変換ができない。
【0007】
特に、加齢や何らかの原因により聴覚特性の劣化した視聴者にとって、リップリーディング(読唇)を併用するため、話速変換音声と映像の同期が取れていない、もしくは、上述の一般的な手法(VTR等の可変速再生)により、動きが不自然になると、リップリーディングを併用することができず、視聴し難くなる。
【0008】
また、VTRのような従来の可変再生等では、可変速倍率が一定で、話速変換音声にきめ細かく、同期させることができない。
【0009】
また、従来の可変速再生機器(例えばVTRなど)等では、フィールドの内挿等の操作を行っておらず、高精度に時々刻々、速度を可変することは不可能であり、話速変換音声のように時々刻々、話速の変化する音声に同期(リップシンク)させることができない。
【0010】
本発明は、上記の点に鑑みて成されたもので、その目的は、VTRの可変速再生等のように、同一フィールドを2度以上、繰り返し提示したり、連続するフィールドを省いたりするために生じる動きの不自然さや、垂直方向に映像のジッターを生じることなく、話速変換音声に同期(リップシンク)して、映像/音声を同時に可変速でき、これにより視聴し難くすることなく、各視聴者の視聴覚特性にフィッティングして視聴を補助することができる話速/画速同時変換装置を提供することにある。
【0011】
【課題を解決するための手段】
上記目的を達成するため、発明は、話速倍率を設定する話速設定手段と、入力音声を無音区間、無声区間、有声区間に分割する区間分割手段と、前記話速設定手段で設定された前記話速倍率をもとに前記区間分割手段で分割された前記無音区間を延長/短縮する無音区間伸張短縮手段と、前記区間分割手段によって分割された前記有声区間に対してその基本周期を抽出する基本周期抽出手段と、該基本周期抽出手段で抽出された基本周期に従って各基本周期ごとに前記有声区間を分割する基本周期区間分割手段と、前記話速設定手段からの有声区間の伸張倍率に従って、前記基本周期区間分割手段で分割された基本周期区間を繰り返し、これにより有声区間の延長を行う基本周期区間繰り返す有声区間伸張短縮手段と、前記無音区間伸張短縮手段で伸張/短縮された無音区間および前記有声区間伸張短縮手段で伸張/短縮された有声区間並びに前記区間分割手段で分割された前記無声区間とを合成して話速変換音声として出力する合成手段と、話速変換を行なう可変長ブロック単位で、前記話速変換音声が原音声である前記入力音声と比べてどの程度時間的な差が生じたかを検知して該時間的な差を表す話速伸張・短縮コードを出力する話速伸張・短縮検出手段とを包含する話速変換手段、および入力映像のフィールド間での動きベクトルを検出する動き検出手段と、前記話速変換手段の前記話速伸張・短縮検出手段から転送される前記話速伸張・短縮コードが示す話速伸張/短縮量が映像の単位フィールド時間を超えた場合に、前記話速伸張/短縮量に相当する数のフィールドを内挿するための時間位置を決定し、前記動き検出手段が検出した前記映像の動きベクトルをもとに、前記入力画像に対して、決定した該時間位置のフィールドとこれに隣接するフィールドから合成した映像の内挿を行ない、その結果得られた画像の各フィールドを単位フィールド時間間隔で画速変換映像として出力するフィールド内挿手段とを包含する画速変換手段を具備することを特徴とする。
【0014】
ここで、前記フィールド内挿手段は、可変ブロック長単位で、時々刻々、速度の変化する前記話速変換音声に同期し、該可変ブロック長単位で、独立に映像の内挿位置を決定し、可変のフィールド数の内挿を行うとすることができる。
【0020】
本発明は、上記構成により、話速変換音声と映像を同期でき、聴覚特性と視覚特性の劣化を相乗的に補償し、各視聴者の視聴覚特性にフィッティングして視聴しやすくできる。原音声に比べ発声時間の変化する話速変換音声に同期して、自然性を保ったまま高品質に映像を可変速でき、加齢ないしは何らかの障害により生じる音声識別臨界速度(音声を正確に識別できる最大の話速)、及び映像の識別速度(映像の動きを正確に識別できる速度)等の低下を補い、各視聴者、千差万別の視聴覚特性に視聴側でフィッティングして、最適な話速音声および、これに同期し、映像も可変速して、視聴を補助することができる。
【0021】
また、本発明は、話速伸張・短縮コードをもとに、話速変換音声に同期して、適宜、映像を内挿することにより、時々刻々、映像の速度を可変でき、これにより、話速変換音声と映像とを同期(リップシンク)させることが可能となる。
【0022】
また、本発明は、ブロック単位で話速の変化する話速変換音声に同期して、適宜、映像の内挿位置を決定し、映像を内挿することにより、時々刻々、映像の速度を可変でき、これにより、話速変換音声と映像とを同期(リップシンク)させることが可能となる。
【0023】
また、本発明は、高品質な速度変換を可能とするため、映像の動きべクトルを検出して内挿を行うアルゴリズムをべースに、話速変換音声から得られる話速伸張・短縮コード(伸張もしくは短縮した情報)をもとに、可変時間長内で、任意の時間位置の映像を内挿し、話速変換音声と映像との同期(リップシンク)を可能とする。
【0024】
以上により、本発明によれば、映像を伴ったメディア(例えば、テレビジョン、VTR、DVDのような映像音声記録メディア、コンピュータ上での動画再生等)や医療機器等、発話者の声の高さ、個人性、及び音韻性を保持したまま高品質に発話速度を変換できる話速変換音声に同期し、映像も自然性を保ったまま高品質に速度の変換が可能であり、視聴者の視聴覚特性にフィッティングでき、視聴を補助することができる。
【0025】
【発明の実施の形態】
以下、図面に示す本発明の実施の形態に基づき本発明を詳細に説明する。
【0026】
なお、本発明は複数の機器からなるシステムにおいて達成されてもよく、1つの機器からなる装置に達成されてもよい。また、システムあるいは装置にプログラムを供給することにより、本発明を達成される場合にも適用されることは言うまでもない。例えば、専用の装置だけでなく、パーソナルコンピュータ(パソコン)等を使用しても実現することができる。また、本発明に係る話速変換アルゴリズム、画速変換アルゴリズムを実現する制御手順をプログラム形態で記録する記録媒体は、FD(フロッピーディスク)以外にも、CD−ROM、ICメモリカード等であってもよい。更に、本プログラムをROMに記録しておき、これをメモリマップの一部となすように構成し、直接CPUで実行することも可能である。
【0027】
図1は本発明の一実施形態の話速/画速同時変換システムの構成を機能ブロックで示した図である。この話速/画速同時変換システムは話速を変換する話速変換部100と画速を変換する画速変換部200とを有し、画速変換部200は話速変換部100からの話速変換音声の時間伸張情報に合わせて、任意の時間位置の映像を内挿することができ、話速変換音声と映像との同期(リップシンク)を可能としている。ここで、画速変換はハイビジョン、NTSC、PAL等の各種カラーテレビジョン方式に適応可能であるが、図1では、代表例としてハイビジョン(高品位テレビジョン、高精細度テレビジョン)についての場合を示す。
【0028】
[1]話速変換部100
話速変換部100は、後述の話速設定部9の定める比率にしたがって発話者の話速(音声スピード)を受聴者の受聴能力に応じた速さに変換して受聴者に受聴させることができる。即ち、話速変換部100は話速変換アルゴリズムに従って入力音声を無音区間、無声区間、有声区間に分割し、声の高さや個人性を保ち、受聴者が設定する話速倍率をもとに、高品位に話速変換を可能とする。この話速倍率は、例えば150ms程度の可変ブロック長単位で、変化させることができる。なお、話速変換アルゴリズムとしては、音声を一律に伸張する方式と、適応的に各部の伸張倍率を変化させて全体の伸張量を抑制する方式とが挙げられるが、そのいずれの方式でも本発明は適用可能である。
【0029】
話速変換部100は、A/D(アナログ・デジタル)変換部1、区間分割部2、無音区間延長部3、基本周期抽出部5、基本周期区間分割部6、基本周期区間繰り返し部7、合成部8、話速設定部9および、D/A(デジタル・アナログ)変換部10を具える。A/D変換部1はアナログの入力音声信号(音声入力)をA/D変換(l6ビット、16kHzサンプル)する。区間分割部2はA/D変換部1でデジタル化した音声入力を無音区間、無声区間、有声区間に分割する。
【0030】
無音区間延長部3はユーザーが設定する話速設定部9からの無音区間の伸張倍率に従って、区間分割部2によって分割された無音区間の延長を行うことにより、音声の間を制御する。
【0031】
発話者の個人性、及び音韻性を保つために無声区間4については加工はしない。
【0032】
基本周期抽出部5は、区間分割部2によって分割された有声区間に対してその基本周期を抽出する。基本周期区間分割部6は基本周期抽出部5で抽出された基本周期に従って、各基本周期ごとに有声区間を分割する。基本周期区間繰り返し部7はユーザーが設定する話速設定部9からの有声区間の伸張倍率に従って、基本周期区間分割部6で分割された基本周期区間を繰り返し、これにより有声区間の延長を行う。
【0033】
話速設定部9は、発話者の話す速さと受聴者の受聴能力に応じて無音区間の伸張倍率および有声区間の基本周期区間の伸張倍率の設定を行なう操作部である。
【0034】
合成部8は無音区間延長部3で延長された無音区間と、何の処理も施されていない無声区間4と、基本周期区間繰り返し部7で延長された有声区間とを合成する。これと同時に、合成部8は、話速変換を行なう可変長ブロック単位で、話速変換音声が原音声と比べて、どの程度伸張(短縮)したかを検出する。即ち、合成部8は区間分割部2から転送される原音声の分析区間と時間長の情報(原音声タイムコード)を逐次、内部メモリに格納しておき、その分析区間に対応した話速変換音声の時間長(話速変換音声タイムコード)とを比較し、どの程度、時間的な差(話速伸張・短縮コード)があるかを検知する。そして、合成部8はこの話速伸張・短縮コードを後述の画速変換部200のフィールド内挿部15へ転送する。
【0035】
合成部8で合成された音声信号は、D/A変換部10によりアナログ信号に変換されて話速変換音声としてスピーカ(図示しない)へ出力され、受聴者の受聴能力に応じた受聴者の好みの速さで発声される。
【0036】
[2]画速変換部200
画速変換部200は、高品質な速度変換を可能とするため、映像の動きベクトルを検出して内挿を行なう変換アルゴリズムをべースに、上記の話速変換部100の合成部8から転送される話速伸張・短縮コードをもとに、話速変換音声に同期して、適宜、可変時間長内で、任意の時間位置の映像(任意のフィールド数)を内挿可能とすることで、時々刻々、映像の速度を可変にする。この画速変換処理により、話速変換音声と映像との同期(リップシンク)を可能とする。
【0037】
一例として、画速変換部200はA/D変換部11、前処理部12、動き検出部13、ベクトル検出割り付け部14、フィールド内挿部15および、D/A変換部16を具える。前処理部12、動き検出部13および、ベクトル検出割り付け部14とで動きベクトル検出系を構成し、フィールド内挿部15で内挿系を構成する。
【0038】
入力する映像(アナログ映像信号)を例えばRGB4:4:4のフォーマットのA/D変換部11においてA/D変換する。A/D変換部11でデジタル化された映像信号に対して、動きべクトル検出・割付のための前処理を前処理部12で行う。例えば、前処理部12において映像信号をインターレースの1125/60/2:1からノンインターレースの652/60/1:1に変換する。前処理部12で前処理を施された映像信号は動き検出部13とベクトル検出割り付け部14とに送られる。
【0039】
動き検出部13は、例えば勾配法に基づく初期偏位べクトル(候補べクトル8種、ブロックサイズ:8画素、8ライン)を用いた反復勾配法(最大反復回数:2回、ブロックサイズ:8画素、8ライン)により、映像のフィールド間で動きべクトルを検出する。
【0040】
入力画像と時間的タイミングの異なるフイールドを新たに内挿するため、入力映像信号から動き検出部13で検出した動きべクトルを、ベクトル検出割り付け部14により新たに内挿するフイールド上に割り当てる。
【0041】
フィールド内挿部15は、話速変換部100の合成部8から転送された話速伸張・短縮コ―ドをもとに、A/D変換部11から送られてくる入力映像に対して任意の時間位置のフィールドを内挿する。即ち、フィールド内挿部15は、話速伸張・短縮コードが示す伸張(短縮)量が例えば1/60秒(1フィールド分)を越えた場合、映像の動きベクトルをもとに伸張量に相当する任意の時間位置のフィールドの内挿を行なう。
【0042】
フィールド内挿部15で内挿処理を受けた映像信号はD/A変換部16へ出力する。このとき、話速変換部100のD/A変換部10と画速変換部200のD/A変換部16とを同期することで、D/A変換部10からの話速変換音声とD/A変換部16からの画速変換映像とを同期して出力させる。
【0043】
図2は図1の話速/画速同時変換システムによる本発明に係わる話速/画速同時変換動作の一例を示す。
【0044】
図2の(a)に示す原音声(音声入力)を図1の話速変換部100により伸張すると、図2の(b)に示すように各音韻の継続時間が変化した音声となる。即ち、原音声は無声区間は変化しないが、有声区間と無音区間の継続時間がそれぞれ伸張した音声に変る。
【0045】
図2の(b)に示す話速変換したある有声区間を拡大して図示すると、図2の(d)のような波形となる。これに対応した原音声の区間の波形は、図2の(c)である。この図示の波形区間を、ある1つのブロックとする(このブロック長は可変長であり、時々刻々、ブロック長が変化する。)。なお、図2の(c)と(d)から原音声は基本周期を保ったまま伸張して変換音声に変換されていることが分かる。
【0046】
この原音声のブロックの時間長をT1とする。このT1とこのブロックが何番目のものかを示す区間情報とを合わせて、原音声タイムコードと呼ぶ。また、このブロックに対応した話速変換音声の時間長をT2とする。このT2とこのブロックが何番目のものかを示す区間情報とを合わせて、話速変換音声タイムコードと呼ぶ。
【0047】
ここで、(T2−T1)が話速変換により伸張・短縮した時間長となる。この時間長と上記の区間情報とを合わせて、話速伸張・短縮コードと呼ぶ。合成部8では、この(T2−T1)の時間長を算出して話速伸張・短縮コードを求める。フィールド内挿部15ではこの話速伸張・短縮コードを1/60秒(lフィールド分)で量子化し、図2の(c)で示した原音声に対応した映像のフィールド数と、図2の(d )に示した話速変換音声に対応した映像のフィールド数とを算出する。この算出結果が、図2の(e)に示す原画(フィールド)の枚数と、図2の(g)に示す画速変換により作り出さなければならないフィールド数に相当する。図2の(f)は内挿位置を表している。この内挿位置については、以下の図3を参照して詳述する。
【0048】
図3は、本発明に係る、ある可変ブロック長内における、フィールドの内挿位置の決め方を示す。
【0049】
原画のフィールド数:M、画速変換により作成するフィールド数:Nとすると、図3の(a)にM=Nの場合、図3の(b)にMNの場合を示している。この両者の内挿位置の決定方法は同一であり、以下に示す手順で決定する。
【0050】
1)原画のフィールドを、O1 、O2 、…、Oi 、Oi+1 、…、Om とする。
【0051】
2)画速変換により作成するフィールドを、C1 、C2 、…、Cj 、Cj+1 、…、Cn とする。
【0052】
3)各フレームCj に対して、次式(1)
【0053】
【数1】
Figure 0003730764
【0054】
を満足するiをiopt とし、
フレームCj は入力フレームO(iopt)-1とOipotの間に位置するものと考える。
【0055】
この時、O(iopt)-1からの内挿位置(Pj)を次式(2)により演算して与える。
【0056】
【数2】
Figure 0003730764
【0057】
4)以上の内挿処理を、各可変ブロック毎(各可変ブロックの時間長はそれぞれ異なる)に行い、画速変換する。
【0058】
任意の可変ブロック長単位で、時々刻々速度の変化する画速変換の例を図4に示す。図4は原画の映像を6フィールドから7フィールドへ変換出力した後、3フィールドから4フィールドへ変換して出力する場合の例を示している。図4の破線矢印で示すように、可変ブロックごとに、決定した内挿位置(時間位置)に、その内挿位置の原画(入力画像)のフィールドの映像と、隣接する原画のフィールドから合成した映像とを内挿し、画速変換している。
【0059】
【発明の効果】
以上説明したように、本発明によれば、映像を伴ったメディア(例えば、テレビジョン、VTR、DVDのような映像音声記録メディア、コンピュータ上での動画再生等)や医療機器等、発話者の声の高さ、個人性、及び音韻性を保持したまま高品質に発話速度を変換できる話速変換音声に同期して、映像も自然性を保ったまま高品質に速度の変換が可能であり、視聴者の視聴覚特性にフィッティングでき、視聴しやすくなる等の効果を有する。
【図面の簡単な説明】
【図1】本発明の一実施形態の話速/画速同時変換システムの構成を示すブロック図である。
【図2】本発明の一実施形態の話速/画速同時変換の動作例を示すタイミングチャートである。
【図3】本発明の一実施形態における映像のフィールドの内挿位置を示すタイミングチャートである。
【図4】本発明の一実施形態における可変ブロック長単位で、時々刻々速度の変化する画速変換の例を示すタイミングチャートである。
【符号の説明】
1、11 A/D変換部
2 区間分割部
3 無音区間延長部
5 基本周期抽出部
6 基本周期区間分割部
7 基本周期区間繰り返し部
8 合成部
9 話速設定部
10、16 D/A変換部
12 前処理部
13 動き検出部
14 ベクトル検出割り付け部
15 フィールド内挿部
100 話速変換部
200 画速変換部

Claims (2)

  1. 話速倍率を設定する話速設定手段と、
    入力音声を無音区間、無声区間、有声区間に分割する区間分割手段と、
    前記話速設定手段で設定された前記話速倍率をもとに前記区間分割手段で分割された前記無音区間を延長/短縮する無音区間伸張短縮手段と、
    前記区間分割手段によって分割された前記有声区間に対してその基本周期を抽出する基本周期抽出手段と、
    該基本周期抽出手段で抽出された基本周期に従って各基本周期ごとに前記有声区間を分割する基本周期区間分割手段と、
    前記話速設定手段からの有声区間の伸張倍率に従って、前記基本周期区間分割手段で分割された基本周期区間を繰り返し、これにより有声区間の延長を行う基本周期区間繰り返す有声区間伸張短縮手段と、
    前記無音区間伸張短縮手段で伸張/短縮された無音区間および前記有声区間伸張短縮手段で伸張/短縮された有声区間並びに前記区間分割手段で分割された前記無声区間とを合成して話速変換音声として出力する合成手段と、
    話速変換を行なう可変長ブロック単位で、前記話速変換音声が原音声である前記入力音声と比べてどの程度時間的な差が生じたかを検知して該時間的な差を表す話速伸張・短縮コードを出力する話速伸張・短縮検出手段と
    を包含する話速変換手段、および
    入力映像のフィールド間での動きベクトルを検出する動き検出手段と、
    前記話速変換手段の前記話速伸張・短縮検出手段から転送される前記話速伸張・短縮コードが示す話速伸張/短縮量が映像の単位フィールド時間を超えた場合に、前記話速伸張/短縮量に相当する数のフィールドを内挿するための時間位置を決定し、前記動き検出手段が検出した前記映像の動きベクトルをもとに、前記入力画像に対して、決定した該時間位置のフィールドとこれに隣接するフィールドから合成した映像の内挿を行ない、その結果得られた画像の各フィールドを単位フィールド時間間隔で画速変換映像として出力するフィールド内挿手段と
    を包含する画速変換手段
    を具備することを特徴とする話速/画速同時変換装置
  2. 前記フィールド内挿手段は、可変ブロック長単位で、時々刻々、速度の変化する前記話速変換音声に同期し、該可変ブロック長単位で、独立に映像の内挿位置を決定し、可変のフィールド数の内挿を行うことを特徴とする請求項に記載の話速/画速同時変換装置
JP24913697A 1997-09-12 1997-09-12 話速/画速同時変換装置 Expired - Fee Related JP3730764B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24913697A JP3730764B2 (ja) 1997-09-12 1997-09-12 話速/画速同時変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24913697A JP3730764B2 (ja) 1997-09-12 1997-09-12 話速/画速同時変換装置

Publications (2)

Publication Number Publication Date
JPH1188844A JPH1188844A (ja) 1999-03-30
JP3730764B2 true JP3730764B2 (ja) 2006-01-05

Family

ID=17188471

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24913697A Expired - Fee Related JP3730764B2 (ja) 1997-09-12 1997-09-12 話速/画速同時変換装置

Country Status (1)

Country Link
JP (1) JP3730764B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3620787B2 (ja) * 2000-02-28 2005-02-16 カナース・データー株式会社 音声データの符号化方法
JP2001312298A (ja) * 2000-04-27 2001-11-09 Nippon Hoso Kyokai <Nhk> 話速変換処理装置、話速変換処理方法、記録媒体および話速変換処理装置の使用法
JP2007047312A (ja) * 2005-08-08 2007-02-22 Sony Corp 話速変換装置
JP5093648B2 (ja) * 2007-05-07 2012-12-12 国立大学法人電気通信大学 再生装置

Also Published As

Publication number Publication date
JPH1188844A (ja) 1999-03-30

Similar Documents

Publication Publication Date Title
US7480446B2 (en) Variable rate video playback with synchronized audio
KR101642642B1 (ko) 동화상 음성 동기 장치, 동화상 음성 동기 방법 및 동화상 음성 동기용 컴퓨터 프로그램
JP5288214B2 (ja) データ処理装置、データ処理方法、及びプログラム
KR950035447A (ko) 음성 분석 자동화를 이용하는 비디오 신호 처리 시스템 및 그 방법
JP2009156888A (ja) 音声補正装置及びそれを備えた撮像装置並びに音声補正方法
US8676584B2 (en) Method for time scaling of a sequence of input signal values
KR100303913B1 (ko) 음성처리방법, 음성처리장치 및 기록재생장치
JP3730764B2 (ja) 話速/画速同時変換装置
JPH09172618A (ja) 画像変換装置
JP2009105706A (ja) 画像音声同期再生装置
KR100786926B1 (ko) 영상 기록 재생 장치 및 방법
JP3377463B2 (ja) 映像/音声ずれ補正システム、方法および記録媒体
JPH06165134A (ja) テレビジョン方式変換装置
JP3766534B2 (ja) 視覚的に聴覚を補助するシステムおよび方法並びに視覚的に聴覚を補助するための制御プログラムを記録した記録媒体
KR20010010928A (ko) 음성처리시스템에서 재생되는 음성신호의 시간축 변환방법
JP3741839B2 (ja) 画速変換システムおよび方法並びに画速変換制御プログラムを記録した記録媒体
JP2002185849A (ja) 出力装置、及びテレシネ表示方法
JP4226933B2 (ja) 映像信号処理装置
KR20070008232A (ko) 디지털 멀티미디어 배속 조절 장치 및 방법
JPS5925239B2 (ja) パラメ−タ補間方式
JP3793333B2 (ja) 時可変型画速変換装置
KR100359988B1 (ko) 실시간 화속 변환 장치
JP4120095B2 (ja) 画像情報変換装置および変換方法
JPS6153909B2 (ja)
KR0172879B1 (ko) 브이씨알의 가변음성신호처리장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050805

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050805

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051007

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091014

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101014

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111014

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121014

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121014

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131014

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141014

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees