JPH05265481A - 自然動画における音声編集装置 - Google Patents

自然動画における音声編集装置

Info

Publication number
JPH05265481A
JPH05265481A JP4089266A JP8926692A JPH05265481A JP H05265481 A JPH05265481 A JP H05265481A JP 4089266 A JP4089266 A JP 4089266A JP 8926692 A JP8926692 A JP 8926692A JP H05265481 A JPH05265481 A JP H05265481A
Authority
JP
Japan
Prior art keywords
signal
voice
audio
data
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4089266A
Other languages
English (en)
Inventor
Shigeru Izawa
繁 井沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CSK Corp
Original Assignee
CSK Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CSK Corp filed Critical CSK Corp
Priority to JP4089266A priority Critical patent/JPH05265481A/ja
Publication of JPH05265481A publication Critical patent/JPH05265481A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】 【目的】 フレーム間にわたる音声の編集が容易になる
自然動画における音声編集装置を提供する。 【構成】 音声信号から一語の開始となるトリガー信号
を得るトリガー検出部と、前記音声信号から一語の終了
となる無信号を検出するポーズ検出部と、前記トリガー
信号及びポーズ信号の時刻やメモリアドレスを記憶する
制御部と、前記トリガー信号からポーズ信号までのフレ
ーム数をカウントするフレームカウンタとを備え、前記
音声信号から前記トリガー検出部とポーズ検出部で検出
した一語の音声データを一つのまとまりとして音声スペ
クトルを得、この音声スペクトルを加工処理した後、前
記制御部で記憶したメモリアドレスに戻し、かつ前記フ
レームカウンタでカウントしたフレーム間にわたり、音
声データと画像データとを復元する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自然動画をデジタル処
理により画像情報に対応して音声情報を編集処理する自
然動画における音声編集装置に関するものである。
【0002】
【従来の技術】近年、記憶素子の大容量化とパーソナル
コンピュータの処理速度の向上にともない、テレビジョ
ン画像等のフルモーション、フルカラーの自然動画を1
フレーム(1/30秒)あるいは1フィールド(1/6
0秒)を単位として記録し、1コマ(1フレームまたは
2フィールドからなる1画面または1フィールド)毎
に、コンピュータ上で修正、変更、合成あるいは創作等
を行う画像処理技術が飛躍的に進歩している。このよう
な画像処理により、想像的な映像をアニメーションでな
く創作でき、個人的な娯楽の分野等で応用されつつあ
る。
【0003】図6は従来例の音声編集装置の構成を説明
するブロック図であり、音声編集装置は、各部を制御す
る制御部31と、音声信号をデジタル音声データに変換
するA/Dコンバータ32と、自然動画のフレームまた
はフィールド用同期信号を検出する同期信号検出部33
と、取込まれた音声データを記録する第1メモリ34
と、音声データにフーリエ変換を施し音声スペクトルを
得るフーリエ変換部35と、音声スペクトルを記録する
第2メモリ36と、1フレームの画像と対応する音声ス
ペクトルを画面表示する表示器37と、音声スペクトル
を画面表示上で加工処理するジョイスティク38やキー
ボード39と、加工処理された音声スペクトルに逆フー
リエ変換を施して音声データを得る逆フーリエ変換部4
0と、編集した音声データと対応する画像を記録する記
録メディア41とを備えている。
【0004】図7は従来例の音声編集処理を説明するフ
ローチャートであり、まず、制御部31からデータ取込
の指示が与えられ、ここで同期信号検出部33はフレー
ム用同期信号の有無を判別し、第1メモリ34へは1フ
レーム分の音声信号(音声データ)が取込まれる(ST
31〜ST33)。次に、制御部31の指示のもとにフ
ーリエ変換部35に音声データが転送され、ここでフー
リエ変換されて音声スペクトルが得られ、この音声スペ
クトルが第2メモリ36に転送されて記録される(ST
33、ST34)。続いて、図8の画面表示例に示すよ
うに、1フレーム分の画像と第2メモリ36の音声スペ
クトルの内容とが表示器37に表示され、この画面表示
上において、ジョイスティク38やキーボード39を用
いて、トーンを変えたり音声を変えたり等の音声スペク
トルの加工処理を行う(ST35、ST36)。次に、
加工処理した音声スペクトルを逆フーリエ変換部40で
変換して時間軸上の音声データとして第1メモリ34へ
戻し、続いてこの第1メモリ34の内容を対応する画像
データとともに記録メディア41に記録する(ST37
〜ST39)。
【0005】
【発明が解決しようとする課題】音付き自然動画におい
て、画像(映像)信号の各フレームと音声信号の関係を
時間軸で表示すると、図9のように示される。ここで音
声信号は、ケース1に示すように、各フレームで音声信
号の一語が終了していることもあるが、例えば、ゆっく
り喋ったり、間をおいて話たりした場合には、ケース2
に示すように、数フレーム間にわたって一語が存在する
ことがある。従来の音声編集装置では、上述のようにフ
レーム毎に同期をとって音声スペクトルを加工処理して
いたため、音声信号がケース2のように数フレーム間に
わたる場合には、各フレーム毎に加工処理し、フレーム
の継ぎ目に当たる部分の信号を調整していた。そのた
め、自然動画の編集処理の操作が煩雑になる問題点があ
った。
【0006】そこで本発明は、フレーム間にわたる音声
の編集が容易になる自然動画における音声編集装置を提
供することを目的とする。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、本発明の自然動画における音声編集装置は、自然動
画の音声信号をデジタル音声データとしてメモリに取込
み、この音声データをフーリエ変換により音声スペクト
ルを得、この音声スペクトルを画像データとともに表示
器に画面表示し、この画面表示上で加工処理をした音声
スペクトルを逆フーリエ変換により音声データを得、こ
の音声データを対応する画像データとともに記録メディ
アに記録する自然動画における音声編集装置において、
前記音声信号から一語の開始となるトリガー信号を得る
トリガー検出部と、前記音声信号から一語の終了となる
無信号を検出するポーズ検出部と、前記トリガー信号及
びポーズ信号の時刻やメモリアドレスを記憶する制御部
と、前記トリガー信号からポーズ信号までのフレーム数
をカウントするフレームカウンタとを備え、前記音声信
号から前記トリガー検出部とポーズ検出部で検出した一
語の音声データを一つのまとまりとして音声スペクトル
を得、この音声スペクトルを加工処理した後、前記制御
部で記憶したメモリアドレスに戻し、かつ前記フレーム
カウンタでカウントしたフレーム間にわたり、音声デー
タと画像データとを復元するものである。
【0008】
【作用】本発明によれば、音声信号からトリガー検出部
とポーズ検出部で一語の始めと終わりを検出し、この一
語の音声データを一つのまとまりとして音声スペクトル
を得、この音声スペクトルを加工処理した後、制御部で
記憶したメモリアドレスに戻し、かつフレームカウンタ
でカウントしたフレーム間にわたり、音声データと画像
データとを復元することで、自然動画のフレーム間にわ
たる音声の編集が容易になる。
【0009】
【実施例】以下、本発明を図示の一実施例により具体的
に説明する。図1は本発明実施例の自然動画における音
声編集装置の構成を説明するブロック図である。
【0010】同図において、本実施例の音声編集装置
は、音付き自然動画をコンピュータによるデジタル処理
で編集を行うときの音声加工処理を施すための装置であ
り、中央処理装置等の各部を制御する制御部11と、こ
の制御部11にバスライン等によりそれぞれ接続され
た、音声信号をアナログ信号からデジタル信号に変換す
るためのA/Dコンバータ12と、音声信号から設定値
以上の値を検出してトリガー信号を得るトリガー検出部
13と、音声信号から一語の切れ目となる無信号のポー
ズ信号を検出するポーズ検出部14と、A/Dコンバー
タ12で変換されたデジタル信号の音声データを記録す
る第1メモリ15及び第3メモリ16と、第1メモリ1
5に記録された音声データにフーリエ変換を施し音声ス
ペクトルを得るフーリエ変換部17と、このフーリエ変
換部17で得られた音声スペクトルを記録する第2メモ
リ18と、自然動画のフレーム画像と第2メモリ18に
記録された音声スペクトルの内容を表示する表示器19
と、この表示されたフレーム画像や音声スペクトルを画
面表示上で加工処理するときの入力装置となるジョイス
ティク20やキーボード21と、加工処理された音声ス
ペクトルに逆フーリエ変換を施して音声データを得る逆
フーリエ変換部22と、トリガー信号検出からポーズ信
号検出までのフレームまたはフィールド用同期信号をカ
ウントするフレームカウンタ23と、編集済の逆フーリ
エ変換された音声データを画像データとともに記録する
光磁気ディスクやコンパクトディスク(CD)等の記録
メディア24とから構成されている。
【0011】次に、上記構成の音声編集装置による音声
編集処理を具体的に説明する。図2及び図3は本発明実
施例の音声編集処理を説明するフローチャートである。
【0012】これらの図において、まず、オペレータに
よる所定の編集開始操作により、音声の編集処理をした
い部分につき、制御部11から音声信号をデジタル信号
に変換してデータ取込みの指示が与えられる(ST1
1)。この場合、後に説明する終了フラッグが第1メモ
リ15に設定されているかを判断することで、第1メモ
リ15の処理が終了しているか否かを判断し(ST1
2)、終了しているときには第1メモリ15へ音声信号
の取込みを開始し(ST13)、終了していないときに
は第3メモリ16へ音声信号の取込みを開始する(ST
14)。この取込み開始と同時にトリガー検出部13
は、動作を開始し、音声信号が所定の設定値以上になる
ときを検出してトリガー信号を出力する(ST15)。
すなわち、図9のケース2に示すように、画像信号が1
フレーム目に対応する音声信号が所定の設定値以上にな
る一語の始めを示すA点でトリガー信号が出力される。
このトリガー信号により制御部11は、そのトリガー検
出時刻と取込まれた音声信号のメモリ上のアドレスを記
憶する(ST16)。次に、トリガー信号が検出される
と、フレームカウンタ23が計数を開始し、音声信号か
らポーズ検出部14によりポーズ信号が検出されるまで
フレーム/フィールド用同期信号に基づきフレーム数を
カウントする(ST17、ST18)。すなわち、図9
のケース2に示すように、画像信号が3フレーム目に対
応する音声信号が一定時間無信号となる一語の終わりに
なるB点でポーズ信号が出力され、その間のフレーム数
がカウントされる。次に、ポーズ信号が検出されたとき
には、制御部11は、その検出時刻と取込まれた音声信
号のメモリ上のアドレスとフレームカウンタ23により
カウントされたフレーム数とを記憶する(ST19)。
次に、制御部11は、トリガー信号が検出された時刻の
少し前とポーズ信号が検出された時刻の少し後のデータ
を加えた音声データを、第1メモリ15からフーリエ変
換部17へ転送指示し、ここでフーリエ変換を施して音
声スペクトルを得、続いてこの音声スペクトルを第2メ
モリ18へ転送指示する(ST20)。このとき、トリ
ガー検出部13及びポーズ検出部14はリセットされ
る。
【0013】次に、制御部11の指示のもとに表示器1
9には、ポーズ信号を検出したときのフレーム画像とト
リガー信号を検出したとき迄の画像を遡ったフレーム画
像のコマ表示、及び第2メモリ18に記録された音声ス
ペクトルの表示が行われる(ST21、ST22)。こ
の表示例は、図4に示すように、画像のコマ表示が左側
半分に、また音声スペクトルが周波数軸上のパワー・ス
ペクトルとして右半分に表示される。この表示におい
て、音声信号が数フレームにわたる場合には、フレーム
カウンタ23から逆算して関連ある全フレームが表示さ
れ、例えば、区切りのフレームの画像が大きくコマ表示
され、未処理フレームがその上に小さく表示される。次
に、表示器19に表示された音声スペクトルに対して、
ジョイスティック20やキーボード21等の入力手段を
用いて制御部11の指示のもとに所定の加工処理を施す
(ST23)。
【0014】図5は本発明実施例の音声加工処理の例を
説明する図である。同図の変更モード1に示すように、
例えば、音声情報の強度を変更したい場合には、矢印で
示すように周波数の分布位置を変更せずに、そのパワー
・スペクトルの値(振幅)を実線から点線のように大き
くしたり小さくすればよく、音声を変える場合には、任
意の周波数上にパワー・スペクトルの値を点線のように
追加すればよい。また、同図の変更モード2に示すよう
に、例えば、音程を変更したい場合には、周波数の分布
パターンを変えずに、実線から点線のように、周波数を
2倍、あるいは1/2倍にすれば、1オクターブ高い
音、あるいは低い音に変更できる。同図の変更モード3
に示すように、例えば、ハスキーな声やダミ声にしたい
場合には、点線のような側波帯を追加することで変更が
できる。さらに、全く別のデータに変換することもでき
る。
【0015】次に、所定の加工処理された音声スペクト
ルは、逆フーリエ変換部22において逆フーリエ変換が
施され(ST24)、時間軸のデータとなった音声デー
タが得られる。この音声データは、制御部11が記憶し
ているトリガー信号とポーズ信号の検出時刻や記録され
たアドレスに基づいて、第1メモリ15の元の位置に戻
される(ST25)。次に、制御部11は、加工処理さ
れた第1メモリ15のデータを、対応する画像データと
ともに、所定の記録メディア24に記録指示する(ST
26)。次に、記録メディア24への正常な書込みが済
んだときには、第1メモリ15は、その処理が終了した
ことを示すフラグが設定され(ST27)、制御部11
からの次の音声編集処理の指示を待つ。区切りのフレー
ムのときに一語が終了し、次の一語が開始するような場
合には、第1メモリ15の処理が終了していないため、
制御部11は次の一語を第3メモリ16へ取込むよう指
示する(ST11〜ST14)。
【0016】上記構成の自然動画における音声編集装置
によれば、音付き自然動画の音声における一語を捉える
ために、トリガー検出部13でその音声信号から設定値
以上の値を検出してトリガー信号を得、ポーズ検出部1
4で音声信号から一語の終わりとして切れ目となるポー
ズ信号を検出し、それぞれのトリガー信号及びポーズ信
号の検出時刻または記録されるメモリのアドレスを制御
部11が記憶し、A/Dコンバータ12でデジタル信号
となった音声データをフーリエ変換部17で音声スペク
トルを得、その音声スペクトルに所定の加工処理を加え
た後、逆フーリエ変換部22で時間軸上の音声データに
変換し、その加工処理を加えた音声データを、元の記憶
されていたメモリの同じアドレス上に戻し、同時にフレ
ームカウンタ23でトリガ信号からポーズ信号までのフ
レーム数をカウントし、音声と画像をフレーム間にわた
って正確に復元している。従って、一語が数フレーム間
にわたる場合でも、従来のようにフレーム毎に加工処理
しフレームの継ぎ目に相当する部分の音声データの信号
を調整する必要がなくなり、フレーム間の音声の編集が
容易に行えるようになった。
【0017】なお、上記実施例において、トリガー検出
部13は、音声信号から設定値以上の値を検出してトリ
ガー信号を得る例を説明したが、図9のケース2に示す
ように、1フレーム目のC点に示す予め音声信号の所定
の位置をプリトリガー信号として設定することもでき
る。
【0018】
【発明の効果】以上説明したように本発明によれば、自
然動画の音声信号をフーリエ変換で音声スペクトルを
得、この音声スペクトルを加工処理した後、逆フーリエ
変換で音声データに変換する音声編集装置において、ト
リガー検出部とポーズ検出部とを備えることで、音声信
号から直接一語の始めと終わりとなるトリガー信号とポ
ーズ信号を検出できるため、一語が数フレーム間にわた
る場合でも、フレーム毎に加工しフレームの継ぎ目に相
当する部分の音声データの信号を調整する必要がなくな
り、フレーム間の音声の編集が容易に行える効果があ
る。
【図面の簡単な説明】
【図1】本発明実施例の音声編集装置の構成を説明する
ブロック図である。
【図2】本発明実施例の音声編集処理を説明するフロー
チャートである。
【図3】本発明実施例の音声編集処理を説明するフロー
チャートである。
【図4】本発明実施例の表示器による表示例を説明する
図である。
【図5】本発明実施例の音声加工処理の例を説明する図
である。
【図6】従来例の音声編集装置の構成を説明するブロッ
ク図である。
【図7】従来例の音声編集処理を説明するフローチャー
トである。
【図8】従来例の表示器による表示例を説明する図であ
る。
【図9】自然動画における画像信号の各フレームと音声
信号の関係を時間軸で表示した図である。
【符号の説明】
11 制御部 12 A/Dコンバータ 13 トリガー検出部 14 ポーズ検出部 15 第1メモリ 16 第3メモリ 17 フーリエ変換部 18 第2メモリ 19 表示器 20 ジョイスティク 21 キーボード 22 逆フーリエ変換部 23 フレームカウンタ 24 記録メディア

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 自然動画の音声信号をデジタル音声デー
    タとしてメモリに取込み、この音声データをフーリエ変
    換により音声スペクトルを得、この音声スペクトルを画
    像データとともに表示器に画面表示し、この画面表示上
    で加工処理をした音声スペクトルを逆フーリエ変換によ
    り音声データを得、この音声データを対応する画像デー
    タとともに記録メディアに記録する自然動画における音
    声編集装置において、 前記音声信号から一語の開始となるトリガー信号を得る
    トリガー検出部と、前記音声信号から一語の終了となる
    無信号を検出するポーズ検出部と、前記トリガー信号及
    びポーズ信号の時刻やメモリアドレスを記憶する制御部
    と、前記トリガー信号からポーズ信号までのフレーム数
    をカウントするフレームカウンタとを備え、前記音声信
    号から前記トリガー検出部とポーズ検出部で検出した一
    語の音声データを一つのまとまりとして音声スペクトル
    を得、この音声スペクトルを加工処理した後、前記制御
    部で記憶したメモリアドレスに戻し、かつ前記フレーム
    カウンタでカウントしたフレーム間にわたり、音声デー
    タと画像データとを復元することを特徴とする自然動画
    における音声編集装置
JP4089266A 1992-03-16 1992-03-16 自然動画における音声編集装置 Pending JPH05265481A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4089266A JPH05265481A (ja) 1992-03-16 1992-03-16 自然動画における音声編集装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4089266A JPH05265481A (ja) 1992-03-16 1992-03-16 自然動画における音声編集装置

Publications (1)

Publication Number Publication Date
JPH05265481A true JPH05265481A (ja) 1993-10-15

Family

ID=13965955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4089266A Pending JPH05265481A (ja) 1992-03-16 1992-03-16 自然動画における音声編集装置

Country Status (1)

Country Link
JP (1) JPH05265481A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001088905A1 (fr) * 2000-05-02 2001-11-22 Siu Cheung Mok Procede et dispositif permettant de representer une image sonore et rythmee
JP2010191042A (ja) * 2009-02-17 2010-09-02 Yamaha Corp 音声処理装置およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001088905A1 (fr) * 2000-05-02 2001-11-22 Siu Cheung Mok Procede et dispositif permettant de representer une image sonore et rythmee
JP2010191042A (ja) * 2009-02-17 2010-09-02 Yamaha Corp 音声処理装置およびプログラム

Similar Documents

Publication Publication Date Title
JPH0773583A (ja) 放送信号の記録及び再生装置とその制御方法
JP3222621B2 (ja) 画像信号入出力装置
JPH01236467A (ja) 情報再生装置
US5339167A (en) Reproduction speed controller for image signal reproducing apparatus
JPS62243490A (ja) ビデオ編集および処理方法および装置
JPH05265481A (ja) 自然動画における音声編集装置
JPH05216487A (ja) カラオケ装置
JP3316344B2 (ja) 音声信号再生装置
JP2996646B2 (ja) 検索時画面の歪みを防止したデジタルビデオカセットレコーダ及びそれによる画面処理方法
JP3491981B2 (ja) マルチメディア・プレゼンテーション方法およびシステム,ならびにマルチメディア・データ作成方法およびシステム
JP3197853B2 (ja) 静止画表示装置
JPH09154093A (ja) 映像・音声再生装置
JP4601095B2 (ja) 再生装置
KR20000008466A (ko) 실시간데이터 기록 및 재생장치와 그 제어방법.
JPH10108129A (ja) ビデオディスク再生装置
JPH07199879A (ja) 音声対応画像表示装置及び方法
JP3298945B2 (ja) 画像作成装置
KR100256388B1 (ko) 비디오 디스크 플레이시스템에 있어서 부분화면 확대방법
JP3551800B2 (ja) ディジタル画像記録再生装置及び方法
JPH10228755A (ja) ディジタルビデオカセットレコーダ(dvcr)のフォト情報のサーチ方法
JPH08292796A (ja) 再生装置
JPH07250300A (ja) 記録再生装置と記録再生媒体
JPH09186964A (ja) ビデオ用高速度撮影装置
JP2607068B2 (ja) 情報信号送出装置
JPS58158736A (ja) 電算写植用音声入力方法