JPS60184299A - 音声編集装置 - Google Patents
音声編集装置Info
- Publication number
- JPS60184299A JPS60184299A JP59039539A JP3953984A JPS60184299A JP S60184299 A JPS60184299 A JP S60184299A JP 59039539 A JP59039539 A JP 59039539A JP 3953984 A JP3953984 A JP 3953984A JP S60184299 A JPS60184299 A JP S60184299A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- audio data
- directory
- editing
- pointer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(A)発明の技術分野
本発明は、音声編集装置、特に、コンピュータを用い音
声を文単位1文節単位等できめ綱かに編集することがで
きるようにした音声編集装置に関するものである。
声を文単位1文節単位等できめ綱かに編集することがで
きるようにした音声編集装置に関するものである。
(B)従来技術とその問題点
従来、音声データを編集する方法としては、(1)アナ
ログ録音テープに記録された音声をテープレコーダで再
生しながら録音テープをハサミと粘着テープで切り貼り
していく方法、(211台の録音用テープレコーダの入
力側に切り換えスイッチを介して複数の再生用テープレ
コーダを接続し、再生用テープレコーダの音声出力を耳
でチェックしながらダビング編集していく方法があった
。しかし、これらはいずれも音声内容とテープレコーダ
カウンタの指示値を対にしたメツ構成し、それを基にし
て基本的に順編成の(シーケンシャルの)録音テープを
早送りあるいは巻き戻して編集作業を行っているために
、大まかな音声の編集が可能であるにすぎず、例えば音
声を文単位2文節単位等で編集するなどきめ細かな編集
を能率よく行うことはできなかった。
ログ録音テープに記録された音声をテープレコーダで再
生しながら録音テープをハサミと粘着テープで切り貼り
していく方法、(211台の録音用テープレコーダの入
力側に切り換えスイッチを介して複数の再生用テープレ
コーダを接続し、再生用テープレコーダの音声出力を耳
でチェックしながらダビング編集していく方法があった
。しかし、これらはいずれも音声内容とテープレコーダ
カウンタの指示値を対にしたメツ構成し、それを基にし
て基本的に順編成の(シーケンシャルの)録音テープを
早送りあるいは巻き戻して編集作業を行っているために
、大まかな音声の編集が可能であるにすぎず、例えば音
声を文単位2文節単位等で編集するなどきめ細かな編集
を能率よく行うことはできなかった。
このため、本願出願人は、コンピュータを用いることに
より、音声のきめ細かな編集を行なうことができる音声
編集装置を提案した。
より、音声のきめ細かな編集を行なうことができる音声
編集装置を提案した。
この音声編集装置の基本的構成を、第1図に示す。図中
、■は入力された音声を編集部への適した信号形態に変
換する入力部、2は音声の編集を行う編集部、3は音声
の編集にあたって必要なデータ等を格納するメモリ部、
4は編集された音声を適切な信す形態に変換して出力す
る出方部である。 ゛ 第2図に音声の特徴量時系列を視覚的に表示して目で観
察しながら細かな編集をしようとする音声編集装置を示
す。
、■は入力された音声を編集部への適した信号形態に変
換する入力部、2は音声の編集を行う編集部、3は音声
の編集にあたって必要なデータ等を格納するメモリ部、
4は編集された音声を適切な信す形態に変換して出力す
る出方部である。 ゛ 第2図に音声の特徴量時系列を視覚的に表示して目で観
察しながら細かな編集をしようとする音声編集装置を示
す。
入力部1はマイクロホン5とこのマイクロホンからのア
ナログ信号をディジタル信号に変換するA/D変換器6
とにより構成し、編集部2はコンピュータ7とディスプ
レイ8とキーボード9とにより構成し、メモリ部3は主
記憶装置1oと磁気ディスク等の補助記憶装置11とに
より構成し、出力部4は編集部2からのディジタル信号
をアナログ信号に変換するD/A変換器12とスピーカ
13とにより構成する。
ナログ信号をディジタル信号に変換するA/D変換器6
とにより構成し、編集部2はコンピュータ7とディスプ
レイ8とキーボード9とにより構成し、メモリ部3は主
記憶装置1oと磁気ディスク等の補助記憶装置11とに
より構成し、出力部4は編集部2からのディジタル信号
をアナログ信号に変換するD/A変換器12とスピーカ
13とにより構成する。
マイクロホン5カ槌の音声信号は、A7D変換器6でデ
ィジタル量に変換され、コンピュータ7はこれを磁気デ
ィスク11に格納する。コンピュータ7は、格納された
音声データがら音声の特徴量時系列を計算する。特徴量
時系列には、音声の強さを表すパワ一時系列、音声信号
が原点と交差するゼロ交差回数時系列、音声の高さく音
階)を表すピッチ周波数時系列等があるが、本実施例で
は、コンピュータ7はパワ一時系列を計算するものとす
る。
ィジタル量に変換され、コンピュータ7はこれを磁気デ
ィスク11に格納する。コンピュータ7は、格納された
音声データがら音声の特徴量時系列を計算する。特徴量
時系列には、音声の強さを表すパワ一時系列、音声信号
が原点と交差するゼロ交差回数時系列、音声の高さく音
階)を表すピッチ周波数時系列等があるが、本実施例で
は、コンピュータ7はパワ一時系列を計算するものとす
る。
一般に、音声信号時系列データをxi (i=1゜2、
−−−− n)で表すと、次式 の引算により、音声パワ一時系列Pj(j、=1゜2、
− −−)を得ることができる。
−−−− n)で表すと、次式 の引算により、音声パワ一時系列Pj(j、=1゜2、
− −−)を得ることができる。
4
コンピュータ7ば計算したパワ一時系列を、ディスプレ
イ8に表示する。装置利用者は、このパワ一時系列表示
を見ながらキーボード9から音声編集指示や音声出力の
指示を行う。音声出力の指示がなされた時にはコンピュ
ータ7は磁気ディスク1】から音声データを読み出し、
D/A変換器12およびスピーカ13に送り出すことに
より音声出力を行う。
イ8に表示する。装置利用者は、このパワ一時系列表示
を見ながらキーボード9から音声編集指示や音声出力の
指示を行う。音声出力の指示がなされた時にはコンピュ
ータ7は磁気ディスク1】から音声データを読み出し、
D/A変換器12およびスピーカ13に送り出すことに
より音声出力を行う。
ディスプレイ8の画面上における音声入力1Ma集、出
力の一態様を第3図に基づいて説明する。
力の一態様を第3図に基づいて説明する。
今、装置利用者が音声として「この件につきまして エ
ート 返事を ゴポン お願いします 至急」をマイク
ロホン5に入力したもめとする。第3図(alは、ディ
スプレイ8の画面上に表示されたパワ一時系列を示す。
ート 返事を ゴポン お願いします 至急」をマイク
ロホン5に入力したもめとする。第3図(alは、ディ
スプレイ8の画面上に表示されたパワ一時系列を示す。
縦軸方向はパワーの大きさを、横軸方向は時間を示す。
このパワ一時系列の波形aは音声「この件につきまして
」に、波形すは「エート」に、波形Cは「返事を」に、
波形dは「ゴホン」に、波形eは「お願します」に、波
形fは「至急」にそれぞれ対応している。
」に、波形すは「エート」に、波形Cは「返事を」に、
波形dは「ゴホン」に、波形eは「お願します」に、波
形fは「至急」にそれぞれ対応している。
キーボード9を操作しディスプレイ画面上のカーソルを
用いて、不要な音声「エート」(波形b)の開始部分と
終了部分とを“指示”すると、コンピュータ7はその部
分間に確認のためアンダーラインLを表示する。次に、
キーボード9を操作し、て“削除”を指示すると、「エ
ート」に対応する波形すが削除される。同様に不要な音
声「ゴボン」 (波形d)の部分も削除すると、ディス
プレイ画面のパワ一時系列表示は第3図(blに示すよ
うになる。
用いて、不要な音声「エート」(波形b)の開始部分と
終了部分とを“指示”すると、コンピュータ7はその部
分間に確認のためアンダーラインLを表示する。次に、
キーボード9を操作し、て“削除”を指示すると、「エ
ート」に対応する波形すが削除される。同様に不要な音
声「ゴボン」 (波形d)の部分も削除すると、ディス
プレイ画面のパワ一時系列表示は第3図(blに示すよ
うになる。
さらに、キーボード9の操作により“指示”。
“削除”を行って無音部g、h、i、jを削除すると、
ディスプレイ画面のパワ一時系列表示は第3図(C1に
示すようになる。
ディスプレイ画面のパワ一時系列表示は第3図(C1に
示すようになる。
次に、キーボード9を操作して、画面上のカーツルで音
声「至急」 (波形f)の部分を指示し、「つきまして
」と「返事を」との間を指示し、キーボードにより“挿
入”を指示すると、「つきまして」と1返事を」との間
に「至急」が、挿6人される、ずなわち波形aと波形C
との間に波形fが挿入される。この最終的なパワ一時系
列表示を、第3図1dlに示す。
声「至急」 (波形f)の部分を指示し、「つきまして
」と「返事を」との間を指示し、キーボードにより“挿
入”を指示すると、「つきまして」と1返事を」との間
に「至急」が、挿6人される、ずなわち波形aと波形C
との間に波形fが挿入される。この最終的なパワ一時系
列表示を、第3図1dlに示す。
キーボード9を操作し、カーソルにより有音部の先頭と
末尾を指示して“出力”の指示を行うと、スピーカ13
から[この件につきまして至急返事をお願いします」と
いう編集された音声が出力される。この場合、1目間い
ただけでは聞きとれない場合には、キーボードにより“
出力”の指示を行うことにより何度でも音声を聞くこと
ができる。
末尾を指示して“出力”の指示を行うと、スピーカ13
から[この件につきまして至急返事をお願いします」と
いう編集された音声が出力される。この場合、1目間い
ただけでは聞きとれない場合には、キーボードにより“
出力”の指示を行うことにより何度でも音声を聞くこと
ができる。
以上の説明では、説明を簡単にするため短い文章を用い
たが、実際には2分程度の音声を画面に表示することが
でき、さらに編集済み音声データを磁気ディスク11に
戻し、未編集音声データを読み出すということを繰り返
せば、数分以上におよぶ手紙1通、会ill 1セツシ
ヨン等の音声編集処理を行うことができる。
たが、実際には2分程度の音声を画面に表示することが
でき、さらに編集済み音声データを磁気ディスク11に
戻し、未編集音声データを読み出すということを繰り返
せば、数分以上におよぶ手紙1通、会ill 1セツシ
ヨン等の音声編集処理を行うことができる。
音声の特徴量時系列をディスプレイ画面上に表示しなが
ら対話形式で編集するという本実施例音声編集装置によ
れば、文単位1文節用位で音声を編集することができる
ので、きめ細かな編集が可能となる。
ら対話形式で編集するという本実施例音声編集装置によ
れば、文単位1文節用位で音声を編集することができる
ので、きめ細かな編集が可能となる。
確かに、前述した音声編集装置では、きめ細かな音声の
編集を行なうことができるが、メモリ部3に格納される
音声データの量が膨大であるため、磁気ディスク装置1
1等のアクセスに時間が掛かるという欠点がある。
編集を行なうことができるが、メモリ部3に格納される
音声データの量が膨大であるため、磁気ディスク装置1
1等のアクセスに時間が掛かるという欠点がある。
このため、この欠点を除去することができる第4図以降
に示される音声編集装置を同時に提案している。
に示される音声編集装置を同時に提案している。
第4図に示す音声編集装置は、例えば、フロッピーディ
スク等の記憶装置に蓄積された音声データを編集する場
合に、音声データを複数のブロックに分割し、各ブロッ
クに対しそのブロックの記憶装置上のアドレスから成る
ポインタを構成し、全ブロックに対するポインタの集合
としてディレクトリを構成し、ポインタに対して編集作
業を行うことにより、音声データ自体を記憶装置上で移
動することなく等価的に音声データの編集を行うことに
より、きめ細かな編集ができるようにしたものである。
スク等の記憶装置に蓄積された音声データを編集する場
合に、音声データを複数のブロックに分割し、各ブロッ
クに対しそのブロックの記憶装置上のアドレスから成る
ポインタを構成し、全ブロックに対するポインタの集合
としてディレクトリを構成し、ポインタに対して編集作
業を行うことにより、音声データ自体を記憶装置上で移
動することなく等価的に音声データの編集を行うことに
より、きめ細かな編集ができるようにしたものである。
また、ディスプレイ画面上に音声の特徴量系列を表示し
て観察しながら、音声データ自体を記憶装置上で移動す
ることなく、ディレクトリ上でポインタ自体を移動する
ことにより音声を編集できるようにしたものである。
て観察しながら、音声データ自体を記憶装置上で移動す
ることなく、ディレクトリ上でポインタ自体を移動する
ことにより音声を編集できるようにしたものである。
入力部lばマイクロホン23とこのマイクロホンからの
アナログ信号をディジタル信号に変換するA/D変換器
24とにより構成し、編集部2はマイクロコンピュータ
25とディスプレイ26とキーボード27と音声特徴量
計算回路28とにより構成し、メモリ部3を音声データ
およびディレクトリ用のフロッピーディスク29と音声
編集。
アナログ信号をディジタル信号に変換するA/D変換器
24とにより構成し、編集部2はマイクロコンピュータ
25とディスプレイ26とキーボード27と音声特徴量
計算回路28とにより構成し、メモリ部3を音声データ
およびディレクトリ用のフロッピーディスク29と音声
編集。
人出カプログラム用のソロソピーデイ〜スク30とによ
り構成し、出力部4はディジタル信号をアナログ信号に
変換するD/A変換器31とスピーカ32とにより構成
する。
り構成し、出力部4はディジタル信号をアナログ信号に
変換するD/A変換器31とスピーカ32とにより構成
する。
音声の特徴量としては、前述したように、音声の強さを
表すパワー、音声信号が原点と交差するゼロ交差回数、
音声の高さく高階)を表すピ・ノチ周波数等がある。し
たがって、特徴量計算回路28としては、パワー計算回
路、ゼロ交差回数計算回路、ピンチ周波数計算回路等が
あるが、この例ではパワー計算回路を用いている。もち
ろん、他のものを用いてもよい。
表すパワー、音声信号が原点と交差するゼロ交差回数、
音声の高さく高階)を表すピ・ノチ周波数等がある。し
たがって、特徴量計算回路28としては、パワー計算回
路、ゼロ交差回数計算回路、ピンチ周波数計算回路等が
あるが、この例ではパワー計算回路を用いている。もち
ろん、他のものを用いてもよい。
マイクロホン23から入力された音声信号はA/D変換
器24によりディジタル量の時系列に変換された後、マ
イクロコンピュータ25の制御によりフロッピーディス
ク29に格納されるとともの特徴量時系列が計算されフ
ロッピーディスク29に格納される。次いで、音声の特
徴量時系列はディスプレイ26に表示される。この表示
に基づいて、装置利用者がキーボード27から入力する
編集コマンドに対応して、マイクロコンピュータ25は
後述のごとく編集処理を行う。編集の途中あるいは編集
の終了後、マイクロコンピュータ25は装置利用者がキ
ーボード27から入力する音声出力コマンドに対応して
、音声データをD/A変換器31転送し、アナログ量に
変換してスピーカ32を駆動し音として出力する。
器24によりディジタル量の時系列に変換された後、マ
イクロコンピュータ25の制御によりフロッピーディス
ク29に格納されるとともの特徴量時系列が計算されフ
ロッピーディスク29に格納される。次いで、音声の特
徴量時系列はディスプレイ26に表示される。この表示
に基づいて、装置利用者がキーボード27から入力する
編集コマンドに対応して、マイクロコンピュータ25は
後述のごとく編集処理を行う。編集の途中あるいは編集
の終了後、マイクロコンピュータ25は装置利用者がキ
ーボード27から入力する音声出力コマンドに対応して
、音声データをD/A変換器31転送し、アナログ量に
変換してスピーカ32を駆動し音として出力する。
第5図に各処理を総合した大まかな流れを示すフローチ
ャートを示す。
ャートを示す。
第6図は、フロッピーディスク29の内容を示す図であ
る。ここでは8インチ両面倍密度フロッピーディスクの
場合につい°ζ説明する。図に示すようにフロッピーデ
ィスクの1トランク5の表」〜「トラック76の裏」の
範囲の936にバイトを音声データ格納用に用いている
。音声をA/D変換器24によりA /、D変換する場
合のサンプリング速度を8Kllz、語長を8ピントと
すれば、936にバイトの領域は117秒(約2分)の
音声を収録することができる。また、フロッピーディス
クの「トラック1の表」〜「トラック4の裏」の範囲5
2にバイトのうち48にバイトをディレクトリ用の領域
としている。
る。ここでは8インチ両面倍密度フロッピーディスクの
場合につい°ζ説明する。図に示すようにフロッピーデ
ィスクの1トランク5の表」〜「トラック76の裏」の
範囲の936にバイトを音声データ格納用に用いている
。音声をA/D変換器24によりA /、D変換する場
合のサンプリング速度を8Kllz、語長を8ピントと
すれば、936にバイトの領域は117秒(約2分)の
音声を収録することができる。また、フロッピーディス
クの「トラック1の表」〜「トラック4の裏」の範囲5
2にバイトのうち48にバイトをディレクトリ用の領域
としている。
第7図(alは、ディレクトリの内容を示すものである
。48にバイトのディレクトリは3バイト長のポインタ
16383ivAで構成されている。1つのポインタは
、lフレームの音声データの所在と属性(特徴量)を示
すものである。1フレームは、64バイトの音声データ
の集合であり、936にバイトの音声データは、 936にバイト÷64バイト=1497官6 (フレー
ム)で構成されるので、ポインタは14976個以上あ
れば十分である。1つのポインタは第7図(b)に示す
ようにビット配分されている。最上位の1ビツトはこの
ポインタの有効/無効を示すもので、このビットがOの
ときは有効でありこのポインタに対応する音声データが
存在することを示し、1のときは無効でありこのポイン
タに対応する音声データが存在しないことを示ず。この
ビットがOのときは残りの23ビツトが意味を持ち、上
位から順に7ビツトがトラック番号を、1ビツトがサイ
ド番号を、5ビツトがセクタ番号を、2ビツトがフレー
ム番号を、8ビツトが特徴量をそれぞれ表している。特
徴量としては、音声データlフレーム分の平均パワー、
ゼロ交差回数、平均ピンチ周波数等が有効であり、前述
したようにこの例では平均パワーを用いている。トラン
ク番号、サイド番号、セクタ番号、フレーム番号はこの
ポインタに対応する音声データがフロッピーディスク上
のどの位置にあるかを示している。なお、サイド番号を
示すビットがOのときはフロンピーディスクの表を、1
のときはフロッピーディスクの裏を示す。また、lセク
タ内には4フレームの音声データが格納される。
。48にバイトのディレクトリは3バイト長のポインタ
16383ivAで構成されている。1つのポインタは
、lフレームの音声データの所在と属性(特徴量)を示
すものである。1フレームは、64バイトの音声データ
の集合であり、936にバイトの音声データは、 936にバイト÷64バイト=1497官6 (フレー
ム)で構成されるので、ポインタは14976個以上あ
れば十分である。1つのポインタは第7図(b)に示す
ようにビット配分されている。最上位の1ビツトはこの
ポインタの有効/無効を示すもので、このビットがOの
ときは有効でありこのポインタに対応する音声データが
存在することを示し、1のときは無効でありこのポイン
タに対応する音声データが存在しないことを示ず。この
ビットがOのときは残りの23ビツトが意味を持ち、上
位から順に7ビツトがトラック番号を、1ビツトがサイ
ド番号を、5ビツトがセクタ番号を、2ビツトがフレー
ム番号を、8ビツトが特徴量をそれぞれ表している。特
徴量としては、音声データlフレーム分の平均パワー、
ゼロ交差回数、平均ピンチ周波数等が有効であり、前述
したようにこの例では平均パワーを用いている。トラン
ク番号、サイド番号、セクタ番号、フレーム番号はこの
ポインタに対応する音声データがフロッピーディスク上
のどの位置にあるかを示している。なお、サイド番号を
示すビットがOのときはフロンピーディスクの表を、1
のときはフロッピーディスクの裏を示す。また、lセク
タ内には4フレームの音声データが格納される。
マイクロホン23から入力され、A/D変換器24によ
ってディジタル量に変換された音声データがマイクロコ
ンピュータ25の制御でフロッピーディスク29の1ト
ランク5の表」から順に格納された場合を考える。音声
の長さが16秒であったとすると、128000バイト
のデータ長となるが、これは2000フレーム長となり
、音声データは「トラック5の表」から「トラック14
の裏」の第6セクタの末尾(第3クレーム)までに格納
されることになる。
ってディジタル量に変換された音声データがマイクロコ
ンピュータ25の制御でフロッピーディスク29の1ト
ランク5の表」から順に格納された場合を考える。音声
の長さが16秒であったとすると、128000バイト
のデータ長となるが、これは2000フレーム長となり
、音声データは「トラック5の表」から「トラック14
の裏」の第6セクタの末尾(第3クレーム)までに格納
されることになる。
音声入力直後にマイクロコンピュータ25がフロ・7ピ
ーデイスク29のディレクトリ領域(トラフ21表〜ト
ラック4裏)に作成するブイレフl−りの内容を第8図
に示す。「ポインタ0」は、音声データの第1フレーム
が[存在し、トランク5゜サイドO(表)、セクタ1の
第1フレーム(はじめのV4)に存在して、特徴量(こ
の例ではパワー)が0であることを示している。「ポイ
ンタl」は、次のフレームが同じセクタの「第1フレー
ム(2目の+A)」に存在し、パワーが35であること
を示している。以下同様に、ポインタ1999までが音
声データの格納場所とパワーを示すように設定される。
ーデイスク29のディレクトリ領域(トラフ21表〜ト
ラック4裏)に作成するブイレフl−りの内容を第8図
に示す。「ポインタ0」は、音声データの第1フレーム
が[存在し、トランク5゜サイドO(表)、セクタ1の
第1フレーム(はじめのV4)に存在して、特徴量(こ
の例ではパワー)が0であることを示している。「ポイ
ンタl」は、次のフレームが同じセクタの「第1フレー
ム(2目の+A)」に存在し、パワーが35であること
を示している。以下同様に、ポインタ1999までが音
声データの格納場所とパワーを示すように設定される。
[ポインタ2000J〜[ポインタ16383Jについ
ては対応する音声データが存在しないので最上位のビッ
トを1に設定する。
ては対応する音声データが存在しないので最上位のビッ
トを1に設定する。
残りの23ビツトは、*印で示しているが、ビットとし
てはlでも0でもよい。
てはlでも0でもよい。
第9図は音声の入力からディレクトリを作成するまでの
処理の流れを示すフローチャートである。
処理の流れを示すフローチャートである。
まず、音声入力のコマンドを受けとると、音声データを
格納するフロンピーディスクの音声データ格納領域を設
定(トランク5.サイドO(裏)。
格納するフロンピーディスクの音声データ格納領域を設
定(トランク5.サイドO(裏)。
セクタl、第Oフレーム(最初のA))する。
マイクロホンより音声データが入力されると、音声デー
タはフロンピーディスクのアドレスADで示される領域
に順次ライトする。音声データの入力につれて、順次ア
ドレスを更新つつ、フロッピーディスクにライトする。
タはフロンピーディスクのアドレスADで示される領域
に順次ライトする。音声データの入力につれて、順次ア
ドレスを更新つつ、フロッピーディスクにライトする。
そして、マイクロホンよりの音声データの入力がなくな
った時点でのフロッピーディスクのアドレスADをレジ
スタADEに格納する。
った時点でのフロッピーディスクのアドレスADをレジ
スタADEに格納する。
これと共に、フロンピーディスクのディレクトリ領域を
示すポインタENを“O”にセットする。
示すポインタENを“O”にセットする。
また、フロッピーディスクの音声データ格納領域のアド
レスを初期値に書き換える。
レスを初期値に書き換える。
次に、フロッピーディスクのアドレスADで示される領
域(64バイト)をリードし、各領域におけるパワーを
計算する。
域(64バイト)をリードし、各領域におけるパワーを
計算する。
計算の結果、得られたパワーはアドレスADと共にポイ
ンタENに書込まれる。
ンタENに書込まれる。
この動作を順次、繰返し、ポインタENが16383(
すなわちポインタENが一杯)になるまでにアドレスA
DがレジスタADHに格納されたアドレスと一致したら
、残りのポインタENにFFFF’FF(16進数)を
格納する。これにより音声データがないことを示す。
すなわちポインタENが一杯)になるまでにアドレスA
DがレジスタADHに格納されたアドレスと一致したら
、残りのポインタENにFFFF’FF(16進数)を
格納する。これにより音声データがないことを示す。
第1表は、キーボード18から操作者が指定する編集コ
マンドの例である。
マンドの例である。
第1表
コマンド(11ば[第1000フレーム目から10フレ
ーム分を聞く」という指示で、このコマンドによりマイ
クロコンピュータ16は、ポインタを順に読み出し、ポ
インタの指示する音声データを読み出しD/A変換器2
1に転送し、スピーカ22を駆動して音声出力を行う。
ーム分を聞く」という指示で、このコマンドによりマイ
クロコンピュータ16は、ポインタを順に読み出し、ポ
インタの指示する音声データを読み出しD/A変換器2
1に転送し、スピーカ22を駆動して音声出力を行う。
コマンド(2)は[第1000フレーム目からlOフレ
ーム分を削除する」という指示で、マイクロコンピュー
タ16は[ポインタ1010J〜[ポインタ1999J
をIOワードずつ(1ワードは3バイト)アドレスの低
い方へ移動する。次に、ポインタ移動により空領域とな
る末尾IOワードについては最上位ビットを1として無
効化する。
ーム分を削除する」という指示で、マイクロコンピュー
タ16は[ポインタ1010J〜[ポインタ1999J
をIOワードずつ(1ワードは3バイト)アドレスの低
い方へ移動する。次に、ポインタ移動により空領域とな
る末尾IOワードについては最上位ビットを1として無
効化する。
ここで重要な点は、音声データそのものは移動せずに、
ディレクトリ内でポインタを移動する点であり、音声デ
ータ自体を移動する場合に比べて転送量が63360バ
イトから2970バイトに減り、転送量が約1/20に
なることである、。
ディレクトリ内でポインタを移動する点であり、音声デ
ータ自体を移動する場合に比べて転送量が63360バ
イトから2970バイトに減り、転送量が約1/20に
なることである、。
コマンド(3)はコマンド口)と同様な方法で第500
フレーム目から20フレ一ム分音声出力する指示である
。
フレーム目から20フレ一ム分音声出力する指示である
。
コマンド(4)は第500フレーム目から20フレ一ム
分の音声をバッファに退避させる指示である。
分の音声をバッファに退避させる指示である。
ここでも、音声データそのものを退避するかわりにポイ
ンタを退避することにより、退避量が約1/20となり
、したがって退避用バッファの容量が1/20で済むこ
ととなる。
ンタを退避することにより、退避量が約1/20となり
、したがって退避用バッファの容量が1/20で済むこ
ととなる。
コマンド(5)は、コマンド+i+と同様な方法で第1
50フレーム目から30フレ一ム分の音声出力を行うコ
マンドである。
50フレーム目から30フレ一ム分の音声出力を行うコ
マンドである。
コマンド(6)は、第149フレーム目と第150フレ
ームとの間に、バッファに退避した前記データを取り出
し、挿入する指示である。具体的には、「ポインタ15
0」〜「ポインタ1989Jを20ワードずつアドレス
の高い方に移動し、空いた領域に前記退避した20ワー
ドのポインタをコピーする。この操作ではデータの転送
量が音声データ自体を転送する場合に比べて約1/20
になる上に、2つ以上のポインタが同一データに指すこ
とにより、音声データの増加を防止している。
ームとの間に、バッファに退避した前記データを取り出
し、挿入する指示である。具体的には、「ポインタ15
0」〜「ポインタ1989Jを20ワードずつアドレス
の高い方に移動し、空いた領域に前記退避した20ワー
ドのポインタをコピーする。この操作ではデータの転送
量が音声データ自体を転送する場合に比べて約1/20
になる上に、2つ以上のポインタが同一データに指すこ
とにより、音声データの増加を防止している。
次に、ディプレイ26の画面表示について説明する。編
集部2の特徴量計算回路28において計算されたパワ一
時系列は、フロッピーディスク29に格納されている。
集部2の特徴量計算回路28において計算されたパワ一
時系列は、フロッピーディスク29に格納されている。
マイクロコンピュータ25は、フロッピーディスク29
から音声データ自体ではなくディレクトリを読み出し、
その特徴量部分を用いてディスプレイ26の画面上に表
示させる。前述と同様に、音声[この件につきましてエ
ート 返事を ゴホン お願いします 至急」が入力さ
れた場合について考える。音声入力直後のディスプレイ
画面を第10図(alに示す。この画面は、第3図Ta
lと全く同じであり、画面上の波形と音声との対応関係
は第3(a)での説明に従うものとする。ここで装置利
用者は、不要な内容である音声「エート」(波形b)の
部分をキーボード27からの操作で指定すると、マイク
ロコンピュータ25はこの部分が音声の310フレーム
・−635フレームであることを判断し、これに対応す
るディレクトリ・ポインタを削除する。すなわち、ポイ
ンタ636〜ポインタ1999を326ワード(1ワー
ドは3バイト)アドレスの低い方に移動し、末尾にでき
た空領域すなわちポインタ1674〜1999の最上位
ビットを1にしてポインタの無効化を行う。第10図1
ctには、説明の便宜上フレーム番号3’I Oおよび
635を表示しているが、これらは画面上に実際表示さ
れるものではない。同様の操作により不要な音声「ゴホ
ン」 (波形d)の部分も除去した場合のディスプレイ
画面が第1O図1b)に示す画面である。次に、各文節
間の無音部(g、、h、t、j)を同様の操作により除
去した場合のディスプレイ画面が第10図1c)に示す
両面である。
から音声データ自体ではなくディレクトリを読み出し、
その特徴量部分を用いてディスプレイ26の画面上に表
示させる。前述と同様に、音声[この件につきましてエ
ート 返事を ゴホン お願いします 至急」が入力さ
れた場合について考える。音声入力直後のディスプレイ
画面を第10図(alに示す。この画面は、第3図Ta
lと全く同じであり、画面上の波形と音声との対応関係
は第3(a)での説明に従うものとする。ここで装置利
用者は、不要な内容である音声「エート」(波形b)の
部分をキーボード27からの操作で指定すると、マイク
ロコンピュータ25はこの部分が音声の310フレーム
・−635フレームであることを判断し、これに対応す
るディレクトリ・ポインタを削除する。すなわち、ポイ
ンタ636〜ポインタ1999を326ワード(1ワー
ドは3バイト)アドレスの低い方に移動し、末尾にでき
た空領域すなわちポインタ1674〜1999の最上位
ビットを1にしてポインタの無効化を行う。第10図1
ctには、説明の便宜上フレーム番号3’I Oおよび
635を表示しているが、これらは画面上に実際表示さ
れるものではない。同様の操作により不要な音声「ゴホ
ン」 (波形d)の部分も除去した場合のディスプレイ
画面が第1O図1b)に示す画面である。次に、各文節
間の無音部(g、、h、t、j)を同様の操作により除
去した場合のディスプレイ画面が第10図1c)に示す
両面である。
次に、装置利用者が第10図1c)の画面上で音声「至
急」 (波形r)の部分を指定し、これを「つきまして
」と「返事を」との間に移動するようにキーボード27
により指示すると、マイクロコンピュータ25は、「至
急」の部分が650フレームから850フレームにある
ことと、[つきまし’?Llと1−返事を4との間が2
10フレームであることを判定し、650フレーム〜8
50フレームに対応するディレクトす・ポインタの退避
を行ってから、ポインタ210〜650を201フレ一
ム分アドレスの高い方へ移動し、ポインタ210〜41
0の領域へ退避しておいたポインタを格納する。このよ
うにして得られるディスプレイ画面が第10図(diに
示す画面である。ここで、装置利用がキーボード27に
より音声出力を指示すると、マ・イクロコンピュータ2
5はディレクトリから「ポインタ0」〜「ポインタ85
0」を順次取り出し、各ポインタが所在を示す音声デー
タを読み出してp/A変換器31へ送すスビーカ32か
ら「この件につきまして至急返事をお願いします」とい
う音声出力を行う。ディスプレイ画面で音声の一部を指
定して音声出力することも可能である。
急」 (波形r)の部分を指定し、これを「つきまして
」と「返事を」との間に移動するようにキーボード27
により指示すると、マイクロコンピュータ25は、「至
急」の部分が650フレームから850フレームにある
ことと、[つきまし’?Llと1−返事を4との間が2
10フレームであることを判定し、650フレーム〜8
50フレームに対応するディレクトす・ポインタの退避
を行ってから、ポインタ210〜650を201フレ一
ム分アドレスの高い方へ移動し、ポインタ210〜41
0の領域へ退避しておいたポインタを格納する。このよ
うにして得られるディスプレイ画面が第10図(diに
示す画面である。ここで、装置利用がキーボード27に
より音声出力を指示すると、マ・イクロコンピュータ2
5はディレクトリから「ポインタ0」〜「ポインタ85
0」を順次取り出し、各ポインタが所在を示す音声デー
タを読み出してp/A変換器31へ送すスビーカ32か
ら「この件につきまして至急返事をお願いします」とい
う音声出力を行う。ディスプレイ画面で音声の一部を指
定して音声出力することも可能である。
以上説明したように音声の特徴量時系列をディスプレイ
画面上に表示しつつ対話形式で行うとともに、フレーム
単位での音声編集が可能となるのできめ細かい編集を行
うことができる。さらには、音声データ自体をフロッピ
ーディスク上で移動させずにディレクトリのみをアクセ
スしており、ディレクトリ容量は音声データの約1/2
0であることから、ディレクトりのみのアクセスにより
編集作業におけるデータ転送量は約1/20に短縮され
ている。したがって、大容量の音声データ自体をアクセ
スする代りに、小容量のディレクトリをアクセスするこ
とにより、表示9編集処理を高速に行うことができ、こ
のため実時間処理が可能となる。
画面上に表示しつつ対話形式で行うとともに、フレーム
単位での音声編集が可能となるのできめ細かい編集を行
うことができる。さらには、音声データ自体をフロッピ
ーディスク上で移動させずにディレクトリのみをアクセ
スしており、ディレクトリ容量は音声データの約1/2
0であることから、ディレクトりのみのアクセスにより
編集作業におけるデータ転送量は約1/20に短縮され
ている。したがって、大容量の音声データ自体をアクセ
スする代りに、小容量のディレクトリをアクセスするこ
とにより、表示9編集処理を高速に行うことができ、こ
のため実時間処理が可能となる。
しかしながら、従来の音声編集装置では、音声の特徴量
だけを表示して編集作業を行なっており、音声の区切り
等の判別が容易ではなく、編集に時間が掛かるという欠
点があった。
だけを表示して編集作業を行なっており、音声の区切り
等の判別が容易ではなく、編集に時間が掛かるという欠
点があった。
(C)発明の目的
本発明の目的は、前述した従来の欠点に鑑み、音声の区
切り等の判別を容易に行なうことができ、音声の編集を
短時間で行なうことのできる音声編集装置を提供するこ
とにある。
切り等の判別を容易に行なうことができ、音声の編集を
短時間で行なうことのできる音声編集装置を提供するこ
とにある。
(D)発明の構成
そして、この目的は、入力される音声信号を音声データ
に変換する入力部と、前記音声データを複数のブロック
に分割して格納する第1のメモリと、各ブロック毎の音
声データの特徴量を計算する計算部と、前記第1のメモ
リ上の各ブロックのアドレスと前記特徴量とから成るポ
インタの集合であるディレクトリを第2のメモリ上に形
成するディレクトリ形成部と、前記ディレクトリをアク
セスすることにより特徴量の時系列を得て、これを視覚
的に表示する表示部と、表示された特徴量時系列の移動
、削除等の処理を指示する指示手段と、前記指示に基づ
いて、前記ディレクトリ上のポインタのみを前記第2の
メモリ上で移動、削除することにより前記特徴量の時系
列の編集を行なう編集処理部とを備えた音声編集装置で
あって、前記ディレクトリ形成部は前記特徴量時系列の
区切り、あるいは区切りとその表示色を示す情報からな
るポインタ前記指示手段からの指示に基づいて、前記デ
ィレクトリの一部として前記第2のメモリ上に形成する
ことを特徴とする音声編集装置を提供することにより達
成される。
に変換する入力部と、前記音声データを複数のブロック
に分割して格納する第1のメモリと、各ブロック毎の音
声データの特徴量を計算する計算部と、前記第1のメモ
リ上の各ブロックのアドレスと前記特徴量とから成るポ
インタの集合であるディレクトリを第2のメモリ上に形
成するディレクトリ形成部と、前記ディレクトリをアク
セスすることにより特徴量の時系列を得て、これを視覚
的に表示する表示部と、表示された特徴量時系列の移動
、削除等の処理を指示する指示手段と、前記指示に基づ
いて、前記ディレクトリ上のポインタのみを前記第2の
メモリ上で移動、削除することにより前記特徴量の時系
列の編集を行なう編集処理部とを備えた音声編集装置で
あって、前記ディレクトリ形成部は前記特徴量時系列の
区切り、あるいは区切りとその表示色を示す情報からな
るポインタ前記指示手段からの指示に基づいて、前記デ
ィレクトリの一部として前記第2のメモリ上に形成する
ことを特徴とする音声編集装置を提供することにより達
成される。
(E)発明の実施例
以下、本発明に係る音声編集装置の実施例を図面を用い
て説明する。
て説明する。
本実施例において、使用される音声編集装置の概略の構
成は、第4図と同一であるため、実施例の説明は第4図
を用いる。
成は、第4図と同一であるため、実施例の説明は第4図
を用いる。
第11図は、第4図に示す、フロッピーディスク29の
内容を示す図である。本実施例において、フロンピーデ
ィスク29は8インチ両面倍密度フロッピーディスクの
場合について説明する。
内容を示す図である。本実施例において、フロンピーデ
ィスク29は8インチ両面倍密度フロッピーディスクの
場合について説明する。
第11図に示すように本実施例ではトラック5の表〜ト
ラック76の裏の範囲の936にバイトを音声データ格
納用に用いている。音声をA/D変換器によりA/D変
換する場合のサンプリング速度を8KIIz、語長を8
ビツトとすれば936にバイトの領域は117秒(約2
分)の音声を収録することができる。又、本実施例では
トランク1の表〜トランク3の表の範囲52にバイトを
ディレクトリ用の領域としている。
ラック76の裏の範囲の936にバイトを音声データ格
納用に用いている。音声をA/D変換器によりA/D変
換する場合のサンプリング速度を8KIIz、語長を8
ビツトとすれば936にバイトの領域は117秒(約2
分)の音声を収録することができる。又、本実施例では
トランク1の表〜トランク3の表の範囲52にバイトを
ディレクトリ用の領域としている。
第12図+alばディレクトリの内容を示すものである
。52にバイトのディレクトリは3バイト長のエントリ
17,749個で構成されている。エントリにはポイン
タとマーカの2種があるが、ポインタは1フレームの音
声の所在と属性(特徴量)を示すものである。■フレー
ムは64バイトの音声データの集合であり、936にバ
イトの音声データは 936バイト÷64ハイド=14,976 (フレーム
)で構成されるのでポインタは14.976個以上あれ
ば十分である。又、マーカは区切とその表示色を示す補
助的なエントリである。尚、特許請求の範囲ではエント
リをポインタと称している。1つのエントリは第12図
に示すようにビット配分されている。最上位ビットはエ
ントリの種類を示すもので、0のときはこのエントリが
第12図(b)に示すポインタであることを、lのとき
は第12図(C1に示すマーカであることを現す。この
ビットが0のとき、つまりポインタの場合は残りの23
ビツトが上位檜)ら順にトラック番号、サイド番号、セ
クタ番号、フレーム番号、特徴量を表わす。特徴量とし
ては音声データ1フレーム分の平均パワー、ゼロ交叉数
、平均ピンチ数等が自効である。
。52にバイトのディレクトリは3バイト長のエントリ
17,749個で構成されている。エントリにはポイン
タとマーカの2種があるが、ポインタは1フレームの音
声の所在と属性(特徴量)を示すものである。■フレー
ムは64バイトの音声データの集合であり、936にバ
イトの音声データは 936バイト÷64ハイド=14,976 (フレーム
)で構成されるのでポインタは14.976個以上あれ
ば十分である。又、マーカは区切とその表示色を示す補
助的なエントリである。尚、特許請求の範囲ではエント
リをポインタと称している。1つのエントリは第12図
に示すようにビット配分されている。最上位ビットはエ
ントリの種類を示すもので、0のときはこのエントリが
第12図(b)に示すポインタであることを、lのとき
は第12図(C1に示すマーカであることを現す。この
ビットが0のとき、つまりポインタの場合は残りの23
ビツトが上位檜)ら順にトラック番号、サイド番号、セ
クタ番号、フレーム番号、特徴量を表わす。特徴量とし
ては音声データ1フレーム分の平均パワー、ゼロ交叉数
、平均ピンチ数等が自効である。
トラック番号、サイド番号、セクタ番号、フレーム番号
は、このポインタが対応する音声データがフロッピーデ
ィスク29上のどこにあるかを示している。エントリの
最上位ビットが1.つまりマーカの場合は、下位23ビ
ツトがともに1ならつまりこのエントリがFFFFFF
(16進数)ならば、このマーカが情報を持っていない
ことを示し、ともに1でなければこのマーカは区切り記
号を表わしていることを示し、最下位3ビツトが表示色
を示す。
は、このポインタが対応する音声データがフロッピーデ
ィスク29上のどこにあるかを示している。エントリの
最上位ビットが1.つまりマーカの場合は、下位23ビ
ツトがともに1ならつまりこのエントリがFFFFFF
(16進数)ならば、このマーカが情報を持っていない
ことを示し、ともに1でなければこのマーカは区切り記
号を表わしていることを示し、最下位3ビツトが表示色
を示す。
さて、マイクロホン23から入力され、・A / D変
換器24によってディジタル量に変換された音声データ
がマイクロコンピュータ25の制御でフロッピーディス
ク29のトラック5の表から順に格納された場合を考え
る。音声の長さが16秒であったとすると128,00
0バイトのデータ長となるが、これは2000フレーム
長となり、音声データはトラック5の表からトラック1
4.裏。
換器24によってディジタル量に変換された音声データ
がマイクロコンピュータ25の制御でフロッピーディス
ク29のトラック5の表から順に格納された場合を考え
る。音声の長さが16秒であったとすると128,00
0バイトのデータ長となるが、これは2000フレーム
長となり、音声データはトラック5の表からトラック1
4.裏。
第6セクタの末尾(第3フレーム)までに格納されるこ
とになる。
とになる。
音声人力直後にマイクロコンピュータ25がフロッピー
ディスク29のディレクトリ領域(トラック13表、〜
トランク4.裏)に作成するディレクトリの内容を第1
3図に示ず。工、ントす0はポインタで、音声データの
第1フレームがトラフ・ り5.サイドO(表)、セク
タlの第0フレーム(はじめのA)に存在し、特徴量(
この例ではパワー)が0であることをボしている。
ディスク29のディレクトリ領域(トラック13表、〜
トランク4.裏)に作成するディレクトリの内容を第1
3図に示ず。工、ントす0はポインタで、音声データの
第1フレームがトラフ・ り5.サイドO(表)、セク
タlの第0フレーム(はじめのA)に存在し、特徴量(
この例ではパワー)が0であることをボしている。
エントリ1もポインタで、次のフレーム音声が同じセク
タの第1フレーム(2つめのA)に存在し、パワーが3
5であることを示している。
タの第1フレーム(2つめのA)に存在し、パワーが3
5であることを示している。
以下同様にエントリ3999までが音声データの格納場
所とパワーを示すように設定される。エントリ4000
〜17,748については対応する音声データが存在し
ないのでエントリの内容をFF、FFFF (16進数
)にし、情報なしのマーカとしておく。
所とパワーを示すように設定される。エントリ4000
〜17,748については対応する音声データが存在し
ないのでエントリの内容をFF、FFFF (16進数
)にし、情報なしのマーカとしておく。
第14図はディスプレイ26における各処理の結果を示
すための画面を表わす図である。
すための画面を表わす図である。
第14図(alは、音声入力直後のディスプレイ画面で
あり、第10図talと同一の画面である。この場合、
マイクロコンピュータ25はフロンピーディスク29か
らディレクトリのみを読み出し、その特徴量のみを用い
てディスプレイ26上に表示する。
あり、第10図talと同一の画面である。この場合、
マイクロコンピュータ25はフロンピーディスク29か
らディレクトリのみを読み出し、その特徴量のみを用い
てディスプレイ26上に表示する。
ここで15図(al、 (b)を用いて、入力された音
声データを表示するための処理の流れを説明する。
声データを表示するための処理の流れを説明する。
まず、キーボード27により音声データの格納場所とパ
ワーを表わすエントリが格納されてし)るページを示す
ページ番号を入力する。
ワーを表わすエントリが格納されてし)るページを示す
ページ番号を入力する。
ここで、ページ0はエントリ0からエントリ4999ま
で、ページlはエントリ5000からエフ ト’J 9
999まで、ページ2はエントリ1006ooからエン
トリ14999まで、ページ3はエントリ15000か
らエントリ17 ?’ 48までが格納されζいるもの
とする。
で、ページlはエントリ5000からエフ ト’J 9
999まで、ページ2はエントリ1006ooからエン
トリ14999まで、ページ3はエントリ15000か
らエントリ17 ?’ 48までが格納されζいるもの
とする。
入力されたページ番号に対応する最初のエントリENB
をレジスタENにセットする。
をレジスタENにセットする。
これと共に、ディスプレイ26上の表示位置を示すフレ
ーム番号FRが格納されるレジスタFRを0”にセット
する。
ーム番号FRが格納されるレジスタFRを0”にセット
する。
この状態でレジスタENに格納されたフロ・ノビ−ディ
スク29のディレクトリエントリENBから順次リード
する。そして、エントリの最上位ビットが“′0”なら
ば特徴量をバーの長さに変換してディスプレイ26上に
表示する。
スク29のディレクトリエントリENBから順次リード
する。そして、エントリの最上位ビットが“′0”なら
ば特徴量をバーの長さに変換してディスプレイ26上に
表示する。
また、エントリの最上位ビットが“1”で、かつエント
リがFFFFFF (16進)でないならばマーカを下
位3ビツトで指定される色で表示する。
リがFFFFFF (16進)でないならばマーカを下
位3ビツトで指定される色で表示する。
第2表にマーカの下位3ビ・ノドと表示される色関係を
示す。
示す。
第2表
以上説明した動作を順次繰返して行ない、フロッピーデ
ィスクのエントリENAI旨定されたページの最終エン
トリENEになり、このエンド1月LNの表示が終了す
る進行なう。
ィスクのエントリENAI旨定されたページの最終エン
トリENEになり、このエンド1月LNの表示が終了す
る進行なう。
この状態で本装置利用者は、ディスプレイ26の画面上
でカーソル操作によって適当な位置へ“区切り”の挿入
と表示色を指示する。第14図(b)が“区切り”挿入
後の画面であり、“区切り”は図中記号Kを用いて示さ
れる。
でカーソル操作によって適当な位置へ“区切り”の挿入
と表示色を指示する。第14図(b)が“区切り”挿入
後の画面であり、“区切り”は図中記号Kを用いて示さ
れる。
一番最初に付与された区切りKを例にとって、マイクロ
コンピュータ25の処理の動作について説明する。
コンピュータ25の処理の動作について説明する。
第16図に、区切りKの挿入の処理のフローチャートを
示す。
示す。
本装置利用者がカーソル操作によって、“区切り”Kの
挿入位置を指定すると、マイクロコンピュータ25は、
このカーソル位置からフレーム番号FRを計算し、例え
ば350フレームであることを判断する。
挿入位置を指定すると、マイクロコンピュータ25は、
このカーソル位置からフレーム番号FRを計算し、例え
ば350フレームであることを判断する。
そして、フロッピーディスク29のディレクトリのエン
1−りの350以降を1工ントリ分だけ、後ろにずらし
、エントリ350があ?た場所にマーカ(第12図te
lに示す)を挿入する。
1−りの350以降を1工ントリ分だけ、後ろにずらし
、エントリ350があ?た場所にマーカ(第12図te
lに示す)を挿入する。
次に本装置利用者はカーソル指定で音声の一部を示すこ
とにより音声出力を行う。この場合マイクロコンピュー
タ25はディレクトリ中のポインタのアドレスによって
、フロッピーディスク29中の音声データを読み出し、
D/A変換器31に送ってアナログ化し、スピーカ32
から音声出力する。
とにより音声出力を行う。この場合マイクロコンピュー
タ25はディレクトリ中のポインタのアドレスによって
、フロッピーディスク29中の音声データを読み出し、
D/A変換器31に送ってアナログ化し、スピーカ32
から音声出力する。
第17図は音声出力の処理の流れを示すフローチャート
である。
である。
まず、本装置利用者がキーボード27により第14図(
C)に示す画面上で音声出力したい部分の始点と終点を
カーソルで指定する。マイクロコンピュータ25は、こ
の指定されたカーソル位置から始点のフレーム番号N1
と終点のフレーム番号N2を計算する。次いで、メモリ
上のバッファをクリアした後に、フレーム番号が格納さ
れるレジスタENにフレーム番号Nlを、セットする。
C)に示す画面上で音声出力したい部分の始点と終点を
カーソルで指定する。マイクロコンピュータ25は、こ
の指定されたカーソル位置から始点のフレーム番号N1
と終点のフレーム番号N2を計算する。次いで、メモリ
上のバッファをクリアした後に、フレーム番号が格納さ
れるレジスタENにフレーム番号Nlを、セットする。
そして、フレーム番号N1がセットされたレジスタEN
の内容に基づいてディレクトリエントリの読み出しを行
ない、最上位ビットがOであればエイトリのトラック、
サイド、セクタ、フレームに従って、フロッピーディス
ク29から64バイトの音声データを読み出す。
の内容に基づいてディレクトリエントリの読み出しを行
ない、最上位ビットがOであればエイトリのトラック、
サイド、セクタ、フレームに従って、フロッピーディス
ク29から64バイトの音声データを読み出す。
読み出された64バイトの音声データはメモリ上のバッ
ファへ格納される。
ファへ格納される。
そして、フレーム番号がN2になるまで、順次音声デー
タの読み出しを行ない、フレーム°番号N2に対応する
音声データの読み出しが終了したら、メモリ上のバッフ
ァの内容をD/A変換器31へ転送し、スピーカ32に
より音声出力する。
タの読み出しを行ない、フレーム°番号N2に対応する
音声データの読み出しが終了したら、メモリ上のバッフ
ァの内容をD/A変換器31へ転送し、スピーカ32に
より音声出力する。
従って、前述したマーカとこの音声出力を利用し、例え
ば文節単位、単語単位にマーカを挿入することにより、
後述する削除、挿入の処理を容易にさせる。次に、装置
利用者は、「エート」、「ゴポン」等、話の筋に関係し
ない音声を削除する操作について説明する。
ば文節単位、単語単位にマーカを挿入することにより、
後述する削除、挿入の処理を容易にさせる。次に、装置
利用者は、「エート」、「ゴポン」等、話の筋に関係し
ない音声を削除する操作について説明する。
第18図は削除の処理の流れを示すフローチャートであ
る。
る。
まず、キーボード26−ヒで削除を指定する。そして、
削除したい音声部分、例えば第14図(blに示ず「エ
ート」(波形b)をカーソル指定する。
削除したい音声部分、例えば第14図(blに示ず「エ
ート」(波形b)をカーソル指定する。
このとき、第14図(blで示される画面上には「エー
ト」(波形b)の音声部分がどこからどこまであるのか
を示す区切りkが表示されているので、装置利用者はま
ず、カーソルを最初の区切りkに位置付けて、この点を
始点とすると共に、後側の区切りkを終点となるように
位置付ける。
ト」(波形b)の音声部分がどこからどこまであるのか
を示す区切りkが表示されているので、装置利用者はま
ず、カーソルを最初の区切りkに位置付けて、この点を
始点とすると共に、後側の区切りkを終点となるように
位置付ける。
マイクロコンピュータ25はこの始点と終点におけるフ
レーム番号N1とN2を計算する。
レーム番号N1とN2を計算する。
そして、ディレクトリのエントリN2〜19748をN
1〜(1774B、−(N2−Nl) )へ移動する。
1〜(1774B、−(N2−Nl) )へ移動する。
そして、ディレクトリのエントリ [17748−(N
2−Nl)+1]〜17748にFFFFFF (16
進数)を詰める。
2−Nl)+1]〜17748にFFFFFF (16
進数)を詰める。
これにより、音声部分「エート」(波形b)のディレク
トリのエントリが削除される。
トリのエントリが削除される。
(F)発明の詳細
な説明したように、本考案によれば、表示装置の画面上
でマーカを同時に表示せしめることにより音声の区切り
等を容易に判別することができるので、挿入、削除等の
処理を容易に行なうことができ、編集時間を短縮するこ
とができる。
でマーカを同時に表示せしめることにより音声の区切り
等を容易に判別することができるので、挿入、削除等の
処理を容易に行なうことができ、編集時間を短縮するこ
とができる。
第1図は音声編集装置の基本的構成を示す図。
第2図、第4図は音声の特徴量時系列を視覚的に表示し
て編集を行なう音声編集装置の構成、を示す図、第3図
、第10図はディスプレイ画面上における編集の態様を
説明するための図、第5図は音声&i築詰装置各処理の
大まかな流れを示すフローチャート第6図は、フロッピ
ーディスクの内容を示す図、第7図はディレクトリの構
成及びポインタのビット構成を示す図、第8図はディレ
クトリの内容を示す図、第9図は、音声の入力からディ
レクトリを作成するまでの処理の流れを示すフローチャ
ート第11図は氷見明係る音声編集装置のフロッピーデ
ィスクの内容を示す図、第12図は、ディレクトリの構
成及びポインタとマーカからなるエントリのビット構成
を示す図、第13図は、ディレクトリの内容を示す図、
第14図は本発明を説明するためのデ4スプレ4画面上
の編集態様を示す図、第15図は音声データを表示する
処理の流れを示すフローチャート、第16図は区切りを
挿入する処理のフローチャート、第17図は音声出力の
処理の流れを示すフローチャート。 第18図は削除の処理を示すフローチャートである。 図において、1は入力部、2は編集部、3はメモリ部、
4は出力部、5.23はマイクロボン。 6.24はA/D変換器、7はコンピュータ、8゜17
.26はディスプレイ、9.27はキーボード、10は
主記憶装置、11は磁気ディスク、12.31はD/A
変換器、13.32はスピーカ。 25はマイクロコンピュータ、29.30はフロッピー
ディスク、28は特徴量計算回路である。 竿乙図 52’kB−−ヤテ“イレ7トリ 岑10 図 曳 曳 幡 失 ヘ ス ( 囚 6?皮B−−デ′イレ7Yす 小′インタ 4BKB tマー〃 茶入4RB 9J乙に8− 唱“戸デ′−7 答 15 目 (b) y4を乙 開
て編集を行なう音声編集装置の構成、を示す図、第3図
、第10図はディスプレイ画面上における編集の態様を
説明するための図、第5図は音声&i築詰装置各処理の
大まかな流れを示すフローチャート第6図は、フロッピ
ーディスクの内容を示す図、第7図はディレクトリの構
成及びポインタのビット構成を示す図、第8図はディレ
クトリの内容を示す図、第9図は、音声の入力からディ
レクトリを作成するまでの処理の流れを示すフローチャ
ート第11図は氷見明係る音声編集装置のフロッピーデ
ィスクの内容を示す図、第12図は、ディレクトリの構
成及びポインタとマーカからなるエントリのビット構成
を示す図、第13図は、ディレクトリの内容を示す図、
第14図は本発明を説明するためのデ4スプレ4画面上
の編集態様を示す図、第15図は音声データを表示する
処理の流れを示すフローチャート、第16図は区切りを
挿入する処理のフローチャート、第17図は音声出力の
処理の流れを示すフローチャート。 第18図は削除の処理を示すフローチャートである。 図において、1は入力部、2は編集部、3はメモリ部、
4は出力部、5.23はマイクロボン。 6.24はA/D変換器、7はコンピュータ、8゜17
.26はディスプレイ、9.27はキーボード、10は
主記憶装置、11は磁気ディスク、12.31はD/A
変換器、13.32はスピーカ。 25はマイクロコンピュータ、29.30はフロッピー
ディスク、28は特徴量計算回路である。 竿乙図 52’kB−−ヤテ“イレ7トリ 岑10 図 曳 曳 幡 失 ヘ ス ( 囚 6?皮B−−デ′イレ7Yす 小′インタ 4BKB tマー〃 茶入4RB 9J乙に8− 唱“戸デ′−7 答 15 目 (b) y4を乙 開
Claims (1)
- ill 入力される音声信号を音声データに変換する入
力部と、前記音声データを複数のブロックに分割して格
納法る第1のメモリと、各ブロック毎の音声データの特
徴量を計算する計算部と、前記第1のメモリ上の各ブロ
ックのアドレスと前記特徴量とから成るポインタの集合
であるディレクトリを第2のメモリ上に形成するディレ
クトリ形成部と、前記ディレクトリをアクセスすること
により特徴量の時系列を得て、これを視覚的に表示する
表示部と、表示された特徴量時系列の移動、削除等の処
理を支持する支持手段と、前記支持に基づいて、前記デ
ィレクトリ上のポインタのみを前記第2のメモリ上で移
動、削除することにより前記特徴量の時系列の編集を行
なう編集処理部とを備えた音声編集装置であって、前記
ディレクトリ形成部は前記特徴量時系列の区切り、ある
いは区切トリの一部として前記第2のメモリ上に形成す
ることを特徴とする音声編集装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59039539A JPS60184299A (ja) | 1984-03-01 | 1984-03-01 | 音声編集装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59039539A JPS60184299A (ja) | 1984-03-01 | 1984-03-01 | 音声編集装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60184299A true JPS60184299A (ja) | 1985-09-19 |
Family
ID=12555852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59039539A Pending JPS60184299A (ja) | 1984-03-01 | 1984-03-01 | 音声編集装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60184299A (ja) |
-
1984
- 1984-03-01 JP JP59039539A patent/JPS60184299A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2724896B2 (ja) | Midi情報をサブコードパツクに記憶する方法及び装置 | |
JPH0973461A (ja) | 音声による文章情報再生装置 | |
JPH06139704A (ja) | ディスク記録再生装置 | |
JPH0315899A (ja) | 情報処理システム | |
CN100385557C (zh) | 管理音频数据和记录设备的设备和方法 | |
US4591929A (en) | Interactive learning programming and like control circuitry | |
JP2819948B2 (ja) | 楽音信号記録再生装置 | |
JPS60184299A (ja) | 音声編集装置 | |
JPH08255466A (ja) | オーディオデータ記録および/または再生方法およびその装置 | |
JPS60181830A (ja) | 音声編集装置 | |
JPS61124996A (ja) | 音声編集装置 | |
JPH0449714B2 (ja) | ||
JPS62994A (ja) | Pcm音声信号記憶装置 | |
JPS5644175A (en) | Reproduction system | |
JPH06131852A (ja) | 音声編集システム | |
JP3230756B2 (ja) | デジタルレコーダ | |
KR100246910B1 (ko) | 메모리 카드를 매체로한 음성/문자에 대한 기록 및 재생방법 | |
JP3248679B2 (ja) | ディスク再生装置 | |
JP2568651B2 (ja) | 音声データの編集方法 | |
JPS5930206A (ja) | 複合情報蓄積記録方式 | |
JPS61103183A (ja) | 語学教育装置 | |
JPH0119160B2 (ja) | ||
JPH07129187A (ja) | 文書作成装置及び音声データ記録再生方法 | |
JPS6046648A (ja) | 自動交換システムにおける音声メッセージ編集方法 | |
JPH04212767A (ja) | デジタルレコーダ |