JPS61124996A - 音声編集装置 - Google Patents
音声編集装置Info
- Publication number
- JPS61124996A JPS61124996A JP59247602A JP24760284A JPS61124996A JP S61124996 A JPS61124996 A JP S61124996A JP 59247602 A JP59247602 A JP 59247602A JP 24760284 A JP24760284 A JP 24760284A JP S61124996 A JPS61124996 A JP S61124996A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- pointer
- directory
- audio data
- editing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、音声編集装置、特に、コンピュータを用い音
声を文単位、文節単位等できめ細かに編集することがで
きるようにした音声編集装置に関するものである。
声を文単位、文節単位等できめ細かに編集することがで
きるようにした音声編集装置に関するものである。
文書作成装置としては、キーボードより入力された情報
を表示装置に表示し、オペレータが挿入、削除等の編集
操作を加えて所望の文書を作成するものが知られている
が、キー操作に習熟する必要があること、又、キーボー
ドを使用するため、情報の入力速度に限度があること、
等の理由で音声による情報入力を行う文書作成装置が提
案されている。この場合、音声情報として入力されるた
め、編集操作を行う場合、オペレータの視聴覚に訴える
形に変換する必要が生じるが、編集操作を円滑に行い得
る形態が望ましい。
を表示装置に表示し、オペレータが挿入、削除等の編集
操作を加えて所望の文書を作成するものが知られている
が、キー操作に習熟する必要があること、又、キーボー
ドを使用するため、情報の入力速度に限度があること、
等の理由で音声による情報入力を行う文書作成装置が提
案されている。この場合、音声情報として入力されるた
め、編集操作を行う場合、オペレータの視聴覚に訴える
形に変換する必要が生じるが、編集操作を円滑に行い得
る形態が望ましい。
本願出願人は、コンピュータを用いることにより、音声
のきめ細かな編集を行なうことができる音声編集装置を
提案した。
のきめ細かな編集を行なうことができる音声編集装置を
提案した。
この音声編集装置の基本的構成を、第4図に示す。図中
、1は入力された音声を編集部への通した信号形態に変
換する入力部、2は音声の編集を行う編集部、3は音声
の編集にあたって必要なデータ等を格納するメモリ部、
4は編集された音声を適切な信号形態に変換して出力す
る出力部である。
、1は入力された音声を編集部への通した信号形態に変
換する入力部、2は音声の編集を行う編集部、3は音声
の編集にあたって必要なデータ等を格納するメモリ部、
4は編集された音声を適切な信号形態に変換して出力す
る出力部である。
第2図に音声の特徴量時系列を視覚的に表示して目で観
察しながら細かな編集をしようとする音声編集装置を示
す。
察しながら細かな編集をしようとする音声編集装置を示
す。
入力部1はマイクロホン5とこのマイクロホンからアナ
ログ信号をディジタル信号に変換するA/D変換器6と
により構成し、編集部2はコンピュータ7とディスプレ
イ8とキーボード9とにより構成し、メモリ部3は主記
憶装置10と磁気ディスク等の補助記憶装置11とによ
り構成し、出力部4は編集部2からのディジタル信号を
アナログ信号に変換するD/A変換器12とスピーカ1
3とにより構成する。
ログ信号をディジタル信号に変換するA/D変換器6と
により構成し、編集部2はコンピュータ7とディスプレ
イ8とキーボード9とにより構成し、メモリ部3は主記
憶装置10と磁気ディスク等の補助記憶装置11とによ
り構成し、出力部4は編集部2からのディジタル信号を
アナログ信号に変換するD/A変換器12とスピーカ1
3とにより構成する。
マイクロホン5からの音声信号は、A/D変換器6でデ
ィジタル量に変換され、コンビエータ7はこれを磁気デ
ィスク11に格納する。コンピュータ7は、格納された
音声データから音声の特徴量時系列を計算する。特徴量
時系列には、音声の強さを表すパワ一時系列、音声信号
が原点と交差するゼロ交差回数時系列、音声の高さく音
階)を表すピッチ周波数時系列等があるが、本実施例で
は、コンピュータ7はパワ一時系列を計算するものとす
る。
ィジタル量に変換され、コンビエータ7はこれを磁気デ
ィスク11に格納する。コンピュータ7は、格納された
音声データから音声の特徴量時系列を計算する。特徴量
時系列には、音声の強さを表すパワ一時系列、音声信号
が原点と交差するゼロ交差回数時系列、音声の高さく音
階)を表すピッチ周波数時系列等があるが、本実施例で
は、コンピュータ7はパワ一時系列を計算するものとす
る。
一般に、音声信号時系列データをxi (i=1、
2 −−−−−− n)で表すと、次式の計算により、
音声パワ一時系列Pj(j=1゜2、 −−−−−−−
)を得ることができる。
2 −−−−−− n)で表すと、次式の計算により、
音声パワ一時系列Pj(j=1゜2、 −−−−−−−
)を得ることができる。
コンピュータ7は計算したパワ一時系列を、ディスプレ
イ8に表示する。装置利用者は、このパワ一時系列表示
を見ながらキーボード9から音声編集指示や音声出力の
指示を行う。音声出力の指示がなされた時にはコンピュ
ータ7は磁気ディスク11から音声データを読み出し、
D/A変換器12およびスピーカ13に送り出すことに
より音声出力を行う。
イ8に表示する。装置利用者は、このパワ一時系列表示
を見ながらキーボード9から音声編集指示や音声出力の
指示を行う。音声出力の指示がなされた時にはコンピュ
ータ7は磁気ディスク11から音声データを読み出し、
D/A変換器12およびスピーカ13に送り出すことに
より音声出力を行う。
ディスプレイ8の画面上における音声入力、編集、出力
の一態様を第3図に基づいて説明する。今、装置利用者
が音声として「この件につきまして エート 返事を
ゴホン お願いします 至急」をマイクロホン5に入力
したものとする。第3図(alは、ディスプレイ8の画
面上に表示されたパワ一時系列を示す。縦軸方向はパワ
ーの大きさを、横軸方向は時間を示す。このパワ一時系
列波形aは音声「この件につきまして」に、波形すは「
エート」に、波形Cは「返事を」に、波形dば「ゴホン
」に、波形eは「お願いします」に、波形rは「至急」
にそれぞれ対応している。
の一態様を第3図に基づいて説明する。今、装置利用者
が音声として「この件につきまして エート 返事を
ゴホン お願いします 至急」をマイクロホン5に入力
したものとする。第3図(alは、ディスプレイ8の画
面上に表示されたパワ一時系列を示す。縦軸方向はパワ
ーの大きさを、横軸方向は時間を示す。このパワ一時系
列波形aは音声「この件につきまして」に、波形すは「
エート」に、波形Cは「返事を」に、波形dば「ゴホン
」に、波形eは「お願いします」に、波形rは「至急」
にそれぞれ対応している。
キーボード9を操作しディスプレイ画面上のカーソルを
用いて、不要な音声「エート」(波形b)の開始部分と
終了部分とを“指示”すると、コンビエータ7とその部
分間に確認のためアンダーラインLを表示する。次に、
キーボード9を操作して“削除”を指示すると、「エー
ト」に対応する波形すが削除される。同様に不要な音声
「ゴホン」 (波形d)の部分も削除すると、ディスプ
レイ画面のパワ一時系列表示は第3図(b)に示すよう
になる。
用いて、不要な音声「エート」(波形b)の開始部分と
終了部分とを“指示”すると、コンビエータ7とその部
分間に確認のためアンダーラインLを表示する。次に、
キーボード9を操作して“削除”を指示すると、「エー
ト」に対応する波形すが削除される。同様に不要な音声
「ゴホン」 (波形d)の部分も削除すると、ディスプ
レイ画面のパワ一時系列表示は第3図(b)に示すよう
になる。
さらに、キーボード9の操作により“指示”、“削除”
を行って無音部g、 h、 t、 jを削除する
と、ディスプレイ画面のパワ一時系列表示は第3図(C
)に示すようになる。
を行って無音部g、 h、 t、 jを削除する
と、ディスプレイ画面のパワ一時系列表示は第3図(C
)に示すようになる。
次に、キーボード9を操作して、画面上のカーソルで音
声「至急」 (波形f)の部分を指示し、「つきまして
」と「返事を」と間を指示し、キーボードにより“挿入
”を指示すると、「つきまして」と「返事を」との間に
「至急」が挿入される、すなわち波形aと波形Cとの間
に波形fが挿入される。この最終的なパワ一時系列表示
を、第3図(d)に示す。
声「至急」 (波形f)の部分を指示し、「つきまして
」と「返事を」と間を指示し、キーボードにより“挿入
”を指示すると、「つきまして」と「返事を」との間に
「至急」が挿入される、すなわち波形aと波形Cとの間
に波形fが挿入される。この最終的なパワ一時系列表示
を、第3図(d)に示す。
キーボード9を操作し、カーソルにより有音部の先頭と
末尾を指示して“出力”の指示を行うと、スピーカ13
から「この件につきまして至急返事をお願いします」と
いう編集された音声が出力される。この場合、1回聞い
ただけでは聞きとれない場合には、キーボードにより“
出力”の指示を行うことにより何度でも音声を聞くこと
ができる。
末尾を指示して“出力”の指示を行うと、スピーカ13
から「この件につきまして至急返事をお願いします」と
いう編集された音声が出力される。この場合、1回聞い
ただけでは聞きとれない場合には、キーボードにより“
出力”の指示を行うことにより何度でも音声を聞くこと
ができる。
以上の説明では、説明を簡単にするため短い文章を用い
たが、実際には2分程度の音声を画面に表示することが
でき、さらに編集済み音声データを磁気ディスク11に
戻し、未編集音声データを読み出すということを繰り返
せば、数分以上におよぶ手紙1通、会議1セツシヨン等
の音声編集処理を行うことができる。
たが、実際には2分程度の音声を画面に表示することが
でき、さらに編集済み音声データを磁気ディスク11に
戻し、未編集音声データを読み出すということを繰り返
せば、数分以上におよぶ手紙1通、会議1セツシヨン等
の音声編集処理を行うことができる。
音声の特微量時系列をディスプレイ画面上に表示しなが
ら対話形式で編集するという本実施例音声編集装置によ
れば、文単位、文節単位で音声を編集することができる
ので、きめ細かな編集が可能となる。
ら対話形式で編集するという本実施例音声編集装置によ
れば、文単位、文節単位で音声を編集することができる
ので、きめ細かな編集が可能となる。
確かに、前述した音声編集装置では、きめ細かな音声の
編集を行なうことができるが、メモリ部3に格納される
音声データの量が膨大であるため、磁気ディスク装置1
1等のアクセスに時間が掛かるという欠点がある。
編集を行なうことができるが、メモリ部3に格納される
音声データの量が膨大であるため、磁気ディスク装置1
1等のアクセスに時間が掛かるという欠点がある。
このため、この欠点を除去することができる第1図以降
に示される音声編集装置を同時に提案している。
に示される音声編集装置を同時に提案している。
第1図に示す音声編集装置は、例えば、フロッピーディ
スク等の記憶装置に蓄積された音声データを編集する場
合に、音声データを複数のブロックに分割し、各ブロッ
クに対しそのブロックの記憶装置上のアドレスから成る
ポインタを構成し、全ブロックに対するポインタの集合
としてディレクトリを構成し、ポインタに対して編集作
業を行うことにより、音声データ自体を記憶装置上で移
動することな(等価的に音声データの編集を行うことに
より、きめ細かな編集ができるようにしたものである。
スク等の記憶装置に蓄積された音声データを編集する場
合に、音声データを複数のブロックに分割し、各ブロッ
クに対しそのブロックの記憶装置上のアドレスから成る
ポインタを構成し、全ブロックに対するポインタの集合
としてディレクトリを構成し、ポインタに対して編集作
業を行うことにより、音声データ自体を記憶装置上で移
動することな(等価的に音声データの編集を行うことに
より、きめ細かな編集ができるようにしたものである。
また、ディスプレイ画面上に音声の特徴量系列を表示し
て観察しながら、音声データ自体を記憶装置上で移動す
ることなく、ディレクトリ上でポインタ自体を移動する
ことにより音声を編集できるようにしたものである。
て観察しながら、音声データ自体を記憶装置上で移動す
ることなく、ディレクトリ上でポインタ自体を移動する
ことにより音声を編集できるようにしたものである。
入力部1はマイクロホン23とこのマイクロホンからの
アナログ信号をディジタル信号に変換するA/D変換器
24とにより構成し、編集部2はマイクロコンピュータ
25とディスプレイ26とキーボード27と音声特微量
計算回路28とにより構成し、メモリ部3を音声データ
およびディレクトリ用のフロッピーディスク29と音声
編集、入出カプログラム用のフロッピーディスク30と
より構成し、出力部4はディジタル信号をアナログ信号
に変換するD/A変換器31とスピーカ32とにより構
成する。
アナログ信号をディジタル信号に変換するA/D変換器
24とにより構成し、編集部2はマイクロコンピュータ
25とディスプレイ26とキーボード27と音声特微量
計算回路28とにより構成し、メモリ部3を音声データ
およびディレクトリ用のフロッピーディスク29と音声
編集、入出カプログラム用のフロッピーディスク30と
より構成し、出力部4はディジタル信号をアナログ信号
に変換するD/A変換器31とスピーカ32とにより構
成する。
音声の特徴量としては、前述したように、音声の強さを
表すパワー、音声信号が原点と交差するゼロ交差回数、
音声の高さく高階)を表すピッチ周波数等がある。した
がって、特徴量計算回路28としては、パワー計算回路
、ゼロ交差回数計算回路、ピッチ周波数計算回路等があ
るが、この例ではパワー計算回路を用いている。
表すパワー、音声信号が原点と交差するゼロ交差回数、
音声の高さく高階)を表すピッチ周波数等がある。した
がって、特徴量計算回路28としては、パワー計算回路
、ゼロ交差回数計算回路、ピッチ周波数計算回路等があ
るが、この例ではパワー計算回路を用いている。
もちろん、他のものを用いてもよい。
マイクロホン23から入力された音声信号はA/D変換
器24によりディジタル量の時系列に変換された後、マ
イクロコンピュータ25の制御によりフロッピーディス
ク29に格納されるとともに、後述のごとくマイクロコ
ンピュータ25の制御により、音声特微量計算回路28
を用いて音声信号の特微量時系列が計算されフロ・ノビ
−ディスク29に格納される。次いで、音声の特微量時
系列はディスプレイ26に表示される。この表示に基づ
いて、装置利用者がキーボード27から入力する編集コ
マンドに対応して、マイクロコンピュータ25は後述の
ごとく編集処理を行う。編集の途中あるいは編集の終了
後、マイクロコンピュータ25は装置利用者がキーボー
ド27から入力する音声出力コマンドに対応して、音声
データをD/A変換器31転送し、アナログ量に変換し
てスピーカ32を駆動し音として出力する。
器24によりディジタル量の時系列に変換された後、マ
イクロコンピュータ25の制御によりフロッピーディス
ク29に格納されるとともに、後述のごとくマイクロコ
ンピュータ25の制御により、音声特微量計算回路28
を用いて音声信号の特微量時系列が計算されフロ・ノビ
−ディスク29に格納される。次いで、音声の特微量時
系列はディスプレイ26に表示される。この表示に基づ
いて、装置利用者がキーボード27から入力する編集コ
マンドに対応して、マイクロコンピュータ25は後述の
ごとく編集処理を行う。編集の途中あるいは編集の終了
後、マイクロコンピュータ25は装置利用者がキーボー
ド27から入力する音声出力コマンドに対応して、音声
データをD/A変換器31転送し、アナログ量に変換し
てスピーカ32を駆動し音として出力する。
第5図に各処理を総合した大まかな流れを示すフローチ
ャートを示す。
ャートを示す。
第6図は、フロッピーディスク29の内容を示す図であ
る。ここでは8インチ両面倍密度フロッピーディスクの
場合について説明する。図に示すようにフロッピーディ
スクの「トラック5の表」〜「トラック76の裏」の範
囲の936にバイトを音声データ格納用に用いている。
る。ここでは8インチ両面倍密度フロッピーディスクの
場合について説明する。図に示すようにフロッピーディ
スクの「トラック5の表」〜「トラック76の裏」の範
囲の936にバイトを音声データ格納用に用いている。
音声をA/D変換器24によりA/D変換する場合のサ
ンプリング速度を8KHz、語長を8ビツトとすれば、
936にバイトの領域は117秒(約2分)の音声を収
録することができる。
ンプリング速度を8KHz、語長を8ビツトとすれば、
936にバイトの領域は117秒(約2分)の音声を収
録することができる。
また、フロッピーディスクの「トラック1の表」〜「ト
ラック4の裏」の範囲52にバイトのうち48にバイト
をディレクトリ用の領域としている。
ラック4の裏」の範囲52にバイトのうち48にバイト
をディレクトリ用の領域としている。
第7図(alは、ディレクトリの内容を示すものである
。48にバイトのディレクトリは3バイト長のポインタ
16383個で構成されている。
。48にバイトのディレクトリは3バイト長のポインタ
16383個で構成されている。
1つのポインタは、1フレームの音声データの所在と属
性(特微量)を示すものである。1フレームは、64バ
イトの音声データの集合であり、936にバイトの音声
データは、 936にバイト÷64バイト=14976(フレーム)
で構成されるので、ポインタは14976個以上あれば
十分である。1つのポインタは第7図(blに示すよう
にビット配分されている。最上位の1ビツトはこのポイ
ンタの有効/無効を示すもので、このビットがOのとき
は有効でありこのポインタに対応する音声データが存在
することを示し、1のときは無効でありこのポインタに
対応する音声データが存在しないことを示す。このビッ
トがOのときは残りの23ビツトが意味を持ち、上位か
ら順に7ビツトがトラック番号を、1ビツトがサイド番
号を、5ビツトがセクタ番号を、2ビツトがフレーム番
号を、8ビツトが特微量をそれぞれ表している。特微量
としは、音声データ1フレーム分の平均パワー、ゼロ交
差回数、平均ピッチ周波数等が有効であり、前述したよ
うにこの例では平均パワーを用いている。トラック番号
、サイド番号、セクタ番号、フレーム番号はこのポイン
タに対応する音声データがフロッピーディスク上のどの
位置にあるかを示している。なお、サイド番号を示すビ
ットが0のときはフロッピーディスクの表を、1のとき
はフロッピーディスクの裏を示す。また、1セクタ内に
は4フレームの音声データが格納される。
性(特微量)を示すものである。1フレームは、64バ
イトの音声データの集合であり、936にバイトの音声
データは、 936にバイト÷64バイト=14976(フレーム)
で構成されるので、ポインタは14976個以上あれば
十分である。1つのポインタは第7図(blに示すよう
にビット配分されている。最上位の1ビツトはこのポイ
ンタの有効/無効を示すもので、このビットがOのとき
は有効でありこのポインタに対応する音声データが存在
することを示し、1のときは無効でありこのポインタに
対応する音声データが存在しないことを示す。このビッ
トがOのときは残りの23ビツトが意味を持ち、上位か
ら順に7ビツトがトラック番号を、1ビツトがサイド番
号を、5ビツトがセクタ番号を、2ビツトがフレーム番
号を、8ビツトが特微量をそれぞれ表している。特微量
としは、音声データ1フレーム分の平均パワー、ゼロ交
差回数、平均ピッチ周波数等が有効であり、前述したよ
うにこの例では平均パワーを用いている。トラック番号
、サイド番号、セクタ番号、フレーム番号はこのポイン
タに対応する音声データがフロッピーディスク上のどの
位置にあるかを示している。なお、サイド番号を示すビ
ットが0のときはフロッピーディスクの表を、1のとき
はフロッピーディスクの裏を示す。また、1セクタ内に
は4フレームの音声データが格納される。
マイクロホン23から入力され、A/D変換器24によ
ってディジタル量に変換された音声データがマイクロコ
ンピュータ25の制御でフロッピーディスク29の「ト
ラック5の表」から順に格納された場合を考える。音声
の長さが16秒であったとすると、128000バイト
のデータ長となるが、これは2000フレーム長となり
、音声データは「トラック5の表」から「トラック14
の裏」の第6セクタ末尾(第3フレーム)までに格納さ
れることになる。
ってディジタル量に変換された音声データがマイクロコ
ンピュータ25の制御でフロッピーディスク29の「ト
ラック5の表」から順に格納された場合を考える。音声
の長さが16秒であったとすると、128000バイト
のデータ長となるが、これは2000フレーム長となり
、音声データは「トラック5の表」から「トラック14
の裏」の第6セクタ末尾(第3フレーム)までに格納さ
れることになる。
音声入力直後にマイクロコンピュータ25がフロッピー
ディスク29のディレクトリ領域(トラック1表〜トラ
・ツク4裏)に作成するディレクトリの内容を第8図に
示す。「ポインタ0」は、音声データの第1フレームが
「存在し、トラック5、サイド0 (表)、セクタ1の
第0フレーム(はじめのA)に存在して、特微量(この
例ではパワー)が0であることを示している。「ポイン
タ1」は、次のフレームが同じセクタの[第1フレーム
(2目の%)Jに存在し、パワーが35であることを示
している。以下同様に、ポインタ1999までが音声デ
ータの格納場所とパワーを示すように設定される。
ディスク29のディレクトリ領域(トラック1表〜トラ
・ツク4裏)に作成するディレクトリの内容を第8図に
示す。「ポインタ0」は、音声データの第1フレームが
「存在し、トラック5、サイド0 (表)、セクタ1の
第0フレーム(はじめのA)に存在して、特微量(この
例ではパワー)が0であることを示している。「ポイン
タ1」は、次のフレームが同じセクタの[第1フレーム
(2目の%)Jに存在し、パワーが35であることを示
している。以下同様に、ポインタ1999までが音声デ
ータの格納場所とパワーを示すように設定される。
「ポインタ2000J〜[ポインタ163834につい
ては対応する音声データが存在しないので最上位のピン
トを1に設定する。残りの23ビットは、*印で示して
いるが、ビットとしては1でも0でもよい。
ては対応する音声データが存在しないので最上位のピン
トを1に設定する。残りの23ビットは、*印で示して
いるが、ビットとしては1でも0でもよい。
第9図は音声の入力からディレクトリを作成するまでの
処理の流れを示すフローチャートである。まず、音声入
力のコマンドを受けとると、音声データを格納するフロ
ッピーディスクの音声データ格納領域を設定(トラック
5、サイド0(裏)、セクタ1、第Oフレーム(最初の
%))する。
処理の流れを示すフローチャートである。まず、音声入
力のコマンドを受けとると、音声データを格納するフロ
ッピーディスクの音声データ格納領域を設定(トラック
5、サイド0(裏)、セクタ1、第Oフレーム(最初の
%))する。
マイクロホンより音声データが入力されると、音声デー
タはフロッピーディスクのアドレスADで示される領域
に順次ライトする。音声データの入力につれて、順次ア
ドレスを更新つつ、フロッピーディスクにライトする。
タはフロッピーディスクのアドレスADで示される領域
に順次ライトする。音声データの入力につれて、順次ア
ドレスを更新つつ、フロッピーディスクにライトする。
そして、マイクロホンよりの音声データの入力がなくな
った時点でのフロッピーディスクのアドレスADをレジ
スタADHに格納する。
った時点でのフロッピーディスクのアドレスADをレジ
スタADHに格納する。
これと共に、フロッピーディスクのディレクトリ領域を
示すポインタENを“0”にセットする。また、フロッ
ピーディスクの音声データ格納領域のアドレスを初期値
に書き換える。
示すポインタENを“0”にセットする。また、フロッ
ピーディスクの音声データ格納領域のアドレスを初期値
に書き換える。
次に、フロッピーディスクのアドレスADで示される領
域(64バイト)をリードし、各領域におけるパワーを
計算する。
域(64バイト)をリードし、各領域におけるパワーを
計算する。
計算の結果、得られたパワーはアドレスADと共にポイ
ンタENに書込まれる。
ンタENに書込まれる。
この動作を順次、繰返し、ポインタENが16383
(すなわちポインタENが一杯)になるまでにアドレ
スADがレジスタADEに格納されたアドレスと一致し
たら、残りのポインタENにFFFFFF (16進数
)を格納する。
(すなわちポインタENが一杯)になるまでにアドレ
スADがレジスタADEに格納されたアドレスと一致し
たら、残りのポインタENにFFFFFF (16進数
)を格納する。
これにより音声データがないことを示す。
第1表は、キーボード18から操作者が指定する編集コ
マンドの例である。
マンドの例である。
第1表
コマンド(1)は「第1000フレーム目から10フレ
ーム分を聞く」という指示で、このコマンドによりマイ
クロコンピュータ16は、ポインタ順に読み出し、ポイ
ンタの指示する音声データを読み出しD/A変換器21
に転送し、スピーカ22を駆動して音声出力を行う。
ーム分を聞く」という指示で、このコマンドによりマイ
クロコンピュータ16は、ポインタ順に読み出し、ポイ
ンタの指示する音声データを読み出しD/A変換器21
に転送し、スピーカ22を駆動して音声出力を行う。
コマンド(2)は「第1000フレーム目から10フレ
ーム分を削除する」という指示で、マイクロコンピュー
タ16は「ポインタ1010」〜「ポインタ1999J
を10ワードずつ(1ワードは3バイト)アドレスの低
い方へ移動する。次に、ポインタ移動により空領域とな
る末尾10ワードについては最上位ビットを1として無
効化する。ここで重要な点は、音声データそのものは移
動せずに、ディレクトリ内でポインタを移動する点であ
り、音声データ自体を移動する場合に比べて転送量が6
3360バイトから2970バイトに減り、転送量が約
1/20になることである。
ーム分を削除する」という指示で、マイクロコンピュー
タ16は「ポインタ1010」〜「ポインタ1999J
を10ワードずつ(1ワードは3バイト)アドレスの低
い方へ移動する。次に、ポインタ移動により空領域とな
る末尾10ワードについては最上位ビットを1として無
効化する。ここで重要な点は、音声データそのものは移
動せずに、ディレクトリ内でポインタを移動する点であ
り、音声データ自体を移動する場合に比べて転送量が6
3360バイトから2970バイトに減り、転送量が約
1/20になることである。
コマンド(3)はコマンド(1)と同様な方法で第50
0フレーム目から20フレ一ム分音声出力する指示であ
る。
0フレーム目から20フレ一ム分音声出力する指示であ
る。
コマンド(4)は第500フレーム目から20フレ一ム
分の音声をバッファに退避させる指示である。ここでも
、音声データそのものを退避するかわりにポインタを退
避することにより、退避量が約1/20となり、したが
って退避用バソファの容量が1720で済むこととなる
。
分の音声をバッファに退避させる指示である。ここでも
、音声データそのものを退避するかわりにポインタを退
避することにより、退避量が約1/20となり、したが
って退避用バソファの容量が1720で済むこととなる
。
コマンド(5)は、コマンド(1)と同様な方法で第1
50フレーム目から30フレ一ム分の音声出力を行うコ
マンドである。
50フレーム目から30フレ一ム分の音声出力を行うコ
マンドである。
コマンド(6)は、第149フレーム目と第150フレ
ームとの間に、バッファに退避した前記データを取り出
し、挿入する指示である。具体的には、「ポインタ15
0」〜「ポインタ1989」を20ワードずつアドレス
の高い方に移動し、空いた領域に前記退避した20ワー
ドのポインタをコピーする。この操作ではデータの転送
量が音声データ自体を転送する場合に比べて約1/20
になる上に、2つ以上のポインタが同一データに指すこ
とにより、音声データの増加を防止している。
ームとの間に、バッファに退避した前記データを取り出
し、挿入する指示である。具体的には、「ポインタ15
0」〜「ポインタ1989」を20ワードずつアドレス
の高い方に移動し、空いた領域に前記退避した20ワー
ドのポインタをコピーする。この操作ではデータの転送
量が音声データ自体を転送する場合に比べて約1/20
になる上に、2つ以上のポインタが同一データに指すこ
とにより、音声データの増加を防止している。
次に、ディプレイ26の画面表示について説明する。編
集部2の特徴量計算回路28において計算されたパワ一
時系列は、フロッピーディスク29に格納されている。
集部2の特徴量計算回路28において計算されたパワ一
時系列は、フロッピーディスク29に格納されている。
マイクロコンピュータ25は、フロッピーディスク29
から音声データ自体ではなくディレクトリを読み出し、
その特徴量部分を用いてディスプレイ26の画面上に表
示させる。前述と同様に、音声「この件につきまして
エート 返事を ゴホン お願いします 至急」が入力
された場合について考える。音声入力直後のディスプレ
イ画面を第10図(a)に示す。この画面は、第3図(
alと全く同じであり、画面上の波形と音声との対応関
係は第3(a)での説明に従うものとする。ここで装置
利用者は、不要な内容である音声「エート」(波形b)
の部分をキーボード27からの操作で指定すると、マイ
クロコンピュータ25はこの部分が音声の310フレー
ム〜635フレームであることを判断し、これに対応す
るディレクトリ・ポインタを削除する。すなわち、ポイ
ンタ636〜ポインタ1999を326ワード(1ワー
ドは3バイト)アドレスの低い方に移動し、末尾にでき
た空領域すなわちポインタ1674〜1999の最上位
ビットを1にしてポインタの無効化を行う。第10図(
alには、説明の便宜上フレーム番号310および63
5を表示しているが、これらは画面上に実際表示される
ものではない。同様の操作により不要な音声「ゴホン」
(波形d)の部分も除去した場合のディスプレイ画面
が第10図(blに示す画面である。次に、各文節間の
無音部(g、h、i、j)を同様の操作により除去した
場合のディスプレイ画面が第10図(C1に示す画面で
ある。
から音声データ自体ではなくディレクトリを読み出し、
その特徴量部分を用いてディスプレイ26の画面上に表
示させる。前述と同様に、音声「この件につきまして
エート 返事を ゴホン お願いします 至急」が入力
された場合について考える。音声入力直後のディスプレ
イ画面を第10図(a)に示す。この画面は、第3図(
alと全く同じであり、画面上の波形と音声との対応関
係は第3(a)での説明に従うものとする。ここで装置
利用者は、不要な内容である音声「エート」(波形b)
の部分をキーボード27からの操作で指定すると、マイ
クロコンピュータ25はこの部分が音声の310フレー
ム〜635フレームであることを判断し、これに対応す
るディレクトリ・ポインタを削除する。すなわち、ポイ
ンタ636〜ポインタ1999を326ワード(1ワー
ドは3バイト)アドレスの低い方に移動し、末尾にでき
た空領域すなわちポインタ1674〜1999の最上位
ビットを1にしてポインタの無効化を行う。第10図(
alには、説明の便宜上フレーム番号310および63
5を表示しているが、これらは画面上に実際表示される
ものではない。同様の操作により不要な音声「ゴホン」
(波形d)の部分も除去した場合のディスプレイ画面
が第10図(blに示す画面である。次に、各文節間の
無音部(g、h、i、j)を同様の操作により除去した
場合のディスプレイ画面が第10図(C1に示す画面で
ある。
次に、装置利用者が第10図(C)の画面上で音声「至
急」 (波形f)の部分を指定し、これを「つきまして
」と「返事を」との間に移動するようにキーボード27
により指示すると、マイクロコンピュータ25は、「至
急」の部分が650フレームから850フレームにある
ことと、「つきまして」と「返事を」との間が210フ
レームであることを判定し、650フレーム〜850フ
レームに対応するディレクトリ・ポインタの退避を行っ
てから、ポインタ210〜650ヲ201フレ一ム分ア
ドレスの高い方へ移動し、ポインタ210〜410の領
域へ退避しておしたポインタを格納する。このようにし
て得られるディスプレイ画面が第10図(d)に示す画
面である。ここで、装置利用がキーボード27により音
声出力を指示すると、マイクロコンピュータ25はディ
レクトリから「ポインタ0」〜「ポインタ850」を順
次取り出し、各ポインタが所在を示す音声データを読み
出してD/A変換器31へ送りスピーカ32から「この
件につきまして至急返事をお願いします」という音声出
力を行う。ディスプレイ画面で音声の一部を指定して音
声出力することも可能である。
急」 (波形f)の部分を指定し、これを「つきまして
」と「返事を」との間に移動するようにキーボード27
により指示すると、マイクロコンピュータ25は、「至
急」の部分が650フレームから850フレームにある
ことと、「つきまして」と「返事を」との間が210フ
レームであることを判定し、650フレーム〜850フ
レームに対応するディレクトリ・ポインタの退避を行っ
てから、ポインタ210〜650ヲ201フレ一ム分ア
ドレスの高い方へ移動し、ポインタ210〜410の領
域へ退避しておしたポインタを格納する。このようにし
て得られるディスプレイ画面が第10図(d)に示す画
面である。ここで、装置利用がキーボード27により音
声出力を指示すると、マイクロコンピュータ25はディ
レクトリから「ポインタ0」〜「ポインタ850」を順
次取り出し、各ポインタが所在を示す音声データを読み
出してD/A変換器31へ送りスピーカ32から「この
件につきまして至急返事をお願いします」という音声出
力を行う。ディスプレイ画面で音声の一部を指定して音
声出力することも可能である。
以上説明したように音声の特徴量時系列をディスプレイ
画面上に表示しつつ対話形式で行うとともに、フレーム
単位での音声編集が可能となるのできめ細かい編集を行
うことができる。
画面上に表示しつつ対話形式で行うとともに、フレーム
単位での音声編集が可能となるのできめ細かい編集を行
うことができる。
さらには、音声データ自体をフロッピーディスク上で移
動させずにディレクトリのみをアクセスしており、ディ
レクトリ容量は音声データの約l/20であることから
、ディレクトリのみのアクセスにより編集作業における
データ転送量は約1/20に短縮されている。したがっ
て、大容量の音声データ自体をアクセスする代りに、小
容量のディレクトリをアクセスすることにより、表示、
編集処理を高速に行うことができ、このため実時間処理
が可能となる。
動させずにディレクトリのみをアクセスしており、ディ
レクトリ容量は音声データの約l/20であることから
、ディレクトリのみのアクセスにより編集作業における
データ転送量は約1/20に短縮されている。したがっ
て、大容量の音声データ自体をアクセスする代りに、小
容量のディレクトリをアクセスすることにより、表示、
編集処理を高速に行うことができ、このため実時間処理
が可能となる。
しかしながら、従来の音声編集装置では、音声の特徴量
だけを表示して編集作業を行なっており、音声の内容の
判別が容易ではなく、編集に時間がかかるという欠点が
あった。
だけを表示して編集作業を行なっており、音声の内容の
判別が容易ではなく、編集に時間がかかるという欠点が
あった。
本発明の目的は、前述した従来の欠点に鑑み、音声の内
容の判別を容易に行なうことのでき、音声の編集を短時
間で行なうことのできる音声編集装置を提供することに
ある。
容の判別を容易に行なうことのでき、音声の編集を短時
間で行なうことのできる音声編集装置を提供することに
ある。
そしてこの目的は、入力される音声信号を音声データに
変換する入力部と、前記音声データを複数のブロックに
分割して格納する第1のメモリと、各ブロック毎の音声
データの特徴量を計算する計算部と、前記第1のメモリ
上の各ブロックのアドレスと、前記特徴量とを含むポイ
ンタの集合であるディレクトリを第2のメモリ上に形成
するディレクトリ形成部と、前記ディレクトリをアクセ
スすることにより前記特徴量の時系列を得て、これを視
覚的に表示する表示部と、表示部で表示された情報の移
動、削除等の処理を指示する指示手段と、前記指示に基
づいて、前記ディレクトリ上のポインタのみを前記第2
のメモリ上で移動、削除することにより前記特徴量の時
系列の編集を行なう編集処理部とを備えた音声編集装置
であって、前記ポインタは入力された文字コードを表わ
す文字ドツトパターンを含んでなり、前記ディレクトリ
形成部は該ポインタを前記ディレクトリとして前記第2
のメモリ上に形成することを特徴とする音声編集装置を
提供することにより達成される。
変換する入力部と、前記音声データを複数のブロックに
分割して格納する第1のメモリと、各ブロック毎の音声
データの特徴量を計算する計算部と、前記第1のメモリ
上の各ブロックのアドレスと、前記特徴量とを含むポイ
ンタの集合であるディレクトリを第2のメモリ上に形成
するディレクトリ形成部と、前記ディレクトリをアクセ
スすることにより前記特徴量の時系列を得て、これを視
覚的に表示する表示部と、表示部で表示された情報の移
動、削除等の処理を指示する指示手段と、前記指示に基
づいて、前記ディレクトリ上のポインタのみを前記第2
のメモリ上で移動、削除することにより前記特徴量の時
系列の編集を行なう編集処理部とを備えた音声編集装置
であって、前記ポインタは入力された文字コードを表わ
す文字ドツトパターンを含んでなり、前記ディレクトリ
形成部は該ポインタを前記ディレクトリとして前記第2
のメモリ上に形成することを特徴とする音声編集装置を
提供することにより達成される。
上記音声編集装置は、音声データを複数のブロックに分
割してメモリに格納し、各々のブロックのアドレス、音
声データの特徴量とともにこの音声データに対応する文
字ドツトパターンをも、ポインタに格納し、特徴量と、
文字ドツトパターンを同時に表示するためメモリに格納
された音声の内容を容易に判別でき、音声編集時間が短
縮される。
割してメモリに格納し、各々のブロックのアドレス、音
声データの特徴量とともにこの音声データに対応する文
字ドツトパターンをも、ポインタに格納し、特徴量と、
文字ドツトパターンを同時に表示するためメモリに格納
された音声の内容を容易に判別でき、音声編集時間が短
縮される。
以下、本発明に係る音声編集装置の実施例を図面を用い
て説明する。
て説明する。
本実施例において、使用される音声編集装置の概略の構
成は、第1図と同一であるため、実施例の説明は第1図
を用いる。
成は、第1図と同一であるため、実施例の説明は第1図
を用いる。
第11図は、第1図に示す、フロッピーディスク29の
内容を示す図である。本実施例において、フロッピーデ
ィスク29は8インチ両面倍密度フロッピーディスクの
場合について説明する。
内容を示す図である。本実施例において、フロッピーデ
ィスク29は8インチ両面倍密度フロッピーディスクの
場合について説明する。
第11図に示すように本実施例ではトラック6の表〜ト
ラック76の裏の範囲の923にバイトを音声データ格
納用に用いている。音声をA/D変換器によりA/D変
換する場合のサンプリング速度を8KHz%語長を8ビ
ツトとすれば923にバイトの領域は115秒(約2分
)の音声を収録することができる。又、本実施例ではト
ラック1の表〜トラック5の表の範囲58.5にバイト
をディレクトリ用の領域としている。
ラック76の裏の範囲の923にバイトを音声データ格
納用に用いている。音声をA/D変換器によりA/D変
換する場合のサンプリング速度を8KHz%語長を8ビ
ツトとすれば923にバイトの領域は115秒(約2分
)の音声を収録することができる。又、本実施例ではト
ラック1の表〜トラック5の表の範囲58.5にバイト
をディレクトリ用の領域としている。
第12図(alはディレクトリの内容を示すものである
。58.5 Kバイトのディレクトリは4バイト長のポ
インタ14.976個で構成されている。ポインタは1
フレームの音声の所在と属性(特徴量)を示すものであ
る。1フレームは64バイトの音声データの集合であり
、923にバイトの音声データは 923にバイト÷64バイト=14,768(フレーム
)で構成されるのでポインタは14゜768個以上あれ
ば十分である。
。58.5 Kバイトのディレクトリは4バイト長のポ
インタ14.976個で構成されている。ポインタは1
フレームの音声の所在と属性(特徴量)を示すものであ
る。1フレームは64バイトの音声データの集合であり
、923にバイトの音声データは 923にバイト÷64バイト=14,768(フレーム
)で構成されるのでポインタは14゜768個以上あれ
ば十分である。
1つのポインタは第12図(b)に示すようにビット配
分されている。最上位ビットはポインタの有効/無効を
示すもので、0のときはこのポインタが有効であること
を、lのときは残りの31ビツトは上位から順にトラッ
ク番号、サイド番号、セクタ番号、フレーム番号、特徴
量、文字ビットパターンを表わす。特徴量としては音声
データ1フレーム分の平均パワー、ゼロ交叉数、平均ピ
ッチ数等が有効である。
分されている。最上位ビットはポインタの有効/無効を
示すもので、0のときはこのポインタが有効であること
を、lのときは残りの31ビツトは上位から順にトラッ
ク番号、サイド番号、セクタ番号、フレーム番号、特徴
量、文字ビットパターンを表わす。特徴量としては音声
データ1フレーム分の平均パワー、ゼロ交叉数、平均ピ
ッチ数等が有効である。
トラック番号、サイド番号、セクタ番号、フレーム番号
は、このポインタが対応する音声データがフロッピーデ
ィスク29上のどこにあるかを示している。ポインタの
最上位ビットが1、ならば、このポインタが情報を持っ
ていないことを示す。
は、このポインタが対応する音声データがフロッピーデ
ィスク29上のどこにあるかを示している。ポインタの
最上位ビットが1、ならば、このポインタが情報を持っ
ていないことを示す。
さて、マイクロホン23から入力され、A/D変換!2
4によってディジタル量に変換された音声データがマイ
クロコンピュータ25の制御でフロッピーディスク29
のトラック5の表から順に格納された場合を考える。音
声の長さが16秒であったとすると128,000バイ
トのデータ長となるが、これは2000フレーム長とな
り、音声データはトラック6の表からトランク15、裏
、第6セクタの末尾(第3フレーム)までに格納される
ことになる。
4によってディジタル量に変換された音声データがマイ
クロコンピュータ25の制御でフロッピーディスク29
のトラック5の表から順に格納された場合を考える。音
声の長さが16秒であったとすると128,000バイ
トのデータ長となるが、これは2000フレーム長とな
り、音声データはトラック6の表からトランク15、裏
、第6セクタの末尾(第3フレーム)までに格納される
ことになる。
音声入力直後にマイクロコンピュータ25がフロッピー
ディスク29のディレクトリ領域(トラック1、表、〜
トランク5、表)に作成するディレクトリの内容を第1
3図に示す。ポインタOは音声データの第1フレームが
トランク6、サイドO(表)、セクタ1第θフレーム(
はじめのA)に存在し、特徴量(この例ではパワー)が
Oであることを示している。
ディスク29のディレクトリ領域(トラック1、表、〜
トランク5、表)に作成するディレクトリの内容を第1
3図に示す。ポインタOは音声データの第1フレームが
トランク6、サイドO(表)、セクタ1第θフレーム(
はじめのA)に存在し、特徴量(この例ではパワー)が
Oであることを示している。
ポインタ1は次のフレーム音声が同じセクタの第1フレ
ーム(2つめのA)に存在し、パワーが35であること
を示している。
ーム(2つめのA)に存在し、パワーが35であること
を示している。
以下同様にポインタ1999までが音声データの格納場
所とパワーを示すように設定される。
所とパワーを示すように設定される。
ポインタ2000〜14.975については対応する音
声データが存在しないのでポインタの内容をFFFFF
F (16進数)にし、無効のポインタとしておく。
声データが存在しないのでポインタの内容をFFFFF
F (16進数)にし、無効のポインタとしておく。
第14図(a)〜(C1はディスプレイ26における各
処理の結果を示すための画面を表わす図である。
処理の結果を示すための画面を表わす図である。
第14図(alは、音声入力直後のディスプレイ画面で
あり、第10図(a)と同一の画面である。
あり、第10図(a)と同一の画面である。
この場合、マイクロコンピュータ25はフロッピーディ
スク29からディレクトリのみを読み出し、その情報の
みを用いてディスプレイ26上に表示する。
スク29からディレクトリのみを読み出し、その情報の
みを用いてディスプレイ26上に表示する。
ここで15図(al、 (blを用いて、入力された音
声データを表示するための処理の流れを説明する。
声データを表示するための処理の流れを説明する。
まず、キーボード27により音声データの格納場所とパ
ワー等を表わすポインタが格納されているページを示す
ページ番号を入力する。
ワー等を表わすポインタが格納されているページを示す
ページ番号を入力する。
ここで、ページ0はエントリOからエントリ4999ま
で、ページ1はエントリ5000からエントリ9999
まで、ページ2はエントリ100.000からエントリ
144,975までが格納されているものとする。
で、ページ1はエントリ5000からエントリ9999
まで、ページ2はエントリ100.000からエントリ
144,975までが格納されているものとする。
入力されたページ番号に対応する最初のポインタ番号P
NBをレジスタPNにセットする。
NBをレジスタPNにセットする。
これと共に、ディスプレイ26上の表示位置を示すフレ
ーム番号FRが格納されるレジスタFRを“0”にセッ
トする。
ーム番号FRが格納されるレジスタFRを“0”にセッ
トする。
この状態でレジスタPNが示すフロッピーディスク29
のディレクトリエントリPNBから順次リードする。そ
して、エントリの最上位ビットが“0”ならば特徴量を
バーの長さに変換したものと文字ドツトパターンをディ
スプレイ26上に表示する。
のディレクトリエントリPNBから順次リードする。そ
して、エントリの最上位ビットが“0”ならば特徴量を
バーの長さに変換したものと文字ドツトパターンをディ
スプレイ26上に表示する。
また、エントリの最上位ビットが“1”である場合には
何もない。
何もない。
以上説明した動作をPN、FRを1ずつ増やしながら順
次繰返して行ない、ポインタPNが指定されたページの
最終ポインタPNEになり、このポインタPHの表示が
終了する巡行なう。
次繰返して行ない、ポインタPNが指定されたページの
最終ポインタPNEになり、このポインタPHの表示が
終了する巡行なう。
この状態で本装置利用者は、ディスプレイ26の画面上
でカーソル操作によって適当な位置へ文字の入力を指示
する。第14図(b)は文字入力後の画面である。
でカーソル操作によって適当な位置へ文字の入力を指示
する。第14図(b)は文字入力後の画面である。
三番目に入力された文字“ケ”を例にとって、マイクロ
コンピュータ25の処理の動作について説明する。
コンピュータ25の処理の動作について説明する。
第16図に、文字挿入処理のフローチャートを示す。
本装置利用者がカーソル操作によって、文字の入力位置
を指定すると、マイクロコンピュータ25は、このカー
ソル位置からフレーム番号FRを計算し、例えば350
フレームであることを判断する。
を指定すると、マイクロコンピュータ25は、このカー
ソル位置からフレーム番号FRを計算し、例えば350
フレームであることを判断する。
そして次に本装置利用者が文字“ケ”をキーボード27
から入力するとマイクロコンピュータ25はその主記憶
上にある文字コード・文字ドツトパターン変換テーブル
を参照して“ケ”のドツトパターンを得て文字“ケ”の
ドツトパターンを8つの列にたて割りしてフロッピーデ
ィスク29のポインタ350〜357の下位8ビツトに
格納する。第17図は“ケ”のドツトパターンをポイン
タに格納する場合の説明図、第18図は文字コード・文
字ドツトパターン変換テーブルの説明図である。
から入力するとマイクロコンピュータ25はその主記憶
上にある文字コード・文字ドツトパターン変換テーブル
を参照して“ケ”のドツトパターンを得て文字“ケ”の
ドツトパターンを8つの列にたて割りしてフロッピーデ
ィスク29のポインタ350〜357の下位8ビツトに
格納する。第17図は“ケ”のドツトパターンをポイン
タに格納する場合の説明図、第18図は文字コード・文
字ドツトパターン変換テーブルの説明図である。
次に本装置利用者はカーソル指定で音声の一部を示すこ
とにより音声出力を行う。この場合マイクロコンピュー
タ25はディレクトリ中のポインタのアドレスによって
、フロッピーディスク29中の音声データを読み出し、
D/A変換器31に送ってアナログ化し、スピーカ32
から音声出力する。
とにより音声出力を行う。この場合マイクロコンピュー
タ25はディレクトリ中のポインタのアドレスによって
、フロッピーディスク29中の音声データを読み出し、
D/A変換器31に送ってアナログ化し、スピーカ32
から音声出力する。
第19図は音声出力の処理の流れを示すフローチャート
である。
である。
まず、本装置利用者がキーボード27により第14図(
C1に示す画面上で音声出力したい部分の始点と終点を
カーソルで指定する。マイクロコンピュータ25は、こ
のt旨定されたカーソル位置から始点のフレーム番号N
1と終点のフレーム番号N2を計算する。次いで、メモ
リ上のバッファをクリアした後に、フレーム番号が格納
されるレジスタPNにフレーム番号N1をセットする。
C1に示す画面上で音声出力したい部分の始点と終点を
カーソルで指定する。マイクロコンピュータ25は、こ
のt旨定されたカーソル位置から始点のフレーム番号N
1と終点のフレーム番号N2を計算する。次いで、メモ
リ上のバッファをクリアした後に、フレーム番号が格納
されるレジスタPNにフレーム番号N1をセットする。
そして、フレーム番号N1がセットされたレジスタPH
の内容に基づいてディレクトリポインタの読み出しを行
ない、最上位ビットがOであればポインタのトラック、
サイド、セクタ、フレームに従って、フロッピーディス
ク29から64バイトの音声データを読み出す。
の内容に基づいてディレクトリポインタの読み出しを行
ない、最上位ビットがOであればポインタのトラック、
サイド、セクタ、フレームに従って、フロッピーディス
ク29から64バイトの音声データを読み出す。
読み出された64バイトの音声データはメモリ上のバッ
ファへ格納される。
ファへ格納される。
そして、フレーム番号がN2になるまで、順次音声デー
タの読み出しを行ない、フレーム番号N2に対応する音
声データの読み出しが終了したら、メモリ上のバッファ
の内容をD/A変換器31へ転送し、スピーカ32によ
り音声出力する。
タの読み出しを行ない、フレーム番号N2に対応する音
声データの読み出しが終了したら、メモリ上のバッファ
の内容をD/A変換器31へ転送し、スピーカ32によ
り音声出力する。
従って、前述した文字表示とこの音声出力を利用するこ
とにより、後述する削除挿入の処理を容易にさせる。次
に、装置利用者は、「エート」、「ゴホン」等、話の筋
に関係しない音声を削除する操作について説明する。
とにより、後述する削除挿入の処理を容易にさせる。次
に、装置利用者は、「エート」、「ゴホン」等、話の筋
に関係しない音声を削除する操作について説明する。
第20図は削除の処理の流れを示すフローチャートであ
る。
る。
まず、キーボード26上で削除を指定する。
そして、削除したい音声部分、例えば第14図(blに
示す「エート」 (波形b)をカーソル指定する。
示す「エート」 (波形b)をカーソル指定する。
このとき、第14図(b)で示される画面上には「エー
ト」(波形b)の音声部分がどこからどこまであるのか
を示す文字列“エート”が表示されているので、装置利
用者はまず、カーソルを“工”の手前に位置付けて、こ
の点を始点とすると共に、“ト”のうしろを終点となる
ように位置付ける。
ト」(波形b)の音声部分がどこからどこまであるのか
を示す文字列“エート”が表示されているので、装置利
用者はまず、カーソルを“工”の手前に位置付けて、こ
の点を始点とすると共に、“ト”のうしろを終点となる
ように位置付ける。
マイクロコンピュータ25はこの始点と終点におけるフ
レーム番号N1とN2を計算する。
レーム番号N1とN2を計算する。
そして、ディレクトリのポインタN2〜14゜975を
N1〜(14,975−(N2−Nl))へ移動する。
N1〜(14,975−(N2−Nl))へ移動する。
そして、ディレクトリのエントリ(14,975−(N
2−Nl)+1)〜14゜975にFFFFFF (1
6進数)を詰める。
2−Nl)+1)〜14゜975にFFFFFF (1
6進数)を詰める。
これにより、音声部分「エート」(波形b)のディレク
トリのエントリが削除される。
トリのエントリが削除される。
(F)発明の効果
以上説明したように、本発明によれば、表示装置の画面
上で文字列を同時に表示せしめることにより音声の内容
を容易に判別することができるので、挿入、削除等の処
理を容易に行なうことができ、編集時間を短縮すること
ができる。
上で文字列を同時に表示せしめることにより音声の内容
を容易に判別することができるので、挿入、削除等の処
理を容易に行なうことができ、編集時間を短縮すること
ができる。
第1図は音声の特徴量時系列を視覚的に表示して編集を
行う音声編集装置の構成を示す本発明の実施例構成図、
第2図、第4図は音声編集装置の基本的構成を示す図、
第3図、第10図はディスプレイ画面上における編集の
態様を説明するための図、第5図は音声編集装置の各処
理の大まかな流れを示すフローチャート、第6図は、フ
ロッピーディスクの内容を示す図、第7図はディレクト
リの構成及びポインタのビット構成を示す図、第8図は
ディレクトリの内容を示す図、第9図は、音声の入力か
らディレクトリを作成するまでの処理の流れを示すフロ
ーチャート、第11図は本発明に係る音声編集装置のフ
ロッピーディスクの内容を示す図、第12図は、ディレ
クトリの構成及びポインタのビット構成を示す図、第1
3図は、ディレクトリの内容を示す図、第14図は本発
明を説明するためのディスプレイ画面上の編集態様を示
す図、第15図は音声データを表示する処理の流れを示
すフローチャート、第16図は区切りを挿入する処理の
フローチャート、第17図は文字入力処理の説明図、第
18図は文字コード・文字ドツトパターン変換テーブル
の説明図、第19図は音声出力の処理の流れを示すフロ
ーチャート、第20図は削除の処理を示すフローチャー
トである。 図において、1は入力部、2は編集部、3はメモリ部、
4は出力部、5,23はマイクロホン、6.24はA/
D変換器、7はコンピュータ、8,17.26はディス
プレイ、9,27はキーボード、10は主記憶装置、1
1は磁気ディスク、12.31はD/A変換器、13゜
32はスピーカ、25はマイクロコンピュータ、29.
30はフロッピーディスク、28は特徴量計算回路であ
る。 第6図 1++ト 第1O図 第11図 第 14 (2) 第15図(a) 第y5 1¥1(b) 第16図 第17図 第 18 図
行う音声編集装置の構成を示す本発明の実施例構成図、
第2図、第4図は音声編集装置の基本的構成を示す図、
第3図、第10図はディスプレイ画面上における編集の
態様を説明するための図、第5図は音声編集装置の各処
理の大まかな流れを示すフローチャート、第6図は、フ
ロッピーディスクの内容を示す図、第7図はディレクト
リの構成及びポインタのビット構成を示す図、第8図は
ディレクトリの内容を示す図、第9図は、音声の入力か
らディレクトリを作成するまでの処理の流れを示すフロ
ーチャート、第11図は本発明に係る音声編集装置のフ
ロッピーディスクの内容を示す図、第12図は、ディレ
クトリの構成及びポインタのビット構成を示す図、第1
3図は、ディレクトリの内容を示す図、第14図は本発
明を説明するためのディスプレイ画面上の編集態様を示
す図、第15図は音声データを表示する処理の流れを示
すフローチャート、第16図は区切りを挿入する処理の
フローチャート、第17図は文字入力処理の説明図、第
18図は文字コード・文字ドツトパターン変換テーブル
の説明図、第19図は音声出力の処理の流れを示すフロ
ーチャート、第20図は削除の処理を示すフローチャー
トである。 図において、1は入力部、2は編集部、3はメモリ部、
4は出力部、5,23はマイクロホン、6.24はA/
D変換器、7はコンピュータ、8,17.26はディス
プレイ、9,27はキーボード、10は主記憶装置、1
1は磁気ディスク、12.31はD/A変換器、13゜
32はスピーカ、25はマイクロコンピュータ、29.
30はフロッピーディスク、28は特徴量計算回路であ
る。 第6図 1++ト 第1O図 第11図 第 14 (2) 第15図(a) 第y5 1¥1(b) 第16図 第17図 第 18 図
Claims (1)
- 入力される音声信号を音声データに変換する入力部と、
前記音声データを複数のブロックに分割して格納する第
1のメモリと、各ブロック毎の音声データの特徴量を計
算する計算部と、前記第1のメモリ上の各ブロックのア
ドレスと、前記特徴量とを含むポインタの集合であるデ
ィレクトリを第2のメモリ上に形成するディレクトリ形
成部と、前記ディレクトリをアクセスすることにより前
記特徴量の時系列を得て、これを視覚的に表示する表示
部と、表示部で表示された情報の移動、削除等の処理を
指示する指示手段と、前記指示に基づいて、前記ディレ
クトリ上のポインタのみを前記第2のメモリ上で移動、
削除することにより前記特徴量の時系列の編集を行なう
編集処理部とを備えた音声編集装置であって、前記ポイ
ンタは入力された文字コードを表わす文字ドットパター
ンを含んでなり、前記ディレクトリ形成部は該ポインタ
を前記ディレクトリとして前記第2のメモリ上に形成す
ることを特徴とする音声編集装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59247602A JPS61124996A (ja) | 1984-11-22 | 1984-11-22 | 音声編集装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59247602A JPS61124996A (ja) | 1984-11-22 | 1984-11-22 | 音声編集装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61124996A true JPS61124996A (ja) | 1986-06-12 |
Family
ID=17165947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59247602A Pending JPS61124996A (ja) | 1984-11-22 | 1984-11-22 | 音声編集装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61124996A (ja) |
-
1984
- 1984-11-22 JP JP59247602A patent/JPS61124996A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS59135542A (ja) | 情報処理システム | |
JPH0315899A (ja) | 情報処理システム | |
US4591929A (en) | Interactive learning programming and like control circuitry | |
JP3448928B2 (ja) | 楽譜認識装置 | |
JPS61124996A (ja) | 音声編集装置 | |
JP2674658B2 (ja) | 光ディスク媒体に記億された音声データのアドレステーブル作成装置 | |
JPS60181830A (ja) | 音声編集装置 | |
JPS60184299A (ja) | 音声編集装置 | |
JPS59160193A (ja) | 音声デ−タ編集システム | |
JP4124416B2 (ja) | 半自動型字幕番組制作システム | |
JPS62994A (ja) | Pcm音声信号記憶装置 | |
JPS61100799A (ja) | 音声デ−タ編集方式 | |
KR100246910B1 (ko) | 메모리 카드를 매체로한 음성/문자에 대한 기록 및 재생방법 | |
JPS58160993A (ja) | 文書編集装置の音声確認方法 | |
JPS5644175A (en) | Reproduction system | |
JPH06131852A (ja) | 音声編集システム | |
JPH06203534A (ja) | 電子楽器のファイル管理システム | |
JPH0336461B2 (ja) | ||
JPS6046648A (ja) | 自動交換システムにおける音声メッセージ編集方法 | |
JPH01265286A (ja) | 語学練習器 | |
JPS6128127A (ja) | 音声編集装置 | |
JPH05151757A (ja) | デジタルレコーダ | |
JPH07129187A (ja) | 文書作成装置及び音声データ記録再生方法 | |
JP2000338952A (ja) | 文字アニメーション編集装置および文字アニメーション再生表示装置 | |
KR0130375B1 (ko) | 다이제스트 오디오의 속도조절방법 |