JPS61100799A - 音声デ−タ編集方式 - Google Patents

音声デ−タ編集方式

Info

Publication number
JPS61100799A
JPS61100799A JP59221339A JP22133984A JPS61100799A JP S61100799 A JPS61100799 A JP S61100799A JP 59221339 A JP59221339 A JP 59221339A JP 22133984 A JP22133984 A JP 22133984A JP S61100799 A JPS61100799 A JP S61100799A
Authority
JP
Japan
Prior art keywords
audio
data
input
command
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59221339A
Other languages
English (en)
Inventor
井関 治
美恵 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP59221339A priority Critical patent/JPS61100799A/ja
Publication of JPS61100799A publication Critical patent/JPS61100799A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声を符号化した上で蓄積、伝送。
再生を行なうことのできるディスプレイ装置付き情報処
理装置における音声データの編集方式に関するものであ
る。
〔従来の技術〕
近年、パーソナルコンピュータあるいはワークステーシ
ョンなどにおいて、テキスト、図形、グラフ、表、イメ
ージ等のデータに加え、音声をも符号化した上で他デー
タとの混在あるいはそれ自へて蓄積、伝送、再生を行な
うことにより1.音声の持つ、特徴を生かすアプリケー
ションが商品化されつつある。例として、音声メールの
アプリケーションがあ今。
音声の符号化方式には、大きく分けて、PCM、ADP
CM、 ΔMなどの技術による波形符号化方式と、LP
G、PARCOR,ホルマントなどの技i荷によるパラ
メータ符号化方式の二つの方式がある。波形符号化方式
は実現は比較的容易だが符号化効率が低く、またパラメ
ータ符号化方式は符号化効率は高いが複雑で波形符号化
方式に比べると音質が悪いという特徴がある。現在、前
述の音声メールなどのアプリケーションにおいて主流を
占めているのはADP5Mによる波形符号化方式で、こ
れによると、符号化された音声データのビットレートは
16Kb/s〜32 K b / sというのが一般的
である。つまり、30秒の音声では60 KByte〜
120 KByteとかなり大きなメモリ容量を必要と
する。
〔発明が解決しようとする問題点〕
このように音声の符号化の場合は大量のメモリ容量を必
要とするが、従来は、音声データの蓄積、伝送に際し音
声を入力する場合は、通常のテープレコーダによる録音
と同様に入力の開始と終了を操作者が指示する必要があ
ったので、有意な音声以外の無音部や雑音部がどうして
も存在してしまい、有意の大量データの他に不必要な大
量データを含むことになり、メモリの有効利用が困難と
いう問題があった。また、入力された音声の一部分の切
り取り、複数データの結合といった編集においても、テ
ープレコーダのテープ編集と同様にカット・アンド・ト
ライ方式に基づいており、経験の少ない操作者にとって
は困難な作業を伴うという問題があった。
〔問題点を解決するための手段〕
このような問題点を解決するために本発明は、ディスプ
レイ装置付き情報処理装置において、音声パワーデータ
曲線を時間座標軸で表示し、カーソルの移動および数種
の編集コマンドを用いるようにしたものである。
〔作用〕
本発明においては、カーソルが移動し、数種の編集コマ
ンドが実行され、入力した音声が編集される。
〔実施例〕
本発明を実施例に基づいて詳細に説明する。まず第3図
に音声パワーデータの例を示す、この例では、「西郷さ
んの銅像は、どこにありますか、」という文章について
示しである。この図からも分かるように、音声パワーデ
ータはおおよそ文章の特徴を表わすため、音声の編集時
の目安となりうる。
次に、第4図のフローチャートにより本発明の原理につ
いて説明する。まず、ステップ400で音声を入力する
。ディスプレイ装置の画面上には第3図のような音声パ
ワーデータ曲線が表示される0次にこの曲線を目安にし
て、ステップ401で音声の編集を行なう。ステップ4
02で編集した部分あるいは全体の音声の再生をしてみ
て、ステップ403で編集が完了したかどうかを判断す
る。li集作業が完了していれば、ステップ404で処
理選択を行ない、ステップ405の音声蓄積、ステップ
406の送信、ステップ407の他ドキュメントとの結
合などの処理を行なう。ステップ403で編集作業が完
了していなければ、ステップ408でさらに音声を追加
入力するか2編集するかの選択を行ない、音声を追加入
力する場合はステップ400、編集をする場合はステッ
プ401へ戻る。
第1図に本発明に係わる音声データ編集方式の一実施例
を説明するためのズロック系統図を示す。
第1図において、100はマイクロプロセッサなどの処
理装置、101はシステム全体あるいはアプリケーショ
ンプログラム、データなどを格納する主メモリ、102
はディスプレイ装置の画面上のカーソル位置を指示しそ
の座標値を入力するための、例えば、マウスのようなカ
ーソル指示装置、103はデータあるいは操作コマンド
を人力するための、例えば、キーボードのようなデータ
入力装置、104はプログラムやデータなどを大量に記
憶しておくためのファイル装置、105はデータや作業
指示などをディスプレイ装置106に表示させるための
表示制御装置、107は他システムと通信ネットワーク
を通じて交信するための通信制御装置、108は音声を
入力するためのマイクロホン、109は入力した音声を
符号化して音声データとする音声符号化装置、110は
音声符号化装置109と同期して音声のパワーデータを
抽出する音声パワーデータ抽出装置、111は音声デー
タおよび音声パワーデータを記憶する音声メモリ、11
2は音声メモリ111上の符号化された音声データを復
号化する音声復号化装置、113は復号化された音声を
人間に聞こえるように出力するスピーカを示している。
第2図に本実施例を説明するための画面表示を示す。第
2図において、200はディスプレイ装置の画面、20
1は入力、再生、切り取り、移動、挿入、コピー、無音
部挿入、スムージング、コマンド取り消し、終了の各コ
マンドを表示するコマンドメニュー、202はカーソル
、203は1秒毎の時間座標軸、204は音声パワーデ
ータ表示曲線、205,206および207は始端点記
2     号・終端点記号6a第2始端点記号7あ族
カーソル202は、カーソル指示装置102により、画
面200上を自由に動かすことができる。
さらに、カーソル指示装置102は画面200上の座標
値を入力するためのボタンを有しており、このボタンを
使用して次の機能を実現できる。
(a)押下−解放       :1点の座標値の入力
(b)押下−カーソル移動−解放:押下点および解放点
の座標値の入力 コマンドメニュー201からのコマンド選択および実行
指示は、カーソル202をコマンドメニュー201上の
任意のコマンド部分に移動し、カーソル指示装置102
のボタンを使用し、1点の座標値を入力することにより
、処理装置100はコマンド種別を判断し実行する。各
種コマンドを実行するに当たり、始端点記骨205によ
りコマンド実行開始位置、始端点記骨205と終端点記
号206で挟まれた部分でコマンド実行範囲、さらに第
2始端点記号207で部分移動などのコマンド実行宛先
を規定する。実際には、これらの記号は音声メモリ11
1上の符号化音声データ列中の位置を示すポインタとみ
なせる。カーソル202で時間座標軸203上の任意の
点を指示し、カーソル指示装置102のボタン操作で1
点の座標値を入力することにより始端点記骨205、押
下点および解放点の座標値を入力することにより始端点
記骨205と終端点記号206の両方、また始端点記骨
205と終端点記号206の表示に続く1点の座標値入
力により第2始端点記号207が表示されるように処理
装置100がコントロールしている。
次に必要なコマンドおよびこれらの動作について説明す
る。
(11入力 始端点記骨205を任意の点に表示させ、続けて入力コ
マンドを選択することにより音声入力可能状態になり、
音声パワーデータ表示曲線204が表示される。
(2)再生 始端点記骨205と終端点記号206を任意の点に表示
させ、続けて再生コマンドを選択することにより両記号
で挟まれた範囲の音声が再生される。
(3)切り取り 始端点記骨205と終端点記号206を任意の点に表示
させ、続けて切り取りコマンドを選択することにより両
記号で挟まれた範囲の音声が切り取られ、前後の部分は
詰められる。
(4)移動 始端点記号205.終端点記号206.第2始端点記号
207を任意の点に表示させ、続けて移動コマンドを選
択することにより始端点記骨205と終端点記号206
で挟まれた範囲の音質が切り取られ、第2始端点記号2
07以降に移動する。
移動先にすでに音声がある場合は挿入動作になる。
(5)挿入 始端点記骨205を任意の点に表示させ、続けて挿入コ
マンドを選択し、その後入力コマンドを選択することに
より始端点記骨205から入力音声を挿入できる。
(6)コピー 始端点記量205.終端点記号206.第2始端点記号
207を任意の点に表示させ、続けてコピーコマンドを
選択することにより始端点記号205と終端点記号20
6で挟まれた範囲の音声が複写され、第2始端点記号2
07以降に移動する。
移動先にすでに音声がある場合は挿入動作になる。
(7)無音部挿入 始端点記量205と終端点記号206を任意の点に表示
させ、続けて無音部挿入コマンドを選択することにより
挟まれた範囲だけ無音部が挿入され、始端°点記量20
5以降の音声は終端点記号206から続く。
(8)スムージング 他のコマンドを実行したために音声パワーデータ表示曲
線204に不自然な不連続点ができてしまった場合、そ
の不連続点を挟むように始端点記骨205.終端点記号
206を表示させ、続けてスムージングコマンドを選択
することにより不運読点を平滑化させる。
1・      (9)コマンド取り消し斗 誤ってコマンドを実行してしまった場合、コマンド取り
消しコマンドを選択することにより直前のコマンドを取
り消し、データをコマンド実行前に戻す。
α0)終了 すべての音声入力1編集を終了させる場合、終了コマン
ドを選択する。
以上のコマンドを使用し編集された音声データは、単独
もしくは処理装置100が主メモリ101上の他ドキュ
メントと結合した上で、ファイル装置104に蓄積した
り、通信制御装置107°を通して伝送する。
〔発明の効果〕
以上説明したように本発明は、音声パワーデータをディ
スプレイ装置の画面上に表示することにより有効に利用
するとともに、ディスプレイ装置の画面上で簡単に音声
の入力および編集ができるようにしたので、蓄積、伝送
などのための符号化音声データを容易に、かつ効率よく
作成できる効果がある。
【図面の簡単な説明】
第1図は本発明に係わる音声データ編集方式の一実施例
を説明するためのブロック系統図、第2図は音声パワー
データを表示する画面表示図ミ第3図は音声パワーデー
タを例示したグラフ、第4図は本発明の詳細な説明す−
るためのフローチャートである。 100・・・・処理装置、101・・・・主メモリ、1
02・・・・カーソル指示装置、103・・・・データ
入力装置、104・・・・ファイル装置、105・・・
・表示制御装置、106・・・・ディスプレイ装置、1
07・・・・通信制御装置、108・・・・マイクロホ
ン、109・・・・音声符号化装置、110・・“・・
音声パワーデータ抽出装置、111・・・・音声メモリ
、112・・・・音声復号化装置、113・・・・スピ
ーカ、200・・・・画面、201・・・・コマンドメ
ニュー、202・・・・カーソル、203・・・・時間
座標軸、204・・・・音声パワーデータ表示曲線、2
05・・・・始端点記量、206・・・・終端点記号、
207・・・・第2始端点記号。 第1図 第2図 第3図

Claims (1)

    【特許請求の範囲】
  1. データを処理する処理装置と、データおよびプログラム
    を記憶する主メモリと、データを入力するデータ入力装
    置と、テキスト、図形、グラフ、表、イメージ等のデー
    タを表示できるディスプレイ装置と、このディスプレイ
    装置を見ながら画面上のカーソル位置を指示するための
    カーソル指示装置と、大量のデータ、プログラムを二次
    的に記憶するファイル装置と、音声を符号化して音声デ
    ータとする音声符号化装置と、この音声符号化装置の符
    号化タイミングと同期して音声のパワーデータを抽出す
    る音声パワーデータ抽出装置と、前記音声データおよび
    前記音声パワーデータを記憶する音声メモリと、前記音
    声データを復号化する音声復号化装置とを備え、前記音
    声データの蓄積、伝送のために、前記ディスプレイ装置
    に表示した前記音声パワーデータ曲線を参照しながら、
    カーソル指示および編集コマンド入力により入力した音
    声データの編集を行なうことを特徴とする音声データ編
    集方式。
JP59221339A 1984-10-23 1984-10-23 音声デ−タ編集方式 Pending JPS61100799A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59221339A JPS61100799A (ja) 1984-10-23 1984-10-23 音声デ−タ編集方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59221339A JPS61100799A (ja) 1984-10-23 1984-10-23 音声デ−タ編集方式

Publications (1)

Publication Number Publication Date
JPS61100799A true JPS61100799A (ja) 1986-05-19

Family

ID=16765252

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59221339A Pending JPS61100799A (ja) 1984-10-23 1984-10-23 音声デ−タ編集方式

Country Status (1)

Country Link
JP (1) JPS61100799A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6358399A (ja) * 1986-08-29 1988-03-14 株式会社日立製作所 音声分析装置
JPS63231498A (ja) * 1987-03-20 1988-09-27 松下技研株式会社 音声編集装置
JPH01133426A (ja) * 1987-11-19 1989-05-25 Matsushita Electric Ind Co Ltd 圧縮データ編集装置
JPH01150198A (ja) * 1987-12-08 1989-06-13 Matsushita Electric Ind Co Ltd 音声データ編集装置
JPH01150199A (ja) * 1987-12-08 1989-06-13 Matsushita Electric Ind Co Ltd 音声データ編集装置
JP2002543445A (ja) * 1999-02-23 2002-12-17 ユニシス コーポレイシヨン 対話の設計およびシミュレーションのための装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6145299A (ja) * 1984-08-09 1986-03-05 カシオ計算機株式会社 波形表示装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6145299A (ja) * 1984-08-09 1986-03-05 カシオ計算機株式会社 波形表示装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6358399A (ja) * 1986-08-29 1988-03-14 株式会社日立製作所 音声分析装置
JPS63231498A (ja) * 1987-03-20 1988-09-27 松下技研株式会社 音声編集装置
JPH01133426A (ja) * 1987-11-19 1989-05-25 Matsushita Electric Ind Co Ltd 圧縮データ編集装置
JPH01150198A (ja) * 1987-12-08 1989-06-13 Matsushita Electric Ind Co Ltd 音声データ編集装置
JPH01150199A (ja) * 1987-12-08 1989-06-13 Matsushita Electric Ind Co Ltd 音声データ編集装置
JP2002543445A (ja) * 1999-02-23 2002-12-17 ユニシス コーポレイシヨン 対話の設計およびシミュレーションのための装置

Similar Documents

Publication Publication Date Title
US5875448A (en) Data stream editing system including a hand-held voice-editing apparatus having a position-finding enunciator
US8548618B1 (en) Systems and methods for creating narration audio
JP3610083B2 (ja) マルチメディアプレゼンテーション装置および方法
JP5045670B2 (ja) 音声データ要約再生装置、音声データ要約再生方法および音声データ要約再生用プログラム
US5632002A (en) Speech recognition interface system suitable for window systems and speech mail systems
JP2006323806A (ja) テキストを音声に変換するシステムおよび方法
JPH07140998A (ja) 音声認識インターフェース
JP4741406B2 (ja) ノンリニア編集装置およびそのプログラム
JP3279684B2 (ja) 音声インタフェース・ビルダ・システム
JPS61100799A (ja) 音声デ−タ編集方式
JPH0315899A (ja) 情報処理システム
JP4489650B2 (ja) 歌詞文字に基づいて切り貼り編集を行うカラオケ録音編集装置
JP5929879B2 (ja) 音声出力装置、プログラム、及び音声出力方法
KR100357241B1 (ko) 디지털 오디오 플레이어에서의 반복재생구간 설정제어방법 및 이것을 이용한 파일재생장치 및 저장매체
JP2001325250A (ja) 議事録作成装置および議事録作成方法および記録媒体
JP4388496B2 (ja) 番組制作装置及び番組制作プログラム
JP7156748B1 (ja) 情報処理システム及び情報処理方法
CN115243108B (zh) 一种解码播放方法
JP2001282291A (ja) 音声データ処理装置
KR20130090985A (ko) 음원 파일을 편집하는 장치 및 방법
JP2574749B2 (ja) 文書処理装置
JPS63201821A (ja) 音声メモ方式
JP2022067945A (ja) 教材オーサリングシステム
US20090082887A1 (en) Method and User Interface for Creating an Audio Recording Using a Document Paradigm
Gagné Cooking with Linux: your voice, forever etched in electrons