JPH0315899A - 情報処理システム - Google Patents

情報処理システム

Info

Publication number
JPH0315899A
JPH0315899A JP14962889A JP14962889A JPH0315899A JP H0315899 A JPH0315899 A JP H0315899A JP 14962889 A JP14962889 A JP 14962889A JP 14962889 A JP14962889 A JP 14962889A JP H0315899 A JPH0315899 A JP H0315899A
Authority
JP
Japan
Prior art keywords
audio
information processing
processing system
audio data
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP14962889A
Other languages
English (en)
Inventor
Shigeru Yabuuchi
藪内 繁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP14962889A priority Critical patent/JPH0315899A/ja
Priority to EP19900111226 priority patent/EP0402911A3/en
Publication of JPH0315899A publication Critical patent/JPH0315899A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
[産業上の利用分野】 文字,図形,画像及び音声からなるマルチメディア文書
を処理する情報処理システムに関する.
【従来の技vf
4] 例えば,サイディス社のボイスステーション( Rob
ert T. Nicholson , ”Integ
rating Voicein the Office
 Word”, BYTE magazine , 1
983 ,l2月号)のシステムは,編集可能な文書に
音声の注釈をつけることが可能である。このシステムで
は,音声メッセージの内容を文書とは別の一つのウィン
ドウ内に棒グラフで表示し,音声の長さ,該音声メッセ
ージの有音部と無音部等を視覚的に表示する.そして,
システム共通の操作メニュー欄に表示されたソフトキー
を用いて音声の綱集を行なう。該ソフトキーにはテープ
レコーダと同じ操作コマンドが備えられている6具体的
には,″record” , ”stop”%’P1a
Y”,”rewind”,”fast forward
″がある。さらに,該ウィンドウには音声文章ごとに番
号が表示され,この番号をキーで指定しながら音声文章
単位で音声メッセージの挿入,削除,追加録音を行なう
ことが出来る。また,文書において音声の注釈を付した
個所にスピーカを抽象化したアイコンを印し,とのアイ
コンを指示すると前記のウィンドウが開くようになって
いる。 [発明が解決しようとする課M1 しかし,従来のボイスステーションシステムは,一つの
ウィンドウに表示された音声メッセージを前記操作コマ
ンドを使用して操作出来るものの,操作コマンドがシー
ケンシャルな動作をするテープレコードと同じであり,
聞きたいところの音声をランダムで短時間にアクセスす
ることが出来ない。また,音声の編集では音声文章単位
でしか音声の編集が出来ない。さらに,音声の録音・再
生の設定・変更が柔軟に行なえる機能などが備えらハ)
ない。このため,文書における音声の処理上の使い勝手
が悪く,応用も制限されていた。本発明の目的は,従来
技術のこのような問題点を解決するためのものである. 【課題を解決するための手段】 本発明の情報処理システムでは,マルチウィンドウ表示
手段を備え,該マルチウィンドウ表示手段を制御して音
声処理のための操作内容を視覚的に表現した複数のウィ
ンドウを作成し,かつこれらのウィンドウを階層的に表
示しながら,以下に述べる多くの機能を実行する手段を
備えた。 (1)音声メッセージ(以下,単に音声と称する)毎に
録音・再生条件を記録する手段を備えるとともに,@音
・再生条件を視覚的に設定・変更できる属性ウィンドウ
を備えた.また,録音時の条件を環境に合わせて自動的
に!1111する手段も備えた。 (2)文書の編集やマルチウィンドウ表示手段の制御等
を行なう情報処理手段とは別に,音声の符号化や復号化
の制御等を行なう音声処理手段と音声処理用記憶手段を
備え,さらに前記情報処理手段から前記音声処理用記憶
手段へのアクセスと前記音声処理手段から前記音声処理
用記憶手段へのアクセスの競合を防止する手段および前
記情報処理手段と前記音声処理手段双方からのアクセス
を可能とする手段を備え,前記情報処理手段による文書
処理と前記音声処理手段による音声の録音・再生等を実
時間で並行処理出来るようにした。さらに,前記音声処
理用記憶手段に音声データを記憶する容量が不足した場
合,S音を行いながら他の音声データを前記音声処理用
記憶手段またはファイル手段に実時間で退避させ,録音
に必要む記憶容量を動的に確保する機能を備えた。 (3)前記音声処理用記憶手段内に複数の音声データを
記憶・管理する手段(音声RAMファイル)を備えた。 (4)音声データを文章単位よりも短いフレーズ単位で
管理できる手段を備えた。 (5)音声処理のための各種ウィンドウ内に操作コマン
ドメニューを表示し,!!択出来る機能を備えた。 (6)別々に記憶されている複数の音声を重ねて再生す
る機能,この再生音声を符号化して再び録音する機能や
音質変換再生機能等を備えた。 (作用l 本発明の情報処理システムでは,音声の編集で使用する
情報を必要なときに他の情報と併記して表示しながら,
音声の編集等の処理を行えると共に,複数の音声を同時
に編集できるようになる.そして,音声の録音・再生等
の状態を視覚的に実時間で把握できる手段と録音・再生
条件を容易に変更できる手段を備えているために,環境
に適した条件で前記音声処理を行うことが可能となる.
また,録音データを蓄積するファイル手段が満杯になる
まで実時間で連続して録音可能となり,録音時間を気に
せずに音声を録音できるようになる。 さらには,音声データを文章単位よりも短いフレーズ単
位で管理する機能を備えたことにより,ランダムでかつ
きめの細かな音声編集が行え,その他の新しい機能の装
備と合わせて,より使いやすく効率的に音声を取り扱え
るシステムを実現できる。
【実施例】
以下,図面に従って本発明を説明する。第1図は,本発
明の一実施例を示す図である。第I図に示す情報処理シ
ステムは,文字,図形および画像を表示する羊段1と,
該表示手段の画面を複数の部分領域(ウィンドウ)に分
割し,ウィンドウを独立した表示手段として動作させる
マルチウィンドウ表示処理手段2と,前記表示手段の画
面における位置を入力する手段3と,文字を入力する手
段4と,画像を入力する手段26と,これらの入力手段
から入力されたデータを前記マルチウィンドウ表示処理
手段経由で前記表示手段に表示しながら文書の作成・編
集・蓄積等を行う情報処理手段5と,該情報処理に使用
する各種データ(前記文書も含む)を記憶する手段6と
,前記文書を蓄積するファイリング手段7と,マイク3
lや電話30,VTR34等の音声入力手段からの入力
を選択する手段8と,該選択手段からのアナログ音声信
号を増幅し,周波数フィルタリングする手段9と,該手
段の出力信号をサンプリングし,デイジタル量に変換す
る符号化手段14と,該符号化された音声信号から元の
アナログ音声信号に復元する復号化手段15と,該手段
の出力信号を増幅し,周波数フィルタリングする手段1
1と,スピー力32や電話等の音声出力手段を選択する
手段10と,該符号化および該復号化を一定周期(フレ
ーム)で繰り返すための制御信号を発生する手段17と
,前記符号化された音声信号等を記憶する音声処理用記
憶手段18と,音声の入出力を制御する音声処理手段1
9と,録音・再生条件を記憶する手段21と,アナログ
音声信号を増幅し,周波数フィルタリングする手段9の
出力信号を分析して音声の大きさ,有声・無声の判定結
果を前記一定周期で出力する分析手段20と,複数の音
声データの管理情報を記憶する手段27と,情報処理手
段5から前記音声処理用記憶手段八のアクセスと前記音
声処理手段から前記音声処理用記憶手段へのアクセスの
競合を防止する手段23(メモリアクセス競合防止手段
23と呼ぶ)と,前記情報処理手段から前記音声処理手
段へのアクセス手段24と,前記音声処理手段から前記
情報処理手段へのアクセス手段25とからなるインタフ
ェース部22と,前記音声処理用記憶手段内に音声再生
条件を記憶する手段35から構或されている。 そして,各手段はデータ,アドレスおよびコントロール
ラインからなる主バスまたは音声バスによって結合され
ている.特に,音声処理を行なう手段をまとめて音声人
出系36と呼ぶ.なお,情報処理手段5と音声処理手段
19は,一般のマイクロプロセッサで構成されているも
のとする。 マルチウィンドウ表示処理手段2は,表示手段2からな
る実端末の画面より大きな論理画面を持つ仮想的な端末
と実端末の画面に表示されるウィンドウを対応付けて制
御することによって,マルチウィンドウを実現する.具
体的には,該マルチウィンドウ表示処理手段は,情報処
理手段5の命令によって仮想端末を生威し,論理的な仮
想画面を編集する.そして,仮想画面の一部を視野とし
て切り出し,実端末である表示手段2の画面に窓(ウィ
ンドウ)として表示する.さらに,実端末の画面上での
ウィンドウの移動,大きさ変更,仮想平面上の視野移動
等の機能を持ち,仮想端末に対する操作者の前記表示手
段の画面における位置を入力する手段3(マウス等)あ
るいは文字を入力する手段4(キーボード等)からの入
力を情報処理手段5に渡す.情報処理手段5からは,仮
想画面の構成,大きさを自由に設定可能であり,文字,
図形,画像を混在させて表示させ,複数のウィンドウを
同時に表示させることが可能である.以上に述べた本発
明の情報処理システムにおいて,文書に音声を付加する
手段や該音声の視覚的な編集手段について以下詳述する
. まず,文書に新しく音声を付与する場合について第2図
を使って説明する.いま,表示手段1の画面に第2図に
示すような二つのウィンドウ50と5lが表示されてい
るものとする。それぞれには,文書と画像が表示され,
ウィンドウ50中の領域52にはウィンドウ50に表示
した文書を編集するコマンドメニューが表示されている
ものとする。このコマンドメニューは情報処理手段5の
制御によって生成され,ウィンドウ50内に表示される
。このような状態において,操作者が表示文書内の音声
を付与したい個所を位置入力手段3で指示し,次にコマ
ンドメニュー欄の”音声注釈″53を位置入力手段3で
指示すると,これらの位置情報がマルチウィンドウ表示
処理手段2によって情報処理手段5に伝えられる。情報
処理手段5は,コマンドメニュー捕作成時に前記仮想画
面における各コマンドメニュー欄の領域情報を情報処理
用記憶手段6に記憶する。情報処理手段5は,情報処理
用記憶手段6を制御して前記コマンドメニュー欄の領域
情報を読み出し,前記位置情報とのマッチングを行ない
,指示されたコマンドすなわち″音声注釈′゛コマンド
を認識する。指示されたコマンドが”音声注釈“コマン
ドだと分かると,情報処理手段5は,最初に指定された
位置に音声の所在を示すアイコン54をマルチウィンド
ウ表示処理手段2を制御して表示する。なお,マルチウ
ィンドウ表示処理手段2を制御して表示手段1の画面に
表示する操作を以降ただ単に表示するとのみ記述する. 次に,情報処理手段5は,最初に指定された位置情報か
ら音声編集ウィンドウ55の位置を自動的に配置し,表
示する.この自動配置については、後述する.従来の公
知例では編集用のコマンドをシステム共用の操作メニュ
ー欄に表示していたが,本発明では,第2図に示すよう
に編集ウィンドウ55の中に編集コマンドメニュー65
6を備える.本発明の一実施例では,′″属性”録音”
停止”,″編集”状態”回復”及び″閉じる”のコマン
ドが存在する(以降コマンドは″と”で囲んで記述する
).9編集”はWt層メニューであり,″編集”が前記
の手続きにより選択されると,情報処理手段5はコマン
ドメニューa56の表示内容を第3図のように変更し,
″切出”消去″′,′挿入′″ ”移動”複写″を表示
する. 第2図の編集ウィンドウ55を拡大して表示した第4図
を用いて音声編集の具体的実施例をさらに述べる。 編集ウィンドウ55は,第4図に示すように5つの表示
領域からなる.領域57は音声データの先頭を時間Oと
した時の音声カーソル61と録音時間を実時間(単位:
秒)で表示する領域である。 音声カーソル時間は,音声カーソル61の音声データ上
の位置を示す.領域58は音量表示領域であり,録音お
よび再生時の音量を動的に視覚化して表示する。第4図
に示した実施例では,音量の大きさを棒グラフの長さに
変換して表しているが,量子化して分割した領域の色を
変えて表現することも可能である.そして,領域59は
録音されている音声データおよび時間スケール62を表
示する領域である.時間スケール62は最上行に表示す
る.音声データは時間スケール62と並行した横棒の形
で示す.横棒は,有音部分(フレーズ)のみ表示し,無
音部分は空白とする.領域60はウィンドウ操作メニュ
ー表示領域であり,ウィンドウの移動,大きさ変更,仮
想平面上の視野移動等のコマンドを表示する. 情報処理手段5は,操作者によって″音声注釈′゛53
が選択された時点では第4図に示すような内容をそのま
ま表示しない.領域57の音声カーソルおよび録音の時
間をO秒とし,領域58の音量としてはその値がOであ
るため何も表示しない。 さらに,領域55には時間スケール62の他には何も表
示しない。情報処理手段5は,このような編集ウィンド
ウの初期画面表示と同時に新しい音声の録音のための準
備を行なう.まず,情報処理手段5は,音声処理手段l
9に新規録音のための音声入出力系36の初期化命令を
アクセス手段24を介して発行する。音声処理手段19
は該初期化命令を受けて,音声入出力系36の各手段に
リセット信号を発行し,各手段の状態をリセット状態に
する。音声処理手段19は各手段からのリセット終了信
号を音声パス経由で受信すると,リセット終了をアクセ
ス手段25を介して情報処理手段5に知らせる。 次に,情報処理手段5は録音音声記憶用のメモリ領域を
確保するための処理を行なう。ここで,本発明の一実施
例における音声データの記憶管理方法および手段につい
て述べておく. まず,音声処理用記憶手段18に関して述べる.音声処
理手段19が後述の手続きにて音声入出力系36を制御
して符号化した音声データは,まず音声処理用記憶手段
18内の音声RAMファイルに記憶される.本発明の一
実施例では,音声データの消去,移動,挿入,複写,再
生等を容易にかつ高速に行なうためと記憶手段を最大限
有効に使用するために第5図に示した記憶構造を持つ音
声RAMファイルを備えた.同図中の番号27の手段は
,内容の異なる複数の音声データに関する管理情報を記
憶する手段である.音声データは,1つのルートディレ
クトリ63を起点とし,音声ファイルディレクトリ64
,フレーズディレクトリ65,ブロックマップリストお
よびデータブロックの木型階層構造により記憶される。 音声ファイルディレクトリ64には,1つの録音音声デ
ータに関するファイル情報(音声ファイル名,フレーズ
数,音声長,フレーズディレクトリポインタ,フォワー
ドポインタ)が記憶される.該フォワードポインタは,
次の音声ファイルディレクトリを示す。ルートディレク
トリ63をたどることによって全ての音声ファイルを検
索できる.フレーズディレクトリ65は,フレーズ音声
データの所在を示すポインタと同一ファイルに記憶され
るフレーズディレクトリ65を結ぶフォワードポインタ
とフレーム数からなる。前記フレーズディレクトリポイ
ンタは,ファイル中の先頭フレーズを示し,このポイン
タをたどることによって全フレーズの音声データをアク
セスすることができる.フレーズディレクトリ65中の
手段68は,該フレーズディレクトリが示すフレーズ音
声データが情報処理用記憶手段6またはファイル手段7
に記憶されているか否かを記憶する。音声データの実体
は,ブロックマップリストとデータブロックにより記憶
される。データブロックは,音声処理用記憶手段18中
の定められた記憶領域をある一定の大きさで分割した1
つの小領域を表す。1つのデータブロックにフレーズ音
声データを記憶できない場合は,?!J数のデータブロ
ツクに分割して記憶する.ブロックマップリストは,こ
の時の分割して記憶したデータブロックを結ぶものであ
る。 これまでに述べた音声RAMファイル69の記憶領域は
,システム立ち上げ時に音声処理手段工9の制御により
第6図のような割り付けで音声処理用記憶千段18内に
確保される。この時,音声処理手段l9は,音声処理用
記憶手段18中のシステム領域70内に記憶されている
管理情報に従って音声RAMファイルの各領域を第6図
のように確保する。そして,各領域の中に第5図に示し
たディレクトリ,データマップリストおよびデータブロ
ックを作威し,同じグループのディレクトリおよびリス
トをポインタで結び,各々の先頭のディレクトリおよび
リストをシステム領域70内の未使用ディレクトリポイ
ンタおよびリストポインタで結ぶ。 一方,ファイル手段7における音声データの記憶手段お
よび方法を第7図に示す。情報処理手段5は,音声デー
タを2種類のファイルで記憶する.1つは音声データの
管理情報を記憶する音声ファイル74であり,他はフレ
ーズ音声データを記憶するフレーズ音声データファイル
76である.音声ファイル74には,録音・再生条件を
記憶する領域75,フレーズ数記憶領域76,音声長記
憶領域77,フレーズの音声長記憶領域78,フレーズ
を構成するフレーム数記領域79および音声データファ
イル名記憶領域80が備えられている.フレーズ音声デ
ータファイル69には,前記の音声RAMファイルとは
異なり,フレーズ音声データを1つのファイルにまとめ
て記憶する.ファイル手段7におけるこれらのファイル
の管理は,一般に知られているUNIXあるいはMS−
DOSのファイルシステムを使用して行なう.なお,情
報処理手段5にて処理中の音声データに関しては,音声
ファイル74と同じ構造を持つ音声データ管理情報を情
報処理用記憶手段6に記憶する.情報処理手段5は,音
声処理手段工9からの音声入出力系36のリセット終了
を受け取ると,以上に述べた記憶手段内に新規録音用の
音声記憶領域を確保する。まず,音声処理手段工9に対
し音声RAMファイル内に音声ファイルを新設させるた
めのコマンドを発する。そして,情報処理用記憶手饅6
中に第7図の音声ファイル74の管理情報領域を確保し
,該領域の内容を0に設定する。 さらに,情報処理用記憶手段6中の録音・再生条件テー
ブルの内容を音声ファイル74の記憶領域75に格納す
る.該録音・再生条件テーブルには,システム立ち上げ
時に予め蓄積されている!s 準の8f!f・再生条件
ファイルの内容が読み出され,格納される6情報処理手
段5は該録音・再生条件を音声処理用記憶手段中の録音
条件記憶手段21と再生条件記憶手段35に格納する。 具体的には,情報処理手段5がメモリアクセス競合防止
手段23の出力から情報処理手段5が前記記憶手段にア
クセス可能であるかを調べ,可能であれば情報処理用記
憶手段6を制御して録音・再生条件テーブルの内容を読
みだし,前記記憶手段2Lおよび35にその内容を格納
する。 一方,音声処理手段19は未使用の音声ファイルディレ
クトリ64を第6図の未使用音声ファイルルートポイン
タ71をたどって求め,求めた音声ファイルディレクト
リ64を第5図のルートディレクトリ63に連結する,
そして,該音声ファイルディレクトリ64中のフレーズ
数と音声長に0に設定し,前記コマンド中の音声ファイ
ル名を該音声ファイルディレクトリ64に書き込む.上
記の処理において,未使用の音声ファイルディレクトリ
64やフレーズディレクトリ65あるいはデータブロッ
ク67がなかった場合は,使用中の音声ファイルを情報
処理用記憶手段6*たはファイル手段7に退避し,音声
RAMファイル中の該音声ファイルまたはフレーズ音声
データを消去して新規録音に必要な記憶領域を確保する
.この処理は,録音中に音声RAMファイルの未使用領
域が無くなった場合と同じ処理内容であるので,その!
1面で詳述する.このような処理が終了すると,音声処
理手段19は音声RAMファイル内に音声ファイルを新
設したことを情報処理手段5に伝える. 以上に述べた処理により″音声注釈″の準備が終わり,
情報処理手段5は編集ウィンドウ55がらのコマンドの
待ちに入る.ここで,操作者は位置入力手段3を用いて
″録音″を選択する。情報処理手段5は″録音′″を検
知すると,音声処理手段19に音声録音開始命令を発す
る。 音声処理手段l9は該命令を受けると,分析手段20と
符号化手段14を起動し,情報処理手段5から録音停止
命令を受けるまで以下に述べる録音処理を行なう。符号
化手段14は国l1g標準規格であるCCITT G,
721 AOPCM ニi’llじた方法で前記手段9
の出力信号をサンプリングして圧縮符号化し,フレーム
周期で出力する。一方,分析手1920は前記手段9の
出力信号をサンプリングして取り込み,この信号の絶対
値を計算し,フレーム間でこの値の平均値を求め,これ
をフレーム音声のパワー値として出力する。また,第8
図に示すように上記の音声パワー81を閾値判定し,1
4値82を超えたフレームを有声,超えなかったフレー
ムを無声とし,この結果を出力する。音声処理手段19
は,これらの出力をフレーム毎に読み込み,第9図に示
すようなデータ構造にまとめ,第5図中のデータブロッ
ク内に順次記憶する.該データブロックが満杯になった
時は,第6図中の未使用ブロックルートポインタから空
きのデータブロックを求め,ブロックマップリストを用
いて前記データブロックと連結させて使用する.また,
音声処理手段19はこの有声・無声判定結果84を用い
て有音・無音区間の判定し,無音区間の音声データの圧
縮を行なう。本実施例では,有音・無音区間の判定に有
声最短時間,子音区間および母音立ち下がり区間の3つ
の条件を使用する.まず,有音部の仮の立上りを検出す
るために次式の比較を行なう. 有声区間≧最短有声区間       (1)式(1)
の条件を満たす場合は該フレームを有音部の仮の立上り
86とする.一度有音部の仮の立上り86が検出される
と,今度は有音部の立ち下がりを次式を使って検出する
. 無声区間≧母音立ち下がり区間    (2)式(2)
が或立した時の無声区間の最初のフレームを有音部の立
ち下がり87と定める。そして,有音部の仮の立上り8
6から前記子音区間88だけ前のフレームから有音部の
立ち下がり87までを有音区間とし,その他を無音区間
とする。さらに,無音区間が録音条件データ中のフレー
ズ判定間値を超えているか判定する.超えている場合は
無音区間のフレーム数を無声区間の最初のフレーム音声
データ90に格納し,前記無音区間の音声データを圧縮
する。この時,該フレーム音声データ90中のパワーと
符号化音声データの値を全て0に改定する。その後,前
記と同じ方法にて音声RAMファイル内に次のフレーズ
を格納するための記憶領域を確保し,以上に述べた録音
処理を繰り返す。また,音声処理手段19はフレーズ判
定の他に録音条件データ中の段落閾値を用いて段落判定
を行なうと共に,音声ファイルディレクトリ64内のフ
レーズ数と音声長を更新する。 音声処理手段19はこのような録音処理を行ないながら
フレームの整数倍の間隔で情報処理手段5に割込みをか
け,録音処理状態を情報処理手段5に知らせる. 情報処理手段19は該割込みを検知すると,分析手段の
出力と有音・無音の判定結果等を音声処理用記憶手段l
8から読み取る.そして,前記音声パワーの大きさを第
4図の編集ウィンドウ中の領域58に視覚して表示する
.また,該割込み数をカウントして録音時間を計算し,
領域57に表示する.さらに,有音・無音の判定結果に
従って録音音声の有音・無音を第4図のように視覚化し
て表示する.この時,情報処理手段5は1フレーズ音声
データを第1O図のように編集ウィンドウ上に定義し,
フレーム音声データの記憶場所との対応がとれるように
情報処理用記憶手段6内に第11図のようなフレーズ表
示領域管理テーブルを備えて,同図に示したような情報
をフレーズ単位で格納する.段落が検出された場合は,
改行して音声データを表示する. 以上に述べたように,音声処理手段t9の制御による音
声の録音処理と情報処理手段5による録は操作者からの
″停止″′を検知すると,音声処理手段に対して録音停
止命令を発行し,上記の録音の停止処理を行なわせる。 音声処理手段l9は該命令を受け取ると,音声入出力系
36からの出力取り込みを停止し,情報処理手段l9に
停止応答を帰す.情報処理手段19は,これを受けて音
声RAMファイル中の録音した音声ファイルのディレク
トリ情報を読み込み,情報処理用記憶手段中の音声デー
タ管理情報記憶千段74に書き込む。 例えば,フレーズ数76,音声長77,フレーズ行声長
78,フレーズ内フレーム数79などである。音声処理
手段19は録音停止後,情報処理手段l9からの命令を
待つ. 操作者は,編集ウィンドウを用いた録音等の編集を終了
するために′″閉じる″を選択する。情報処理手段19
は該コマンドが選択されると.m集したa声データを音
声RAMファイルから情報処理用記憶手段6に読み出し
,さらにファイル手段に格納するための処理(アップロ
ード)行なう。 アップロードの方法には該音声ファイルの全音声データ
を一度に行なう方法とある単位に分割して行なう方法が
考えられるが,本実施例では情報処理手段5を有効に働
かせるために音声データをフレーズ単位でアップロード
し,音声処理のために占有させる時間を出来るだけ少な
くする。そこで,音声データ管理情報記憶手段74中の
フレーズ音声ファイル名を調べ,ファイル名が記述され
ていないフレーズすなわち該フレーズ音声データが未だ
アップロードされていないフレーズを検索する.そして
,該音声フレーズのアップロード命令を音声処理手段1
9に発する。音声処理手段19は,該命令を受けると,
フレーズ音声メモリアクセス競合防止手段23を調べ,
音声RAMファイルへのアクセス可能な時に前記音声フ
レーズのブロックマップリストポインタが示すデータブ
ロックの音声データを公知の技術であるDMA(Dir
ect Memory Access)またはP L 
O (Program Input Output)の
方法にて情報処理用記憶手段6内に読み込む。■データ
ブロックの読み込みが終わると,ブロックポインタをた
どり,次のデータブロックを上記の方法にて情報処理用
記憶手段6内に読み込む。音声処理手段5は,このよう
な処理を繰返して該フレーズ音声データを情報処理用記
憶手段6内に読み込む。1フレーズ音声データのアップ
ロードが完了すると,音声処理手段19はこの旨を情報
処理手段5に割込みで知らせる。情報処理手段5は該割
込みを受けると,フレーズ音声データを格納するフレー
ズ音声データファイルをファイル手段7に確保し,情報
処理用記憶手段6内に格納されているフレーズ音声デー
タを該ファイルに格納する。この時,情報処理手段5は
他と競合しない該フレーズ音声データファイル名を自動
的に生威し,該当するフレーズの記憶領域80に生成し
たファイル名を格納する.例えば,年月日を含めた名前
等を生成する。 情報処理手段5は以上のフレーズ音声データのアップロ
ード処理を繰返し,′音声注釈″′で録音した全ての音
声データをファイル手段7に格納する。その後,音声再
生条件記憶手段35および録音条件記憶手段21の内容
を読み出し,音声データ管理情報記憶手段74に書き込
む.さらに,他と競合しない音声ファイル名を生威し,
該音声ファイル名で前記音声データ管理情報記憶手段7
4をファイル手段7に格納する,そして,音声の所在を
示すアイコン54の文書中の位置と該ファイル名を情報
処理用記憶手段6に記憶し,m集ウィンドウ56を表示
手段2から消去する3さらに,アイコン54の色等を編
集ウィンドウを開いている時と比べて変化させ,音声処
理に関するシステムの動作状態が変化したことを,操作
者に知らせる. 以上,本発明における文書への音声付与の一実施例につ
いて述べた.この中で複数の音声を記憶・管理する音声
RAMファイルについて述べたが,その記f!l領域は
有限であり,音声RAMファイルに空きの記憶領域が無
くなる場合がある。この場合の処理の一実施例を次に述
べる。 各種音声処理において,音声RAMファイルに未使用の
音声ファイルディレクトリを確保出来なくなった場合,
音声処理手段↓9は,音声RAMファイルから消去可能
な音声ファイルをルートポインダ63をたどって求める
。消去可能な音声ファイルを求める方法としては,ルー
トポインタ63に連結された1つの音声ファイル(例え
ば,最初あるいは最後に連結されているもの)を消去対
象とする方法と,情報処理手段5が現在音声付与の対象
としている文書中の音声ファイル名を音声処理用記憶手
段18に書き込んでおき,音声処理手段19が該情報を
参照して該音声ファイル以外の音声ファイルを消去対象
とする方法を備え,通常は後者の方法にて消去音声ファ
イルを求める.しかし,後者の方法にても消去音声ファ
イルを求められなかった場合は,前者の方法にて該ファ
イルを求める。 このようにして消去可能な音声ファイルを求めた後,音
声処理手段19は該音声ファイルディレクトリのフレー
ズディレクトリポインタに連結されるフレーズディレク
トリを検索し,前記手段68を調べ,未だアップロード
されていないフレーズ音声データが存在するか調べる.
もし,これが存在しない場合は,該音声ファイルディレ
クトリのフレーズディレクトリポインタに連結されるフ
レーズディレクトリを順次たどりながら,フレーズディ
レクトリのブロックマップリストポインタに連結するデ
ータブロックを未使用ブロックルートポインタに連結さ
せ,該ブロックマップリストポインタ柿を空白にする.
このようにして前記消去音声ファイルの全フレーズディ
レクトリに連結するデータブロックを開放した後,該消
去音声ファイルのフレーズディレクトリポインタに連結
する全てのフレーズディレクトリを未使用フレーズルー
トポインタに連結する。そして,該消去音声ファイルデ
ィレクトリのフォワードポインタの内容を該ファイルデ
ィレクトリを指すファワードポインタに書き込むと共に
,該ファイルディレクトリの内容を空白にし,ファイル
ディレクトリを未使用音声ファイルルートポインタに連
結させて該音声ファイルの消去処理を終える. 一方,未だアップロードされていないフレーズ音声デー
タが存在する場合([1集中の音声ファイルを消去する
場合に該当する)には,該フレーズ音声データのアップ
ロード要求割込みをアクセス手段25を介して情報処理
手段5に対し発する.アップロード要求割込みには,退
避する音声ファイル名およびフレーズ番号を付帯する.
情報処理手段5はこの割込みを検知すると,音声処理手
段5はフレーズ音声データに関する前述のアップロード
処理を行ない,ファイル手段7に前記のフレーズ音声デ
ータを格納する.音声処理手段5は前記消去音声ファイ
ル内の全てのフレーズ音声データがアップロードされる
までに上記の処裡を繰り返す。その後,前述の処理によ
り消去音声ファイルを開放する。 以上,音声RAMファイルに未使用の音声ファイルディ
レクトリを確保出来なくなった場合の処理について述べ
たが,未使用のフ,レーズディレクトリを確保できない
場合も同様な処理を行なう。 一方,データブロックが確保できない場合は,前述の処
理で消去可能な音声ファイルを求め,該音声ファイルの
エフレーズ音声データのアップロード処理とフレーズデ
ィレクトリ,データブロックの開放処理を行なう.これ
らの処理は,フレーム周期および情報処理手段5から録
音・再生等の音声編集命令が発行される度に行なう. 次に,第4図に示した編集ウィンドウ内の領域56に表
示されている”録音”および″停止″以外のコマンドの
処理について順次述べる。 本発明の実施例では,IR集ウィンドウ内の領域59に
表示されているフレーズ音声データの中で,上記コマン
ドの処理対象としたいフレーズ音声データを操作者が位
置入力手段3を使用して指定することが出来る.このた
めに,情報処理手段5は,位置入力手段3から位置情報
が入力される度に編集ウィンドウのどの表示領域内の位
置が指定されたか調べる.該領域が音声データを表示し
た領域59ならば,さらに第1l図に示したフレーズ表
示領域管理テーブルを検索し,前記指定位置を含むフレ
ーズがあるか調べる.あれば,それが指定されたフレー
ズ音声となる。この処理によって情報処理手段5は操作
者が指定したい音声データをフレーズ単位で知ることが
出来る。位置入力手段として一般に使用されているマウ
スを使用した場合,該マウスの左ボタンからの位置情報
でコマンドの操作開始位置のフレーズ,同右ボタンから
の位置情報でコマンドの操作終了位置のフレーズという
ように区別を行ない,操作者が上記コマンドの処理対象
となるフレーズの範囲指定を可能とした。また,操作者
が゛フレーズを指定せずにコマンドを選択した場合,情
報処理手段5はその時点で音声カーソルが位置するフレ
ーズを操作開始位置のフレーズとする.そして,操作者
が操作終了位置のフレーズを指定しなかった場合は,録
音最後尾のフレーズを操作終了位置のフレーズを定める
6さらに,情報処理手段5は上記指定された編集ウィン
ドウ内の領域59に表示されているフレーズの表示部の
色を反転または変化させて強調し,情報処理手段5が認
知したフレーズを操作者に知らせる。 以下,各コマンドの処理を詳しく述べる。まず,〃再生
〃コマンドについて述べる。上記の方法にて操作者が操
作対象を指定し,そして第4図の編集ウィンドウにおい
て操作者が″′再生”を選択すると,情報処理手段5は
第12図のようなポップアップメニューを表示し,操作
者に再生モードをさらに選択させる.本発明の一実施例
では,上記の処理によって指定された範囲のフレーム音
声データを異なった方法で再生する機能を備えている.
第12図において,原音再生は録音時と同じ速度と高さ
で再生するモード,早口再生は録音時に比べて音声の高
さを変えずに速度だけを速めて再生するモード,多重再
生は指定された音声を順次重ねて再生するモード,多重
同期再生は指定された音声を同じに重ねて再生するモー
ドおよび音質変換再生は録音時と音声の高さ等を変化さ
せて再生するモードである。 情報処理手段5は原音再生モードが選択されると,音声
入力機器選択手段8に命令を発し,前記手段11の出力
信号を前記手段9に入力するように接続させると共に,
第12図中のポップアップメニューを消し,音声入力機
器選択手段8に指定範囲のフレーズ音声データの原音再
生命令を音声処理手段19に発する。該原音再生命令に
は再生音声ファイル名,再生開始フレーズおよび再生終
了フレーズを付帯する.なお,ここでの説明では再生対
象である音声データがファイル手段7から情報処理手段
5によって情報処理用記憶手段6内に読み出され,前記
音声RAMファイルに既に格納されているものとする。 音声RAMファイル内に再生対象である音声データが存
在しない場合についての処理については,後述する。 音声処理手段l9は,第3図に示した音声RAMファイ
lレのノレートディレクトリをたどって目的とする音声
ファイルディレクトリを探す。該ディレクトリを検出す
ると,第1図の音声出力4I!l器選択手段を用いて音
声出力する機器を選択し,その後同図中の復号化手段1
5を始めとする複数の復号化手段と音声分析手段20を
起動する。そして,音声再生記憶手段35から再生フレ
ーズ時間,再生段落時間および再生音量等の再生条件を
読み出し,前記復号化手段に前記再生音量と音声多重度
1を転送する.この後,音声処理手段19は情報処理手
段5から停止命令を受けるか,あるいは指定された終了
フレームに到達するまで以下に述べる原音再生処理を行
なう。音声処理手段19は前記音声ファイルディレクト
リから前述の処理にて再生フレーズ音声データを求め,
第9図に示したフレーム音声データを前記データブロッ
クからフレーム周期で切り出し,これを前記復号化手段
に転送する.該復号化手・段は,国際標準規格であるC
CITT G.721 ADPCMに準じた方法で符号
化された音声を復号化し,前記再生音量を乗じた後,第
1図中の手段11を介して元のアナログ波形に変換する
.lフレーズ音声データの最後尾のフレーム音声データ
は,音声の録音処理で述べたように入力音声の無音部を
lフレームに圧縮して記録している。そこで,音声処理
手段19は該フレームに達すると該フレーム音声データ
中の無音フレーム数Frを求め,これと前記再生フレー
ズ時間,再生段落時間を次のように比較し,再生無音フ
レーム数Fρを求める。 Fr<FfならばFp = Fr          
  (3)Fr≧FfでかつFr(FsならばFP =
 Ff(4)Fr≧FsならばFp = Fs    
        (5)ここで, FfとFsは,前記
再生フレーズ時間と再生段落時間をフレーム数に換算し
た値を表し,これらは再生条件記憶手段35に記憶され
ている。 このようにして,再生無音フレーム数Fpを求めた後,
これ以降該フレーム数だけパワーと符号化音声データの
値が全て0である然音フレーム音声データを繰り返して
前記復号化手段に出力し,指定された再生条件で無音区
間を発生する。 音声処理手段19は,このような処理の他に録音処理と
同様に分析手段20の出力を情報処理手段19に転送し
,再生音声の大きさや再生音声の位置等を実時間で編集
ウィンドウに表示させる。 以上,原音再生モードの処理について述べた。 次に多重再生モードの処理について述べる。情報処理手
段Sは多重再生モードが選択されると,その時点で他の
音声を再生中か調べ,再生中でなければ原音再生モード
の処理を行ない,音声を再生する。もし,再生中であれ
ば,指定範囲のフレーズ音声データの多重再生命令を音
声処理手段19に発する.該多重再生命令には再生音声
ファイル名,再生開始フレーズおよび再生終了フレーズ
を付帯する。音声処理手段19は多重再生命令を受ける
と,第13図に示すような処理を行ない,多重再生を実
現する.同図における番号91,92,18,1.5の
各手段の関係は,前記原音再生時に述べたフレーム音声
データを音声RAMファイルのデータブロックからフレ
ーム周期で切り出し,これを前記復号化手段に転送する
処理の詳細を示している,該手段91は再生するフレー
ムデータが格納されているデータブロック内の番地を記
憶し,手段92はデータブロックから読み出された■フ
レーム音声データを記憶する。該手段91の内容は前述
の処理に従って変更される。音声処理手段19は多重再
生命令受理後,第13図中の番号91と92をもう一式
(同図中の番号93と94の手段)確保し,符号化手段
15に音声の多重度2を転送する.そして,前記両手段
を用いて2つの音声の再生フレーム音声データを切り出
し,一緒に符号化手段l5に転送する。符号化手段15
はこれらの再生フレーム音声データを受けると,個別に
前述の方法にて音声を復元し,出力サンプリング周期毎
に次式に示すような復号信号の重み付け積和演算を行な
い,正規化して出力する.?こで,r■は多重度,vj
はサンプル点jでの多重化再生音声値,Wn,kは多重
度n時のk番目の音声の正規化重み定数yVj,kはk
番目の音声のサンプル点jでの符号化音声値を表す。な
お,W n , kはシステム立ち上げ時に音声処理手
段L9によって符号化手段14内に設定される。 音声処理手段19は,以上に述べた処理により複数の音
声を指定した時点から多重化して再生する。なお,音声
処理手段19は,個々の再生音声において指定範囲のフ
レーズ音声が終了すると,前記フレームデータ切り出し
記憶手段を開放すると共に,多重度をその分だけ減じて
符号化手段15に転送し,自動的に多重度を制御する.
また,原音再生モードと同じ再生条件処理を行なう.次
に多重同期再生モードの処理について述べる6情報処理
手段5は,操作者が編集ウィンドウ内で再生したい音声
の範囲を指定出来るための処理を前に述べたが,さらに
指定された範囲が重なっているかを判断することによっ
て複数の範囲が指定されたかどうかを知る.多重同期再
生モードの場合.操作者はこの処理によって複数の範囲
を指定し,多重同期再生モードを選択する.情報処理手
段5は,原音再生モードと同じ前処理を行ない,その後
音声処理手段19に多重同期再生命令を発する.該命令
には,複数の音声の再生範囲を示す前記情報を付帯する
.音声処理手段19は,該命令を受けると,第13図に
示した前記フレームデータ切り出し記憶手段を指定され
た腹数組だけ確保し,以降は前述の多重再生モードと同
じ処理を行ない2腹数の音声を同期させて多重再生する
。 次に,音質変換再生モードの処理について述べる。情報
処理手段5は該モードが選択されると,原音再生モード
と同様な前処理を行ない,音声処理手段19に音質変換
再生命令を発する。音声処理千段19は該命令を受ける
と,原音再生時の初期処理に加えて再生条件記憶手段3
5に記憶されている音質変換パラメータである高さ変換
度を復号化手段15に設定する.また,多重度上が復号
化手段15に設定される.そして,音声処理手段l9は
音声入出力系を起動し,フレーム音声データを前述のよ
うに切り出して復号化手段工5に転送する。復号化手段
15は高さ変換度が1であれば,原音再生と同じ再生処
理を実行する。しかし,原音に比べて高くする場合ある
いは低くする場合には,第14図またはfJ!,15図
に示した処理を行なう。すなわち,高くする場合は第1
4図に示すように復号化音声を変換度に比例して間引い
て出力する。反対に低くする場合は,第↓5図に示すよ
うに復号化音声を変換度に比例して同じ音声を挿入して
出力する。なお,無音区間の音声に対してはこれらの操
作を行なわない。本発明の一実施例では,このような処
理を行なって再生音声の音質を変換する. 以上,本発明の一実施例で備えている音声再生モードの
処理について述べた.各再生モードで再生された音声は
,音声入力機器選択手段8経出で符号化手段14に入力
されるため,前述の”録音”時の処理により該音声を録
音することも可能である.次に,編集ウィンドウ55に
示した他のコマンドの処理について述べる. まずν”属性”コマンドについて述べる。″属性″は,
音声の録音および再生時の前記各種条件を変更するため
のコマンドである。情報処理手段5は操作者によって”
属性”が選択されると,第16回に示す属性制御ウィン
ドウ95を生成し,表示手段1に表示する。この時,情
報処理手段5はフレーズ音声データの表示管理で述べた
ような方法によって,表示項目とウィンドウ内での表示
位置を情報処理用記憶手段6内に記憶する.そして,位
置入力手段3から位置情報が入力されると,前記情報を
使用して該位置がどの項目の表示領域内に位置するか調
べて,操作者が選択した項目を知る。その後,文字入力
手段4あるいは位置入力手段3によって入力された値を
,音声処理用記憶手段内の録音条件記憶手段21または
再生条件記憶手段35の選択された項目に該当する場所
に絡納する。情報処理手段5はこのような処理を行ない
,操作者が属性制御ウィンドウを介して音声の録音・再
生条件を動的に設定しながら音声の編集等を行なうこと
が出来るようにした。 該属性制御ウィンドウ95は,第16図に示すように4
つの表示領域に大別される。領域96はコマンドメニュ
ー欄,領域97は録音条件設定欄,領域98は再生条件
設定欄,そして領域99は試行選択欄をそれぞれ表示す
る領域である。情報処理手段5は,前記”属性″が選択
され,属性制御ウィンドウ95を生或,表示した時点で
は,各簡には前記録音・再生条件記憶手段内に記憶され
ている値を読みだし,表示する。ここで,各領域内の表
示内容について述べる。 領域96中のコマンド”標71!l値”は今までに設定
されている条件を破棄し,システム立ち上げ時に定めた
標準値で録音・再生を行なうものである.情報処理手段
5は,該コマンドが選択されると,″音声注釈″の処理
説明の中で述べた情報処理用記憶手段内の録音・再生テ
ーブルに記憶されている条件を,音声処理用記憶手段内
の録音条件記憶手段21および再生条件記憶手段35に
格納する。 同領域中のコマンド”回復”は,該属性ウィンドウを開
いて表示した当初の録音・再生条件を設定することを表
す.情報処理手段5は,該コマンドが選択されると,情
報処理用記憶手段6中に記憶されている第7図に示した
編集対象音声に関する音声データ管理情報内の録音・再
生条件を,音声処理用記憶手段内の録音条件記憶手段2
1および再生条件記憶手段35に格納する。さらに,同
領域中のコマンド″閉じる”は,属性制御ウィンドウ9
5による録音・再生条件の設定を終了することを表す.
情報処理手段5は該コマンドが選択されると,属性制御
ウィンドウ95を表示手段■から消去し,編集ウィンド
ウの処理に戻る。 次に,領域97の録音条件設定欄について説明する。同
領域中のバワー閾値欄↓OO,子音区間欄101,母音
立下がり区間102,有音R’Ki区間欄103,フレ
ーズ!’1104および段落欄105で設定された値の
処理内容については,′録音″の処理説明の中で述べた
ので,ここでは省酩する。 音量411106は入力音声のゲインを指定するための
ものである.情報処理手段5は,該表示欄の何れかが選
択されると,録音条件記憶手段21にその値を設定する
と共に,音声処理手段19に音声入力系の手段9のゲイ
ン制御を命ずる。音声処理手段19は該命令を受け,前
記ゲイン値を録音条件記憶手段21から読みだし,手段
9のゲイン制御を行なう6表示l1107は,音声入力
機器からの入力音声の大きさを横棒表示で示すr1であ
る。 これは,′録音”処理における分析手段20の出力信号
の表示処理部分のみを実行することによって実現する。 操作者は,該音量表示を使用して入力音声の大きさを実
時間で調節することが出来る.さらに,領域98の再生
条件設定欄について説明する.第16図中のフレーズ欄
108,段落欄109および高さ11113で設定され
た値の処理内容については,′″再生″の処理説明の中
で述べたので,ここでは省略する.速度41112は早
口再生モードにおける速さを設定する欄である.そして
,再生音量11110は出力音声のゲインを指定するた
めのものである.情報処理手段5は該表示欄の何れかが
選択されると,再生条件記憶手段35にその値を設定す
る.表示11111は,再生音声の大きさを実時間で横
棒表示する欄である.一方,試行選択(II99は,領
域97または領域98で指定された条件で音声の録音ま
たは試用音声の再生の試行を選択できる欄である.情報
処理手段5は,この欄において試行有が選択され,かつ
録音条件あるいは再生条件のいずれかの欄が設定される
と,設定した条件で録音あるいは再生を前述の処理手順
にて実行し,設定した条件が適切であるかを操作者に調
べさせる.ただし,この場合に使用する音声ファイルは
予め試用のために備試行選択a99の試用無を選択する
と,情報処理手段5は編集ウィンドウ55中の″停止″
コマンドと同じ処理を実行し,録音または再生を停止す
る。 この他に,本発明の一実施例では,録音時の音声の有声
・無声判定閾値であるバワー閾値を使用環境から自動的
に求める機能を備えている。属性制御ウィンドウ内の選
択表示!I114および115がこの機能に関連する部
分である.情報処理手段5は,選択表示欄114におい
て自@ll設定が選択されると,′録音”と同様な手順
にて録音を実行する。ただし,音声処理手段19からの
前記割込みを数え情報処理用記憶手段6に記憶された所
定の数に達したとき,音声処理手段l9に録音停止命令
を発する。情報処理手段5は,該割込みを検知すると,
″録音”処理と同じ方法にてシステム使用環境の維音等
のパワーの大きさを音声処理用記憶手段l8から読み取
る.そして,Mパワーの平均を求め,これに選択表示欄
115で選択された環境指数(システムで予め定められ
た値)を) 乗じた結果を有声・無声判定閾値であるバヮー閾値とし
て設定する. 以上,本発明の一実施例が備えてぃる〃属性”コマンド
の処理について述べた.次に,9編集〃コマンドについ
て述べる. 前述のように”編集″が選択されると,情報処理手段5
はコマンドメニュー欄の表示内容を第3図のように変更
する.第3図に示した実施例では,″紹集”は階層メニ
ューをなす.これは,編集ウィンドウ55のコマンドメ
ニュー欄の表示領域を小さくすることによって編集ウィ
ンドウ全体の大きさを押えるためにこのような構造をと
ったが,他の”録音”再生”等と併記してもよい.まず
,第3図のコマンドメニュー榴において”消去′″が選
択されると,情報処理手段5は第11図に示したフレー
ズ表示領域管理テーブルから編集ウィンドウ55内の音
声データ表示領域59において指定された範囲のフレー
ズ音声を消去する。 そして,該音声データ表示領域59の表示内容をテーブ
ルに記憶されたフレーズの表示情報を用いて,再度表示
領域を計算し,表示しなおす.さらに,情報処理用記憶
手段6内の該当する音声データ管理情報74中の前記消
去フレーズのフレーズ音声データファイル名を読み出し
,情報処理用記憶手段6内に該消去フレーズ音声ファイ
ル名を保存する。その後,上記音声データ管理情報74
から前記消去フレーズに関する情報を消去し,全音声長
77から消去したフレーズの音節長を減じると共に,全
フレーズ数76も同様に減じる。そして,消去したフレ
ーズ情報記述柿を前に詰める処理を行なう。これと,並
行して情報処理手段5は,音声RAMファイル中の着目
音声ファイルの前記フレーズ音声データの消去命令を,
音声処理手段19に発する6該消去命令には消去音声フ
ァイル名,消去先頭フレーズおよび消去末尾フレーズを
付帯する。音声処理手段19は,該命令を受けると,ル
ートディレクトリ63をたどって目的の音声ファイルデ
ィレクトリを検出する。そして,該ディレクトリ中のフ
レーズディレクトリポインタ7,)、 をたどり,消去フレーズディレクトリを検索し,その後
″録音”において音声RAMファイルに空きの記憶容量
が無くなった場合と同様の処理を行ない,゜音声RAM
ファイルから前記フレーム音声データを消去する.音声
処理手段19は,該消去処理を終了すると,情報処理手
段5に該消去命令の実行完了を知らせる. 以上,″消去″コマンドの処理について述べた。 次に,″移勅″′コマンドの処理について述べる。 情報処理手段5は”移動”が選択されると,第IL図に
示したフレーズ表示領域管理テーブルにおいて,編集ウ
ィンドウ55内の音声データ表示頭域59で指定された
範囲のフレーズ音声に関する表示情報を該テーブル中の
移動先フレーズに関する表示情報欄前に移動する。この
処理は,前記テーブルの情報を並び換えることによって
行なわれる.そして,該音声データ表示領域59の表示
内容を全て消去し,更新された該フレーズ表示領域管理
テーブルに記憶されたフレーズの表示情報を用いて,再
度表示領域を計算し,表示しなおす.その後2該音声に
関する音声データ管理情報74においてもフレーズ音声
情報(音声長78,フレーム数79,フレーズ音声ファ
イル名80)の並び換えを行ない,前記指定された範囲
のフレーズの音声情報を移動する。これと,並行して情
報処理手段5は,音声RAMファイル中の着目音声ファ
イルに対する前記フレーズ音声データの移動命令を,音
声処理手段19に発する。該命令には移動音声ファイル
名,移動元先頭フレーズ,移動フレーズ数および移動先
フレーズを付帯する。音声処理手段19は,該命令を受
けると,ルートディレクトリ63をたどって目的の音声
ファイルディレクトリを検出する.そして,該ディレク
トリ中のフレーズディレクトリポインタをたどり,移動
元先頭フレーズディレクトリと移動先フレーズディレク
トリを検索する.その後,移動元先頭フレーズから前記
移動フレーズ数分のフレーズディレクトリをフレーズデ
ィレクトリの鎖から切り離す。 即ち,第5図において移動元先頭フレーズディレクトリ
を連結するフレーズディレクトリ内フオワ一ドポインタ
と,移動元末尾フレーズディレクトリに連結されるフレ
ーズディレクトリを連結させる。さらに,移動先フレー
ズディレクトリを連結するフレーズディレクトリ内フォ
ワードポインタと,移動元先頭フレーズディレクトリを
連結する。 そして,移動元末尾フレーズディレクトリ内フォワード
ポインタと,移動先フレーズディレクトリを連結し,フ
レーズ音声データの移動を終了する。 音声処理手段19は,該移動処理を終了すると,情報処
理手段5に該命令の実行完了を知らせる.以上,″移勅
”コマンドの処理について述べた.次に,″複写”コマ
ンドの処理について述べる。 情報処理手段5は”複写′″が選択されると,第11図
に示したフレーズ表示領域管理テーブルにおいて,Jl
集ウィンドウ55内の音声データ表示領域59で指定さ
れた範囲のフレーズ音声に関する表示情報を該テーブル
中の複写先フレーズに関する表示情報柿前に複写する.
この処理は,前記テーブルの情報を並び換えることによ
って行なわ内容を全て消去し,更新された該フレーズ表
示領域管理テーブルに記憶されたフレーズの表示情報を
用いて,再度表示領域を計算し,表示しなおす。 その後,該音声に関する音声データ管理情報74におい
てもフレーズ音声情報(音声長78,フレーム数79,
フレーズ音声ファイル名80)の並び換えを行ない,前
記指定された範囲のフレーズの音声情報を複写先フレー
ズ前に複写し,全フレーズ数と音声長を更新する.ただ
し,複写された複数のフレーズのフレーズ音声ファイル
名8041mは空白とする。これと,並行して情報処理
手段5は,音声RAMファイル中の着目音声ファイルに
対する前記フレーズ音声データの複写命令を,音声処理
手段l9に発する.該命令には複写音声ファイル名,複
写元先頭フレーズ,l!l[写フレーズ数および複写先
フレーズを付帯する.音声処理手段19は,該命令を受
けると,ルートディレクトリ63をたどって目的の音声
ファイルディレクトリを検出する.そして,該ディレク
トリ中のフレーズデ天レクトリポインタをたどり,複写
元先頭フレーズディレクトリと腹写先フレーズディレク
トリを検索する。その後,複写フレーズ数分の未使用フ
レーズディレクトリを確保し,これらを”移動″処理で
述べたようなポインタ操作を行なって複写先フレーズデ
ィレクトリの前に挿入する.さらに,複写元各フレーズ
に対する該当ブロック数の未使用データブロック領域を
確保し,上記確保したフレーズディレクトリ下に連結す
るおそして,腹写元フレーズのデータブロック内の音声
データを上記確保したデータブロックに複写する。最後
に,該音声ファイルの音声長およびフレーズ数を複写分
だけ更新する。音声処理手段19は,該複写処理を終了
すると,情報処理手段5に該命令の実行完了を知らせる
. 以上,″複写′″コマンドの処理について述べた。 次に,″神入”コマンドの処理について述べる.情報処
理手段5は,″挿入”コマンドが選択されると,gI集
ウィンドウとは別に第17図に示す挿入ウィンドウ12
0を生成し,表示手段1に表示する。操作者は,該挿入
ウィンドウ上で挿入する音声データを録音し,再生して
挿入音声を確認したり,消去したりできる.このように
別ウィンドウを使用しないで編集ウィンドウ上で音声を
挿入する方法もあるが、編集ウィンドウにおいて挿入音
声が録音される度に実時間で表示領域55中の挿入位置
以降の音声データの表示を実時間でスクロールすること
は困難であり,本発明の一実施例では上記の方法を採っ
た. 該挿入ウィンドウ120は,第17図に示すように3つ
の表示領域に大別される.領域121はコマンドメニュ
ー欄,領域122は録音された挿入音声データを視覚化
して表示する領域で編集ウィンドウの領域59と同じ,
領域123はウィンドウ操作コマンド表示欄である. 音声処理手段5は挿入ウィンドウ120を表示した後,
領域122への挿入録音音声表示のために″録音”の処
理部で述べた第1工図のフレーズ音声表示領域管理テー
ブルを,挿入ウィンドウ用に別途情報処理記憶手段6内
に確保する.そして,挿ルウィンドウにおいて操作者に
よってコマンドが選択されるのを待つ。このような状態
において,操作者により”録音″が選択されると,情報
処理手段5は編集ウィンドウにおいて録音されている末
尾のフレーズ音声以降に音声を録音する命令を音声処理
手段19に発する。音声処理手段19は該命令を受ける
と,編集ウィンドウの”録音”処理を行ない,録音した
音声データを前記末尾フレーズ音声以降に連結させる。 また,情報処理手段5は,編集ウィンドウの”録音”処
理と同じ処理を行ない,挿入ウィンドウ120の領域1
22に録音音声を視覚化して実時間で表示する。挿入ウ
ィンドウ中の領域121に表示された他のコマンドも編
集ウィンドウ中のコマンドと同じ前述の処理が行なわれ
る. このような処理により挿入音声を録音した後,操作者が
挿入ウィンドウ中の″閉じる”を選択すると,情報処理
手段5は該挿入ウィンドウを表示手段1から消去する。 そして,前記末尾フレーズ音声以降に録音した挿入音声
データを,編集ウィンドウ上で指定された挿入先フレー
ズの前に移動し,′挿入″の処理を終了する。この処理
については,編集ウィンドウ中の”移動″′コマンドに
関する説明で詳細に述べたので,ここでは省略する。 以上,編集ウィンドウ中の″挿入”コマンドの処理につ
いて述べた.次に、該ウィンドウにおける”状態”コマ
ンドの処理について述べる.情報処理手段5は,′状態
”コマンドが選択されると,m集ウィンドウとは別に第
18図に示すウィンドウ125を生成し,表示手段1に
表示する。該ウィンドウは,前記音声RAMファイルの
使用状況を操作者に知らせる。該ウィンドウ125は,
第18図に示すように2つの表示領域に大別される.領
域126はコマンドメニュー桐,領域127は音声RA
Mファイルの使用状況の概要とその詳細を表示する領域
である.情報処理手段5は第6図に示した各種ルートポ
インタをたどり,各ディレクトリおよびデータブロック
の残量を求めると共に,同図中のシステム領域に記載さ
れている情報から音声RAMファイルにおける各ディレ
クトリおよびデータブロックの実装容量を求める.そし
て,該実装容量から前記残量を減じて使用量を算出し,
前記ウィンドウ内に表示する。一方,音声RAMファイ
ルの使用状況の詳細に関しては,゜第5図に示したディ
レクトリをたどりながら第18図に示した各情報を求め
,前記ウ゛インドウに表示する.このような処理により
前記ウィンドウを表示した後,操作者が前記ウィンドウ
中の″閉じる”を選択すると,情報処理手段5は前記ウ
ィンドウを表示手段1から消去する。 以上,1i集ウィンドウ中の”状態”コマンドの処理に
ついて述べた.次に、該ウィンドウにおける”回復″コ
マンドの処理について述べる。 情報処理手段5は,′回復″コマンドが選択されると,
gI集ウィンドウ中の表示領域59に表示されている音
声データを全て消去する。そして,編集対象とする音声
ファイルがファイル手段7に蓄積されているか調べる.
もし,蓄積されていないのならば,前述の新規録音のた
めの初期化処理を行なう.反対に蓄積されいる場合は,
上記音声ファイルの内容を読み出し,情報処理用記憶手
段6内の第7図に示した音声データ管理情報記憶領域に
格納する。その後,音声処理手段l9に対して音声RA
Mファイル中の該音声ファイルの消去命令を発する。音
声処理手段19は該消去命令を受けると,前述の処理に
て音声RAMファイル中の該音声ファイルを検出し,該
音声ファイルを構成するデータブロック,フレーズディ
レクトリおよび音声ファイルディレクトリのそれぞれを
第4図に示した未使用ルートディレクトリに連結させ,
開放する.音声処理手段19は,このような音声ファイ
ルの消去処理を終えると,その旨を情報処理手段5に知
らせる. 情報処理手段5は該消去終了を受理すると,音声処理手
段19に対し音声RAMファイル中に音声ファイルを新
設させるための命令を発する。該命令には,前記編集対
象とする音声ファイル名,フレーズ数および音声長を付
帯する。音声処理手段19は,前述の処理を実行して新
しい音声ファイルディレクトリを確保し,指定された音
声ファイル名,“フレーズ数および音声長を該音声ファ
イルディレクトリに格納する.そして,指定された数だ
けのフレーズディレクトリを前述の処理により確保し,
前記音声ファイルディレクトリに連結する. 次に,音声処理手段5は前記編集対象とする音声ファイ
ルの音声データをファイル手段7から読ミ出し,音声R
AMファイルに格納するための処理(ダウンロード)を
行なう.本実施例では,前述のアップ口ードと同じくフ
レーズ単位で音声データをダウンロードする.音声処理
手段19は,上記音声ファイルディレクトリのフレーズ
ディレクトリポインタをたどり,ブロックマップリスト
ポインタが空白のフレーズディレクトリを検出すると,
該フレーズ音声データのダウンロード割込みを情報処理
手段5に発する.該割込みには,音声ファイル名とダウ
ンロードフレーズ番号を付帯する。情報処理手段5は,
該割込みを受けると,指定されたフレーズ番号のフレー
ズ音声データファイル名前を記音声データ管理情報記憶
領域からレーズ音声データ)を情報処理用記憶手段6内
に読み込む.そして,DMAまたはPI○の方法にて,
情報処理用記憶手段6の該フレーズ音声データを音声処
理用記憶手段18内に転送する.その後,音声処理手段
5にフレーズ音声データの転送終了を知らせる。音声処
理手段5は該知らせを受けると,音声処理用記憶手段1
8内の前記フレーズ音声データを前記データブロックの
大きさに分割する。そして,必要な数のデータブロック
を確保してフレーズディレクトリに連結し,前記フレー
ズ音声データを確保したデータブロックに格納する.こ
の処理が終わると,フレーズディレクトリ中の記憶手段
68の値を1に設定し,該フレーズ音声データがファイ
ル手段7に蓄積されていることを印すと共に,フレーム
数も書き込む。 音声処理手段5は,以上に述べたフレーズ音声データの
ダウンロードを指定されたフレーズ数だけ繰り返し,前
記編集対象の音声データを音声RAMファイルに格納す
る。該処理が終了すると,情報処理手段5に対してこの
旨を知らせる。情報処理手段5はこの知らせを受けると
,前記音声データ管理情報内の録音・再生条件を音声処
理用記憶手段内の録音条件記憶手段21および再生条件
記憶手段35に書き込み,”回復”コマンドの処理を終
える。 以上で,文書等への音声注釈の付与処理およびg集ウィ
ンドウ等を使用した音声データの編集処理の実施例に関
する説明を終了する.次に,既に文書に対して付与され
ている音声データおよび別途録音済音声データに対して
,本発明の一実旅例が持つ機能に関する処理内容につい
て説明する。 本発明では,第2図に示したように音声の所在を示すア
イコン54をマルチウィンドウ表示手段2を制御して表
示する。本発明では,第2図中のアイコン54の他に第
19図および第20図のようなアイコンを表示する機能
も備える。第19図のアイコン128は,録音音声の長
さと再生時の残量を表す。該アイコン中の番号129の
数字が録音音声の長さを示し,番号130の領域が再生
同図中のアイコン128から数秒経過した後のアイコン
を示したものである.一方,第20図のアイコンは,録
音されている音声の発声者の顔写真を画像で表示したも
のである.該アイコンは,入力手段26を使用して発声
者の顔写真を量子化してファイル処理手段7に格納して
おき,必要時に該手段から読み出して,アイコン表示位
置にマルチウィンドウ表示手段2により表示する。 前記″音声注釈”により文書に音声を付与し,上記のア
イコンでその所在を表した以降の該音声の再生等の処理
は,次のように行なわれる。 操作者は,文書に付与した音声を操作したい場合,前記
アイコンを位置入力手段3で指定する.情報処理手段5
は,位置入力手段3からの入力位置情報と情報処理用記
憶手段6に記憶済みの前記アイコンが表示されている領
域情報を比較し,指定位置が前記アイコン表示領域内に
あれば,第21図に示すポップアップメニュー135を
生成し,指定アイコンの近くに表示する.該ポップアッ
プる操作コマンドを表示する。そして,該アイコンが示
す音声ファイルの内容をファイル手段7から読み出し,
情報処理用記憶手段6内の第7図に示した音声データ管
理情報記憶領域に椙納する.その後,音声RAMファイ
ルに該音声ファイルが記憶されているか調べる。もし,
記憶されていない場合には,″回復″処理で述べた該音
声ファイルの音声RAMファイルへの蓄積処理を行なう
。そして,操作者によるポップアップメニュー135中
のコマンド選択を待つ. 該ポップアップメニュー135内の音声再生および停止
コマンドに関する情報処理手段5および音声処理手段1
9の処理は,前記音声ファイル中の全フレーズを対象に
″音声注釈”時の編集ウィンドウ内のコマンドと同じ処
理を行なう.なお,f!声処理手段19は,音声再生中
に,音声RAMファイルの容量不足でアップロードされ
,音声RAMファイル内にフレーズ音声データが存在し
ないことをフレーズディレクトリ中のブロックマップリ
ストポインタから知ると,″回復″処理の説明で述べた
フレーズ音声データのダウンロード処理を行ない,上記
フレーズ音声データを音声RAMファイルにダウンロー
ドしながら該音声を再生する. 該音声再生において,音声処理手段5は,操作者が表示
手段1中に表示した複数のアイコンを順次指定しながら
”原音再生”または”同時再生”を選択すると,指定さ
れた音声データを前述の如く情報処理用記憶手段6と音
声RAMファイルに格納しながら,第12図の”多重再
生″または″多重同時再生″処理を行ない,複数の音声
を重ねて再生する. さらに,音声処理手段5は,前記ポップアップメニュー
135内の”属性設定”が選択されると,編集ウィンド
ウの″属性″と同じ処理を行ない,第16図に示した属
性制御ウィンドウを表示し,音声の録音・再生条件の設
定処理を行なう.また,″エディタ″が選択されると,
前記の編集ウィンドウを表示し,前述の音声編集処理を
行なう.前アイコンで示している音声を消去するコマン
ドを表している.音声処理手段5は,該″消去”が選択
されると,前記”回復″コマンドで述べたような処理を
行ない,音声RAMファイルから該音声ファイルを消去
する.そして,該音声の音声データ管理情報領域内に記
載されているフレーズ音声データファイル全てをファイ
ル手段7から消去し,その後該音声データ管理情報が格
納されたファイルをファイル手段7から消去する.最後
に,情報処理用記憶手段6内に記憶されているアイコン
の表示位置情報と表示アイコンを消去し,″消去″の処
理を終える。 一方,前記ポップアップメニュー135内の″移動′″
は,アイコン即ち音声を付与した位置を移動するコマン
ドである.情報処理手段5は,″移動″が選択されると
,以降位置が位置入力手段3により確定される(例えば
,マウスの場合ボタンがオフされた時)まで,位置入力
手段3からの入力位置に該アイコンを移動,表示する。 そして,位置確定後,該アイコンの表示位置情報を情報
処理記憶手段6に格納する. 以上,既に文書等に対して付与されている音声データの
操作機能の処理について述べた。次に,別途録音済音声
に対して,本発明の一実施例が持つ機能に関する処理内
容について説明する。 第2図では編集エディタを使用して音声をその場で録音
し,文書等に付与する実施例について述べたが,既に録
音されている音声を文書等に対して付与する場合の一実
施例を第22図に示す。第22図において,操作者が文
書等を表示しているウィンドウ50内で音声を付与した
い位置136を位置入力手段3で指示し,その後コマン
ドメニュー欄の″音声注釈″53を選択すると,情報処
理手段5はポップアップメニュー137を表示する。次
に,操作者が該メニュー中のlj j/ir規録音″を
選択すると,情報処理手段5は第2図で説明した処理を
行ない,音声を付与する。一方,該メニュー137中の
″音声複写”を選択すると,情報処理手段5は既に録音
されている複数の音声デ−第22図中のリスト138に
表示する6そして,該リスト138から複写して音声付
与したい音声が操作者によって位置入力手段等を使用し
て選択されるのを待つ。該音声が選択されると,情報処
理手段5は該音声のデータを格納したファイルを別の名
前でファイル手段7に複写し,このファイル名と前記位
置136の情報を情報処理用記憶手段内に格納する,そ
の後,ポップアップメニュー137とリスト138をウ
ィンドウ50から消去し,かつアイコンを位置136に
表示して”音声纜写″による″音声注釈″処理を終了す
る。 次に,第23図に示した実施例について説明する。この
図は,情報処理手段5がウィンドウ50内に既に録音さ
れている複数の音声データに関する情報をウィンドウ1
41のリスト143に表示し,そしてこの中で位置入力
手段3等により選択された音声データを,文字入力手段
から4から人力され,同図中のファイル名入力4!11
44に表示されたファイル名でファイル手段に腹写し,
vl積する実施例を示している。 さらに,第24図は編集ウィンドウを同時に2つ動作さ
せ,別の編集ウィンドウ5Sにおいて指定された複数の
フレーズ音声データ151を2着目する編集ウィンドウ
50内の指定された個所に複写する場合の実施例を示す
。操作者はg集ウィンドウ50を用いて音声編集してい
る段階において,別の音声の特定のフレーズ音声を複写
したいと考えた時,第21図に示した方法等で複写対象
である音声のH4集エディタ5Sを開く。そして,該ウ
ィンドウ55の”編集”コマンドを選択し,第3図で説
明した編集コマンドをウィンドウ55に選択させる。こ
のような状態において,情報処理手段5は,前述の処理
により操作者に指定されたコマンドの操作対象となるフ
レーズ音声を認知し,操作者により″切り出し″コマン
ドが選択されると,該被複写音声のファイル名と切り出
し先佃フレーズ番号とフレーズ数を情報処理用記憶手段
6に一時記憶する。そして,編集ウィンドウ50の″複
写″が操作者によって選択されたとき,切り出し音声デ
ータが情報処理用記憶手段6内に一時記憶されているか
調べ,されている場合には″複写″選択後に指示された
編集ウィンドウ50中の指定位置に,上記切り出し音声
データを前述の複写処理によって複写する。該情報処理
用記憶手段6における切り出し音声データの一時記憶は
,1!集ウィンドウにおいて”切り出し′″コマンド後
に選択されたコマンドの実行後消去される。 以上,別途録音済音声に対して,本発明の一実施例が持
つ機能に関する処理内容について説明した。むお,第1
図に示した実施例では,符号化手段14で第25図に示
したようなAD変換処理およびAD変換後の音声データ
の圧縮処理等の処理を全て行なっているが,AD変換処
理を除いた音声データの圧縮処理等の処理を音声処理手
段19にて行なっても良い.第26図に示した音声復号
化についても同様なことが可能である。 最後に,情報処理手段5が,指定された位置情報から音
声編集ウィンドウを自動的に配置する処理内容について
,第27図および第28図を用いWSXおよびWSYは
表示手段1の表示可能領域160の横幅および縦幅,P
XおよびPYは上記指定された位置座標,VXおよびv
Yは前記表示可能領域160中の音声編集ウィンドウの
表示原点座標,VWXおよびvWYは音声編集ウィンド
ウの横幅および縦幅,BXおよびBYは指定された位置
座標から音声編集ウィンドウの表示原点座標へのバイア
ス値,そしてRXおよびRYは表示可能領域160と編
集ウィンドウで最小限確保すべき間隔を表している.但
し,次式の関係は満足しているものとする. RX+VWX<WSX           (7)R
Y+VWY<WSY           (8)まず
,vXを決定する6第27図のように編集ウィンドウを
配置した時,表示可能領域160と編集ウィンドウの左
側の間隔がRXよりも小さいか調べる(ステップ161
,162)。小さければRXをvXとする(ステップ1
63).さもなければ,表示可能領域160と編集ウィ
ンドウのプ164)。大きくなければ該右側の間隔をR
Xにした位置にvxをとる(ステップ↓65)。大きけ
ればPXからBXを減じた位置をvXにする。 次に,VYを決定する。第27図のように編集ウィンド
ウを配置した時,表示可能領域160と編集ウィンドウ
の下側の間隔がRYよりも大きいか調べる(ステップ1
66,167).大きければステップ166の結果をV
Yとする.さもなければ,編集ウィンドウをPYよりも
上側に配置した時,表示可能領域160と編集ウィンド
ウの上側の間隔がRYよりも大きいか調べる(ステップ
168,169)。大きければときステップ168の結
果をVYとし,さもなければVYをRYにとる。 [発明の効果】 本発明の情報処理システムにより,音声の編集で使用す
る情報を必要なときに他の情報と併記して表示しながら
,音声の編集等の処理を行えると共に,腹数の音声を同
時にかつ多様に編集できるようになった。そして,音声
の録音・再生等の状態を視覚的に実時間で把握できる手
段と録音・再生条件を容易に変更できる手段を備えてい
るために,環境に適した条件で前記音声処理を行うこと
が可能となった.また,M音データを蓄積するファイル
手段が満杯になるまで実時間で連続して録音可能となり
,録音時間を気にせずに音声を録音できるようになった
.さらには,音声データを文章単位よりも短いフレーズ
単位で管理する機能を備えたことにより,ランダムでか
つきめの細かな音声編集が行え,その他の新しい機能の
装備と合わせて,より使いやすく効率的に音声を取り扱
えるシステムを実現できた。
【図面の簡単な説明】
第1図は本発明の一実施例を示す図,第2図はマルチウ
ィンドウを用いた音声付与方法を示す図,Mファイルの
記憶構造を示す図,第6図は音声RAMファイルの領域
管理を示す図,第7図は音声ファイルの記憶構造を示す
図,第8図は無音区間検出処理を示す図,第9図はフレ
ーム音声データの記憶構造を示す図,第10図は編集ウ
ィンドウにおけるフレーム音声の表示法を示す図,第1
1図はフレーズ音声表示領域管理テーブルを示す図,第
12図は再生ポップアップメニューを示す図,第13図
は多重音声処理を示す図,第14図は音質を高くする処
理を示す図,第15図は音質を低くする処理を示す図,
第16図は属性制御ウィンドウを示す図,第17図は挿
入ウィンドウを示す図,第18図は音声RAMファイル
状態ウィンドウを示す図,第19図はアイコン例2を示
す図,第20図はアイコン例3を示す図,第21図は既
に付与された音声の操作ポップアップメニューを示す図
,第22図は他の録音音声を文書に付与する処理を示す
図,第23図は他の録音音声を別のファイル名で複写す
る処理を示す図,第24図は他のフレーズ音声を複写す
る処理を示す図,第25図は符号化処理を示す図,第2
6図は復号化処理を示す図,第27図は編集ウィンドウ
の自動配置処理を説明するための図および第28図は編
集ウィンドウの自動配置処理を示す図である.第2図 寥 3 図 第 7 図 第g図 第5図 第6図 第q図 第 fθ 図 第11図 第 16 図 第 14図 第15図 出力{戸 JLILl uuLJuu uu L .++*         丼 第17図 第I2図 第fq図 第2σ図 第22図 53 第23図 第21図

Claims (1)

  1. 【特許請求の範囲】 1、文字、図形および画像を表示する手段と、該表示手
    段の画面を複数の部分領域(ウィンドウ)に分割し、ウ
    ィンドウを独立した表示手段として動作させるマルチウ
    ィンドウ表示処理手段と、前記表示手段の画面における
    位置を入力する手段と、文字を入力する手段と、画像を
    入力する手段と、これらの入力手段から入力されたデー
    タを前記マルチウィンドウ表示処理手段経由で前記表示
    手段に表示しながら文書の作成・編集・蓄積等を行う情
    報処理手段と、該情報処理に使用する各種データ(前記
    文書も含む)を記憶する手段と、前記文書を蓄積するフ
    ァイリング手段と、マイクや電話等の音声入力手段から
    の入力を選択する手段と、該選択手段からのアナログ音
    声信号を周波数フィルタリングする手段と、該手段の出
    力信号をサンプリングし、ディジタル量に変換する符号
    化手段と、該符号化された音声信号から元のアナログ音
    声信号に復元する復号化手段と、該手段の出力信号を増
    幅し、周波数フィルタリングする手段と、スピーカや電
    話等の音声出力手段を選択する手段と、該符号化および
    該復号化を一定周期(フレーム)で繰り返すための制御
    信号を発生する手段と、前記符号化された音声信号等を
    記憶する音声処理用記憶手段と、音声の入出力を制御す
    る音声処理手段より構成される情報処理システムにおい
    て、前記文字入力装置または位置入力手段からの信号を
    解析して音声データの処理要求であるかを判断し、音声
    データの処理要求であった場合にはマルチウィンドウ表
    示処理手段を制御して音声処理のために視覚的に表現さ
    れた操作内容を幾つかのウィンドウに分けて前記表示手
    段に表示させ、前記文字入力手段または位置入力手段か
    らの信号を取り込み、該信号から前記表示手段における
    画面内での位置を計算し、該位置と前記ウィンドウの表
    示画面から指示された操作内容を認識し、該認識結果の
    操作内容に応じて前記各手段を制御する情報処理手段を
    備えることを特徴とする情報処理システム。 2、前記情報処理手段は、前記視覚的に表現された前記
    操作内容を幾つかのウィンドウに分けて階層的に前記表
    示手段に表示させる特許請求の範囲第1項記載の情報処
    理システム。 3、特許請求の範囲第1項記載のウィンドウ内に音声の
    録音・再生等の編集コマンドメニューを備えたことを特
    徴とする情報処理システム。 4、前記音声処理用記憶手段から前記音声処理手段の制
    御によって読み出された有声・無声判定のための条件を
    はじめとする録音条件データを記憶する手段を備え、前
    記アナログ音声信号を増幅し、周波数フィルタリングす
    る手段の出力信号を分析して音声の大きさ、有声・無声
    判定結果を前記一定周期で出力する音声分析手段を更に
    備える特許請求の範囲第1項記載の情報処理システム。 5、前記音声処理用記憶手段内に、内容の異なる複数の
    音声データの管理情報を記憶する手段を更に備える特許
    請求の範囲第1項記載の情報処理システム。 6、前記音声処理手段は、前記情報処理装置からの音声
    録音開始命令を受けると、前記分析手段と前記符号化手
    段を起動し、前記情報処理手段から録音停止命令を受け
    るまで前記一定周期毎に前記分析手段と前記符号化手段
    から出力される音声データ(フレーム音声データ)を読
    み取り、該フレーム音声データを時系列的に前記音声処
    理用記憶手段に格納すると共に、前記分析結果と前記録
    音条件データを用いて有音・無音区間の検出を行ない、
    前記分析結果が無音となるまでに格納された前記時系列
    フレーム音声データと音声無音区間を圧縮した1フレー
    ム音声データからなる音声データ(フレーズ音声データ
    )が記憶されている先頭番地とフレーズ音声データ内の
    フレーム音声データ数を前記音声処理用記憶手段内の音
    声データ管理情報記憶手段に格納する特許請求範囲第1
    項記載の情報処理システム。 7、前記情報処理手段から前記音声処理用記憶手段への
    アクセスと前記音声処理手段から前記音声処理用記憶手
    段へのアクセスの競合を防止する手段と、前記情報処理
    手段から前記音声処理手段へのアクセス手段と、前記音
    声処理手段から前記情報処理手段へのアクセス手段とか
    らなるインタフェース部を備え、これらの手段を使用し
    て、前記情報処理手段よる前記文書処理と前記音声処理
    手段による音声の録音・再生処理等を同時に実行させる
    特許請求範囲第1項記載の情報処理システム。 8、前記音声処理手段は、前記音声処理用記憶手段にお
    いて音声データ記憶に使用できる容量を調べ、該容量が
    必要量以下であった場合、前記情報処理手段に働きかけ
    て退避可能な音声データを前記情報処理用記憶手段また
    は前記フアイルへ退避させ、以降の音声処理に必要な記
    憶領域を確保する特許請求の範囲第1項記載の情報処理
    システム。 9、特許請求の範囲第8項記載の情報処理システムにお
    いて、編集中の文書に付与されて音声以外の音声データ
    を前記退避可能な音声データとする特許請求範囲第1項
    記載の情報処理システム。 10、特許請求の範囲第9項記載の情報処理システムに
    おいて、前記音声データ管理情報記憶手段内に音声デー
    タを前記情報処理用記憶手段または前記ファイルへ退避
    させたか否かを記憶する手段を備え、前記音声処理手段
    は前記音声データ管理情報記憶手段を調べ、未だ前記情
    報処理用記憶手段または前記ファイルへ退避させていな
    い音声データのみ退避させ、以降の音声処理に必要な記
    憶領域を確保する情報処理システム。 11、特許請求の範囲第8項、第9項または第10項記
    載の情報処理システムにおいて、前記音声処理手段がフ
    レーム毎に実行することを特徴とする情報処理システム
    。 12、特許請求の範囲第8項、第9項または第10項記
    載の情報処理システムにおいて、前記情報処理手段から
    音声編集命令が発行される度に前記音声処理手段が実行
    されることを特徴とする情報処理システム。 13、前記音声処理手段は、前記情報処理手段から前記
    アクセス手段経由で録音音声の再生命令を受けると、前
    記音声データ管理記憶手段内の情報を検索し、該音声の
    データがすでに前記音声処理用記憶手段内に記憶されて
    いたならば直ちに該音声の再生処理を実行し、 一方該
    音声のデータが前記音声処理用記憶手段内に存在しない
    のならば、前記情報処理手段に前記ファイルから該音声
    のデータと管理情報を前記音声処理用記憶手段と前記音
    声データ管理記憶手段に書き込みさせ、書き込み終了後
    該音声の再生処理を実行する特許請求の範囲第1項記載
    の情報処理システム。 14、前記音声処理手段と前記復号化手段は、複数の録
    音音声を重ねて同時に再生する特許請求範囲第1項記載
    の情報処理システム。 15、前記音声処理用記憶手段内に音声再生条件を記憶
    する手段を備え、前記音声処理手段は音声再生条件を該
    記憶手段から読み出し、該再生条件で音声を再生する特
    許請求の範囲第1項記載の情報処理システム。 16、前記音声処理手段と前記復号化手段は、録音音声
    の音質を変化させて出力する特許請求の範囲第1項記載
    の情報処理システム。 17、前記音声処理手段は、録音音声の音質を変化させ
    た音声や複数の録音音声を重ねて同時に再生した音声等
    を選択手段を介して前記符号化手段にて符号化し、前記
    音声処理用記憶手段に格納する特許請求の範囲第1項記
    載の情報処理システム。 18、特許請求の範囲第1項記載の情報処理システムに
    おける符号化手段において、AD変換処理を除いた音声
    データの圧縮等の処理を前記音声処理手段で行うことを
    特徴とする情報処理システム。 19、特許請求の範囲第1項記載の情報処理システムに
    おける復号化手段において、DA変換処理を除いた音声
    データの伸長等の処理を前記音声処理手段で行うことを
    特徴とする情報処理システム。 20、前記情報処理手段は、前記音声処理用のウィンド
    ウの一つとして音声の編集に使用するウィンドウ(編集
    ウィンドウ)を前記音声データ処理要求時に前記位置入
    力手段から取り込んだ位置の近くでかつ前記表示手段の
    画面の枠内に配置する特許請求の範囲第1項記載の情報
    処理システム。 21、特許請求の範囲第4項記載の情報処理システムに
    おいて、前記情報処理手段は、録音および再生時に前記
    音声分析手段の出力を前記フレームの整数倍の間隔で取
    り込み、取り込む毎に音声の大きさを視覚的に前記編集
    ウィンドウ内に表示することを特徴とする情報処理シス
    テム。 22、特許請求範囲第6項記載の情報処理システムにお
    いて、前記情報処理手段は、録音時に音声分析手段の出
    力を前記フレームの整数倍の間隔で取り込み、取り込む
    毎に符号化した音声の有音・無音の区別と録音時間を前
    記編集ウィンドウに視覚化して同時に表示することを特
    徴とする情報処理システム。 23、特許請求の範囲第22項記載の符号化音声の表示
    において、前記情報処理手段は、前記編集ウィンドウ内
    に表示した有音部の表示位置とフレーズ音声データの記
    憶場所との対応関係を前記情報処理用記憶手段に格納し
    、使用者が前記位置入力手段等と前記編集ウィンドウを
    介して音声処理の対象をフレーム音声データ単位に指定
    できるようにしたことを特徴とする情報処理システム。 24、前記情報処理手段は、特許請求範囲第23項記載
    の処理において前記位置入力手段3等と前記編集ウィン
    ドウを介して前記音声処理の対象フレーズ音声データの
    範囲を指定できるようにしたことを特徴とする情報処理
    システム。 25、特許請求の範囲第22項記載の処理により表示さ
    れた前記編集ウィンドウ内のフレーズ音声データ表示部
    において、前記情報処理手段は、使用者によって指定さ
    れたフレーズ音声データ表示部の表示色を反転または変
    化させて強調することを特徴とする情報処理システム。 26、前記情報処理手段は、音声の録音および再生時の
    各種条件を前記ウィンドウ内に視覚的に表示し、該ウィ
    ンドウを介して前記文字入力手段または前記位置入力手
    段により入力または選択された条件で音声の録音および
    再生を行う特許請求の範囲第1項記載の情報処理システ
    ム。 27、特許請求範囲第26項記載の情報処理システムに
    おけるウィンドウを音声の録音および再生時の各種条件
    の設定専用とすることを特徴とする情報処理システム。 28、特許請求の範囲第26項記載の情報処理システム
    において、前記情報処理手段は、音声録音・再生条件を
    変更した後、前記ウィンドウを開いた時点の音声録音・
    再生条件を回復する機能を備えることを特徴とする情報
    処理システム。 29、前記情報処理手段は、予めシステムで定められて
    いる標準値で音声の録音および再生を行う特許請求の範
    囲第1項記載の情報処理システム。 30、特許請求の範囲第1項記載の情報処理システムに
    おいて、前記情報処理手段は、前記音声処理手段と前記
    分析手段等を用いて該システムの使用環境を測定し、こ
    れに基づいて有音・無音判定のための条件を求めること
    を特徴とする情報処理システム。 31、特許請求の範囲第26項、27項、28項、29
    項または第30項記載の情報処理システムにおいて前記
    情報処理手段は、設定された条件で音声の録音または再
    生を試行できる機能を備える特許請求範囲第1項記載の
    情報処理システム。 32、特許請求範囲第23項記載の情報処理システムに
    おいて、前記情報処理手段は、前記操作内容が音声デー
    タの移動であった場合、前記音声処理手段を制御して、
    前記音声処理用記憶手段と前記音声データ管理記憶手段
    内の処理によって指定された範囲のフレーズ音声データ
    を別に指定されたフレーズ音声データの前に移動させる
    と共に、これに合わせて前記編集ウィンドウに表示され
    ている音声データの表示と前記情報処理用記憶手段内の
    内容を修正することを特徴とする情報処理システム。 33、特許請求の範囲第23項記載の情報処理システム
    において、前記情報処理手段は、前記操作内容が音声デ
    ータの複写であった場合、前記音声処理手段を制御して
    、前記音声処理用記憶手段と前記音声データ管理記憶手
    段内の処理によって指定された範囲のフレーズ音声デー
    タを別に指定されたフレーズ音声データの前に複写させ
    ると共に、これに合わせて前記編集ウィンドウに表示さ
    れている音声データの表示と前記情報処理用記憶手段内
    の内容を修正することを特徴とする情報処理システム。 34、特許請求範囲第23または24項記載の情報処理
    システムにおいて、前記情報処理手段は、前記操作内容
    が音声データの挿入であった場合、挿入音声の入力処理
    を専用に行う挿入ウィンドウを別に開き、該挿入ウィン
    ドウにおいて挿入音声の入力処理を行った後、該挿入ウ
    ィンドウを閉じて、該挿入音声データを所定処理によっ
    て指定されたフレーズ音声データの前に挿入させると共
    に、これに合わせて前記編集ウィンドウに表示されてい
    る音声データの表示と前記情報処理用記憶手段内の内容
    を修正することを特徴とする情報処理システム。 35、特許請求の範囲第1項記載の情報処理システムに
    おいて、前記情報処理手段は、前記操作内容が音声デー
    タの回復であった場合、前記編集ウィンドウを開いた時
    点の音声データを前記音声処理用記憶手段と前記情報処
    理用記憶手段に再格納すると共に、前記編集ウィンドウ
    に該音声データを表示しなおすことを特徴とする情報処
    理システム。 36、前記情報処理手段は、前記編集ウィンドウを介し
    て使用者の編集終了を検知すると、前記音声処理用記憶
    手段を制御して録音した音声データと管理情報と録音・
    再生条件等を前記情報処理用記憶手段に読み出し、これ
    らの情報を更に前記ファイルに蓄積する特許請求の範囲
    第1項記載の情報処理システム。 37、前記音声処理手段を制御して、前記特許請求範囲
    第33項または第34項記載の情報処理システムにおい
    て、前記情報処理手段は、指定された範囲のフレーズ音
    声データを異なった方法で再生させることを特徴とする
    情報処理システム。 38、前記特許請求の範囲第37項記載の再生方法をポ
    ップアップメニューを用いて使用者に選択させることを
    特徴とする情報処理システム。 39、特許請求の範囲第1項記載の情報処理システムに
    音声の所在を示すアイコン等の目印を付す機能を更に備
    えた情報処理システムにおいて、該目印が音声の長さと
    再生時の残量を表わすことを特徴とする情報処理システ
    ム。 40、特許請求の範囲第1項記載の情報処理システムに
    音声の所在を示すアイコン等の目印を付す機能を更に備
    えた情報処理システムにおいて、該目印が音声処理に関
    するシステムの動作状態を表わすことを特徴とする情報
    処理システム。 41、特許請求の範囲第1項記載の情報処理システムに
    音声の所在を示すアイコン等の目印を付す機能を更に備
    えた情報処理システムにおいて、該目印が音声の発声者
    を表わすことを特徴とする情報処理システム。 42、特許請求の範囲第1項記載の情報処理システムに
    音声の所在を示すアイコン等の目印を付す機能を更に備
    えた情報処理システムにおいて、前記情報処理手段が前
    記入力手段からの情報に従って該目印の位置を移動させ
    る情報処理システム。 43、特許請求の範囲第1項記載の情報処理システムに
    音声の所在を示すアイコン等の目印を付す機能を更に備
    えた情報処理システムにおいて、前記情報処理手段が前
    記入力手段からの情報に従って該目印を表示文書から消
    すと共に、該目印が表わす音声データを前記音声処理用
    記憶手段と前記ファイル等から消去する情報処理システ
    ム。 44、特許請求の範囲第1項記載の情報処理システムに
    音声の所在を示すアイコン等の目印を付す機能を更に備
    えた情報処理システムにおいて、前記情報処理手段がウ
    ィンドウ内に複数の音声データに関する情報を表示し、
    この中で前記入力手段により選択された音声データを表
    示文書に付す情報処理システム。 45、特許請求の範囲第1項記載の情報処理システムに
    音声の所在を示すアイコン等の目印を付す機能を更に備
    えた情報処理システムにおいて、前記情報処理手段が前
    記位置入力手段により該目印が指定された時点で、該音
    声データを前記ファイル手段より読み出し、前記情報処
    理用記憶手段および前記音声処理用記憶手段に格納する
    情報処理システム。 46、前記情報処理手段がウィンドウ内に複数の音声デ
    ータに関する情報を表示し、そしてこの中で前記入力手
    段により選択された音声データを複写し、該音声データ
    を新しい音声ファイル名称で前記ファイル手段に蓄積す
    る特許請求の範囲第1項記載の情報処理システム。 47、前記情報処理手段は、別の編集ウィンドウにおい
    て指定された複数のフレーズ音声データを着目するウィ
    ンドウ内の指定された個所に複写する特許請求の範囲第
    1項記載の情報処理システム。 48、特許請求の範囲第30項記載の情報処理システム
    において前記情報処理手段は、前記表示手段上に表示さ
    れた音声のうち前記文字入力手段または前記位置入力手
    段により指定された複数の音声を制御して同時に再生さ
    せることを特徴とする情報処理システム。 49、特許請求の範囲第31項記載の情報処理システム
    において、前記情報処理手段は、前記表示手段上に表示
    された音声のうち前記文字入力手段または前記位置入力
    手段により指定された複数の音声を制御して指定された
    時点で直ちに再生させる特許請求範囲第1項記載の情報
    処理システム。 50、特許請求範囲第1項記載の情報処理システムにお
    いて、録音した音声データを階層的な構造で記憶するこ
    とを特徴とする情報処理システム。
JP14962889A 1989-06-14 1989-06-14 情報処理システム Pending JPH0315899A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP14962889A JPH0315899A (ja) 1989-06-14 1989-06-14 情報処理システム
EP19900111226 EP0402911A3 (en) 1989-06-14 1990-06-13 Information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14962889A JPH0315899A (ja) 1989-06-14 1989-06-14 情報処理システム

Publications (1)

Publication Number Publication Date
JPH0315899A true JPH0315899A (ja) 1991-01-24

Family

ID=15479381

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14962889A Pending JPH0315899A (ja) 1989-06-14 1989-06-14 情報処理システム

Country Status (2)

Country Link
EP (1) EP0402911A3 (ja)
JP (1) JPH0315899A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007047802A (ja) * 1994-10-12 2007-02-22 Touchtunes Music Corp デジタルオーディオビジュアル情報の記録及び再生のための家庭用機器
US8145999B1 (en) 1999-09-28 2012-03-27 Ricoh Co., Ltd. System and method for audio creation and editing in a multimedia messaging environment
US9047574B2 (en) 2006-02-09 2015-06-02 Dell Software Inc. Storage capacity planning

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2248371A (en) * 1990-09-27 1992-04-01 Fung Sidney Kwok On Electronic voice databank
EP0529729A1 (en) 1991-08-29 1993-03-03 Koninklijke Philips Electronics N.V. Device having functional means supported by ancillary message reproduction means
WO1993007562A1 (en) * 1991-09-30 1993-04-15 Riverrun Technology Method and apparatus for managing information
US5586216A (en) * 1992-09-25 1996-12-17 Apple Computer, Inc. Recording method and apparatus and audio data user interface
US5500919A (en) * 1992-11-18 1996-03-19 Canon Information Systems, Inc. Graphics user interface for controlling text-to-speech conversion
DE69425929T2 (de) * 1993-07-01 2001-04-12 Koninkl Philips Electronics Nv Fernbedienung mit Spracheingabe
CA2133877A1 (en) * 1993-10-25 1995-04-26 Mark A. Malamud Quick info windows and audio information cursors
JPH07219970A (ja) * 1993-12-20 1995-08-18 Xerox Corp 加速フォーマットでの再生方法及び再生装置
AU4160896A (en) * 1994-11-14 1996-06-06 Norris Communications Corp. Method for editing in hand held recorder
WO1996015523A1 (en) * 1994-11-15 1996-05-23 Norris Communications Corporation Method for playback in hand held recorder
WO1996015524A1 (en) * 1994-11-15 1996-05-23 Norris Communications Corp. Method for recording in hand-held recorder
GB9602701D0 (en) * 1996-02-09 1996-04-10 Canon Kk Image manipulation
US5960395A (en) 1996-02-09 1999-09-28 Canon Kabushiki Kaisha Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007047802A (ja) * 1994-10-12 2007-02-22 Touchtunes Music Corp デジタルオーディオビジュアル情報の記録及び再生のための家庭用機器
US8145999B1 (en) 1999-09-28 2012-03-27 Ricoh Co., Ltd. System and method for audio creation and editing in a multimedia messaging environment
US9047574B2 (en) 2006-02-09 2015-06-02 Dell Software Inc. Storage capacity planning

Also Published As

Publication number Publication date
EP0402911A2 (en) 1990-12-19
EP0402911A3 (en) 1992-05-27

Similar Documents

Publication Publication Date Title
JP3610083B2 (ja) マルチメディアプレゼンテーション装置および方法
JPH0315899A (ja) 情報処理システム
EP0887788B1 (en) Voice recognition apparatus for converting voice data present on a recording medium into text data
US5151998A (en) sound editing system using control line for altering specified characteristic of adjacent segment of the stored waveform
US8548618B1 (en) Systems and methods for creating narration audio
JP2593927B2 (ja) オ−ディオデ−タ処理装置
US5526407A (en) Method and apparatus for managing information
KR0138002B1 (ko) 객체 지향 사용자 인터페이스 내에 다중 매체 프리젠테이션을 통합시키기 위한 방법 및 시스템
JP3142803B2 (ja) テキストを音声に変換するシンセサイザ
CN106971749A (zh) 音频处理方法及电子设备
JPH09185879A (ja) レコーディング・インデクシング方法
JP4741406B2 (ja) ノンリニア編集装置およびそのプログラム
JP3279684B2 (ja) 音声インタフェース・ビルダ・システム
JP2001272990A (ja) 対話記録編集装置
JP6506438B1 (ja) 音声合成装置
KR100383194B1 (ko) 미디어 파일 재생 방법
JP2020154057A (ja) 音声データのテキスト編集装置及び音声データのテキスト編集方法
KR100473163B1 (ko) 멀티미디어 컨텐츠가 저장된 기록 매체 및 그 재생을 위한장치와 방법
JPH0375699A (ja) 音声編集方法及び装置
Ingram et al. Digital data collection and analysis
JPH06119401A (ja) サウンドデータ関連情報表示システム
JP2574749B2 (ja) 文書処理装置
JPH0449714B2 (ja)
JP2007219219A (ja) 語学学習用電子機器および学習用文章リスト作成方法
KR100563320B1 (ko) 단일 메모리를 갖는 어학학습장치 및 그 제어방법