JP2000181492A - 音声情報処理装置および音声情報を処理するための処理プログラムを記録した記録媒体 - Google Patents

音声情報処理装置および音声情報を処理するための処理プログラムを記録した記録媒体

Info

Publication number
JP2000181492A
JP2000181492A JP10357637A JP35763798A JP2000181492A JP 2000181492 A JP2000181492 A JP 2000181492A JP 10357637 A JP10357637 A JP 10357637A JP 35763798 A JP35763798 A JP 35763798A JP 2000181492 A JP2000181492 A JP 2000181492A
Authority
JP
Japan
Prior art keywords
information
audio data
data file
voice
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10357637A
Other languages
English (en)
Inventor
Hiroshi Koge
浩 高家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP10357637A priority Critical patent/JP2000181492A/ja
Publication of JP2000181492A publication Critical patent/JP2000181492A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 本発明は、音声データファイルの確認または
検索を簡単に行うことができる音声情報処理装置を提供
する。 【解決手段】 装置本体1の中央処理装置1aは、第1
記録媒体駆動部6を介して第1の記録媒体7から音声デ
ータファイル処理をする制御プログラムを読み込むとと
もに、第2記録媒体駆動部8を介して第2の記録媒体9
から取り込まれる音声データファイルの所定範囲の始端
部から第1の時間が経過後第2の時間が経過するまでに
無音情報が所定時間連続して検出されるときは該無音情
報の位置を終端部と判定し、無音情報が所定の時間継続
して検出されないときは第2の時間が経過した時点を終
端部と判定し、この判定により得られた終端部を用いて
音声データファイルの始端部から終端部までの音声認識
を行ない、認識結果を表示装置3に表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、プログラムされた
コンピュータによって音声情報の処理を制御する音声情
報処理装置および音声情報を処理するための処理プログ
ラムを記録した記録媒体に関する。
【0002】
【従来の技術】従来、音声情報処理装置として、音声情
報の再生手段が知られており、この再生手段には、複数
の音声データファイルについて、各音声データファイル
中の所定範囲の情報を、指定された再生順にしたがって
順時再生するようにしたものが実用化されている。
【0003】
【発明が解決しようとする課題】ところが、このように
したものでは、音声データファイルの内容を事前に確認
したいような場合も、実際にファイルを再生して内容を
聞かなければ確認するのが難しく、また、目的とする音
声データファイルを見つけ出すにも、録音日時、録音時
間長、重要度などしか目印となり得るものがないため、
ファイル数が多くなると、多大な時間が掛かってしま
い、また、キーワードなどを用いての検索もできないな
どの問題があった。
【0004】本発明は、上記事情に鑑みてなされたもの
で、ファイルの確認または検索を簡単に行うことができ
る音声情報処理装置を提供することを目的とする。
【0005】
【課題を解決するための手段】請求項1記載の発明は、
一つ、あるいは複数の音声データファイル中の無音情報
を検出する無音情報検出手段と、上記無音情報検出手段
により上記音声データファイルの所定の範囲の始端部か
ら第一の時間が経過後第二の時間が経過するまでに無音
情報が所定時間連続して検出されるときは該無音情報の
位置を終端部と判定し、上記無音情報が所定の時間継続
して検出されないときは上記第二の時間が経過した時点
を終端部と判定する終端部判定手段と、上記始端部から
終端部までの音声認識を行なう音声認識手段と、上記音
声認識手段で音声認識された情報を音声データファイル
のインデックス情報として表示する表示手段とにより構
成している。
【0006】請求項2記載の発明は、一つ、あるいは複
数の音声データファイル中の無音情報を検出する無音情
報検出手段と、上記無音情報検出手段により上記音声デ
ータファイルの所定の範囲の始端部から第一の時間が経
過後第二の時間が経過するまでに無音情報が所定時間連
続して検出されるときは該無音情報の位置を終端部と判
定し、上記無音情報が所定の時間継続して検出されない
ときは上記第二の時間が経過した時点を終端部と判定す
る終端部判定手段と、上記始端部から終端部までの音声
認識を行なう音声認識手段と、上記音声認識手段で音声
認識された情報を音声データファイルのインデックス情
報として上記音声データファイルへ記録するインデック
ス情報記録手段とにより構成している。
【0007】請求項3記載の発明は、請求項1記載の発
明において、上記表示手段は、複数の音声データファイ
ルのインデックス情報を同時に表示することが可能であ
ることを特徴としている。
【0008】請求項4記載の発明は、請求項1記載の発
明において、インデックスマーク検出手段を有し、所定
範囲の始端部がインデックスマークの存在する位置であ
ることを特徴としている。
【0009】請求項5記載の発明は、コンピュータによ
って音声の情報処理をするための処理プログラムを記録
した記録媒体であって、一つ、あるいは複数の音声デー
タファイルについて、所定の範囲の始端部から第一の時
間が経過後第二の時間が経過するまでに無音情報が所定
時間連続して検出されるときは該無音情報の位置を終端
部と判定し、上記無音情報が所定の時間継続して検出さ
れないときは上記第二の時間が経過した時点を終端部と
判定し、これらの結果に基づいて上記始端部から終端部
までの音声認識を行なうとともに、この音声認識された
情報を音声データファイルのインデックスとして表示さ
せることを特徴としている。
【0010】この結果、請求項1および2記載の発明に
よれば、各音声データファイルについて音声認識処理に
よりインデックス情報としてテキスト情報などを付加で
きるので、音声データファイルの内容を実際に聞くこと
なく簡単に確認できるとともに、文字検索などが可能に
なって、ファイル検索や管理を簡単にできる。また、音
声データファイルの始端部から無音部分まで、または無
音部が存在しない場合は、始端部から所定時間経過した
時点を終端部と判定して、この間でのみで音声認識を行
うようにしているので、無駄な音声認識を省くことがで
き、認識率を高めることもできる。
【0011】請求項3記載の発明によれば、複数の音声
データファイルのインデックス情報を同時に表示できる
ので、各音声データファイルの内容を簡単に確認でき
る。
【0012】請求項4記載の発明によれば、インデック
スマークから音声データファイルの始端部を指定できる
ので、各音声データファイルについて能率よく音声認識
処理を行うことができる。
【0013】請求項5記載の発明による記録媒体によっ
ても、請求項1記載の発明と同様な作用を実現できる。
【0014】
【発明の実施の形態】以下、本発明の実施の形態を図面
に従い説明する。
【0015】図1は、本発明が適用される音声情報処理
装置の概略構成を示している。図において、1は装置本
体で、この装置本体1は、音声データの処理やその制御
をするために演算等を行うCPU等の中央処理装置1a
を有するとともに、この中央処理装置1aに接続される
操作部2、表示装置3、音声出力装置4および入出力装
置5を有している。
【0016】ここで、操作部2は、音声データの処理な
どを行う際に、所望する指示を行うためのキーボード、
マウスなどのポインティング・デバイスなどからなって
いる。表示装置3は、中央処理装置1aによって行う音
声データの再生処理などの操作部の表示や音声ファイル
の一覧の表示を行うもので、CRTディスプレイや液晶
ディスプレイからなっている。音声出力装置4は、中央
処理装置1aによって得られる音声データの処理結果な
どを音声として出力するスピーカなどからなっている。
そして、入出力装置5は、中央処理装置1aに対して情
報、データなどの入出力を行うためのもので、ここで
は、第1記録媒体駆動部6と第2記録媒体駆動部8を有
している。
【0017】第1記録媒体駆動部6は、音声データの処
理をするための処理プログラムやその制御をするための
制御プログラムが記憶されたフロッピー(登録商標)デ
ィスク、CD−ROMなどの第1の記録媒体7を装着
し、この第1の記録媒体7に記録された制御プログラム
を読み込むようにしている。なお、第1の記録媒体7と
しては、任意に情報やデータの書き換えが可能なRAM
を用いてもよい。
【0018】また、第2記録媒体駆動部8は、音声デー
タが記録されたPCカード、メモリカード、小型ICカ
ードなどの第2の記録媒体9を装着し、この第2の記録
媒体9に記録された音声データなどを読み込んだり、中
央処理装置1aによって処理された音声データなどを記
録するようにしている。
【0019】なお、第2記録媒体駆動部8として、例え
ば第2記録媒体9であるPCカードを装着して第2の記
録媒体9に記録された音声データなどを読み込むPCカ
ード駆動装置を適用した場合、図2に示すようなPCカ
ードアダプタ10を用意することによって一般的なPC
カード以外の小型ICカード9aを用いることもでき
る。
【0020】この場合、PCカードアダプタ10は、そ
の外形形状および寸法を一般的なPCカードと同様に形
成するとともに、その一方の面に、小型ICカード9a
とほぼ同形状の凹部からなる同小型ICカード9aの装
着部10aを形成している。そして、装着部10aの内
壁面の一辺に、小型ICカード9aの先端面を、図2の
矢印X1方向に向けて当接させた状態で、同小型ICカ
ード9aの後端面を矢印X2方向に向けて差し込むこと
で、小型ICカード9aを装着部10aに装着できるよ
うになっている。この装着状態で、小型ICカード9a
とPCカードアダプタ10は、電気的に接続される。
【0021】このようにして、小型ICカード9aが装
着されたPCカードアダプタ10を矢印X方向から第2
記録媒体駆動部8であるPCカード駆動装置の挿入スロ
ット(図示せず)に挿入し装着すれば、一般的なPCカ
ードと同様に、小型ICカード9aに記録された音声デ
ータの読み込みなどの処理を行うことができる。
【0022】次に、音声データの処理を制御するための
制御プログラム、つまり、プログラムされたコンピュー
タによって動作する制御プログラムの操作画面について
説明する。
【0023】この場合、制御プログラムは、表示装置3
に対してファイル単位の音声データに関する詳細な情報
である音声データファイルの一覧表示とともに、音声デ
ータの再生処理をするための各種操作部を表示する第1
の画面11と、音声データファイルの一覧表示を含まな
い音声データの再生処理をするための操作部のみを表示
する再生操作専用の第2の画面16を選択的に表示する
ようにしている。
【0024】第1の画面11は、各種機能を指定してコ
ンピュータに指示を与える各種コマンドを実行させるた
めの複数の操作部によって形成されており、ここでは、
選択できる各種処理コマンドの一覧を文字などによって
表示する領域であるメニューバー12、このメニューバ
ー12の真下に配置され、頻繁に利用する機能を素早く
起動するために、各種処理コマンドの機能などを図柄、
絵文字によって表示したアイコン付きのボタンを並べて
表示した領域であるツールバー13、複数のファイル情
報が一覧表示される音声ファイルリストボックス14お
よび再生操作に関する各種操作を行わしめるためのボタ
ンを並べて配置した再生コントロール部15を有してい
る。
【0025】ツールバー13は、各種コマンドのボタン
としての操作性を考慮して図柄、絵文字などによって表
したアイコン付きのボタンを表示しており、第2の画面
16を表示させるための表示選択手段である画面切換え
ボタン13aと一覧表示される音声データファイルの認
識処理を指示する認識処理指示ボタン13bを有してい
る。なお、その他のボタンの詳細については、本発明に
直接関係ないので、説明は省略するとともに、図面の繁
雑化を避けるためボタンのみを図示して、具体的なアイ
コンなどの表示を省略している。
【0026】音声ファイルリストボックス14は、図3
に示す音声データファイルの一覧表示画面141と、図
5に示す各音声データファイルの認識結果のテキスト情
報画面142を切換え表示可能にしている。
【0027】このうち図3に示す音声データファイルの
一覧表示画面141は、音声データファイルの一覧が表
示され、各音声データファイルについての各種情報とし
て、例えばファイル名、記録時間長さ、記録日時、重要
度、終了マークなどの固有の情報を表示している。
【0028】また、これら各項目名の表示部分に対応さ
せて[File Name]ボタン14a、[Leng
th]ボタン14b、[RecDate/Time]ボ
タン14cを表示していて、これらのボタンを任意に選
択操作することにより、選択した項目での所定の順番に
よるファイルの並び替えできるようになっている。さら
に、[Priority]ボタン14d、優先順位付加
ボタン14e、マーク付加用ボタン14f、[End]
ボタン14gを表示していて、音声データファイルの一
覧表示のうち、各音声データファイルの重要度情報を各
ファイルごとに任意に設定したり、終了マーク14hの
付加操作などができるようになっている。つまり、重要
度情報の設定は、設定したい所望の音声データファイル
を選択し、この選択ファイルの欄を高輝度表示(ハイラ
イト表示または反転表示)させた後、優先順位付加ボタ
ン14eにより優先順位(重要度)の指数を、例えば0
〜15の数字の範囲で指定することで、優先順位に応じ
た数字を表示させるようにしている。また、[Prio
rity]ボタン14dを操作することで、設定された
重要度の高い順番で音声データファイルの一覧表示の並
び替えが実行される。さらに、一覧表示される各音声デ
ータファイルには、例えば「V」マークや「x」マーク
などの終了マーク14hを付加できるようになってい
る。この終了マーク14hを音声データファイルに付加
するには、上述したと同様に所望の音声データファイル
を高輝度表示(ハイライト表示または反転表示)させた
後、マーク付加用ボタン14fを操作するようにしてい
る。ここで、マーク付加用ボタン14fは、いわゆるト
グル式になっており、操作するごとに終了マーク14h
が付加または削除が選択できるようになっている。
【0029】そして、[End]ボタン14gを操作す
ることにより、終了マーク14hが付加されている音声
データファイル欄は、一覧表示の最下段(最後部)位置
に移動して、ファイルの並び替えが行われるようになっ
ている。
【0030】また、図3に示す音声データファイルの一
覧表示画面141に代わる図5に示すテキスト情報画面
142は、音声データファイル名と認識結果のテキスト
情報を表示するようにしている。このテキスト情報画面
142は、ユーザの切換え操作、例えば、ツールバー1
3中の図示しないボタンの操作により一覧表示画面14
1と交互に切換え表示できるようになっている。
【0031】図3に戻って、再生コントロール部15
は、再生操作に関する各種操作を行わしめるためのボタ
ンとして、例えば、選択されている音声データファイル
中において現在のデータ位置より前の任意のデータ位置
に戻すための戻しボタン15a、再生動作を停止させる
停止ボタン15b、再生動作を開始させる再生ボタン1
5c、現在のデータ位置より後の任意のデータ位置に進
めるための早送りボタン15d、上述した終了マーク1
4hが付加されている音声データファイルをスキップさ
せるためのスキップ手段や再生移行手段の動作をさせる
ためのスキップボタン15e、再生速度の調整を行うた
めのスライドバーからなる再生速度コントロール部15
f、音量調整を行うためのボリュームコントロール部1
5gを表示し、さらに、選択されている音声データファ
イルの全記録時間長を時分秒で表示する全記録時間長表
示部15h、現在位置を時分秒で表示する現在位置表示
部15iおよび現在位置をスライドバーで表示する現在
位置指標15jを表示している。
【0032】一方、再生操作専用の第2の画面16は、
上述した再生コントロール部15で述べた戻しボタン1
5a、停止ボタン15b、再生ボタン15c、早送りボ
タン15d、スキップボタン15eを表示するととも
に、再生速度コントロール部15f、ボリュームコント
ロール部15gに代わるアイコン付きのボタン15f
f、15ggを表示し、さらに、現在の音声データファ
イルから次の音声データファイルの先頭部に直接移動さ
せるための[Next]ボタン17および第1の画面1
1に戻るための選択表示手段であるメイン[Main]
ボタン18を表示している。
【0033】次に、このように構成した実施の形態の動
作を説明する。
【0034】この場合、制御プログラムにより一覧表示
された各音声データファイル中の所定箇所を音声認識し
てインデックス化する動作を説明する。まず、操作部2
により音声認識処理モードを設定すると、装置本体1の
中央処理装置1aは、第1記録媒体駆動部6を介して第
1の記録媒体7から音声データファイル処理をするため
の制御プログラムを図示しないRAMに読み込むととも
に、第2記録媒体駆動部8を介して第2の記録媒体9に
記録されている音声データファイルを図示しない固定記
録媒体に取り込み、図6に示す音声認識処理モードが実
行される。
【0035】まず、ステップ601で、制御プログラム
により、ファイル単位の音声データに関する詳細な情報
である音声データファイルの一覧表示とともに、音声デ
ータの再生処理をするための各種操作部を表示する図3
に示す第1の画面11が表示される。この場合、第1の
画面11の音声ファイルリストボックス14には、ファ
イル単位の音声データに関する詳細な情報である複数の
音声データファイルの一覧表示画面141が表示されて
いる。
【0036】この状態から、まず、一覧表示中の先頭の
音声データファイルが選択される。そして、ステップ6
02で、ツールバー13の音声データファイルの認識処
理を指示する認識処理指示ボタン13bが操作されたか
を判断し、ここで操作されていれば、ステップ603
で、選択された音声データファイル中の所定範囲の音声
データについて、該範囲の始端部から認識処理が実行さ
れる。
【0037】そして、ステップ604で、所定時間(少
なくとも認識結果からファイル内容が把握できる程度の
時間)以上の認識処理が実行されると、ステップ605
で、選択された音声データファイル中で所定時間以上の
無音部分が存在するかを判断する。この場合、無音部分
の判断は、音声データファイルを構成するフレーム(デ
ータ圧縮最小単位)単位の音声データに付加されている
フラグの状態から無音部分を検出するとともに、中央処
理装置1aに内蔵される図示しないタイマにより時間を
計測するか、あるいは無音フレームの数をカウントする
ことによって、所定時間以上の無音部分の存在を判断し
ている。
【0038】ここで、所定時間以上の無音部分が存在し
ない場合は、ステップ606で、音声データファイルの
先頭位置から一定時間(ステップ604の所定時間に比
べて十分に長く設定しておけば、無音部分の存在が検出
される可能性は高くなるので好ましい。)の認識処理を
行ったか否かを判断する。ここで、一定時間に達しない
場合は、ステップ605に戻り、同じ動作が繰り返し実
行される。
【0039】その後、ステップ605で、所定時間以上
の無音部分の存在を判断した場合、またはステップ60
6で、先頭から一定時間認識処理を行った場合は、ステ
ップ607で、インデックスマークが存在するかを判断
し、存在する場合は、ステップ608で、インデックス
マークの位置へ移行してステップ604に戻り、インデ
ックスマークの付されている部分の認識処理が行われ
る。
【0040】一方、ステップ607で、インデックスマ
ークが存在しない場合は、ステップ609に進み、認識
処理の結果として得られたテキストデータをインデック
スとして音声データファイルに保存する。そして、ステ
ップ610で、次ファイルが存在するか判断する。この
場合、一覧表示画面141では、次ファイルが存在して
いるので、ステップ611で、次ファイルとして、一覧
表示中の次の音声データファイルが選択され、ステップ
604に戻って、上述したと同様な動作が繰り返し実行
される。
【0041】その後、一覧表示画面141上の全ての音
声データファイルに対する認識処理が終了し、ステップ
610で、次のファイルが存在しないと判断すると、ス
テップ612で、処理を終了する。
【0042】図7は、音声データファイルの認識処理結
果であるテキストデータの保存方法を示している。この
場合、音声データファイル100は、インデックス情報
領域第1ブロック101、インデックス情報領域第2ブ
ロック102および音声データ領域103を有してい
て、このうちの、インデックス情報領域第2ブロック1
02に認識結果のテキストデータを保存するようにして
いる。このインデックス情報領域第2ブロック102
は、さらに管理コード102a、ファイルテキスト基本
領域102b、ファイルテキスト予備領域102cを有
していて、管理コード102aには、認識処理の終了、
訂正処理済みなどの管理情報を保存し、ファイルテキス
ト基本領域102bには、音声データファイルの先頭か
らの認識結果を保存し、ファイルテキスト予備領域10
2cには、インデックスマーク直後からの認識結果を保
存している。
【0043】また、このようにして各音声データファイ
ル100に保存されたテキストデータは、図5に示すテ
キスト情報画面142に表示することができる。この場
合、第1の画面11に図3に示す音声データファイルの
一覧表示画面141が表示されている状態から、ツール
バー13の図示しないボタンを操作すると、一覧表示画
面141に代わって、図5に示すテキスト情報画面14
2が表示される。このテキスト情報画面142は、各音
声データファイルの名前とともに、音声認識結果のテキ
ストデータを表示しており、これら音声データファイル
ごとのテキストデータから各音声データファイルの内容
を確認することができる。
【0044】従って、このようにすれば、各音声データ
ファイルごとに音声認識を行ない、それぞれインデック
ス情報としてテキスト情報を付加できるようにしたの
で、音声データファイルの内容を事前に確認したいよう
な場合、実際にファイルを再生して内容を聞かなくと
も、ファイル内容を簡単に確認することができる。ま
た、テキスト情報を用いることで、文字検索などを簡単
に行なうことができ、ファイル検索や管理を簡単にでき
る。
【0045】音声データファイルの始端部から無音部分
まで、または無音部が存在しない場合は、始端部から所
定時間経過した時点を終端部と判定して、この間でのみ
で音声認識を行うようにしているので、無駄な音声認識
を省くことができ、認識率を高めることができる。ま
た、このように認識範囲を制限し、テキスト情報を最小
限にすることは、ファイル容量の無駄も無くし、効率の
よい作業を実現できる。また、音声データファイルの始
端部から無音部分までを一区切りとすることで、言葉の
途中でとぎれて認識処理が不能になるようなトラブル原
因を皆無にでき、確実に必要と思われる部分のみのテキ
スト情報を得ることが可能になる。
【0046】複数の音声データファイルのインデックス
情報を同時に表示しているので、各音声データファイル
の内容を簡単に確認できる。
【0047】各音声データファイルの始端部から音声認
識処理を行なうことができるので、音声データファイル
の内容を把握するのに最適なテキスト情報が得られる。
【0048】インデックスマークから音声データファイ
ルの始端部を指定できるので、各音声データファイルに
ついて能率よく音声認識処理を行うことができる。
【0049】一方、このようにしたものは、音声メール
への応用も可能である。通常、音声メールを送る場合
は、テキスト文章ファイルに音声情報を添付して送る
が、音声メールを直接送るにしても音声情報と別にタイ
トル文字は自分で入力する必要がある。そこで、上述し
た音声認識方法を利用して音声情報の頭部分にメールの
タイトルとなる音声を記録しておき、これを認識させる
ことにより、音声メールのタイトルも自動的にテキスト
文字で付加することが可能になり、音声メールとしての
便利さをさらに増すことができる。
【0050】なお、上述した実施の形態では、音声デー
タファイルを構成するフレームのデータが有音(音声)
であるか無音(非音声)であるかを識別するためのフラ
グなどの情報は、記録時に判断して付加されるようにな
っているが、こうした識別情報が付加されていない音声
データを認識する場合は、その認識を行なうときに、音
声信号のレベルに基づいて有音(音声)であるか無音
(非音声)であるかを判定するようにしてもよい。
【0051】なお、本明細書、図面に記載の発明には、
以下の発明も含まれる。
【0052】(1)一つ、あるいは複数の音声データフ
ァイルについて、所定の範囲の始端部から第一の時間が
経過後第二の時間が経過するまでに無音情報が所定時間
連続して検出されるときは該無音情報の位置を終端部と
判定し、上記無音情報が所定の時間継続して検出されな
いときは上記第二の時間が経過した時点を終端部と判定
し、これらの結果に基づいて上記始端部から終端部まで
の音声認識を行なうとともに、この音声認識された情報
を音声データファイルのインデックス情報として表示さ
せることを特徴とする音声情報処理方法。
【0053】(2)一つ、あるいは複数の音声データフ
ァイルについて、所定の範囲の始端部から第一の時間が
経過後第二の時間が経過するまでに無音情報が所定時間
連続して検出されるときは該無音情報の位置を終端部と
判定し、上記無音情報が所定の時間継続して検出されな
いときは上記第二の時間が経過した時点を終端部と判定
し、これらの結果に基づいて上記始端部から終端部まで
の音声認識を行なうとともに、この音声認識された情報
を音声データファイルのインデックス情報として上記音
声データファイルへ記録させることを特徴とする音声情
報処理方法。
【0054】
【発明の効果】以上述べたように本発明によれば、音声
ファイルの内容確認または検索を簡単に行うことができ
る。
【図面の簡単な説明】
【図1】本発明の一実施の形態の概略構成を示す図。
【図2】一実施の形態に用いられるPCカードアダプタ
の概略構成を示す図。
【図3】一実施の形態の第1の画面の表示例を示す図。
【図4】一実施の形態の第2の画面の表示例を示す図。
【図5】一実施の形態のテキスト情報画面の表示例を示
す図。
【図6】一実施の形態の動作を説明するためのフローチ
ャート。
【図7】一実施の形態に用いられるテキストデータの保
存方法を示す図。
【符号の説明】
1…装置本体 1a…中央処理装置 2…操作部 3…表示装置 4…音声出力装置 5…入出力装置 6…第1記録媒体駆動部 7…第1の記録媒体 8…第2記録媒体駆動部 9…第2の記録媒体 9a…ICカード 10…PCカードアダプタ 10a…装着部 11…第1の画面 12…メニューバー 13…ツールバー 13a…画面切換えボタン 13b…認識処理指示ボタン 14…音声ファイルリストボックス 141…一覧表示画面 142…テキスト情報画面 14a…[File Name]ボタン 14b…[Length]ボタン 14c…[RecDate/Time]ボタン 14d…[Priority]ボタン 14e…優先順位付加ボタン 14f…マーク付加用ボタン 14g…[End]ボタン 14h…終了マーク 15…再生コントロール部 15a…戻しボタン 15b…停止ボタン 15c…再生ボタン 15d…早送りボタン 15e…スキップボタン 15f…再生速度コントロール部 15g…ボリュームコントロール部 15h…全記録時間長表示部 15i…現在位置表示部 15j…現在位置指標 16…第2の画面 17…[Next]ボタン 18…[Main]ボタン

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 一つ、あるいは複数の音声データファイ
    ル中の無音情報を検出する無音情報検出手段と、 上記無音情報検出手段により上記音声データファイルの
    所定の範囲の始端部から第一の時間が経過後第二の時間
    が経過するまでに無音情報が所定時間連続して検出され
    るときは該無音情報の位置を終端部と判定し、上記無音
    情報が所定の時間継続して検出されないときは上記第二
    の時間が経過した時点を終端部と判定する終端部判定手
    段と、 上記始端部から終端部までの音声認識を行なう音声認識
    手段と、 上記音声認識手段で音声認識された情報を音声データフ
    ァイルのインデックス情報として表示する表示手段とを
    具備したことを特徴とする音声情報処理装置。
  2. 【請求項2】 一つ、あるいは複数の音声データファイ
    ル中の無音情報を検出する無音情報検出手段と、 上記無音情報検出手段により上記音声データファイルの
    所定の範囲の始端部から第一の時間が経過後第二の時間
    が経過するまでに無音情報が所定時間連続して検出され
    るときは該無音情報の位置を終端部と判定し、上記無音
    情報が所定の時間継続して検出されないときは上記第二
    の時間が経過した時点を終端部と判定する終端部判定手
    段と、 上記始端部から終端部までの音声認識を行なう音声認識
    手段と、 上記音声認識手段で音声認識された情報を音声データフ
    ァイルのインデックス情報として上記音声データファイ
    ルへ記録するインデックス情報記録手段とを具備したこ
    とを特徴とする音声情報処理装置。
  3. 【請求項3】 上記表示手段は、複数の音声データファ
    イルのインデックス情報を同時に表示することが可能で
    あることを特徴とする請求項1記載の音声情報処理装
    置。
  4. 【請求項4】 インデックスマーク検出手段を有し、所
    定範囲の始端部がインデックスマークの存在する位置で
    あることを特徴とする請求項1記載の音声情報処理装
    置。
  5. 【請求項5】 コンピュータによって音声の情報処理を
    するための処理プログラムを記録した記録媒体であっ
    て、 一つ、あるいは複数の音声データファイルについて所定
    の範囲の始端部から第一の時間が経過後第二の時間が経
    過するまでに無音情報が所定時間連続して検出されると
    きは該無音情報の位置を終端部と判定し、上記無音情報
    が所定の時間継続して検出されないときは上記第二の時
    間が経過した時点を終端部と判定し、これらの結果に基
    づいて上記始端部から終端部までの音声認識を行なうと
    ともに、この音声認識された情報を音声データファイル
    のインデックスとして表示させることを特徴とする音声
    の情報処理をするための処理プログラムを記録した記録
    媒体。
JP10357637A 1998-12-16 1998-12-16 音声情報処理装置および音声情報を処理するための処理プログラムを記録した記録媒体 Pending JP2000181492A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10357637A JP2000181492A (ja) 1998-12-16 1998-12-16 音声情報処理装置および音声情報を処理するための処理プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10357637A JP2000181492A (ja) 1998-12-16 1998-12-16 音声情報処理装置および音声情報を処理するための処理プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2000181492A true JP2000181492A (ja) 2000-06-30

Family

ID=18455143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10357637A Pending JP2000181492A (ja) 1998-12-16 1998-12-16 音声情報処理装置および音声情報を処理するための処理プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2000181492A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003255982A (ja) * 2002-02-28 2003-09-10 Fujitsu Ltd 音声認識システムおよび音声ファイル記録システム
CN112420044A (zh) * 2020-12-03 2021-02-26 深圳市欧瑞博科技股份有限公司 语音识别方法、语音识别装置及电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003255982A (ja) * 2002-02-28 2003-09-10 Fujitsu Ltd 音声認識システムおよび音声ファイル記録システム
US7979278B2 (en) 2002-02-28 2011-07-12 Fujitsu Limited Speech recognition system and speech file recording system
CN112420044A (zh) * 2020-12-03 2021-02-26 深圳市欧瑞博科技股份有限公司 语音识别方法、语音识别装置及电子设备

Similar Documents

Publication Publication Date Title
JP3163119B2 (ja) 記録再生装置
JPH10340180A (ja) 音声データの処理制御装置及び音声データの処理を制御するための制御プログラムを記録した記録媒体
KR100271886B1 (ko) 정보 기록 매체 및 그 매체를 사용하기 위한 정보 재생 장치
JP2000181492A (ja) 音声情報処理装置および音声情報を処理するための処理プログラムを記録した記録媒体
JP2007165959A (ja) 画像表示装置
JP4174838B2 (ja) 記録再生装置
JP2002344849A (ja) 動画像処理装置、動画像処理方法、記録媒体、及び制御プログラム
JP4148250B2 (ja) コンテンツ情報表示装置およびそのプログラム
JP2006208866A (ja) 再生装置
JP3852427B2 (ja) コンテンツデータ処理装置及びプログラム
JP2007219219A (ja) 語学学習用電子機器および学習用文章リスト作成方法
US8001164B2 (en) Method for providing file information in portable device
JPH08160989A (ja) サウンドデータリンク編集方法
JP2008257609A (ja) 電子書籍再生装置
JP2001042893A (ja) 音声認識装置および音声認識処理をするための処理プログラムを記録した記録媒体
KR20080039704A (ko) 휴대용 오디오 플레이어 및 그 제어 방법
JP2007048391A (ja) 操作信号処理装置およびコンテンツ選択装置
JPH1166825A (ja) 音声再生装置
JP2005285274A (ja) タイトル表示情報生成装置
JPH07191978A (ja) 文書処理装置
JPH05108608A (ja) 情報信号処理装置
JP3496614B2 (ja) オーディオシステム機器
JP2002312154A (ja) 画面記録再生装置
JP2000163093A (ja) 音声再生装置
JP2000259181A (ja) 音声情報認識装置、音声情報認識方法、音声情報の認識をするためのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080729

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081028

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090303