JPH10340179A - 音声認識処理装置及び音声認識処理プログラムを記録した記録媒体 - Google Patents

音声認識処理装置及び音声認識処理プログラムを記録した記録媒体

Info

Publication number
JPH10340179A
JPH10340179A JP9149729A JP14972997A JPH10340179A JP H10340179 A JPH10340179 A JP H10340179A JP 9149729 A JP9149729 A JP 9149729A JP 14972997 A JP14972997 A JP 14972997A JP H10340179 A JPH10340179 A JP H10340179A
Authority
JP
Japan
Prior art keywords
data
recording medium
voice
processing program
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9149729A
Other languages
English (en)
Other versions
JP3905181B2 (ja
Inventor
Takashi Onishi
孝史 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP14972997A priority Critical patent/JP3905181B2/ja
Priority to US09/088,996 priority patent/US6353809B2/en
Priority to EP98110264A priority patent/EP0887788B1/en
Priority to DE69829802T priority patent/DE69829802T2/de
Publication of JPH10340179A publication Critical patent/JPH10340179A/ja
Application granted granted Critical
Publication of JP3905181B2 publication Critical patent/JP3905181B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 所定の記録媒体に記録された音声データを音
声認識する音声認識処理装置及び音声認識処理プログラ
ムを記録した記録媒体を提供する。 【解決手段】 コンピュータ1のCPU1aで、音声認
識処理プログラムを記録した第1記録媒体7より音声認
識処理プログラムを読み込み、この音声認識処理プログ
ラムに沿って、音声データが記録された第2記録媒体1
0から音声データを読み込み、音声認識してテキストデ
ータに変換し、上記テキストデータを表示装置3に表示
せしめる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識処理装置
及び音声認識処理プログラムを記録した記録媒体、詳し
くは、プログラムされたコンピュータによって音声認識
処理をする音声認識処理装置及びコンピュータによって
音声認識処理をするための処理プログラムを記録した音
声認識処理プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】近年、音声認識技術の研究は盛んに行わ
れており、リアルタイムで音声を認識できる技術手段も
提案され、種々の製品に利用されるに至っている。例え
ば電話でのチケット予約やカーナビゲーションの音声コ
マンド等がこれに該当する。また、パーソナルコンピュ
ータの性能向上によってパーソナルコンピュータ用のア
プリケーションソフトのうち音声認識を可能とするソフ
トウェアも知られている。
【0003】近年発売されたIBM社のVoice T
ype3.0 for Windows95はマイクか
ら入力した音声をリアルタイムにテキストデータに変換
するというもので認識率もかなり高いものとなってい
る。
【0004】
【発明が解決しようとする課題】しかしながら、上記ア
プリケーションソフトは入力する手段としてはマイクか
らの入力だけで、すでに存在している音声ファイルを直
接認識処理することはできないという問題点があった。
【0005】本発明はかかる問題点に鑑みてなされたも
のであり、所定の記録媒体に記録された音声データを音
声認識する音声認識処理装置及び音声認識処理プログラ
ムを記録した記録媒体を提供することを目的とする。
【0006】
【課題を解決するための手段】上記の目的を達成するた
めに本発明の第1の音声認識処理装置は、プログラムさ
れたコンピュータによって音声認識処理をする装置であ
って、音声データが記録された音声データ用記録媒体か
ら音声データを読み込む音声データ読込手段と、上記音
声データを音声認識してテキストデータに変換する音声
認識処理手段と、上記テキストデータを表示する表示手
段と、を具備する。
【0007】上記の目的を達成するために本発明の第1
の音声認識処理プログラムを記録した記録媒体は、コン
ピュータによって音声認識処理をするための処理プログ
ラムを記録した記録媒体であって、上記処理プログラム
は、コンピュータに音声データが記録された音声データ
用記録媒体から音声データを読み込ませ、上記音声デー
タを音声認識してテキストデータに変換させ、上記テキ
ストデータを表示させることを特徴とする。
【0008】上記の目的を達成するために本発明の第2
の音声認識処理プログラムを記録した記録媒体は、上記
第1の音声認識処理プログラムを記録した記録媒体にお
いて、上記音声認識処理プログラムは、さらに、コンピ
ュータに上記音声データを音声認識してテキストデータ
に変換させるときにおいて、所定の時間間隔毎に、所定
の語数のみ音声認識してテキストデータに変換させるこ
とを特徴とする。
【0009】上記の目的を達成するために本発明の第3
の音声認識処理プログラムを記録した記録媒体は、上記
第1または第2の音声認識処理プログラムを記録した記
録媒体において、上記音声認識処理プログラムは、さら
に、コンピュータに上記音声データを音声認識してテキ
ストデータに変換させるときにおいて、音声データが記
録された記録媒体上の所定の位置から、所定の語数のみ
音声認識してテキストデータに変換させることを特徴と
する。
【0010】上記の目的を達成するために本発明の第4
の音声認識処理プログラムを記録した記録媒体は、コン
ピュータによって音声認識処理をするための処理プログ
ラムを記録した記録媒体であって、上記処理プログラム
は、コンピュータに音声データが記録された音声データ
用記録媒体から音声データを読み込ませ、上記音声デー
タを音声認識して所定のフレーズを検出させ、上記所定
のフレーズの位置を表示させることを特徴とする。
【0011】上記の目的を達成するために本発明の第5
の音声認識処理プログラムを記録した記録媒体は、上記
第4の音声認識処理プログラムを記録した記録媒体にお
いて、上記音声認識処理プログラムは、さらに、コンピ
ュータに上記音声データを音声認識して所定のフレーズ
を検出させた後において、該音声データが記録された音
声データ用記録媒体における当該所定のフレーズの位置
にインデックスマークを作成させることを特徴とする。
【0012】上記の目的を達成するために本発明の第6
の音声認識処理プログラムを記録した記録媒体は、コン
ピュータによって音声認識処理をするための処理プログ
ラムを記録した記録媒体であって、上記処理プログラム
は、コンピュータに音声データが記録された音声データ
用記録媒体から音声データを読み込ませ、上記音声デー
タを音声認識してテキストデータに変換させ、上記テキ
ストデータを表示させ、上記テキストデータの一部を指
定入力手段によって指定可能にさせ、上記指定入力手段
によって指定されたテキストデータの部分に対応する音
声データの部分を音声データが記録された音声データ用
記録媒体より削除させることを特徴とする。
【0013】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。
【0014】図1は、本発明の音声認識処理装置の一実
施形態であるコンピュータの概略構成を示したブロック
図である。
【0015】図に示すように、コンピュータ1は、該コ
ンピュータ1全般の制御を司る中央演算処理装置(CP
U)1aと、所定のプログラムが記録されている外部の
記録媒体(第1記録媒体7)を装着自在とする第1入力
装置5と、この第1入力装置5内に配設され上記第1記
録媒体7が第1入力装置5に装着された際に上記CPU
1aの制御のもと該第1記録媒体7より所定プログラム
を読み込む第1記録媒体駆動部6と、所定の音声データ
が記録されている外部の記録媒体(第2記録媒体10)
を装着自在とする第2入出力装置8と、この第2入出力
装置8内に配設され上記第2記録媒体10が第2入出力
装置8に装着された際に上記CPU1aの制御のもと該
第2記録媒体10より所定の音声データを読み込むとと
もに所定データの書き込みを行う第2記録媒体駆動部9
と、使用者からの所定の指示を入力する操作部2と、上
記CPU1aにおいて所定の処理が施された後、所定デ
ータを表示する表示装置3と、CPU1aにおいて所定
の処理が施された後、生成される音声を出力する音声出
力装置4と、で主要部が構成されている。
【0016】上記コンピュータ1は、複数のアプリケー
ションソフトウェアが同時に実行(マルチタスク)でき
るOS(オペレーション システム)を動作可能とする
構成をなしており、以下、当該コンピュータ1には、こ
のようなOSが組み込まれているものとして説明を行
う。
【0017】上記第1記録媒体は、所定の音声認識処理
プログラムを記録した記録媒体であり、本実施形態で
は、たとえば、CD−ROM、フロッピーディスク等、
可搬型の記録媒体を想定している。
【0018】また、上記第2記録媒体10は、所定の音
声データが記録された音声データ用記録媒体であり、以
下、この第2記録媒体10について詳述する。
【0019】上記第2記録媒体10は、外部の固体録音
機で録音した音声データが記録された記録媒体であり、
本実施形態においてはフラッシュメモリによるカード型
記録媒体を想定している。
【0020】近年、フラッシュメモリの需要が高まり、
フラッシュメモリを記録媒体としたデジタル固体録音機
が商品化されている。このフラッシュメモリはカード型
の記録媒体として多くの種類のものが知られている。例
えば、PCMCIAに準拠したメモリカード、Inte
l社のミニチュアカード、東芝社のSSFDC、Sun
Disk社のコンパクトフラッシュ等が知られている。
【0021】一般にこれらのカード型フラッシュメモリ
はアダプタ等を介し、パーソナルコンピュータに接続さ
れ所定のデータを転送できるようになっている。現在こ
のようなカード型メモリの記憶容量は2MBから8MB
までのものが多い。また、現在商品化されているデジタ
ル固体録音機は2MBのカードに20分から40分の録
音ができるものが知られている。
【0022】これらの固体録音機はマイクから入力され
たアナログ信号をデジタルのPCMデータ等に変換し、
このPCMデータをADPCMあるいはCELP形等の
符号化アルゴリズムによって圧縮し、圧縮したデータを
フラッシュメモリカードに記録している。なお、このよ
うにして記録されたデータはアダプタ等を介してパーソ
ナルコンピュータにおいて直接読み取れるようになって
いる。
【0023】本実施形態のコンピュータ1も、上述した
ように装着されたフラッシュメモリカード(第2記録媒
体10)より音声データを読み込むようになっている。
【0024】次に、このようなコンピュータ1におけ
る、音声データの音声認識処理動作を説明する。まず、
使用者は、所定の音声認識処理プログラムを記録した記
録媒体(第1の記録媒体7)をコンピュータ1の第1入
力装置5に装着する。コンピュータ1は、接続された当
該第1記録媒体7より一アプリケーションソフトウェア
である所定の音声認識処理プログラムを第1記録媒体駆
動部6を介して図示しない内部メモリに読み込む。これ
により、CPU1aは該プログラムに沿う音声認識処理
動作を制御可能とする。
【0025】以下、この音声認識処理プログラムによる
音声認識処理動作を説明する。図2は、本発明の音声認
識処理プログラムを記録した記録媒体に記録された音声
認識処理プログラムの第1の例(第1音声認識処理プロ
グラム)を示したフローチャートである。
【0026】コンピュータ1に上記第2記録媒体10が
装着されると、CPU1aは外部の固体録音機で圧縮記
録された音声圧縮ファイルより音声データを読み込む
(ステップS1)。この圧縮された音声データは当該第
1音声認識処理プログラムによって、固体録音機で記録
したときと同じ圧縮アルゴリズムを逆に用いてPCMデ
ータに伸長処理を行う(ステップS2)。すなわち、こ
の処理は当該固体録音機の再生処理と同じ処理を第1音
声認識処理プログラムにより制御されるコンピュータ1
で行うことになる。
【0027】上記ステップS2で伸長されたPCMデー
タは音声認識処理が施され(ステップS3)、音声認識
されたデータはテキストデータ文字に変換され(ステッ
プS4)、変換された文字データはディスプレイ(表示
装置3)にテキスト表示される(ステップS5)。ま
た、この処理は音声認識されたデータが終了するまで続
けられる(ステップS6)。
【0028】図3は、本実施形態のコンピュータ1にお
いて、上記第1記録媒体7より読み込んだ音声認識処理
用アプリケーションソフトウェアを起動させた際の一表
示例であり、音声圧縮された音声データを再生するため
のメイン画面である。
【0029】図3に示すメイン画面11において、圧縮
音声ファイル一覧表示部14でハイライトされているフ
ァイルが再生や音声認識の対象となるファイルであり、
ツール・バー13上に設けられた音声認識ツールボタン
グループ21内の音声認識開始ボタン22を押すと該ハ
イライトされている音声ファイルの音声認識が開始さ
れ、図4に示すテキストエディタが立ち上がり、認識さ
れた音声データがこのエディタ上に逐次テキストデータ
として文字表示される。なお、メイン画面11上、符号
12はメニュー・バーを示している。
【0030】次に、音声認識の対象となるファイルの先
頭から一定の時間間隔をおいて所定語数だけ認識を行
い、該語数だけ一覧表示する処理動作について説明す
る。
【0031】上記音声認識ツールボタングループ21内
のリスト表示ボタン24は、音声認識の対象となるファ
イルの先頭から一定の時間間隔をおいてある語数だけ認
識を行い、一覧表示するためのボタンである。
【0032】このリスト表示ボタン24を押すと図5に
示すようなダイアログボックスが表示され、上記圧縮音
声ファイル一覧表示部14でハイライトされているファ
イル(音声認識の対象となるファイル)の先頭から何秒
おきに認識するかの時間間隔の設定と認識する文字の語
数の設定を入力するように使用者に要求する。なお、使
用者は該処理を途中で中断したい場合、図5に示すキャ
ンセルボタンを押すことで図3のメイン画面に戻ること
ができる。
【0033】使用者が、上記時間間隔の設定と認識する
文字の語数の設定を入力し、開始ボタンを押すと図5に
示したダイアログボックスが閉じられ、図6に示すよう
なリストボックスが表示される。
【0034】図7は、本発明の音声認識処理プログラム
を記録した記録媒体に記録された音声認識処理プログラ
ムの第2の例(第2音声認識処理プログラム)を示した
フローチャートであり、上記音声認識の対象となるファ
イルの先頭から一定の時間間隔をおいて所定語数だけ認
識を行い、該語数だけ一覧表示する処理動作を示してい
る。
【0035】すなわち、使用者により時間間隔の設定と
認識する文字の語数の設定がなされ、開始ボタンが押さ
れると、まず上記第2記録媒体10の音声認識の対象と
なるファイルより音声データを読み込む(ステップS1
1)。次にこの圧縮された音声データを当該第2音声認
識処理プログラムによって、上記第1音声認識処理プロ
グラムと同様の伸長処理を行い(ステップS12)、上
記設定された時間に対応して(ステップS13)、伸長
されたPCMデータが音声認識処理される(ステップS
14)。
【0036】ここで、音声認識されたデータはテキスト
データ文字に変換され(ステップS15)、変換された
文字データはディスプレイ(表示装置3)に図6に示す
ように所定文字数テキスト表示される(ステップS1
6)。すなわち、図6に示すリストボックスには、音声
認識が行われたファイルの先頭からの再生位置時間の表
示と、その再生位置からの音声認識したテキスト表示を
図5のダイアログボックスで設定した語数だけ順次テキ
スト表示される。この処理はデータ終了の後終了する
(ステップS17)。
【0037】次に、音声認識の対象となるファイルにお
いて、所定位置から音声認識を行い表示する処理動作に
ついて説明する。
【0038】図3に示すメイン画面11の現在再生位置
表示スライダ15の再生位置を変更し、音声認識ツール
ボタン21内の音声認識開始ボタン22を押すと再生位
置が変更された場所からの音声認識が行われ、図4に示
したテキストエディタ上にテキスト表示する。
【0039】図8は、本発明の音声認識処理プログラム
を記録した記録媒体に記録された音声認識処理プログラ
ムの第3の例(第3音声認識処理プログラム)を示した
フローチャートであり、上記音声認識の対象となるファ
イルの所定位置から音声認識を行い表示する処理動作を
示している。
【0040】すなわち、使用者により図3に示す現在再
生位置表示スライダ15の再生位置が変更されると、ま
ず、上記第2記録媒体10の音声認識の対象となるファ
イルより音声データを読み込む(ステップS21)。次
にこの圧縮された音声データを当該第3音声認識処理プ
ログラムによって、上記第1音声認識処理プログラムと
同様の伸長処理を行い(ステップS22)、上記所定位
置に対応して(ステップS23)、該位置より伸長され
たPCMデータが音声認識処理される(ステップS2
4)。
【0041】ここで、音声認識されたデータはテキスト
データ文字に変換され(ステップS25)、変換された
文字データはディスプレイ(表示装置3)にテキスト表
示される(ステップS26)。すなわち、図4に示すエ
ディタ画面に設定された所定位置からのテキスト文字が
表示される。この処理はデータ終了の後終了する(ステ
ップS27)。
【0042】次に、音声認識の対象となるファイルよ
り、音声認識させたい所望のフレーズだけを音声認識処
理するとともに、当該所望のフレーズ位置を表示する処
理動作について説明する。
【0043】図3に示す上記音声認識ツールボタングル
ープ21内のフレーズ認識ボタン23は、音声認識の対
象となるファイルより、音声認識させたい所望のフレー
ズだけを音声認識処理するとともに、当該所望のフレー
ズ位置を表示するためのボタンである。すなわち、この
フレーズ認識ボタン23を押すことで、音声認識させた
いフレーズだけを音声圧縮ファイルの中から音声認識を
行うことによって検索し、検索された場所を現在再生位
置表示スライダ15中にライン16で表示し、一覧でき
るようになっている。以下、具体的に説明する。
【0044】上記フレーズ認識ボタン23が押される
と、図9に示すダイアログボックスが表示される。この
ダイアログボックスにより使用者に対して認識させたい
特定の単語あるいはフレーズの入力を要求する。なお、
この処理を中断させたい場合は、キャンセルボタンを押
すことでこの処理から抜け出し、図3のメイン画面に戻
ることができる。
【0045】図10は、本発明の音声認識処理プログラ
ムを記録した記録媒体に記録された音声認識処理プログ
ラムの第4の例(第4音声認識処理プログラム)を示し
たフローチャートであり、音声認識の対象となるファイ
ルより、音声認識させたい所望のフレーズだけを音声認
識処理するとともに、当該所望のフレーズ位置を表示す
る処理動作を示している。
【0046】すなわち、図9において使用者により認識
させたい単語あるいはフレーズが入力され、開始ボタン
が押されると、まず上記第2記録媒体10の音声認識の
対象となるファイルより音声データを読み込む(ステッ
プS31)。次にこの圧縮された音声データを当該第4
音声認識処理プログラムによって、上記第1音声認識処
理プログラムと同様の伸長処理を行い(ステップS3
2)、選択されている音声圧縮ファイルの先頭から音声
認識が開始される(ステップS33)。
【0047】この後、図9のダイアログボックスで登録
した単語あるいはフレーズが音声認識対象ファイルの中
から認識されると(ステップS34)、当該位置を図3
に示すメイン画面11の現在再生位置表示スライド15
中にライン16で表示するとともに、当該位置に対応す
る箇所にはインデックスマークが挿入され、図3に示す
メイン画面11中のボタン操作部18のインデックスサ
ーチボタン17を押す毎にライン16で表示された場所
に順次スキップする(ステップS35、ステップS3
6)。なお、この機能は再生停止中だけでなく再生中も
可能である。
【0048】音声圧縮ファイルの最後まで音声認識が終
了すると、現在再生位置表示スライド15中に登録した
単語あるいはフレーズの有った全ての箇所がライン16
で表示される。
【0049】なお、この処理はデータ終了の後終了する
(ステップS37)。
【0050】次に、音声認識の対象となるファイルよ
り、指定したテキストデータの部分に対応する音声デー
タの部分を第2記録媒体10より削除する処理動作につ
いて説明する。
【0051】図11は、本発明の音声認識処理プログラ
ムを記録した記録媒体に記録された音声認識処理プログ
ラムの第5の例(第5音声認識処理プログラム)を示し
たフローチャートであり、指定したテキストデータの部
分に対応する音声データの部分を第2記録媒体10より
削除する処理動作を示している。
【0052】まず上記第2記録媒体10の音声認識の対
象となるファイルより音声データを読み込む(ステップ
S41)。次にこの圧縮された音声データを当該第5音
声認識処理プログラムによって、上記第1音声認識処理
プログラムと同様の伸長処理を行い(ステップS4
2)、伸長されたPCMデータが音声認識処理される
(ステップS43)。
【0053】次に、音声認識されたデータはテキストデ
ータ文字に変換され(ステップS44)、各語に対応す
る第2記録媒体10のアドレスを取得し、表を作成する
(SS45)。表1は、テキスト文字例「空は青いな海
も青いな」に対応する第2記録媒体10のアドレスを示
している。
【0054】
【表1】 この後、上記テキスト文をデータが終了するまでディス
プレイに表示する(ステップS46、ステップS4
7)。
【0055】データ終了後、上記テキスト文を削除する
か否かを判定し(ステップS48)、削除する場合は、
該削除位置をテキスト文上で指定し(ステップS4
9)、この指定位置に対応した第2記録媒体10のアド
レスを上記表1より取得する(ステップS50)。
【0056】この後、上記第2記録媒体10より音声デ
ータを読み込み(ステップS51)、当該音声データに
伸長処理を施し(ステップS52)、音声データの当該
部分を削除する(ステップS53)。この後、再び圧縮
処理を施し(ステップS54)、当該音声データを上書
きする(ステップS55)。
【0057】本実施形態では、テキスト文の削除位置を
第2の記録媒体上の位置に関連つけるためにアドレスを
表に記録したが、これに限らず、例えば、ファイルの先
頭からの時間を表に記録しても良い。
【0058】このように、本実施形態のコンピュータ1
に適用される記録媒体に記録された音声認識処理プログ
ラムによると、従来、マイクロフォンから直接音声認識
する場合にリアルタイムで音声認識処理をしなければな
らないために高いCPUのパフォーマンスが要求されて
いたのに対して、(音声圧縮ファイルの伸長処理)→
(音声認識処理)の繰り返しを行うだけなので、リアル
タイム性は要求されず、CPUの高いパフォーマンスは
要求とされないという効果を奏する。
【0059】また、リアルタイム性が要求されないため
に音声認識処理の精度をより高く認識させるようなアル
ゴリズムを作ることができるという効果も奏する。
【0060】さらに、音声圧縮ファイル中の部分的な内
容を一覧できるためにどの再生位置に何がかかれている
かを大まかに把握することができる。
【0061】さらに、既存の音声圧縮ファイル内のテキ
ストデータに変換したい部分だけを音声認識させること
ができる。
【0062】さらに、既存の音声圧縮ファイルの中から
キーワードとなる単語あるいはフレーズの位置へ瞬時に
スキップすることができ、検索したい位置に即座にたど
り着くことができる。
【0063】さらに、記録後のデータに対しても、後か
ら語句を指定してインデックスマークを入れられ利便性
が向上し、さらに、記録後のデータに対して、後から不
用部分を語句を指定して削除できるので、失敗した口述
部分などを簡単に消すことができる。
【0064】なお、本実施形態のコンピュータ1におい
ては、上記第1記録媒体7は、外部の記録媒体とし、該
コンピュータ1に装着の後、所定の音声認識処理プログ
ラムを記録した該記録媒体よりアプリケーションソフト
ウェアである所定の音声認識処理プログラムを読み込む
ことを可能としたが、これに限らず、当該コンピュータ
1内のCPU1aに作用し所定の音声認識処理プログラ
ムを起動せしめるものであれば如何様な態様をなしたも
のでも良い。
【0065】たとえば、当該音声認識処理プログラムを
記録した記録媒体を予めコンピュータ1内に備え、随時
当該音声認識処理プログラムを読み込むようにしても良
い。
【0066】[付記]以上詳述した如き本発明の実施形態
によれば、以下の如き構成を得ることができる。即ち、 (1) プログラムされたコンピュータによって音声認
識処理をする装置であって、PCMのデジタル音声デー
タが圧縮記録された記録媒体から音声データを読み込
む、読み込み手段と、該音声データを音声認識して、テ
キストデータに変換する、音声認識手段と、該テキスト
データを表示する表示手段とを備えたことを特徴とす
る、音声認識処理装置。
【0067】(2) コンピュータによって音声認識処
理をするための処理プログラムを記録した記録媒体であ
って、該処理プログラムは、コンピュータに音声データ
が記録された記録媒体から音声データを読み込ませ、該
音声データが音声認識して所定のフレーズを検出させ、
該音声データが記録された記録媒体の該所定のフレーズ
の位置にインデックスマークを作成させ該所定のフレー
ズの位置を表示させ、コンピュータに該音声データが記
録された記録媒体の音声データを所定の位置から再生さ
せることを特徴とする、音声認識処理プログラムを記録
した記録媒体。
【0068】(3)コンピュータによって音声認識処理
をするための処理プログラムを記録した記録媒体であっ
て、該処理プログラムは、コンピュータに音声データが
記録された記録媒体から音声データを読み込ませ、該音
声データを音声認識してテキストデータに変換させ、該
テキストデータの各語に対応する音声データが記録され
た記録媒体の位置情報を、該各語に関連させて取得し、
該テキストデータを表示させ、該テキストデータの一部
を指定入力手段によって指定可能にさせ、該指定入力手
段によって指定されたテキストデータの部分に含まれる
語により、対応する音声データが記録された記録媒体の
位置情報を求めさせ、上記の位置情報に基づき、音声デ
ータの対応する部分を音声データが記録された記録媒体
より削除させることを特徴とする、音声認識処理プログ
ラムを記録した記録媒体。
【0069】
【発明の効果】以上説明したように請求項1に記載の発
明によれば、所定の音声データ用記録媒体に記録された
音声データを音声認識する音声認識処理装置を提供でき
る。これにより、それほど高い能力をCPUに要求せず
に、音声認識ができる。
【0070】また、請求項2に記載の発明によれば、コ
ンピュータに所定の音声データ用記録媒体に記録された
音声データを音声認識せしめる音声認識処理プログラム
を記録した記録媒体を提供できる。これにより、それほ
ど高い能力をCPUに要求せずに、音声認識ができる。
【0071】さらに、請求項3に記載の発明によれば、
コンピュータに、使用者が一読で音声ファイルの記録内
容を概略認知できる表示をさせる音声認識処理プログラ
ムを記録した記録媒体を提供できる。これにより、音声
ファイルの記録内容の概要を、先頭から音声ファイルを
聞くことなく、一瞥のもとに把握できる。
【0072】さらに、請求項4に記載の発明によれば、
コンピュータに、必要な部分のみテキスト化せしめる音
声認識処理プログラムを記録した記録媒体を提供でき
る。これにより、音声ファイルの記録内容の必要部分だ
けを選択して音声認識できるので、効率的に音声認識が
できる。
【0073】さらに、請求項5に記載の発明によれば、
コンピュータに、音声データ用記録媒体に記録された音
声ファイルの内容の検索を可能たらしめる音声認識処理
プログラムを記録した記録媒体を提供できる。これによ
り、音声ファイルの記録内容の重要語句が記録されてい
る箇所を、簡単な操作で視覚的に知ることができ、重要
な記録箇所がすぐ見つけられる。
【0074】さらに、請求項6に記載の発明によれば、
コンピュータに音声データ用記録媒体に記録された音声
ファイルの内容を検索し、その位置にインデックスマー
クを付加することを可能たらしめる音声認識プログラム
を記録した記録媒体を提供できる。これにより、音声フ
ァイルを記録した後でも、重要語句の位置にインデック
スマークをつけることができ、重要な場所にすぐアクセ
スできる、使い勝手の良い音声ファイルに変更できる。
【0075】さらに、請求項7に記載の発明によれば、
コンピュータに、音声ファイルの不要部分を削除せしめ
る音声認識処理プログラムを記録した記録媒体を提供で
きる。これにより、すでに記録された音声ファイルか
ら、失敗した口述部分などの不要箇所を、表示された語
句を指定して削除できるので、音声ファイルの整理に利
便性が良い。
【図面の簡単な説明】
【図1】本発明の音声認識処理装置の一実施形態である
コンピュータの概略構成を示したブロック図である。
【図2】本発明の音声認識処理プログラムを記録した記
録媒体に記録された音声認識処理プログラムの第1の例
(第1音声認識処理プログラム)を示したフローチャー
トである。
【図3】本実施形態のコンピュータにおいて、上記第1
記録媒体より読み込んだ音声認識処理用アプリケーショ
ンソフトウェアを起動させた際の一表示例であり、音声
圧縮された音声データを再生するためのメイン画面であ
る。
【図4】本実施形態のコンピュータにおいて、上記第1
記録媒体より読み込んだ音声認識処理用アプリケーショ
ンソフトウェアを起動させた際の、テキストデータを表
示する画面の一例を示した図である。
【図5】本実施形態のコンピュータにおいて、上記第1
記録媒体より読み込んだ音声認識処理用アプリケーショ
ンソフトウェアを起動させ、音声認識の対象となるファ
イルの先頭から一定の時間間隔をおいて所定語数だけ認
識する際、音声認識の間隔と表示語数を設定するダイヤ
ログボックス画面の一例を示した図である。
【図6】本実施形態のコンピュータにおいて、上記第1
記録媒体より読み込んだ音声認識処理用アプリケーショ
ンソフトウェアを起動させ、音声認識の対象となるファ
イルの先頭から一定の時間間隔をおいて所定語数だけ認
識して表示した画面の一例を示した図である。
【図7】本発明の音声認識処理プログラムを記録した記
録媒体に記録された音声認識処理プログラムの第2の例
(第2音声認識処理プログラム)を示したフローチャー
トである。
【図8】本発明の音声認識処理プログラムを記録した記
録媒体に記録された音声認識処理プログラムの第3の例
(第3音声認識処理プログラム)を示したフローチャー
トである。
【図9】本実施形態のコンピュータにおいて、上記第1
記録媒体より読み込んだ音声認識処理用アプリケーショ
ンソフトウェアを起動させ、音声認識させたいフレーズ
だけを音声圧縮ファイルの中から音声認識を行う際、該
音声認識検索単語およびフレーズの設定用のダイヤログ
ボックス画面の一例を示した図である。
【図10】本発明の音声認識処理プログラムを記録した
記録媒体に記録された音声認識処理プログラムの第4の
例(第4音声認識処理プログラム)を示したフローチャ
ートである。
【図11】本発明の音声認識処理プログラムを記録した
記録媒体に記録された音声認識処理プログラムの第5の
例(第5音声認識処理プログラム)を示したフローチャ
ートである。
【符号の説明】
1…コンピュータ 2…操作部 3…表示装置 4…音声出力装置 5…第1入力装置 6…第1記録媒体駆動部 7…第1記録媒体 8…第2入出力装置 9…第2記録媒体駆動部 10…第2記録媒体 11…メイン画面 14…圧縮音声ファイル一覧表示部 15…現在再生位置表示スライダ 16…ライン 17…インデックスサーチボタン 21…音声認識ツールボタングループ 22…音声認識開始ボタン 23…フレーズ認識ボタン 24…リスト表示ボタン

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 プログラムされたコンピュータによって
    音声認識処理をする装置であって、 音声データが記録された音声データ用記録媒体から音声
    データを読み込む音声データ読込手段と、 上記音声データを音声認識してテキストデータに変換す
    る音声認識処理手段と、 上記テキストデータを表示する表示手段と、 を具備したことを特徴とする音声認識処理装置。
  2. 【請求項2】 コンピュータによって音声認識処理をす
    るための処理プログラムを記録した記録媒体であって、 上記処理プログラムは、コンピュータに音声データが記
    録された音声データ用記録媒体から音声データを読み込
    ませ、 上記音声データを音声認識してテキストデータに変換さ
    せ、 上記テキストデータを表示させることを特徴とする音声
    認識処理プログラムを記録した記録媒体。
  3. 【請求項3】 上記音声認識処理プログラムは、さら
    に、コンピュータに上記音声データを音声認識してテキ
    ストデータに変換させるときにおいて、所定の時間間隔
    毎に、所定の語数のみ音声認識してテキストデータに変
    換させることを特徴とする、請求項2に記載の音声認識
    処理プログラムを記録した記録媒体。
  4. 【請求項4】 上記音声認識処理プログラムは、さら
    に、コンピュータに上記音声データを音声認識してテキ
    ストデータに変換させるときにおいて、音声データが記
    録された記録媒体上の所定の位置から、所定の語数のみ
    音声認識してテキストデータに変換させることを特徴と
    する、請求項2または3に記載の音声認識処理プログラ
    ムを記録した記録媒体。
  5. 【請求項5】 コンピュータによって音声認識処理をす
    るための処理プログラムを記録した記録媒体であって、 上記処理プログラムは、コンピュータに音声データが記
    録された音声データ用記録媒体から音声データを読み込
    ませ、 上記音声データを音声認識して所定のフレーズを検出さ
    せ、 上記所定のフレーズの位置を表示させることを特徴とす
    る音声認識処理プログラムを記録した記録媒体。
  6. 【請求項6】 上記音声認識処理プログラムは、さら
    に、コンピュータに上記音声データを音声認識して所定
    のフレーズを検出させた後において、該音声データが記
    録された音声データ用記録媒体における当該所定のフレ
    ーズの位置にインデックスマークを作成させることを特
    徴とする、請求項5に記載の音声認識処理プログラムを
    記録した記録媒体。
  7. 【請求項7】 コンピュータによって音声認識処理をす
    るための処理プログラムを記録した記録媒体であって、 上記処理プログラムは、コンピュータに音声データが記
    録された音声データ用記録媒体から音声データを読み込
    ませ、 上記音声データを音声認識してテキストデータに変換さ
    せ、 上記テキストデータを表示させ、 上記テキストデータの一部を指定入力手段によって指定
    可能にさせ、 上記指定入力手段によって指定されたテキストデータの
    部分に対応する音声データの部分を音声データが記録さ
    れた音声データ用記録媒体より削除させることを特徴と
    する音声認識処理プログラムを記録した記録媒体。
JP14972997A 1997-06-06 1997-06-06 音声認識処理装置及び音声認識処理プログラムを記録した記録媒体 Expired - Lifetime JP3905181B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP14972997A JP3905181B2 (ja) 1997-06-06 1997-06-06 音声認識処理装置及び音声認識処理プログラムを記録した記録媒体
US09/088,996 US6353809B2 (en) 1997-06-06 1998-06-02 Speech recognition with text generation from portions of voice data preselected by manual-input commands
EP98110264A EP0887788B1 (en) 1997-06-06 1998-06-05 Voice recognition apparatus for converting voice data present on a recording medium into text data
DE69829802T DE69829802T2 (de) 1997-06-06 1998-06-05 Spracherkennungsapparat zum Übertragen von Sprachdaten auf einem Datenträger in Textdaten

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14972997A JP3905181B2 (ja) 1997-06-06 1997-06-06 音声認識処理装置及び音声認識処理プログラムを記録した記録媒体

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2006169354A Division JP2006323858A (ja) 2006-06-19 2006-06-19 音声認識処理装置および音声認識処理プログラムを記録した記録媒体
JP2006169353A Division JP2006323857A (ja) 2006-06-19 2006-06-19 音声認識処理装置および音声認識処理プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JPH10340179A true JPH10340179A (ja) 1998-12-22
JP3905181B2 JP3905181B2 (ja) 2007-04-18

Family

ID=15481546

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14972997A Expired - Lifetime JP3905181B2 (ja) 1997-06-06 1997-06-06 音声認識処理装置及び音声認識処理プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3905181B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61239358A (ja) * 1985-04-15 1986-10-24 Sharp Corp 音声入力による文書作成方式
JPH0245868A (ja) * 1988-08-08 1990-02-15 Sanyo Electric Co Ltd 文書読み上げ装置
JPH0460577A (ja) * 1990-06-29 1992-02-26 Toshiba Corp オーディオ再生装置
JPH07146919A (ja) * 1993-11-19 1995-06-06 Canon Inc 文書作成補助装置
JPH07182365A (ja) * 1993-12-24 1995-07-21 Hitachi Ltd マルチメディア会議録作成支援装置および方法
JPH08317365A (ja) * 1995-05-22 1996-11-29 Matsushita Electric Ind Co Ltd 電子会議装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61239358A (ja) * 1985-04-15 1986-10-24 Sharp Corp 音声入力による文書作成方式
JPH0245868A (ja) * 1988-08-08 1990-02-15 Sanyo Electric Co Ltd 文書読み上げ装置
JPH0460577A (ja) * 1990-06-29 1992-02-26 Toshiba Corp オーディオ再生装置
JPH07146919A (ja) * 1993-11-19 1995-06-06 Canon Inc 文書作成補助装置
JPH07182365A (ja) * 1993-12-24 1995-07-21 Hitachi Ltd マルチメディア会議録作成支援装置および方法
JPH08317365A (ja) * 1995-05-22 1996-11-29 Matsushita Electric Ind Co Ltd 電子会議装置

Also Published As

Publication number Publication date
JP3905181B2 (ja) 2007-04-18

Similar Documents

Publication Publication Date Title
EP0887788B1 (en) Voice recognition apparatus for converting voice data present on a recording medium into text data
US5477511A (en) Portable documentation system
JP3163119B2 (ja) 記録再生装置
EP0536792B1 (en) Audio sound recording/reproducing apparatus using semiconductor memory
JPH05173897A (ja) 記録再生装置
JP2006323857A (ja) 音声認識処理装置および音声認識処理プログラムを記録した記録媒体
JP3905181B2 (ja) 音声認識処理装置及び音声認識処理プログラムを記録した記録媒体
JPH04311222A (ja) 電子ドキュメントを音声処理するポータブル・コンピュータ装置
KR100395074B1 (ko) 어학 학습용 디지털 데이터의 재생 방법
KR100383194B1 (ko) 미디어 파일 재생 방법
KR19980015989A (ko) 휴대용 재생 전용 전자 독서장치 및 그 제어방법
JP2006323858A (ja) 音声認識処理装置および音声認識処理プログラムを記録した記録媒体
JP4189653B2 (ja) 画像記録再生方法および画像記録再生装置
JPH0962296A (ja) 音声記録装置および音声再生装置
JP2005107617A5 (ja)
JP2005107617A (ja) 音声データ検索装置。
JPH0213398B2 (ja)
JPH0413829Y2 (ja)
JP3217590B2 (ja) メッセージの再生装置
JP2001188562A (ja) 音声記録再生装置、周辺装置、これら装置を備える音声記録再生システムおよび音声データ処理プログラムを記録した記録媒体
JPH11212590A (ja) 音声処理装置、音声認識プログラムを記録した記録媒体、処理プログラムを記録した記録媒体
JPH05108608A (ja) 情報信号処理装置
JPH07191978A (ja) 文書処理装置
JP3611985B2 (ja) ディジタル式音声録音再生装置
JP2000089784A (ja) 音声認識システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040519

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110119

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120119

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130119

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140119

Year of fee payment: 7

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term