JP2001022744A - 音声処理装置及び音声処理プログラムを記録した記録媒体 - Google Patents

音声処理装置及び音声処理プログラムを記録した記録媒体

Info

Publication number
JP2001022744A
JP2001022744A JP11190500A JP19050099A JP2001022744A JP 2001022744 A JP2001022744 A JP 2001022744A JP 11190500 A JP11190500 A JP 11190500A JP 19050099 A JP19050099 A JP 19050099A JP 2001022744 A JP2001022744 A JP 2001022744A
Authority
JP
Japan
Prior art keywords
voice
voice recognition
range
data
voice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11190500A
Other languages
English (en)
Inventor
Takashi Onishi
孝史 大西
秀享 ▲高▼橋
Hideyuki Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP11190500A priority Critical patent/JP2001022744A/ja
Publication of JP2001022744A publication Critical patent/JP2001022744A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】音声ファイル中の所望の区間を選択して音声認
識を行い、テキスト化することを可能とする、使い勝手
のよい音声処理装置及び音声処理プログラムを記録した
記録媒体を提供することである。 【解決手段】インデックスマークを含む音声データに対
して音声認識処理を行い、音声データをテキスト化する
ことが可能な音声処理制御システムに於いて、検出部1
により上記音声データ中に於ける上記インデックスマー
クの位置が検出される。また、上記インデックスマーク
の位置に基いて、音声認識処理範囲設定部2にて上記音
声データの音声認識処理を行う範囲の指定が行われる。
そして、上記音声認識処理範囲設定部2で設定された範
囲の音声データに対して、音声認識部3によって音声認
識処理が行われて音声データがテキスト化される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声データを有す
る音声ファイルに対して音声認識処理を行う音声認識手
段を有する音声処理装置及び音声処理プログラムを記録
した記録媒体に関するものである。
【0002】
【従来の技術】近年の音声認識技術の発展により、パー
ソナルコンピュータに接続したマイクロホンから入力し
た音声を自動的にテキスト化するものが種々提案されて
いる。
【0003】一方、本件出願人は、先の出願である特願
平9−149728号に、一旦音声記録装置で音声を記
録し、その音声記録装置からパーソナルコンピュータに
転送された音声ファイルを該パーソナルコンピュータ上
で簡単な操作で扱うことを可能にする処理制御装置を記
載し、また特願平9−149729号に、音声ファイル
を処理制御装置から音声認識装置に渡して音声認識処理
を行い、文書として画面に表示させるディクテーション
システムを記載している。
【0004】このようなディクテーションシステムによ
れば、コンピュータの前に座って直接音声入力を行う必
要がなく、一旦音声記録装置に録音して、後でコンピュ
ータにその録音データである音声ファイルを転送して文
書を作成することが可能となる。
【0005】例えば、医師がX線画像を観察しながら診
断書を作成する場合、キーボード等を操作するのは煩わ
しいものである。そのため、X線画像を観察しながら所
見内容を音声記録装置に録音して、後にコンピュータに
その音声ファイルを転送して診断書を作成するといった
場面で有用である。
【0006】
【発明が解決しようとする課題】ところで、例えば録音
時間が長い音声ファイルに対しては、その所望の区間だ
けに音声認識処理を行ってテキストを得たいという場合
がある。現状の音声認識処理は少なからず時間がかかる
ため、上述したような所望の区間だけの音声認識処理及
びテキスト化を行うことができれば、より効率的な文書
作成が可能になる。
【0007】しかしながら、このような特定の区間だけ
の音声認識を行い、テキスト化することが可能なもの
は、従来は存在しないものであった。したがって、従来
は、一旦録音ファイル全体を音声認識させるほかなかっ
たため、使い勝手が悪いという課題を有していた。
【0008】本発明は上記実状に鑑みてなされたもので
あり、その目的は、音声ファイル中の所望の区間を選択
して音声認識を行い、テキスト化することを可能とす
る、使い勝手のよい音声処理装置及び音声処理プログラ
ムを記録した記録媒体を提供することを目的とする。
【0009】
【課題を解決するための手段】すなわち請求項1に記載
の発明による音声処理装置は、インデックスマークを含
む音声データに対して音声認識処理を行い、音声データ
をテキスト化することが可能な音声処理制御システムに
於いて、上記音声データ中に於ける上記インデックスマ
ークの位置を検出する検出手段と、上記インデックスマ
ークの位置に基いて上記音声データの音声認識処理を行
う範囲の指定を行う音声認識処理範囲設定手段と、上記
音声認識処理範囲設定手段で設定された範囲の音声デー
タに対して音声認識処理を行い音声データをテキスト化
する音声認識手段と、を具備することを特徴とする。
【0010】また、請求項2に記載の発明による音声処
理装置は、請求項1に於いて、上記インデックスマーク
の位置に基いた範囲の音声認識処理を行うか、若しくは
音声データの全範囲に対して音声認識処理を行うかを選
択する選択手段を更に具備し、上記選択手段に於いて音
声データの全範囲に対して音声認識処理を行うことが選
択された場合には、上記音声認識処理範囲設定手段は上
記音声データの先頭位置から最終位置までを音声認識の
対象範囲に設定することを特徴とする。
【0011】更に、請求項3に記載の発明による音声処
理プログラムを記録した記録媒体は、コンピュータに対
して、インデックスマークを含む音声データに対して音
声認識処理を行わせ、音声データをテキスト化させるこ
とが可能な音声処理制御プログラムを記録した記録媒体
に於いて、上記音声処理制御プログラムはコンピュータ
に対して、上記音声データ中に於ける上記インデックス
マークの位置を検出させ、上記インデックスマークの位
置に基いて上記音声データの音声認識処理を行う範囲の
指定を行わせ、上記指定された範囲の音声データに対し
て音声認識処理を行わせ音声データをテキスト化させる
音声認識を行わせることを特徴とする。
【0012】請求項1に記載の発明にあっては、インデ
ックスマークを含む音声データに対して音声認識処理を
行い、音声データをテキスト化することが可能な音声処
理制御システムに於いて、上記音声データ中に於ける上
記インデックスマークの位置が検出手段で検出される。
また、上記インデックスマークの位置に基いて、音声認
識処理範囲設定手段にて上記音声データの音声認識処理
を行う範囲の指定が行われる。そして、上記音声認識処
理範囲設定手段で設定された範囲の音声データに対し
て、音声認識手段によって音声認識処理が行われて音声
データがテキスト化される。
【0013】請求項2に記載の発明にあっては、選択手
段を更に具備し、この選択手段によって上記インデック
スマークの位置に基いた範囲の音声認識処理を行うか、
若しくは音声データの全範囲に対して音声認識処理を行
うかが選択される。そして、上記選択手段に於いて音声
データの全範囲に対して音声認識処理を行うことが選択
された場合には、上記音声認識処理範囲設定手段によ
り、上記音声データの先頭位置から最終位置までが、音
声認識の対象範囲に設定される。
【0014】請求項3に記載の発明にあっては、コンピ
ュータに対して、インデックスマークを含む音声データ
に対して音声認識処理を行わせ、音声データをテキスト
化させることが可能な音声処理制御プログラムを記録し
た記録媒体に於いて、上記音声処理制御プログラムによ
り、コンピュータに対して、上記音声データ中に於ける
上記インデックスマークの位置が検出される。そして、
上記インデックスマークの位置に基いて上記音声データ
の音声認識処理を行う範囲の指定が行われる。更に、上
記指定された範囲の音声データに対して音声認識処理が
行われ、次いで音声データをテキスト化させる音声認識
が行われる。
【0015】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。
【0016】図1は、本発明の一実施の形態に係る音声
処理システムの概念を示すブロック構成図である。
【0017】図1に於いて、この音声処理システムは、
インデックスマークを含む音声データに対して音声認識
処理を行い、音声データをテキスト化するためのもの
で、検出部1と、音声認識処理範囲設定部2と、音声認
識部3と、選択部4とを有して構成される。
【0018】上記検出部1では、上記音声データ中に於
ける上記インデックスマークの位置が検出される。ま
た、上記音声認識処理範囲設定部2では、上記インデッ
クスマークの位置に基いて、上記音声データの音声認識
処理を行う範囲の指定が行われる。そして、上記音声認
識処理範囲設定部2で設定された範囲の音声データに対
して、音声認識部3によって音声認識処理が行われて音
声データがテキスト化される。
【0019】また、上記選択部4は、上記インデックス
マークの位置に基いた範囲の音声認識処理を行うか、若
しくは音声データの全範囲に対して音声認識処理を行う
かを選択するためのものである。この選択部4によって
音声データの全範囲に対して音声認識処理を行うことが
選択された場合には、上記音声データの先頭位置から最
終位置までが、上記音声認識処理範囲設定部2によって
音声認識の対象範囲に設定される。
【0020】図2は、本発明の一実施の形態に係る音声
処理システムの全体構成を示す図である。
【0021】図2に於いて、デジタルレコーダ11は音
声記録手段として使用されるもので、図示されないマイ
クロホンから入力された音声をデジタル信号に変換し、
それを圧縮して記録媒体に音声データファイルとして記
録する。それと共に、該記録媒体から音声データファイ
ルを読出して伸長した後、アナログ信号に変換してスピ
ーカから音声として出力するという機能を有している。
【0022】上記記録媒体は、例えばデジタルレコーダ
11に着脱自在に内蔵される半導体メモリのミニチュア
カード12である。このミニチュアカード12が、例え
ばPCカードアダプタ13に装填され、更にパーソナル
コンピュータ15内に設定されることにより、ミニチュ
アカード12に記録された音声データファイルがパーソ
ナルコンピュータ15内に取り込まれるようになってい
る。
【0023】一方、パーソナルコンピュータ15は、本
体16に、キーボード17aやマウス17b等の入力装
置と、CRTディスプレイや液晶ディスプレイ等の表示
手段であるディスプレイ18とが接続されて構成されて
いる。そして、このパーソナルコンピュータ15の記録
媒体(図示せず)には、転送された音声ファイルに関す
る情報の表示や音声ファイルの再生を行う制御プログラ
ムと、選択された音声ファイルを自動的にテキストデー
タに変換してディスプレイ画面上に表示することを可能
とする音声認識プログラムが格納されている。
【0024】尚、図2では、PCカードアダプタ13を
介して音声ファイルデータを転送するようにしている
が、デジタルレコーダ11からパーソナルコンピュータ
15へは、ケーブルを直接接続して音声ファイルを転送
するようにしてもよいし、無線によるデータ通信により
音声ファイルを転送するようにしてもよい。
【0025】図3は、上記制御プログラムを起動したと
きの表示画面を示した図である。
【0026】この表示画面であるウィンドウ21は、メ
ニューバー22、ツールバー23、ファイル一覧表示部
24、再生表示部27等を有して構成される。上記ファ
イル一覧表示部24には、複数の音声ファイルが表示可
能である。
【0027】また、上記再生表示部27には、音声デー
タファイルの再生時に再生表示部27上を移動して現在
の経過時間等を示す時間バー28が表示される。更に、
再生表示部27内には、インデックスマーク29が複数
表示可能となっている(図3では291 、292 の2つ
が示される)。このインデックスマークの設定について
は後述する。
【0028】図4は、デジタルレコーダ11による、録
音時に作成される音声ファイルの構造例を示した図であ
る。
【0029】音声ファイルの構造は、ヘッダ領域31
と、音声データ領域32とから構成されている。上記音
声データ領域32は、実際の音声によるメッセージに対
応したデータが記録される。
【0030】ヘッダ領域31は、例えばユーザIDデー
タ33a、録音開始日時データ33b、録音終了日時デ
ータ33c、インデックスマークアドレス(1)33d
及びインデックスマークアドレス(2)33eとにより
構成される。この場合、複数(図4では2つ)のインデ
ックスマークが記録可能となっており、録音中または再
生中に、デジタルレコーダ11のインデックスマーク釦
(図示せず)が押されると、その時点のアドレスが記録
されるようになっている。
【0031】尚、インデックスマークアドレス値の初期
値として、特定の値(例えばFFFFH )が記録されて
いるものとし、その特定の値であればインデックスマー
クは記録されていないと判断することができる。また、
図3の再生表示部27に於いても、インデックスマーク
29の存在が表示されるようになっている。
【0032】次に、図5のフローチャートを参照して、
本実施の形態に於ける、音声認識の処理動作について説
明する。
【0033】いま、操作者が、ファイル一覧表示部24
内に表示されている複数のファイルの中から、音声認識
処理を行いたい音声ファイルを、マウス17b等によっ
て選択した後、ツールバー23に表されている音声認識
釦23aを押す(クリックする)か、メニューバー22
の図示されないプルダウンメニューの中から「音声認識
の開始」を選択することにより、音声認識プログラムが
起動して当該音声ファイルの音声認識処理が開始され
る。
【0034】すると、先ずステップS1にて、音声認識
処理開始アドレス及び音声認識処理終了アドレスが初期
化される。この初期化により、上述したように、各アド
レスには“FFFF”が設定される。
【0035】次いで、ステップS2に於いて、1番目の
インデックスマークアドレスが“FFFF”であるか否
かが検出される。ここで、1番目のインデックスマーク
アドレスが“FFFF”であれば、初期値のままである
のでインデックスマークは設定されていないことにな
る。したがって、ステップS6へ移行して、音声ファイ
ルの全区間の音声データに対して音声認識処理が実行さ
れる。
【0036】上記ステップS2に於いて、1番目のイン
デックスマークアドレスが“FFFF”でない、すなわ
ちインデックスマークが設定されていた場合は、続くス
テップS3にて、その1番目のインデックスマークアド
レスの値が音声認識処理開始アドレスに設定される。
【0037】次に、ステップS4に於いて、2番目のイ
ンデックスマークアドレスが“FFFF”であるか否か
が検出される。ここで、2番目のインデックスマークア
ドレスが“FFFF”であれば、初期値のままであるの
でインデックスマークは設定されていないことになる。
したがって、ステップS8へ移行して、音声認識処理開
始アドレスから音声データ終了までの区間に対応する音
声データに対して音声認識処理が実行される。
【0038】また、上記ステップS4に於いて、2番目
のインデックスマークアドレスが“FFFF”でない、
すなわちインデックスマークが設定されていた場合は、
続くステップS5にて、その2番目のインデックスマー
クアドレスの値が音声認識処理終了アドレスに設定され
る。
【0039】そして、ステップS7に於いて、音声認識
処理開始アドレスから音声認識処理終了アドレスまでの
区間(音声認識範囲)に対応する音声データに対して、
音声認識処理が実行される。
【0040】このようにして、ウィンドウ21上の再生
表示部27に表示されているインデックスマーク291
からインデックスマーク292 までの区間だけ、音声認
識処理を行うことが可能になる。
【0041】図6は、メニューバー22上の「編集」メ
ニューが選択されて「インデックスマークの追加」が選
択された場合の例を示した図である。
【0042】「インデックスマークの追加」を実行した
場合、その時点に於ける音声ファイルデータの位置を示
すアドレスが、上述したインデックスマークアドレスと
して書込まれる。
【0043】デジタルレコーダ11のインデックス釦の
操作によるインデックスマークの追加、削除の他、この
ように、画面上に於いても、編集メニュー中のプルダウ
ンメニューからの選択により、インデックスマークの追
加、削除等が可能である。また、音声認識処理の実行に
先立って、音声認識処理を実行する音声ファイルの範囲
を設定することが可能である。
【0044】図7は、メニューバー22の「ツール」メ
ニュー中のプルダウンメニューから、上述した「音声認
識の範囲」を選択している例を示した図である。
【0045】この「音声認識の範囲」を選択して、更に
プルダウンメニューから「ファイル全体」か、「インデ
ックスマーク間」かを選択できるようになっている。こ
れらの項目選択は、マウス17b等の入力手段の操作に
より行われる。
【0046】尚、上述した実施の形態では、2つのイン
デックスマークが記録可能なものについての処理を説明
したが、これに限られるものではない。
【0047】例えば、図8に示されるように、ヘッダ領
域31を、例えばユーザIDデータ33a、録音開始日
時データ33b、録音終了日時データ33c、インデッ
クス(I)マークアドレス(1)33d〜インデックス
マークアドレス(15)33rにより構成する。この場
合、15のインデックスマークが記録可能となる。
【0048】このように、インデックスマークが2以上
記録可能なものに対しては、例えば図9に示されるよう
に、再生表示部27に於いてインデックスマークに挟ま
れた区間をマウス17bで選択してカラー等で表示させ
るようにし、その選択された区間の先頭のインデックス
マークと最後尾のインデックスマークを音声認識処理を
実行する区間とするようにすればよい。
【0049】次に、図10のフローチャートを参照し
て、任意の音声認識対象区間を選択した場合の音声認識
処理の動作について説明する。
【0050】操作者により、音声認識処理を行いたい音
声ファイルが選択されて音声認識対象区間が選択された
後に、ファイル一覧表示部24内に表示されている複数
のファイルの中から、ツールバー23に表されている音
声認識釦23aを押す(クリックする)か、メニューバ
ー22の図示されないプルダウンメニューの中から「音
声認識の開始」が選択される。すると、音声認識プログ
ラムが起動して当該音声ファイルの音声認識処理が開始
される。
【0051】そして、先ずステップS11にて、音声認
識処理開始アドレス及び音声認識処理終了アドレスが初
期化される。次いで、ステップS12に於いて、音声認
識を行うべく音声認識対象区間数が計数され、該音声認
識対象区間数rnが設定される。更に、ステップS13
にて、音声認識済み区間数をカウントするための変数i
に初期値として“1”が設定される。
【0052】ステップS14では、i番目のインデック
スマークに対応する音声認識処理開始アドレス及び音声
認識処理終了アドレスが、それぞれi番目の音声認識対
象区間の始点アドレス及びi番目の音声認識対象区間の
終点アドレスとして設定される。次いで、ステップS1
5では、上記音声認識処理開始アドレスから音声認識処
理終了アドレスまでの区間に対応する音声データに対し
て音声認識処理が実行される。
【0053】次に、ステップS16に於いて、変数iが
上記ステップS12で設定された音声認識対象区間数r
nに到達したか否かが検出される。ここで、まだ設定さ
れた音声認識対象区間数rnに到達していなければ、ス
テップS17に移行して変数iがインクリメントされ
る。その後、上記ステップS14へ移行して上記ステッ
プS16で変数iが音声認識対象区間数rnに到達する
まで、上述した処理が繰り返される。
【0054】そして、上記ステップS16にて変数iが
音声認識対象区間数rnに到達したならば、音声認識対
象区間の音声データが全て音声認識されたとして、本ル
ーチンを抜ける。
【0055】図11は、上述した音声認識対象区間につ
いて説明する図である。
【0056】いま、図11(a)に示されるように、再
生表示部27にインデックスマークが361 〜366
2つより多く設定されているとする。
【0057】ここで、例えば、音声認識を行いたい対象
区間をインデックスマーク362 〜363 内の区間とす
ると、マウス17bを操作して、該対象区間にマウスポ
インタ37を合わせる。そして、このマウスポインタ3
7を合わせた状態でマウス17bをクリックすると、図
11(b)に示されるように、インデックスマーク36
2 〜363 の間が選択されて表示される。この選択表示
は、例えば再生表示部27上で反転表示されるものであ
ってもよいし、他の色で表示されるようになっていても
よい。ここでは、図面に斜線で示される部分が選択され
た対象区間である。
【0058】上記したように音声認識対象区間の選択表
示がなされた状態で、ウィンドウ21のツールバー23
内の音声認識釦23aが押されると、上記対象区間の音
声データに対して音声認識処理が実行される。すなわ
ち、指定されたインデックスマークの対象区間だけ、音
声認識がなされる。
【0059】また、インデックスマークによる対象区間
が複数あって複数の対象区間を選択して音声認識を行う
場合は、選択した対象区間の表示動作を繰り返し行えば
よい。
【0060】すなわち、インデックスマーク362 〜3
3 の区間とインデックスマーク365 〜366 の区間
の音声認識を行いたい場合は、上述したように、インデ
ックスマーク362 〜363 の区間とインデックスマー
ク365 〜366 の区間について、マウスポインタ37
を合わせてクリックする。すると、図11(c)に示さ
れるように、2つの対象区間が選択されて表示される。
この状態でウィンドウ21のツールバー23内の音声認
識釦23aが押されると、上記2つの選択された対象区
間の音声データに対して音声認識処理が実行される。
【0061】このように、対象区間が連続していない部
分の音声認識を行いたい場合は、それぞれの区間にマウ
スポインタ37を合わせてクリック動作を行う。そし
て、選択された対象区間が表示された後に音声認識釦2
3aが押すと、上記対象区間の音声データがテキスト化
される。
【0062】また、選択する対象区間が連続している場
合は、選択する先頭の対象区間にマウスポインタ37を
合わせてクリックした状態のまま、連続する最後の対象
区間まで移動させてクリックを外す。これにより、複数
の連続した対象区間が選択されて音声認識が可能とな
る。
【0063】尚、対象区間の選択を取り消す場合は、取
り消したい対象区間にマウスポインタを合わせて、もう
一度クリックすればよい。
【0064】上述した実施の形態によれば、音声データ
中の所望の区間を選択して音声認識を行い、テキスト化
することが可能となる。
【0065】尚、本発明の上記実施の形態によれば、以
下の如き構成を得ることができる。
【0066】すなわち、 (1) インデックスマークを含む音声データに対して
音声認識処理を行い、音声データをテキスト化すること
が可能な音声処理制御システムに於いて、上記音声デー
タ中に於ける上記インデックスマークの位置を検出する
検出手段と、上記インデックスマークの位置に基いて上
記音声データの音声認識処理を行う範囲の指定を行う音
声認識処理範囲設定手段と、上記音声認識処理範囲設定
手段で設定された範囲の音声データに対して音声認識処
理を行い音声データをテキスト化する音声認識手段と、
を具備することを特徴とする音声処理装置。
【0067】(2) 上記音声認識処理範囲設定手段
は、上記音声データ中にインデックスマークが1つしか
行う付与されていなかった場合には、上記インデックス
マークの位置から音声データの最終位置までを音声認証
の対象範囲に設定することを特徴とする上記(1)に記
載の音声処理装置。
【0068】(3) 上記音声認識処理範囲設定手段
は、上記音声データの中にインデックスマークが2つ付
与されていた場合には、その2つのインデックスマーク
に挟まれた範囲を音声認識の対象範囲に設定することを
特徴とする上記(1)に記載の音声処理装置。
【0069】(4) 上記音声認識処理範囲設定手段
は、上記音声データの中にインデックスマークが複数個
付与されていた場合には、上記インデックスマークで区
切られた複数の区間のうち任意の区間を音声認識の対象
範囲として設定することが可能であることを特徴とする
上記(1)に記載の音声処理装置。
【0070】(5) 上記音声認識処理範囲設定手段
は、上記音声データにインデックスが付与されていない
場合には上記音声データの先頭位置から最終位置までを
音声認識の対象範囲に設定することを特徴とする上記
(1)に記載の音声処理装置。
【0071】(6) コンピュータに対して、インデッ
クスマークを含む音声データに対して音声認識処理を行
わせ、音声データをテキスト化させることが可能な音声
処理制御プログラムを記録した記録媒体に於いて、上記
音声処理制御プログラムはコンピュータに対して、上記
音声データ中に於ける上記インデックスマークの位置を
検出させ、上記インデックスマークの位置に基いて上記
音声データの音声認識処理を行う範囲の指定を行わせ、
上記指定された範囲の音声データに対して音声認識処理
を行わせ音声データをテキスト化させる音声認識を行わ
せることを特徴とする音声処理プログラムを記録した記
録媒体。
【0072】(7) 更に、上記インデックスマークの
位置に基いた範囲の音声認識処理を行うか、若しくは音
声データの全範囲に対して音声認識処理を行うかを選択
させ、音声データの全範囲に対して音声認識処理を行わ
せることが選択された場合には、上記音声データの先頭
位置から最終位置までを音声認識の対象範囲に設定させ
ることを特徴とする上記(6)に記載の音声処理プログ
ラムを記録した記録媒体。
【0073】(8) 上記音声データ中にインデックス
マークが1つしか付与されていなかった場合には、上記
インデックスマークの位置から音声データの最終位置ま
でを音声認識の対象範囲に設定させることを特徴とする
上記(6)に記載の音声処理プログラムを記録した記録
媒体。
【0074】(9) 上記音声データの中にインデック
スマークが2つ付与されていた場合には、その2つのイ
ンデックスマークに挟まれた範囲を音声認識の対象範囲
に設定させることを特徴とする上記(6)に記載の音声
処理プログラムを記録した記録媒体。
【0075】(10) 上記音声データの中にインデッ
クスマークが複数個付与されていた場合には、上記イン
デックスマークで区切られた複数の区間のうち任意の区
間を音声認識の対象範囲として設定させることが可能で
あることを特徴とする上記(6)に記載の音声処理プロ
グラムを記録した記録媒体。
【0076】(11) 上記音声データにインデックス
が付与されていない場合には、上記音声データの先頭位
置から最終位置までを音声認識の対象範囲に設定させる
ことを特徴とする上記(6)に記載の音声処理プログラ
ムを記録した記録媒体。
【0077】
【発明の効果】以上のように本発明によれば、音声ファ
イル中の所望の区間を選択して音声認識を行い、テキス
ト化することを可能とする、使い勝手のよい音声処理装
置及び音声処理プログラムを記録した記録媒体を提供す
ることができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態に係る音声処理システム
の概念を示すブロック構成図である。
【図2】本発明の一実施の形態に係る音声処理システム
の全体構成を示す図である。
【図3】パーソナルコンピュータ15内の制御プログラ
ムを起動したときの表示画面を示した図である。
【図4】デジタルレコーダ11による、録音時に作成さ
れる音声ファイルの構造例を示した図である。
【図5】本発明の一実施の形態に於ける、音声認識の処
理動作について説明するフローチャートである。
【図6】メニューバー22上の「編集」メニューが選択
されて「インデックスマークの追加」が選択された場合
の例を示した図である。
【図7】メニューバー22の「ツール」メニュー中のプ
ルダウンメニューから「音声認識の範囲」を選択してい
る例を示した図である。
【図8】デジタルレコーダ11による、録音時に作成さ
れる音声ファイルの構造の他の例を示した図である。
【図9】パーソナルコンピュータ15内の制御プログラ
ムを起動したときの表示画面で、再生表示部27に於い
てインデックスマークに挟まれた区間を選択して表示さ
せるようにした例を示す図である。
【図10】任意の音声認識対象区間を選択した場合の音
声認識処理の動作について説明するフローチャートであ
る。
【図11】音声認識対象区間について説明する図であ
る。
【符号の説明】
1 検出部、 2 音声認識処理範囲設定部、 3 音声認識部、 4 選択部、 11 デジタルレコーダ、 12 ミニチュアカード、 13 PCカードアダプタ、 15 パーソナルコンピュータ、 16 本体、 17a キーボード、 17b マウス、 18 ディスプレイ、 21 ウィンドウ、 22 メニューバー、 23 ツールバー、 23a 音声認識釦、 24 ファイル一覧表示部、 27 再生表示部、 28 時間バー、 29、291 、292 インデックスマーク。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 インデックスマークを含む音声データに
    対して音声認識処理を行い、音声データをテキスト化す
    ることが可能な音声処理制御システムに於いて、 上記音声データ中に於ける上記インデックスマークの位
    置を検出する検出手段と、 上記インデックスマークの位置に基いて上記音声データ
    の音声認識処理を行う範囲の指定を行う音声認識処理範
    囲設定手段と、 上記音声認識処理範囲設定手段で設定された範囲の音声
    データに対して音声認識処理を行い音声データをテキス
    ト化する音声認識手段と、 を具備することを特徴とする音声処理装置。
  2. 【請求項2】 上記インデックスマークの位置に基いた
    範囲の音声認識処理を行うか、若しくは音声データの全
    範囲に対して音声認識処理を行うかを選択する選択手段
    を更に具備し、 上記選択手段に於いて音声データの全範囲に対して音声
    認識処理を行うことが選択された場合には、上記音声認
    識処理範囲設定手段は上記音声データの先頭位置から最
    終位置までを音声認識の対象範囲に設定することを特徴
    とする請求項1に記載の音声処理装置。
  3. 【請求項3】 コンピュータに対して、インデックスマ
    ークを含む音声データに対して音声認識処理を行わせ、
    音声データをテキスト化させることが可能な音声処理制
    御プログラムを記録した記録媒体に於いて、上記音声処
    理制御プログラムはコンピュータに対して、 上記音声データ中に於ける上記インデックスマークの位
    置を検出させ、 上記インデックスマークの位置に基いて上記音声データ
    の音声認識処理を行う範囲の指定を行わせ、 上記指定された範囲の音声データに対して音声認識処理
    を行わせ音声データをテキスト化させる音声認識を行わ
    せることを特徴とする音声処理プログラムを記録した記
    録媒体。
JP11190500A 1999-07-05 1999-07-05 音声処理装置及び音声処理プログラムを記録した記録媒体 Pending JP2001022744A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11190500A JP2001022744A (ja) 1999-07-05 1999-07-05 音声処理装置及び音声処理プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11190500A JP2001022744A (ja) 1999-07-05 1999-07-05 音声処理装置及び音声処理プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2001022744A true JP2001022744A (ja) 2001-01-26

Family

ID=16259134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11190500A Pending JP2001022744A (ja) 1999-07-05 1999-07-05 音声処理装置及び音声処理プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2001022744A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019056746A (ja) * 2017-09-20 2019-04-11 株式会社野村総合研究所 データ変換装置
JP2020193994A (ja) * 2019-05-24 2020-12-03 株式会社ナレッジフロー 通話システム、及び通話プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019056746A (ja) * 2017-09-20 2019-04-11 株式会社野村総合研究所 データ変換装置
JP7088645B2 (ja) 2017-09-20 2022-06-21 株式会社野村総合研究所 データ変換装置
JP2020193994A (ja) * 2019-05-24 2020-12-03 株式会社ナレッジフロー 通話システム、及び通話プログラム

Similar Documents

Publication Publication Date Title
JP6060989B2 (ja) 音声録音装置、音声録音方法、及びプログラム
JP2005286903A (ja) 音響再生装置、音響再生システム、音響再生方法及び制御プログラム並びにこのプログラムを記録した情報記録媒体
JPH0651930A (ja) 計算機
US20020085022A1 (en) Presentation system, method for generating presentation data, and program for generating presentation data
JP2009265531A (ja) 内視鏡装置およびプログラム
JP2001022744A (ja) 音声処理装置及び音声処理プログラムを記録した記録媒体
JP3623820B2 (ja) 音声処理装置
US7027978B2 (en) Voice recording and reproducing apparatus, information processing apparatus, and recording medium having recorded an information processing program
JP3036430B2 (ja) 文章読み上げ装置
US20200241048A1 (en) Measurement system and method for recording context information of a measurement
JP2004302300A (ja) 情報処理方法
JP2004301980A (ja) 音声対話装置及び音声対話代行装置並びにそれらのプログラム
JPH11231867A (ja) 楽音表示装置
JP4270854B2 (ja) 音声記録装置、音声記録方法、音声記録プログラム及び記録媒体
US20050119888A1 (en) Information processing apparatus and method, and program
JP7539278B2 (ja) 情報処理装置、プログラム、および情報処理方法
JPH113249A (ja) 操作性評価支援装置
JP4273821B2 (ja) 音声データ処理プログラム
JP2003141859A (ja) 画像音声再生システム、プログラム、及び記録媒体
JP2002247489A (ja) 記録装置、記録方法、記録プログラム、記録再生装置、記録再生プログラム、記録媒体
JP2001060149A (ja) 文書作成装置及び文書作成処理プログラムを記録した記録媒体
JP2007034422A (ja) データ記録装置及びデータ再生装置
JP3273713B2 (ja) 音響心理試験装置
JP2000259387A (ja) 音声認識装置、音声認識処理プログラムを記録した記録媒体、及び音声認識処理方法
JP4710600B2 (ja) データ転送装置、データ転送再生システム、データ転送方法、データ転送再生方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060516

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080404

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081216