JP2000020091A - 音声記録再生装置 - Google Patents

音声記録再生装置

Info

Publication number
JP2000020091A
JP2000020091A JP10189325A JP18932598A JP2000020091A JP 2000020091 A JP2000020091 A JP 2000020091A JP 10189325 A JP10189325 A JP 10189325A JP 18932598 A JP18932598 A JP 18932598A JP 2000020091 A JP2000020091 A JP 2000020091A
Authority
JP
Japan
Prior art keywords
voice
data
recording
command
voice command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10189325A
Other languages
English (en)
Inventor
Hiroaki Momose
裕明 百瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP10189325A priority Critical patent/JP2000020091A/ja
Publication of JP2000020091A publication Critical patent/JP2000020091A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 音声データを再生出力するだけで、音声認識
装置により音声認識処理をさせることができる使い勝手
の良い音声記録再生装置を提供する。 【解決手段】 音声認識処理装置と接続可能であって、
該音声認識装置に対して記録した音声データを再生出力
する音声記録再生装置において、上記音声データが記録
される記録媒体7と、上記音声認識装置による音声認識
処理の開始や終了等を制御するための所定の音声コマン
ドを記憶しており、上記音声データに対して無音データ
を挟んでその音声コマンドを挿入するシステム制御部6
と、上記音声データに上記所定の音声コマンドが挿入さ
れたデータを上記音声認識装置に出力するEAR端子1
3と、上記音声コマンドや無音データ長を変更可能な操
作入力部9とを備えた音声記録再生装置。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声記録再生装
置、より詳しくは、音声認識装置に対して記録された音
声データを再生出力する音声記録再生装置に関する。
【0002】
【従来の技術】いわゆる音声ワードプロセッサ、あるい
は、口述することにより音声データを入力すると、該音
声データに基づいて自動的に文書を作成し、それを画面
等に表示するディクテーションシステムの実現は、従来
からの音声認識システム開発における一つの目標であ
り、現在、活発に研究や開発が進められている。
【0003】こうした近年の音声認識技術の進歩に伴っ
て、パーソナルコンピュータにマイクロフォンを接続
し、このマイクロフォンを用いて入力した音声を、該パ
ーソナルコンピュータ上で文書化して画面に表示させる
装置が開発されていて、一般に市販されている。
【0004】このようなディクテーションシステムに
は、入力された音声を認識して文書に変換するディクテ
ーションモードと、ある特定の音声コマンドを認識して
上記ディクテーションシステムやアプリケーションの制
御を行うコマンドモードとの2つのモードを有するもの
がある。
【0005】上記ディクテーションモードにおいては、
連続音声認識でボキャブラリと呼ばれる音響モデルと、
単語の順序列によって発生単語の尤度を決める言語モデ
ルとによって、入力された音声を音声認識処理して文書
に変換する。
【0006】また、上記コマンドモードでは、特定のコ
マンドのみを音響モデルによって認識処理し、その認識
結果となるコマンドの種類に応じて、所定の処理を行う
ようになっている。
【0007】このようなディクテーションシステムは、
認識した該音声コマンドに応じてディクテーションモー
ドの可/不可、つまりディクテーションモードの開始/
終了を切り替えるようになっているために、例えばマウ
ス等の他の入力操作装置による操作を必要とすることな
く、文書作成時の音声入力の可/不可を切り替えること
が可能である。
【0008】一方、従来より、文書を作成するにあた
り、作成したい文書の内容を一旦テープレコーダ等の録
音装置に口述録音して、後で秘書やタイピスト等がその
口述内容を再生しながら、タイプライタやワードプロセ
ッサ等の文書作成装置により文書化する、といった形態
をとることが、テープレコーダ等の録音装置の有効な利
用形態の1つとして一般化している。このような録音装
置を用いて口述する利用形態においては、以前から録音
内容を自動的に文書に変換する技術の実現が強く望まれ
ている。
【0009】また、近年のコンピュータ技術やデジタル
信号処理技術等の発展により、録音内容をデジタルデー
タ化して、フラッシュメモリ等の書き込みや消去が可能
な記録媒体に記録する、いわゆるデジタルレコーダが開
発されるようになり、さらに、そのデジタル化された録
音内容をパーソナルコンピュータに転送して、該パーソ
ナルコンピュータにおいて録音内容を再生することが可
能となっている。
【0010】本出願人は、このようなデジタルレコーダ
から転送された録音データを、パーソナルコンピュータ
上において簡単な操作で扱うことを可能とする音声デー
タの処理制御装置を開発しており、特願平9−1497
28号においてその提案を行っている。
【0011】さらに本出願人は、デジタル記録された音
声データを、上記音声データの処理制御装置から音声認
識装置に渡して音声認識させ、文書として画面に表示さ
せるディクテーションシステムを開発しており、特願平
9−149729号において提案している。このような
ディクテーションシステムによれば、コンピュータの前
に座って該コンピュータに接続されたマイクロフォン等
を介して直接音声入力をする必要がなく、一旦デジタル
レコーダに録音して、後でコンピュータにその録音デー
タを転送して文書を作成することができるようになって
いる。
【0012】このような音声認識装置において音声認識
処理を行うときには、デジタルで音声データを入力する
ために、上述したディクテーションの開始/終了の切り
換えは、音声ファイルのインデックス情報に基づいて処
理プログラムにより自動的に行うことが可能である。
【0013】
【発明が解決しようとする課題】上述したような従来の
音声記録再生装置では、ディクテーションモードを開始
するときに、予めディクテーションモードを開始するた
めの音声コマンドを音声データの前に録音しておくか、
あるいはディクテーションモードを開始するための所定
の操作を行った後で、該音声記録再生装置に設けられて
いる再生釦等を押さなければならず、操作がやや面倒で
ある。
【0014】同様に、ディクテーションモードを終了す
るときにも、該ディクテーションモードを終了するため
の音声コマンドを音声データの後に録音しておくか、あ
るいは音声認識処理が終了するのを待って所定の操作に
より該ディクテーションモードを終了しなければなら
ず、やはり操作がやや面倒であった。
【0015】本発明は上記事情に鑑みてなされたもので
あり、音声データを再生出力するだけで、音声認識装置
により音声認識処理をさせることができる使い勝手の良
い音声記録再生装置を提供することを目的としている。
【0016】
【課題を解決するための手段】上記の目的を達成するた
めに、第1の発明による音声記録再生装置は、音声認識
装置と接続可能であって、該音声認識装置に対して記録
された音声データを再生出力する音声記録再生装置にお
いて、上記音声データが記録される記録媒体と、上記音
声認識装置の音声認識処理を制御する所定の音声コマン
ドが記憶される記憶部と、上記音声データに対して上記
所定の音声コマンドを挿入する挿入手段と、上記音声デ
ータに上記所定の音声コマンドが挿入されたデータを上
記音声認識装置に出力する出力手段とを備えたものであ
る。
【0017】また、第2の発明による音声記録再生装置
は、上記第1の発明による音声記録再生装置において、
上記挿入手段が、上記所定の音声コマンドとともに、上
記音声データと上記所定の音声コマンドの間に無音デー
タを挿入するものである。
【0018】さらに、第3の発明による音声記録再生装
置は、上記第1または第2の発明による音声記録再生装
置において、上記記憶部に記憶された音声コマンドを変
更する音声コマンド変更手段を備えたものである。
【0019】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1から図4は本発明の一実施形
態を示したものであり、図1は音声記録再生装置の主と
して電気的な構成を示すブロック図である。
【0020】この音声記録再生装置は、音声を入力して
電気信号に変換する音声入力手段たるマイクロフォン1
と、このマイクロフォン1からの音声信号を適正なレベ
ルに増幅するための増幅器(AMP)2と、この増幅器
2により増幅された音声信号から不要な高域成分を除去
するためのローパスフィルタ(LPF)3と、このロー
パスフィルタ3から出力されたアナログの音声信号をデ
ジタルデータに変換するためのA/D変換器4と、この
デジタルデータ化された音声信号を録音動作時に符号化
(圧縮)するとともに、再生動作時に符号化データの復
号化(伸長)を行うデジタル信号処理部(DSP)5
と、このデジタル信号処理部5から出力される復号化さ
れたデジタルの音声信号をアナログ信号に変換するため
のD/A変換器10と、このD/A変換器10によりア
ナログ信号に変換された音声信号から量子化雑音等の不
要な高域成分を除去するためのローパスフィルタ(LP
F)11と、このローパスフィルタ11の出力を増幅す
るパワーアンプ(AMP)12と、このパワーアンプ1
2の出力を外部に接続するための出力手段たるEAR端
子13と、上記パワーアンプ12により駆動されて音声
を発するスピーカ14と、上記デジタル信号処理部5の
制御を含むこの音声記録再生装置の動作を統括的に制御
するための制御手段であり挿入手段、記憶部、検出手段
を兼ねたシステム制御部(CPU)6と、上記デジタル
信号処理部5から出力される符号化された音声データを
システム制御部6を介して入力し記録して保持するもの
であり例えばフラッシュメモリで構成されている記録媒
体7と、上記システム制御部6の制御によりこの音声記
録再生装置に係る各種の情報を表示する表示器8と、上
記システム制御部6に接続されていて各種の操作入力を
行うためのものであり音声コマンド変更手段、無音デー
タ長変更手段、切換スイッチを兼ねた操作入力部9と、
を有して構成されている。
【0021】上記操作入力部9は、上記記録媒体7への
入力音声の記録開始を指示するための録音釦RECと、
上記記録媒体7に記録されている音声データの再生開始
を指示するための再生釦PLAYと、録音,再生,早送
り,早戻し等の動作を停止させるための停止釦STOP
と、再生や録音を行う際の現在位置を早送りするための
早送り釦FFと、上記現在位置を早戻しするための早戻
し釦REWと、この音声記録再生装置に係る各種のメニ
ューを選択するためのメニュー釦MENUとを含む複数
の操作釦を有するとともに、さらに、この音声記録再生
装置の再生モードが音声認識モードか非音声認識モード
かを切り換えるための音声認識モード切換スイッチSR
を有して構成されていて、これらの状態が上記システム
制御部6によりそれぞれ検出されるようになっている。
【0022】これにより上記システム制御部6は、この
操作入力部9の操作に応じて、上記デジタル信号処理部
5と記録媒体7の動作を制御するようになっている。
【0023】また、上記システム制御部6は、その内部
に、バッファとしてのメモリと、所定の音声コマンドが
圧縮符号化されて記憶されている記憶部たるメモリとを
備えていて、上述したように、所定の音声コマンドを挿
入する挿入手段の構成要素となっている。ここに上記所
定の音声コマンドは、本実施形態の場合には、音声認識
装置にディクテーションモードを開始させるための「音
声入力開始」と、同ディクテーションモードを終了させ
るための「音声入力終了」とである。
【0024】さらに、上記記録媒体7は、本実施形態で
はフラッシュメモリを用いるものとしたが、これに限る
ものではなく、光磁気ディスクや磁気ディスク等であっ
ても良く、さらに、これらは固定式と着脱式の何れであ
っても構わない。
【0025】なお、上記EAR端子13は、本実施形態
においては、モノラルの音声信号を出力するものとして
いる。
【0026】次に、このような音声記録再生装置におけ
る録音処理について説明する。なお、音声記録再生装置
における再生処理については後で説明する。
【0027】上記操作入力部9の録音釦RECが押され
ると、上記システム制御部6がこれを検出し、上記マイ
クロフォン1から入力された音声が上記パワーアンプ2
によって増幅される。
【0028】このパワーアンプ2の出力は、エリアシン
グノイズの発生を防止するべくローパスフィルタ3によ
り不要な周波数帯域をカットされ、さらに、A/D変換
器4によりアナログ信号からデジタル信号に変換され
て、上記デジタル信号処理部5に入力される。
【0029】上記デジタル化された音声信号は、このデ
ジタル信号処理部5において、符号化して圧縮され、上
記システム制御部6へ出力されて、その内部のバッファ
に一旦蓄積される。
【0030】そしてシステム制御部6は、符号化された
音声データを記録媒体7へ出力することにより、該記録
媒体7に音声データが記録されるようになっている。
【0031】続いて、図2は、音声認識装置の主として
電気的な構成を示すブロック図である。
【0032】この実施形態の音声認識装置は、後述する
音声認識処理プログラム29によって所定の処理を行う
コンピュータ21により構成されており、アナログの音
声信号を入力する音声入力手段である入力端子22と、
この入力端子22から入力した音声信号をデジタル信号
に変換するA/D変換器23と、このA/D変換器23
を制御する第2CPU24と、音声認識処理,音声入力
処理,表示処理,操作制御等を含むこの音声認識装置全
体の統括的な制御を行う第1CPU25と、この第1C
PU25により音声認識処理を行う際に音声データを保
持するとともにその作業用の記憶領域となるメモリ26
と、上記第1CPU25により音声認識処理を行うため
の音声認識処理プログラム29が記録されている記録媒
体28と、例えばキーボードやマウス等でなる操作部2
7と、例えばディスプレイ等でなる表示装置30と、を
有して構成されている。
【0033】上述した音声記録再生装置におけるEAR
端子13がモノラルの音声信号を出力するものであった
のに対応して、上記入力端子22は、本実施形態におい
ては、上記音声記録再生装置により記録された音声信号
を、モノラルで入力可能な端子として構成されており、
例えばコンピュータのラインイン端子が用いられてい
る。
【0034】音声認識装置としての上記コンピュータ2
1は、上記音声認識処理プログラム29による処理を開
始したときには、特定の音声コマンドのみを認識するコ
マンドモードになるように設定されている。この音声コ
マンドは、当該音声認識装置の動作を制御するためのも
のである。すなわち、コマンドモードにあるときは、所
定の音声コマンドのみを認識して、それ以外の音声につ
いては認識しないようになっている。それ故に、音声を
文書に変換して上記表示装置30に表示する動作も行わ
ない。
【0035】本実施形態では特定のコマンドとして、デ
ィクテーションモードを開始する音声コマンド「音声入
力開始」のみを認識するものとする。ディクテーション
モードとは、上述したように、連続音声認識により認識
した音声を文書に変換して、表示装置30に表示するモ
ードである。
【0036】また、このディクテーションモードの最中
に「音声入力終了」という該ディクテーションモードを
終了するための音声コマンドが認識されると、元のコマ
ンドモードに復帰して、ディクテーション認識を行うの
が不可能な状態になるように構成されている。
【0037】次に、上述したような音声記録再生装置の
再生処理を図3のフローチャートを参照して説明する。
【0038】上述したように音声記録再生装置の記録媒
体7に音声信号を記録したら、使用者は、この音声記録
再生装置と音声認識装置であるコンピュータ21との接
続を行う。
【0039】すなわち、音声記録再生装置の音声出力端
子であるEAR端子13に、オーディオケーブルの一方
の端子を接続するとともに、他方の端子を音声認識装置
であるコンピュータ21の入力端子22に接続する。な
お、この実施形態におけるオーディオケーブルは、上述
したように出力がモノラルであるのに対応して、両側に
モノラル端子が設けられたものを用いている。
【0040】次に、コンピュータ21側において音声認
識処理プログラム29を所定の操作により起動させると
ともに、音声記録再生装置側において再生釦PLAYを
押すことにより録音された音声データを再生する。
【0041】再生釦PLAYが押されたことをシステム
制御部6が検出すると、該システム制御部6は、音声認
識モード切換スイッチSRがオン/オフの何れの状態と
なっているかを検出する。
【0042】この音声認識モード切換スイッチSRがオ
ンとなっているときには、システム制御部6は、音声認
識モードであると認識して、音声データの前後にディク
テーション開始およびディクテーション終了の音声コマ
ンドを所定時間の無音を挟んで自動的に付加して出力す
るようになっている。
【0043】すなわち、システム制御部6は、まず、そ
の内部の記憶部に記録されているディクテーションモー
ドを開始する音声コマンド「音声入力開始」の符号化デ
ータをデジタル信号処理部5に出力するとともに(ステ
ップS1)、その後に所定時間(例えば5秒間)の第1
の無音を付加して出力する(ステップS2)。
【0044】次に、記録媒体7の再生位置を検出して、
内部バッファを介して音声データをシステム制御部6へ
入力し、デジタル信号処理部5に出力する(ステップS
3)。
【0045】上記音声データを出力し終えてファイルの
終了が確認されたら、システム制御部6は、まず、所定
時間(例えば5秒間)の第2の無音をデジタル信号処理
部5に出力するとともに(ステップS4)、その後にデ
ィクテーションモードを終了する音声コマンド「音声入
力終了」の符号化データを出力する(ステップS5)。
【0046】上記デジタル信号処理部5は、上述したよ
うに入力された音声コマンド、所定時間の無音、音声デ
ータを、上記システム制御部6の制御に基づいて複合化
して出力する。
【0047】この複合化されたデジタル信号は、D/A
変換器10に入力されてアナログ信号に変換された後
に、上記ローパスフィルタ11により不要な周波数をカ
ットして量子化雑音等の軽減が行われる。さらにその音
声信号が、パワーアンプ12により増幅されてから、上
記EAR端子13にオーディオケーブルが接続されてい
る場合には、このEAR端子13に出力される。
【0048】続いて、上述したような音声記録再生装置
の出力を受けて、音声認識装置であるコンピュータ21
において行われる音声認識処理について説明する。
【0049】上記音声記録再生装置のEAR端子13か
ら出力される音声信号は、上記オーディオケーブルを介
して、入力端子22からコンピュータ21に入力され
る。
【0050】この音声信号は、A/D変換器23に入力
されて、所定のサンプリング周波数、例えば12kHz
のサンプリング周波数により例えばPCMのデジタル信
号に変換される。
【0051】このサンプリング周波数による量子化は、
上記音声認識処理プログラム29によって動作する上記
第1CPU25の命令に基づいて、第2CPU24がA
/D変換器23を制御することにより行われる。
【0052】こうしてデジタル信号に変換された音声デ
ータは、第2CPU24と第1CPU25を介して、一
旦メモリ26に記憶される。
【0053】次に、このメモリ26中の音声データに対
して、上記第1CPU25が、上記音声認識処理プログ
ラム29に基づいて音声認識処理を行う。
【0054】すなわち、まず最初に、ファイルの先頭に
挿入されたディクテーションモードを開始する音声コマ
ンド「音声入力開始」の認識を行い、これが認識された
場合には、ディクテーションモードを開始する。
【0055】音声コマンドの後に挿入された所定時間の
第1の無音を入力し終えると、録音した音声データの音
声認識処理が行われる。この認識結果は、上記第1CP
U25の制御によって、上記表示装置30の所定の場所
に表示される。
【0056】こうして音声データの音声認識が終了する
と、まず、所定時間の第2の無音が入力された後に、デ
ィクテーションモードを終了する音声コマンド「音声入
力終了」が入力され、この該音声コマンドが認識される
と、当該音声認識装置は、このディクテーションモード
を終了する。
【0057】また、上記無音の時間は変更することがで
きるようになっている。この所定の無音時間を変更する
動作について、図4を参照して説明する。
【0058】なお、上述したように、ディクテーション
モードを開始する音声コマンドの後に挿入する無音が第
1の無音であり、ディクテーションモードを終了する音
声コマンドの前に挿入する無音が第2の無音である。
【0059】上記音声記録再生装置のメニュー釦MEN
Uを、所定時間(T秒)以上、例えば3秒以上押し続け
たことを上記システム制御部6が検出すると(ステップ
S11)、このシステム制御部6は、各種のモード設定
を行うための設定モードに入る。
【0060】この設定モードにおいては、設定可能な複
数のモードがあって、早戻し釦REWと早送り釦FFを
操作することにより、これらの複数のモードの内の着目
するモードを変更することができ、さらに再生釦PLA
Yを押すことにより、その着目したモードを選択するこ
とができるようになっている。なお、停止釦STOPを
押した場合には、キャンセルとなってこの設定モードか
ら抜けることができるようになっている。
【0061】こうして所定の無音を設定する無音時間設
定モードが選択されたか否かを判断し(ステップS1
2)、選択されている場合には、まず、上記第1の無音
の時間を、上記早戻し釦REWと早送り釦FFを操作す
ることにより、秒単位で変更し、その変更値を決定する
ときは上記再生釦PLAYを押すことにより行う(ステ
ップS13)。
【0062】続いて、上記第2の無音の時間を、上述し
た第1の無音の場合と同様の手順により設定する(ステ
ップS14)。
【0063】このように上記無音の時間を変更可能とす
ることにより、音声認識装置によるディクテーション開
始の音声コマンドを認識した後に、ディクテーションモ
ードになるまでの処理時間の違いや、音声データの音声
認識が終了した後に、音声コマンドによりディクテーシ
ョンモードを抜けるまでの処理時間等の違いに柔軟に対
応することができるようになっている。その結果、音声
認識装置の処理方法や処理速度によらず、録音された音
声を初めから終わりまで別途の操作を要することなく音
声認識することが可能となる。
【0064】なお、上述した操作釦は一例であり、どの
ような釦やスイッチ等を行うことにより操作することが
できるように構成しても構わない。
【0065】さらに、上記音声コマンドは変更すること
ができるようになっている。この音声コマンドを変更す
る動作について、上記図4を参照してさらに説明する。
【0066】上記ステップS12において、無音時間の
設定を行うのでない場合には、さらに音声コマンドの設
定を行うか否かを判断し(ステップS15)、音声コマ
ンド設定モードが選択されていない場合には、上記ステ
ップS12へ戻って選択が行われるのを待機する。な
お、音声コマンド設定モードの選択は、上述した無音時
間設定モードの選択と同様に行う。
【0067】こうして、音声コマンド設定モードが選択
された場合には、まずディクテーションモードを開始す
るための音声コマンドの設定を行う(ステップS1
6)。
【0068】すなわち、この音声コマンドの設定モード
に入ると、録音釦RECを押して、設定したい音声コマ
ンドを発声することにより、該音声コマンドの録音を行
い、発声が終了したところで停止釦STOPを押す。
【0069】こうして録音したものを音声コマンドとし
て決定する場合には、再生釦PLAYを押し、そうでな
い場合には、上述したような操作を繰り返すことによ
り、再度の音声コマンドの録音を行うことができる。
【0070】このようにディクテーションモードを開始
するための音声コマンドが設定されたら、続いて、ディ
クテーションモードを終了するための音声コマンドの設
定を、上述と同様に録音釦RECを押して録音すること
により行い(ステップS17)、設定がなされたところ
で終了する。
【0071】上述したように、音声コマンドを任意に設
定することができるようにしたために、異なる音声コマ
ンドを有する音声認識装置であっても、柔軟に対応する
ことができる。
【0072】なお、音声コマンドを設定するための上述
した操作釦は、一例であって、どのような釦やスイッチ
等を操作用に割り当てても構わない。さらに、音声コマ
ンドも、1つに限らず、複数登録することができるよう
にしても良い。
【0073】また、上述したような構成は、デジタル式
の音声記録再生装置に適用するに限定されるものではな
く、アナログ式の音声記録再生装置にも適用可能であ
る。
【0074】このような実施形態の音声記録再生装置に
よれば、音声コマンドがシステム制御部内の記憶部に予
め記憶されているために、音声の録音を行う際に、音声
コマンドの発声を別途行う必要がなく、操作性が向上す
る。
【0075】そして、音声認識装置と接続して再生を行
うだけで、上記記憶部の音声コマンドが自動的に音声デ
ータに挿入されて、録音された音声データを音声認識装
置により自動的に音声認識処理させることが可能とな
る。
【0076】また、無音時間を変更することができるた
めに、音声認識装置の処理速度に関わらず、全ての音声
データを別途の操作を要することなく音声認識処理する
ことが可能となる。
【0077】さらに、音声コマンドを変更することがで
きるために、音声コマンドが異なる音声認識装置により
音声認識を行う際にも、柔軟に対応して適用することが
できるようになる。
【0078】加えて、音声認識モード切換スイッチを設
けたことにより、スピーカを介して音声を再生するなど
の、音声認識を行わない通常の再生等の場合には、音声
コマンドが自動的に付加されることはなく、使い勝手が
向上する。
【0079】なお、本発明は上述した各実施形態に限定
されるものではなく、発明の主旨を逸脱しない範囲内に
おいて種々の変形や応用が可能であることは勿論であ
る。
【0080】[付記]以上詳述したような本発明の上記
実施形態によれば、以下のごとき構成を得ることができ
る。
【0081】(1) 音声認識装置と接続可能であっ
て、該音声認識装置に対して記録された音声データを再
生出力する音声記録再生装置において、上記音声データ
が記録される記録媒体と、上記音声認識装置の音声認識
処理を制御する所定の音声コマンドが記憶される記憶部
と、上記音声データに対して上記所定の音声コマンドを
挿入する挿入手段と、上記音声データに上記所定の音声
コマンドが挿入されたデータを上記音声認識装置に出力
する出力手段と、を具備したことを特徴とする音声記録
再生装置。
【0082】(2) 上記挿入手段は、上記所定の音声
コマンドとともに、上記音声データと上記所定の音声コ
マンドの間に無音データを挿入するものであることを特
徴とする付記(1)に記載の音声記録再生装置。
【0083】(3) 上記記憶部に記憶された音声コマ
ンドを変更する音声コマンド変更手段を具備したことを
特徴とする付記(1)または付記(2)に記載の音声記
録再生装置。
【0084】(4) 上記挿入手段は、上記無音データ
の長さを変更する無音データ長変更手段を有することを
特徴とする付記(2)に記載の音声記録再生装置。
【0085】(5) 音声データを音声認識処理させる
音声認識モードと、音声データを音声認識させない非音
声認識モードとを切り換える切換スイッチと、上記切換
スイッチの状態を検出する検出手段と、を有し、上記挿
入手段は、上記検出手段によって上記音声認識モードが
検出された際に、上記所定の音声コマンドを上記音声デ
ータに挿入するものであることを特徴とする付記
(1)、付記(2)、付記(3)、または付記(4)に
記載の音声記録再生装置。
【0086】(6) 上記所定の音声コマンドは、上記
音声認識装置の音声認識処理を開始させる音声コマンド
であることを特徴とする付記(1)に記載の音声記録再
生装置。
【0087】(7) 上記所定の音声コマンドは、上記
音声認識装置の音声認識処理を終了させる音声コマンド
であることを特徴とする付記(1)に記載の音声記録再
生装置。
【0088】従って、付記(1)に記載の発明によれ
ば、音声認識装置に対して記録された音声データを再生
出力するだけで、該音声認識装置を制御して音声認識処
理をさせることが可能となり、使い勝手が向上する。
【0089】また、付記(2)に記載の発明によれば、
付記(1)に記載の発明と同様の効果を奏するととも
に、音声認識装置の処理速度によらず全ての音声データ
を音声認識処理させることが可能となる。
【0090】さらに、付記(3)に記載の発明によれ
ば、付記(1)または付記(2)に記載の発明と同様の
効果を奏するとともに、音声コマンドが異なる音声認識
装置に対しても柔軟に適応させることができる。
【0091】付記(4)に記載の発明によれば、付記
(2)に記載の発明と同様の効果を奏するとともに、無
音データの長さを変更することにより、より広い範囲の
音声認識装置に対応することができる。
【0092】付記(5)に記載の発明によれば、付記
(1)、付記(2)、付記(3)、または付記(4)に
記載の発明と同様の効果を奏するとともに、切換スイッ
チにより音声認識モードと非音声認識モードを自由に切
り換えることが可能になるとともに、所定の音声コマン
ドを上記音声データに挿入するか否かを、この切換スイ
ッチの状態を検出することにより自動的に行うことがで
き、使い勝手をより向上させることができる。
【0093】付記(6)に記載の発明によれば、付記
(1)に記載の発明と同様の効果を奏するとともに、所
定の音声コマンドを音声認識処理を開始させる音声コマ
ンドとすることにより、音声認識処理を自動的に開始さ
せることができる。
【0094】付記(7)に記載の発明によれば、付記
(1)に記載の発明と同様の効果を奏するとともに、所
定の音声コマンドを音声認識処理を終了させる音声コマ
ンドとすることにより、音声認識処理を自動的に終了さ
せることができる。
【0095】
【発明の効果】以上説明したように請求項1による本発
明の音声記録再生装置によれば、音声認識装置に対して
記録された音声データを再生出力するだけで、該音声認
識装置を制御して音声認識処理をさせることが可能とな
り、使い勝手が向上する。
【0096】また、請求項2による本発明の音声記録再
生装置によれば、請求項1に記載の発明と同様の効果を
奏するとともに、音声認識装置の処理速度によらず全て
の音声データを音声認識処理させることが可能となる。
【0097】さらに、請求項3による本発明の音声記録
再生装置によれば、請求項1または請求項2に記載の発
明と同様の効果を奏するとともに、音声コマンドが異な
る音声認識装置に対しても柔軟に適応させることができ
る。
【図面の簡単な説明】
【図1】本発明の一実施形態の音声記録再生装置の主と
して電気的な構成を示すブロック図。
【図2】上記実施形態の音声認識装置の主として電気的
な構成を示すブロック図。
【図3】上記実施形態の音声記録再生装置の再生処理を
示すフローチャート。
【図4】上記実施形態の音声記録再生装置における無音
時間の設定および音声コマンドの設定の処理を示すフロ
ーチャート。
【符号の説明】
1…マイクロフォン 5…デジタル信号処理部 6…システム制御部(挿入手段、記憶部、検出手段) 7…記録媒体 8…表示器 9…操作入力部(音声コマンド変更手段、無音データ長
変更手段、切換スイッチ) 13…EAR端子(出力手段) 14…スピーカ 21…コンピュータ(音声認識装置) 29…音声認識処理プログラム

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 音声認識装置と接続可能であって、該音
    声認識装置に対して記録された音声データを再生出力す
    る音声記録再生装置において、 上記音声データが記録される記録媒体と、 上記音声認識装置の音声認識処理を制御する所定の音声
    コマンドが記憶される記憶部と、 上記音声データに対して上記所定の音声コマンドを挿入
    する挿入手段と、 上記音声データに上記所定の音声コマンドが挿入された
    データを上記音声認識装置に出力する出力手段と、 を具備したことを特徴とする音声記録再生装置。
  2. 【請求項2】 上記挿入手段は、 上記所定の音声コマンドとともに、上記音声データと上
    記所定の音声コマンドの間に無音データを挿入するもの
    であることを特徴とする請求項1に記載の音声記録再生
    装置。
  3. 【請求項3】 上記記憶部に記憶された音声コマンドを
    変更する音声コマンド変更手段を具備したことを特徴と
    する請求項1または請求項2に記載の音声記録再生装
    置。
JP10189325A 1998-07-03 1998-07-03 音声記録再生装置 Withdrawn JP2000020091A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10189325A JP2000020091A (ja) 1998-07-03 1998-07-03 音声記録再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10189325A JP2000020091A (ja) 1998-07-03 1998-07-03 音声記録再生装置

Publications (1)

Publication Number Publication Date
JP2000020091A true JP2000020091A (ja) 2000-01-21

Family

ID=16239473

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10189325A Withdrawn JP2000020091A (ja) 1998-07-03 1998-07-03 音声記録再生装置

Country Status (1)

Country Link
JP (1) JP2000020091A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006223357A (ja) * 2005-02-15 2006-08-31 Olympus Corp 医療支援システム
KR101317941B1 (ko) * 2012-03-02 2013-10-18 (주)파워보이스 음성인식을 기반으로 통신 서비스 연결을 수행하는 단말 및 방법, 그리고 음성인식을 위한 소리 데이터를 생성하는 방법
WO2019053864A1 (ja) * 2017-09-14 2019-03-21 株式会社ソシオネクスト 電子機器制御システム、音声出力装置及びそれらの方法
CN111079414A (zh) * 2019-07-02 2020-04-28 广东小天才科技有限公司 一种听写检测方法、电子设备及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006223357A (ja) * 2005-02-15 2006-08-31 Olympus Corp 医療支援システム
KR101317941B1 (ko) * 2012-03-02 2013-10-18 (주)파워보이스 음성인식을 기반으로 통신 서비스 연결을 수행하는 단말 및 방법, 그리고 음성인식을 위한 소리 데이터를 생성하는 방법
WO2019053864A1 (ja) * 2017-09-14 2019-03-21 株式会社ソシオネクスト 電子機器制御システム、音声出力装置及びそれらの方法
JPWO2019053864A1 (ja) * 2017-09-14 2020-08-27 株式会社ソシオネクスト 電子機器制御システム、音声出力装置及びそれらの方法
US11455993B2 (en) 2017-09-14 2022-09-27 Socionext Inc. Electronic device controlling system, voice output device, and methods therefor
CN111079414A (zh) * 2019-07-02 2020-04-28 广东小天才科技有限公司 一种听写检测方法、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US7119267B2 (en) Portable mixing recorder and method and program for controlling the same
US20010032071A1 (en) Portable data recording and/or data playback device
KR100609171B1 (ko) 이어폰의 기능 키를 이용한 음악 재생 제어 장치 및 방법
JP2000020091A (ja) 音声記録再生装置
JP2005044409A (ja) 情報再生装置、情報再生方法および情報再生プログラム
JP3859201B2 (ja) ポータブルミキシング記録装置及びその制御方法並びにプログラム
JPH1152995A (ja) 音声再生装置
JPH10116097A (ja) 音声再生装置
JP4248636B2 (ja) 音声録音装置
JPH0916200A (ja) 音声記録再生装置
JPH11167396A (ja) 音声記録再生装置
JP2006243128A (ja) 再生装置及び再生方法
JP2000206992A (ja) 音声記録装置、音声再生装置、音声処理装置
JP2004235979A (ja) 音入出力装置および音入出力方法
JP4222665B2 (ja) 音声記録再生装置
JP2000122694A (ja) 音声記録再生装置
JP2001142490A (ja) データ記録装置
JP2814385B2 (ja) 書写用減速再生テープレコーダー
JPH06324691A (ja) マイクロホン付音響機器
JPH103300A (ja) ディジタル音声記録再生装置
JP2000206993A (ja) 音声記録装置、音声再生装置、音声処理装置
JP2000132190A (ja) 音声記録再生装置
JP2001318695A (ja) 音声再生装置
JPH1063473A (ja) デジタル音声記録装置およびデジタル音声再生装置
JPH0764584A (ja) 音声情報の再生速度自動調整装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050906