JP4540185B2 - 音声処理装置及び音声処理プログラム - Google Patents

音声処理装置及び音声処理プログラム Download PDF

Info

Publication number
JP4540185B2
JP4540185B2 JP2000158952A JP2000158952A JP4540185B2 JP 4540185 B2 JP4540185 B2 JP 4540185B2 JP 2000158952 A JP2000158952 A JP 2000158952A JP 2000158952 A JP2000158952 A JP 2000158952A JP 4540185 B2 JP4540185 B2 JP 4540185B2
Authority
JP
Japan
Prior art keywords
voice recognition
voice
data
recognition data
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000158952A
Other languages
English (en)
Other versions
JP2001337691A (ja
Inventor
雄一 冨井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Corp filed Critical Olympus Corp
Priority to JP2000158952A priority Critical patent/JP4540185B2/ja
Publication of JP2001337691A publication Critical patent/JP2001337691A/ja
Application granted granted Critical
Publication of JP4540185B2 publication Critical patent/JP4540185B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、音声処理装置及び音声処理プログラムに関し、ユーザ情報を認識可能な音声認識システムに関するものである。
【0002】
【従来の技術】
不特定話者モデルを使用した音声認識装置では、認識率向上のために、ユーザ或いは環境毎に設定したユーザ情報ファイルが設けられている。例えば、特願平10−255744号公報には、このユーザ情報ファイルの切換えの煩雑さを解消するために、音声データに設定されたIDによりユーザ情報ファイルを自動的に切換える音声認識システムが開示されている。
【0003】
【発明が解決しようとする課題】
しかしながら、上述した音声認識システムでは、音声データに設定されたIDに対応したユーザ情報ファイルが音声認識装置内に存在しない場合は、不特定話者モデルを使用したユーザ情報ファイルが使用されることとなり、ユーザ或いは環境毎に設定された音響モデルを有するユーザ情報ファイルが使用された場合よりも認識率は低下してしまうことになる。
【0004】
通常の認識率を確保するためには、新たにユーザ情報ファイルを作成する、他の音声認識装置で作成済みのユーザ情報ファイルを転送する、等の手段が考えられるが、何れにしても手間を要するものであった。
【0005】
したがって本発明は、上記実状に鑑みてなされたものであり、ユーザ情報を自動的に選択することの可能な音声処理装置及び、音声処理プログラムを記録した記録媒体及び音声データ処理方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
すなわち、第1の発明は、外部の音声記録装置と情報を送受信する通信手段と、上記通信手段を介して上記音声記録装置で生成された音声データを含む音声ファイルを取得する音声ファイル取得手段と、前記音声データをテキスト化する音声認識手段と、上記音声認識手段のテキスト化の精度を上げるための第1の音声認識データを記憶しておく記憶手段と、上記通信手段を介して上記音声記録装置に記憶された第2の音声認識データを取得する音声認識データ取得手段と、上記第1の音声認識データが上記音声ファイルに含まれる使用者を特定するIDに対応するものであって、当該第1の音声認識データの記録若しくは更新日時が、上記IDに対応する第2の音声認識データの記録及び更新日時の何れよりも新しい場合、または上記IDに対応する第2の音声認識データが上記音声記録装置に記憶されていない場合には、上記第1の音声認識データを用いて上記音声データのテキスト化を行うように上記音声認識手段を制御すると共に、上記第1の音声認識データを前記通信手段を介して上記音声記録装置に送信し、上記第2の音声認識データが上記音声ファイルに含まれる使用者を特定するIDに対応するものであって、当該第2の音声認識データの記録若しくは更新日時が、上記IDに対応する第1の音声認識データの記録及び更新日時の何れよりも新しい場合、または上記IDに対応する第1の音声認識データが上記記憶手段に記憶されていない場合には、上記第2の音声認識データを用いて上記音声データのテキスト化を行うように上記音声認識手段を制御すると共に上記第2の音声認識データを上記記憶手段の上記第1の音声認識データに上書き記憶する制御手段と、を具備することを特徴とする。
【0007】
第2の発明は、外部の音声記録装置で生成された音声データファイルが記憶された記憶媒体を着脱可能なインターフェース手段と、上記インターフェース手段に装着された上記記憶媒体から上記音声ファイルを取得する音声ファイル取得手段と、音声データをテキスト化する音声認識手段と、上記音声認識手段のテキスト化の精度を上げるための第1の音声認識データを記憶しておく記憶手段と、上記記憶媒体に記憶された第2の音声認識データを取得する音声認識データ取得手段と、上記第1の音声認識データが上記音声ファイルに含まれる使用者を特定するIDに対応するものであって、当該第1の音声認識データの記録若しくは更新日時が、上記IDに対応する第2の音声認識データの記録及び更新日時の何れよりも新しい場合、または上記IDに対応する第2の音声認識データが上記音声記録装置に記憶されていない場合には、上記第1の音声認識データを用いて上記音声データのテキスト化を行うように上記音声認識手段を制御すると共に、上記第1の音声認識データを上記記憶媒体の上記2の音声認識データに上書き記憶し、上記第2の音声認識データが上記音声ファイルに含まれる使用者を特定するIDに対応するものであって、当該第2の音声認識データの記録若しくは更新日時が、上記IDに対応する第1の音声認識データの記録及び更新日時の何れよりも新しい場合、または上記IDに対応する第1の音声認識データが上記記憶手段に記憶されていない場合には、上記第2の音声認識データを用いて上記音声データのテキスト化を行うように上記音声認識手段を制御すると共に、上記第2の音声認識データを上記記憶手段の第1の音声認識データに上書き記憶する制御手段と、を具備することを特徴とする。
【0008】
第3の発明は、コンピュータに対して、外部の音声記録装置で生成された音声データファイルを取得させ、上記音声データファイルに含まれる音声データを音声認識してテキスト化させる音声処理プログラムに於いて、上記音声処理プログラムはコンピュータに対して、上記音声データファイルから音声データの使用者を特定するIDを読み出す音声データ取得処理と、当該コンピュータの記憶手段に記憶された、上記IDに対応する音声データのテキスト化の精度を上げるための第1の音声認識データを読み出す第1の音声認識データ取得処理と、上記音声記録装置に記憶された、上記IDに対応する音声データのテキスト化の精度を上げるための第2の音声認識データを取得する第2の音声認識データ取得処理と、上記第1の音声認識データの記録日時若しくは更新日時が、上記第2の音声認識データの記録日時及び更新日時の何れよりも新しい場合、または上記第2の音声認識データ取得処理で上記IDに対応する第2の音声認識データが取得できなかった場合には、上記第1の音声認識データを用いて上記音声データのテキスト化を行わせると共に、上記第1の音声認識データを上記音声記録装置に記憶させ、上記第2の音声認識データの記録日時若しくは更新日時が、上記第1の音声認識データの記録日時及び更新日時の何れかよりも新しい場合、または、上記第1の音声認識データ取得処理で上記IDに対応する第1の音声認識データが取得できなかった場合には、上記第2の音声認識データを用いて上記音声データのテキスト化を行わせると共に、上記第2の音声認識データを当該コンピュータの記憶手段に記憶させる音声認識処理と、を実行させることを特徴とする。
【0009】
また、第4の発明は、コンピュータに対して、外部の音声記録装置で生成されて着脱可能な記憶媒体に記憶された音声データファイルを取得させ、上記音声データファイルに含まれる音声データを音声認識してテキスト化させる音声処理プログラムに於いて、上記音声処理プログラムはコンピュータに対して、当該コンピュータに装着された上記記憶媒体から、前記懇請記録装置で生成された音声データファイルを読み出す音声ファイル取得処理と、音声ファイル取得処理で読み出した上記音声データファイルから、音声データと使用者を特定するIDを読み出す音声データ取得処理と、当該コンピュータの記憶手段に記憶された、上記IDに対応する音声データのテキスト化の精度を上げるための第1の音声認識データを読み出す第1の音声認識データ取得処理と、上記記憶媒体に記憶された、上記IDに対応する音声データのテキスト化の精度を上げるための第2の音声認識データを取得する第2の音声認識データ取得処理と、上記第1の音声認識データの記録日時若しくは更新日時が、上記第2の音声認識データの記録日時および更新日時の何れよりも新しい場合、または上記第2の音声認識データ取得処理で上記IDに対応する第2の音声認識データが取得できなかった場合には、上記第1の音声認識データを用いて上記音声データのテキスト化を行わせると共に、上記第1の音声認識データを上記記憶媒体の第2の音声認識データに上書き記憶させ、上記第2の音声認識データの記録日時若しくは更新日時が、上記第1の音声認識データの記録日時および更新日時の何れかよりも新しい場合、又は上記第1の音声認識データ取得処理で上記IDに対応する第1の音声認識データが取得できなかった場合には、上記第2の音声認識データを用用いて上記音声データのテキスト化を行わせると共に、上記第2の音声認識データを当該コンピュータの記憶手段の第1の音声認識データに上書き記憶させる音声認識処理と、を実行させることを特徴とする。
【0013】
第1の発明による音声処理装置にあっては、外部の音声記録装置と情報を通信手段で送受信すると、音声ファイル取得手段が上記通信手段を介して上記音声記録装置で生成された音声データを含む音声ファイルを取得し、音声認識手段が前記音声データをテキスト化する。記憶手段には、上記音声認識手段のテキスト化の精度を上げるための第1の音声認識データを記憶しておく。音声認識データ取得手段は、上記通信手段を介して上記音声記録装置に記憶された第2の音声認識データを取得する。制御手段は、上記第1の音声認識データが上記音声ファイルに含まれる使用者を特定するIDに対応するものであって、当該第1の音声認識データの記録若しくは更新日時が、上記IDに対応する第2の音声認識データの記録及び更新日時の何れよりも新しい場合、または上記IDに対応する第2の音声認識データが上記音声記録装置に記憶されていない場合には、上記第1の音声認識データを用いて上記音声データのテキスト化を行うように上記音声認識手段を制御すると共に、上記第1の音声認識データを前記通信手段を介して上記音声記録装置に送信し、上記第2の音声認識データが上記音声ファイルに含まれる使用者を特定するIDに対応するものであって、当該第2の音声認識データの記録若しくは更新日時が、上記IDに対応する第1の音声認識データの記録及び更新日時の何れよりも新しい場合、または上記IDに対応する第1の音声認識データが上記記憶手段に記憶されていない場合には、上記第2の音声認識データを用いて上記音声データのテキスト化を行うように上記音声認識手段を制御すると共に上記第2の音声認識データを上記記憶手段の上記第1の音声認識データに上書き記憶する。
【0014】
第2の発明による音声処理装置にあっては、インターフェース手段は、外部の音声記録装置で生成された音声データファイルを着脱可能な記憶媒体に記憶し、音声ファイル取得手段が上記インターフェース手段に装着された上記記憶媒体から上記音声ファイルを取得し、音声認識手段が音声データをテキスト化する。記憶手段は、上記音声認識手段のテキスト化の精度を上げるための第1の音声認識データを記憶しておき、音声認識データ取得手段は、上記記憶媒体に記憶された第2の音声認識データを取得する。制御手段は、上記第1の音声認識データが上記音声ファイルに含まれる使用者を特定するIDに対応するものであって、当該第1の音声認識データの記録若しくは更新日時が、上記IDに対応する第2の音声認識データの記録及び更新日時の何れよりも新しい場合、または上記IDに対応する第2の音声認識データが上記音声記録装置に記憶されていない場合には、上記第1の音声認識データを用いて上記音声データのテキスト化を行うように上記音声認識手段を制御すると共に、上記第1の音声認識データを上記記憶媒体の上記2の音声認識データに上書き記憶し、上記第2の音声認識データが上記音声ファイルに含まれる使用者を特定するIDに対応するものであって、当該第2の音声認識データの記録若しくは更新日時が、上記IDに対応する第1の音声認識データの記録及び更新日時の何れよりも新しい場合、または上記IDに対応する第1の音声認識データが上記記憶手段に記憶されていない場合には、上記第2の音声認識データを用いて上記音声データのテキスト化を行うように上記音声認識手段を制御すると共に、上記第2の音声認識データを上記記憶手段の第1の音声認識データに上書き記憶する。
【0015】
第3の発明による音声処理プログラムにあっては、コンピュータに対して、外部の音声記録装置で生成された音声データファイルを取得させ、上記音声データファイルに含まれる音声データを音声認識してテキスト化させる音声処理プログラムであり、この音声処理プログラムは、コンピュータに対して、上記音声データファイルから音声データの使用者を特定するIDを読み出す音声データ取得処理と、当該コンピュータの記憶手段に記憶された、上記IDに対応する音声データのテキスト化の精度を上げるための第1の音声認識データを読み出す第1の音声認識データ取得処理とを処理し、さらに、第2の音声認識データ取得処理は、上記音声記録装置に記憶された、上記IDに対応する音声データのテキスト化の精度を上げるための第2の音声認識データを取得する。上記第1の音声認識データの記録日時若しくは更新日時が、上記第2の音声認識データの記録日時及び更新日時の何れよりも新しい場合、または上記第2の音声認識データ取得処理で上記IDに対応する第2の音声認識データが取得できなかった場合には、上記第1の音声認識データを用いて上記音声データのテキスト化を行わせると共に、上記第1の音声認識データを上記音声記録装置に記憶させ、上記第2の音声認識データの記録日時若しくは更新日時が、上記第1の音声認識データの記録日時及び更新日時の何れかよりも新しい場合、または、上記第1の音声認識データ取得処理で上記IDに対応する第1の音声認識データが取得できなかった場合には、上記第2の音声認識データを用いて上記音声データのテキスト化を行わせると共に、上記第2の音声認識データを当該コンピュータの記憶手段に記憶させる音声認識処理と、を実行させる。
【0016】
第4の発明による音声処理プログラムにあっては、コンピュータに対して、外部の音声記録装置で生成されて着脱可能な記憶媒体に記憶された音声データファイルを取得させ、上記音声データファイルに含まれる音声データを音声認識してテキスト化させる音声処理プログラムに於いて、上記音声処理プログラムはコンピュータに対して、当該コンピュータに装着された上記記憶媒体から、前記懇請記録装置で生成された音声データファイルを読み出す音声ファイル取得処理と、音声ファイル取得処理で読み出した上記音声データファイルから、音声データと使用者を特定するIDを読み出す音声データ取得処理と、当該コンピュータの記憶手段に記憶された、上記IDに対応する音声データのテキスト化の精度を上げるための第1の音声認識データを読み出す第1の音声認識データ取得処理と、上記記憶媒体に記憶された、上記IDに対応する音声データのテキスト化の精度を上げるための第2の音声認識データを取得する第2の音声認識データ取得処理と、上記第1の音声認識データの記録日時若しくは更新日時が、上記第2の音声認識データの記録日時および更新日時の何れよりも新しい場合、または上記第2の音声認識データ取得処理で上記IDに対応する第2の音声認識データが取得できなかった場合には、上記第1の音声認識データを用いて上記音声データのテキスト化を行わせると共に、上記第1の音声認識データを上記記憶媒体の第2の音声認識データに上書き記憶させ、上記第2の音声認識データの記録日時若しくは更新日時が、上記第1の音声認識データの記録日時および更新日時の何れかよりも新しい場合、叉jは上記第1の音声認識データ取得処理で上記IDに対応する第1の音声認識データが取得できなかった場合には、上記第2の音声認識データを用用いて上記音声データのテキスト化を行わせると共に、上記第2の音声認識データを当該コンピュータの記憶手段の第1の音声認識データに上書き記憶させる音声認識処理と、を実行させる。
【0020】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。
【0021】
図1は、本発明の一実施の形態である音声認識システムの概略構成を示した図である。
【0022】
図1に示されるように、この音声認識システムは、可搬型記録媒体1と、音声データと共に使用者の固有のデータであるユーザIDを記録可能な音声記録再生装置2と、上記記録媒体1に記録された音声データに基いて音声認識処理を行う音声認識装置であるコンピュータ3とにより構成される。このコンピュータ3は、入力装置5、表示装置としてのディスプレイ6及びキーボード、マウス(ポインティングデバイス)等の操作部材7を有して構成される。
【0023】
ここで、上記音声記録再生装置2について説明する。
【0024】
図2は、本発明の一実施形態である音声認識システムの一構成要素となる音声記録再生装置のブロック図である。
【0025】
図2に示されるように、この音声記録再生装置では、音声入力手段であるマイクロフォン11が、増幅器(AMP)12、ローパスフィルタ(LPF)13、A/Dコンバータ14を介して、デジタル信号処理部(DSP)15に接続されている。このデジタル信号処理部15には、この音声記録再生装置の各種制御を司るシステム制御部(CPU)16が接続されている。
【0026】
システム制御部16には、上記デジタル信号処理部15の他、記録媒体17と、表示器18と、ユーザ情報ファイルを記録する外部メモリ19と、録音釦(REC)21a、再生釦(PLAY)21b、停止釦(STOP)21c、早送り釦(FF)21d、早戻し釦(REW)21e、メニュー釦(MENU)21f等の操作入力部21とが接続されている。
【0027】
また、上記デジタル信号処理部15には、D/Aコンバータ23、ローパスフィルタ(LPF)24、増幅器(AMP)25を介して、スピーカ26が接続されている。
【0028】
尚、上記A/Dコンバータ14、デジタル信号処理部15は、入力したアナログ音声信号を所定のデジタル音声データに変換処理する音声データ処理手段を構成する。
【0029】
上記システム制御部16は、デジタル信号処理部15と記録媒体17の他、当該音声記録再生装置の各部の動作を制御すると共に、操作入力部12に於ける複数釦の操作に応じて、所定のユーザIDの読出し、書出しの制御、すなわちユーザID識別手段としての役目も果たす。更に、システム制御部16は、その内部にユーザIDを記録する内部メモリを備えている(図示せず)。
【0030】
また、上記記録媒体17には、システム制御部16の制御下にデジタル信号処理部15で符号化処理された音声データが記録されると共に、当該音声データが記録される同一ファイル内に同音声データに対応するユーザIDが記録される。更に、上記記録媒体17には、ユーザ情報ファイルを格納する領域が用意されており、記録媒体17にユーザ情報ファイルが存在しない場合は、外部メモリ19よりユーザ情報ファイルが転送される。
【0031】
上記システム制御部16では、該音声記録再生装置に記録媒体17が新たに装着される毎に、外部メモリ19内と記録媒体17のユーザ情報ファイルの更新日時の比較が行われる。この比較結果に従って、最新の状態に合わせてそれぞれ上書き更新がなされる。
【0032】
次に、このように構成された音声記録再生装置に於ける音声記録動作について説明する。
【0033】
本実施の形態に於ける音声記録再生装置では、記録媒体17に音声データが記録される際、当該音声データに対応するユーザID、すなわち使用者に固有のID情報が、当該音声データと同一ファイルに記録される。そして、当該音声再生装置の使用者は、音声データと共に記録されるユーザIDを任意に登録することができる。
【0034】
以下、このユーザID登録の設定動作について、図3のフローチャートを参照して説明する。
【0035】
先ず、ステップS1に於いて、システム制御部16では、使用者によってメニュー釦21fが所定時間T秒、例えば3秒間押し続けられたか否かが判断される。ここで、使用者によって該メニュー釦21fが所定時間T秒押されなかった場合は、ステップS2に移行し、システム制御部16により、使用者ユーザIDの設定意志があると見なされて、表示器18にID設定画面が表示される。これにより、ユーザID設定可能状態となる。一方、上記ステップS1にて、メニュー釦21fが所定時間押された場合は、ステップS7に移行し、後述する音声を収録してファイルを作成した後に、ユーザIDを登録、変更する処理が行われる。
【0036】
次に、ステップS3に於いて、使用者が操作入力部21に於ける所定の操作釦、例えば4桁の所定のIDコードが入力されたか否かが判断される。ここで、当該IDコードが入力されると、システム制御部16によってこのコードが認識される。
【0037】
尚、本実施の形態に於いて、IDコードは所定のアラビア数字、ローマ字等の英数字の組合わせで構成されているものとする。そして、これら4桁の英数字は所定の釦、例えば、早送り釦21d、早戻し釦21eで選択され、再生釦21bで決定されるものとする。また、この設定に用いられる釦は、これに限らず操作入力部21の他の釦でも良い。
【0038】
上記操作によってユーザIDが入力されると、ステップS4に移行して、システム制御部16によってその内部メモリ(図示せず)に該ユーザIDが記録される。これにより、ユーザIDが登録される。そして、その後ステップS6に移行し、録音モード、BEEP音、時刻合わせ等、各種動作設定が行われる。
【0039】
一方、上記ステップS3にてユーザIDの設定が行われない場合は、ステップS5に移行して所定時間が経過したか否かが判断される。ここで、所定時間が経過していない場合は上記ステップS3に移行し、再度IDの設定が判断される。これに対し、所定時間内にIDの設定が行われない場合は、ユーザIDは未設定となってメニュー設定を終了する。
【0040】
次に、音声を収録してファイルを作成した後、すなわち音声データ及びユーザIDが記録媒体17に記録された後に、ユーザIDを登録、変更する場合について説明する。
【0041】
先ず、停止時に所定の操作、本実施の形態の場合は、早送り釦21d、早戻し釦21eにより、ユーザIDを変更したしたいファイルナンバを、表示器18に表示させる。ついで、上述したようにメニュー釦21fが所定時間T秒間押されると、ステップS7に移行し、ユーザID登録、変更可能状態とされる。
【0042】
このとき、システム制御部16によって、記録媒体17に記録されている音声データのヘッダ部分が検索され、選択されたファイルのヘッダのユーザIDが検出されて、表示器18に表示される。
【0043】
次に、上記と同様の操作により、ユーザIDの登録または変更が行われる。そして、登録または変更が決定されると、システム制御部16では、ファイルヘッダに記録されているユーザIDが書換えられる。
【0044】
以上の操作によって、ユーザIDの登録、変更がなされる。
【0045】
次に、この音声記録再生装置に音声を記録する録音処理について説明する。
【0046】
システム制御部16にて、録音釦21aが押されたことが検出されると、マイクロフォン11から入力された音声信号は、増幅器12によって増幅される。この増幅器12の出力は、ローパスフィルタ13にてエリアシングノイズの発生を防止するために、不要な周波数帯がカットされる。
【0047】
次いで、A/Dコンバータ14に於いて、アナログ信号である音声信号がデジタル信号に変換された後、デジタル信号処理部15に入力される。デジタル信号処理部15では、デジタル信号に変換された音声データが、定められたフォーマットのデータに圧縮変換(符号化)される。符号化された音声データは、図示されないバッファを介してシステム制御部16へ送られる。更に、システム制御部16では、入力された音声データが記録媒体17へ出力される。
【0048】
ここで、記録媒体17に音声データ及びユーザIDを記録する動作について、図4のフローチャートを参照して説明する。
【0049】
先ず、ステップS11に於いて、システム制御部16によって録音モードか否かが判断される。ここで、録音中であれば、次にステップS12に移行して、その録音、すなわち1つのファイルが終了したか否かが判断される。そして、ここで録音(ファイル)が終了したら、ステップS13に移行して、システム制御部16によってユーザIDが該システム制御部16の内部メモリに登録されているか否かが判断される。
【0050】
このステップS13にて、ユーザIDが登録されていると判断されたならば、ステップS14及びS15に移行して、このユーザIDが記録媒体17のファイルヘッダの所定のアドレスに記録される。これにより、記録媒体17には、ファイル毎にユーザIDが付与されることとなる。
【0051】
一方、システム制御部16の内部メモリにユーザIDが登録されていなければ、ステップS16及びS15に移行して、システム制御部16によってデフォルトのユーザID(0000)が、上記と同様に記録媒体17のファイルヘッダに記録される。
【0052】
尚、記録媒体17に記録される際に、ファイル毎のファイルヘッダは、図5に示されるように、ユーザIDの他、例えばファイルナンバ、録音開始時間、録音終了時間、録音日時等の情報が、所定のアドレスに書込まれるようになっている。
【0053】
また、上記ステップS11に於いて、録音モードではないと判断された場合は、他の操作釦の入力待ちとなる。
【0054】
次に、本発明の実施の形態である音声認識システムに於ける音声認識装置について説明する。
【0055】
図6は、本発明の一実施の形態である音声認識システムの一構成要素となる音声認識装置の構成を示したブロック図である。
【0056】
図6に示されるように、本実施の形態に於いては、音声認識装置としてコンピュータ30が採用される。
【0057】
このコンピュータ30の内部は、音声認識処理の他、音声入力処理、表示処理、操作制御等を行う音声認識部の構成要素であるCPU31と、音声入力手段である入力装置32、記録媒体33、表示装置34、キーボード、マウス等の操作部35を有して構成される。
【0058】
上記記録媒体33はハードディスク等で構成され、音声認識部の構成要素となる音声認識処理を行う音声認識プログラム、使用者情報(ユーザ情報)としてのユーザ情報ファイル等が記録されている。これらはCPU31によって制御される。ユーザ情報には、音響モデル、単語の修正情報、トレーニング情報が含まれる。
【0059】
上記入力装置32は、上記音声記録再生装置により、音声データと共にユーザID等が記録された記録媒体17を装着することが可能となっている。この記録媒体17が入力装置32に装着された際には、音声認識プログラムにより、CPU31の制御で読書きが可能となっている。尚、CPU31には、図示されないRAMが接続されており、このRAM上に音声認識処理プログラムがロードされ、各種処理が行われる。
【0060】
上記ユーザ情報ファイルには、それぞれユーザIDが設定されている。該ユーザーIDは、上記音声記録再生装置で記録したユーザIDと同じ形式であり、所定のアラビア数字、ローマ字等の英数字の組合わせで構成されている。音声認識時には、このユーザIDによる音響モデルを選択するようになっている。
【0061】
次に、上記音声認識装置に於ける音声認識動作について、図7のフローチャートを参照して説明する。
【0062】
使用者によって、上述した音声データと共にユーザIDが記録された記録媒体17が、上記音声記録再生装置から取出されて入力装置32に装着される。次いで、CPU31により、音声認識処理用プログラムが所定の操作により起動される。
【0063】
図8は、本実施の形態で用いられる音声認識処理用プログラムを起動させたときの操作の一表示例を示した図であり、上記記録媒体17に圧縮されて記録された音声ファイルの一覧表示である。
【0064】
そして、ステップS31にて、使用者により、マウスやキーボード等による操作部35が操作されて音声認識処理を実行するファイルが選択されて、音声処理の実行が指示される。例えば、操作部35がキーボードの場合は、カーソルキーで選択されて実行キーで実行される。尚、この操作はこれに限らす他のキー、または操作方法であってもよい。
【0065】
CPU31にて音声認識実行の命令が認識されると、ステップS32に移行し、該CPU31にて、使用者によって音声認識処理実行が指定されたファイルが記録媒体17から検索され、該ファイルのヘッダが検索される。ヘッダには、上述したように、ユーザIDの他、インデックス情報として録音日時、録音開始時間、録音終了時間等の情報が記録されている(図5参照)。
【0066】
次に、ステップS33にて、CPU31によりユーザIDの記録されたアドレスからユーザIDが検出される。更に、ステップS34に於いて、検出されたユーザIDが、音声記録再生装置でユーザにより指定されなかった際に記録されるデフォルトのユーザID(0000)であるか否かの確認が行われる。
【0067】
ここで検出されたユーザIDがデフォルトのユーザIDでなければ、ステップS35に移行して、CPU31によって、検出されたユーザIDに対応したユーザ情報ファイルが記録媒体33内に存在するか否かの確認が行われる。
【0068】
そして、ユーザ情報ファイルの存在が確認された場合は、ステップS36に移行して、同様に記録媒体17内のユーザ情報ファイルの存在が確認される。ここで、ユーザ情報ファイルが存在する場合は、ステップS37及びS38に移行して、それぞれのファイルの最終更新日時の比較が行われる。
【0069】
次いで、ステップS39にて、記録媒体17内のユーザ情報ファイルが記録媒体33へ転送される。その後、ステップS40に移行して、該転送された記録媒体33内のユーザ情報ファイルが、音声認識処理に使用されるユーザ情報ファイルとして設定される。
【0070】
一方、上記ステップS36に於いて、記録媒体17にユーザ情報ファイルが存在しない場合、及び上記ステップS38に於いて、記録媒体33内のユーザ情報ファイルが最新のファイルである場合は、共にステップS41に移行する。そして、このステップS41にて記録媒体33内のユーザ情報ファイルが記録媒体17へ転送された後、ステップS40に移行して、記録媒体33内のユーザ情報ファイルが、音声認識処理に使用されるユーザ情報ファイルとして設定される。
【0071】
また、上記ステップS35に於いて、同じユーザIDが検出されなかった場合は、ステップS42に移行して、記録媒体17内のユーザ情報ファイルの存在が確認される。ここで、記録媒体17内にユーザ情報ファイルの存在が確認された場合は、ステップS43に移行して、記録媒体17から記録媒体33ヘユーザ情報ファイルが転送される。その後、ステップS40に移行して、記録媒体33内のユーザ情報ファイルが音声認識処理に使用されるユーザ情報ファイルとして設定される。
【0072】
更に、上記ステップS34に於いてユーザIDがデフォルトのIDであった場合、及び上記ステップS42に於いて記録媒体17内にユーザ情報ファイルが存在しなかった場合には、ステップS44に移行して、音声認識処理に使用されるユーザ情報ファイルとして、所定のユーザ情報ファイルが使用される。
【0073】
本実施の形態に於いては、該ユーザ情報ファイルにデフォルトとして不特定話者モデルを有するユーザ情報ファイルが使用される。
【0074】
次に、CPU31にてユーザ情報ファイルが選択されたことが確認されると、上記音声記録再生装置で圧縮伸張された該ファイルの音声データが音声圧縮ファイルより読込まれる。この圧縮された音声データは、音声認識処理プログラムによって音声記録再生装置で記録されたときと同じ圧縮アルゴリズムが逆に用いられて伸張処理が行われ、PCMデータとなる。
【0075】
すなわち、この処理は、音声記録再生装置と同じ処理が、音声認識処理プログラムにより制御されるコンピュータで行われることとなる。
【0076】
次に、音声認識装置では上記処理で伸張されたPCMデータがCPU31に入力される。そして、ステップS45にて、CPU31では、音声認識処理プログラムによりCPU31によって音声認識処理が行われる。そして、ステップS46にて、認識の結果が表示装置34に表示される。
【0077】
尚、本実施の形態では、可搬型記録媒体を用いた音声記録再生装置による音声認識システムを説明したが、これに限られるものではない。例えば、記録媒体を内蔵した音声記録再生装置を用いた場合は、所定の手段、例えばUSBに代表されるインターフェイスや光通信等を利用して音声認識システムと直接接続することにより、同様の効果を得ることが可能である。
【0078】
図9は、本発明の別の実施の形態である音声認識システムの概略構成を示した図である。
【0079】
図9に示されるように、この音声認識システムは、音声記録再生装置2と音声認識装置であるコンピュータ3とがUSBケーブル38により接続されて構成される。尚、その他の構成は、上述した実施の形態と同じであるので説明は省略する。
【0080】
また、図10は、図9の音声認識システムに於ける音声認識動作について説明するフローチャートである。
【0081】
尚、図10のフローチャートに於いて、ステップS51〜S55、S57、S60及びS64〜S66は、上述した図7のフローチャートに於けるステップS31〜S35、S37、S40及びS44〜46と同様であるので、説明は省略する。
【0082】
そして、音声記録再生装置2とコンピュータ3とが、USBケーブル38によって接続された状態で、音声認識処理プログラム用プログラムが所定の操作により起動される。
【0083】
ステップS55にて、CPU31によって、検出されたユーザIDに対応したユーザ情報ファイルがコンピュータ3内に存在するか否かの確認が行われる。そして、ユーザ情報ファイルの存在が確認された場合は、ステップS56に移行して、同様に音声記録再生装置2内のユーザ情報ファイルの存在が確認される。
【0084】
ここで、ユーザ情報ファイルが存在する場合は、ステップS57及びS58に移行して、それぞれのファイルの最終更新日時の比較が行われる。次いで、ステップS59にて、音声記録再生装置2内のユーザ情報ファイルが記録媒体33へ転送される。その後、ステップS40に移行して、該転送されたファイルが音声認識処理に使用されるユーザ情報ファイルとして設定される。
【0085】
一方、上記ステップS56に於いて、音声記録再生装置2内にユーザ情報ファイルが存在しない場合、及び上記ステップS58に於いて、音声記録再生装置2内のユーザ情報ファイルが最新のファイルである場合は、共にステップS61に移行する。そして、このステップS61にて、記録媒体33内のユーザ情報ファイルが音声記録再生装置2へ転送された後、ステップS60に移行して、記録媒体33内のユーザ情報ファイルが、音声認識処理に使用されるユーザ情報ファイルとして設定される。
【0086】
また、上記ステップS55に於いて、同じユーザIDが検出されなかった場合は、ステップS62に移行して、音声記録再生装置2内のユーザ情報ファイルの存在が確認される。ここで、音声記録再生装置2内にユーザ情報ファイルの存在が確認された場合は、ステップS63に移行して、音声記録再生装置2から記録媒体33ヘユーザ情報ファイルが転送される。その後、ステップS60に移行して、音声認識処理に使用されるユーザ情報ファイルとして設定される。
【0087】
更に、上記ステップS54に於いてユーザIDがデフォルトのIDであった場合、及び上記ステップS62に於いて音声記録再生装置2内にユーザ情報ファイルが存在しなかった場合には、ステップS64に移行して、音声認識処理に使用されるユーザ情報ファイルとして、所定のユーザ情報ファイルが使用される。
【0088】
以上のように、上記実施の形態の音声認識システムによれば、ユーザや環境によるユーザ情報を聞違えて選択することなく、音声データを音声認識することができる。また、場所等も制約されず、更に音声認識装置への入力時に於ける操作が、発音者以外の者でも可能である。
【0089】
また、音声認識装置内にユーザ情報ファイルか存在しない場合でも、音声入力装置内のユーザ情報ファイルを使用することにより、良好な認識結果を得ることができる。
【0090】
更に、ユーザIDが未設定、或いはユーザ情報ファイルが作成されていない場合でも、所定のユーザ情報によって音声認識処理が可能となる。
【0091】
尚、本発明の上記実施の形態によれば、以下の如き構成を得ることができる。
【0092】
すなわち、
(1) 音声を入力可能な音声入力手段と、
上記音声入力手段で入力した音声を所定の音声データに変換する音声データ処理手段と、
上記音声データをテキスト処理して記憶する記憶手段とを有する音声記録装置に於いて、
上記記憶手段に、上記音声データをテキスト化処理する際にテキスト化の精度を上げるために使用するもので、上記音声データを記録したユーザのユーザ情報である音声認識データを記憶しておくことを特徴とする音声記録装置。
【0093】
(2) 外部の音声記録装置内の音声データを受信する受信手段と、
上記受信した音声データをテキスト化する音声認識手段と、
上記テキスト化の際にテキスト化の精度を上げるための音声認識データを記憶しておく記憶手段と、
を有する音声処理装置に於いて、
上記受信した音声データのテキスト化に適した音声認識データが上記記憶手段に記憶されていない場合には、上記外部の音声記録装置内に記憶されている音声認識データを使用して上記受信した音声データのテキスト化を行うように制御する制御手段を具備することを特徴とする音声処理装置。
【0094】
(3) 上記制御手段は、上記受信した音声データのユーザIDに基いて、上記受信した音声データのテキスト化の際に用いる上記音声認識データを決定することを特徴とする上記(2)に記載の音声処理装置。
【0095】
(4) 上記制御手段は、上記外部の音声記録装置内に上記受信した音声データに適した音声認識データが記憶されていない場合には、上記記憶手段に記憶されている所定のデータを用いて上記受信した音声データのテキスト化を行うように制御することを特徴とする上記(2)に記載の音声処理装置。
【0096】
(5) 外部の音声記録装置内の音声データを受信する受信手段と、
上記受信した音声データをテキスト化する音声認識手段と、
上記テキスト化の際にテキスト化の精度を上げるための音声認識データを記憶しておく記憶手段と、
を有する音声処理装置に於いて、
上記受信した音声データのテキスト化に適した音声認識データが上記記憶手段及び上記外部の音声記録装置内の双方に記憶されている場合には、上記音声認識データの記録日時若しくは更新日時の新しい方を用いて上記受信した音声データのテキスト化を行うように制御する制御手段と、
上記音声記録装置内の上記音声認識データより、上記音声処理装置内の音声認識データの記録日時若しくは更新日時の方が新しい場合には、上記音声処理装置内の音声認識データを上記音声記録装置に送信する送信手段と、
を具備することを特徴とする音声処理装置。
【0097】
(6) コンピュータに対して、外部の音声記録装置内の音声データを受信させ、上記受信した音声データをテキスト化の精度を上げるための音声認識データを用いてテキスト化させる音声処理プログラムを記録した記録媒体に於いて、
上記音声処理プログラムはコンピュータに対して、
上記受信した音声データのテキスト化に適した音声認識データが上記コンピュータ内の記憶装置及び上記外部の音声記録装置内の双方に記憶されている場合には、上記音声認識データの記録日時若しくは更新日時の新しい方を用いて上記受信した音声データのテキスト化を行わせることを特徴とする音声処理プログラムを記録した記録媒体。
【0098】
(7) 上記音声処理プログラムは、更にコンピュータに対して、上記音声記録装置内の上記音声認識データより上記コンピュータ内の音声認識データの記録日時若しくは更新日時の方が新しい場合には、上記コンピュータ内の音声認識データを上記音声記録装置に送信させることを特徴とする上記(6)に記載の音声処理プログラムを記録した記録媒体。
【0099】
【発明の効果】
以上のように本発明によれば、ユーザ情報を自動的に選択することの可能な音声処理装置及び、音声処理プログラムを記録した記録媒体及び音声データ処理方法を提供することをができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態である音声認識システムの概略構成を示した図である。
【図2】本発明の一実施形態である音声認識システムの一構成要素となる音声記録再生装置のブロック図である。
【図3】ユーザID登録の設定動作について説明するフローチャートである。
【図4】記録媒体17に音声データ及びユーザIDを記録する動作について説明するフローチャートである。
【図5】記録媒体17に於けるファイル、及びファイル毎のファイルヘッダの例を示した図である。
【図6】本発明の一実施の形態である音声認識システムの一構成要素となる音声認識装置の構成を示したブロック図である。
【図7】音声認識装置に於ける音声認識動作について、図7のフローチャートを参照して説明する。
【図8】本実施の形態で用いられる音声認識処理用プログラムを起動させたときの操作の一表示例を示した図であり、上記記録媒体33に圧縮されて記録された音声ファイルの一覧表示である。
【図9】本発明の別の実施の形態である音声認識システムの概略構成を示した図である。
【図10】図9の音声認識システムに於ける音声認識動作について説明するフローチャートである。
【符号の説明】
1 可搬型記録媒体(記録媒体)、
2 音声記録再生装置、
3 コンピュータ、
5入力装置、
6 ディスプレイ、
7 操作部材、
11 マイクロフォン、
12 、25 増幅器(AMP)、
13、24 ローパスフィルタ(LPF)、
14 A/Dコンバータ、
15 デジタル信号処理部(DSP)、
16 システム制御部(CPU)、
17 記録媒体、
18 表示器、
19 外部メモリ、
21 操作入力部、
21a 録音釦(REC)、
21b 再生釦(PLAY)、
21c 停止釦(STOP)、
21d 早送り釦(FF)、
21e 早戻し釦(REW)、
21f メニュー釦(MENU)、
23 D/Aコンバータ、
26 スピーカ、
30 コンピュータ、
31 CPU、
32 入力装置、
33 記録媒体、
34 表示装置、
35 操作部。

Claims (4)

  1. 外部の音声記録装置と情報を送受信する通信手段と、
    上記通信手段を介して上記音声記録装置で生成された音声データを含む音声ファイルを取得する音声ファイル取得手段と、
    上記音声データをテキスト化する音声認識手段と、
    上記音声認識手段のテキスト化の精度を上げるための第1の音声認識データを記憶しておく記憶手段と、
    上記通信手段を介して上記音声記録装置に記憶された第2の音声認識データを取得する音声認識データ取得手段と、
    上記第1の音声認識データが上記音声ファイルに含まれる使用者を特定するIDに対応するものであって、当該第1の音声認識データの記録若しくは更新日時が、上記IDに対応する第2の音声認識データの記録及び更新日時の何れよりも新しい場合、または上記IDに対応する第2の音声認識データが上記音声記録装置に記憶されていない場合には、上記第1の音声認識データを用いて上記音声データのテキスト化を行うように上記音声認識手段を制御すると共に、上記第1の音声認識データを前記通信手段を介して上記音声記録装置に送信し、
    上記第2の音声認識データが上記音声ファイルに含まれる使用者を特定するIDに対応するものであって、当該第2の音声認識データの記録若しくは更新日時が、上記IDに対応する第1の音声認識データの記録及び更新日時の何れよりも新しい場合、または上記IDに対応する第1の音声認識データが上記記憶手段に記憶されていない場合には、上記第2の音声認識データを用いて上記音声データのテキスト化を行うように上記音声認識手段を制御すると共に上記第2の音声認識データを上記記憶手段の上記第1の音声認識データに上書き記憶する制御手段と、を具備することを特徴とする音声処理装置。
  2. 外部の音声記録装置で生成された音声データファイルが記憶された記憶媒体を着脱可能なインターフェース手段と、
    上記インターフェース手段に装着された上記記憶媒体から上記音声ファイルを取得する音声ファイル取得手段と、
    音声データをテキスト化する音声認識手段と、
    上記音声認識手段のテキスト化の精度を上げるための第1の音声認識データを記憶しておく記憶手段と、
    上記記憶媒体に記憶された第2の音声認識データを取得する音声認識データ取得手段と、
    上記第1の音声認識データが上記音声ファイルに含まれる使用者を特定するIDに対応するものであって、当該第1の音声認識データの記録若しくは更新日時が、上記IDに対応する第2の音声認識データの記録及び更新日時の何れよりも新しい場合、または上記IDに対応する第2の音声認識データが上記音声記録装置に記憶されていない場合には、上記第1の音声認識データを用いて上記音声データのテキスト化を行うように上記音声認識手段を制御すると共に、上記第1の音声認識データを上記記憶媒体の上記2の音声認識データに上書き記憶し、
    上記第2の音声認識データが上記音声ファイルに含まれる使用者を特定するIDに対応するものであって、当該第2の音声認識データの記録若しくは更新日時が、上記IDに対応する第1の音声認識データの記録及び更新日時の何れよりも新しい場合、または上記IDに対応する第1の音声認識データが上記記憶手段に記憶されていない場合には、上記第2の音声認識データを用いて上記音声データのテキスト化を行うように上記音声認識手段を制御すると共に、上記第2の音声認識データを上記記憶手段の第1の音声認識データに上書き記憶する制御手段と、
    を具備することを特徴とする音声処理装置。
  3. コンピュータに対して、外部の音声記録装置で生成された音声データファイル取得させ、上記音声データファイルに含まれる音声データを音声認識してテキスト化させる音声処理プログラムに於いて、
    上記音声処理プログラムはコンピュータに対して、
    上記音声データファイルから音声データの使用者を特定するIDを読み出す音声データ取得処理と、当該コンピュータの記憶手段に記憶された、上記IDに対応する音声データのテキスト化の精度を上げるための第1の音声認識データを読み出す第1の音声認識データ取得処理と、
    上記音声記録装置に記憶された、上記IDに対応する音声データのテキスト化の精度を上げるための第2の音声認識データを取得する第2の音声認識データ取得処理と、
    上記第1の音声認識データの記録日時若しくは更新日時が、上記第2の音声認識データの記録日時及び更新日時の何れよりも新しい場合、または上記第2の音声認識データ取得処理で上記IDに対応する第2の音声認識データが取得できなかった場合には、上記第1の音声認識データを用いて上記音声データのテキスト化を行わせると共に、上記第1の音声認識データを上記音声記録装置に記憶させ、
    上記第2の音声認識データの記録日時若しくは更新日時が、上記第1の音声認識データの記録日時及び更新日時の何れかよりも新しい場合、または、上記第1の音声認識データ取得処理で上記IDに対応する第1の音声認識データが取得できなかった場合には、上記第2の音声認識データを用いて上記音声データのテキスト化を行わせると共に、上記第2の音声認識データを当該コンピュータの記憶手段に記憶させる音声認識処理と、
    を実行させることを特徴とする音声処理プログラム。
  4. コンピュータに対して、外部の音声記録装置で生成されて着脱可能な記憶媒体に記憶された音声データファイルを取得させ、上記音声データファイルに含まれる音声データを音声認識してテキスト化させる音声処理プログラムに於いて、
    上記音声処理プログラムはコンピュータに対して、
    当該コンピュータに装着された上記記憶媒体から、前記懇請記録装置で生成された音声データファイルを読み出す音声ファイル取得処理と、
    音声ファイル取得処理で読み出した上記音声データファイルから、音声データと使用者を特定するIDを読み出す音声データ取得処理と、
    当該コンピュータの記憶手段に記憶された、上記IDに対応する音声データのテキスト化の精度を上げるための第1の音声認識データを読み出す第1の音声認識データ取得処理と、
    上記記憶媒体に記憶された、上記IDに対応する音声データのテキスト化の精度を上げるための第2の音声認識データを取得する第2の音声認識データ取得処理と、
    上記第1の音声認識データの記録日時若しくは更新日時が、上記第2の音声認識データの記録日時および更新日時の何れよりも新しい場合、または上記第2の音声認識データ取得処理で上記IDに対応する第2の音声認識データが取得できなかった場合には、上記第1の音声認識データを用いて上記音声データのテキスト化を行わせると共に、上記第1の音声認識データを上記記憶媒体の第2の音声認識データに上書き記憶させ、
    上記第2の音声認識データの記録日時若しくは更新日時が、上記第1の音声認識データの記録日時および更新日時の何れかよりも新しい場合、又は上記第1の音声認識データ取得処理で上記IDに対応する第1の音声認識データが取得できなかった場合には、上記第2の音声認識データを用いて上記音声データのテキスト化を行わせると共に、上記第2の音声認識データを当該コンピュータの記憶手段の第1の音声認識データに上書き記憶させる音声認識処理と、
    を実行させることを特徴とする音声処理プログラム。
JP2000158952A 2000-05-29 2000-05-29 音声処理装置及び音声処理プログラム Expired - Fee Related JP4540185B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000158952A JP4540185B2 (ja) 2000-05-29 2000-05-29 音声処理装置及び音声処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000158952A JP4540185B2 (ja) 2000-05-29 2000-05-29 音声処理装置及び音声処理プログラム

Publications (2)

Publication Number Publication Date
JP2001337691A JP2001337691A (ja) 2001-12-07
JP4540185B2 true JP4540185B2 (ja) 2010-09-08

Family

ID=18663349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000158952A Expired - Fee Related JP4540185B2 (ja) 2000-05-29 2000-05-29 音声処理装置及び音声処理プログラム

Country Status (1)

Country Link
JP (1) JP4540185B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04167071A (ja) * 1990-10-31 1992-06-15 Oki Electric Ind Co Ltd 音声翻訳装置
JPH04301695A (ja) * 1991-03-28 1992-10-26 Ricoh Co Ltd 音声認識装置の辞書制御方式
JPH1028170A (ja) * 1996-07-11 1998-01-27 Sony Corp 通信機器
JP2000067319A (ja) * 1998-06-09 2000-03-03 Digicube Co Ltd 情報提供装置、情報提供システム、情報提供処理方法、及び記録媒体
JP2000089784A (ja) * 1998-09-09 2000-03-31 Olympus Optical Co Ltd 音声認識システム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3001585B2 (ja) * 1989-02-13 2000-01-24 株式会社リコー 音声認識システム
JPH1131000A (ja) * 1997-07-11 1999-02-02 Kenwood Corp ボイスレコーダ

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04167071A (ja) * 1990-10-31 1992-06-15 Oki Electric Ind Co Ltd 音声翻訳装置
JPH04301695A (ja) * 1991-03-28 1992-10-26 Ricoh Co Ltd 音声認識装置の辞書制御方式
JPH1028170A (ja) * 1996-07-11 1998-01-27 Sony Corp 通信機器
JP2000067319A (ja) * 1998-06-09 2000-03-03 Digicube Co Ltd 情報提供装置、情報提供システム、情報提供処理方法、及び記録媒体
JP2000089784A (ja) * 1998-09-09 2000-03-31 Olympus Optical Co Ltd 音声認識システム

Also Published As

Publication number Publication date
JP2001337691A (ja) 2001-12-07

Similar Documents

Publication Publication Date Title
EP1930819A1 (en) Method and apparatus to process an audio user interface and audio device using the same
US20060089736A1 (en) Music reproducing apparatus, mobile phone conversation apparatus, music reproducing system, and operating method thereof
JP4540185B2 (ja) 音声処理装置及び音声処理プログラム
US7027978B2 (en) Voice recording and reproducing apparatus, information processing apparatus, and recording medium having recorded an information processing program
JP4485966B2 (ja) カラオケシステム
JP2009037320A (ja) 情報処理装置、情報処理装置の制御方法
JP4591283B2 (ja) 画像再生システム、撮像装置及び情報処理装置
JP2007158684A (ja) 通信端末装置及び端末制御方法
US20030236660A1 (en) Data recording-reproduction device
US20080279526A1 (en) Record/playback apparatus and control method therefor
JP4603284B2 (ja) 端末操作装置および端末操作ソフトウェア
JP2000089784A (ja) 音声認識システム
JP3096532U (ja) 光ディスク再生装置
US20050240405A1 (en) Transcription apparatus and dictation system
JP4716675B2 (ja) 録音再生装置
JP2003140957A (ja) 音声処理装置
JP2002189993A (ja) 携帯型情報記録再生装置
JP4090617B2 (ja) 記録再生装置
JP3611985B2 (ja) ディジタル式音声録音再生装置
JP2004304776A (ja) 画像取り込み装置
JP2000259387A (ja) 音声認識装置、音声認識処理プログラムを記録した記録媒体、及び音声認識処理方法
JP5777532B2 (ja) オーディオ装置
JP2002196794A (ja) 音声記録再生装置
JP2004102346A (ja) 音声データ処理装置及び音声データ処理プログラム
JPH10301825A (ja) 情報再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100615

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100622

R151 Written notification of patent or utility model registration

Ref document number: 4540185

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130702

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees