JPS6191700A - 音声入力装置 - Google Patents
音声入力装置Info
- Publication number
- JPS6191700A JPS6191700A JP59211377A JP21137784A JPS6191700A JP S6191700 A JPS6191700 A JP S6191700A JP 59211377 A JP59211377 A JP 59211377A JP 21137784 A JP21137784 A JP 21137784A JP S6191700 A JPS6191700 A JP S6191700A
- Authority
- JP
- Japan
- Prior art keywords
- standard pattern
- standard
- voice
- voice input
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の利用分野〕
本発明は音声認識装置に係り、特に複数の標準パターン
を用意し、状況に応じ最適な標準パターンを選択供給し
、実効的な認識率を向上させることに好適な音声入力装
置に関する。
を用意し、状況に応じ最適な標準パターンを選択供給し
、実効的な認識率を向上させることに好適な音声入力装
置に関する。
従来の音声入力装置では、特開昭58−68796号公
報のように、標準パターンを登録し、認識する方法とし
て、オンラインでオペレータの声を登録してから認識を
実行することがひとつの方法である。この方法であると
、認識実行までに時間がかかる。もう一つの操作方法と
して、ホストコンビエータのメモリに事前に作成した音
声標準パターンを格納しておいて、認識に先立ちこのデ
ータを音声入力装置本体に転送(ダウンロード)してか
ら認識を実行するオンライン的登録方法がある。この2
つの方法のうちで後者の方法によると人間の声に、登録
時点からの時間経過や、体調によって性質が変化すると
いう問題があるので、次第に認識率が低下するという欠
点があった。
報のように、標準パターンを登録し、認識する方法とし
て、オンラインでオペレータの声を登録してから認識を
実行することがひとつの方法である。この方法であると
、認識実行までに時間がかかる。もう一つの操作方法と
して、ホストコンビエータのメモリに事前に作成した音
声標準パターンを格納しておいて、認識に先立ちこのデ
ータを音声入力装置本体に転送(ダウンロード)してか
ら認識を実行するオンライン的登録方法がある。この2
つの方法のうちで後者の方法によると人間の声に、登録
時点からの時間経過や、体調によって性質が変化すると
いう問題があるので、次第に認識率が低下するという欠
点があった。
本発明の目的は、オペレータとなる人の体調の変化や登
録時点からの時間経過などによる人間の声の変化によっ
て、認識率が低下することを防゛止し、高認識率で使い
膠手のよい音声入力装置を提供することにある。
録時点からの時間経過などによる人間の声の変化によっ
て、認識率が低下することを防゛止し、高認識率で使い
膠手のよい音声入力装置を提供することにある。
本発明は、いわゆる(!!数標準パターン同時利用によ
る認識率向上とは異なり、複数パターン中の1組に限定
して認識するところに特長がある。本発明は、ホストコ
ンビエータ側に音声標準パターン格納エリアを有する音
声入力装置であってこのエリアに、同じオペレータの同
−単語群を何種類かのワードセット(同属性の標準パタ
ーンの集合体)として入力しておく。ここで、認識中は
照合値を常にモニタし、一定の閾値を超えた場合に次々
に複数の標準パターン群から一群毎に、ホストコンビエ
ータから認識装置に標準パターンを供給することにより
状況に席 応じた標部パターンを与えるわけである。また単語の中
でキーワード1〜2語を決めておいて一連の認識に先立
ちそのキーワードを発声し、そのキーワードの認識スコ
アをもとに現状で最適なワードセットに入れ替え、常に
高認識率を得るために、最適な標準パターンを所有する
。
る認識率向上とは異なり、複数パターン中の1組に限定
して認識するところに特長がある。本発明は、ホストコ
ンビエータ側に音声標準パターン格納エリアを有する音
声入力装置であってこのエリアに、同じオペレータの同
−単語群を何種類かのワードセット(同属性の標準パタ
ーンの集合体)として入力しておく。ここで、認識中は
照合値を常にモニタし、一定の閾値を超えた場合に次々
に複数の標準パターン群から一群毎に、ホストコンビエ
ータから認識装置に標準パターンを供給することにより
状況に席 応じた標部パターンを与えるわけである。また単語の中
でキーワード1〜2語を決めておいて一連の認識に先立
ちそのキーワードを発声し、そのキーワードの認識スコ
アをもとに現状で最適なワードセットに入れ替え、常に
高認識率を得るために、最適な標準パターンを所有する
。
以下、本発明の実施例を第1図〜第6図にもとづいて説
明・する。第1図は本発明が適用される音声入力装置の
構成を示す。第1図で、音声認識装置本体2は、マイク
9から音声信号を入力し、内蔵する音声入力回路0分析
回路、認識論理回路等の従来公知の構成により音声認識
処理全実行する。ホストコンビエータ4は、制御部とな
る部分であり、認識装置本体2の制御を行ないオペレー
タとの接点の段別な果たす。ここで示した音声入力装置
は特定話者用のもので、この装置を利用する話者は、事
前に、標準音声パターンを登録しておく必要があり、マ
イク9からの音声信号を、音声認識装置本体2に内蔵す
る音声入力回路でデジタル信号に変換し、さらに音声分
析回路で、話者の音声に含まれる特徴を抽出し、制御部
インタフェース10.11を介して、ホストコンビエー
タ4の第2のm 準ハI’−ンメモリ3に転送し、記憶
させる。実際の認a時には、認識に先立ち、ホストコン
ビエータ4の第2の標準パターンメモリ3から、制御部
インタフェース11.10を介して、認識装置本体2の
第1の標準パターンメモリ1に、標準パターンを転送す
る。
明・する。第1図は本発明が適用される音声入力装置の
構成を示す。第1図で、音声認識装置本体2は、マイク
9から音声信号を入力し、内蔵する音声入力回路0分析
回路、認識論理回路等の従来公知の構成により音声認識
処理全実行する。ホストコンビエータ4は、制御部とな
る部分であり、認識装置本体2の制御を行ないオペレー
タとの接点の段別な果たす。ここで示した音声入力装置
は特定話者用のもので、この装置を利用する話者は、事
前に、標準音声パターンを登録しておく必要があり、マ
イク9からの音声信号を、音声認識装置本体2に内蔵す
る音声入力回路でデジタル信号に変換し、さらに音声分
析回路で、話者の音声に含まれる特徴を抽出し、制御部
インタフェース10.11を介して、ホストコンビエー
タ4の第2のm 準ハI’−ンメモリ3に転送し、記憶
させる。実際の認a時には、認識に先立ち、ホストコン
ビエータ4の第2の標準パターンメモリ3から、制御部
インタフェース11.10を介して、認識装置本体2の
第1の標準パターンメモリ1に、標準パターンを転送す
る。
本発明は、同一話者に対し複数の標準パターンをホスト
コンピュータ4の第2の標準パターンメモリ3に予め記
憶しておき、ホストコンピュータ4の内部プログラムに
より状況に応じて、音声認識装置本体2の第1の振部パ
ターンメモリ1に、最適な標準パターンを提供するとこ
ろに特徴があるがその具体例を第2図のフローチャート
と第1図にもとづいて示す。
コンピュータ4の第2の標準パターンメモリ3に予め記
憶しておき、ホストコンピュータ4の内部プログラムに
より状況に応じて、音声認識装置本体2の第1の振部パ
ターンメモリ1に、最適な標準パターンを提供するとこ
ろに特徴があるがその具体例を第2図のフローチャート
と第1図にもとづいて示す。
第2図で示すように、ホストコンピュータ4は、内部プ
ログラムを起動し、処理01でL=。
ログラムを起動し、処理01でL=。
として、処理02で第2の標準パターンメモリから標準
パターンの一群りを音声認識装置本体2の第1の標準パ
ターンメモリ1に転送し、処理04で認識処理を起動す
る。本体2は、通常の認識処理を行ない、認識結果と照
合値Mn1(iは標準パターンの一群り内の各パターン
を示す)を、制御部インタフェース10.11を介して
ホストコンピュータ4に転送するので、ホスト)7ビエ
ータ4はフローに示すように認識不能の閾値をθrec
とすると、処理05でMni〉θrecすなわちその照
合値が認識不能の閾値より高いかを判定し、高い場合に
は処理06で変数工を+1し、別途定めた標準パターン
群変更の閾値Nと工が等しくなったかを処理07でチェ
ックしその時に限り、次の標準パターン群L+1を、前
述の方法と同様に本体2に転送する。なお、処理05に
おいて、Mn1(θrecの場合は、本体2で認識処理
を続行することになる。
パターンの一群りを音声認識装置本体2の第1の標準パ
ターンメモリ1に転送し、処理04で認識処理を起動す
る。本体2は、通常の認識処理を行ない、認識結果と照
合値Mn1(iは標準パターンの一群り内の各パターン
を示す)を、制御部インタフェース10.11を介して
ホストコンピュータ4に転送するので、ホスト)7ビエ
ータ4はフローに示すように認識不能の閾値をθrec
とすると、処理05でMni〉θrecすなわちその照
合値が認識不能の閾値より高いかを判定し、高い場合に
は処理06で変数工を+1し、別途定めた標準パターン
群変更の閾値Nと工が等しくなったかを処理07でチェ
ックしその時に限り、次の標準パターン群L+1を、前
述の方法と同様に本体2に転送する。なお、処理05に
おいて、Mn1(θrecの場合は、本体2で認識処理
を続行することになる。
実際的な取扱いとしては、Mni〉θrecの場合には
、認識不能とする。いわゆる認識不能率が高くなったと
きに標準パターン群の変更が打なわれる。なおホストコ
ンビ具−夕4は本体2に対して認識処理の起動をかげる
のみですく、話者の要求(キーボードでも、音声入力で
も、どのような方法でもよい。)により認識処理を停止
できる。第2図の例では標準パターン群を5ケと仮定し
ているのでL=5で処理不能となる。
、認識不能とする。いわゆる認識不能率が高くなったと
きに標準パターン群の変更が打なわれる。なおホストコ
ンビ具−夕4は本体2に対して認識処理の起動をかげる
のみですく、話者の要求(キーボードでも、音声入力で
も、どのような方法でもよい。)により認識処理を停止
できる。第2図の例では標準パターン群を5ケと仮定し
ているのでL=5で処理不能となる。
また認識不能の閾値θrecは、通常よく採用される1
0bit (約1ooo)精度の処理回路では400〜
500をとることが多い。これは、いわゆる正解となる
閾値が200〜300であることと関係する。
0bit (約1ooo)精度の処理回路では400〜
500をとることが多い。これは、いわゆる正解となる
閾値が200〜300であることと関係する。
第5図では、ホスト内に格納した複数の標準パターン群
を、常に最適なワードセクトのみにしておく具体的方法
を示す。第3図では、標準パターン群のiKを5と仮定
する。ホストコンビ晶−夕4の内部プログラムにより、
処理0ATK=5として、処理11で、ホストコンビエ
ータ4の第2の標準パターンメモリ3から第1番目の標
準パターン群を、本体2の第1の標準パターンメモリ1
にダウンロードする。処理12では、ディスプレイによ
りキーワード発声を促し、本体2での8識結果と照合値
をホストコンピ−タ4にとり込み、処理15でマツチン
グ値を表示する。以下に=oになるまで、標準パターン
詳を変更し、最もマツチング値の大きいものを選択して
処理20で、該当の単語全てを発声して本体2の第1の
標準パターンメモリ1に登録し、さらに処理21で、そ
のパターンをホストコンビエータ4に転送すなわちアク
ブロードし、前記のごとく、選択した最もマツチング値
の大きい標準パターン群をホストコンビエータ4の第2
の標準パターンメモリ3より削除して、そのかわりに今
回アクブロードしたものをホストコンピュータ4の第2
の標準パターンメモリ3に格納する。この場合に削除す
べき内容を話者がキーボードなどで指定してもよい。
を、常に最適なワードセクトのみにしておく具体的方法
を示す。第3図では、標準パターン群のiKを5と仮定
する。ホストコンビ晶−夕4の内部プログラムにより、
処理0ATK=5として、処理11で、ホストコンビエ
ータ4の第2の標準パターンメモリ3から第1番目の標
準パターン群を、本体2の第1の標準パターンメモリ1
にダウンロードする。処理12では、ディスプレイによ
りキーワード発声を促し、本体2での8識結果と照合値
をホストコンピ−タ4にとり込み、処理15でマツチン
グ値を表示する。以下に=oになるまで、標準パターン
詳を変更し、最もマツチング値の大きいものを選択して
処理20で、該当の単語全てを発声して本体2の第1の
標準パターンメモリ1に登録し、さらに処理21で、そ
のパターンをホストコンビエータ4に転送すなわちアク
ブロードし、前記のごとく、選択した最もマツチング値
の大きい標準パターン群をホストコンビエータ4の第2
の標準パターンメモリ3より削除して、そのかわりに今
回アクブロードしたものをホストコンピュータ4の第2
の標準パターンメモリ3に格納する。この場合に削除す
べき内容を話者がキーボードなどで指定してもよい。
今回の実施例では、話者に対してディスプレイを用いマ
ツチング値を表示して見せたが、表示せずに、単にホス
トコンピュータ4の内部プログラムで、更新してもよい
。
ツチング値を表示して見せたが、表示せずに、単にホス
トコンピュータ4の内部プログラムで、更新してもよい
。
最後になったが、最も極端な例として、前述の複数の標
準パターン群の各々を、高騒音下で発声したもの、低騒
音下で発声したもの、風邪をひいたときのものとして、
ホストコンビエータ4の第2の標準パターンメモリ3に
格納しておき、利用者が、環境に応じてキーボード6あ
るいはマイク9によるキー入力、音声入力により人為的
に指定する例がある。これは環境変化として予め予測さ
れる条件を揃えておき、利用者が介入して、積極的に認
識率を向上させようとすることも可能である。
準パターン群の各々を、高騒音下で発声したもの、低騒
音下で発声したもの、風邪をひいたときのものとして、
ホストコンビエータ4の第2の標準パターンメモリ3に
格納しておき、利用者が、環境に応じてキーボード6あ
るいはマイク9によるキー入力、音声入力により人為的
に指定する例がある。これは環境変化として予め予測さ
れる条件を揃えておき、利用者が介入して、積極的に認
識率を向上させようとすることも可能である。
本発明によれは、複数の標準パターン群のうち、状況に
応じて最適な標準パターン群1組を選択的に提供できる
ので実効的に認識率を向上する効果がある。
応じて最適な標準パターン群1組を選択的に提供できる
ので実効的に認識率を向上する効果がある。
第1図は本発明が適用される音声入力装置の構成図、第
2図は複数の標準パターン群の中から、最適な標準パタ
ーンを選択的に供給する具体的なフロー、第3図はキー
ワード発声により常に最適な標準パターンを確保するた
めのフローを示す。 1・・・音声認識装置本体2内の第1の標準パターンメ
モリ、 2・・・音声認識装置本体、 3・・・ホスト4内の第2の標準パターンメモリ、4・
・・ホスト、 5・・・ディスプレイ、6・
・・キーボード、 7・・・アップロード1パス
、8・・・タウンロードパス、9・・・マイク、10.
11・・・本体2、ホスト4内の制御部インタフェース
回路。
2図は複数の標準パターン群の中から、最適な標準パタ
ーンを選択的に供給する具体的なフロー、第3図はキー
ワード発声により常に最適な標準パターンを確保するた
めのフローを示す。 1・・・音声認識装置本体2内の第1の標準パターンメ
モリ、 2・・・音声認識装置本体、 3・・・ホスト4内の第2の標準パターンメモリ、4・
・・ホスト、 5・・・ディスプレイ、6・
・・キーボード、 7・・・アップロード1パス
、8・・・タウンロードパス、9・・・マイク、10.
11・・・本体2、ホスト4内の制御部インタフェース
回路。
Claims (1)
- 【特許請求の範囲】 1、登録された標準音声パターンと入力音声パターンと
の比較により認識処理を行なう音声入力装置において、
認識処理部側に音声入力回路、音声分析回路、認識論理
回路、第1の標準パターンメモリおよび制御部とのイン
タフェース回路を設け、制御部側に第2の標準パターン
メモリを設けることによって、話者によって発声された
音声を該音声入力回路で入力し、さらに該音声分析回路
で音声に含まれる特徴パラメータを抽出し、前記制御部
とのインタフェースを介して、第2の標準パターンメモ
リに転送することで、各話者に対する複数の標準パター
ンを用意し、前記制御部側の処理により、状況に応じて
最適な標準パターンを前記認識処理部側の第1の標準パ
ターンメモリに転送することにより実効的に認識率向上
をはかることを特徴とする音声入力装置。 2、認識中に常に照合値をモニターし、一定の閾値を超
えた場合、次々に前記制御部側の第2の標準パターンメ
モリから複数の標準パターン群を一群ごとに前記認識処
理部側の第1の標準パターンメモリに転送し、状況に応
じた標準パターンを提供することにより、実効的に認識
率向上をはかることを特徴とする特許請求の範囲第一項
記載の音声入力装置。 3、一個以上のキーワードにより、各話者の複数の標準
パターンに対して認識を行ない、全ての標準パターンと
の照合値が一定の閾値を超えた場合に、最も照合値の高
い標準パターンを削除し、現時点で再登録した標準パタ
ーンに更新することを特徴とする特許請求の範囲第一項
記載の音声入力装置。 4、該複数の標準パターンを別途設けた切換手段により
選択して前記認識処理部に提供することを特徴とする特
許請求の範囲第一項記載の音声入力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59211377A JPS6191700A (ja) | 1984-10-11 | 1984-10-11 | 音声入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59211377A JPS6191700A (ja) | 1984-10-11 | 1984-10-11 | 音声入力装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6191700A true JPS6191700A (ja) | 1986-05-09 |
Family
ID=16604952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59211377A Pending JPS6191700A (ja) | 1984-10-11 | 1984-10-11 | 音声入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6191700A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002542501A (ja) * | 1999-02-19 | 2002-12-10 | カスタム・スピーチ・ユーエスエイ・インコーポレーテッド | 2つの音声変換インスタンス及びコンピュータ補助訂正を用いる自動転記システム及び方法 |
JP2003504675A (ja) * | 1999-07-08 | 2003-02-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 転送手段を有するスピーチ認識装置 |
JP2004325688A (ja) * | 2003-04-23 | 2004-11-18 | Toyota Motor Corp | 音声認識システム |
JP2007072481A (ja) * | 2006-11-20 | 2007-03-22 | Ricoh Co Ltd | 音声認識システムおよび音声認識方法および記録媒体 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5681899A (en) * | 1979-12-07 | 1981-07-04 | Sanyo Electric Co | Voice indentifier |
JPS56119199A (en) * | 1980-02-26 | 1981-09-18 | Sanyo Electric Co | Voice identifying device |
JPS57139798A (en) * | 1981-02-24 | 1982-08-28 | Tokyo Shibaura Electric Co | Equipment operator by voice |
JPS587698A (ja) * | 1981-07-08 | 1983-01-17 | 株式会社東芝 | 音声認識方式 |
JPS5915994A (ja) * | 1982-07-19 | 1984-01-27 | 株式会社東芝 | 音声認識装置 |
JPS5934595A (ja) * | 1982-08-20 | 1984-02-24 | 富士通株式会社 | 音声認識処理方式 |
JPS59137999A (ja) * | 1983-01-27 | 1984-08-08 | 松下電器産業株式会社 | 音声認識装置 |
JPS59167636A (ja) * | 1983-03-15 | 1984-09-21 | Matsushita Electric Ind Co Ltd | 加熱装置 |
-
1984
- 1984-10-11 JP JP59211377A patent/JPS6191700A/ja active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5681899A (en) * | 1979-12-07 | 1981-07-04 | Sanyo Electric Co | Voice indentifier |
JPS56119199A (en) * | 1980-02-26 | 1981-09-18 | Sanyo Electric Co | Voice identifying device |
JPS57139798A (en) * | 1981-02-24 | 1982-08-28 | Tokyo Shibaura Electric Co | Equipment operator by voice |
JPS587698A (ja) * | 1981-07-08 | 1983-01-17 | 株式会社東芝 | 音声認識方式 |
JPS5915994A (ja) * | 1982-07-19 | 1984-01-27 | 株式会社東芝 | 音声認識装置 |
JPS5934595A (ja) * | 1982-08-20 | 1984-02-24 | 富士通株式会社 | 音声認識処理方式 |
JPS59137999A (ja) * | 1983-01-27 | 1984-08-08 | 松下電器産業株式会社 | 音声認識装置 |
JPS59167636A (ja) * | 1983-03-15 | 1984-09-21 | Matsushita Electric Ind Co Ltd | 加熱装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002542501A (ja) * | 1999-02-19 | 2002-12-10 | カスタム・スピーチ・ユーエスエイ・インコーポレーテッド | 2つの音声変換インスタンス及びコンピュータ補助訂正を用いる自動転記システム及び方法 |
JP2003504675A (ja) * | 1999-07-08 | 2003-02-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 転送手段を有するスピーチ認識装置 |
JP4659311B2 (ja) * | 1999-07-08 | 2011-03-30 | ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー | 転送手段を有するスピーチ認識装置 |
JP2004325688A (ja) * | 2003-04-23 | 2004-11-18 | Toyota Motor Corp | 音声認識システム |
JP2007072481A (ja) * | 2006-11-20 | 2007-03-22 | Ricoh Co Ltd | 音声認識システムおよび音声認識方法および記録媒体 |
JP4658022B2 (ja) * | 2006-11-20 | 2011-03-23 | 株式会社リコー | 音声認識システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0702351B1 (en) | Method and apparatus for analysing audio input events in a speech recognition system | |
US5163111A (en) | Customized personal terminal device | |
US4769845A (en) | Method of recognizing speech using a lip image | |
CN106649694A (zh) | 语音交互中确定用户意图的方法及装置 | |
CN108447471A (zh) | 语音识别方法及语音识别装置 | |
US5752230A (en) | Method and apparatus for identifying names with a speech recognition program | |
CN110544468A (zh) | 应用唤醒方法、装置、存储介质及电子设备 | |
CN110580897B (zh) | 音频校验方法、装置、存储介质及电子设备 | |
JP2000075887A (ja) | パターン認識装置、方法及びシステム | |
JP3792755B2 (ja) | 文字認識方法及び装置 | |
JPS6191700A (ja) | 音声入力装置 | |
JP4244423B2 (ja) | 適正単語列推定装置 | |
CN111724795A (zh) | 一种相册播放方法及装置 | |
CN106971734A (zh) | 一种可根据模型的提取频率训练识别模型的方法及系统 | |
JPH09185632A (ja) | 情報検索・編集方法及び装置 | |
JPS6151798B2 (ja) | ||
JPH06175698A (ja) | 音声検索装置 | |
JPS61148497A (ja) | 標準パタン作成装置 | |
JP2002251236A (ja) | ネットワークサービスシステム | |
JPS59117632A (ja) | 音声入力方式 | |
JPS5864548A (ja) | 音声日本語処理システム | |
JPS637398B2 (ja) | ||
JPS62124599A (ja) | 音声認識装置 | |
CN116016747A (zh) | 车机蓝牙通话系统的控制方法、装置、电子设备及介质 | |
CN111401059A (zh) | 小说朗读的方法 |