JPS6172377A - パタ−ン認識装置 - Google Patents
パタ−ン認識装置Info
- Publication number
- JPS6172377A JPS6172377A JP59194411A JP19441184A JPS6172377A JP S6172377 A JPS6172377 A JP S6172377A JP 59194411 A JP59194411 A JP 59194411A JP 19441184 A JP19441184 A JP 19441184A JP S6172377 A JPS6172377 A JP S6172377A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- pattern
- learning
- dictionary
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は認識辞書の学習を効率良く行い、入力パターン
に対する認識率の向上を効果的に図り得るパターン認識
装置に関する。
に対する認識率の向上を効果的に図り得るパターン認識
装置に関する。
近時、文字認識、音声認識9図面読取等のパターン認識
技術の発達が目覚ましく、例えば音声ワードプロセッサ
、手書き文字の読取り入力装置等におけるパターン認識
装置が種々開発されている。
技術の発達が目覚ましく、例えば音声ワードプロセッサ
、手書き文字の読取り入力装置等におけるパターン認識
装置が種々開発されている。
しかして一般に、この種のパターン認識装置にあっては
、予め準備された認識辞書と入力パターンとを照合処理
して該入力パターンに対する認識結果を得ている。これ
故、入力パターンの高いTel IEd 率を
得る為には、実際に使用されているパターンや、パター
ン認識装置の利用時に用いられるパターンを多数収集し
て上記認識辞書の学習を行ない、充実度の高い認識辞書
を作成することが必要である。
、予め準備された認識辞書と入力パターンとを照合処理
して該入力パターンに対する認識結果を得ている。これ
故、入力パターンの高いTel IEd 率を
得る為には、実際に使用されているパターンや、パター
ン認識装置の利用時に用いられるパターンを多数収集し
て上記認識辞書の学習を行ない、充実度の高い認識辞書
を作成することが必要である。
然し乍ら、予め多数のパターンを収集する必要があるこ
と、また収集されたパターンを用いた認識辞書の学習処
理に多大な処理時間が必要なこと等が大きな課題となっ
ている。例えば単音節の音声認識を行う為の256次元
のベクトルとして表現される101個のカテゴリからな
る単音節Wg識辞書をに−L展開によって学習する場合
、演算処理速度がIMIPSの高速型の大型計算機を用
いたとしても、約5時間もの処理時間が必要となる。
と、また収集されたパターンを用いた認識辞書の学習処
理に多大な処理時間が必要なこと等が大きな課題となっ
ている。例えば単音節の音声認識を行う為の256次元
のベクトルとして表現される101個のカテゴリからな
る単音節Wg識辞書をに−L展開によって学習する場合
、演算処理速度がIMIPSの高速型の大型計算機を用
いたとしても、約5時間もの処理時間が必要となる。
ところで従来、パターンの収集と認識辞書の学習は、一
般的に入力パターンの認識とは異なった状態で行われて
いる。即ち、パターンm I 装置の動作状態を認識状
態から学習状態に切替えて行われている。例えばオンラ
イン手書き文字読取り装置にあっては、そのパターン認
識処理を中断して学習用のパターンを入力し、認識辞書
の学習を行っている。この為、認識辞書の学習処理中、
入力パターンの認識処理が行えないと云う不具合があっ
た。
般的に入力パターンの認識とは異なった状態で行われて
いる。即ち、パターンm I 装置の動作状態を認識状
態から学習状態に切替えて行われている。例えばオンラ
イン手書き文字読取り装置にあっては、そのパターン認
識処理を中断して学習用のパターンを入力し、認識辞書
の学習を行っている。この為、認識辞書の学習処理中、
入力パターンの認識処理が行えないと云う不具合があっ
た。
また、音声ワードプロセッサ等のように会話的に入力さ
れたパターンを認識するパターン認識装置にあっては、
入力パターンを認識処理する演算処理部はパターンが入
力された成る一定時間に1って動作するだけある。そし
て他の時間は、パターンの入力待ち状態として待機し、
上記演算処理部は事実上体止している。これにも拘らず
、パターン認識装置の動作状態を学習状態に設定し、改
めて学習用のパターンを入力し認識辞書の学習を行って
いるので、その利用者に多大な負担を強いることのみな
らず時間の無駄が多かった。
れたパターンを認識するパターン認識装置にあっては、
入力パターンを認識処理する演算処理部はパターンが入
力された成る一定時間に1って動作するだけある。そし
て他の時間は、パターンの入力待ち状態として待機し、
上記演算処理部は事実上体止している。これにも拘らず
、パターン認識装置の動作状態を学習状態に設定し、改
めて学習用のパターンを入力し認識辞書の学習を行って
いるので、その利用者に多大な負担を強いることのみな
らず時間の無駄が多かった。
また不特定話者や不特定筆者からの入力パターンを高い
精度で認識する場合、認識処理に供せられる入力パター
ンをそのまま学習用パターンとして収集し、これらのパ
ターンを用いて認識辞書を学習することが考えられてい
る。このようにすれば認識辞書学習用のパターン収集を
効果的に行うことができ、また認識辞書の充実化を容易
に図ることが可能となる。然し乍ら、このようにして収
集した多数のパターンを学習状態を設定して・学習を行
う為には、膨大な処理時間が必要となる等、多くの問題
が生じた。
精度で認識する場合、認識処理に供せられる入力パター
ンをそのまま学習用パターンとして収集し、これらのパ
ターンを用いて認識辞書を学習することが考えられてい
る。このようにすれば認識辞書学習用のパターン収集を
効果的に行うことができ、また認識辞書の充実化を容易
に図ることが可能となる。然し乍ら、このようにして収
集した多数のパターンを学習状態を設定して・学習を行
う為には、膨大な処理時間が必要となる等、多くの問題
が生じた。
(発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、パターン認識に供する認識辞書
を時間的な無駄を招来することなく効果的に学習するこ
とができ、またパターン認識処理を妨げることなしに認
識辞書の学習を行うことができる簡易な構成で認識率の
高いパターン認識装置を提供することにある。
の目的とするところは、パターン認識に供する認識辞書
を時間的な無駄を招来することなく効果的に学習するこ
とができ、またパターン認識処理を妨げることなしに認
識辞書の学習を行うことができる簡易な構成で認識率の
高いパターン認識装置を提供することにある。
(発明の概要)
本発明に係るパターン認識装置は、演算処理部により入
力パターンと認識辞書とを照合処理して上記入力パター
ンの認識結果を得るパターン認識装置本体が、上記パタ
ーン認識装置本体のアイドル状態にある演算処理部、例
えば入力パターンと認識辞書とを照合処理する演算処理
部と同一の構成を有し、該入力パターンと認識辞書とを
照合処理する演算処理部とは別に設けられた演算処理部
、または入力パターンと認識辞書との照合処理の休止状
態にある演算処理部を用いて前記認識辞書を学習してな
ることを特徴とするものである。
力パターンと認識辞書とを照合処理して上記入力パター
ンの認識結果を得るパターン認識装置本体が、上記パタ
ーン認識装置本体のアイドル状態にある演算処理部、例
えば入力パターンと認識辞書とを照合処理する演算処理
部と同一の構成を有し、該入力パターンと認識辞書とを
照合処理する演算処理部とは別に設けられた演算処理部
、または入力パターンと認識辞書との照合処理の休止状
態にある演算処理部を用いて前記認識辞書を学習してな
ることを特徴とするものである。
かくして本発明によれば、入力パターンのHa処理に用
いる演算処理部と同一構成の別の演算処理部を用いて、
或いは入力パターンの認識処理に用いる演算処理部の上
記認識処理の休止期間を利用して、例えば成る認識処理
から次の認識処理までの間に同一の演算回路によりその
入力パターンを利用して認識辞書の学習を行うので、利
用者に負担をかけることなく信頼性の高い認識辞書を効
率良く作成することができる。従って認識率の大幅な向
上を簡易に図ることが可能となる。また装置を認識辞書
の学習に専有することがないので、パターン認識処理が
妨げられることがなく、時間的な無駄を招来することな
しに装置を効果的に利5. 用することが可能となる
。つまり、少ない時間と演算処理部の有効利用によって
認識辞書の高性能化を容易に図り、認識率の向上を図る
ことが可能となる等の実用上多大なる効果が奏せられる
。
いる演算処理部と同一構成の別の演算処理部を用いて、
或いは入力パターンの認識処理に用いる演算処理部の上
記認識処理の休止期間を利用して、例えば成る認識処理
から次の認識処理までの間に同一の演算回路によりその
入力パターンを利用して認識辞書の学習を行うので、利
用者に負担をかけることなく信頼性の高い認識辞書を効
率良く作成することができる。従って認識率の大幅な向
上を簡易に図ることが可能となる。また装置を認識辞書
の学習に専有することがないので、パターン認識処理が
妨げられることがなく、時間的な無駄を招来することな
しに装置を効果的に利5. 用することが可能となる
。つまり、少ない時間と演算処理部の有効利用によって
認識辞書の高性能化を容易に図り、認識率の向上を図る
ことが可能となる等の実用上多大なる効果が奏せられる
。
以下、図面を参照して本発明の実施例につき説明する。
第1図は実施例装置の要部概略構成を示す図である。こ
の装置はオンライン入力される手書き文字パターン、例
えば書状郵便物に記載された宛名を読取り入力し、その
文字パターンを認識処理するものからなる。認識部1は
入力パターンと辞書記憶部2に登録された認識辞書とを
照合して上記入力パターンに対する認識結果を求めるも
のである。このパターン認識処理は、例えば周知の複合
類似度法や部分空間法を用いる等して行われる。
の装置はオンライン入力される手書き文字パターン、例
えば書状郵便物に記載された宛名を読取り入力し、その
文字パターンを認識処理するものからなる。認識部1は
入力パターンと辞書記憶部2に登録された認識辞書とを
照合して上記入力パターンに対する認識結果を求めるも
のである。このパターン認識処理は、例えば周知の複合
類似度法や部分空間法を用いる等して行われる。
またディスプレイ3およびキーボード4は上記パターン
認識結果に対する修正処理を行う為の端末である。この
端末を介して、例えば認識リジェクトされた入力パター
ンや認識エラーを生じた認識結果に対する入力パターン
の正しいカテゴリ名が入力される等して、その修正が行
われる。
認識結果に対する修正処理を行う為の端末である。この
端末を介して、例えば認識リジェクトされた入力パター
ンや認識エラーを生じた認識結果に対する入力パターン
の正しいカテゴリ名が入力される等して、その修正が行
われる。
また学習部5は上記認識部1と同じ構成の演算処理部を
備えて構成される。この学習部5は、前記認識部1にお
いて前記入力パターンの認識リジェクトや認識エラーが
生じたときに起動され、例えば前記入力パターンを認識
辞書学習用パターンとして用いて、上記認識部1とは独
立に前記認識辞書の学習を行い、その学習結果に基いて
前記辞書記憶部2に登録された認識辞書を更新するもの
である。またこの学習部5には特性核記憶部6、学習中
間状態記憶部7、エラー・リジェクト記憶部8が設けら
れている。尚、このエラー・リジェクト記憶部8は上記
特性核記憶部6、または学習中間状態記憶部7の一部の
メモリ領域として構成されることもある。
備えて構成される。この学習部5は、前記認識部1にお
いて前記入力パターンの認識リジェクトや認識エラーが
生じたときに起動され、例えば前記入力パターンを認識
辞書学習用パターンとして用いて、上記認識部1とは独
立に前記認識辞書の学習を行い、その学習結果に基いて
前記辞書記憶部2に登録された認識辞書を更新するもの
である。またこの学習部5には特性核記憶部6、学習中
間状態記憶部7、エラー・リジェクト記憶部8が設けら
れている。尚、このエラー・リジェクト記憶部8は上記
特性核記憶部6、または学習中間状態記憶部7の一部の
メモリ領域として構成されることもある。
しかして、前記学習部5は前記認識部1が入力パターン
の認識処理においてエラーまたはりジェツトを発生した
とき、例えばその入力パターンに対して修正入力される
正しいカテゴリ名と上記入力パターンとに基いて、K−
L展開を使用する等してその認識辞書の特性核または相
関行列に対する入力パターンの寄与率を変化させる等し
て前記認識辞書の学習を行うものである。例えば、前記
認識部1が入力パターンに対して得た認識結果、および
その認識結果に対するパターン入力者の合・否の指示情
報、上記入力パターン、既に記憶されている他の入力パ
ターン、複合類似度で認識する場合は特性核、認識時に
おける誤り傾向を示すコンヒユージョンマトリックス等
を用いて、前記辞書記憶部2に登録されている認識辞書
について学習を行い、その更新を行っている。尚、この
学習部5は、例えば前記入力パターンの02エラーやり
ジェツトが発生し、前記認識辞書の学習が必要となった
場合にのみ、第2図(a)に示すように前記認識部1と
並列的に起動される。従って、通常は前記認識部1だけ
が稼働状態にある。そして、上記学習部5が認識辞書の
学習を開始しても、認識部1は順次入力される入力パタ
ーンに対する認識処理を継続する。従って前記学習部5
による認識辞書の学習実行中に新たな入力パターンに対
する認識リジェクトや認識エラーが発生することがある
。このような場合、その入力パターン、および入力パタ
ーンと認識辞書との照合処理結果が前記エラー・リジェ
クト記憶部8に順次記憶されて、前記・認識辞書の学習
に備えられる。
の認識処理においてエラーまたはりジェツトを発生した
とき、例えばその入力パターンに対して修正入力される
正しいカテゴリ名と上記入力パターンとに基いて、K−
L展開を使用する等してその認識辞書の特性核または相
関行列に対する入力パターンの寄与率を変化させる等し
て前記認識辞書の学習を行うものである。例えば、前記
認識部1が入力パターンに対して得た認識結果、および
その認識結果に対するパターン入力者の合・否の指示情
報、上記入力パターン、既に記憶されている他の入力パ
ターン、複合類似度で認識する場合は特性核、認識時に
おける誤り傾向を示すコンヒユージョンマトリックス等
を用いて、前記辞書記憶部2に登録されている認識辞書
について学習を行い、その更新を行っている。尚、この
学習部5は、例えば前記入力パターンの02エラーやり
ジェツトが発生し、前記認識辞書の学習が必要となった
場合にのみ、第2図(a)に示すように前記認識部1と
並列的に起動される。従って、通常は前記認識部1だけ
が稼働状態にある。そして、上記学習部5が認識辞書の
学習を開始しても、認識部1は順次入力される入力パタ
ーンに対する認識処理を継続する。従って前記学習部5
による認識辞書の学習実行中に新たな入力パターンに対
する認識リジェクトや認識エラーが発生することがある
。このような場合、その入力パターン、および入力パタ
ーンと認識辞書との照合処理結果が前記エラー・リジェ
クト記憶部8に順次記憶されて、前記・認識辞書の学習
に備えられる。
ところで前記認識部1は入力パターンの認識リジェクト
や認識エラーが発生したとき、前記修正端末から前記入
力パターンに対する正しいカテゴリの情報が入力された
時点で、その入力パターンに対する正しいカテゴリ名と
、認識エラーしたカテゴリ名とをそれぞれ知ることがで
きる。このような情報を受けて前記g識部1は、その認
識処理において求められた前記入力パターンとエラー先
カテゴリの認識辞書パターンとの類似度、および上記入
力パターンと正しいカテゴリの認識辞書パターンと類似
度をそれぞれ抽出している。学習部5はこのような入力
パターンの上記各カテゴリに対して求められた類似度の
情報を入力し、正しいカテゴリの特性核とエラー先のカ
テゴリの特性核、或いはその一方の特性核を前記特性核
記憶部6から読出し、その特性核を次のようにして更新
している。
や認識エラーが発生したとき、前記修正端末から前記入
力パターンに対する正しいカテゴリの情報が入力された
時点で、その入力パターンに対する正しいカテゴリ名と
、認識エラーしたカテゴリ名とをそれぞれ知ることがで
きる。このような情報を受けて前記g識部1は、その認
識処理において求められた前記入力パターンとエラー先
カテゴリの認識辞書パターンとの類似度、および上記入
力パターンと正しいカテゴリの認識辞書パターンと類似
度をそれぞれ抽出している。学習部5はこのような入力
パターンの上記各カテゴリに対して求められた類似度の
情報を入力し、正しいカテゴリの特性核とエラー先のカ
テゴリの特性核、或いはその一方の特性核を前記特性核
記憶部6から読出し、その特性核を次のようにして更新
している。
Kn+t−(1−W) Krl +w<f、f >(
但し、〈、〉はdyadである) ここで上記Wは、正ならば特性核の入力パターンに対す
る類似度を大きくする作用があり、負ならば上記類似度
を小さくする作用がある。この認識辞書の学習処理プロ
セスは、例えば特開昭56−137483号に示される
ものと同様に行っても良いが、必要に応じて複数回繰返
えすようにしても良い。
但し、〈、〉はdyadである) ここで上記Wは、正ならば特性核の入力パターンに対す
る類似度を大きくする作用があり、負ならば上記類似度
を小さくする作用がある。この認識辞書の学習処理プロ
セスは、例えば特開昭56−137483号に示される
ものと同様に行っても良いが、必要に応じて複数回繰返
えすようにしても良い。
しかる後、この特性核の固有値問題を解くことによって
、更新された認識辞書を得ることが可能となる。尚、こ
の時点で前記修正端末に学習終了の信号を送り、上記の
如く学習された認識辞書の確認を利用者に求めるように
しても良い。このようにすれば、その利用者は前記辞書
記憶部2に登録された認識辞書を更新する前に、その認
識辞書の学習の正当性をチェックすることができる。し
かして、g識辞書を更新して良い場合には、前記辞書記
憶部2に新しい認識辞書を格納してその学習処理が完了
する。・ ところで一般に上記認識辞書の学習のプロセスには、前
述したように多くの時間を必要とする。
、更新された認識辞書を得ることが可能となる。尚、こ
の時点で前記修正端末に学習終了の信号を送り、上記の
如く学習された認識辞書の確認を利用者に求めるように
しても良い。このようにすれば、その利用者は前記辞書
記憶部2に登録された認識辞書を更新する前に、その認
識辞書の学習の正当性をチェックすることができる。し
かして、g識辞書を更新して良い場合には、前記辞書記
憶部2に新しい認識辞書を格納してその学習処理が完了
する。・ ところで一般に上記認識辞書の学習のプロセスには、前
述したように多くの時間を必要とする。
しかも、入力パターンの認識処理とは独立に実行される
為、認識処理の終了に伴って装置の電源を切る時に、前
記認識辞書の学習が終了していない可能性がある。この
ような場合、本装置にあっては学習部5における認識辞
書の学習の中間状態が中間状態記憶部7にセーブされる
。最も簡単なセーブの手法は、認識辞書の学習のプログ
ラム領域、データ領域、実行アドレス、およびその状態
フラグの全てをセーブすることである。このうち上記プ
ログラム領域については、Wg識処理の実行中に変更さ
れないことが保証されれば、あえてセーブする必要はな
い。
為、認識処理の終了に伴って装置の電源を切る時に、前
記認識辞書の学習が終了していない可能性がある。この
ような場合、本装置にあっては学習部5における認識辞
書の学習の中間状態が中間状態記憶部7にセーブされる
。最も簡単なセーブの手法は、認識辞書の学習のプログ
ラム領域、データ領域、実行アドレス、およびその状態
フラグの全てをセーブすることである。このうち上記プ
ログラム領域については、Wg識処理の実行中に変更さ
れないことが保証されれば、あえてセーブする必要はな
い。
しかして次に装置の電源が投入されてパターン認識処理
が再開されると、前記学習中間状態記憶部7にセーブさ
れた前記各情報が前記学習部5にリロードされる。そし
て、その実行アドレスから前記認識辞書の学習が再開さ
れる。第2図(b)はこのプロセスの時間的流れの一例
を示している。
が再開されると、前記学習中間状態記憶部7にセーブさ
れた前記各情報が前記学習部5にリロードされる。そし
て、その実行アドレスから前記認識辞書の学習が再開さ
れる。第2図(b)はこのプロセスの時間的流れの一例
を示している。
このように本装置によれば、パターン認識処理を中断す
ることなしに認識辞書の学習を行って認識辞書の高性能
化を図ることができ、認識性能の向上を図ることができ
る。また従来、多くの労力と多大な時間を必要とたg識
辞書の開発・充実化を極めて簡易に行い得る等の効果が
奏せられる。
ることなしに認識辞書の学習を行って認識辞書の高性能
化を図ることができ、認識性能の向上を図ることができ
る。また従来、多くの労力と多大な時間を必要とたg識
辞書の開発・充実化を極めて簡易に行い得る等の効果が
奏せられる。
ところで上述した実施例装置はオンライン入力される入
力パターンを順次連続的にパターン認識するものである
が、対話的に音声入力きれる単音部を認識するような音
声ワードプロセッサ等のパターン認識装置にあっては、
その認識部1はパターンが入力されたときだけその入力
パターンを認識処理し、その他の時間は休止状態にある
。従って、この認識部1の休止期間を利用して認識辞書
の学習を実行することも可能である。第3図はこのよう
な観点に立脚して構成された本発明の別の実施例装置の
要部概略構成を示すものである。尚、先の実施例装置と
同一部分には同一符号を付して示しである。また、図中
9は、入力パターンの前処理部を示している。
力パターンを順次連続的にパターン認識するものである
が、対話的に音声入力きれる単音部を認識するような音
声ワードプロセッサ等のパターン認識装置にあっては、
その認識部1はパターンが入力されたときだけその入力
パターンを認識処理し、その他の時間は休止状態にある
。従って、この認識部1の休止期間を利用して認識辞書
の学習を実行することも可能である。第3図はこのよう
な観点に立脚して構成された本発明の別の実施例装置の
要部概略構成を示すものである。尚、先の実施例装置と
同一部分には同一符号を付して示しである。また、図中
9は、入力パターンの前処理部を示している。
この装置は、認識辞書を学習する為の各別な学習部を備
えず、第4図に処理の時間的な流れを示すように¥ll
郡部1認識処理体止期間を利用して前記認識辞書の学習
を上記認識部1で行わせるようにしたものである。即ち
、認識部1において入力パターンと認識辞書とを照合し
ての認識結果を求める演算処理部の一部または全部は、
認識辞書の学習にそのまま利用することができる。具体
的には、認識処理および学習処理における主要な演算で
ある積和演算は、同様な処理プロセスによって行われる
。従って、パターン認識処理の休止状態にある認識部1
を利用すれば、学習状態を改めて設定することなしに前
述した認識辞書の学習を時間的に効率良く実行すること
が可能となる。
えず、第4図に処理の時間的な流れを示すように¥ll
郡部1認識処理体止期間を利用して前記認識辞書の学習
を上記認識部1で行わせるようにしたものである。即ち
、認識部1において入力パターンと認識辞書とを照合し
ての認識結果を求める演算処理部の一部または全部は、
認識辞書の学習にそのまま利用することができる。具体
的には、認識処理および学習処理における主要な演算で
ある積和演算は、同様な処理プロセスによって行われる
。従って、パターン認識処理の休止状態にある認識部1
を利用すれば、学習状態を改めて設定することなしに前
述した認識辞書の学習を時間的に効率良く実行すること
が可能となる。
第5図はこのように構成された装置において、単音節音
声パターンの認識を行う場合の処理の流れを示すもので
ある。
声パターンの認識を行う場合の処理の流れを示すもので
ある。
この場合、一般に認識用辞書として不特定話者用のもの
が備えられている。先ず発声者が単音節′1□1 を
発声入力すると、前処理部9を介して入力音声パターン
が求められ、その入力音声パターンは認識辞書と照合さ
れて認識処理される。ここで、例えば単音節「ば」を発
声したにも拘らず「あ」と誤認識し、上記入力音声パタ
ーンと上記「!ざ」お、よび「あ」の各認識辞書との類
似度の差が僅かであり、上記入力音声パターンを学習用
データとして利用可能であると判断された場合には、上
記入力音声パターンとその認識結果等が学習情報として
記憶される。しかる後、次に認識処理すべき入力音声パ
ターンが前記前処理部9を介して継続的に入力されいて
るか否かが判定される。入力音声パターンが継続的に入
力されている場合には、上記の処理を繰返す。しかして
、例えば発声者が入力内容を考えている場合や、所謂息
継ぎをしている等して音声パターンの入力が途切れた場
合、ここで前記認識辞書の学習条件が整っているか否か
が判断される。例えば、先に実行した認識辞書の学習時
より「あ」 「ば丁「か」 「たJを誤った回数が各々
10回以上である場合、「あ」 「ば」「か」 「た」
に対する学習条件が整っているとしてその認識辞書の学
習を行なう。尚、上記学習条件が整っていない場合には
、前述した処理を繰り返し実行する。
が備えられている。先ず発声者が単音節′1□1 を
発声入力すると、前処理部9を介して入力音声パターン
が求められ、その入力音声パターンは認識辞書と照合さ
れて認識処理される。ここで、例えば単音節「ば」を発
声したにも拘らず「あ」と誤認識し、上記入力音声パタ
ーンと上記「!ざ」お、よび「あ」の各認識辞書との類
似度の差が僅かであり、上記入力音声パターンを学習用
データとして利用可能であると判断された場合には、上
記入力音声パターンとその認識結果等が学習情報として
記憶される。しかる後、次に認識処理すべき入力音声パ
ターンが前記前処理部9を介して継続的に入力されいて
るか否かが判定される。入力音声パターンが継続的に入
力されている場合には、上記の処理を繰返す。しかして
、例えば発声者が入力内容を考えている場合や、所謂息
継ぎをしている等して音声パターンの入力が途切れた場
合、ここで前記認識辞書の学習条件が整っているか否か
が判断される。例えば、先に実行した認識辞書の学習時
より「あ」 「ば丁「か」 「たJを誤った回数が各々
10回以上である場合、「あ」 「ば」「か」 「た」
に対する学習条件が整っているとしてその認識辞書の学
習を行なう。尚、上記学習条件が整っていない場合には
、前述した処理を繰り返し実行する。
しかして前記学習条件が整っており、認識辞書の学習を
行なう場合には、学習対象となるカテゴリの、例えば「
あ」のパターンの学習情報を読出して、先に述べた方式
に従って認識辞書の学習が行われφ。この認識辞書の学
習は、その学習対象とするカテゴリの全て入力パターン
に対して実行されるまで継続される。この認識辞書の学
習処理中は辞書記憶部2に登録された認識辞書はそのま
まの状態に保たれる。そして、その学習が終了して新た
な認識辞書が得られた時点で、前記辞書記憶部2に登録
された認識辞書が更新される。従って、この更新が行わ
れた時点以後は、新しい認識辞書を用いて入力パターン
の認識処理が行われる。
行なう場合には、学習対象となるカテゴリの、例えば「
あ」のパターンの学習情報を読出して、先に述べた方式
に従って認識辞書の学習が行われφ。この認識辞書の学
習は、その学習対象とするカテゴリの全て入力パターン
に対して実行されるまで継続される。この認識辞書の学
習処理中は辞書記憶部2に登録された認識辞書はそのま
まの状態に保たれる。そして、その学習が終了して新た
な認識辞書が得られた時点で、前記辞書記憶部2に登録
された認識辞書が更新される。従って、この更新が行わ
れた時点以後は、新しい認識辞書を用いて入力パターン
の認識処理が行われる。
以上の処理が繰返し実行されて、認識辞書が次々と更新
されて、その充実化が図られる。故に、認識辞書の学習
が行われるに従って、入力パターンに対する認識率の向
上が図られることになる。
されて、その充実化が図られる。故に、認識辞書の学習
が行われるに従って、入力パターンに対する認識率の向
上が図られることになる。
ところで、手書文字パターンの認識を行なう場合には、
例えば第6図および第7図に示すような処理が行われる
。第6図はバックグラウンド処理として動作する学習処
理を示しており、また第7図は入力文字パターンの前処
理が終了する毎に前記認識部1に対して発生される認識
処理の割り込み処理を示している。即ち、手書き文字入
力の場合、その入力速度が遅いことから、パターンの入
力(前処理)が終了した時点でその認識処理が認識部1
に対する割込みとして起動されるようになっている。
例えば第6図および第7図に示すような処理が行われる
。第6図はバックグラウンド処理として動作する学習処
理を示しており、また第7図は入力文字パターンの前処
理が終了する毎に前記認識部1に対して発生される認識
処理の割り込み処理を示している。即ち、手書き文字入
力の場合、その入力速度が遅いことから、パターンの入
力(前処理)が終了した時点でその認識処理が認識部1
に対する割込みとして起動されるようになっている。
しかして入力された文字パターンの前処理が終了すると
、第7図に示すように割込み処理が起動され、その入力
パターンが認識辞書と照合されて認識される。ここで、
例えば「識」と筆記したにも拘らずrillと誤認識し
、これらの各カテゴリの認識辞書と入力パターンとの類
似度差が僅かである場合、上記入力パターンおよび上記
類似度差の情報等が学習用データとして記憶される。し
かして上記割込み処理による入力パターンの認識処理が
終了すると、第6図に示すバックグラウンド処理、つま
り学習処理が行われる。このバックグラウンド処理とし
て実行される学習処理は、基本的には前記第5図に示す
学習処理と同様である。
、第7図に示すように割込み処理が起動され、その入力
パターンが認識辞書と照合されて認識される。ここで、
例えば「識」と筆記したにも拘らずrillと誤認識し
、これらの各カテゴリの認識辞書と入力パターンとの類
似度差が僅かである場合、上記入力パターンおよび上記
類似度差の情報等が学習用データとして記憶される。し
かして上記割込み処理による入力パターンの認識処理が
終了すると、第6図に示すバックグラウンド処理、つま
り学習処理が行われる。このバックグラウンド処理とし
て実行される学習処理は、基本的には前記第5図に示す
学習処理と同様である。
しかし、割り込み許可の状態で認識辞書の学習を実行し
て、適宜割り込みによる認識処理が行えるようにしてい
るが、認識用辞書を更新する際には、その認識用辞書の
更新が完了するまで該認識辞書を使用するI!処理の割
り込みを受付けないように処理ループを構成している。
て、適宜割り込みによる認識処理が行えるようにしてい
るが、認識用辞書を更新する際には、その認識用辞書の
更新が完了するまで該認識辞書を使用するI!処理の割
り込みを受付けないように処理ループを構成している。
このようにして、認識辞書の学習とその認識辞書を用い
た入力パターンの!!識処理が、共通の認識部1を利用
して行われるようになっている。
た入力パターンの!!識処理が、共通の認識部1を利用
して行われるようになっている。
以上説明したように、本実施例装置によれば認識部1が
認識処理を休止している時間を利用して認識辞書の学習
処理を行うので、従来のように一括して学習処理を行な
う場合に比較して、学習処理という時間を、常時使用す
る利用者には勿論のこと、一時的に使用する利用者にも
意識させるこΔ となく辞書更新を行うことが
できる。また、時間的な無駄を招くことなく認識部1を
有効に利用して、認識辞書を更新して、Wg識率の大幅
な向上を図ることが可能となる。また現在の有効な学習
方式は、主に統計的処理を基本にして多数の収集データ
について繰返して学習処理を行い、積和演算が基本とな
っている。これ故、大きな演算能力が必製となるが、上
述した如く認識辞書の学習を行う本装置は、特に高精度
のパターン認識装置を実現する場合には非常に有効であ
る。また演算素子の進歩を考慮した場合、より多撮能で
高精度なパターン認識装置を実現する上で本発明は極め
て有効である。
認識処理を休止している時間を利用して認識辞書の学習
処理を行うので、従来のように一括して学習処理を行な
う場合に比較して、学習処理という時間を、常時使用す
る利用者には勿論のこと、一時的に使用する利用者にも
意識させるこΔ となく辞書更新を行うことが
できる。また、時間的な無駄を招くことなく認識部1を
有効に利用して、認識辞書を更新して、Wg識率の大幅
な向上を図ることが可能となる。また現在の有効な学習
方式は、主に統計的処理を基本にして多数の収集データ
について繰返して学習処理を行い、積和演算が基本とな
っている。これ故、大きな演算能力が必製となるが、上
述した如く認識辞書の学習を行う本装置は、特に高精度
のパターン認識装置を実現する場合には非常に有効であ
る。また演算素子の進歩を考慮した場合、より多撮能で
高精度なパターン認識装置を実現する上で本発明は極め
て有効である。
尚、本発明は上述した実施例に限定されるものではない
。例えば入力パターンを表わす特徴ベクトルの種類や、
その特徴ベクトルを用いたパターン認識法については、
従来知られた種々の方式をその用途に応じて適宜用いれ
ばよい。また実施例では単音節音声認識と手書文字認識
ついて述べたが、その他のパターン認識にも適用可能で
あり、また特定利用者用、不特定利用者用の装置に拘ら
ず本発明を実施することができる。更には、単音節音声
認識や手書文字認識のみならず、単語音声認識や連続数
字音声認識、手書図面入力装置等、認識用辞書を用いて
入力パターンを認識処理するパターン入力装置に適用可
能である。要するに本発明はその要旨を逸脱しない範囲
で種々変形して実施することができる。
。例えば入力パターンを表わす特徴ベクトルの種類や、
その特徴ベクトルを用いたパターン認識法については、
従来知られた種々の方式をその用途に応じて適宜用いれ
ばよい。また実施例では単音節音声認識と手書文字認識
ついて述べたが、その他のパターン認識にも適用可能で
あり、また特定利用者用、不特定利用者用の装置に拘ら
ず本発明を実施することができる。更には、単音節音声
認識や手書文字認識のみならず、単語音声認識や連続数
字音声認識、手書図面入力装置等、認識用辞書を用いて
入力パターンを認識処理するパターン入力装置に適用可
能である。要するに本発明はその要旨を逸脱しない範囲
で種々変形して実施することができる。
第1図は本発明の一実施例装置の要部概略構成図、第2
図(a)(b)は実施例装置の処理の流れを模式的に示
す図、第3図は本発明の別の実施列装置の要部概略構成
図、第4図は第3図に示す実施例装置の処理の時間的な
流れを示す図、第5図乃至第7図はそれぞれ実施例装置
における認識処理と学習処理の流れを示す図である。 1・・・認識部、2・・・辞書記憶部、3・・・ディス
プレイ、4・・・キーボード、5・・・学習部、6・・
・特性核記憶部、7・・・学習中間状態記憶部、8・・
・エラー・リジェクト記憶部、9・・・前処理部。 出願人代理人 弁理士 鈴江武彦 第1図 第2図 第3図 第4図 第5図 第6図 第7図
図(a)(b)は実施例装置の処理の流れを模式的に示
す図、第3図は本発明の別の実施列装置の要部概略構成
図、第4図は第3図に示す実施例装置の処理の時間的な
流れを示す図、第5図乃至第7図はそれぞれ実施例装置
における認識処理と学習処理の流れを示す図である。 1・・・認識部、2・・・辞書記憶部、3・・・ディス
プレイ、4・・・キーボード、5・・・学習部、6・・
・特性核記憶部、7・・・学習中間状態記憶部、8・・
・エラー・リジェクト記憶部、9・・・前処理部。 出願人代理人 弁理士 鈴江武彦 第1図 第2図 第3図 第4図 第5図 第6図 第7図
Claims (6)
- (1)演算処理部により入力パターンと認識辞書とを照
合処理して上記入力パターンの認識結果を得るパターン
認識装置本体と、このパターン認識装置本体のアイドル
状態にある演算処理部を用いて前記認識辞書を学習して
なる手段とを具備してなることを特徴とするパターン認
識装置。 - (2)アイドル状態にある演算処理部は、該入力パター
ンと認識辞書とを照合処理する演算処理部とは別に設け
られたものであって、上記入力パターンと認識辞書との
照合処理とは独立に前記認識辞書の学習を行うものであ
る特許請求の範囲第1項記載のパターン認識装置。 - (3)アイドル状態にある演算処理部は、入力パターン
と認識辞書との照合処理の休止状態にある演算処理部か
らなり、該演算処理部は入力パターンの認識処理を実行
する期間以外の時間に上記認識辞書の学習を行うもので
ある特許請求の範囲第1項記載のパターン認識装置。 - (4)アイドル状態にある演算処理部は、少なくとも入
力パターンを用いた認識辞書の学習中にパターン認識装
置本体の稼働が停止されるとき、上記学習の中間状態を
セーブし、且つ上記パターン認識装置本体の再稼働時に
上記セーブした学習の中間状態をリロードして前記学習
を継続するものである特許請求の範囲第1項記載のパタ
ーン認識装置。 - (5)演算処理部による入力パターンと認識辞書との照
合処理は、複合類似度法または部分空間法によって行わ
れ、演算処理部による認識辞書の学習は、K−L展開法
を用いて特性核または相関行列に対する入力パターンの
寄与率を変化させて行われるものである特許請求の範囲
第1項記載のパターン認識装置。 - (6)アイドル状態にある演算処理部による認識辞書の
学習は、認識リジェクトまたはエラーを発生した入力パ
ターンとその認識辞書との照合結果を利用して行われる
ものである特許請求の範囲第1項記載のパターン認識装
置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59194411A JP2607457B2 (ja) | 1984-09-17 | 1984-09-17 | パターン認識装置 |
EP85111752A EP0175348B1 (en) | 1984-09-17 | 1985-09-17 | Pattern recognition device |
DE8585111752T DE3586378T2 (de) | 1984-09-17 | 1985-09-17 | Mustererkennungsanlage. |
US07/203,505 US4926491A (en) | 1984-09-17 | 1988-06-06 | Pattern recognition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59194411A JP2607457B2 (ja) | 1984-09-17 | 1984-09-17 | パターン認識装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5126532A Division JPH081652B2 (ja) | 1993-05-28 | 1993-05-28 | パターン認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6172377A true JPS6172377A (ja) | 1986-04-14 |
JP2607457B2 JP2607457B2 (ja) | 1997-05-07 |
Family
ID=16324151
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59194411A Expired - Lifetime JP2607457B2 (ja) | 1984-09-17 | 1984-09-17 | パターン認識装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US4926491A (ja) |
EP (1) | EP0175348B1 (ja) |
JP (1) | JP2607457B2 (ja) |
DE (1) | DE3586378T2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6355673A (ja) * | 1986-08-27 | 1988-03-10 | Minolta Camera Co Ltd | 画像処理装置 |
JPH04339288A (ja) * | 1991-01-25 | 1992-11-26 | Fuso Kogyo Kk | 魚群探知機における画像表示法 |
JP2007509418A (ja) * | 2003-10-24 | 2007-04-12 | マイクロソフト コーポレーション | 手書き認識をパーソナル化するシステムと方法 |
Families Citing this family (135)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4802231A (en) * | 1987-11-24 | 1989-01-31 | Elliot Davis | Pattern recognition error reduction system |
US5048100A (en) * | 1988-12-15 | 1991-09-10 | Michael Kuperstein | Self organizing neural network method and system for general classification of patterns |
US5046111A (en) * | 1989-02-09 | 1991-09-03 | Philip Morris Incorporated | Methods and apparatus for optically determining the acceptability of products |
US5146510A (en) * | 1989-02-09 | 1992-09-08 | Philip Morris Incorporated | Methods and apparatus for optically determining the acceptability of products |
US5048097A (en) * | 1990-02-02 | 1991-09-10 | Eastman Kodak Company | Optical character recognition neural network system for machine-printed characters |
US5020123A (en) * | 1990-08-03 | 1991-05-28 | At&T Bell Laboratories | Apparatus and method for image area identification |
US5121441A (en) * | 1990-09-21 | 1992-06-09 | International Business Machines Corporation | Robust prototype establishment in an on-line handwriting recognition system |
US5164992A (en) * | 1990-11-01 | 1992-11-17 | Massachusetts Institute Of Technology | Face recognition system |
US5598345A (en) * | 1990-11-29 | 1997-01-28 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for inspecting solder portions |
JPH0772906B2 (ja) * | 1991-07-10 | 1995-08-02 | 富士ゼロックス株式会社 | 文書認識装置 |
US5237621A (en) * | 1991-08-08 | 1993-08-17 | Philip Morris Incorporated | Product appearance inspection methods and apparatus employing low variance filter |
US8352400B2 (en) | 1991-12-23 | 2013-01-08 | Hoffberg Steven M | Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore |
US10361802B1 (en) | 1999-02-01 | 2019-07-23 | Blanding Hovenweep, Llc | Adaptive pattern recognition based control system and method |
GB2281997B (en) * | 1993-09-20 | 1997-10-15 | Ricoh Kk | Method and apparatus for improving a text image by using character regeneration |
US5511135A (en) * | 1993-11-29 | 1996-04-23 | International Business Machines Corporation | Stylus-input recognition correction manager |
US5802205A (en) * | 1994-09-09 | 1998-09-01 | Motorola, Inc. | Method and system for lexical processing |
US5828999A (en) * | 1996-05-06 | 1998-10-27 | Apple Computer, Inc. | Method and system for deriving a large-span semantic language model for large-vocabulary recognition systems |
US5920644A (en) * | 1996-06-06 | 1999-07-06 | Fujitsu Limited | Apparatus and method of recognizing pattern through feature selection by projecting feature vector on partial eigenspace |
WO1998033144A1 (fr) * | 1997-01-23 | 1998-07-30 | Oleg Yakovlevich Sivkov | Ensemble d'unites d'interpretation de concepts par des illustrations |
US6260015B1 (en) * | 1998-09-03 | 2001-07-10 | International Business Machines Corp. | Method and interface for correcting speech recognition errors for character languages |
US7966078B2 (en) | 1999-02-01 | 2011-06-21 | Steven Hoffberg | Network media appliance system and method |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US7016849B2 (en) * | 2002-03-25 | 2006-03-21 | Sri International | Method and apparatus for providing speech-driven routing between spoken language applications |
US7352825B2 (en) * | 2003-12-01 | 2008-04-01 | Lucent Technologies Inc. | Method and apparatus for providing random access detection in a communication system |
US7508985B2 (en) * | 2003-12-10 | 2009-03-24 | International Business Machines Corporation | Pattern-matching system |
US7467403B2 (en) * | 2004-01-09 | 2008-12-16 | Harris Scott C | Techniques for entry of less-than-perfect-passwords |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101772152B1 (ko) | 2013-06-09 | 2017-08-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
EP3008964B1 (en) | 2013-06-13 | 2019-09-25 | Apple Inc. | System and method for emergency calls initiated by voice command |
TWI508057B (zh) * | 2013-07-15 | 2015-11-11 | Chunghwa Picture Tubes Ltd | 語音辨識系統以及方法 |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
CN110797019B (zh) | 2014-05-30 | 2023-08-29 | 苹果公司 | 多命令单一话语输入方法 |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
JP2018112839A (ja) * | 2017-01-10 | 2018-07-19 | 富士通株式会社 | 画像処理プログラム、画像認識プログラム、画像処理装置、画像認識装置、画像認識方法、及び画像処理方法 |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5977579A (ja) * | 1982-10-26 | 1984-05-04 | Ricoh Co Ltd | パタ−ン認識装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3446950A (en) * | 1963-12-31 | 1969-05-27 | Ibm | Adaptive categorizer |
US4227177A (en) * | 1978-04-27 | 1980-10-07 | Dialog Systems, Inc. | Continuous speech recognition method |
NL7810943A (nl) * | 1978-11-03 | 1980-05-07 | Philips Nv | Lerende inrichting voor het herkennen van patronen van digitale signalen. |
JPS56105586A (en) * | 1980-01-28 | 1981-08-22 | Toshiba Corp | Pattern identifying device |
JPS56137483A (en) * | 1980-03-31 | 1981-10-27 | Toshiba Corp | Pattern recognizing device |
US4319085A (en) * | 1980-04-08 | 1982-03-09 | Threshold Technology Inc. | Speech recognition apparatus and method |
US4400788A (en) * | 1981-03-27 | 1983-08-23 | Bell Telephone Laboratories, Incorporated | Continuous speech pattern recognizer |
JPS58129684A (ja) * | 1982-01-29 | 1983-08-02 | Toshiba Corp | パタ−ン認識装置 |
US4521909A (en) * | 1983-10-04 | 1985-06-04 | Wang Laboratories, Inc. | Dual level pattern recognition system |
US4593367A (en) * | 1984-01-16 | 1986-06-03 | Itt Corporation | Probabilistic learning element |
-
1984
- 1984-09-17 JP JP59194411A patent/JP2607457B2/ja not_active Expired - Lifetime
-
1985
- 1985-09-17 DE DE8585111752T patent/DE3586378T2/de not_active Expired - Lifetime
- 1985-09-17 EP EP85111752A patent/EP0175348B1/en not_active Expired
-
1988
- 1988-06-06 US US07/203,505 patent/US4926491A/en not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5977579A (ja) * | 1982-10-26 | 1984-05-04 | Ricoh Co Ltd | パタ−ン認識装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6355673A (ja) * | 1986-08-27 | 1988-03-10 | Minolta Camera Co Ltd | 画像処理装置 |
JPH04339288A (ja) * | 1991-01-25 | 1992-11-26 | Fuso Kogyo Kk | 魚群探知機における画像表示法 |
JP2007509418A (ja) * | 2003-10-24 | 2007-04-12 | マイクロソフト コーポレーション | 手書き認識をパーソナル化するシステムと方法 |
Also Published As
Publication number | Publication date |
---|---|
DE3586378T2 (de) | 1992-12-24 |
JP2607457B2 (ja) | 1997-05-07 |
EP0175348B1 (en) | 1992-07-22 |
DE3586378D1 (de) | 1992-08-27 |
US4926491A (en) | 1990-05-15 |
EP0175348A2 (en) | 1986-03-26 |
EP0175348A3 (en) | 1988-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS6172377A (ja) | パタ−ン認識装置 | |
US11848008B2 (en) | Artificial intelligence-based wakeup word detection method and apparatus, device, and medium | |
CN108182937B (zh) | 关键词识别方法、装置、设备及存储介质 | |
CN107291783B (zh) | 一种语义匹配方法及智能设备 | |
CN108847241A (zh) | 将会议语音识别为文本的方法、电子设备及存储介质 | |
WO2021179701A1 (zh) | 多语种语音识别方法、装置及电子设备 | |
CN110570873B (zh) | 声纹唤醒方法、装置、计算机设备以及存储介质 | |
CN108711421A (zh) | 一种语音识别声学模型建立方法及装置和电子设备 | |
EP4095850A1 (en) | Instruction execution method and apparatus, storage medium, and electronic device | |
CN114999463A (zh) | 语音识别方法、装置、设备及介质 | |
JPS61249182A (ja) | パタ−ン認識学習装置 | |
JPH0628483A (ja) | パターン認識装置 | |
CN114724683B (zh) | 一种通过间接式手段进行情感调节的装置与方法 | |
JPS62229489A (ja) | パタ−ン認識学習装置 | |
CN117649861B (zh) | 基于帧级别情感状态对齐的语音情感识别方法和系统 | |
JPS60107192A (ja) | パタ−ン認識装置 | |
JP2656239B2 (ja) | 音声認識学習方式 | |
JPH0366704B2 (ja) | ||
Kido et al. | Spoken word recognition system for unlimited speakers | |
JPS6385883A (ja) | パタ−ン認識学習装置 | |
CN115662422A (zh) | 语音交互方法、装置、电子设备和可读存储介质 | |
CN116612744A (zh) | 语音唤醒方法、语音唤醒装置和车辆 | |
CN115391502A (zh) | 一种生成可应答话术语句的智能客服方法和装置 | |
JPS63298299A (ja) | パタ−ン認識学習装置 | |
JPS58169679A (ja) | 文章読取り装置後処理方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |