JP2795719B2 - 認識距離の差に基づく最良優先探索処理方法 - Google Patents
認識距離の差に基づく最良優先探索処理方法Info
- Publication number
- JP2795719B2 JP2795719B2 JP2056043A JP5604390A JP2795719B2 JP 2795719 B2 JP2795719 B2 JP 2795719B2 JP 2056043 A JP2056043 A JP 2056043A JP 5604390 A JP5604390 A JP 5604390A JP 2795719 B2 JP2795719 B2 JP 2795719B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- search
- difference
- candidate
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000000034 method Methods 0.000 claims description 21
- 230000007423 decrease Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
- G06F18/295—Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/36—Matching; Classification
- G06V30/373—Matching; Classification using a special pattern or subpattern alphabet
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Bioinformatics & Computational Biology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Acoustics & Sound (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の詳細な説明】 〔概要〕 音声認識装置または文字認識装置が認識結果として生
成する候補単語ラティスまたは候補文字ラティスなどか
ら,候補文または候補単語を順次選別する認識距離の差
に基づく最良優先探索処理方法に関し, 入力文または単語を候補ラティスから短時間で選別で
きるようにすることを目的とし, 各候補間の認識距離の差を計算する処理過程と,その
差の平均値を計算する処理過程と,前の候補との認識距
離の差に応じた探索優先指数を計算する処理過程と,探
索優先指数が小さい候補から優先的に探索する処理過程
とを含む,あるいは各候補間の認識距離の差およびその
差の平均値を計算する処理過程と,この平均値と各認識
距離の差とに基づき,候補をグループに分ける処理過程
と,各グループごとに候補間の認識距離の差に応じた探
索融点指数を計算する処理過程と,グループ間で探索優
先指数が小さいグループから優先的に探索する処理過程
とを含むように構成する。
成する候補単語ラティスまたは候補文字ラティスなどか
ら,候補文または候補単語を順次選別する認識距離の差
に基づく最良優先探索処理方法に関し, 入力文または単語を候補ラティスから短時間で選別で
きるようにすることを目的とし, 各候補間の認識距離の差を計算する処理過程と,その
差の平均値を計算する処理過程と,前の候補との認識距
離の差に応じた探索優先指数を計算する処理過程と,探
索優先指数が小さい候補から優先的に探索する処理過程
とを含む,あるいは各候補間の認識距離の差およびその
差の平均値を計算する処理過程と,この平均値と各認識
距離の差とに基づき,候補をグループに分ける処理過程
と,各グループごとに候補間の認識距離の差に応じた探
索融点指数を計算する処理過程と,グループ間で探索優
先指数が小さいグループから優先的に探索する処理過程
とを含むように構成する。
本発明は,音声認識装置または文字認識装置が認識結
果として生成する候補単語ラティスまたは候補文字ラテ
ィスなどから,候補文または候補単語を順次選別する認
識距離の差に基づく最良優先探索処理方法に関する。
果として生成する候補単語ラティスまたは候補文字ラテ
ィスなどから,候補文または候補単語を順次選別する認
識距離の差に基づく最良優先探索処理方法に関する。
第10図は従来技術による縦型探索の例を示す。
従来,音声や文字の認識装置が認識結果として生成し
た候補ラティスから,正解となる入力文や単語を選び出
すための方式として,縦型探索方式が用いられている。
た候補ラティスから,正解となる入力文や単語を選び出
すための方式として,縦型探索方式が用いられている。
例えば,文字認識装置から「類似度」という単語を入
力したとする。文字認識装置は,各文字ごとに,各種の
特徴に着目して抽出した入力パターンと,あらかじめ用
意されている標準パターンとの照会を行い,いくつかの
候補とその候補に関する確からしさの基準となる認識距
離とを出力する。
力したとする。文字認識装置は,各文字ごとに,各種の
特徴に着目して抽出した入力パターンと,あらかじめ用
意されている標準パターンとの照会を行い,いくつかの
候補とその候補に関する確からしさの基準となる認識距
離とを出力する。
第10図に示す例では,「類似度」の入力における1文
字目の候補順位が,「願(認識距離=2458)」→「類
(認識距離=2497)」→「頽(認識距離=2582)」→
「締(認識距離=2717)」の順となっている。2文字目
は,「似」→「以」→‥‥の順である。このような候補
の並びを候補ラティスという。
字目の候補順位が,「願(認識距離=2458)」→「類
(認識距離=2497)」→「頽(認識距離=2582)」→
「締(認識距離=2717)」の順となっている。2文字目
は,「似」→「以」→‥‥の順である。このような候補
の並びを候補ラティスという。
従来の縦型探索では,これらの候補ラティスから,正
解となる入力単語を選び出す場合に,第10図に示す→
→→‥‥の文字の組み合わせを生成して探索を進め
る。すなわち,「願似唐」→「願似度」→「願似慶」→
‥‥の順で,探索していく。この例では,正解候補の
「類似度」に行きつくまでに,18回の探索が必要にな
る。
解となる入力単語を選び出す場合に,第10図に示す→
→→‥‥の文字の組み合わせを生成して探索を進め
る。すなわち,「願似唐」→「願似度」→「願似慶」→
‥‥の順で,探索していく。この例では,正解候補の
「類似度」に行きつくまでに,18回の探索が必要にな
る。
また,探索方式の1つとして,最良優先探索方式が知
られている。最良優先探索方式は,横型探索の一種で,
ある量を基準として最も確からしい候補から優先的に選
びだして探索する方式である。しかし,従来の最良優先
探索方式では,基準となる量として認識距離の絶対的な
値だけを用いることが考えられており,次の候補との関
係については,考慮が払われていなかった。
られている。最良優先探索方式は,横型探索の一種で,
ある量を基準として最も確からしい候補から優先的に選
びだして探索する方式である。しかし,従来の最良優先
探索方式では,基準となる量として認識距離の絶対的な
値だけを用いることが考えられており,次の候補との関
係については,考慮が払われていなかった。
従来の縦型探索では,無駄な探索を繰り返すことが多
く,また最良優先探索でも,下位の候補に正解が含まれ
ているときに,他との関係で,それの選択が後回しにな
り,探索に長時間かかることがしばしばあるという問題
があった。
く,また最良優先探索でも,下位の候補に正解が含まれ
ているときに,他との関係で,それの選択が後回しにな
り,探索に長時間かかることがしばしばあるという問題
があった。
本発明は上記問題点の解決を図り,入力文または単語
を候補ラティスから短時間で選別できるようにすること
を目的としている。
を候補ラティスから短時間で選別できるようにすること
を目的としている。
第1図は本発明の原理説明図である。
第1の発明では,第1図(イ)に示すように処理す
る。
る。
音声または文字の認識装置が認識した複数の認識候補
群から正解候補の文または単語を順次選別するにあたっ
て,まず,処理過程10により,認識装置が出力した候補
単語または文節間あるいは候補文字間の認識距離の差を
計算する。
群から正解候補の文または単語を順次選別するにあたっ
て,まず,処理過程10により,認識装置が出力した候補
単語または文節間あるいは候補文字間の認識距離の差を
計算する。
次に,処理過程11により,各認識距離の差の平均値を
計算する。
計算する。
処理過程12では,処理過程11で計算した平均値を利用
して候補単語または文節ごと,あるいは候補文字ごと
に,前の候補との認識距離の差に応じた探索優先指数を
計算する。
して候補単語または文節ごと,あるいは候補文字ごと
に,前の候補との認識距離の差に応じた探索優先指数を
計算する。
そして,処理過程13により,探索優先指数が小さい候
補から優先的に探索し,正解の入力文または単語を選別
する。
補から優先的に探索し,正解の入力文または単語を選別
する。
第2の発明では,第1図(ロ)に示すように処理す
る。
る。
音声または文字の認識装置が認識した複数の認識候補
群から正解候補の文または単語を順次選別するにあたっ
て,まず,処理過程20により,認識装置が出力した候補
単語または文節間あるいは候補文字間の認識距離の差を
計算する。
群から正解候補の文または単語を順次選別するにあたっ
て,まず,処理過程20により,認識装置が出力した候補
単語または文節間あるいは候補文字間の認識距離の差を
計算する。
次に,処理過程21により,各認識距離の差の平均値を
計算する。
計算する。
処理過程22では,処理過程21で計算した平均値と,処
理過程20で計算した各認識距離の差との大小関係などに
より,候補をグループに分ける。
理過程20で計算した各認識距離の差との大小関係などに
より,候補をグループに分ける。
そして,処理過程23により,各グループごとに,隣接
するグループに属する候補との間の認識距離の差に応じ
た探索優先指数を計算する。
するグループに属する候補との間の認識距離の差に応じ
た探索優先指数を計算する。
各グループの探索優先指数を計算したならば,処理過
程24により,グループ間では探索優先指数が小さいグル
ープから優先的に探索し,グループ内では縦型探索また
は横型探索を実施する。これにより,正解の入力文また
は単語を得る。
程24により,グループ間では探索優先指数が小さいグル
ープから優先的に探索し,グループ内では縦型探索また
は横型探索を実施する。これにより,正解の入力文また
は単語を得る。
文字認識装置が生成する文字の認識類似度,すなわち
認識距離には,次のような属性がある。
認識距離には,次のような属性がある。
(i)候補文字ラティスの中の1位の候補文字が,それ
より下位の候補文字より実際に入力した文字である可能
性が高い。例えば,5位以下の候補文字に,入力文字が含
まれている可能性はほとんどない。
より下位の候補文字より実際に入力した文字である可能
性が高い。例えば,5位以下の候補文字に,入力文字が含
まれている可能性はほとんどない。
(ii)候補文字2位と3位の類似度の差が大きい場合,1
位と2位の中に入力文字が存在する可能性が高い。
位と2位の中に入力文字が存在する可能性が高い。
このような属性は,音声認識の場合も同様であるが,
本発明は,この属性に着目し,認識距離の差を利用する
ことにより,各候補または各グループの探索優先指数を
求め,その探索優先指数に基づいて最良優先探索を実施
する。したがって,従来の縦型探索に比べて,大幅に探
索時間を短縮することが可能になる。また,認識距離の
差に着目して最良優先探索を行うので,認識距離そのも
のの値により最良優先探索を行う場合に比べても,探索
時間の削減が可能である。
本発明は,この属性に着目し,認識距離の差を利用する
ことにより,各候補または各グループの探索優先指数を
求め,その探索優先指数に基づいて最良優先探索を実施
する。したがって,従来の縦型探索に比べて,大幅に探
索時間を短縮することが可能になる。また,認識距離の
差に着目して最良優先探索を行うので,認識距離そのも
のの値により最良優先探索を行う場合に比べても,探索
時間の削減が可能である。
第2図は本発明の適用システムの例,第3図は本発明
の実施例を説明するための認識装置の出力例,第4図は
第1の発明に係る認識距離の差と平均値の計算例,第5
図は第1の発明に係る探索優先指数の計算例,第6図は
第1の発明に係る探索の例,第7図は第2の発明に係る
認識距離の差と平均値の計算例,第8図は第2の発明に
係るグループ化の例,第9図は第2の発明に係る探索優
先指数と探索の例を示す。
の実施例を説明するための認識装置の出力例,第4図は
第1の発明に係る認識距離の差と平均値の計算例,第5
図は第1の発明に係る探索優先指数の計算例,第6図は
第1の発明に係る探索の例,第7図は第2の発明に係る
認識距離の差と平均値の計算例,第8図は第2の発明に
係るグループ化の例,第9図は第2の発明に係る探索優
先指数と探索の例を示す。
本発明は,例えば第2図に示すようなシステムに適用
される。
される。
第2図(イ)および(ロ)において,30は入力用マイ
クであり,音声パターン登録,音声入力などに使われる
もの,31は特定話者用音声認識装置であり,入力単語に
対して候補単語を抽出しその候補単語の類似度を示す認
識距離を生成するもの,32はパーソナルコンピュータな
どの処理装置であって,CPUやメモリなどからなるもの,3
3は探索処理部であって,正解の候補を選別する処理を
行うプログラムから構成されるもの,34はディスプレイ
であり,認識結果や類似度などが表示されるもの,35は
キーボードであり,認識用の単語などの登録に使われる
もの,36は入力用タブレットであり,文字入力に使われ
るもの,37は文字認識装置であり,入力文字に対して候
補文字との類似度(認識距離)を生成するものである。
クであり,音声パターン登録,音声入力などに使われる
もの,31は特定話者用音声認識装置であり,入力単語に
対して候補単語を抽出しその候補単語の類似度を示す認
識距離を生成するもの,32はパーソナルコンピュータな
どの処理装置であって,CPUやメモリなどからなるもの,3
3は探索処理部であって,正解の候補を選別する処理を
行うプログラムから構成されるもの,34はディスプレイ
であり,認識結果や類似度などが表示されるもの,35は
キーボードであり,認識用の単語などの登録に使われる
もの,36は入力用タブレットであり,文字入力に使われ
るもの,37は文字認識装置であり,入力文字に対して候
補文字との類似度(認識距離)を生成するものである。
本発明は,第2図(イ)に示すような音声認識システ
ムにも,第2図(ロ)に示すような文字認識システムに
も適用することができ,処理装置32における探索処理部
33により実現される。
ムにも,第2図(ロ)に示すような文字認識システムに
も適用することができ,処理装置32における探索処理部
33により実現される。
以下,文字認識の認識候補から,正解単語を探索する
具体例について,本発明の実施例を説明する。
具体例について,本発明の実施例を説明する。
実際の入力単語が「類似度」であり,文字認識装置に
よる認識結果が,第3図に示すとおりであったとする。
よる認識結果が,第3図に示すとおりであったとする。
1文字目の認識候補の順番が「願」→「類」→…であ
り,2文字目の認識候補の順番が「似」→「以」,…であ
り,3文字目の認識候補の順番が,「唐」→「度」→…で
ある。括弧内の数値は,認識距離であり,標準パターン
との類似性の度合いを示す。
り,2文字目の認識候補の順番が「似」→「以」,…であ
り,3文字目の認識候補の順番が,「唐」→「度」→…で
ある。括弧内の数値は,認識距離であり,標準パターン
との類似性の度合いを示す。
(第1の発明の実施例) 第1の発明では,第3図に示すような入力に対して,
次のように処理する。
次のように処理する。
まず,第4図に示すように,候補文字間の認識距離の
差とその差の平均値を計算する。この例では,「願」と
「類」との認識距離の差は,2497−2458=39である。ま
た,「類」と「頽」との認識距離の差は,85であり,
「頽」と「締」との認識距離の差は,135である。
差とその差の平均値を計算する。この例では,「願」と
「類」との認識距離の差は,2497−2458=39である。ま
た,「類」と「頽」との認識距離の差は,85であり,
「頽」と「締」との認識距離の差は,135である。
これらの認識距離の差の平均値は, (39+85+135)/3=約86となる。
この認識距離の差と平均値とから,探索優先指数(Se
arch Priority Index)を計算する。
arch Priority Index)を計算する。
PI=((MSi−MSi-1)/平均値)×eci PI:探索優先指数 MSi:候補順位iの認識距離 i:候補順位 C:定数 なお,候補順位が1位の候補の探索優先指数PIの値
は,“0"とする。
は,“0"とする。
この式により,各候補の探索優先指数PIを計算する
と,第5図に示すような結果が得られる。ここではC=
4としている。この結果に従って,探索優先指数PIの小
さい候補から探索を行う最良優先探索を実施する。これ
により,第6図に示すような探索が行われる。すなわ
ち,「願似唐」→「願似度」→「類似唐」→「類似度」
の順で探索が進められ,4回で探索が終了することにな
る。
と,第5図に示すような結果が得られる。ここではC=
4としている。この結果に従って,探索優先指数PIの小
さい候補から探索を行う最良優先探索を実施する。これ
により,第6図に示すような探索が行われる。すなわ
ち,「願似唐」→「願似度」→「類似唐」→「類似度」
の順で探索が進められ,4回で探索が終了することにな
る。
(第2の発明の実施例) 第2の発明では,第3図に示すような入力に対して,
次のように処理する。
次のように処理する。
まず,第7図に示すように,候補文字間の認識距離の
差とその差の平均値を計算する。この例では「願」と
「類」との認識距離の差は,2497−2458=39である。ま
た,「類」と「頽」との認識距離の差は,85であり,
「頽」と「締」との認識距離の差は,135である。
差とその差の平均値を計算する。この例では「願」と
「類」との認識距離の差は,2497−2458=39である。ま
た,「類」と「頽」との認識距離の差は,85であり,
「頽」と「締」との認識距離の差は,135である。
これらの認識距離の差の平均値は, (39+85+135)/3=約86となる。
次に,候補文字間の認識距離の差と平均値とを比較
し,認識距離の差が平均値より大きい場合,そこまでを
1単位として,認識候補をグループ化する。この例で
は,「頽」と「締」との認識距離の差が135であり,平
均値の86より大きいので,ここでグループを分ける。他
の候補についても,同様に認識距離の差と平均値とによ
り,グループ化を行う。これにより,第8図に示すよう
に,1文字目は2つのグループ,2文字目は3つのグルー
プ,3文字目は2つのグループにそれぞれ分けられること
になる。
し,認識距離の差が平均値より大きい場合,そこまでを
1単位として,認識候補をグループ化する。この例で
は,「頽」と「締」との認識距離の差が135であり,平
均値の86より大きいので,ここでグループを分ける。他
の候補についても,同様に認識距離の差と平均値とによ
り,グループ化を行う。これにより,第8図に示すよう
に,1文字目は2つのグループ,2文字目は3つのグルー
プ,3文字目は2つのグループにそれぞれ分けられること
になる。
次に,これらの各グループごとに,以下の式により,
探索優先指数を計算する。
探索優先指数を計算する。
PI=((MSi−MSj)/平均値)×ecR PI:探索優先指数 MSi:グループiの最後の文字の認識距離 MSj:グループjの最初の文字の認識距離 C:定数 R:グループ順位 なお,グループ順位が1位のグループの探索優先指数
PIの値は,“0"とする。
PIの値は,“0"とする。
例えばC=2として,この式により,各候補の探索優
先指数PIを計算すると,第9図に示すような結果が得ら
れる。
先指数PIを計算すると,第9図に示すような結果が得ら
れる。
そこで,この結果に従って,グループ間で最良優先探
索を実施する。最初の探索は,第9図に示すG11,G21,G3
1のグループの組み合わせに対して行われることにな
る。もし仮に,この最初のグループの組み合わせで正解
が得られなかった場合には,次は,G11,G22,G31のグルー
プの組み合わせに対して,探索が行われる。
索を実施する。最初の探索は,第9図に示すG11,G21,G3
1のグループの組み合わせに対して行われることにな
る。もし仮に,この最初のグループの組み合わせで正解
が得られなかった場合には,次は,G11,G22,G31のグルー
プの組み合わせに対して,探索が行われる。
1つのグループ内では,縦型探索または横型探索を実
施する。
施する。
この例でも,「願似唐」→「願似度」→「類似唐」→
「類似度」の順で探索が進められ,4回で探索が終了する
ことになる。
「類似度」の順で探索が進められ,4回で探索が終了する
ことになる。
なお,探索の途中結果について,それが正解であるか
どうかの判断については,本発明の要旨に関係しないた
め,詳しい説明を省略するが,例えば単語辞書を用いた
り,入力文の認識であれば文法チェックその他の手段を
用いることにより,判断することができる。また,第2
図に示すディスプレイ34は各探索結果を表示し,ユーザ
の確認を得るようにしてもよい。
どうかの判断については,本発明の要旨に関係しないた
め,詳しい説明を省略するが,例えば単語辞書を用いた
り,入力文の認識であれば文法チェックその他の手段を
用いることにより,判断することができる。また,第2
図に示すディスプレイ34は各探索結果を表示し,ユーザ
の確認を得るようにしてもよい。
文字認識の例について説明したが,音声認識による単
語や文章の入力でも,音節,単語,文節などの候補につ
いて,同様に本発明による最良優先探索を実施すること
ができる。
語や文章の入力でも,音節,単語,文節などの候補につ
いて,同様に本発明による最良優先探索を実施すること
ができる。
以上説明したように,本発明によれば,探索の回数を
削減し,入力文または単語などを,候補ラティスから短
時間で選別できるようになるという効果がある。
削減し,入力文または単語などを,候補ラティスから短
時間で選別できるようになるという効果がある。
第1図は本発明の原理説明図, 第2図は本発明の適用システムの例, 第3図は本発明の実施例を説明するための認識装置の出
力例, 第4図は第1の発明に係る認識距離の差と平均値の計算
例, 第5図は第1の発明に係る探索優先指数の計算例, 第6図は第1の発明に係る探索の例, 第7図は第2の発明に係る認識距離の差と平均値の計算
例, 第8図は第2の発明に係るグループ化の例, 第9図は第2の発明に係る探索優先指数と探索の例, 第10図は従来技術の例を示す。 図中,10〜13は第1の発明の処理過程,20〜24は第2の発
明の処理過程を表す。
力例, 第4図は第1の発明に係る認識距離の差と平均値の計算
例, 第5図は第1の発明に係る探索優先指数の計算例, 第6図は第1の発明に係る探索の例, 第7図は第2の発明に係る認識距離の差と平均値の計算
例, 第8図は第2の発明に係るグループ化の例, 第9図は第2の発明に係る探索優先指数と探索の例, 第10図は従来技術の例を示す。 図中,10〜13は第1の発明の処理過程,20〜24は第2の発
明の処理過程を表す。
フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/72 特許ファイル(PATOLIS)
Claims (2)
- 【請求項1】複数の認識対象要素の並びについて認識装
置が認識した複数の認識候補群の並びから正解候補の文
または単語を選別する探索処理方法において, 前記各認識対象要素ごとに,認識装置が出力した同一認
識対象要素に対する複数の認識候補間の認識距離の差を
計算する処理過程(10)と, 前記各認識対象要素ごとに,前記各認識距離の差の平均
値を計算する処理過程(11)と, この平均値を利用して各認識候補ごとに同一認識対象要
素における前の認識候補との認識距離の差に応じた探索
優先指数を計算する処理過程(12)と, 各認識対象要素から選択した認識候補の並びから正解と
なる文または単語を探索するにあたって,前記探索優先
指数が小さい認識候補の組み合わせから優先的に探索す
る処理過程(13)と を含むことを特徴とする認識距離の差に基づく最良優先
探索処理方法。 - 【請求項2】複数の認識対象要素の並びについて認識装
置が認識した複数の認識候補群の並びから正解候補の文
または単語を選別する探索処理方法において, 前記各認識対象要素ごとに,認識装置が出力した同一認
識対象要素に対する複数の認識候補間の認識距離の差を
計算する処理過程(20)と, 前記各認識対象要素ごとに,前記各認識距離の差の平均
値を計算する処理過程(21)と, この平均値と各認識距離の差とに基づき,同一認識対象
要素ごとに認識候補をグループに分ける処理過程(22)
と, 前記各グループごとに,隣接するグループに属する認識
候補との間の認識距離の差に応じた探索優先指数を計算
する処理過程(23)と, 各認識対象要素から選択した認識候補の並びから正解と
なる文または単語を探索するにあたって,前記グループ
間では探索優先指数が小さいグループから優先的に探索
し,前記グループ内では縦型探索または横型探索を行う
処理過程(24)と を含むことを特徴とする認識距離の差に基づく最良優先
探索処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2056043A JP2795719B2 (ja) | 1990-03-07 | 1990-03-07 | 認識距離の差に基づく最良優先探索処理方法 |
US08/110,799 US5416892A (en) | 1990-03-07 | 1993-08-23 | Best first search considering difference between scores |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2056043A JP2795719B2 (ja) | 1990-03-07 | 1990-03-07 | 認識距離の差に基づく最良優先探索処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03257596A JPH03257596A (ja) | 1991-11-18 |
JP2795719B2 true JP2795719B2 (ja) | 1998-09-10 |
Family
ID=13016062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2056043A Expired - Fee Related JP2795719B2 (ja) | 1990-03-07 | 1990-03-07 | 認識距離の差に基づく最良優先探索処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5416892A (ja) |
JP (1) | JP2795719B2 (ja) |
Families Citing this family (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5546565A (en) * | 1993-06-21 | 1996-08-13 | Casio Computer Co., Ltd. | Input/output apparatus having a pen, and method of associating and processing handwritten image data and voice data |
JP2738403B2 (ja) * | 1995-05-12 | 1998-04-08 | 日本電気株式会社 | 音声認識装置 |
JPH1049549A (ja) * | 1996-05-29 | 1998-02-20 | Matsushita Electric Ind Co Ltd | 文書検索装置 |
WO1998002833A1 (en) * | 1996-07-17 | 1998-01-22 | Rutgers, The State University Of New Jersey | Methods of producing optimized designs using computer systems and designs produced therefrom |
US5940825A (en) * | 1996-10-04 | 1999-08-17 | International Business Machines Corporation | Adaptive similarity searching in sequence databases |
JP4465564B2 (ja) * | 2000-02-28 | 2010-05-19 | ソニー株式会社 | 音声認識装置および音声認識方法、並びに記録媒体 |
US7392287B2 (en) * | 2001-03-27 | 2008-06-24 | Hemisphere Ii Investment Lp | Method and apparatus for sharing information using a handheld device |
US7031915B2 (en) * | 2003-01-23 | 2006-04-18 | Aurilab Llc | Assisted speech recognition by dual search acceleration technique |
US7991778B2 (en) | 2005-08-23 | 2011-08-02 | Ricoh Co., Ltd. | Triggering actions with captured input in a mixed media environment |
US9171202B2 (en) | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US9373029B2 (en) | 2007-07-11 | 2016-06-21 | Ricoh Co., Ltd. | Invisible junction feature recognition for document security or annotation |
US7702673B2 (en) | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US8184155B2 (en) | 2007-07-11 | 2012-05-22 | Ricoh Co. Ltd. | Recognition and tracking using invisible junctions |
US8156427B2 (en) | 2005-08-23 | 2012-04-10 | Ricoh Co. Ltd. | User interface for mixed media reality |
US8005831B2 (en) | 2005-08-23 | 2011-08-23 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment with geographic location information |
US8195659B2 (en) | 2005-08-23 | 2012-06-05 | Ricoh Co. Ltd. | Integration and use of mixed media documents |
US8176054B2 (en) | 2007-07-12 | 2012-05-08 | Ricoh Co. Ltd | Retrieving electronic documents by converting them to synthetic text |
US9530050B1 (en) | 2007-07-11 | 2016-12-27 | Ricoh Co., Ltd. | Document annotation sharing |
US8276088B2 (en) | 2007-07-11 | 2012-09-25 | Ricoh Co., Ltd. | User interface for three-dimensional navigation |
US9405751B2 (en) | 2005-08-23 | 2016-08-02 | Ricoh Co., Ltd. | Database for mixed media document system |
US7917554B2 (en) | 2005-08-23 | 2011-03-29 | Ricoh Co. Ltd. | Visibly-perceptible hot spots in documents |
US9384619B2 (en) | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
US8856108B2 (en) | 2006-07-31 | 2014-10-07 | Ricoh Co., Ltd. | Combining results of image retrieval processes |
US8335789B2 (en) | 2004-10-01 | 2012-12-18 | Ricoh Co., Ltd. | Method and system for document fingerprint matching in a mixed media environment |
US7970171B2 (en) | 2007-01-18 | 2011-06-28 | Ricoh Co., Ltd. | Synthetic image and video generation from ground truth data |
US8838591B2 (en) | 2005-08-23 | 2014-09-16 | Ricoh Co., Ltd. | Embedding hot spots in electronic documents |
US8510283B2 (en) | 2006-07-31 | 2013-08-13 | Ricoh Co., Ltd. | Automatic adaption of an image recognition system to image capture devices |
US8385589B2 (en) | 2008-05-15 | 2013-02-26 | Berna Erol | Web-based content detection in images, extraction and recognition |
US7920759B2 (en) | 2005-08-23 | 2011-04-05 | Ricoh Co. Ltd. | Triggering applications for distributed action execution and use of mixed media recognition as a control input |
US8332401B2 (en) | 2004-10-01 | 2012-12-11 | Ricoh Co., Ltd | Method and system for position-based image matching in a mixed media environment |
US8989431B1 (en) | 2007-07-11 | 2015-03-24 | Ricoh Co., Ltd. | Ad hoc paper-based networking with mixed media reality |
US8144921B2 (en) | 2007-07-11 | 2012-03-27 | Ricoh Co., Ltd. | Information retrieval using invisible junctions and geometric constraints |
US8949287B2 (en) | 2005-08-23 | 2015-02-03 | Ricoh Co., Ltd. | Embedding hot spots in imaged documents |
US8600989B2 (en) | 2004-10-01 | 2013-12-03 | Ricoh Co., Ltd. | Method and system for image matching in a mixed media environment |
US8825682B2 (en) | 2006-07-31 | 2014-09-02 | Ricoh Co., Ltd. | Architecture for mixed media reality retrieval of locations and registration of images |
US8156116B2 (en) * | 2006-07-31 | 2012-04-10 | Ricoh Co., Ltd | Dynamic presentation of targeted information in a mixed media reality recognition system |
US8521737B2 (en) * | 2004-10-01 | 2013-08-27 | Ricoh Co., Ltd. | Method and system for multi-tier image matching in a mixed media environment |
US7885955B2 (en) | 2005-08-23 | 2011-02-08 | Ricoh Co. Ltd. | Shared document annotation |
US8369655B2 (en) | 2006-07-31 | 2013-02-05 | Ricoh Co., Ltd. | Mixed media reality recognition using multiple specialized indexes |
US8086038B2 (en) | 2007-07-11 | 2011-12-27 | Ricoh Co., Ltd. | Invisible junction features for patch recognition |
US8868555B2 (en) | 2006-07-31 | 2014-10-21 | Ricoh Co., Ltd. | Computation of a recongnizability score (quality predictor) for image retrieval |
US7518749B2 (en) * | 2004-11-12 | 2009-04-14 | Microsoft Corporation | Analysis alternates in context trees |
US9176984B2 (en) | 2006-07-31 | 2015-11-03 | Ricoh Co., Ltd | Mixed media reality retrieval of differentially-weighted links |
US8073263B2 (en) | 2006-07-31 | 2011-12-06 | Ricoh Co., Ltd. | Multi-classifier selection and monitoring for MMR-based image recognition |
US8489987B2 (en) | 2006-07-31 | 2013-07-16 | Ricoh Co., Ltd. | Monitoring and analyzing creation and usage of visual content using image and hotspot interaction |
US9063952B2 (en) | 2006-07-31 | 2015-06-23 | Ricoh Co., Ltd. | Mixed media reality recognition with image tracking |
US8676810B2 (en) * | 2006-07-31 | 2014-03-18 | Ricoh Co., Ltd. | Multiple index mixed media reality recognition using unequal priority indexes |
US9020966B2 (en) | 2006-07-31 | 2015-04-28 | Ricoh Co., Ltd. | Client device for interacting with a mixed media reality recognition system |
US8201076B2 (en) | 2006-07-31 | 2012-06-12 | Ricoh Co., Ltd. | Capturing symbolic information from documents upon printing |
US8385660B2 (en) | 2009-06-24 | 2013-02-26 | Ricoh Co., Ltd. | Mixed media reality indexing and retrieval for repeated content |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
US11036705B2 (en) | 2019-02-27 | 2021-06-15 | International Business Machines Corporation | Traversal of dispersed lockless concurrent index nodes |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5380922A (en) * | 1976-12-25 | 1978-07-17 | Toshiba Corp | Pattern recognition device |
JPS58100195A (ja) * | 1981-12-10 | 1983-06-14 | 日本電気株式会社 | 連続音声認識装置 |
JPS58115497A (ja) * | 1981-12-28 | 1983-07-09 | シャープ株式会社 | 音声認識方法 |
US4468756A (en) * | 1982-05-20 | 1984-08-28 | Chan Computer Corporation | Method and apparatus for processing languages |
US4658429A (en) * | 1983-12-29 | 1987-04-14 | Hitachi, Ltd. | System and method for preparing a recognition dictionary |
US4718088A (en) * | 1984-03-27 | 1988-01-05 | Exxon Research And Engineering Company | Speech recognition training method |
EP0158311A3 (en) * | 1984-04-06 | 1989-04-26 | Nec Corporation | Apparatus for retrieving character strings |
US4713777A (en) * | 1984-05-27 | 1987-12-15 | Exxon Research And Engineering Company | Speech recognition method having noise immunity |
JPS6172376A (ja) * | 1984-09-17 | 1986-04-14 | Sanyo Electric Co Ltd | 認識順位決定方式 |
JPS61114299A (ja) * | 1984-11-09 | 1986-05-31 | 日本電気株式会社 | 音声認識方式 |
US4718094A (en) * | 1984-11-19 | 1988-01-05 | International Business Machines Corp. | Speech recognition system |
JPS61220864A (ja) * | 1985-03-27 | 1986-10-01 | Toshiba Corp | ドツトプリンタ |
US4748670A (en) * | 1985-05-29 | 1988-05-31 | International Business Machines Corporation | Apparatus and method for determining a likely word sequence from labels generated by an acoustic processor |
US4783803A (en) * | 1985-11-12 | 1988-11-08 | Dragon Systems, Inc. | Speech recognition apparatus and method |
JPS62192890A (ja) * | 1986-02-20 | 1987-08-24 | Fujitsu Ltd | 文字認識処理方式 |
US4805100A (en) * | 1986-07-14 | 1989-02-14 | Nippon Hoso Kyokai | Language processing method and apparatus |
US4770843A (en) * | 1987-04-08 | 1988-09-13 | Westinghouse Electric Corp. | Controlling fuel assembly stability in a boiling water reactor |
US4899290A (en) * | 1987-10-16 | 1990-02-06 | Digital Equipment Corporation | System for specifying and executing protocols for using iterative analogy and comparative induction in a model-based computation system |
US5185813A (en) * | 1988-01-19 | 1993-02-09 | Kabushiki Kaisha Toshiba | Document image processing apparatus |
JPH02150899A (ja) * | 1988-12-02 | 1990-06-11 | Toshiba Corp | 音声認識方式 |
US5067165A (en) * | 1989-04-19 | 1991-11-19 | Ricoh Company, Ltd. | Character recognition method |
JP2755738B2 (ja) * | 1989-11-20 | 1998-05-25 | 三洋電機株式会社 | 文字認識装置 |
US5029223A (en) * | 1990-02-02 | 1991-07-02 | International Business Machines Corporation | Constraint driven-on line recognition of handwritten characters and symbols |
US5125022A (en) * | 1990-05-15 | 1992-06-23 | Vcs Industries, Inc. | Method for recognizing alphanumeric strings spoken over a telephone network |
-
1990
- 1990-03-07 JP JP2056043A patent/JP2795719B2/ja not_active Expired - Fee Related
-
1993
- 1993-08-23 US US08/110,799 patent/US5416892A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US5416892A (en) | 1995-05-16 |
JPH03257596A (ja) | 1991-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2795719B2 (ja) | 認識距離の差に基づく最良優先探索処理方法 | |
US6879951B1 (en) | Chinese word segmentation apparatus | |
US7831911B2 (en) | Spell checking system including a phonetic speller | |
JP5710317B2 (ja) | 情報処理装置、自然言語解析方法、プログラムおよび記録媒体 | |
CN106202153A (zh) | 一种es搜索引擎的拼写纠错方法及系统 | |
US20130177893A1 (en) | Method and Apparatus for Responding to an Inquiry | |
CN110083681A (zh) | 基于数据分析的搜索方法、装置及终端 | |
Le Zhang et al. | Enhancing low resource keyword spotting with automatically retrieved web documents | |
TW201822190A (zh) | 語音辨識系統及其方法、詞彙建立方法與電腦程式產品 | |
CN112231451B (zh) | 指代词恢复方法、装置、对话机器人及存储介质 | |
JP2007334429A (ja) | キーワード生成方法、文書検索方法、話題範囲推定方法、話題境界推定方法、及びこれらの装置とそのプログラム、その記録媒体 | |
JP2008052548A (ja) | 検索プログラム、情報検索装置及び情報検索方法 | |
JP2017059014A (ja) | 解析装置およびデータ検索装置,ならびにこれらの制御方法 | |
JPH0454564A (ja) | 重み学習型テキストベース検索装置 | |
Zhang et al. | Character-Aware Sub-Word Level Language Modeling for Uyghur and Turkish ASR | |
KR101982490B1 (ko) | 문자 데이터 변환에 기초한 키워드 검색 방법 및 그 장치 | |
JP2005284209A (ja) | 音声認識方式 | |
JPH0981184A (ja) | 対話支援装置 | |
JP6805431B2 (ja) | 音声認識装置 | |
JP2007199876A (ja) | 質問応答システム、質問応答処理方法及び質問応答プログラム | |
JP2966002B2 (ja) | 音声認識装置 | |
JPH06274546A (ja) | 情報量一致度計算方式 | |
JPS61122781A (ja) | 音声ワ−ドプロセツサ | |
CN112084777B (zh) | 一种实体链接方法 | |
JP3001334B2 (ja) | 認識用言語処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |