JPH03144877A - 文脈的文字または音素認識方法及びシステム - Google Patents
文脈的文字または音素認識方法及びシステムInfo
- Publication number
- JPH03144877A JPH03144877A JP2280532A JP28053290A JPH03144877A JP H03144877 A JPH03144877 A JP H03144877A JP 2280532 A JP2280532 A JP 2280532A JP 28053290 A JP28053290 A JP 28053290A JP H03144877 A JPH03144877 A JP H03144877A
- Authority
- JP
- Japan
- Prior art keywords
- string
- candidate
- character
- strings
- box
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 38
- 230000007704 transition Effects 0.000 claims description 10
- 238000012360 testing method Methods 0.000 description 26
- 238000012545 processing Methods 0.000 description 16
- 230000004044 response Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 230000011218 segmentation Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000006677 Appel reaction Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 206010017577 Gait disturbance Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000000384 rearing effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/083—Recognition networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/268—Lexical context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の利用分野〕
本発明は自然言語のテキスト及び音声の認識に関し、特
に、文字及び音素の認識に関する。
に、文字及び音素の認識に関する。
「パターン認識J (Pattern Recogn
ition )誌、第21巻、第5号(1988年)、
第455〜462頁に所載のニー・ゴシュタスビ−(G
osh tasby 。
ition )誌、第21巻、第5号(1988年)、
第455〜462頁に所載のニー・ゴシュタスビ−(G
osh tasby 。
A)及びアール・タブリュー・エーリッヒ(Ehric
hR,W、)の論文「確率的弛緩ラベル付けを用いる文
脈的語認識J (Contextual Word R
ecognitionUsing Probabili
stic Labeling )において、第1図に示
すような文脈的語認識システムが記載されている。即ち
、文字認識モジュールが、各入力文字に、入力内の文字
がaから2までのラベルを持っているということの確実
性を示す26個の番号を割り当てる。この確実性は確率
に変換され、その出力は代入集合と呼ばれる集合のシー
ケンスとなり、その各々は、非ゼロ確率を有する個々の
文字に対する代替え物を含んでいる。ポストプロセッサ
が、この言語からの文脈的情報を用いてこの代替え物の
シーケンスから正しい語を識別し、また、文字の混同確
率、文字の遷移確率、辞書またはこれらの組合せを用い
る場合もある。第2節において、第457頁の辞書探索
を含む主な後処理方法が概説されている。第2.4節に
は、辞書探索に必要なメモリ及び時間が記載されている
。第3節には、弛緩ラベル付は処理が記載されている。
hR,W、)の論文「確率的弛緩ラベル付けを用いる文
脈的語認識J (Contextual Word R
ecognitionUsing Probabili
stic Labeling )において、第1図に示
すような文脈的語認識システムが記載されている。即ち
、文字認識モジュールが、各入力文字に、入力内の文字
がaから2までのラベルを持っているということの確実
性を示す26個の番号を割り当てる。この確実性は確率
に変換され、その出力は代入集合と呼ばれる集合のシー
ケンスとなり、その各々は、非ゼロ確率を有する個々の
文字に対する代替え物を含んでいる。ポストプロセッサ
が、この言語からの文脈的情報を用いてこの代替え物の
シーケンスから正しい語を識別し、また、文字の混同確
率、文字の遷移確率、辞書またはこれらの組合せを用い
る場合もある。第2節において、第457頁の辞書探索
を含む主な後処理方法が概説されている。第2.4節に
は、辞書探索に必要なメモリ及び時間が記載されている
。第3節には、弛緩ラベル付は処理が記載されている。
ICASSP会報(Proceedings of I
CASSP )、82、第1巻(IEII!E、 19
82年)の第546〜549頁に所載のデイ−・ダブリ
ュー・シップマン(Shipman、 o、 w、 )
及びヴイー・ダブリュー・ツーエ(Zue、 V、 −
、)の論文「大型辞書の性質:高度孤立語認識システム
に対する含意J (Propertiesof Lar
ge Lexicons: Implications
for AdvancedIsolated Wor
d Recognition System )におい
て、大型器量の音声学を基礎とする孤立語音声認識のた
めの方法が記載されている。そのデータベースは、客語
に対する音素的表記及びこの語の出現頻度を有する用語
集を含んでいる。第548頁には、例えば子音であるか
母音であるかを識別することのできる予備的な粗(cr
ude )の音声学的解析が記載されている。第549
頁には、種々の大きさの辞書が、音素型、強度記号、及
び音節境界を含む客語の発音を選択することによってど
のようにして作られたかが記載されている。第547頁
には、音素の6様分類が記載されている。第547〜5
48頁には、例えば、各子音を符号Cで置き換え、及び
各母音を符号Vで置き換えることによって辞書内の客語
をC−■のシーケンスに還元するというようなセグメン
ト的レベルにおける部分的仕様が、どのようにして語を
一意的に決定することができるかが記載されている。こ
の論文の著者は、子音と母音とを正確に識別する粗の予
備的な音声学的解析を考えており、また、大型の用語集
のための孤立語識別に対する一つの試みは、最初に音声
単位をいくつかの広い項頻に分類することであろう、と
示唆しており、これにおいてはラベル付けの誤りは依然
として小さい。
CASSP )、82、第1巻(IEII!E、 19
82年)の第546〜549頁に所載のデイ−・ダブリ
ュー・シップマン(Shipman、 o、 w、 )
及びヴイー・ダブリュー・ツーエ(Zue、 V、 −
、)の論文「大型辞書の性質:高度孤立語認識システム
に対する含意J (Propertiesof Lar
ge Lexicons: Implications
for AdvancedIsolated Wor
d Recognition System )におい
て、大型器量の音声学を基礎とする孤立語音声認識のた
めの方法が記載されている。そのデータベースは、客語
に対する音素的表記及びこの語の出現頻度を有する用語
集を含んでいる。第548頁には、例えば子音であるか
母音であるかを識別することのできる予備的な粗(cr
ude )の音声学的解析が記載されている。第549
頁には、種々の大きさの辞書が、音素型、強度記号、及
び音節境界を含む客語の発音を選択することによってど
のようにして作られたかが記載されている。第547頁
には、音素の6様分類が記載されている。第547〜5
48頁には、例えば、各子音を符号Cで置き換え、及び
各母音を符号Vで置き換えることによって辞書内の客語
をC−■のシーケンスに還元するというようなセグメン
ト的レベルにおける部分的仕様が、どのようにして語を
一意的に決定することができるかが記載されている。こ
の論文の著者は、子音と母音とを正確に識別する粗の予
備的な音声学的解析を考えており、また、大型の用語集
のための孤立語識別に対する一つの試みは、最初に音声
単位をいくつかの広い項頻に分類することであろう、と
示唆しており、これにおいてはラベル付けの誤りは依然
として小さい。
本発明は、書かれた語の文字または話された語の音素を
、この語を文字または音素の候補のストリングとして取
り扱うことによって認識するための方法を提供すること
を目的とするものであり、この本発明方法によれば、−
のストリングを認識するために、及び、そうであると思
われる語の格またはフォントのような認識済みストリン
グについての追加の情報を提供するために用いることの
できるデータ構造を提供することができ、また、複数の
これらデータ構造をシステムに含ませて並列認識操作を
提供することができる。
、この語を文字または音素の候補のストリングとして取
り扱うことによって認識するための方法を提供すること
を目的とするものであり、この本発明方法によれば、−
のストリングを認識するために、及び、そうであると思
われる語の格またはフォントのような認識済みストリン
グについての追加の情報を提供するために用いることの
できるデータ構造を提供することができ、また、複数の
これらデータ構造をシステムに含ませて並列認識操作を
提供することができる。
本発明の一つの態様は、蓋然的な文字のセットのストリ
ングに基づいて認識を行なう従来の方法にある基本的な
問題を認めたことから発生したものである。客語に対す
る文字の可能性ある組合せの数は、各セット内の文字の
数が増加するにしたがって急速に増加する。したがって
、この方法は、各セット内の文字の数が制限されている
場合にのみ実用的であり、蓋然性の少ない文字について
の情報を捨てるステップは、したがって、誤りを導入す
る可能性がある。
ングに基づいて認識を行なう従来の方法にある基本的な
問題を認めたことから発生したものである。客語に対す
る文字の可能性ある組合せの数は、各セット内の文字の
数が増加するにしたがって急速に増加する。したがって
、この方法は、各セット内の文字の数が制限されている
場合にのみ実用的であり、蓋然性の少ない文字について
の情報を捨てるステップは、したがって、誤りを導入す
る可能性がある。
一現在市販の機械は、一般に、完全な正確性を持って文
字型を識別するということはできない。その理由は、一
部は、格、フォント、等の変化から生ずる各文字型内の
文字の形状及び大きさの大幅の変化のためである。しか
し、本発明のこの態様は、かかる機械を、機械識別可能
文字候補型のセット間でほとんど完全に識別するものと
して取り扱うことができる、ということを理解すること
から発生したものである。換言すれば、成るレベルにお
いて、かかる機械は、同一の文字候補に対して同一に応
答し、そして文字候補に対する有限数の個別的応答を有
す。これらの個別的応答は、所定の機械に対して一意的
であることができ、したがって、機械識別可能文字候補
型のセットを定義することができる。
字型を識別するということはできない。その理由は、一
部は、格、フォント、等の変化から生ずる各文字型内の
文字の形状及び大きさの大幅の変化のためである。しか
し、本発明のこの態様は、かかる機械を、機械識別可能
文字候補型のセット間でほとんど完全に識別するものと
して取り扱うことができる、ということを理解すること
から発生したものである。換言すれば、成るレベルにお
いて、かかる機械は、同一の文字候補に対して同一に応
答し、そして文字候補に対する有限数の個別的応答を有
す。これらの個別的応答は、所定の機械に対して一意的
であることができ、したがって、機械識別可能文字候補
型のセットを定義することができる。
この態様は、また、不正確な文字認識の問題を、一部は
、文字候補識別子のストリングを認識することによって
解決することができる、ということを理解することから
発生したものであり、各文字候補識別子は一つのセット
の機械識別可能文字候補型のうちの一つを指示する。認
識済みストリングであるという可能性が高い語の文字を
認識出力として提供することができる。
、文字候補識別子のストリングを認識することによって
解決することができる、ということを理解することから
発生したものであり、各文字候補識別子は一つのセット
の機械識別可能文字候補型のうちの一つを指示する。認
識済みストリングであるという可能性が高い語の文字を
認識出力として提供することができる。
この解決法は、候補識別子のストリングのセットを指示
するデータを含むデータ構造を用いて実施することがで
き、したがって、プロセッサがこのデータ構造にアクセ
スし、このセット内に候補ストリングがあるかどうかを
測定することができる。このセットは、各々が少なくと
も1つの受容可能語である可能性がある受容可能なスト
リングを、及びこのセットが指示されたグラフまたは他
の適切なデータ構造であり得るということを指示するデ
ータを含むことができる。
するデータを含むデータ構造を用いて実施することがで
き、したがって、プロセッサがこのデータ構造にアクセ
スし、このセット内に候補ストリングがあるかどうかを
測定することができる。このセットは、各々が少なくと
も1つの受容可能語である可能性がある受容可能なスト
リングを、及びこのセットが指示されたグラフまたは他
の適切なデータ構造であり得るということを指示するデ
ータを含むことができる。
本発明のこの態様はまた、従来の方法に重大な影響を与
える可能性のある問題であるセグメンテーションにおけ
る誤りに比較的1屯感である認識方法を提供するので、
有利である。成る与えられた文字候補は、文字の一部で
ある可能性、または複数の文字の組合せである可能性が
ある。文字候補のストリングがセット内にあるかぎり、
1つまたは複数の候補が単一の文字に対応しなくとも、
このストリングは認識可能である。
える可能性のある問題であるセグメンテーションにおけ
る誤りに比較的1屯感である認識方法を提供するので、
有利である。成る与えられた文字候補は、文字の一部で
ある可能性、または複数の文字の組合せである可能性が
ある。文字候補のストリングがセット内にあるかぎり、
1つまたは複数の候補が単一の文字に対応しなくとも、
このストリングは認識可能である。
この方法の他の利点は、成る与えられた文字確率のシー
ケンスに対応する可能性のある文字の多数のストリング
について、時間のかかる計算を必要としないということ
である。従来の成る方法においては、可能性ある文字の
複数のストリングを計算し、そして受容可能な語である
ものを見付けるために辞書内の可能性ある各ストリング
を探索する。しかし、本発明方法においては、文字候補
識別子の単一のストリングを探索し、これが受容可能ス
トリングのセット内にあるかどうかを測定するだけでよ
い。
ケンスに対応する可能性のある文字の多数のストリング
について、時間のかかる計算を必要としないということ
である。従来の成る方法においては、可能性ある文字の
複数のストリングを計算し、そして受容可能な語である
ものを見付けるために辞書内の可能性ある各ストリング
を探索する。しかし、本発明方法においては、文字候補
識別子の単一のストリングを探索し、これが受容可能ス
トリングのセット内にあるかどうかを測定するだけでよ
い。
以下、本発明の前記及び他の目的、特徴及び利点を図面
を参照して詳細に説明する。
を参照して詳細に説明する。
A、用語の説明
次ぎに行なう用語の説明は本発明の広い範囲を理解する
のに助けとなるものであり、以下に定義する用語は本出
願明細書を通じて示される意味を有す。
のに助けとなるものであり、以下に定義する用語は本出
願明細書を通じて示される意味を有す。
「語j (word )とは、言語における意味の最少
単位である。「書かれた語J (written im
ord )は、英字的、数字的、または絵文字的要素の
ような個別要素の形式で記録された語を意味する。「話
された語J (5poken word )または「音
声J (speech)は、話者の発声からのような連
続した形式で受け取られる語を意味する。したがって、
記録された音声のような連続した形式で記憶された語は
書かれた語ではなく、再生されると話された語となる。
単位である。「書かれた語J (written im
ord )は、英字的、数字的、または絵文字的要素の
ような個別要素の形式で記録された語を意味する。「話
された語J (5poken word )または「音
声J (speech)は、話者の発声からのような連
続した形式で受け取られる語を意味する。したがって、
記録された音声のような連続した形式で記憶された語は
書かれた語ではなく、再生されると話された語となる。
「孤立した話された語J (1solated 5po
ken word)とは、先行または後続の全ての語か
ら分離して受け取られる話された語である。
ken word)とは、先行または後続の全ての語か
ら分離して受け取られる話された語である。
「テキストJ (text )とは、書かれた語の配列
であり、通例はシーケンスである。したがって、テキス
トは、各々が少なくとも■つの個別要素を有するゼロま
たはそれ以上の語を含む。
であり、通例はシーケンスである。したがって、テキス
トは、各々が少なくとも■つの個別要素を有するゼロま
たはそれ以上の語を含む。
「文字j (character )は、テキスト内に
現われる個別素子を意味する。したがって、文字は、英
数字要素だけではなく、更に、句読記号、分音記号、及
びテキスト内に含まれる他の要素を含む。
現われる個別素子を意味する。したがって、文字は、英
数字要素だけではなく、更に、句読記号、分音記号、及
びテキスト内に含まれる他の要素を含む。
「文字型J (character type )とは
、文字が英文字または数字のような例となることができ
る、という項頻である。
、文字が英文字または数字のような例となることができ
る、という項頻である。
「音素J (phonen+e )は、音声内に生ずる
要素のシーケンスの一部である要素を意味する。辞書内
に見られる語の音声学的表現は音素のシーケンスである
。「音素型J (phoneme type )とは、
一つの項類であり、その音素が一つの例となることがで
きる。
要素のシーケンスの一部である要素を意味する。辞書内
に見られる語の音声学的表現は音素のシーケンスである
。「音素型J (phoneme type )とは、
一つの項類であり、その音素が一つの例となることがで
きる。
「文字識別子J (character 1denti
fer )とは、一つのデータ構造であり、そのデータ
が一つのセットの文字型のうちの一つを指示する。「音
素識別子J (phoneme 1dentifier
)とは、一つのデータ構造であり、そのデータが一つ
のセットの音素型のうちの一つを指示する。
fer )とは、一つのデータ構造であり、そのデータ
が一つのセットの文字型のうちの一つを指示する。「音
素識別子J (phoneme 1dentifier
)とは、一つのデータ構造であり、そのデータが一つ
のセットの音素型のうちの一つを指示する。
「文字候補」とは、分類または識別のためにシステムに
別々に提示されるテキストの全ての部分である。代表的
な文字識別システムにおいては、文字候補は、この文字
候補が文字となることを示す基準を基礎としてセグメン
ト化されたテキストの一部である。
別々に提示されるテキストの全ての部分である。代表的
な文字識別システムにおいては、文字候補は、この文字
候補が文字となることを示す基準を基礎としてセグメン
ト化されたテキストの一部である。
「音素候補」とは、分類または識別のためにシステムに
別々に提示される発声の全ての部分である。代表的な音
素識別システムにおいては、音素候補は、この音素候補
が音素となることを示す基準を基礎としてセグメント化
された発声の一部である。
別々に提示される発声の全ての部分である。代表的な音
素識別システムにおいては、音素候補は、この音素候補
が音素となることを示す基準を基礎としてセグメント化
された発声の一部である。
「候補J (candidate )は、文字候補また
は音素候補のいずれかを意味することができる。
は音素候補のいずれかを意味することができる。
「文字確率空間」とは、一つの数学的空間であり、この
空間において、各次元が、一つの候補が成る特定の文字
型の例となる確率を指示する。
空間において、各次元が、一つの候補が成る特定の文字
型の例となる確率を指示する。
「音素確率空間J (phoneme probabi
lity 5pace )とは、一つの数学的空間であ
り、この空間において、各次元が、一つの候補が成る特
定の音素型の例となる確率を指示する。
lity 5pace )とは、一つの数学的空間であ
り、この空間において、各次元が、一つの候補が成る特
定の音素型の例となる確率を指示する。
「文字候補型j (character candid
ate type )とは、一つの項類であり、その文
字候補が一つの例となることができる。一つの「文字候
補型のセットJ (set of character
candidatetypes )は複数のかかる項
類を含む。
ate type )とは、一つの項類であり、その文
字候補が一つの例となることができる。一つの「文字候
補型のセットJ (set of character
candidatetypes )は複数のかかる項
類を含む。
「音素候補型J (phoneme candidat
e type )とは一つの項類であり、その音素候補
が一つの例となることができる。一つの「音素候補型の
セット」(set of phoneme candi
date types )は複数のかかる項類を含む。
e type )とは一つの項類であり、その音素候補
が一つの例となることができる。一つの「音素候補型の
セット」(set of phoneme candi
date types )は複数のかかる項類を含む。
「候補型J (candidate type )なる
語は、文字候補型及び音素候補型の両方を含む。1つま
たは複数の項類を変化することにより、型のセットを修
正することができる。
語は、文字候補型及び音素候補型の両方を含む。1つま
たは複数の項類を変化することにより、型のセットを修
正することができる。
「機械識別可能文字候補型J (machine di
scriminable character can
didate type )とは、機械によって他の型
から正確に識別することのできる文字候補型である。「
機械識別可能音素候補型」(machine disc
riminable phoneme candida
tetype )とは、機械によって他の型から正確に
識別することのできる音素候補型である。前述したよう
に、文字型及び音素型は、これらを機械によって正確に
識別することができないので、一般に、機械識別可能性
でない。
scriminable character can
didate type )とは、機械によって他の型
から正確に識別することのできる文字候補型である。「
機械識別可能音素候補型」(machine disc
riminable phoneme candida
tetype )とは、機械によって他の型から正確に
識別することのできる音素候補型である。前述したよう
に、文字型及び音素型は、これらを機械によって正確に
識別することができないので、一般に、機械識別可能性
でない。
「データ構造J (data 5tructure )
とは、相互関連したデータの全ての組合せである。「プ
ロセッサJ (processor )とは、データを
処理することのできる全ての構成要素である。データは
、これがプロセッサによってアクセスされ得るときに「
アクセス可能J (accessible )となる。
とは、相互関連したデータの全ての組合せである。「プ
ロセッサJ (processor )とは、データを
処理することのできる全ての構成要素である。データは
、これがプロセッサによってアクセスされ得るときに「
アクセス可能J (accessible )となる。
データは、該データが、該データへのアクセスに先立っ
てデータ構造にアクセスすることを含む操作によってア
クセス可能となるときに、「データ構造内でJ (in
a data 5tructure )アクセス可能
となる。「データ単位J (data unit )と
は、データ処理システムによって単位としてアクセス可
能であるデータ構造である。データ構造内にデータを「
含む」とは、このデータをこのデータ構造内でアクセス
可能とするために必要な全ての操作を行なうことを意味
する。
てデータ構造にアクセスすることを含む操作によってア
クセス可能となるときに、「データ構造内でJ (in
a data 5tructure )アクセス可能
となる。「データ単位J (data unit )と
は、データ処理システムによって単位としてアクセス可
能であるデータ構造である。データ構造内にデータを「
含む」とは、このデータをこのデータ構造内でアクセス
可能とするために必要な全ての操作を行なうことを意味
する。
データは、プロセッサが該データに基づいてそれぞれの
メンバを決定することができるときに、セットの前記そ
れぞれのメンバを「指示する」(1ndicate )
。データは、セットが該セットの各メンバを指示するデ
ータを含むときに、前記セットを「指示するJ (1n
dicate )。
メンバを決定することができるときに、セットの前記そ
れぞれのメンバを「指示する」(1ndicate )
。データは、セットが該セットの各メンバを指示するデ
ータを含むときに、前記セットを「指示するJ (1n
dicate )。
「指示されたグラフデータ構造j (directed
graph data 5tructure )とは、
ノードのセット及び辺(または弧)のセットを定義する
データを含むデータ構造であり、前記辺の各々は前記ノ
ードの一つにおいて始まり、前記ノードの一つにおいて
終わる。
graph data 5tructure )とは、
ノードのセット及び辺(または弧)のセットを定義する
データを含むデータ構造であり、前記辺の各々は前記ノ
ードの一つにおいて始まり、前記ノードの一つにおいて
終わる。
「有限状態変換器データ構造J (finite 5t
atetransducer data 5truct
ure ) とは、指示されたグラフデータ構造であり
、そのデータが、状態と呼ばれるノードのセットを、及
び遷移と呼ばれる辺のセットを定義する、というもので
ある。即ち、次のごとくである。単一の開始状態があり
、これから、遷移のシーケンスに従うことにより、全て
の他の状態に到達することができる、これは、前記開始
状態を定義するデータの部分にアクセスし、次いで前記
データの他の部分にアクセスして遷移のシーケンスに従
うことによって、行なうことができる。遷移の前記シー
ケンスを定義する前記データの部分は、また、各遷移に
対し、2つのセットからの1対の素子を指示し、一方の
セットからの素子のシーケンスは他方のセットからの素
子のシーケンスと対になるようになっている。
atetransducer data 5truct
ure ) とは、指示されたグラフデータ構造であり
、そのデータが、状態と呼ばれるノードのセットを、及
び遷移と呼ばれる辺のセットを定義する、というもので
ある。即ち、次のごとくである。単一の開始状態があり
、これから、遷移のシーケンスに従うことにより、全て
の他の状態に到達することができる、これは、前記開始
状態を定義するデータの部分にアクセスし、次いで前記
データの他の部分にアクセスして遷移のシーケンスに従
うことによって、行なうことができる。遷移の前記シー
ケンスを定義する前記データの部分は、また、各遷移に
対し、2つのセットからの1対の素子を指示し、一方の
セットからの素子のシーケンスは他方のセットからの素
子のシーケンスと対になるようになっている。
「文字候補識別子J (character cand
idateidentifier )とは、一つのデー
タ構造であり、そのデータが一つのセットの文字候補型
の一つを指示する。「音素候補識別子J (phone
me candidateidentifier )と
は、一つのデータ構造であり、そのデータが一つのセッ
トの文字候補型の一つを指示する。
idateidentifier )とは、一つのデー
タ構造であり、そのデータが一つのセットの文字候補型
の一つを指示する。「音素候補識別子J (phone
me candidateidentifier )と
は、一つのデータ構造であり、そのデータが一つのセッ
トの文字候補型の一つを指示する。
識別子の「ストリング」とは、識別子の順序セットを含
むデータ構造である。データは、このようなストリング
の識別子の順序セットを指示することによって該ストリ
ングを「指示する」(i nd tca te)。かか
るストリングのセットは、該セット内のストリングの各
々を指示するデータを獲得することによって「獲得する
J (obtain )される。
むデータ構造である。データは、このようなストリング
の識別子の順序セットを指示することによって該ストリ
ングを「指示する」(i nd tca te)。かか
るストリングのセットは、該セット内のストリングの各
々を指示するデータを獲得することによって「獲得する
J (obtain )される。
B、−船釣特徴
本発明の一般的特徴は、第1図ないし第6図から理解す
ることができる。第1図は一般的段階を示すものであり
、これら段階により、サンプルテキスト内の誤セグメン
ト化文字候補が、正しく認識された文字へ通ずることが
できる。第2A図は、文字候補ストリングのセットを指
示するデータをもつデータ構造の例を示すものである。
ることができる。第1図は一般的段階を示すものであり
、これら段階により、サンプルテキスト内の誤セグメン
ト化文字候補が、正しく認識された文字へ通ずることが
できる。第2A図は、文字候補ストリングのセットを指
示するデータをもつデータ構造の例を示すものである。
第2B図は、文字候補ストリングに基づく文字ストリン
グを獲得するために用いることのできる同様のデータ構
造の一部を示すものである。第3A図は、第2A図にお
けるものと同様のデータ構造を用いる際の一般的ステッ
プを示すものであり、第3B図は、第2B図におけるも
のと同様のデータ構造を用いる際の一般的ステップを示
すものである。第4図は、このようなデータ構造を作る
ためにストリングのセットを獲得する際の一般的ステッ
プを示すものである。第5図は、各々がこのようなデー
タ構造を含んでいる並列t、識詰装置もつシステムの一
般的構成要素を示すものである。第6図は、第5図にお
ける結果プロセッサの操作における一般的ステップを示
すものである。
グを獲得するために用いることのできる同様のデータ構
造の一部を示すものである。第3A図は、第2A図にお
けるものと同様のデータ構造を用いる際の一般的ステッ
プを示すものであり、第3B図は、第2B図におけるも
のと同様のデータ構造を用いる際の一般的ステップを示
すものである。第4図は、このようなデータ構造を作る
ためにストリングのセットを獲得する際の一般的ステッ
プを示すものである。第5図は、各々がこのようなデー
タ構造を含んでいる並列t、識詰装置もつシステムの一
般的構成要素を示すものである。第6図は、第5図にお
ける結果プロセッサの操作における一般的ステップを示
すものである。
一般に、本発明の方法は、孤立語音声における音素の認
識に、及びテキストにおける文字の認識に適用すること
ができる。第1図ないし第4図の方法は、若干の修正を
もって音素に適用することができ、第5図及び第6図の
方法は、文字及び音素の両方に直接適用可能である。
識に、及びテキストにおける文字の認識に適用すること
ができる。第1図ないし第4図の方法は、若干の修正を
もって音素に適用することができ、第5図及び第6図の
方法は、文字及び音素の両方に直接適用可能である。
第1図における第1の一般的段階は、第10図に示すよ
うなrsavvy morning warning
jという語を含んでいるテキストのセグメンテーション
である。第1図に示すセグメンテーション誤りとしては
、文字がrvvJ、rrnJ、またはrinJである場
合に2つの連続文字を単一文字候補に誤って包括すると
いうこと、及び文字がrmJまたはrwJで成る場合に
単一文字を2つの候補に誤って分離するということがあ
る。
うなrsavvy morning warning
jという語を含んでいるテキストのセグメンテーション
である。第1図に示すセグメンテーション誤りとしては
、文字がrvvJ、rrnJ、またはrinJである場
合に2つの連続文字を単一文字候補に誤って包括すると
いうこと、及び文字がrmJまたはrwJで成る場合に
単一文字を2つの候補に誤って分離するということがあ
る。
セグメンテーションから生ずる文字候補は、次いで、各
候補に対して、ボックス12内に示すように、そのそれ
ぞれの機械識別可能文字候補型の識別子を与える方法に
よって認識される。ボックス12内の各文字候補識別子
は、例えば、候補のそれぞれの型を指示する番号が後に
続く英文字「C」を含んでいるが、これら識別子は任意
の適当する形式を取ることができる。この段階は、例え
ば、「確率クラスタリングに基づく文字及び音素認識J
(Character and Phoneme R
ecognitionBaed on Probabi
lty Clustering)なる発明の名称の係属
中の米国特許出願第07/427,148号に記載の方
法で実施することができる。前記発明は文字確率空間内
のクラスタの識別子を獲得するためのものであり、その
内容は、本明細書において参照として説明する。ボック
ス12内の識別子のストリングは、また、テキスト内の
語相互間のスペースまたは他の区切り点を指示する語の
終わり(EOW)識別子を含んでいる。
候補に対して、ボックス12内に示すように、そのそれ
ぞれの機械識別可能文字候補型の識別子を与える方法に
よって認識される。ボックス12内の各文字候補識別子
は、例えば、候補のそれぞれの型を指示する番号が後に
続く英文字「C」を含んでいるが、これら識別子は任意
の適当する形式を取ることができる。この段階は、例え
ば、「確率クラスタリングに基づく文字及び音素認識J
(Character and Phoneme R
ecognitionBaed on Probabi
lty Clustering)なる発明の名称の係属
中の米国特許出願第07/427,148号に記載の方
法で実施することができる。前記発明は文字確率空間内
のクラスタの識別子を獲得するためのものであり、その
内容は、本明細書において参照として説明する。ボック
ス12内の識別子のストリングは、また、テキスト内の
語相互間のスペースまたは他の区切り点を指示する語の
終わり(EOW)識別子を含んでいる。
EOWiJ別子相互量子相互間文字候補識別子の各スト
リングは、次いで、ボックス14内に示すようなストリ
ング識別子に変換される。ボックス14内の各ストリン
グ識別子は、例えば、文字候補識別子のストリングを指
示する番号が後に続く英文字rsJを含んでいる。この
変換は、候補識別子ストリングのセットを指示するデー
タを含んでいるデータ構造で行なうことができる。ボッ
クス12からのストリングがこのセットのものである場
合には、このデータ構造を用いて、このストリングを指
示するストリング識別子を獲得することができる。
リングは、次いで、ボックス14内に示すようなストリ
ング識別子に変換される。ボックス14内の各ストリン
グ識別子は、例えば、文字候補識別子のストリングを指
示する番号が後に続く英文字rsJを含んでいる。この
変換は、候補識別子ストリングのセットを指示するデー
タを含んでいるデータ構造で行なうことができる。ボッ
クス12からのストリングがこのセットのものである場
合には、このデータ構造を用いて、このストリングを指
示するストリング識別子を獲得することができる。
次いで、各ストリング識別子を用いて、ボックス16内
に示すようなそれぞれの識別子を獲得することができる
。ボックス16内の各語識別子は、例えば、語を指示す
る番号が後に続く英文字「W」を含んでいる。この変換
は、ストリング識別子でアクセスされるとそれぞれの語
識別子を提供するルックアップテーブルのようなデータ
構造で行なうことができる。
に示すようなそれぞれの識別子を獲得することができる
。ボックス16内の各語識別子は、例えば、語を指示す
る番号が後に続く英文字「W」を含んでいる。この変換
は、ストリング識別子でアクセスされるとそれぞれの語
識別子を提供するルックアップテーブルのようなデータ
構造で行なうことができる。
最後に、各語識別子を用いて、ボックス18内に示すよ
うな、これが指示する語の文字コードを獲得することが
できる。ボックス18内の各文字コードは、例えば、文
字として示しであるが、実際には、ASCIIコードま
たは文字を指示する他の適当するコードであってもよい
。
うな、これが指示する語の文字コードを獲得することが
できる。ボックス18内の各文字コードは、例えば、文
字として示しであるが、実際には、ASCIIコードま
たは文字を指示する他の適当するコードであってもよい
。
第1図の例は、どのようにして文字候補ストリング認識
を用いて、間違ってセグメント化されたテキストの認識
を改善することができるかを示すものである。第1図に
おける一般的シーケンスの段階は、文字認識において通
例生ずる他の多くの問題に適用可能である。例えば、第
1図における段階は、相異なる文字が機械識別可能でな
い場合に適用可能である。これは、機械が「6」とrb
Jとのような相異なる文字を識別することができないた
めに、または、機械が「c」と「C」とのような相異な
るフォントもしくは格の文字を識別することができない
ために、または、一方の文字が、斜めになるというよう
に変形されているか、または点もしくは白スペースのよ
うな雑音によって変形されておって他の文字のように見
えるので機械が文字を識別することができないために、
生ずるのである。第1図における段階は、また、語の織
りが間違っている場合にも適用可能である。
を用いて、間違ってセグメント化されたテキストの認識
を改善することができるかを示すものである。第1図に
おける一般的シーケンスの段階は、文字認識において通
例生ずる他の多くの問題に適用可能である。例えば、第
1図における段階は、相異なる文字が機械識別可能でな
い場合に適用可能である。これは、機械が「6」とrb
Jとのような相異なる文字を識別することができないた
めに、または、機械が「c」と「C」とのような相異な
るフォントもしくは格の文字を識別することができない
ために、または、一方の文字が、斜めになるというよう
に変形されているか、または点もしくは白スペースのよ
うな雑音によって変形されておって他の文字のように見
えるので機械が文字を識別することができないために、
生ずるのである。第1図における段階は、また、語の織
りが間違っている場合にも適用可能である。
第2A図はデータ構造20を示すものであり、このデー
タ構造を用いて、第1図のボックス12内にあるような
文字候補識別子のストリングを認識し、そしてボックス
14内にあるようなストリング識別子に変換することが
できる。データ構造20は、指示されたグラフデータ構
造のノードを表す円、及び、辺または弧を表す線を含ん
でいる。
タ構造を用いて、第1図のボックス12内にあるような
文字候補識別子のストリングを認識し、そしてボックス
14内にあるようなストリング識別子に変換することが
できる。データ構造20は、指示されたグラフデータ構
造のノードを表す円、及び、辺または弧を表す線を含ん
でいる。
各辺は関連の候補識別子を有しており、この識別子は、
図示のように、この辺を指示するデータがアクセスされ
るとアクセス可能となる。同様に、許容ストリングの端
部において到達される各ノードは、先行する辺の識別子
が整合するとアクセス可能となるこのストリングに対す
る関連のストリング識別子を有している。
図示のように、この辺を指示するデータがアクセスされ
るとアクセス可能となる。同様に、許容ストリングの端
部において到達される各ノードは、先行する辺の識別子
が整合するとアクセス可能となるこのストリングに対す
る関連のストリング識別子を有している。
データ構造20は、前述した可能性あるセグメンテーシ
ョン誤りに基づく3つの語rsavvy J、rmor
ning J 、及びrtnarntng Jを拡張す
ることによって獲得される18ストリングのリストを指
示するデータを含んでいる。語rsavvy Jは1つ
のセグメ・ンテーション誤りを受けている。従って、こ
れを、rC8−CI=C9−C9−CI IJ及びrC
8−C1−CI 0−C11Jのような第2A図及びに
示す2つの可能ストリングに拡張することができる。語
rmorning J及びriyarning Jは、
各々が3つのセグメンテーション誤りを受けている。従
って、その各々を8つの可能ストリングに拡張すること
ができる。
ョン誤りに基づく3つの語rsavvy J、rmor
ning J 、及びrtnarntng Jを拡張す
ることによって獲得される18ストリングのリストを指
示するデータを含んでいる。語rsavvy Jは1つ
のセグメ・ンテーション誤りを受けている。従って、こ
れを、rC8−CI=C9−C9−CI IJ及びrC
8−C1−CI 0−C11Jのような第2A図及びに
示す2つの可能ストリングに拡張することができる。語
rmorning J及びriyarning Jは、
各々が3つのセグメンテーション誤りを受けている。従
って、その各々を8つの可能ストリングに拡張すること
ができる。
データ構造20によって指示されるストリングは第2A
図の左側において崩壊しており、これらストリングを指
示するデータはこれに対応して崩壊させられて冗長度を
排除し、データ構造20を記憶するのに必要なメモリを
縮小させる可能性がある。
図の左側において崩壊しており、これらストリングを指
示するデータはこれに対応して崩壊させられて冗長度を
排除し、データ構造20を記憶するのに必要なメモリを
縮小させる可能性がある。
第2B図は、第2A図におけるデータ構造20と類似の
データ構造22を示すものである。ストリング識別子を
提供するのに加えて、データ構造22は、また、文字候
補ストリングに基づく文字ストリングを提供する。その
結果、データ構造22を用い、第1図のボックス14及
び16内に示すストリング識別子または語識別子を用い
ることなしに、候補識別子ストリングに基づく文字スト
リングを獲得することができる。
データ構造22を示すものである。ストリング識別子を
提供するのに加えて、データ構造22は、また、文字候
補ストリングに基づく文字ストリングを提供する。その
結果、データ構造22を用い、第1図のボックス14及
び16内に示すストリング識別子または語識別子を用い
ることなしに、候補識別子ストリングに基づく文字スト
リングを獲得することができる。
第2B図に示すように、データ構造22における各辺は
、候補識別子及び文字識別子を含んでいる関連の対を有
している。この文字識別子は、前記候補識別子と同しよ
うに、前記辺を指示するデータにアクセスすることによ
ってアクセスすることができる。後述するように、この
ようなデータ構造は、有限状態変換器方法によって作る
ことができる。この場合、このデータ構造は、上に定義
したような有限状態変換器データ構造となる。
、候補識別子及び文字識別子を含んでいる関連の対を有
している。この文字識別子は、前記候補識別子と同しよ
うに、前記辺を指示するデータにアクセスすることによ
ってアクセスすることができる。後述するように、この
ようなデータ構造は、有限状態変換器方法によって作る
ことができる。この場合、このデータ構造は、上に定義
したような有限状態変換器データ構造となる。
データ構造22は、データ構造20によって指示されて
ない2つのストリングを指示するデータを含んでいる。
ない2つのストリングを指示するデータを含んでいる。
これら2つのストリングは、S9’及び310’として
識別され、その各々は語rsawJを認識しようとする
試みから生ずる可能性がある。語rsaw Jは、語r
savvy Jのセグメンテーション誤りと反対のセグ
メンテーション誤りを受けており、2つの可能ストリン
グS9’及びSIO’に拡張することができる。
識別され、その各々は語rsawJを認識しようとする
試みから生ずる可能性がある。語rsaw Jは、語r
savvy Jのセグメンテーション誤りと反対のセグ
メンテーション誤りを受けており、2つの可能ストリン
グS9’及びSIO’に拡張することができる。
ストリング39’及びSIO’は、第2A図から若干変
化しており、関連の対がニブシロン(ε)を含んでいる
辺を示している。このニブシロンは、候補識別子と文字
識別子との間に1対1の関係が存在していない場合に、
用いられる。ストリング39’においては、C9−C9
のシーケンスが単一の文字rwJを発生するので、対c
9:εが生ずる。同様に、ストリングSIOにおいては
、候補識別子CIOが文字rvvJのシーケンスを発生
するので、対ε:Vが生ずる。
化しており、関連の対がニブシロン(ε)を含んでいる
辺を示している。このニブシロンは、候補識別子と文字
識別子との間に1対1の関係が存在していない場合に、
用いられる。ストリング39’においては、C9−C9
のシーケンスが単一の文字rwJを発生するので、対c
9:εが生ずる。同様に、ストリングSIOにおいては
、候補識別子CIOが文字rvvJのシーケンスを発生
するので、対ε:Vが生ずる。
第3A図は、データ構造20、または第1図のボックス
12内のもののような候補識別子ストリングを持つ類似
のデータ構造にアクセスする際の一般的ステップを示す
ものである。第3A図におけるステップは、ボックス3
oにおいて、候補識別子ストリングを受け取ると開始す
る。ボックス32におけるステップは、データ構造2o
の開始ノードにアクセスすることによって開始する。こ
のノードは、第2A図においてSOとラベル付けされて
おり、初期現在(カレント)ノードとして働く。
12内のもののような候補識別子ストリングを持つ類似
のデータ構造にアクセスする際の一般的ステップを示す
ものである。第3A図におけるステップは、ボックス3
oにおいて、候補識別子ストリングを受け取ると開始す
る。ボックス32におけるステップは、データ構造2o
の開始ノードにアクセスすることによって開始する。こ
のノードは、第2A図においてSOとラベル付けされて
おり、初期現在(カレント)ノードとして働く。
第3A図におけるステップは、2つの反復ループ、即ち
、ストリング内の候補識別子を通って進む外部反復・ル
ープ、及びストリングからの現在(カレント〉識別子を
現在(すなわちカレント)ノードからの各出発辺に対す
る候補識別子と比較する内部反復ループを含んでいる。
、ストリング内の候補識別子を通って進む外部反復・ル
ープ、及びストリングからの現在(カレント〉識別子を
現在(すなわちカレント)ノードからの各出発辺に対す
る候補識別子と比較する内部反復ループを含んでいる。
2つの反復ループの代わりに、この方法は、ストリング
内の各候補識別子をデータ構造20内への・インデック
スとして用いることによって実施することもできる。
内の各候補識別子をデータ構造20内への・インデック
スとして用いることによって実施することもできる。
ボックス34における試験は外部反復ループを開始する
。候補識別子が残っている限り、ボックス36における
ステップはストリングからの次の候補識別子を取り、次
いでボックス38におけるステップは内部反復ループを
開始する。ボックス40において整合が検出されたら、
この整合辺の宛先ノードはボックス42において現在す
なわちカレントノードとなり、次いで外部反復ループは
ボックス34における試験へ戻る。しかし、整合が検出
されない場合には、内部反復ループはボックス38へ戻
る。ボックス38における試験が、カレントノードの全
ての出発辺が整合なしにこのように取り扱われていたと
いうことを決定する場合には、ボックス44において、
候補識別ストリングへの整合に対する失敗を指示する値
が復帰させられる。
。候補識別子が残っている限り、ボックス36における
ステップはストリングからの次の候補識別子を取り、次
いでボックス38におけるステップは内部反復ループを
開始する。ボックス40において整合が検出されたら、
この整合辺の宛先ノードはボックス42において現在す
なわちカレントノードとなり、次いで外部反復ループは
ボックス34における試験へ戻る。しかし、整合が検出
されない場合には、内部反復ループはボックス38へ戻
る。ボックス38における試験が、カレントノードの全
ての出発辺が整合なしにこのように取り扱われていたと
いうことを決定する場合には、ボックス44において、
候補識別ストリングへの整合に対する失敗を指示する値
が復帰させられる。
ストリングからの全ての候補識別子が間違いなく整合し
ている場合には、ボックス46における試験が、カレン
トノードが許容可能ストリングの終わりであるかどうか
を測定する。このノードは、第2A図及び第2B図にお
いて、前述したように内部にストリング識別子がある円
として示されている。許容可能ストリングの終わりであ
る場合には、ボックス48において、探索の成功を指示
するストリング識別子が復帰させられる。しかし、許容
ストリングの終わりでない場合には、ボックス44にお
いて、故障を指示する値が復帰させられる。
ている場合には、ボックス46における試験が、カレン
トノードが許容可能ストリングの終わりであるかどうか
を測定する。このノードは、第2A図及び第2B図にお
いて、前述したように内部にストリング識別子がある円
として示されている。許容可能ストリングの終わりであ
る場合には、ボックス48において、探索の成功を指示
するストリング識別子が復帰させられる。しかし、許容
ストリングの終わりでない場合には、ボックス44にお
いて、故障を指示する値が復帰させられる。
第3B図は第3A図とほぼ同様であり、ボックス50,
52.54.56.58.60及び70におけるステッ
プはボックス30,32.34.36.38.40及び
46におけるステップに対応する。しかし、第3B図に
おけるステップは異なる。即ち、第3B図におけるステ
ップは、データ構造22に、または、各辺が、候補識別
子及び文字識別子を含んでいる関連の対を有していると
いう類似のデータ構造に適当するものであるからである
。
52.54.56.58.60及び70におけるステッ
プはボックス30,32.34.36.38.40及び
46におけるステップに対応する。しかし、第3B図に
おけるステップは異なる。即ち、第3B図におけるステ
ップは、データ構造22に、または、各辺が、候補識別
子及び文字識別子を含んでいる関連の対を有していると
いう類似のデータ構造に適当するものであるからである
。
ボックス60において一つの辺と関連の候補識別子の整
合が見つかったら、ボックス62におけるステップはデ
ータをスタックにロードし、この整合済み識別子と対に
なっている文字識別子、データ構造22における現在位
置、及びこの候補識別子(ID)ストリング内の現在位
置を決定することのできるデータを指示する。次いで、
ボックス54における試験へ戻る前に、ボックス64に
おいて、カレントノードが次の辺の宛先へセットされる
。
合が見つかったら、ボックス62におけるステップはデ
ータをスタックにロードし、この整合済み識別子と対に
なっている文字識別子、データ構造22における現在位
置、及びこの候補識別子(ID)ストリング内の現在位
置を決定することのできるデータを指示する。次いで、
ボックス54における試験へ戻る前に、ボックス64に
おいて、カレントノードが次の辺の宛先へセットされる
。
ボックス58における試験が、全ての辺が、整合を見付
けることなしに、所定の候補IDに対して取り扱われた
ということを測定した場合、または、ボ・ツクスフ0に
おける試験が、整合済みストリングが受容可能ストリン
グではないということを測定した場合には、ボックス6
6における試験が、スタックが空であるかどうかを測定
する。スタックが空でない場合には、スタックを通って
後へ戻り、そして他の探索櫓を追跡することにより、整
合ストリングを見付けることが可能となる可能性がある
。従って、ボックス68におけるステップは、スタック
から最上位のエントリをポツプし、このエントリにおい
て指示されているデータ構造22内の場所へ、及び候補
IDストリング内の指示された位置にある候補IDへ行
く。このエントリが、候補識別子としてεを持っている
辺に対応した場合は、候補IDストリング内の位置の変
化はない。次いで、ボックス58におけるステップを繰
り返し、まだ考えられてなかった場所に何らかの択−的
辺があるかどうかを測定する。
けることなしに、所定の候補IDに対して取り扱われた
ということを測定した場合、または、ボ・ツクスフ0に
おける試験が、整合済みストリングが受容可能ストリン
グではないということを測定した場合には、ボックス6
6における試験が、スタックが空であるかどうかを測定
する。スタックが空でない場合には、スタックを通って
後へ戻り、そして他の探索櫓を追跡することにより、整
合ストリングを見付けることが可能となる可能性がある
。従って、ボックス68におけるステップは、スタック
から最上位のエントリをポツプし、このエントリにおい
て指示されているデータ構造22内の場所へ、及び候補
IDストリング内の指示された位置にある候補IDへ行
く。このエントリが、候補識別子としてεを持っている
辺に対応した場合は、候補IDストリング内の位置の変
化はない。次いで、ボックス58におけるステップを繰
り返し、まだ考えられてなかった場所に何らかの択−的
辺があるかどうかを測定する。
ボックス70における試験が、整合済みストリングが受
容可能であるということを測定した場合には、ボックス
72におけるステップが、スタックを通って進んで、ε
以外の文字IDを引き出すことによって獲得された文字
IDのストリングを記憶する。次いで、ボックス66に
おける試験が、前述したようにこのスタックが空である
かどうかを測定する。
容可能であるということを測定した場合には、ボックス
72におけるステップが、スタックを通って進んで、ε
以外の文字IDを引き出すことによって獲得された文字
IDのストリングを記憶する。次いで、ボックス66に
おける試験が、前述したようにこのスタックが空である
かどうかを測定する。
ボックス66における試験が、スタ7りが空であるとい
うことを最終的に決定したら、ボックス74における試
験が、文字IDの全てのストリングが、ボックス72に
おけるステッ゛ブによって記憶されているかどうかを測
定する。記憶されている場合には、ボックス76におい
て、記憶済み文字IDストリングは戻されるが、記憶さ
れていない場合には、ボックス78において、失敗を指
示する信号が戻される。
うことを最終的に決定したら、ボックス74における試
験が、文字IDの全てのストリングが、ボックス72に
おけるステッ゛ブによって記憶されているかどうかを測
定する。記憶されている場合には、ボックス76におい
て、記憶済み文字IDストリングは戻されるが、記憶さ
れていない場合には、ボックス78において、失敗を指
示する信号が戻される。
第4図は、ボックス80において受け取られた語のリス
トを用い、データ構造20及び22に含まれているもの
のようなストリングのリストを獲得するための一般的ス
テップを示すものである。
トを用い、データ構造20及び22に含まれているもの
のようなストリングのリストを獲得するための一般的ス
テップを示すものである。
第4図に示すステップは2つの方法でストリングを獲得
する。一つの方法は、所定の長さの全てのストリングを
発生し、次いで、各ストリングを語のリストと比較し、
これが語のうちの一つとして生ずる可能性があるかどう
かを測定する、という方法である。他の方法は、客語を
拡張して対応のストリングを獲得する、という方法であ
る。
する。一つの方法は、所定の長さの全てのストリングを
発生し、次いで、各ストリングを語のリストと比較し、
これが語のうちの一つとして生ずる可能性があるかどう
かを測定する、という方法である。他の方法は、客語を
拡張して対応のストリングを獲得する、という方法であ
る。
ボックス82におけるステップは、短い長さの全てのス
トリングを獲得することにより、これら2つの方法のう
ちの第1のものを開始する。例えば、1つまたは2の候
補識別子を有する全てのストリングが獲得される。ボッ
クス84におけるステップは、ボックス82において獲
得されたストリングの各々を取り扱う反復ループを開始
する。
トリングを獲得することにより、これら2つの方法のう
ちの第1のものを開始する。例えば、1つまたは2の候
補識別子を有する全てのストリングが獲得される。ボッ
クス84におけるステップは、ボックス82において獲
得されたストリングの各々を取り扱う反復ループを開始
する。
ボックス86における試験が、次のストリングが1つま
たは複数の語として生ずる可能性があるということを測
定した場合には、ボックス88において、このストリン
グ及びその対応の語がストリングのリストに追加される
。
たは複数の語として生ずる可能性があるということを測
定した場合には、ボックス88において、このストリン
グ及びその対応の語がストリングのリストに追加される
。
ボックス90におけるステップは、前述の2つの方法の
うちの第2のものを適用する反復ループを開始し、ボッ
クス80において受け取られたリスト内の客語を取り扱
う。ボックス92におけるステップは、次の語をストリ
ングのセット内に拡張し、そしてこれらストリングをリ
ストに追加し、前記語を各ストリングと関連させる。所
定のストリングが既に前記リスト上にある場合には、前
記語を前記リスト上のストリングの対応の語に追加する
ことができる。
うちの第2のものを適用する反復ループを開始し、ボッ
クス80において受け取られたリスト内の客語を取り扱
う。ボックス92におけるステップは、次の語をストリ
ングのセット内に拡張し、そしてこれらストリングをリ
ストに追加し、前記語を各ストリングと関連させる。所
定のストリングが既に前記リスト上にある場合には、前
記語を前記リスト上のストリングの対応の語に追加する
ことができる。
全ての語がこのようにして取り扱われたら、ボックス9
4におけるステップは、獲得されたストリングのリスト
を戻す。次いで、これらストリングを用い、後で詳述す
るように、第2A図及び第2B図におけるもののような
データ構造を生成させる。
4におけるステップは、獲得されたストリングのリスト
を戻す。次いで、これらストリングを用い、後で詳述す
るように、第2A図及び第2B図におけるもののような
データ構造を生成させる。
第5図は、第2A図及び第2B図におけるもののような
データ構造をどのようにして並列に使用することができ
るかを示すものである。第5図におけるシステム100
は2つの主な構成要素を含んでいる。即ち、候補ディス
クリミネータ102は、認識されるテキストまたは音声
に関する情報を受け取り、そして文字または音素候補識
別子を提供する。ストリングレコグナイザ104は、候
補識別子のストリングを認識し、そして、認識されたス
トリングに基づいて、テキストに対応する文字または音
素のストリングを提供する。前記並列のデータ構造はス
トリングリコグナイザ104内で使用される。
データ構造をどのようにして並列に使用することができ
るかを示すものである。第5図におけるシステム100
は2つの主な構成要素を含んでいる。即ち、候補ディス
クリミネータ102は、認識されるテキストまたは音声
に関する情報を受け取り、そして文字または音素候補識
別子を提供する。ストリングレコグナイザ104は、候
補識別子のストリングを認識し、そして、認識されたス
トリングに基づいて、テキストに対応する文字または音
素のストリングを提供する。前記並列のデータ構造はス
トリングリコグナイザ104内で使用される。
第5図に示すように、ストリングレコグナイザ104は
複数の認識装置を含んでいる。図にはその内の2つを示
しである。認識装置110及び120は、それぞれのプ
ロセッサ112及び122、ならびにそれぞれのサブセ
ットデータ構造114及び124を含んでいる。プロセ
ッサ112及び122は、各々が、候補ディスクリミネ
ータ102から候補識別子を受け取り、そしてそれぞれ
のサブセットデータ構造114または124にアクセス
するように、接続されている。従って、プロセソサ11
2及び122は、各々が、第3図に示すものと同様なス
テップを実施し、候補ディスクリ藁ネータ102から受
け取った候補識別子のストリングがそれぞれの候補識別
子ストリングのサブセットに存在しているかどうかを測
定する。
複数の認識装置を含んでいる。図にはその内の2つを示
しである。認識装置110及び120は、それぞれのプ
ロセッサ112及び122、ならびにそれぞれのサブセ
ットデータ構造114及び124を含んでいる。プロセ
ッサ112及び122は、各々が、候補ディスクリミネ
ータ102から候補識別子を受け取り、そしてそれぞれ
のサブセットデータ構造114または124にアクセス
するように、接続されている。従って、プロセソサ11
2及び122は、各々が、第3図に示すものと同様なス
テップを実施し、候補ディスクリ藁ネータ102から受
け取った候補識別子のストリングがそれぞれの候補識別
子ストリングのサブセットに存在しているかどうかを測
定する。
プロセッサ112及び122は、また、各々が、それら
の結果を結果プロセッサ130に提供するように接続さ
れている。結果プロセッサ130はデータ構造132に
アクセスし、認識装置からの結果に基づいて出力文字ま
たは音素を提供する際に該データ構造を助ける。
の結果を結果プロセッサ130に提供するように接続さ
れている。結果プロセッサ130はデータ構造132に
アクセスし、認識装置からの結果に基づいて出力文字ま
たは音素を提供する際に該データ構造を助ける。
第6図は、結果プロセッサ130が受け取った結果が、
第3A図のボックス48において提供されるような候補
ストリング番号、または音素ストリング番号を含んでい
る場合に、該プロセッサが従うことのできる一般的ステ
ップを示すものである。ボックス142において、結果
プロセッサ130は、候補ストリングのストリング番号
のような、前記結果内に生ずるストリング番号のうちの
一つを選択する。次いで、ボックス144において、前
記プロセッサはデータ構造132から対応の語を検索す
る。ボックス146において、前記プロセッサは、前記
語のうちの一つを選択し、この語の文字または音素を、
出力として、または次の処理のために、提供する。結果
プロセッサ130が、第3B図のボックス76において
提供されるような文字識別子のストリングを、または音
素識別子のストリングを受け取る場合には、ボックス1
46におけるステップのみが必要となる。
第3A図のボックス48において提供されるような候補
ストリング番号、または音素ストリング番号を含んでい
る場合に、該プロセッサが従うことのできる一般的ステ
ップを示すものである。ボックス142において、結果
プロセッサ130は、候補ストリングのストリング番号
のような、前記結果内に生ずるストリング番号のうちの
一つを選択する。次いで、ボックス144において、前
記プロセッサはデータ構造132から対応の語を検索す
る。ボックス146において、前記プロセッサは、前記
語のうちの一つを選択し、この語の文字または音素を、
出力として、または次の処理のために、提供する。結果
プロセッサ130が、第3B図のボックス76において
提供されるような文字識別子のストリングを、または音
素識別子のストリングを受け取る場合には、ボックス1
46におけるステップのみが必要となる。
以上、第1図ないし第6図について本発明のいくつかの
一般的特徴を示した。次に、どのようにして本発明を実
施することができるかについて詳細に説明する。
一般的特徴を示した。次に、どのようにして本発明を実
施することができるかについて詳細に説明する。
C1実施
本発明は種々の仕方で実施することができる。
以下、どのようにして本発明のいくつかの態様が実施さ
れるかの例について説明する。これには、ストリングの
セットを獲得するためのステップ、ストリングのセット
を指示するデータ構造を獲得するためのステップ、この
ようなデータ構造を探索ためのプロセッサの操作、及び
並列認識装置からの結果を取り扱うためのプロセッサの
操作を含む。並列認識装置に加え、更に、候補識別、探
索、及び結果処理のための単一直列プロセッサの使用に
ついて説明する。
れるかの例について説明する。これには、ストリングの
セットを獲得するためのステップ、ストリングのセット
を指示するデータ構造を獲得するためのステップ、この
ようなデータ構造を探索ためのプロセッサの操作、及び
並列認識装置からの結果を取り扱うためのプロセッサの
操作を含む。並列認識装置に加え、更に、候補識別、探
索、及び結果処理のための単一直列プロセッサの使用に
ついて説明する。
■1文字候補ストリングの獲得
前述した第4図は、文字候補ストリングのセットを獲得
する際に従うことのできる一般的ステップを示すもので
ある。第7図は、第4図のボックス86及び88におけ
るステップがどのようにして実施されるかを詳細に示す
ものであり、第8図は、第4図のボックス92における
ステップがどのようにして実施されるかを詳細に示すも
のである。
する際に従うことのできる一般的ステップを示すもので
ある。第7図は、第4図のボックス86及び88におけ
るステップがどのようにして実施されるかを詳細に示す
ものであり、第8図は、第4図のボックス92における
ステップがどのようにして実施されるかを詳細に示すも
のである。
第7図及び第8図におけるステップと類似のステップを
用いて音素候補ストリングを獲得することができる。こ
れは、図示のステップ変形し、テキスト、文字、文字型
、文字候補、及び文字候補型にではなしに、音声、音素
、音素型、音素候補、及び音素候補型に適用することに
よって、行なうことができる。
用いて音素候補ストリングを獲得することができる。こ
れは、図示のステップ変形し、テキスト、文字、文字型
、文字候補、及び文字候補型にではなしに、音声、音素
、音素型、音素候補、及び音素候補型に適用することに
よって、行なうことができる。
第7図におけるステップは、第4図のボックス82にお
いて獲得された短いストリングの各々に対して追従され
、第4図のボックス84における試験で始まる反復ルー
プを実施することができる。
いて獲得された短いストリングの各々に対して追従され
、第4図のボックス84における試験で始まる反復ルー
プを実施することができる。
ボックス160におけるステップは、現在取り扱われて
いる文字候補ストリングと等価の試行語のセットを獲得
する。このステップは経験データに基づいて行なうこと
ができ、この経験データは、各機械識別可能文字候補に
対し、出現することがありうるその文字型を指示すると
いうデータである。このデータを獲得するため、候補デ
ィスクリミネータを、正常操作においてこれが出会うで
あろうテキストと類似のテキストの代表的サンプルで試
験し、その識別可能文字候補型の各々として該ディスク
リミネータが認識する文字型の、及び各文字型に対する
文字候補型の記録を保持することができる。次いで、各
文字候補型に対する文字型の記録を文字型の小さいセッ
トに切り詰めることができる。この切り詰めは、この文
字候補型に対する高い頻度を持っている文字型、または
、この文字候補型が高い頻度を持っているという文字型
である文字型を選択することによって行なわれる。次い
で、取り扱い中のストリングにおける各文字候補に対す
る前記小さいセットの文字型を用い、このストリングと
して認識される可能性のある文字型の全ての組合せを獲
得することができ、そして、これら組合せは、ボックス
160において獲得される試行語のセットを形成する。
いる文字候補ストリングと等価の試行語のセットを獲得
する。このステップは経験データに基づいて行なうこと
ができ、この経験データは、各機械識別可能文字候補に
対し、出現することがありうるその文字型を指示すると
いうデータである。このデータを獲得するため、候補デ
ィスクリミネータを、正常操作においてこれが出会うで
あろうテキストと類似のテキストの代表的サンプルで試
験し、その識別可能文字候補型の各々として該ディスク
リミネータが認識する文字型の、及び各文字型に対する
文字候補型の記録を保持することができる。次いで、各
文字候補型に対する文字型の記録を文字型の小さいセッ
トに切り詰めることができる。この切り詰めは、この文
字候補型に対する高い頻度を持っている文字型、または
、この文字候補型が高い頻度を持っているという文字型
である文字型を選択することによって行なわれる。次い
で、取り扱い中のストリングにおける各文字候補に対す
る前記小さいセットの文字型を用い、このストリングと
して認識される可能性のある文字型の全ての組合せを獲
得することができ、そして、これら組合せは、ボックス
160において獲得される試行語のセットを形成する。
次いで、ボックス162におけるステップは、前記試行
語の各々を順々に取り扱う反復ループを開始する。ボッ
クス164における試験は、次の試行語が、第4図のボ
ックス80において獲得された語りスト上の語のうちの
一つであるかどうかを測定する。そうである場合には、
ボックス166におけるステップは、この試行語を、取
り扱い中の文字候補ストリングに対する語セットに追加
する。
語の各々を順々に取り扱う反復ループを開始する。ボッ
クス164における試験は、次の試行語が、第4図のボ
ックス80において獲得された語りスト上の語のうちの
一つであるかどうかを測定する。そうである場合には、
ボックス166におけるステップは、この試行語を、取
り扱い中の文字候補ストリングに対する語セットに追加
する。
全ての試行語がこのようにして取り扱われたら、ボック
ス170における試験は、取り扱い中の文字候補ストリ
ングに対する語セットが何らかの語を含んでいるかどう
かを測定する。含んでいない場合には、ステップ84に
おけるステップを行ない、次の文字候補ストリングを取
り扱うことができる。しかし、何らかの語が見つかった
場合には、ボックス84へ戻る前に、ボックス172に
おけるステップは、前記文字候補ストリング及びそのそ
れぞれの語セットを許容可能文字候補ストリングのリス
トに追加する。
ス170における試験は、取り扱い中の文字候補ストリ
ングに対する語セットが何らかの語を含んでいるかどう
かを測定する。含んでいない場合には、ステップ84に
おけるステップを行ない、次の文字候補ストリングを取
り扱うことができる。しかし、何らかの語が見つかった
場合には、ボックス84へ戻る前に、ボックス172に
おけるステップは、前記文字候補ストリング及びそのそ
れぞれの語セットを許容可能文字候補ストリングのリス
トに追加する。
第8図におけるステップは、第4図のボックス80にお
いて受け取られた語りスト上の語の各々に対して追従さ
れ、第4図のボックス90における試験で始まる反復ル
ープを実施する。
いて受け取られた語りスト上の語の各々に対して追従さ
れ、第4図のボックス90における試験で始まる反復ル
ープを実施する。
ボックス180におけるステップは、取り扱い中の語の
最初の文字で反復ループを開妬する。次いで、ボックス
182における試験は、現在考えている文字が、まだ適
用されてない何らかの候補等個物を有しているかどうか
を測定する。有している場合には、ボックス184にお
けるステップは次の等価候補識別子または識別子をスタ
ック上にロードする。
最初の文字で反復ループを開妬する。次いで、ボックス
182における試験は、現在考えている文字が、まだ適
用されてない何らかの候補等個物を有しているかどうか
を測定する。有している場合には、ボックス184にお
けるステップは次の等価候補識別子または識別子をスタ
ック上にロードする。
各文字に対する等価候補識別子は、ボックス184にお
ける検索に利用可能な適当するデータ構造に記憶される
。例えば、データ構造は各文字に対する連結リストを含
み、この連結リストは、この文字と等価の1つまたは複
数の候補識別子のセットを含む。複数の文字のシーケン
スと等価の候補識別子のセットは、このシーケンスの下
記の文字を指示するデータと一緒に、このシーケンス内
の最初の文字の連結リストに含まれる。
ける検索に利用可能な適当するデータ構造に記憶される
。例えば、データ構造は各文字に対する連結リストを含
み、この連結リストは、この文字と等価の1つまたは複
数の候補識別子のセットを含む。複数の文字のシーケン
スと等価の候補識別子のセットは、このシーケンスの下
記の文字を指示するデータと一緒に、このシーケンス内
の最初の文字の連結リストに含まれる。
ボックス182において文字が何らかの等個物を有して
いるかどうかを測定するに際し、行なわれる操作は、こ
の文字が先行文字の所定の等個物に対して取り扱われて
いたかどうかに応じて定まる。最初、この文字はこのよ
うな各等価物に対して取り扱われ、その連結リストはア
クセスされ、そして等価候補識別子の最初のセットは、
この連結リストの次の素子に対するポインタと一緒に、
スタック上にロードされる。
いるかどうかを測定するに際し、行なわれる操作は、こ
の文字が先行文字の所定の等個物に対して取り扱われて
いたかどうかに応じて定まる。最初、この文字はこのよ
うな各等価物に対して取り扱われ、その連結リストはア
クセスされ、そして等価候補識別子の最初のセットは、
この連結リストの次の素子に対するポインタと一緒に、
スタック上にロードされる。
次いで、同じ文字を取り扱ったら、スタックからのポイ
ンタを用い、連結リストから該文字の次の等個物を検索
する。そこで、このスタックは、少なくとも1回取り扱
われた語の各文字に対する位置を持つ。また、各スタッ
ク位置は、候補識別子の可能な最大大きさのセットに対
して持続することができる。
ンタを用い、連結リストから該文字の次の等個物を検索
する。そこで、このスタックは、少なくとも1回取り扱
われた語の各文字に対する位置を持つ。また、各スタッ
ク位置は、候補識別子の可能な最大大きさのセットに対
して持続することができる。
また、ダミー候補識別子を持つことが有用であり、この
ダ逅−候補識別子は、スタック内の文字の位置にロード
された場合、このスタックから識別子を読み出すときに
この位置はスキップされるべきことを指示する。連結リ
スト内の素子が複数の文字の識別子と等価である場合、
及び取り扱い中の語がこの識別子を含んでいる場合、ダ
ミー識別子を識別子内の第2及び後続の文字のスタック
位置にロードし、文字が現在文字であるというトラック
を保持する際の助けとすることができる。
ダ逅−候補識別子は、スタック内の文字の位置にロード
された場合、このスタックから識別子を読み出すときに
この位置はスキップされるべきことを指示する。連結リ
スト内の素子が複数の文字の識別子と等価である場合、
及び取り扱い中の語がこの識別子を含んでいる場合、ダ
ミー識別子を識別子内の第2及び後続の文字のスタック
位置にロードし、文字が現在文字であるというトラック
を保持する際の助けとすることができる。
等個物をボックス184においてスタックにロードした
のち、ボックス186における試験は、語が次の文字を
有し、この文字は、そのスタック位置が最後にロードさ
れたというものであるかどうかを測定する。さもない場
合には、この語の最後の文字に到達しており、そして、
第7図について前述したように、このスタック内の候補
識別子のストリングは、この語と一緒に、ストリング及
びそれらの語セットのリストに追加される。スタック内
の全てのダミー識別子はストリング読出しの際にスキッ
プされる。ストリングが既にリスト内にある場合には、
語はこのストリングの語セットに追加される。次いで、
ボックス182における試験が現在取り扱い中の文字に
対して繰り返され、この文字が他の等傷物を持っている
かどうかを調べる。
のち、ボックス186における試験は、語が次の文字を
有し、この文字は、そのスタック位置が最後にロードさ
れたというものであるかどうかを測定する。さもない場
合には、この語の最後の文字に到達しており、そして、
第7図について前述したように、このスタック内の候補
識別子のストリングは、この語と一緒に、ストリング及
びそれらの語セットのリストに追加される。スタック内
の全てのダミー識別子はストリング読出しの際にスキッ
プされる。ストリングが既にリスト内にある場合には、
語はこのストリングの語セットに追加される。次いで、
ボックス182における試験が現在取り扱い中の文字に
対して繰り返され、この文字が他の等傷物を持っている
かどうかを調べる。
ボックス186における試験が、スタック位置が最後の
ロードされたいう文字の後に次の文字があるということ
を測定した場合には、識別子のセットまたはダミー識別
子があってもなくとも、該次の文字は現在文字となる。
ロードされたいう文字の後に次の文字があるということ
を測定した場合には、識別子のセットまたはダミー識別
子があってもなくとも、該次の文字は現在文字となる。
その等傷物の連結リストの最初の素子は、ボックス18
2における試験が、これが等個物持っているということ
を測定した後に、ボックス184においてロードされる
。
2における試験が、これが等個物持っているということ
を測定した後に、ボックス184においてロードされる
。
同様に、ボックス182における試験が、文字の連結リ
スト内の最後の素子が到達されているということを測定
した場合、全ての前記文字の等傷物は適用されてしまっ
ている。この目的のため、各リンク内の最後の素子は、
これが最後の素子であって候補識別子を何も含んでいな
いということを指示する値を持つことができる。次いで
、ボックス190における試験は、語の最近接の先行文
字を見付ける。この先行文字は、そのスタック位置が、
ダミー識別子ではなしに候補識別子のセットを有してい
るという文字である。次いで、この先行文字は現在文字
となり、そして、ボックス182における試験は、該文
字が何らかの適用済み等傷物を持っているかどうかを測
定する。
スト内の最後の素子が到達されているということを測定
した場合、全ての前記文字の等傷物は適用されてしまっ
ている。この目的のため、各リンク内の最後の素子は、
これが最後の素子であって候補識別子を何も含んでいな
いということを指示する値を持つことができる。次いで
、ボックス190における試験は、語の最近接の先行文
字を見付ける。この先行文字は、そのスタック位置が、
ダミー識別子ではなしに候補識別子のセットを有してい
るという文字である。次いで、この先行文字は現在文字
となり、そして、ボックス182における試験は、該文
字が何らかの適用済み等傷物を持っているかどうかを測
定する。
ボックス190における試験が、候補識別子を持つ先行
スタック位置がないということを測定して場合には、全
ての文字の全ての等傷物は全ての組合せに適用されてし
まっている。従って、語は一杯に拡張されてしまってお
り、次の語はボックス90におけるステップへ戻ること
によって取り扱われるということになる。
スタック位置がないということを測定して場合には、全
ての文字の全ての等傷物は全ての組合せに適用されてし
まっている。従って、語は一杯に拡張されてしまってお
り、次の語はボックス90におけるステップへ戻ること
によって取り扱われるということになる。
即ち、第7図及び第8図のステップは、受容可能語のセ
ットからの対応語を持つストリングのリストを提供する
。
ットからの対応語を持つストリングのリストを提供する
。
2、サブセットデータ構造
第5図における認識装置の各々は第4図、第7図及び第
8図に示すように、獲得された文字または音素候補スト
リングのリストに基づくことのできるサブセットデータ
構造を含んでいる。第9図は、第5図におけるような並
列認識装置に用いるためにどのようにしてサブセットデ
ータ構造のグループを作ることができるかを示すもので
ある。
8図に示すように、獲得された文字または音素候補スト
リングのリストに基づくことのできるサブセットデータ
構造を含んでいる。第9図は、第5図におけるような並
列認識装置に用いるためにどのようにしてサブセットデ
ータ構造のグループを作ることができるかを示すもので
ある。
第9図におけるステップはいくつかの反復ループを含ん
でいる。最外側のループは、候補ディスクリ藁ネータを
調整し、これが適切なセットの文字または音素候補型を
識別することのできるようにする。中間及び最内側のル
ープは、ともに、適当する全ての候補等価データ構造を
複数の語りストの各々に適用し、サブセットデータ構造
が基礎としているストリングのリストを獲得する。他の
内側ループが設けられ、ストリングのリストの手動修正
ができるようになっている。
でいる。最外側のループは、候補ディスクリ藁ネータを
調整し、これが適切なセットの文字または音素候補型を
識別することのできるようにする。中間及び最内側のル
ープは、ともに、適当する全ての候補等価データ構造を
複数の語りストの各々に適用し、サブセットデータ構造
が基礎としているストリングのリストを獲得する。他の
内側ループが設けられ、ストリングのリストの手動修正
ができるようになっている。
ボックス200におけるステップは前記中間ループを開
始し、これは語りストの各々に対して繰り返される。ボ
ックス202におけるステップは、同様に、内側ループ
を開始する。これは、取り扱い中の語りストに適当する
等価候補識別子を持つ各ブタ−構造に対して繰り返され
る。ボックス204におけるステップは、第4図、第7
図及び第8図におけるように、等傷物のデータ構造のう
ちの一つを現在語リストに適用してストリングのリスト
を獲得する。
始し、これは語りストの各々に対して繰り返される。ボ
ックス202におけるステップは、同様に、内側ループ
を開始する。これは、取り扱い中の語りストに適当する
等価候補識別子を持つ各ブタ−構造に対して繰り返され
る。ボックス204におけるステップは、第4図、第7
図及び第8図におけるように、等傷物のデータ構造のう
ちの一つを現在語リストに適用してストリングのリスト
を獲得する。
中間ループ内で取り扱われる種々の語りストは、例えば
、各品詞に対する語りスト、複数の言語の各々に対する
語りスト、複数の話者または著者の各々に対する語りス
ト、略語及び固有名詞に対する特殊な語りスト、複数の
専門用語集の各々に対する語りスト、全部が小文字の語
または最初の大文字付きの語に対する異なる語りスト、
及び他の全ての適当するリストまたは語のセットに対す
るその他のものを含んでいる。テキスト認識のための等
傷物のデータ構造は複数のフォントまたは書体の各々に
対する等傷物を含み、これらには、斜字体、太字体、下
線付き、重ね打ち、等がある。
、各品詞に対する語りスト、複数の言語の各々に対する
語りスト、複数の話者または著者の各々に対する語りス
ト、略語及び固有名詞に対する特殊な語りスト、複数の
専門用語集の各々に対する語りスト、全部が小文字の語
または最初の大文字付きの語に対する異なる語りスト、
及び他の全ての適当するリストまたは語のセットに対す
るその他のものを含んでいる。テキスト認識のための等
傷物のデータ構造は複数のフォントまたは書体の各々に
対する等傷物を含み、これらには、斜字体、太字体、下
線付き、重ね打ち、等がある。
テキスト認識のための等傷物の各データ構造において、
各文字の大文字及び小文字は等傷物の別々のリストを持
つ。
各文字の大文字及び小文字は等傷物の別々のリストを持
つ。
ストリングの全てのリストが獲得されたら、ボックス2
06におけるステップは試行テキストとまたは話された
語を候補ディスクリミネータに加え、次いでその結果の
候補識別子をリストに加える。このリストからの結果は
、ボックス210において、誤りを見付けるために正し
い結果と比較される。
06におけるステップは試行テキストとまたは話された
語を候補ディスクリミネータに加え、次いでその結果の
候補識別子をリストに加える。このリストからの結果は
、ボックス210において、誤りを見付けるために正し
い結果と比較される。
ボックス210において誤りが見つかった場合は、ボッ
クス212におけるステップは、文字または音素候補型
のセットを修正することによって誤りの全てが補正可能
になるかどうかに基づいて分岐する。修正可能になる場
合には、ボックス214におけるステップは型の数を適
当に増加または減少する。例えば、誤りが、2つの機械
識別可能文字または音素を同じ候補型として常に扱うも
のである場合には、この候補型を2つの型に分割するこ
とによって型の数を増加させることができる。これと逆
に、誤りが、識別する必要のない文字または音素の2つ
の形式を常に識別するものである場合には、型の数を減
少させることができ、唯1つの型が両方の形式を包含す
ることになる。
クス212におけるステップは、文字または音素候補型
のセットを修正することによって誤りの全てが補正可能
になるかどうかに基づいて分岐する。修正可能になる場
合には、ボックス214におけるステップは型の数を適
当に増加または減少する。例えば、誤りが、2つの機械
識別可能文字または音素を同じ候補型として常に扱うも
のである場合には、この候補型を2つの型に分割するこ
とによって型の数を増加させることができる。これと逆
に、誤りが、識別する必要のない文字または音素の2つ
の形式を常に識別するものである場合には、型の数を減
少させることができ、唯1つの型が両方の形式を包含す
ることになる。
型が変形されたら、ボックス216におけるステップは
、これに従って、等傷物のデータ構造を変形する。次い
で、この変形済みデータ構造を、ボックス200におけ
るステップで始まる反復ループにおいて用いることがで
きる。
、これに従って、等傷物のデータ構造を変形する。次い
で、この変形済みデータ構造を、ボックス200におけ
るステップで始まる反復ループにおいて用いることがで
きる。
候補型を変更することが適当でない場合には、ボックス
220におけるステップは、誤りを除去するのに適当す
るようにリスト自体を補正する。
220におけるステップは、誤りを除去するのに適当す
るようにリスト自体を補正する。
例えば、語が、該語に頻繁に整合するストリングに対す
る語セット内にない場合には、この語をこのストリング
に対する語セットに追加する、等である。次いで、ボッ
クス206におけるステップを、この変形済みリストで
繰り返す。
る語セット内にない場合には、この語をこのストリング
に対する語セットに追加する、等である。次いで、ボッ
クス206におけるステップを、この変形済みリストで
繰り返す。
ボックス210,212.214及び220におけるス
テップは、ある程度まで、自動的に行なうことができる
が、熟練した操作員が手動でこれらステップを行なうの
がより効果的である。熟練操作員は、例えば、どの誤り
を補正すべきか、及びどの誤りは補正しないでおくほう
がよいか、についての適切な判断を下すことができる。
テップは、ある程度まで、自動的に行なうことができる
が、熟練した操作員が手動でこれらステップを行なうの
がより効果的である。熟練操作員は、例えば、どの誤り
を補正すべきか、及びどの誤りは補正しないでおくほう
がよいか、についての適切な判断を下すことができる。
補正すべき誤りがもはやなくなったら、ボックス222
におけるステップは、各リストを、サブセットデータ構
造として用いられるように、ROMのような永久メモリ
に、または他の適当するメモリ装置に記憶させる。ボッ
クス222におけるこの記憶ステップは適当する任意の
方法で行なうことができ、この方法としては第2A図及
び第2B図において示唆されている2つの異なる方法が
ある。
におけるステップは、各リストを、サブセットデータ構
造として用いられるように、ROMのような永久メモリ
に、または他の適当するメモリ装置に記憶させる。ボッ
クス222におけるこの記憶ステップは適当する任意の
方法で行なうことができ、この方法としては第2A図及
び第2B図において示唆されている2つの異なる方法が
ある。
ボックス222における記憶ステップは、前に掲げ且つ
本明細書において参照として内容を説明しであるアベル
(Appel )及びジャコブソン(Jacobson
)の論文に記載しである仕方で、ストリングの各リス
トを用いて提示されたグラフデータ構造を生成すること
によって実施することができ、各リスト上のストリング
の始まりにある冗長候補識別子を崩壊させる。次いで、
各リストに対する指示されたグラフは通例の方法を用い
て最小化され、ストリングの終わりにある冗長候補識別
子が除去される。アペル及びジャコブソンの論文に記載
されているように、この最少化された指示されたグラフ
データ構造は辺または遷移のアレイとして記憶される。
本明細書において参照として内容を説明しであるアベル
(Appel )及びジャコブソン(Jacobson
)の論文に記載しである仕方で、ストリングの各リス
トを用いて提示されたグラフデータ構造を生成すること
によって実施することができ、各リスト上のストリング
の始まりにある冗長候補識別子を崩壊させる。次いで、
各リストに対する指示されたグラフは通例の方法を用い
て最小化され、ストリングの終わりにある冗長候補識別
子が除去される。アペル及びジャコブソンの論文に記載
されているように、この最少化された指示されたグラフ
データ構造は辺または遷移のアレイとして記憶される。
第2B図におけるもののようなデータ構造を作るため、
ξ−り一型順序回路方法としても知られている有限状態
変換器方法を適用することができる。対のリストの各々
に対してチェーン変換器を作ることができ、各月は、リ
スト上のストリング、及びこのストリングの語セットか
らの語を含んでいる。次いで、これらチェーン変換器の
結合体を用い、共通開始状態を持つデータ構造を作るこ
とができる。次いで、このデータ構造を決定性化及び最
少化し、記憶すべきデータ構造を獲得することができる
。要すればニブシロンをこのチェーン変換器に追加する
。しかし、その結果のデータ構造は、ニブシロンによっ
て決定性または最少となるとは限らない。
ξ−り一型順序回路方法としても知られている有限状態
変換器方法を適用することができる。対のリストの各々
に対してチェーン変換器を作ることができ、各月は、リ
スト上のストリング、及びこのストリングの語セットか
らの語を含んでいる。次いで、これらチェーン変換器の
結合体を用い、共通開始状態を持つデータ構造を作るこ
とができる。次いで、このデータ構造を決定性化及び最
少化し、記憶すべきデータ構造を獲得することができる
。要すればニブシロンをこのチェーン変換器に追加する
。しかし、その結果のデータ構造は、ニブシロンによっ
て決定性または最少となるとは限らない。
ストリングに整合したときにストリング識別子または他
の関連データを獲得するための一つの方法は、データ構
造内にあって、ストリングが整合されたときに検索でき
るようになっているデータを含むことである。また、語
りストを整列させて記憶するための通例の方法を用い、
ストリングのリストを単にリストとして記憶することも
可能であり、この場合、各ストリングを識別する番号は
、単に、リスト内のストリングを通って計数することに
よって獲得することができる。ハツシュ表のような、他
の多くの通例の方法があり、また、任意の適当する方法
であってもよい。
の関連データを獲得するための一つの方法は、データ構
造内にあって、ストリングが整合されたときに検索でき
るようになっているデータを含むことである。また、語
りストを整列させて記憶するための通例の方法を用い、
ストリングのリストを単にリストとして記憶することも
可能であり、この場合、各ストリングを識別する番号は
、単に、リスト内のストリングを通って計数することに
よって獲得することができる。ハツシュ表のような、他
の多くの通例の方法があり、また、任意の適当する方法
であってもよい。
探索を促進することが望ましい場合には、各候補識別子
で始まる最初のストリングの始まりを、各アクセス点で
探索を始めるのに必要なデータを含むアクセス表をもっ
て、アクセス点として処理することができる。このアク
セス表はまた、メモリに記憶されているデータ構造内に
含むことができる。
で始まる最初のストリングの始まりを、各アクセス点で
探索を始めるのに必要なデータを含むアクセス表をもっ
て、アクセス点として処理することができる。このアク
セス表はまた、メモリに記憶されているデータ構造内に
含むことができる。
メモリに記憶されているデータ構造は、第3A図及び第
3B図について上述した仕方で探索することができる。
3B図について上述した仕方で探索することができる。
記憶されるべきサブセットデータ構造を作る際に追従さ
れるステップは、大きな程度まで、これを探索する際の
探索プロセッサによって追従されるステップを決定する
。
れるステップは、大きな程度まで、これを探索する際の
探索プロセッサによって追従されるステップを決定する
。
第5図に示すように、並列処理の結果プロセッサは複数
の探索プロセッサから並列に結果を受け取ることができ
る。従って、結果を戻す際に、各探索プロセッサは、ど
の探索プロセッサが値の器源であるかを識別し、及び候
補ディスクリミネータ102からのストリングのシーケ
ンスないのどのストリングがこの値に対応するかを指示
する追加のデータを提供する。各探索プロセッサは候補
識別器から受け取ったストリングのバッファを管理する
ことができ、この操作は、受け取られたストリングの実
行計数を保持することを含むことができ、従って、この
実行計数を提供して現在ストリングを提示することがで
きる。
の探索プロセッサから並列に結果を受け取ることができ
る。従って、結果を戻す際に、各探索プロセッサは、ど
の探索プロセッサが値の器源であるかを識別し、及び候
補ディスクリミネータ102からのストリングのシーケ
ンスないのどのストリングがこの値に対応するかを指示
する追加のデータを提供する。各探索プロセッサは候補
識別器から受け取ったストリングのバッファを管理する
ことができ、この操作は、受け取られたストリングの実
行計数を保持することを含むことができ、従って、この
実行計数を提供して現在ストリングを提示することがで
きる。
次に、並列処理の結果プロセッサについて詳細に説明す
る。
る。
3、並列認識装置のための結果プロセッサ第6図に示す
一般的ステップのほかに、結果プロセッサは並列認識装
置の操作に関する他の機能を行なうことができる。第1
0図は、結果プロセッサと他の若干の並列処理の構成素
子との間の接続を示すものである。第11図は、認識済
み文字または音素のストリームを提供する際に、このよ
うな処理の結果プロセッサが行なうことのできるステッ
プを示すものである。第12図及び第13図は、候補デ
ィスクリミネータまたは認識装置からの割込みに応答し
て結果プロセッサが追従することのできるステップを示
すものである。
一般的ステップのほかに、結果プロセッサは並列認識装
置の操作に関する他の機能を行なうことができる。第1
0図は、結果プロセッサと他の若干の並列処理の構成素
子との間の接続を示すものである。第11図は、認識済
み文字または音素のストリームを提供する際に、このよ
うな処理の結果プロセッサが行なうことのできるステッ
プを示すものである。第12図及び第13図は、候補デ
ィスクリミネータまたは認識装置からの割込みに応答し
て結果プロセッサが追従することのできるステップを示
すものである。
第10図における結果プロセッサ320は、候補ディス
クリミネータ322からの割込み信号を受け取るように
接続されている。この信号は、弁別器322がストリン
グの終わりを検出し、そしてこのストリングの候補識別
子を認識装置に提供しようとしている、ということを指
示する。この信号はまた、候補弁別器322が、認識装
置に対するその出力端子において、新しい候補識別子を
提供し始めたということを指示する。このようなデータ
が全ての認識装置によって受け取られると、結果プロセ
ッサ320は解除信号をディスクリミネータ322に与
える。
クリミネータ322からの割込み信号を受け取るように
接続されている。この信号は、弁別器322がストリン
グの終わりを検出し、そしてこのストリングの候補識別
子を認識装置に提供しようとしている、ということを指
示する。この信号はまた、候補弁別器322が、認識装
置に対するその出力端子において、新しい候補識別子を
提供し始めたということを指示する。このようなデータ
が全ての認識装置によって受け取られると、結果プロセ
ッサ320は解除信号をディスクリミネータ322に与
える。
第10図は、認識装置330及び340に接続された結
果プロセッサ320を示すものである。
果プロセッサ320を示すものである。
認識装置330はプロセッサ332及び確率データ構造
334を含んでいる。テキスト認識のため、確率データ
構造334は、各文字候補型の文字確率を指示するデー
タを記憶するすることができる。
334を含んでいる。テキスト認識のため、確率データ
構造334は、各文字候補型の文字確率を指示するデー
タを記憶するすることができる。
これについては、係属中の米国特許出願第07/442
7.147号に記載されており、その内容は参照として
本明細書において説明する。他方、認識装置340は、
第5図について前述した型の複数の並列認識装置のうち
の一つであり、探索プロセッサ342及びサブセットデ
ータ構造344を含んでいる。
7.147号に記載されており、その内容は参照として
本明細書において説明する。他方、認識装置340は、
第5図について前述した型の複数の並列認識装置のうち
の一つであり、探索プロセッサ342及びサブセットデ
ータ構造344を含んでいる。
結果プロセッサ320は各認識装置との複数の接続部を
有す。各認識装置は結果プロセッサ320に対する割込
み線を有す。この割り込みを用い、認識装置のプロセッ
サが、全ての認識装置に及び結果プロセッサ320に接
続されて結果バス上で結果を提供する準備ができている
、ということを指示することができる。このプロセッサ
はまたこのバスを制御することができる。結果プロセン
サ320は、また、各認識装置に対する複数の制御線を
有しており、認識装置のプロセッサに割込んでディスク
リミネータ322からデータを受け取るための回線、全
ての認識装置が操作を開始することができるストリング
の一連番号を提供するための回線、各認識装置のプロセ
ッサが一連番号を読み取り、そして該プロセッサがまだ
これに到達していない場合に対応のストリングへ進むよ
うに該プロセッサに割込むための回線、及び各プロセッ
サへ信号を送ってその結果を結果バス上で提供し、そし
てその結果が結果プロセッサ320によって受け取られ
たという信号を送るための回線を含んでいる。
有す。各認識装置は結果プロセッサ320に対する割込
み線を有す。この割り込みを用い、認識装置のプロセッ
サが、全ての認識装置に及び結果プロセッサ320に接
続されて結果バス上で結果を提供する準備ができている
、ということを指示することができる。このプロセッサ
はまたこのバスを制御することができる。結果プロセン
サ320は、また、各認識装置に対する複数の制御線を
有しており、認識装置のプロセッサに割込んでディスク
リミネータ322からデータを受け取るための回線、全
ての認識装置が操作を開始することができるストリング
の一連番号を提供するための回線、各認識装置のプロセ
ッサが一連番号を読み取り、そして該プロセッサがまだ
これに到達していない場合に対応のストリングへ進むよ
うに該プロセッサに割込むための回線、及び各プロセッ
サへ信号を送ってその結果を結果バス上で提供し、そし
てその結果が結果プロセッサ320によって受け取られ
たという信号を送るための回線を含んでいる。
結果プロセッサ320はまた複数のデータ構造にアクセ
スすることができ、このデータ構造の若干を第10図に
示す。ストリング番号/語データ構造350に、認識装
置の一つからのストリング番号でアクセスし、このスト
リングまたはこのストリングに関する他のデータを獲得
することができる。第2B図に示すデータ構造で可能で
あるように、各サブセットデータ構造が整合済みストリ
ングとに対する語セットを提供するならば、データ構造
350は必要でない。最近語キャッシュ352は最近に
認識された語のキャッシュであり、あいまいな語を解明
する際に結果プロセッサ320を助けることができる。
スすることができ、このデータ構造の若干を第10図に
示す。ストリング番号/語データ構造350に、認識装
置の一つからのストリング番号でアクセスし、このスト
リングまたはこのストリングに関する他のデータを獲得
することができる。第2B図に示すデータ構造で可能で
あるように、各サブセットデータ構造が整合済みストリ
ングとに対する語セットを提供するならば、データ構造
350は必要でない。最近語キャッシュ352は最近に
認識された語のキャッシュであり、あいまいな語を解明
する際に結果プロセッサ320を助けることができる。
品詞規則354は、結果プロセッサ320が、また、あ
いまいな語を解明するために適用することができる、と
いう規則である。
いまいな語を解明するために適用することができる、と
いう規則である。
第11図におけるステップは、第10図に示すもののよ
うな認識装置からの結果に基づいて文字または音素のス
トリームを提供する際に結果プロセッサ320が行なう
操作を示すものである。第11図は、候補ディスクリミ
ネータ322からのストリングのうちの一つのものの結
果に基づいて行なわれるステップを示すものである。後
で説明するように、各ストリングに対する結果はそれぞ
れのデータ構造にロートドされ、そして、バックグラウ
ンド処理が各結果データ構造を検査し、これが十分なデ
ータを含んでいるかどうかを測定することができる。含
んでいる場合には、バンクグラウンド処理はこのデータ
構造に対して第11図におけるステップを開始すること
ができる。第11図におけるステップは、語の文字また
は音素を出力データ構造にロードすることを含んでいる
。
うな認識装置からの結果に基づいて文字または音素のス
トリームを提供する際に結果プロセッサ320が行なう
操作を示すものである。第11図は、候補ディスクリミ
ネータ322からのストリングのうちの一つのものの結
果に基づいて行なわれるステップを示すものである。後
で説明するように、各ストリングに対する結果はそれぞ
れのデータ構造にロートドされ、そして、バックグラウ
ンド処理が各結果データ構造を検査し、これが十分なデ
ータを含んでいるかどうかを測定することができる。含
んでいる場合には、バンクグラウンド処理はこのデータ
構造に対して第11図におけるステップを開始すること
ができる。第11図におけるステップは、語の文字また
は音素を出力データ構造にロードすることを含んでいる
。
従って、他のバックグラウンド処理は、適切な時に、文
字または音素が出力データ構造から提供されるかどうか
を検査することができ、提供される場合には、ストリー
ム内の文字または音素を出力として提供する。
字または音素が出力データ構造から提供されるかどうか
を検査することができ、提供される場合には、ストリー
ム内の文字または音素を出力として提供する。
第11図におけるステップが結果データ構造に対して開
始されると、ボックス370におけるステップは、スト
リング整合に成功した認識装置の番号に基づいて分岐す
る。これは、認識装置から受け取られたストリング識別
子の番号に基づくことができるが、または、各認識装置
が、単に、該装置がストリング整合に成功したかどうか
を指示する信号を提供する。
始されると、ボックス370におけるステップは、スト
リング整合に成功した認識装置の番号に基づいて分岐す
る。これは、認識装置から受け取られたストリング識別
子の番号に基づくことができるが、または、各認識装置
が、単に、該装置がストリング整合に成功したかどうか
を指示する信号を提供する。
受け取られた結果の全てがストリング整合の失敗を指示
する場合には、ボックス372におけるステップは、認
識装置330から獲得された確率を用い、認識中のスト
リングに対する最確の文字または音素を決定する。ボッ
クス372におけるステップは、その結果得られた文字
または音素を、受容可能語のリストと、及び受容不能語
のリストと比較することを含むことができる。これは、
また、通例の方法にしたがって、所定の位置に対する複
数の可能性ある文字または音素を考慮することを含むこ
とができる。次いで、ボックス374におけるステップ
は、その結果得られた文字または音素を、テキスト内の
現在ストリング位置に対応する位置にある出力データ構
造内にロードする。
する場合には、ボックス372におけるステップは、認
識装置330から獲得された確率を用い、認識中のスト
リングに対する最確の文字または音素を決定する。ボッ
クス372におけるステップは、その結果得られた文字
または音素を、受容可能語のリストと、及び受容不能語
のリストと比較することを含むことができる。これは、
また、通例の方法にしたがって、所定の位置に対する複
数の可能性ある文字または音素を考慮することを含むこ
とができる。次いで、ボックス374におけるステップ
は、その結果得られた文字または音素を、テキスト内の
現在ストリング位置に対応する位置にある出力データ構
造内にロードする。
複数の認識装置がストリングの成功的整合を指示した場
合には、ボックス376におけるステップがストリング
を分解して単一ストリングを獲得する。第10図の処理
において、これは、成功を指示した認識装置から、また
は各整合済みストリング番号でストリング番号/語デー
タ構造350にアクセスすることによって、各整合済み
ストリングに対する語セットを先ず獲得することによっ
て行なわれる。次いで、これら語セットを比較し、スト
リングが同じ語セットを有しているかどうかを測定する
。有している場合には、全てのストリングを用いること
ができる。ストリングが同じ語セットを有していない場
合には、ボックス376におけるステップは全ての利用
可能情報を用いてこれらストリングを分解することがで
きる。各最近認識済み語の品詞を指示する最近語キャッ
シュ352からのデータに基づき、及び品詞規則354
に基づいて、ボックス376におけるステップは、どの
品詞がテキスト内の現在ストリング位置に適正に当ては
まるかを測定し、次いで、この品詞に対応する認識装置
からの結果を選択することができる。この手続きを、現
在ストリングの文脈に基づいて解決が得られるまで、ま
わりのストリングが分解される回数だけ繰り返す。同様
に、最近認識済み語の言語または専門用語集を指示する
最近語キャッシュからのデータを用い、この言語または
専門用語集に対応する認識装置からの結果を選択するこ
とができる。文の始まりまたは終わりが識別されたら、
ボックス376におけるステップは、この突内の現在ス
トリング位置に対する適切な格を持つ語に対応する認識
装置からの結果を選択することができる。また、認識装
置330からの確率データを用い、どのストリング番号
が、最確であってまた考慮に入れることのできる対応の
語を有しているかを測定することができる。
合には、ボックス376におけるステップがストリング
を分解して単一ストリングを獲得する。第10図の処理
において、これは、成功を指示した認識装置から、また
は各整合済みストリング番号でストリング番号/語デー
タ構造350にアクセスすることによって、各整合済み
ストリングに対する語セットを先ず獲得することによっ
て行なわれる。次いで、これら語セットを比較し、スト
リングが同じ語セットを有しているかどうかを測定する
。有している場合には、全てのストリングを用いること
ができる。ストリングが同じ語セットを有していない場
合には、ボックス376におけるステップは全ての利用
可能情報を用いてこれらストリングを分解することがで
きる。各最近認識済み語の品詞を指示する最近語キャッ
シュ352からのデータに基づき、及び品詞規則354
に基づいて、ボックス376におけるステップは、どの
品詞がテキスト内の現在ストリング位置に適正に当ては
まるかを測定し、次いで、この品詞に対応する認識装置
からの結果を選択することができる。この手続きを、現
在ストリングの文脈に基づいて解決が得られるまで、ま
わりのストリングが分解される回数だけ繰り返す。同様
に、最近認識済み語の言語または専門用語集を指示する
最近語キャッシュからのデータを用い、この言語または
専門用語集に対応する認識装置からの結果を選択するこ
とができる。文の始まりまたは終わりが識別されたら、
ボックス376におけるステップは、この突内の現在ス
トリング位置に対する適切な格を持つ語に対応する認識
装置からの結果を選択することができる。また、認識装
置330からの確率データを用い、どのストリング番号
が、最確であってまた考慮に入れることのできる対応の
語を有しているかを測定することができる。
1つのストリングしか整合しなかった場合、またはボッ
クス376におけるステップが分解の結果としてのスト
リングを提供する場合、ボックス380におけるステッ
プはこのストリングの語セット内の語数に基づいて分岐
する。前述したように、この語セットは、ストリング番
号/語データ構造350から検索され、または認識装置
から受け取られる。
クス376におけるステップが分解の結果としてのスト
リングを提供する場合、ボックス380におけるステッ
プはこのストリングの語セット内の語数に基づいて分岐
する。前述したように、この語セットは、ストリング番
号/語データ構造350から検索され、または認識装置
から受け取られる。
語セブトが複数の語を含んでいる場合には、ボックス3
82におけるステップはこの語を分解して単一語を獲得
する。この語は、最近語キャッシュ352からのデータ
に基づいて選択され、最も頻繁に出現し且つ最も最近に
選択された語とともに、どのように最近に且つどのよう
に頻繁に語が出現したかを示す。これが語を分解しない
場合には、認識装置330からの確率データを用い、ど
の語が最確であるかを測定する。
82におけるステップはこの語を分解して単一語を獲得
する。この語は、最近語キャッシュ352からのデータ
に基づいて選択され、最も頻繁に出現し且つ最も最近に
選択された語とともに、どのように最近に且つどのよう
に頻繁に語が出現したかを示す。これが語を分解しない
場合には、認識装置330からの確率データを用い、ど
の語が最確であるかを測定する。
語セットが1つの語しか有していない場合、または分解
済み語がボックス382におけるステップによって提供
される場合には、ボックス384におけるステップは、
この語を最近語キャッシュ352内にロードし、且つこ
の語の文字または音素を現在ストリングの位置にある出
力データ構造内にロードする。この語が既にキャッシュ
352内にある場合には、ボ・ノクス384におけるス
テップはこのキャッシュ内にあるそのデータを更新する
ことができる。
済み語がボックス382におけるステップによって提供
される場合には、ボックス384におけるステップは、
この語を最近語キャッシュ352内にロードし、且つこ
の語の文字または音素を現在ストリングの位置にある出
力データ構造内にロードする。この語が既にキャッシュ
352内にある場合には、ボ・ノクス384におけるス
テップはこのキャッシュ内にあるそのデータを更新する
ことができる。
最後に、現在ストリングに関するデータが既に出力デー
タ構造内にロードされている場合には、ボックス386
におけるステップは、認識装置が、候補ディスクリミネ
ータ322から受け取られる次のストリングへ進むこと
を確実にする。第11図におけるステップを、全ての認
識装置が所定のストリングに対するそれらの結果を提供
する前に開始させることができる場合には、ボックス3
86におけるステップは、全ての先行ストリングに対す
る文字または音素が出力データ構造内にロードされてい
たかどうかを検査し、ロードされていない場合には、こ
のステップを省くことができる。
タ構造内にロードされている場合には、ボックス386
におけるステップは、認識装置が、候補ディスクリミネ
ータ322から受け取られる次のストリングへ進むこと
を確実にする。第11図におけるステップを、全ての認
識装置が所定のストリングに対するそれらの結果を提供
する前に開始させることができる場合には、ボックス3
86におけるステップは、全ての先行ストリングに対す
る文字または音素が出力データ構造内にロードされてい
たかどうかを検査し、ロードされていない場合には、こ
のステップを省くことができる。
このステップが適切である場合には、各認識装置内のプ
ロセッサを制御することによって前記ステップを行ない
、次のストリングに未だ到達していない全てのプロセッ
サがその現在操作を停止し、そして次のストリングで開
始するようにすることができる。
ロセッサを制御することによって前記ステップを行ない
、次のストリングに未だ到達していない全てのプロセッ
サがその現在操作を停止し、そして次のストリングで開
始するようにすることができる。
第12図及び第13図は、第11図に示すもののような
割り込みに応答して結果プロセッサ320が行なう操作
を示すものである。第12図は候補ディスクリミネータ
322からの割り込みを取り扱うステップを示す。第1
3図は、認識装置の一つからの割り込みを取り扱うステ
ップを示す。
割り込みに応答して結果プロセッサ320が行なう操作
を示すものである。第12図は候補ディスクリミネータ
322からの割り込みを取り扱うステップを示す。第1
3図は、認識装置の一つからの割り込みを取り扱うステ
ップを示す。
第12におけるステップは、ボックス410において、
候補ディスクリミネータ322から割り込みを受け取る
と始まる。この割り込みは、候補ディスクリミネータ3
22が認識装置に対するその出力端子においてデータを
提供していることを指示する。これに応答して、結果プ
ロセッサ320は、ボックス412において、割り込み
を認識装置へ送り、これに応答して、各認識装置は、候
補ディスクリミネータ322のよって提供されるデータ
を検索し、そして、これを、現在受け取り中のストリン
グを定義している、前に受け取られたデータに含ませる
。このデータが、ストリングの終わりが到達されている
ということを指示する場合には、各認識装置は、このス
トリングを、認識すべきストリングの待ち行列に追加し
、そして、候補ディスクリ累ネータ322が再びデータ
を提供するときに新しいストリングを受け取る準備をす
ることができる。データを成功的に検索したら、認識装
置は、ボックス414において、底切を指示する信号を
結果プロセッサ320へ送る。次いで、結果プロセッサ
320は、ボックス416において、解除信号を候補デ
ィスクリミネータ322へ送り、その後、候補ディスク
リミネータ322はその操作を継続し、その出力端子に
おいて更に他のデータを提供することができる。
候補ディスクリミネータ322から割り込みを受け取る
と始まる。この割り込みは、候補ディスクリミネータ3
22が認識装置に対するその出力端子においてデータを
提供していることを指示する。これに応答して、結果プ
ロセッサ320は、ボックス412において、割り込み
を認識装置へ送り、これに応答して、各認識装置は、候
補ディスクリミネータ322のよって提供されるデータ
を検索し、そして、これを、現在受け取り中のストリン
グを定義している、前に受け取られたデータに含ませる
。このデータが、ストリングの終わりが到達されている
ということを指示する場合には、各認識装置は、このス
トリングを、認識すべきストリングの待ち行列に追加し
、そして、候補ディスクリ累ネータ322が再びデータ
を提供するときに新しいストリングを受け取る準備をす
ることができる。データを成功的に検索したら、認識装
置は、ボックス414において、底切を指示する信号を
結果プロセッサ320へ送る。次いで、結果プロセッサ
320は、ボックス416において、解除信号を候補デ
ィスクリミネータ322へ送り、その後、候補ディスク
リミネータ322はその操作を継続し、その出力端子に
おいて更に他のデータを提供することができる。
第13図におけるステップは、ボックス430において
、認識装置の一つからの割り込みを受け取ると開始する
。この割り込みは、認識装置が結果バス上に結果を提供
しようとしているということを指示する。これに応答し
て、結果プロセッサ320は、ボックス432において
その結果を提供するということの信号を認識装置に送る
。結果プロセッサ320は、前記認識装置に信号を送る
のを、1つまたは複数の他の認識装置がそれらの結果を
提供するのを終わるまで、延期している。
、認識装置の一つからの割り込みを受け取ると開始する
。この割り込みは、認識装置が結果バス上に結果を提供
しようとしているということを指示する。これに応答し
て、結果プロセッサ320は、ボックス432において
その結果を提供するということの信号を認識装置に送る
。結果プロセッサ320は、前記認識装置に信号を送る
のを、1つまたは複数の他の認識装置がそれらの結果を
提供するのを終わるまで、延期している。
次いで、ボックス434において、結果プロセッサ32
0は前記結果を受け取る。前記結果は、単一装置として
ではなしに一連のステップにおいて、送信及び受信され
る。結果プロセッサ320はまた前記結果を適切な結果
データ構造にロードする。
0は前記結果を受け取る。前記結果は、単一装置として
ではなしに一連のステップにおいて、送信及び受信され
る。結果プロセッサ320はまた前記結果を適切な結果
データ構造にロードする。
前述したように、結果データ構造は各ストリングに対し
て生成され、各認識装置からの結果は前記結果データ構
造内のそれぞれの位置を占める。結果が成功的に受け取
られると、ボックス436において、結果プロセッサ3
20は成功信号を認識装置に送り、これが更にその操作
を継続することのできるようにする。
て生成され、各認識装置からの結果は前記結果データ構
造内のそれぞれの位置を占める。結果が成功的に受け取
られると、ボックス436において、結果プロセッサ3
20は成功信号を認識装置に送り、これが更にその操作
を継続することのできるようにする。
若干の目的のため、前述した並列認識装置は高速認識を
提供することができる。次に、並列認識装置ではなしに
、直列プロセッサの使用について簡単に説明する。
提供することができる。次に、並列認識装置ではなしに
、直列プロセッサの使用について簡単に説明する。
4、直列プロセッサ
並列認識装置にも利点があるが、直列プロセッサの使用
は、プロトタイピングに対して、及び他の状態において
、有利である。第14図は、第10図におけるいくつか
のプロセッサの機能を行なう直列プロセッサを持つシス
テムを示すものである。
は、プロトタイピングに対して、及び他の状態において
、有利である。第14図は、第10図におけるいくつか
のプロセッサの機能を行なう直列プロセッサを持つシス
テムを示すものである。
第14図におけるシステム450は直列プロセッサ45
2を含んでおり、このプロセッサは、入力信号を受け取
り、そして出力信号を送り出すように、入出力装置45
4に接続されている。また、直列プロセッサ452は、
プログラムメモリ460、長期データメモリ462、及
び短期データメモリ464にアクセスするように接続さ
れている。
2を含んでおり、このプロセッサは、入力信号を受け取
り、そして出力信号を送り出すように、入出力装置45
4に接続されている。また、直列プロセッサ452は、
プログラムメモリ460、長期データメモリ462、及
び短期データメモリ464にアクセスするように接続さ
れている。
プログラムメモリ460は主ルーチン470を含んでお
り、このルーチンは他の複数のルーチンを呼び出す。そ
のうちの若干を第14図に示す。
り、このルーチンは他の複数のルーチンを呼び出す。そ
のうちの若干を第14図に示す。
候補認識ルーチン472は第1O図における候補ディス
クリミネータ322の機能を行なう。サブセット探索ル
ーチン474は第1O図における探索プロセッサ342
の機能を行なう。結果処理ル−チン476は第10図に
おける結果プロセッサ320の機能を行ない、また、要
すれば、確率検索サブルーチン478を呼び出してプロ
セッサ322の機能を行なうことができる。
クリミネータ322の機能を行なう。サブセット探索ル
ーチン474は第1O図における探索プロセッサ342
の機能を行なう。結果処理ル−チン476は第10図に
おける結果プロセッサ320の機能を行ない、また、要
すれば、確率検索サブルーチン478を呼び出してプロ
セッサ322の機能を行なうことができる。
長期データメモリ462は、プログラムメモリ460内
のルーチンによってアクセスされる複数の永久データ構
造を含んでいる。そのうちの若干を第14図に示す。サ
ブセットデータ構造480は第10図における認識装置
内のサブセットデータ構造に対応する。確率データ構造
482は第10図におけるデータ構造334に対応する
。ストリング番号/語データ構造484はデータ構造3
50に対応し、品詞規則486は規則354に対応する
。
のルーチンによってアクセスされる複数の永久データ構
造を含んでいる。そのうちの若干を第14図に示す。サ
ブセットデータ構造480は第10図における認識装置
内のサブセットデータ構造に対応する。確率データ構造
482は第10図におけるデータ構造334に対応する
。ストリング番号/語データ構造484はデータ構造3
50に対応し、品詞規則486は規則354に対応する
。
短期データメモリ464は複数のデータ構造を含んでお
り、このデータ構造の内容はプログラムメモリ460内
のルーチンによってアクセス及び修正される。前記デー
タ構造の若干を第14図に示す。ストリング待ち行列4
90は、候補識別ルーチア472によって提供される候
補ストリングの待ち行列であり、そして、主ルーチン4
70が、他のルーチンがそのように高速で働いていない
としても候補識別ルーチン472がマルチタスキングを
通ってその操作を継続することを許す場合に、用いられ
る。ストリングの待ち行列を持つことは、結果処理ルー
チン476が、時折、一連の相互依存ストリングを、各
ストリングを別々に分解するのではなしに、文脈に基づ
いてグループとして極めて高速に分解する場合に、有用
である。結果データ構造492は、結果処理ルーチン4
72によって取り扱われる前に各ストリングに対してセ
ットアツプされるデータ構造であり、主ルーチン470
が探索ルーチン474を並列に呼び出してマルチタスキ
ングを通って種々のストリングに対して操作させる場合
に用いられ、各ストリングに対する探索結果は、これら
が獲得されるにつれ、それぞれの結果データ構造にロー
ドされる。最近語キャッシュ494は、第10図におけ
るキャッシュ352に対応し、客語に対して品詞、言語
、用語集、格、等を指示するデータ、及び、現在認識中
の突内で出現する語の表示を含むことができ、品詞規則
486の適用を許す、出力データ構造496は、それぞ
れの位置における各ストリングの対応する認識済み文字
または音素を待ち行列に入れるデータ構造であり、主ル
ーチン470が結果処理ルーチン476を並列に呼び出
してマルチタスキングを通って種々のストリングに対し
て操作させる場合に用いられる。後続のストリングに対
応する文字または音素は、全ての先行ストリングの対応
の文字または音素が獲得されるまで、出力データ構造4
96内に保持される。
り、このデータ構造の内容はプログラムメモリ460内
のルーチンによってアクセス及び修正される。前記デー
タ構造の若干を第14図に示す。ストリング待ち行列4
90は、候補識別ルーチア472によって提供される候
補ストリングの待ち行列であり、そして、主ルーチン4
70が、他のルーチンがそのように高速で働いていない
としても候補識別ルーチン472がマルチタスキングを
通ってその操作を継続することを許す場合に、用いられ
る。ストリングの待ち行列を持つことは、結果処理ルー
チン476が、時折、一連の相互依存ストリングを、各
ストリングを別々に分解するのではなしに、文脈に基づ
いてグループとして極めて高速に分解する場合に、有用
である。結果データ構造492は、結果処理ルーチン4
72によって取り扱われる前に各ストリングに対してセ
ットアツプされるデータ構造であり、主ルーチン470
が探索ルーチン474を並列に呼び出してマルチタスキ
ングを通って種々のストリングに対して操作させる場合
に用いられ、各ストリングに対する探索結果は、これら
が獲得されるにつれ、それぞれの結果データ構造にロー
ドされる。最近語キャッシュ494は、第10図におけ
るキャッシュ352に対応し、客語に対して品詞、言語
、用語集、格、等を指示するデータ、及び、現在認識中
の突内で出現する語の表示を含むことができ、品詞規則
486の適用を許す、出力データ構造496は、それぞ
れの位置における各ストリングの対応する認識済み文字
または音素を待ち行列に入れるデータ構造であり、主ル
ーチン470が結果処理ルーチン476を並列に呼び出
してマルチタスキングを通って種々のストリングに対し
て操作させる場合に用いられる。後続のストリングに対
応する文字または音素は、全ての先行ストリングの対応
の文字または音素が獲得されるまで、出力データ構造4
96内に保持される。
前述したように、主ルーチン470はマルチタスキング
または他の類似の方法を利用して何らかの並列性を獲得
することができる。一般に、主ルーチン470を最適化
し、第10図に示すような並列認識装置で獲得される性
能に近付くことを試みることができる。
または他の類似の方法を利用して何らかの並列性を獲得
することができる。一般に、主ルーチン470を最適化
し、第10図に示すような並列認識装置で獲得される性
能に近付くことを試みることができる。
以上の本発明についての説明は、「確率クラスタリング
に基づく文字及び音素認識J (Charactera
nd Phoneme Recognition Ba
5ed on Probabilitycluster
ing)なる発明の名称の係属中の米国特許出願第07
/427.148号に関連して行なったものであり、こ
の米国出願の内容は本明細書において参照として説明し
た。本発明の方法は、前記米国特許出願において定義さ
れている制約された充足物の処理を提供する。前述した
ように、前記米国特許出願に開示されている方法は候補
識別に用いることができるが、本発明は更にまた、他の
候補識別方法からの出力について有用である。この出力
として、例えば、光センサの並列配置からの信号を処理
するためのネントワークからの出力がある。本発明はま
た、テキスと内の候補に整合し、そして整合候補のグル
ープに識別子を割り当てる候補識別方法について有用で
ある。
に基づく文字及び音素認識J (Charactera
nd Phoneme Recognition Ba
5ed on Probabilitycluster
ing)なる発明の名称の係属中の米国特許出願第07
/427.148号に関連して行なったものであり、こ
の米国出願の内容は本明細書において参照として説明し
た。本発明の方法は、前記米国特許出願において定義さ
れている制約された充足物の処理を提供する。前述した
ように、前記米国特許出願に開示されている方法は候補
識別に用いることができるが、本発明は更にまた、他の
候補識別方法からの出力について有用である。この出力
として、例えば、光センサの並列配置からの信号を処理
するためのネントワークからの出力がある。本発明はま
た、テキスと内の候補に整合し、そして整合候補のグル
ープに識別子を割り当てる候補識別方法について有用で
ある。
以上、本発明をその実施例について説明した。
しかし、本発明はこれに限定されるものではなく、特許
請求の範囲の記載のごとき本発明の範囲内で種々の変形
及び変更を行なうことができる。
請求の範囲の記載のごとき本発明の範囲内で種々の変形
及び変更を行なうことができる。
第1図は本発明においてテキスと内の誤セグメンテト化
文字候補を正しく認識された文字へ通じさせる一般的段
階を示す路線図、第2A図は文字候補ストリングのセッ
トを指示するデータを持つデータ構造を示す路線図、第
2B図は文字候補ストリングのセット及び可能性ある語
を指示するデータを持つデータ構造を示す路線図、第3
A図は第2A図におけるものと同様のデータ構造を用い
る際の一般的ステップを示すフローチャート、第3B図
は第2B図におけるものと同様のデータ構造を用いる際
の一般的ステップを示すフローチャート、第4図はスト
リングのかかるセットを指示するデータを持つデータ構
造を作るために文字候補ストリングのセットを獲得する
際の一般的ステップを示すフローチャート、第5図は、
文字または音素候補ストリングのセットを指示するデー
タを持つデータ構造を各々が含んでいる並列認識装置を
持つシステムの一般的構成要素を示すプロ・ツク線図、
第6図は第5図における結果プロセッサの操作における
一般的ステップを示すフローチャート、第7図は文字候
補ストリングが語りスト上の語のうちのどれかである可
能性があるかどうかを測定するために第4図のステップ
を実行する際に用いられるステップを示すフローチャー
ト、第8図は語の拡張文字候補ストリングを獲得してか
かるストリングのセットに含ませるために第4図のステ
ップを実行する際に用いられるステップを示すフローチ
ャート、第9図は第5図におけるような並列認識装置に
おいて用いるためのサブセットデータ構造のグループを
作るために用いられるステップを示すフローチャート、
第10図は第5図におけるような並列認識装置を含んで
いるシステムにおける結果プロセッサと他の構成要素と
の間の接続を示すブロック線図、第11図は認識済み文
字または音素のストリームを提供する際に第10図の結
果プロセッサが行なうことのできるステップを示すフロ
ーチャート、第12図は候補ディスクリ逅ネータからの
割り込みに応答して第1O図の結果プロセッサが行なう
ことのできるステップを示すフローチャート、第13図
は並列認識装置の一つからの割り込みに応答して第10
図の結果プロセッサが行なうことのできるステ、2プを
示すフローチャート、第14図は直列プロセッサが第1
0図におけるプロセッサのうちのいくつかのものの機能
を行なうようになっているシステムを示すブロック線図
である。 102:候補ディスクリ稟ネータ 104:ストリングレコグナイザ 110.120,330,340;認識装置130.3
20:結果プロセッサ 322:候補ディスクリミネータ
文字候補を正しく認識された文字へ通じさせる一般的段
階を示す路線図、第2A図は文字候補ストリングのセッ
トを指示するデータを持つデータ構造を示す路線図、第
2B図は文字候補ストリングのセット及び可能性ある語
を指示するデータを持つデータ構造を示す路線図、第3
A図は第2A図におけるものと同様のデータ構造を用い
る際の一般的ステップを示すフローチャート、第3B図
は第2B図におけるものと同様のデータ構造を用いる際
の一般的ステップを示すフローチャート、第4図はスト
リングのかかるセットを指示するデータを持つデータ構
造を作るために文字候補ストリングのセットを獲得する
際の一般的ステップを示すフローチャート、第5図は、
文字または音素候補ストリングのセットを指示するデー
タを持つデータ構造を各々が含んでいる並列認識装置を
持つシステムの一般的構成要素を示すプロ・ツク線図、
第6図は第5図における結果プロセッサの操作における
一般的ステップを示すフローチャート、第7図は文字候
補ストリングが語りスト上の語のうちのどれかである可
能性があるかどうかを測定するために第4図のステップ
を実行する際に用いられるステップを示すフローチャー
ト、第8図は語の拡張文字候補ストリングを獲得してか
かるストリングのセットに含ませるために第4図のステ
ップを実行する際に用いられるステップを示すフローチ
ャート、第9図は第5図におけるような並列認識装置に
おいて用いるためのサブセットデータ構造のグループを
作るために用いられるステップを示すフローチャート、
第10図は第5図におけるような並列認識装置を含んで
いるシステムにおける結果プロセッサと他の構成要素と
の間の接続を示すブロック線図、第11図は認識済み文
字または音素のストリームを提供する際に第10図の結
果プロセッサが行なうことのできるステップを示すフロ
ーチャート、第12図は候補ディスクリ逅ネータからの
割り込みに応答して第1O図の結果プロセッサが行なう
ことのできるステップを示すフローチャート、第13図
は並列認識装置の一つからの割り込みに応答して第10
図の結果プロセッサが行なうことのできるステ、2プを
示すフローチャート、第14図は直列プロセッサが第1
0図におけるプロセッサのうちのいくつかのものの機能
を行なうようになっているシステムを示すブロック線図
である。 102:候補ディスクリ稟ネータ 104:ストリングレコグナイザ 110.120,330,340;認識装置130.3
20:結果プロセッサ 322:候補ディスクリミネータ
Claims (1)
- 【特許請求の範囲】 1、文字候補識別子のセットを指示するデータ構造内に
データを含む段階を有し、各前記文字候補識別子は一つ
のセットの機械識別可能文字候補型のうちの一つを指示
し、前記含む段階は、認識中の文字候補識別子のストリ
ングが前記データによって指示されるセット内のストリ
ングのうちの一つであるかどうかを測定するため、前記
データがアクセス可能となるように前記データを含む段
階から成っていることを特徴とする文字認識方法。 2、認識されるべき文字候補識別子のストリングを提供
するための候補ディスクリミネータを備え、各前記文字
候補識別子は一つのセットの機械識別可能文字候補型の
うちの一つを指示し、前記候補ディスクリミネータはテ
キストに基づいて認識されるべき前記ストリングを提供
し、更に、 認識されるべき前記ストリングを受け取るための、及び
認識されるべき前記ストリングがそうである可能性があ
る語の文字を提供するためのストリングレコグナイザを
備えて成る文字認識システム。 3、状態のセット及び遷移のセットを定義するデータを
備えて成り、各前記遷移は前記状態の一つにおいて始ま
って前記状態の一つにおいて終わり、前記状態及び遷移
を定義するデータは、音素候補識別子のストリングのセ
ットを、及び、前記セット内の各ストリングに対して、
音素識別子のそれぞれのストリングを指示し、前記音素
候補識別子の各々は一つのセットの機械識別可能音素候
補型のうちの一つを指示し、認識中の音素候補識別子の
ストリングが前記指示されたセットのストリングのうち
の一つであるかどうかを測定するため、データ構造がア
クセス可能であることを特徴とする有限状態変換器デー
タ構造。 4、認識されるべき音素候補識別子のストリングを提供
するための候補ディスクリミネータを備え、各前記音素
候補識別子は一つのセットの機械識別可能音素候補型の
うちの一つを指示し、前記候補ディスクリミネータは話
された語から前記認識されるべきストリングを獲得し、
更に、前記認識されるべきストリングを受け取るための
、及び前記認識されるべきストリングがそうである可能
性がある語の音素を提供するためのストリングレコグナ
イザを備えて成り、前記ストリングレコグナイザは、各
々が前記候補ディスクリミネータから前記認識されるべ
きストリングを受け取る複数の認識装置を具備し、各前
記認識装置は、前記認識されるべきストリングが前記音
素候補識別子のストリングのそれぞれのセット内のスト
リングのうちの一つであるかどうかを測定するようにな
っていることを特徴とする音素認識システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US42714789A | 1989-10-25 | 1989-10-25 | |
US427147 | 1989-10-25 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03144877A true JPH03144877A (ja) | 1991-06-20 |
Family
ID=23693677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2280532A Pending JPH03144877A (ja) | 1989-10-25 | 1990-10-18 | 文脈的文字または音素認識方法及びシステム |
Country Status (2)
Country | Link |
---|---|
EP (1) | EP0425291A3 (ja) |
JP (1) | JPH03144877A (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5488719A (en) * | 1991-12-30 | 1996-01-30 | Xerox Corporation | System for categorizing character strings using acceptability and category information contained in ending substrings |
US5251273A (en) * | 1992-04-15 | 1993-10-05 | International Business Machines Corporation | Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms |
ES2078834B1 (es) * | 1992-10-30 | 1997-04-16 | Alcatel Standard Electrica | Metodo de segmentacion de cadenas de palabras en la fase de entrenamiento de un reconocedor de palabras conectadas. |
DE69423838T2 (de) * | 1993-09-23 | 2000-08-03 | Xerox Corp., Rochester | Semantische Gleichereignisfilterung für Spracherkennung und Signalübersetzungsanwendungen |
CA2326901A1 (en) * | 1998-04-01 | 1999-10-07 | William Peterman | System and method for searching electronic documents created with optical character recognition |
JP3543931B2 (ja) * | 1998-12-17 | 2004-07-21 | 日本電気株式会社 | 音声認識による文字編集手段を有する移動通信端末装置 |
JP2003513341A (ja) * | 1999-11-04 | 2003-04-08 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 遠隔通信端末における音声入力命令の認識率を上げるシステム及び方法 |
JP5888222B2 (ja) * | 2012-12-18 | 2016-03-16 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
CN111368506B (zh) * | 2018-12-24 | 2023-04-28 | 阿里巴巴集团控股有限公司 | 文本处理方法及装置 |
CN114981885A (zh) * | 2020-01-17 | 2022-08-30 | 谷歌有限责任公司 | 用于自动语音识别的字母数字序列偏置 |
US11270153B2 (en) * | 2020-02-19 | 2022-03-08 | Northrop Grumman Systems Corporation | System and method for whole word conversion of text in image |
CN112069812B (zh) * | 2020-08-28 | 2024-05-03 | 喜大(上海)网络科技有限公司 | 一种分词方法、装置、设备及计算机存储介质 |
-
1990
- 1990-10-18 JP JP2280532A patent/JPH03144877A/ja active Pending
- 1990-10-25 EP EP19900311711 patent/EP0425291A3/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP0425291A3 (en) | 1993-04-21 |
EP0425291A2 (en) | 1991-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100749289B1 (ko) | 텍스트의 자동 세그멘테이션 방법 및 시스템 | |
JP2991473B2 (ja) | 文字の認識方法及び音素の認識方法 | |
EP1462950B1 (en) | Method for language modelling | |
JP2571857B2 (ja) | 入力語の起源の言語群の判定方法及び合成器による音素の発生方法 | |
US8185376B2 (en) | Identifying language origin of words | |
JP3664550B2 (ja) | 文書検索方法及び装置 | |
US6487532B1 (en) | Apparatus and method for distinguishing similar-sounding utterances speech recognition | |
US8099281B2 (en) | System and method for word-sense disambiguation by recursive partitioning | |
KR101997783B1 (ko) | 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석기 및 분석 방법 | |
EP2315134A1 (en) | Search device, search index creating device, and search system | |
JPH03144877A (ja) | 文脈的文字または音素認識方法及びシステム | |
Lehal et al. | A shape based post processor for Gurmukhi OCR | |
JP3309174B2 (ja) | 文字認識方法及び装置 | |
JP3975825B2 (ja) | 文字認識誤り訂正方法、装置及びプログラム | |
JP2004177551A (ja) | 音声認識用未知発話検出装置及び音声認識装置 | |
Zeghiba | Arabic word decomposition techniques for offline Arabic text transcription | |
JP2004206659A (ja) | 読み情報決定方法及び装置及びプログラム | |
EP3051437A1 (en) | Method for query processing for search in multilingual audio-archive and device for search of that processed query | |
Tomokiyo et al. | An automatic method for learning a Japanese lexicon for recognition of spontaneous speech | |
JPH0627985A (ja) | 音声認識方法 | |
JP2001051992A (ja) | 日本語統計データ作成装置および方法、並びにディクテーションシステム | |
Sarukkai et al. | Phonetic set indexing for fast lexical access | |
JPH04296898A (ja) | 音声認識装置 | |
Chen | Vocabulary selection for high performance speech recognition | |
JPH076212A (ja) | 光学文字読取装置の知識処理装置 |