JPH03198154A

JPH03198154A - 文字シーケンス検証方法及び装置

Info

Publication number: JPH03198154A
Application number: JP2341151A
Authority: JP
Inventors: Timothy J Littlewood; ティモティ　ジェイムス　リトルウッド
Original assignee: Northern Telecom Ltd
Current assignee: Nortel Networks Ltd
Priority date: 1989-12-20
Filing date: 1990-11-30
Publication date: 1991-08-29
Anticipated expiration: 2012-12-08
Also published as: US5226148A; JP2686847B2; CA2006230C; CA2006230A1

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］本発明は文字シーケンスの検証に関するものである。特
に、電話システム、コンピュ−タ等で用いられるキーボ
ードまたはキーバッドによって生成された文字シーケン
ス（またはストリング）の検証に適用できるものである
。　代表的な応用例はパスワードの検証、電話番号ダイ
ヤルおよびデータベース・アクセス／検索等である。

この明細書において、文字シーケンスのコンテキスト中
の「文字」の語は１またはそれ以上のシンボル、英数字
、ＡＳＣＩＩ文字コード、絵文字、アイコン、その他の
外字をすべて含むものである。

また、この明細書において「アルファベット類」の語は
シーケンスが最下位の数字から順序付けられ、また、同
一の意味を持つ文字の順序はアルファベット類に順序付
けられることを意味する。

例えば、文字シーケンスＡＢＺとＡＣＡは隣接するであ
ろう。十進数Ｏから９の数字を含むシーケンス１２８．
１２９．１３０，１３１はレンジ内で隣接するシーケン
スである。

［従来の技術］代表的なシステムは、あらかじめ定められた、例えば、
パスワード、コマンド、ディレクトリ・アドレスのよう
な”有効”文字シーケンスのセット（集合）を認識する
ためにプログラムされる。

これらの有効シーケンスは多くの文字の順列によって生
成される可能なシーケンスの”スパース（疎）”サブセ
ット（部分集合）である。

ユーザは、システムが理解できないような無効文字シー
ケンスを入力するかもしれない。したがって、このシス
テムは各入力文字シーケンスが有効シーケンスに対応す
るか否かを判断する、すなわちシステムが有効文字シー
ケンスを認識するためにプログラムされているかをチエ
ツクする、必要がある。

オプションとして、文字シーケンスまたは文字ストリン
グが全て入力される前に文字ストリング中で早期に発生
するエラーは、パスワード検証の明かな例外を除いて、
ユーザに報告することができる。また、検証プロセスは
異なる長さの文字ストリングを取り扱うことができるよ
うにすべきであろう。

現存のシステムで用いられている文字シーケンス検証の
１つの形式は完全なマツチングであり、そのマツチング
においては、全入カシ−ケンス（またはストリング）ま
たは入力の一部が有効シーケンスを示すテンプレートま
たは参照テーブルと比較される。

［発明が解決しようとする課題］しかしながら、このアプローチは全ての可能性ある有効
シーケンスに対し個々のテンプレートが必要であり、こ
れらのテンプレートが検索されなければならず、そのた
め時間の浪費となる問題点があった。さらに、このテン
プレートのテーブルまたはリストは法外のメモリ領域を
必要とする問題点があった。

他の公知の文字シーケンス検証の形式は３つのタイプの
アルゴリズムを用いている。このシステムでは、一連の
データレコードは「ポインタｊによって相互接続される
。各レコードはシーケンス中に有効文字とポインタとを
含む。このポインタはシーケンス中の次の文字に対応す
るレコードの位置を与えるアドレスを示す。

共通の主要な文字を有するシーケンスは木の幹に近い共
通の木のノードを有する。木は後続する文字が２つまた
はそれ以上の有効ストリングだけ異なるところで分岐す
る。これは完全なマツチングよりもよりスペースの効率
をよくする。しかし、各有効シーケンスに対する１つの
木のノードの最小値が要求される。ポインタは高価なメ
モリスペースを占める。これはポインタがデータを有す
るレコードに蓄積されなくてはならないからである。さ
らに、中央プロセッサはストリング中の各有効文字を検
出するために非常に長い時間をかけてポインタをアクセ
スしなければならない。

この発明の目的は、特に、通信または同様なシステムに
用いるための文字シーケンスの検証装置を提供すること
にある。その中で、有効シーケンスは用いられる全文字
の可能な順列の中で非常に小さなサブセット（部分集合
）を構成する。さらに、この装置は上述した従来の装置
よりも、時間とメモリの使用においてより効率的である
。

［課題を解決するための手段］本発明の文字シーケンス検証装置は、（ａ）前記入力文
字シーケンスに対応する潜在レンジを推定する手段と、
（ｂ）前記入力文字シーケンスに対応する潜在レンジと
前記データベースセグメントとを比較し、前記潜在レン
ジと前記有効文字シーケンスとの間に共通部があるか否
かを判断する手段とを備え、前記共通部が存在し、かつ後続文字が前記入力文字シー
ケンス中にある場合は、前記後続文字から最初の潜在レ
ンジのサブセットである第２の潜在レンジを推定し、前
記第２の潜在シーケンスレンジと前記データベースセグ
メントとを比較し、第２の潜在レンジと前記有効文字シ
ーケンスとの間で共通部があるかを判断し、全ての入力
文字シーケンスに対して上記推定および判断が完了した
時点で前記共通部が存在する場合は、入力文字シーケン
スが完全であることを示すように構成される。

［作用］本発明の文字シーケンス検証装置は、電話システム、コ
ンピュータ等で用いられるキーボードまたはキーバッド
から文字シーケンスが入力されたとき、潜在レンジ推定
手段によって入力文字シーケンスに対応する潜在レンジ
を推定する。その潜在レンジとデータベース中のセグメ
ントとを比較し、その潜在レンジとデータベース中の有
効文字シーケンスとの間に共通部があるか否かを判断す
る。

前記共通部は存在するが入力文字シーケンス中に後続文
字がある場合は、その後続文字がら最初の潜在レンジの
サブセットである第２の潜在レンジを推定し、前記第２
の潜在シーケンスレンジと前記データベースセグメント
とを比較し、第２の潜在レンジと前記有効文字シーケン
スとの間で共通部があるかの判断を後続文字がなくなる
まで行なう。後続文字がなくなった時点で前記共通部が
存在する場合は、入力文字シーケンスが有効であると判
断する。

本発明の文字シーケンス検証装置はこのように文字シー
ケンスの後続文字に全部について潜在レンジの推定と共
通部の有無の判断を順次行い最終的に入力文字シーケン
スが有効であるか否かを判断するように動作する。

［実施例］第１図は本発明の一実施例の回路構成を示すブロック図
である。

ユーザ端末１１０はユーザとコンピュータまたは通信シ
ステム１１２間と接続される。通信システム１１２はＣ
ＰＵ　（中央処理装置）１１４を含む。ＣＰＵ１１４と
入出力インタフェース（Ｉｌｏ）１１６とメモリ１１８
はパラレルバス１２０によって相互接続されている。

この例において、ユーザはユーザ端末１１０のキーボー
ド１２２を経由して文字シーケンスを入力する。これに
よりユーザはディジタル符号化された文字シーケンスを
生成し、入出力インタフェース１１６に送出する。コン
ピュータまたは通信システムはこの文字シーケンスが有
効であるか否か、言い替えればシステム内で意味がある
か否かについて判断しなければならない。

メモリ１１８は有効文字シーケンスのデータベースを含
み、さらに、検証プロセスを実行するインストラクショ
ン（ソフトウェア）の集合をも含む。もちろん、このデ
ータベースは、キーボード１２２から入力される全ての
順列を用いることによって生成できる文字シーケンスの
中で限られた集合のみを含むという意味において、”ス
パース（疎）”と言ってもよい。

ＣＰＵ１１４は、検証プロセスのインストラクションを
実行し、文字入カシ−ケンスとメモリ１１８に蓄積され
た有効文字シーケンスとを比較することによって、入出
力インタフェース１１６に結果を出力し、ユーザ端末１
１０に入力文字シーケンスが有効か無効かを示す。

また、メモリ１１８は特殊の有効文字シーケンスに関す
るファンクションを初期化するマシーンインストラクシ
ョンをも含む。

第２図は第１図に対応するデータフロー図であり、ノー
ザンテレコムリミテッドによって商標ｒＮＯＲｓＴＡＲ
Ｊとして販売されている電話システムにおけるデータの
流れを示している。

Ｎ０Ｒ８ＴＡＲタイプのシステムにおいては、ユーザは
、要望により、応用ソフトウェアパッケージの種々のイ
ンストラクションの集合を直接アクセスし、種々の異な
る機能（以後サービスと言う）を実行することができる
。そのようなシステムの詳細についてはカナダ特許５９
０，６５７−１および５９３．２６８に記載されている
。

Ｎ０Ｒ８ＴＡＲシステムには多くのコンテキストがあり
、そこではユーザによって生成された特殊文字シーケン
スは検証する必要がある。したがって、ある特殊文字シ
ーケンスは、例えば、出回線に用いられ、そこからユー
ザが１回線を選択しようとする電話回線のグループであ
る「回線プール」サービスのコンテキスト内では有効で
あるかもしれない。ところが、「着信転送」のような他
のサービスでは有効でないかも知れない。

このように、第２図に示されるように、シーケンスパー
サ２０２、すなわち、ＣＰＵ１１４によって実行される
検証プログラムは第１の命令またはデータ入力であるパ
ーサコンテキスト２０４を受信する。このパーサコンテ
キスト２０４はアプリケーションサービス２１２によっ
て、文字シーケンスがユーザによって入力される特殊な
環境に対して判断される。例えば、ユーザが操作する「
ファンクション・キー」のような従来のいくつかのもの
は、アプリケーションサービス２１２を起動し、回線プ
ールをダイヤルするコンテキスト内で文字シーケンスが
検証されるべきであると要求するかもしれない。その場
合、アプリケーションサービス２１２は後続のパージン
グ（構文解析）または検証プロセスを潜在的なまたは許
容される回線プール番号の全てを含むデータベースの一
部に限定するようにコンテキストを特定するであろう。

入力シーケンス２０６がデータとして受信されると、シ
ーケンスパーサ（解析機）２０２は種々の有効シーケン
スまたは「ターゲット（目標）」シーケンスをデータ２
０８としてメモリ１１８から抽出して、パージングまた
は検証テストを実行して、その後パーサ結果２１０をア
プリケーションサービス２１２に送出する。もしシーケ
ンスが完全に検証されたことをパーサ結果２１０が表示
したときは、パーサ結果２１０によって判断されたアプ
リケーションの特殊のデータを含む結果パラメータ２１
４、例えば回線プール番号、はアプリケーションサービ
ス２１２に返送される。　アプリケーションサービス２
１２は、その後ユーザ端末１１０を介してユーザに、シ
ーケンスが無効であったことを報告するか、または要求
されるファンクションを初期化するかのいずれかを行う
。

さらに、アプリケーションサービス２１２は、後に説明
するように、現在のシーケンス長をデータ２１６として
記録する。

第３図はパージングまたは検証プロセスおよび入力文字
シーケンスがターゲットセグメント上にマツピングされ
る過程を示している。

本文中では、入力文字シーケンス中の文字から推定する
ことによって得られるレンジは「潜在レンジ」と表現さ
れる。一方、データベース中に実際に存在するレンジは
「実在レンジ」として表現される。

第３図はネスティング（入れ子構造）になった潜在レン
ジ３０２．３０４．３０６および３０８を示している。

ユーザは最初の文字（１）を入力する。潜在レンジ３０
２は（１）の文字で始まる文字シーケンスの全集合とし
て定義され、入力文字シーケンス中で引き続き入力され
る文字の種々の順列によって生成される。　これらの文
字シーケンスの幾らかは、「無効」であるとしてデータ
ベースには用いられない。他は「有効」であるとしてデ
ータベースで使用される。これらは「実在レンジ」とし
てグループ化される。

第３図において、実在レンジ３１０．３１２および３１
４はそれぞれセグメント３１６としてグループ化される
。実在レンジ３１８．３２０および３２２はそれぞれセ
グメント３２４としてグループ化される。セグメント３
１６と３２４の実在シーケンスはそれぞれ隣接レンジと
してグループ化される。これらのセグメントが「コンテ
キスト」の概念に含まれるかについては後に詳細に説明
する。

入力文字シーケンス中の次の文字（２）は、検索領域を
、最初の２つの文字（１２）で始まる文字シーケンスを
含んだ潜在レンジ３０４に「絞り」、または限定する。

第３図に見られるように、これはセグメント３１６中の
実在レンジ３１０．３１２および３１４を排除し、検索
領域をセグメント３２４の主要部に限定する。セグメン
ト３２４が複数のレンジを含んでいる限り、入力シーケ
ンスはまだ完全でない。

第３番目の文字（３）は潜在レンジ３０６を定義し、こ
れはレンジ３２０とレンジ３２２を事実上排除するよう
に領域を限定する。この場合でも文字シーケンス（１２
３）はまだ完全でない。

入力文字シーケンス中の次の第４番目の文字（４）は領
域を潜在レンジ３０８に限定する。この潜在レンジ３０
８は実在レンジ３２０と３２２を排除する。文字（４）
は入力文字シーケンス中の最後の文字であるから潜在レ
ンジ３０８はターゲットである「実在レンジ」３１８に
対応する。

入力シーケンス（１２３４）はしたがって、この場合は
完全でありかつ有効となる。

Ｎ０Ｒ８ＴＡＲのようなシステムでは、ユーザは特殊の
アプリケーションソフトウェアを要求するファンクショ
ンキーを押すであろう。これによって特殊のアプリケー
ションソフトウェアは、パーサコンテキスト２０４の入
力パラメータによって、自動的に後続のパージングまた
は文字検証プロセスを、特殊のアプリケーションに関係
するメモリデータベースの一部に限定するであろう。

例えば、ファンクションキー１は構内ダイヤルにおける
インターフオン番号のデータベース中にあるディレクト
リを選択することが可能である。

一方、ファンクションキー２は外部回線を使用してアク
セスされる回線プール番号のディレクトリを選択するこ
とができる。後続の番号は両ディレクトリに共通である
が、パージング（構文解析）はデータベースの１つの部
分のみで行なわれる。

このパージングソフトウェアはもちろんファンクション
が選択されたことを知る必要はない。パージングは単に
文字シーケンスを抽出し、特殊のアプリケーションのデ
ィレクトリに対して検証をするのみである。

このように、回線コードとインターフオン番号のような
両コンテキスト中に生じる特殊の文字のシーケンスは、
両コンテキストに対して構文解析が同時にされることは
ない。したがって、各コンテキストは別々に構文解析さ
れ、そのファンクションキーは構文解析がその中で行わ
れるコンテキストを定義する。

第４図はデータベース中の有効レンジの異なるセグメン
トが、その中で検証が行われる特殊コンテキストによっ
て、どのように分離されるかを示す。第４図において、
セグメント４０２はインタフオン番号のディレクトリを
表し、セグメント４０４は対応の回線プール番号を示す
ものとする。

アプリケーションソフトウェアはコンテキスト上で従属
した２つセグメントを区別することができる。このよう
に、もし、ユーザがアプリケーションサービスの「回線
プール」を選択するならば、そのアプリケーションソフ
トウェアは、ユーザがその後選択するであろう回線プー
ルを介して、ユーザは外部に呼接続を行いたいに違いな
いと認識するであろう。したがって、それに続く文字シ
ーケンスの検証は、第４図のスクリーンまたはマスク４
０６によって示されるように、セグメント４０４に限定
されるであろう。

第４図において、文字シーケンス１２３４の入力に先だ
って、ファンクションキーＦ１の動作は、ユーザが選択
する回線プール機能に対応し、コンテキストマスク４０
６を生成する。

マスク４０６はセグメント４０４に限定し、セグメント
４０２を排除し、セグメント４０．４のアクセスを可能
にする。他の方法としては、コンテキストマスク４０６
はユーザによるファンクションの選択によらないで、シ
ステムが絶対的に決定するようにもできる。

コンテキストマスク４０６はコンテキストＦ１に対する
ただ−の「窓」を示すように見えるが、このコンテキス
トマスク４０６は各データベースに対応して複数の窓を
含むこともできる。

第５図は文字シーケンス５０２．５０４．５０６．５０
８．５１０および５１２の一連の潜在レンジとターゲッ
トまたは「実在」レンジ５１４を示す。

レンジ５０２はターゲットレンジ５１４に含まれるので
有効である。レンジ５０４もまたターゲットレンジを含
むので有効である。同様に、レンジ５０６もターゲット
レンジ５１４の下端とオーバーラツプするので有効であ
る。レンジ５０８もまたターゲットレンジ５１４の上端
とオーバーラツプするので有効である。入力レンジ５１
０および５１２はそれぞれターゲットレンジ５１４の下
端、上端の全く外部にあるので無効である。

第６図は３つの「実在」レンジすなわちデータベース中
のシーケンスＡＳＢおよびＣのターゲットレンジを示す
。この例では、アルファベットは０から９のデイジット
のみから構成される。各レンジはあらかじめ定められた
文字番号と上限および下限を有している。このように、
ターゲットレンジＡは下限２５６３と上限６７８９の間
の数字で表現される４文字長の全てのシーケンスを含ん
でいる。ターゲットレンジＢは下限と上限がそれぞれ０
７００，２１９９である２文字長のシーケンスを含んで
いる。ターゲットレンジＣは下限と上限がそれぞれ８０
００，８９９９である１文字長のシーケンスである。最
大炎より小さいターゲットストリングは、そのレンジの
上限と下限において最大値と最小値に推定される。例え
ば、８は下限５ｏｏｏと上限８９９９に拡張される。

第７図Ａ１第７図Ｂ１第７図Ｃはそれぞれ第６図に示す
ターゲットシーケンスのレンジと代表的な３つの文字シ
ーケンス■、■、■とを比較する検証プロセスを示す。

第７図Ａにおいて、入力文字シーケンス■は数字２３を
含んでいる。第１のデイジット（２）は、潜在レンジ２
０００から２９９９までのレンジにあると推定され、そ
のレンジは第６図のターゲットシーケンスＢの上端とタ
ーゲットシーケンスＡの下端とのオーバラップしている
。　　しかしながら、第２のデイジット（３）が付くと
、潜在レンジは２３００から２３９９までと狭くなり、
前の潜在レンジの残りの部分を排除する。２８００から
２３９９までの新たな潜在レンジはターゲットレンジＢ
の上端（２１９９）より大きく、ターゲットレンジＡの
下端（２５６３）より小さい。

したがって、入力文字シーケンス■は無効である。

第７図Ｂにおいて、入力文字シーケンスまたは入力文字
ストリング■は単一のデイジット（８）を含んでいる。

これは潜在レンジ８０００から８９９９にあると推定さ
れる。これは第６図のターゲットレンジＣと完全にオー
バラップし、今度は有効であり完全である。数字１の隣
のアスクリスク（＊）は文字シーケンスがこの時点で完
全であることを示す。

第７図Ｃにおいて、シーケンス■は４つのデイジット長
でありデイジット５４２６と特定される。数字４の隣の
アスタリスク（＊）はシーケンスがこの時点で完全であ
ることを示す。最初のデイジット（５）は潜在レンジを
５．０００から５９９９に限定する。これは明らかに第
６図の実在レンジまたはターゲットレンジＡ内に存在す
る。次のデイジット（４）は潜在レンジを５４００から
５４９９に限定し、これはまだターゲットレンジＡ内に
存在するので、明らかに有効である。次のデイ−ジット
（２）はさらにレンジを５４２０から５４２９に限定す
る。最後のデイジット（６）は潜在レンジを５４２６か
ら５４２６に限定し、これもまたターゲットレンジＡに
含まれる。このようにして、入力文字ストリングまたは
入力文字シーケンスは有効でかつ完全であると判断され
る。

第８図から第１５図は検証プロセスを示すフローチャー
トである。

第８図は第２図のアプリケーションサービス２１２を示
し、特にこのアプリケーションサービス２１２がどのよ
うにシーケンスパーサ２０２を要求し、どのようにそれ
が用いる文字シーケンスをバッファするかについて示さ
れる。アプリケーションサービス２１２はユーザによっ
て入力されたデイジットを集め、シーケンスパーサ２０
２の中に集めた文字シーケンスを送り、このシーケンス
パーサ２０２から結果を得る。完全な結果が得られたら
、第８図のプロセスステップ８１８によって示されるア
プリケーション特有のファンクションを実行する。

第８図に関していえば、入力当初はアプリケーションサ
ービス２１２は文字を集められないので、ステップ８０
２で「シーケンス長」変数を０にセットする。プロセス
ステップ８０４で文字を集め、その文字は、プロセスス
テップ８０６で「入力シーケンス」と名付けられたデイ
ジットバッファ変数中の文字シーケンスに加えられ、そ
こで集められた全ての文字がバッファされる。その後、
プロセスステップ８０８で「シーケンス長」変数は１だ
け加算される。

第２図のシーケンスパーサ２０２はプロセスステップ８
１０を実行する。プロセスステップ８１０中に見られる
コンテキストは文字シーケンスが入力される前にユーザ
によって直接決定されるか、または検証が行われる環境
によって暗に示されるであろう（第２図の２０４参照）
。

シーケンスパーサ２０２がひとたびその検証過程を完了
すると、後で詳細に述べるように、パーサ結果２１０を
返送する。この結果は第８図の決定ステップ８１２に示
されるように有効であるか否かがテストされる。もし、
解析結果が有効であれば、デイジットは受領される。し
かし、入力文字シーケンスがいまだ十分にターゲットシ
ーケンスとマツチしていないときはプログラムはプログ
ラムステップ８０４に戻り、他の文字が処理される。反
対に、もし、結果が有効でない場合には、決定ステップ
８１４はそれが完了したか否かをチエツクする。もし完
了していたら、前述したように、適当なファンクション
がプロセスステップ８１８によって初期化される。もし
結果が完了していないときは、無効であったことになり
、その場合はプロセスステップ８１６がエラーを回答す
る。

両ケースにおいて、プロセスステップ８１６または８１
８のいずれかからそのプログラムはステップ８２０を介
して出口に至る。

フローチャートとその関連説明で、データベースの一般
的構造が示されているので、当業者ならその内容を理解
できるであろう。しかしながら、シーケンスパーサ２０
２の動作を示すフローチャートを説明する前に、いくつ
かの特殊のデクラレーション（宣言）を説明する。以下
にリストされたデクラレーションはターゲットシーケン
ス２０８に対応するものである。これらのデクラレーシ
ョンはパスカル言語のソースコードの形で与えられるが
、もちろん特殊のアプリケーションに適応するため他の
原語で表現することもできる。以下にリストされたもの
は３つの基本的なデクラレーションすなわち、定数、形
式、変数が含まれる。

これらはそれぞれＣ０Ｎ５Ｔ、ＴＹＰＥＳＶＡＲと表現
され、以下のようである。

０ＮＳＴ（Ｐａｒｓｅｒ　ａｒｒａｙ　ｂｏｕｎｄｓ）ｍａｘ　
ｓｅｇｍｅｎｔ　＝　１６；ｍａｘ　ｅｎｔｒｙ　＝　２５６；ＹＰＥｒａｎｇｅ　ｒｅｃ　＝　ＰＡＣＫＥＤ　ＲＥＣＯＲＤ
ｒａｎｇｅ　５ｔａｒｔ　　：ＩＮＴＥＧＥＲ；（Ｔｒ
ｅａｔ　ａｓ　ＢＣＤ　ｄｉｇｉｔｌｒａｎｇｅ　ｆｉ
ｎｉｓｈ　：ＩＮＴＥＧＥＲ；　（Ｔｒｅａｔ　ａｓ　
ＢＣＤ　ｄｉｇｉｔｌｄｉｇ　ｃｏｕｎｔ　　　：ＩＮ
ＴＥＧＥＲ；ｒｅｓｕｌｔ　ｐａｒａｍ　：ＩＮＴＥＧ
ＥＲ：ＥＮＤ；　（ｒａｎｇｅ　ｒｅｃ）ｃｏｎｔｘ　ｒｅｃ　＝　ＰＡＣＫＥＤ　ＲＥＣＯＲＤ
ＣＡＳＥ　ＢＯＯＬＥＡＭ　ＯＦＲ１ＪＥ：（ｂｉｔ：ＰＡＣＫＥＤ　ＡＲＲＡＹ　［０，，１５
］　ＯＦＢＯＯＬＥＡＮ）　；ＦＡＬＳＥ：（ｎｕｍｂｅｒ：　ＩＮＴＥＧＥＲ）；Ｅ
ＮＤ；（ｃｏｎｔｘ　ｒｅｃｌｈｅａｄｅｒ　ｒｅｃ　＝　ＰＡＣＫＥＤ　ＲＥＣＯＲ
Ｄｄｉｓｊｎｔ　ｓｅｇｍｅｎｔｓ：　ｃｏｎｔｘ　ｒ
ｅｃ；ｔａｂｌｅ　５ｔａｒｔ　　　：　０．、ｍａｘ
　ｅｎｔｒｙ　−１；ｔａｂｌｅ　ｆｉｎｉｓｈ　　：
　Ｏ，、ｍａｘ　ｅｎｔｒｙ　−１；ＥＮＤ；（ｈｅａ
ｄｅｒ　ｒｅｃｌｐａｒｃｅｒ　ｒｅｃ　＝　ＰＡＣＫＥＤ　ＲＥＣＯＲ
Ｄｌａｓｔ　ｓｅｇｍｅｎｔｓ　：　ｂｙｔｅ；１ａｓ
ｔ　ｅｎｔｒｙ　　　：　ｂｙｔｅ；ｈｅａｄｅｒ：Ｐ
ＡＣＫＥＤ　ＡＲＡＹ　［０，、Ｍａｘ−ｓｅｇｍｅｎ
ｔ−１１０Ｆ　ｈｅａｄｅｒ　ｒｅｃ；ｔａｂｌｅ　：ＰＡＣＫＥＤ　ＡＲＡＹ　［０，、Ｍａ
ｘ−Ｅｎｔｒｙ　−１ｌ０Ｆ　ｒａｎｇｅ　ｒｅｃ；ＥＮＤ；　（ｐａｒｓｅｒ　ｒｅｃｌＡＲｐａｒＳｅｒ　ｄａｔａ：　ｐａｒｓｅｒ　ｒｅｃ定数
（ＣＯＮＳＴ）はデータベースのサイズを定義するため
に用いられ、フレキシブルであり、またデータベースの
サイズに従属するものである。

形式（ＴＹＰＥ）はフィールドを構成するレコードであ
る。　ｒ　ＲＥＣＯＲＤＪの語はこれらの簡単なフィー
ルドから構成される複合変数を示す。全体のデータベー
ス構造はｒｐａｒｓｅｒ　ｒｅｃＪと呼ばれるレコード
によって記述さね、それはこのレコード宣言の２つ前の
デクラレーション「ｒａｎｇｅ　ｒｅｃＪと「ｈｅａｄ
ｅｒ　ｒｅｃＪとから構成される。

変数（ＶＡＲ）はデータ用のメモリ領域を実際に割り当
てるスティトメントである。

レコードｒｃｏｎｔｅｘ　ｒｅｃＪはデータベース中の
コンテキストフィールドを記述するために用いられ、さ
らにコンテキストを指定するときシーケンスパーサ２０
２への入力パラメータとして用いられる。

コンテキストレコードは２様に用いられる。

第１のケースである第２図のパーサコンテキスト２０４
の場合は、検証またはパーサプロセスに含まれるセグメ
ントを指定するために用いられる。

第２のケースは「ｈｅａｄｅｒ　ｒｅｃｏｒｄ　Ｊの中
にあり、そこではコンテキストレコードは与えられたセ
グメントに対して分離セグメントを記述するために用い
られる。すなわち、この分離セグメントはそのレンジが
オーバラップしないようにするためのものである。

第９図は第８図のプロセスステップ８１０を詳述するフ
ローチャートであり、第２図におけるシーケンスパーサ
２０２の動作を説明するものである。

第９図において、まず、プロセスステップ９０２は「パ
ーサ結果：＝　無効」をセットし、他の場所で変更され
るまでその設定が保持される。

プロセスステップ９０４において、入力文字シーケンス
は「有効」であるかについてチエツクされ、またコンテ
キストは使用されているデータベースのセグメントが有
効であるかについてチエツクされる。（第１０図はプロ
セスステップ９０４をより詳細に記述したフローチャー
トである。）プロセスステップ９０６は入力文字シーケ
ンスが入力されたとき、シーケンスの潜在レンジを生成
する。

検証プロセスはデータベースの各セグメントに対して実
行され、プロセスステップ９０８は変数「セグメント」
を初期化する。

プロセスステップ９１０は検索されたセグメントが最終
セグメントであるか否かを判断する。

もし、最終セグメントであれば、プログラムはアプリケ
ーションサービスのステップ８１０に結果を返送する。

もし最終セグメントでなければ、判断ステップ９１４は
セグメントが入力コンテキスト中にあるか否かまたはセ
グメントが定義されたか否かを判断する。もし、結果が
ｒＦ　（偽）］であれば、プログラムはプロセスステッ
プ９１２で示すように次のセグメントに行く。もしプロ
グラムが入力コンテキスト中にあり、かつセグメントが
定義されている両方の状態のときは、プログラムステッ
プ９１６は入力セグメントの潜在レンジの最小値に対し
てデータベース中のマツチングレンジを捜す。

プロセスステップ９１８は入力文字セグメントレンジの
最大値に対するマツチングレンジを決定する。

プロセスステップ９２０は潜在レンジと実在レンジがオ
ーバラップしていないかどうかをチエツクする。プロセ
スステップ９１２から９１０は各セグメントに対してデ
ータベースの最後のセグメントが完了するまで繰り返さ
れる。最後のセグメントがくるとプロセスステップ９１
０はプログラムを出口に導く。

第１０図はプロセスステップ９０４をより詳細に示した
フローチャートである。プロセスステップ１００２は内
部「入力状態」変数が「無効」であることをセットする
。これは入力状態が検証プロセスによって他のステップ
で有効であると証明されるまでは無効であることを暗に
示している。

このプログラムは次の３つのステップを必要とする。

決定ステップ１００４は入力文字シーケンス中のデイジ
ット数が、データベース内に含まれる実在シーケンス長
中に存在することをチエツクする。

決定シーケンス１００６は一連の全てのデイジットが有
効、すなわち、使用されているアルファベット中に含ま
れることをチエツクする。

決定シーケンス１００８は入力中に要求されるコンテキ
ストが有効か、すなわち、セグメントがデータベース中
に存在し分離されているかをチエツクする。

したがって、もし１つより多くのセグメントが要求され
るならばそのセグメントのレンジはオーバラップしない
。もし、決定ステップ１００４．１００６．１００８の
いずれかを満たさない、すなわちｒＦ　（偽）］の場合
はプログラムは終了する。しかし、もし、全てｒＴ　（
真）］の場合はプロセスステップ１０１０は「入力状態
」変数を「有効」とセットする。

第１１図はプロセスステップ１００８を詳細に示すフロ
ーチャートであり、特にデータベース中の実在セグメン
トに対する入力コンテキストの検証をより詳細に示して
いる。

基本的には、このコンテキストはセグメントのリストと
して記述される。プロセスステップ１１０２は他のステ
ップで入力コンテキストが検証プロセスによって有効と
されるまで「偽」であることを示す初期変数である。プ
ロセスステップ１１０４、判断ステップ１１０６は第８
図のステップ８０６．８０８に示すデータベース中の各
セグメントに対してプログラムが繰り返し処理を行うよ
うにする。

プロセスステップ１１０４は「初期セグメント」変数を
初期化する。その後、各決定ステップ１１０６は最終セ
グメントを検出するための比較を行う。もし、最終セグ
メントが通過したら、そのプログラムは主プログラム１
００８へ出る。もし、最終セグメントが未だ通過しない
間は、判断ステップ１１０８は、現セグメントに対する
パスカルレコード「ｃｏｎｔｘ　ｒｅｃＪ中のビットが
「真」であるか、つまり、セグメントが要求されたコン
テキストの一部であることを示しているかをチエツクす
る。さらに、決定ステップ１１０８はデータベース中の
このセグメントに対し分離セグメントが零でないこと、
つまり、そのセグメントがデータベース中に定義されて
いることを示しているかを確認する。

もし、これらの両状態が「真」であれば、判断ステップ
１１１０は入力コンテキストがデータベース分離セグメ
ントと分離されていると判断する。他の言葉で言い替え
ると、重なりがないことを示す。

データベース中では各セグメントに対し分離セグメント
のリストがある。各セグメントに対して、プロセスステ
ップ１１１０は分離セグメントのリストをアクセスし、
入力コンテキスト中の要求されたセグメントがこれらの
分離セグメント以外に実質的に何も含んでいないことを
確認する。

したがって、この処理は現セグメントに対して分離セグ
メントと入力コンテキストを同時に行う。

もし、何らかの付加的セグメントが入力に特定されれば
、入力コンテキスト中のセグメントがお互いに重なりあ
い無効になる可能性が大きい。これは、もし、２以上の
重複セグメント中で入力シーケンスが有効であれば、あ
いまいなパーサ結果が生じることになるからである。こ
の状態になるとプログラムは第１１図から外に出る。

その他の場合は、もし判断ステップ１１１０の状態が「
真」であれば、コンテキストは有効であり、検証プロセ
スはプロセスステップ１１１２に続き、そこでコンテキ
スト変数を「真」にセットする。プロセスステップ１１
０８．１１１０゜１１１２は各セグメントに対してプロ
セスステップ１１１４によって繰り返えされる。

有効な場合については多くの可能性が考えられるが、以
上説明したことは、そのうちの少なくとも１つのセグメ
ントが有効である場合である。

第１２図は、第９図のプロセスステップ９０６の詳細フ
ローチャートであり、このプロセスステップは２つのス
トリング、すなわち、１つは最大値を持つストリング、
他は最小値を持つストリングを発生させるデイジットス
トリングを推定する。もし、入力ストリングの長さがデ
ータベース中のシーケンスの最大長よりも小さいときは
、それを最大長になるまで他の文字が追加される。

その結果、ストリングは２つの部分を含む。その１つは
入力デイジットを含み、他は最大値または最小値と推定
される部分を含む。

プロセスステップ１２０２中で、内部変数はデイジット
カウントの最初の値に初期設定される。

判断ステップ１２０４はデイジットカウンタの内容と入
力シーケンス中のデイジット数を特定するカウンタとを
比較する。カウンタの値が入力ストリング長に達したと
きはもはや入力デイジットはコピーされない。

もし判断ステップ１２０４が未だ終わりに達していない
ことを示すｒＦＪを表示しているときは、プロセスステ
ップ１２０６．１２０８は入力デイジットをそれぞれ最
小値および最大値ストリングに直接コピーする。もし、
決定ステップ１２０４がシーケンスの最終ステップに到
達したと判断すると、プロセスステップ１２１０は最小
文字を、この場合はＯを、最小値ストリングにセットし
、プロセスステップ１２１２は最大文字、この場合は９
、を最大値ストリングにセットする。これらの文字、Ｏ
と９は、データベース中で定義される文字であるアルフ
ァベットで、最初の文字および最後の文字としてそれぞ
れ定義される。

両ケースにおいて、ストリングがコピーまたは拡張され
ると、次のプロセスステップ１２１４は、デイジットカ
ウントを１だけ増加し、シーケンスの次のデイジットに
する。プロセスステップ１２１６は処理されたデイジッ
ト数が最大デイジット数と等しいか否かを判断する。も
し等しくなかったら、ループはプロセスステップ１２０
４からプロセスステップ１２１４が繰り返えされる。

この結果、入力デイジットは最大値と最小値ストリング
にコピされ、その後、最大値／最小値ストリングは最大
ストリング長になるまで増加する。

このようにして、シーケンス中の後続文字の潜在レンジ
は各文字に対して生成される。プロセスステップ１２１
６において、デイジットカウントが最大デイジットを越
えると、プログラムはこのステップを抜は第９図のプロ
セスステップ９０６に行く。

第１３図は第９図のプロセスステップ９１６と９１８の
詳細なフローチャートを示す。このプロセスステップは
データベースに入力した入力ストリングのマツチングを
検出する。データベースはセグメント内のレンジは増加
状態にあるように指令される。初期プロセスステップ１
３０２は「マツチング検出」変数を初期化する。これは
データベース中で最小境界値と最大境界値の間にインデ
クッスの連続レンジがあるかを推定する。プロセスステ
ップ１３０４と１３０６はセグメント中に含まれるレン
ジのインデクラスの低境界値と高境界値をそれぞれ決定
する。判断チップ１３０８はセグメント中の最小レンジ
の低境界値が入力値よりも大きいかを判断する。もし、
セグメント中の最小レンジの低境界値が入力値よりも大
きい場合は、入力シーケンスは完全に分離されているこ
とになる。すなわち、その入力値は完全に実在セグメン
トの外にあり、オーバラップは生じない。

結局、プロセスステップ１３１０において低境界値がマ
ツチング検出変数に登録される。

決定ステップ１３１２は入力バッファ値とセグメント中
の最高レンジの高境界値と比較する。

もし、セグメント中の最高レンジの高端値が入力バッフ
ァ値、すなわち、潜在レンジよりも小さければ、再びオ
ーバラップはなく、プロセスステップ１３１４は高境界
値に対する値をマツチング検出変数に登録する。

もし、低または高境界値のマツチングが発見されないと
きは、オーバラップの可能性があるので、プロセスステ
ップ１３１６はセグメントのバイナリ検索を行い、どこ
でオーバラップが発生するかを決定する。

第１４図は第１３図のプロセスステップ１３１６のバイ
ナリ検出の詳細フローチャートである。

第９図のプロセスステップ１３１０．１３１４でセグメ
ントの低境界値と高境界値が決定されると、バイナリ検
索はレンジを半分に分割し、そのうちの半分を捨て、残
りの半分の中で検索をする過程を繰り返す。このように
して、プロセスステップ１４０２はレンジの中間点を検
出する。

この検索は検索される部分の長さがＯのとき終了する。

これは判断ステップ１４０４によって判断される。もし
、中間オフセットがＯよりも大きいときは、プロセスス
テップ１４０６は中間点のどちらが検索されるべきかを
判断する。もし、中間点のレンジ出発点が入力バッファ
よりも大きいときは、セグメントは低い方の半分が検索
される。したがって、プロセスステップ１４０８は高境
界値が中間点よりも小さくなるように減少させる。反対
に、もし、中間点のレンジ出発点が入力バッファよりも
小さいときは、セグメントは高い方の半分が検索され、
プロセスステップ１４１０は低境界値をオフセットより
も小さい高境界値と等しくなるように設定する。

「低境界値」と「高境界値」はテーブル中のエントリの
インデックスである。それらの間の距離または数値がオ
フセットであり、特別な場合としてそれら間の距離の半
分がオフセットとなる。

プロセスステップ１４１２はレンジを再び半分にする。

オフセットが０の点においては、レンジはテーブル中の
単一のエントリになる。その後、判断ステップ１４１４
は高境界値が低境界値に等しか否かを判断する。もし、
高境界値が低境界値に等シい場合は、プロセスステップ
１４２０は「マツチング検出」を高境界値となるように
登録し、第１３図のプロセスステップ１３１６へ戻る。

そして、その結果を第９図のステップ９１６または９１
８に戻す。

もしプロセスステップ１４１４が高境界値と低境界値が
異なると判断した場合には、その相違の状態がプロセス
ステップ１４１６によって判断される。このプロセスス
テップ１４１６は高境界出発値が入力バッファ値よりも
大きいかを判断する。もし、判断結果がｒＴ　（真）」
の場合は、プロセスステップ１４１８は高境界値を１だ
け減少する。その結果、高境界値はプロセスステップ１
４２０によってマツチングしたと判断される。その後、
その高境界値は入力ストリングを含むセグメント中のレ
ンジのインデックス値を持ってプログラムを出る。

第１５図はプロセスステップ９２０の詳細フローチャー
トを示す。プロセスステップ９２０はプロセスステップ
９１６とプロセスステップ９１８の両ステップの結果に
対して適用される。プロセスステップ９１６とプロセス
ステップ９１８で得られたマツチングは実際にデータベ
ースとオ−バラツブしているかを調べるためにチエツク
される。

判断ステップ１５０２は最大入力変数が最小マツチング
の出発値よりも小さいか判断される。

もし、小さければ、オーバラップはないので、ｒＴ　（
真）」の結果になり、プログラムはこのフローチャート
から出る。もし、結果がｒＦ（偽）」の場合は、潜在的
なオーバラップの可能性があり、レンジの高端は判断ス
テップ１５０４で判断され、最小入力変数が高端値より
も大きいか判断される。

もし大きければ、再びオーバラップはないことになり、
このプログラムは終了する。もし小さければ、プログラ
ムステップ１５０６は「有効」結果を登録する。入力潜
在レンジがデータベースレンジ内にあると、プログラム
ステップ１５０８は最小マツチングと最大マツチングが
同一か、言い替えると、レンジのインデックスは同一で
あるかを判断する。これは入力レンジがデータベース中
の単一のレンジと一致することを示すであろう。この場
合、判断ステップ１５１０は入力のデイジット数がデー
タベースレンジのデイジット数と一致するかを判断する
。もし、一致すれば、結果は完全であり、入力シーケン
スとデータベース中°のシーケンスとが完全に一致して
いることになる。この点で、プログラムステップ１５１
２は変数を「パーサ状態」に割り当てることにより、パ
ージングは完全であることを登録する。

プログラムステップ１５１４はレンジと関係する結果パ
ラメータを調べる。これらの結果パラメータはデータベ
ースのセットアツプ時に定義される。結果が返送される
前に入力デイジットは多くのことを行うことができる。

例えば、単に「検証」ステイトメントと一緒にストリン
グを返送する事ができる。また、他のストリングと置き
換えることも好んで行われるかもしれない。例えば、パ
スワード検証に対しては、ストリングを実際に返送しな
くてもパスワードが有効であることを示すフラッグに置
き換えることで十分であるかも知れない。他の可能性は
デイジットストリングを名前に変換し、それをユーザに
返送する可能性も含んでいる。

以上述べたように、無効ストリングはステップ１５０２
．１５０４からプログラムを終了させる。有効であるが
不完全のストリングに対してはパラメータはステップ１
５０８．１５１０から終了する。最後に、もし、ストリ
ングが有効でかつ完全の場合はプログラムはステップ１
５１４を通って外に出る。全ての場合プログラムは第９
図のステップ９２０に戻り、全シーケンスが他のセグメ
ント（すなわち、検証シーケンスに先だって定義される
ような異なるコンテキスト中で）に対して繰り返される
。

入力文字シーケンスは一度に１文字が検証されても良い
、またはユーザによってシーケンス中の全文字が入力さ
れたときは、全ての文字に対して同時に検証プロセスが
実行されても良い。

各セグメントはレンジの中でアルファベットの順序にグ
ループ分けされた同一文字数の１またはそれ以上のシー
ケンスを含むことが好ましい。

そして上記レンジは連続であること、すなわち、レンジ
の境界の間（およびその境界を含む）の全ての可能なシ
ーケンスが有効であることが好ましい。この発明は文字
ストリングが、キーボードまたは他の入力装置によって
直接ユーザによって生成されるようなユーザインタフェ
ースに限定されない。本発明の実施例は文字のシーケン
スを検証する必要があるようなシステムではどこでも適
用できる。特別な例としてはディスクファイルに蓄えら
れた文字ストリングの中央処理装置検証がある。

インタフェース１１２はより大きなコンピュータまたは
電気通信システムの単なるＩ１０インタフェースとして
、すなわち、そのようなシステムのユーザインタフェー
スの一部とみることができる。データベースのセグメン
ト中の有効シーケンスを表わす代替方法、例えば、はっ
きりしたマツチングテーブル、木構造等を用いることが
できる。第１１図から第１５図までに示される実行ソフ
トウェアおよびデータベースを定義するパスカル宣言は
適当に変形することもできる。

なお、上記実施例の他に以下のような実施の態様がある
。

（ａ）　　文字シーケンス検証装置において、各セグメ
ントは、１またはそれ以上の有効シーケンスの１または
それ以上の連続レンジを含み、そのようなシーケンスは
全て同一文字数を有し、アルファベット類にグループ化
されている文字シーケンス検証装置。

（ｂ）　　文字シーケンス検証装置において、入力文字
シーケンスの潜在レンジを推定する手段は、あらかじめ
定められた最大入カシーケンス長に対する人力シーケン
スを推定し、前記潜在レンジに対し低および高限界値を
生成し、前記潜在レンジと前記データベースセグメント
とを比較する手段は、前記潜在レンジの前記低および高
限界値と前記データベースのセグメントとを比較する文
字シーケンス検証装置。

（Ｃ）　　文字シーケンス検証装置において、前記入力
文字シーケンスの潜在レンジを推定する手段は、あらか
じめ定められた最大入カシーケンス長に対する入力シー
ケンスを推定し、前記潜在レンジに対し低および高限界
値を生成し、前記潜在レンジと前記データベースのセグ
メントとを比較する手段は、前記潜在レンジの前記低お
よび高限界値と前記データベースの前記連続レンジとを
比較する文字シーケンス検証装置。

（ｄ）文字シーケンス検証装置において、各データベー
スレンジは前記レンジおよびそのレンジ中の各シーケン
スの実際の文字数を含む領域に対する低および高限界値
によって定義され、前記比較手段は、前記潜在レンジの
前記低および高限界値と前記連続レンジの低および高限
界値とをそれぞれ比較する文字シーケンス検証装置。

（ｅ）　　文字シーケンス検証装置において、特殊のセ
グメント中の全ての前記シーケンスはあらかじめ定めら
れた関係を有し、さらに、共通部と前記関係の判断の結
果に従って結果パラメータを発生させる手段とを含む文
字シーケンス検証装置。

（ｆ）　　文字シーケンス検証装置において、前記関係
に従って前記１またはそれ以上のセグメントを選択する
為の手段を含む文字シーケンス検証装置。

（ｇ）　　文字シーケンス検証装置において、前記関係
を形成する為にユーザが操作できる手段を含む文字シー
ケンス検証装置。

（ｈ）　　文字シーケンス検証装置において、人力文字
シーケンスの全文字とデータベースとを個々に比較する
文字シーケンス検証装置。

（ｉ）　　文字シーケンス検証装置において、入力文字
シーケンスの全文字とデータベースとを同時に比較する
文字シーケンス検証装置。

［発明の効果］本発明は通信システム等で用いられる文字シーケンスの
検証装置中で、データベース中に有効シーケンスの他に
、使用される文字の全ての順列により構成される小さい
サブセットを設けることによって、メモリの使用効率お
よび時間効率を向上させる効果がある。

【図面の簡単な説明】

第１図は本発明による一実施例のコンピュータまたは電
気通信システムの構成図、第２図は本発明のデータフロ
ー図、第３図は本発明の一実施例における文字検証プロ
セスを示す概要図、第４図はコンテキストによってデー
タベースがどのように分離されるかを示す図、第５図は
入力レンジとターゲットレンジを示す図、第６図はター
ゲットレンジまたはデータベース中の文字シーケンスの
有効レンジを示す図、第７図Ａ、第７図Ｂ１第７図Ｃは
それぞれ第６図に示すターゲットシーケンスのレンジと
３つの文字シーケンス■、■、■とを比較する検証プロ
セスを示す図、第８図は第２図に示したアプリケーショ
ンサービスとシーケンスパーサとの関係を示すフローチ
ャート、第９図は第２図におけるシーケンスパーサの動
作を説明するプロセスステップ８１０を詳述するフロー
チャート、第１０図から第１５図は第９図のフロ−チャ
ートをより詳細に説明するフローチャートである。１１０・・・ユーザ端末、１１２・・・通信システム、
１１４・・・ＣＰＵ　（中央処理装置）、１１６・・・
入出力インタフェース（ＩｌｏＬ　　１１８・・・メモ
リ、１２０・・・パラレルバス、１２２・・・キーボー
ド、２０２・・・シーケンスパーサ、２０４・・・パー
サコンテキスト、２０６・・・入力シーケンス、２０８
・・・ターゲットシーケンス、２１０・・・パーサ結果
、２１２・・・アプリケーションサービス、２１４・・
・結果パラメータ、２１６・・・シーケンス長、３０２
．３０４．３０６．３０８・・・潜在レンジ、３１０．
３１２．３１４．３１８．３２０．３２２・・・実在レ
ンジ、３１６．３２４・・・セグメント、４０２．４０
４・・・セグメント、　４０６・・・コンテキストマス
ク、４０８・・・潜在レンジ、５０２．５０４．５０６
．５０８．５１０および５１２・・・潜在レンジ、５１
４・・・ターゲットまたは「実在」レンジ、Ｆｌ・・・
ファンクションキー領域。第１図第２図第Ｓ四８７−２１トーーＨ０７００２１９９８０甜１９９９第６図入力ストリングレンジ１０００３ｎ′ ２３００　２３９９第７図Ａ第７図Ｂ１゛５４００５４９９４２６５４２６　５４２６ ☆ ＝完全第７図Ｃ第８図第９図第１０図第１１図第１２図第１３図第１４図第５図

Claims

【特許請求の範囲】

（１）通信ネットワーク、データベース、コンピュータ
インタフェース等において、入力文字シーケンスと、デ
ータベース中の有効文字シーケンスを含むセグメントと
を比較することによって、入力文字シーケンスを検証す
る装置において、（ａ）前記入力文字シーケンスに対応する潜在レンジを
推定する手段と、（ｂ）前記入力文字シーケンスに対応する潜在レンジと
前記データベースセグメントとを比較し、前記潜在レン
ジと前記有効文字シーケンスとの間に共通部があるか否
かを判断する手段と、を備え、前記共通部が存在し、かつ後続文字が前記入力文字シー
ケンス中にある場合は、前記後続文字から最初の潜在レ
ンジのサブセットである第２の潜在レンジを推定し、前
記第２の潜在シーケンスレンジと前記データベースセグ
メントとを比較し、第２の潜在レンジと前記有効文字シ
ーケンスとの間で共通部があるかを判断し、全ての入力
文字シーケンスに対して上記推定および判断が完了した
時点で前記共通部が存在する場合は、入力文字シーケン
スが完全であることを示すことを特徴とする文字シーケ
ンス検証装置。