JPH06266780A - 意味パターン認識による文字列検索方法及びその装置 - Google Patents

意味パターン認識による文字列検索方法及びその装置

Info

Publication number
JPH06266780A
JPH06266780A JP5278754A JP27875493A JPH06266780A JP H06266780 A JPH06266780 A JP H06266780A JP 5278754 A JP5278754 A JP 5278754A JP 27875493 A JP27875493 A JP 27875493A JP H06266780 A JPH06266780 A JP H06266780A
Authority
JP
Japan
Prior art keywords
node
vector
query
elements
parent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5278754A
Other languages
English (en)
Other versions
JP3170400B2 (ja
Inventor
Gurahamu Jieimuzu
グラハム ジェイムズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JPH06266780A publication Critical patent/JPH06266780A/ja
Application granted granted Critical
Publication of JP3170400B2 publication Critical patent/JP3170400B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/322Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • G06F16/3323Query formulation using system suggestions using document space presentation or visualization, e.g. category, hierarchy or range presentation and selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 自動意味パターン認識を用い、説明書の使用
者がその文字列内の情報に関する問合せを入力すると対
応する情報の発見位置を表示させる。 【構成】 自然言語の文字列を表すデータ構造を保存す
るコンピュータを含み、データ構造はノードを有するツ
リー構造をなしノードの各々が文字列の関連する位置か
らの情報を表現する。ツリー構造の高次レベルのノード
は一般的情報の分類を表す。ツリー構造内ですぐ低次レ
ベルのノードはその先祖が高次レベルで表現している情
報の一般分類において更に特定の下位分類を表現する。
問合せは文字列を表すノード構造と形態的に類似の問合
せデータ構造に整形する。問合せデータ構造はツリー構
造内の各ノードと比較する。ノードの先祖と問合せの間
の類似性の度合を考慮の上、問合せとノードの間の類似
性の度合が所定の閾値以上の場合、ノードの関連位置が
問合せに対応する情報を含む位置としてビデオモニタ上
に表示される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自動意味パターン認識
を用いることにより、操作又は修理説明書の使用者が、
説明書の文書内の情報についての問合せを入力すると、
問合せに応じた情報の文書の位置が表示される意味パタ
ーン認識による文字列検索方法及びその装置に関する。
【0002】本発明は、説明書の利用者への補助として
の実施に関連して解説するが、本発明の多くの重要な特
徴は一般的用途を有し、また、説明書形式にある文書に
制限することを意図していない。
【0003】
【従来の技術及び発明が解決しようとする課題】一台の
装置の修理技術者又は使用者は、その装置の操作、保守
点検、又は、修理についての取扱い方法を説明書に頼る
ことが多い。このため、修理技術者又は使用者は、目次
及び本文中の関連頁を指す関連単語の索引を検索する必
要がある。
【0004】この方法は有効ではあるが、時間がかか
る。頻繁に探す時間は、顧客サービス担当者が電話によ
り顧客からの質問に迅速に応答する場合などで重大な制
約となる。
【0005】
【発明の概要】本発明では、使用説明書の本文中にある
関連情報を迅速に検索するため意味パターン認識を用い
る。意味パターン認識は、文書及び情報の検索を改善す
るための考え得る解決方法として以前から考えられてき
た。残念なことに、大半の自然言語理解システムは、日
常の人間の活動の一部として一般に出現する広範囲な意
味的状況を取扱うために、必要な語意と意味の深さが欠
如している。しかし、言語指向の組織及び比較の方法
が、非常に有用な幾つかの領域が存在する。このような
分野の一つは、トピック毎に主題の分類に組織できる情
報を含んでいる。トピックの組織の代表例は、典型的な
使用説明書又は修理説明書で、トピック毎に章に分割し
てあり、高度に説明的な語句や文章からなる簡潔な説明
を使用している。
【0006】そこで、本発明は、ビデオモニタと自然言
語の文章を表現するデータ構造を保存するためのメモリ
装置を含むコンピュータを使用し、自然言語で書かれた
説明書の本文内で情報を特定するものである。データ構
造は、ツリー(木)構造の異なるレベルに配置されたノ
ードを有するツリー構造の形態を有し、各ノードは本文
内の関連位置からの情報を表わし、その各々の位置は、
対応する位置識別子、例えば、頁又は章番号などを有す
る。各ノードは、本文からの語句又は文章を表わすノー
ド構成要素を含み、各ノードをノード構成要素を要素と
して含むベクトルで表現してもよい。内容的に相関する
要素への文章解析は従来技術で公知である。
【0007】通常、ツリーの高次レベルのノードは、情
報の一般的分類を表わす。ツリー内でこれに続いて低い
レベルのノードは、高次レベルで表現された情報の一般
分類の中でより特定の下位分類を表現する。例えば、1
つのレベルのノードは説明書の章の表題を表わし、これ
の次のレベルのノードが章の内部の節を表わし、さらに
これに続くレベルのノードがこれの項を表わす。このよ
うに、ツリー構造内の1つのレベルのノードは「親」ノ
ードと称し、これの直下のレベルにあって親ノードの表
現する情報の下位分類を表現するノードをその親ノード
の「子」ノードと称する。親ノードと特定の子ノードよ
り一般的な情報の分類を表現するツリー構造の高次レベ
ルにあるその他のノードはその子ノードの「先祖」と称
する。
【0008】本発明は、あるノードの先祖からの意味的
伝播を用いて、所定の確実性の度合で、そのノードが問
合せに応じる情報を含むかを決定する。問合せは、利用
者が入力するか又は自然言語の文章が問合せに対する答
えを含むと期待してシステム内にその他の入力から入力
する。問合せは、問合せデータ構造に整形する。問合せ
データ構造がノードと比較され、問合せとノードの表現
する情報の間の類似性の度合を表わす比較値を生成す
る。比較値は問合せとノードの先祖の表現する情報の間
の類似の度合を表わす量で拡張され、拡張比較値を生成
する。拡張比較値が所定の下限を超過しており、問合せ
に応答する情報をノードが提供する場合には、そのノー
ドの付随する位置識別子がメモリ内に保存される。問合
せデータ構造をノードと比較し、比較値を拡張し、位置
識別子を保存する過程がツリー構造内の各々のノードで
反復される。これらの段階をツリー構造全体に渡って実
行した後、保存した位置識別子をビデオモニタ上に表示
する。
【0009】本発明は、拡張比較値が所定の下限を超過
しているかを調べるだけではなく、ノードが問合せに応
答する情報を提供するか否かを検証している。拡張比較
値は先祖ノードからの情報の算入を表現しているので、
現在ノードと問合せの間の適合が全く存在しない場合で
あっても、拡張比較値は主として問合せとノードの先祖
により表現される情報の間の類似性の度合に基づいて下
限を超過することがある。従って、現在ノードが少なく
とも問合せに応答する何らかの情報を含むことを検証す
る必要がある。
【0010】本発明の一つの実施例において、問合せは
文字データ構造のノード内容と形式が類似した問合せの
構成要素を有する問合せデータ構造に整形される。つま
り、各々の問合せの構成要素は問合せに含まれる単語又
は文章を表現する。問合せデータ構造をツリー構造内の
ノードと比較し、適合要素数を有する適合ベクタを生成
し、適合ベクタが問合せデータ構造とノードの類似度を
表現する。各適合要素は、問合せ要素の1つと親ベクタ
の要素の1つに位置が対応する。親ベクタはゼロに初期
化されている。
【0011】得られた適合ベクタは親ベクタの各々の要
素と対応する各々の適合要素を比較することで親ベクタ
と併合し、各々の併合要素は親の要素と位置が対応し、
各々の併合要素を対応する親要素の最大の要素及び対応
する適合要素の最大の要素と等しく設定することによ
り、適合要素数を有する併合ベクタを生成する。
【0012】適合要素の何れかがゼロより大きい上にそ
の適合要素に対応する親の要素より大きいか又は等しい
場合には関連フラグを真に設定する。関連フラグを真に
設定した場合は、(1)併合要素の平均をとり、併合ベ
クタの平均を生成し、さらに、(2)併合ベクタ平均が
所定の閾値と等しいか又はこれを超過している場合ノー
ドの関係する位置識別子が表示のために保存される。本
発明にもっとも広い意味で関連している場合に、上記で
は術語「拡張比較値」と「下限」を用いた。本実施例に
おいては、併合ベクタの平均を拡張比較値として用い、
また、閾値を下限として用いている。
【0013】関連フラグが真に設定されているか否かに
より、適合ベクタを生成し、適合ベクタを親ベクタと併
合し、関連フラグを設定するか否かを決定し、さらに、
関連フラグが真に設定されいる場合には併合要素の平均
をとり関連のある位置識別子を保存する過程を、本発明
では反復しており、検証中のノードの親ノードに対して
併合段階を実行したことで得られた併合ベクタで親ベク
タを置換した後、これら全ての段階を各ノードで実行す
る。上記の段階がデータ構造内の各ノードで実行された
後、保存した位置識別子がビデオモニタ上に表示され
る。
【0014】この概要では、併合過程を通じて、本発明
がツリー構造内のノードに対してこれの先祖からの属性
の比較の意味的伝播を利用していることを示した。適合
値を閾値と単に比較する代わりに、本発明では、問合せ
に対する親ノードの類似の度合だけでなく、親ノードの
先祖と問合せの間の類似の度合も表わす新しい値を比較
している。つまり、他の方法では閾値を通過しないよう
なノードもこれがその先祖からの比較特性を受け継いで
いるため、関連情報を含むものとして計数されるように
なる。
【0015】
【実施例】本発明は、自動意味パターン認識を用いるこ
とで、操作説明書の使用者が説明書の本文内の情報に関
する問合せを入力すると、問合せに応じた情報が位置し
ている頁数が表示されるような意味パターン認識による
文字列検索方法及びその装置に関する。
【0016】パターン適合部分は、検索した頁上の情報
が問合せに対応するかについてシステムがどの程度確実
かを表わす確実度又は点数も計算し表示する。本発明
は、説明書の使用者に対する補助としての実施に関して
説明するが、本発明の多くの重要な特徴は、一般的用途
を有し、説明書の様式の文書に制限することを意図して
いない。
【0017】添付図面を参照して、以下に本発明の一実
施例を説明する。本発明のパターン適合は、例えば、D
ECstation5000ワークステーション上で実行するComm
onLISPプログラミング言語を用いて行なうことがで
きる。
【0018】図1及び図2は、説明書からの文書をツリ
ー構造に整形する方法を示す。図1は複写機の説明書の
1頁である。MChartなどの一般公有ソフトウェア製品
を用いると、該頁からの情報をCommon LISPのデー
タ構造に解析し、図2に示すようにトピック毎にツリー
構造に適合させることができる。
【0019】図面を参照すると、“FUSING”(定着)及
び“Fusing Unit Removal”(定着ユニットの取外
し)は目次の見出しとしてリストに入っているが、“R
emoval”(取外し)及び“Installation” (装着)は
リストに入っていない。つまり、図2に示すように得ら
れた文書データ構造は、目次より多くの情報を含み、本
文全体に含まれる無関係の情報を排除している。その結
果、ツリー構造の検索は本文全体のデータベースで行な
う検索より高速かつ効率的であり、さらに目次の検索よ
り正確かつ判りやすい。
【0020】図3は本発明の好適実施例の動作を示すフ
ローチャートである。開始するには、ステップ1で、入
力装置、例えばキーボードから本文に含まれ本文のツリ
ー構造に相応して表現されている情報についての問合せ
を入力する。ステップ2に示したように、問合せはMC
hartなどのプログラムでLISPデータ構造に解析され
る。
【0021】図3の実施は、主LISPルーチン(sear
ch-parsed-tree)で表現でき、ここでは、説明書の章を
表わすツリー構造内の文章分岐ノードと問合せを比較し
ている。各章内での比較は、search-parsed-treeルーチ
ンが呼出したルーチン(new-search-branch)で実行さ
れる。new-search-branchルーチン内では、解析した問
合せデータ構造がパターン(pattern) として表現さ
れ、ツリーの文章構造が分岐(branch)で表現される。
【0022】ステップ3に移ると、解析の後、問合せデ
ータ構造パターンをツリーの最高レベルから始めて本文
のデータ構造(branch)の(parsed-data で表現され
る)ノードと比較する。この比較により適合ベクタ(ma
tch-result)が生成される。適合ベクタは、ノードと問
合せの間の類似の度合を表わす数値要素を含む。適合ベ
クタの各要素の位置は、問合せデータ構造内の問合せ要
素の位置に対応する。
【0023】比較処理は関数match-contentが実行す
る。この関数は、次にcompare-two-language-structure
sルーチンを呼出す。compare-two-language-structure
ルーチン内部では、各々の問合せ要素が現在ノードでの
各ノード要素と比較され、「要素値」の行列が得られ
る。これらの値の各々は問合せ要素とノード要素の間の
類似性の度合を表現している。この比較では、従来技術
において公知の技術である知識ベースを使用し、内容的
に関連のある問合せ要素の形態を比較に含めることで意
味的に検索を広げている。例えば、要素“hard drive”
(ハードディスク・ドライブ)はこれの同義語である
“fixed disk”(固定ディスク)でも表現される。
【0024】比較の詳細については、一般に、適合ベク
タの各要素はその要素の対応する問合せ要素をノード要
素の各々と比較した結果として得られた最高位の要素値
と等しく設定する。例えば、図4(a)を参照して、利
用者が問合せ“PLEASE SHOWME THE SECTION ON REPLACI
NG THE EXPOSURE LAMP” (露光ランプの取替えの章を
示せ)を入力したと仮定する。この問合せの簡略化した
(SIMPLEIED) 意味表現(SEMANTIC)は次のような形態
をとる:((REPLACING)(EXPOSURE LAMP))。また、修理説
明書の本文が、図4(b)に図示したように、最初の章
が“REPLACEMENT AND ADJUSTMENT”(交換と調整)と題
する単純化したツリー構造で整形されていたと仮定す
る。整形すると、この文字列は単純に((REPLACEMENT)(A
DJUSTMENT))と表現される。
【0025】適合ベクタを生成するには、各々の問合せ
要素を各ノードの内容と比較し、各々の比較について要
素値を得る。つまり、図4(c)の行列式で示したよう
に、問合せ要素“REPLACING”(取替え)とノード要素
“REPLACEMENT”(交換)の比較により、これら2つの
術語が意味的に等価であるから、要素値1.0が生成さ
れる。一方、問合せ要素“REPLACING”(取替え)とノ
ード要素“ADJUSTMENT”(調節)との比較では、これら
2つの術語が完全に不適合であることから、要素値0.
0が生成される。問合せ要素“EXPOSURE LAMP” (露光
ランプ)について見ると、この術語はどちらのノード要
素とも適合しない。その結果、第1の問合せ要素“REPL
ACING” (取替え)に対応する第1の適合ベクタ要素
が、問合せ要素“REPLACING” (取替え)とノード要素
の各々との比較の結果得られた最高の要素値であるた
め、1.0に設定される。第2の問合せ要素“EXPOSURE
LAMP”(露光ランプ)に対応する第2の適合ベクタ要
素は、この要素がノード要素と全く適合を生じなかった
ので、0.0に設定される。つまり、得られた適合ベク
タは形態(1.0 0.0)をとることになる。
【0026】2つ又はそれ以上の問合せ要素と同一のノ
ード要素との比較が、この問合せ要素について得られた
最高の要素値となるような起こりそうもない事態では、
これらの要素値の最大値だけが適合ベクタ内に含まれ
る。同じノードと最高の適合が得られた残りの問合せ要
素と対応する適合ベクタの位置は他のノード要素と対応
するこれらの残りの問合せ要素の比較の結果得られた次
に高い要素値が入る。残っている問合せ要素の2つ又は
それ以上が同じノード要素と最高の適合をさらに発生す
る場合にはこの処理が続く。関数run-best-path で実装
したこの特徴は、ノードと問合せの間の類似性について
より正確な決定を提供する。
【0027】new-search-branch に戻ると、適合ベクタ
match-resultをステップ3で計算した後、適合ベクタの
要素をステップ4に図示したように平均する。ステップ
5に示したように、適合ベクタ平均が所定の閾値と比較
される。平均が閾値と等しいか又はこれを超過している
場合、このノードは問合せに適合していると見做してス
テップ6に示したように定数値を適合ベクタ平均に加算
する。この平均値はノードと問合せの適合の確実度を表
現している。定数の加算を実行するのは、あるノードが
その先祖からの意味的伝播の補助なしに適合を生じる場
合に、問合せに対応する情報が対応するノードを含む頁
上で発見する大きな確実性を有することができるためで
ある。逆に、適合が意味的伝播に依存するほど、「間接
的な」適合を正しい頁上に発見する確実度が低くなる。
従って、現在ノードが単独で閾値を引く場合、適合ベク
タ平均の値を拡張する、又は「報奨する」。この平均
は、拡張したか否かによらず、後に意味的伝播により得
られたその他の確実度数による処理において比較され、
適合の最も代表的な確実度を決定する。適合ベクタ平均
はLISPコード内のnew-match-resultsで表わされ、
定数値を加算する関数individual-matchの積である。
【0028】ステップ7に入ると、本発明ではノードと
その先祖の間の意味的関連性の計数を開始する。最初
に、親ベクタの要素parentをゼロ又は値nil に設定す
る。問合せをツリー構造の最高レベルから始めて特定の
ノードと比較した後、関数new-merge-tree-vectorsが得
られた適合ベクタmatch-resultを親ベクタと併合し、ス
テップ7に示したように、併合ベクタmerged-vector を
生成する。併合ベクタの各要素の位置は親ベクタの要素
の位置と対応する。併合は各併合ベクタ要素を対応する
親の要素又は適合ベクタの対応する要素どちらか大きい
方と等しく設定して完了する。
【0029】本発明の検索アルゴリズムは、ツリー構造
の分岐を下向きに進み、問合せを子ノードと比較するの
で、継起する親ベクタ各々を直前のレベルで計算した併
合ベクタと等しくなるように設定する。親ベクタがここ
では問合せと全ての意味的に関連のある現在ノードの先
祖との類似性に関する情報を含んでいるので、ノードと
これの先祖の間の意味的相関を考慮している。この方法
によって、本発明は、現在検査の対象となっているノー
ドが保持しているよりもさらに一般的な情報を保持して
いる先祖ノードから受け継いだ情報を利用することがで
きる。つまり、適合ベクタ平均単独では閾値を超過する
ことがないかもしれないが、併合ベクタ平均は親の関与
により適合ベクタ平均より常に大きいか又は等しいため
併合ベクタの要素の平均は超過して適合を示すことがで
きる。
【0030】関数new-merge-tree-vectorsもフラグcont
ributeを設定し、現在ノードがそのノードと問合せの適
合に「関与するか」を示す。併合ベクタ平均が親ノード
からの情報の算入を表現しているので、現在ノードと問
合せの間に適合が存在しない場合であっても親ベクタに
含まれる適合値に主として基づく閾値を超過することが
ある。
【0031】この問題を回避するには、適合ベクタmatc
h-resultの1つ又はそれ以上の要素がゼロより大きく、
かつ、同時に対応する親ベクタの要素の値より大きいか
又は等しいことが解った場合にだけ、ステップ7のフラ
グを設定する。この方法では、フラグは現在調べている
ノードが問合せに応答する情報を含むことを示すことに
なる。
【0032】例えば、再度図4(b)を参照すると、適
合ベクタは(1.0 0.0)と計算されている。適合
ベクタを(0.0 0.0)に初期化してある親ベクタ
と併合した後、併合ベクタは(1.0 0.0)とな
る。併合ベクタは、問合せを“EXPOSURE LAMP” (露光
ランプ)を表わすノードと比較するため、ツリー構造の
次のレベルに検索が進むと親ベクタとなる。ここで、問
合せとノードは双方が術語“EXPOSURE LAMP” (露光ラ
ンプ)を共有している。得られた適合ベクタは(0.0
1.0)の形態をとり、これが親ベクタ(1.0
0.0)と併合された場合には併合ベクタ(1.0
1.0)が得られる。さらに、適合ベクタ(0.0
1.0)とこれの親ベクタ(1.0 0.0)との比較
により関与フラグを真に設定することで、適合ベクタの
第2の要素1.0が親ベクタの第2の要素0.0より大
きいことから、現在のノードが親ベクタよりノードに強
く関係していることを示す。併合ベクタの平均をとるこ
とで併合ベクタ平均は(1.0+1.0)/2=1.0
となる。閾値が0.8に設定してあると仮定すれば、閾
値を超過していることになり、適合が発生したと見做す
ことができる。次のレベルのノードに降りていくと、親
ベクタは併合ベクタと等しい値(1.0 1.0)に設
定されることになる。
【0033】本発明のパターン適合は、適合フラグが直
前に設定されなかったとしても現在のノードが完全な意
味的伝播の補助なしに問合せとの適合を起動し得るとい
うことも考慮している。ステップ8において、適合フラ
グcontributeを検証する。これが真に設定していない場
合は、適合ベクタの要素のどれも親ベクタの要素のどれ
かと等しくないか又は超過してはいないことになる。し
かし、先祖ノードからの意味的伝播の部分的平均だけを
とることによって、現在ノードと問合せの類似性が親ベ
クタで表現されているほど大きくない場合でも現在ノー
ドが適合を起動し得る場合も存在する。
【0034】この状況をステップ9以降で活用し、適合
ベクタを親ベクタと部分的にのみ併合している。関数pr
opagate-context は適合ベクタ要素を親ベクタへ一対一
で置換し、この「半併合」ベクタの平均を閾値と比較す
る。より詳細には、親ベクタの第1の要素を適合ベクタ
の第1の要素で置換し、さらに、この半併合ベクタの平
均を閾値と比較する。閾値と等しいか又は超過している
場合と、置換した適合ベクタの要素がゼロ以上の場合、
propagate-context 関数の実行を停止し、半併合ベクタ
をpropagated-resultsとして返す(置換要素がゼロ以上
かの検査でそのノードが問合せに応答する情報に関係し
ていることを確認する)。一方で、閾値が置換中に超過
しなかった場合又は置換要素の値がゼロの場合には、pr
opagate-context が親ベクタの次の要素をこれと対応す
る適合ベクタの次の要素と置換し、ここでは第2の適合
要素を構成している第2の要素を除く親ベクタの全ての
要素を含む半併合ベクタが得られる。関数propagate-co
ntext がこの半併合ベクタの平均を閾値と比較する。非
ゼロ適合ベクタ要素を用いて初めて閾値を超過するか親
ベクタの各要素が置換の対象となるまでこの処理が継続
する。置換の何れかの間に閾値を超過しなかった場合、
ベクタpropagated-resultsにはnil 値が割当てられる。
【0035】propagate-context がnil 以外のpropagat
ed-results半併合ベクタを生じる場合、ステップ11で
示すように、確実性レベルtree-node-score は少なくと
も一時的に、半併合ベクタの平均と等しくなるように設
定される。
【0036】例えば、図4(b)で次のレベルに処理を
進めると、親ベクタとして直前に計算した併合ベクタ
(1.0 1.0)を用い、問合せを第1に“EXPOSURE
BULB”(露光電球)を表わすノードと比較する。“EXP
OSURE BULB”(露光電球)と“EXPOSURE LAMP” (露光
ランプ)の意味的類似性によりこのノードとの適合が
(0.0 0.9)などの適合ベクタを生成する。この
適合ベクタを親ベクタと併合すると、結果は併合ベクタ
(1.0 1.0)となり、確実に閾値を超過する。し
かし、適合要素を親要素と比較した場合、第1の適合要
素0.0が第1の親要素1.0より小さく、また、第2
の適合要素0.9が第2の親要素1.0より小さいた
め、適合ベクタと親ベクタの比較ではcontributeフラグ
の設定ができないことになる。つまり、この時点でアル
ゴリズムは問合せとこのノードとの適合を見落とすこと
になり、高度に関連性のある情報を含む頁が検索されな
いことになる。
【0037】しかし、この欠点は半併合処理の使用で克
服できる。この処理の開始時に、適合ベクタの第1の要
素を親ベクタの第1の要素と置き換えベクタ(0.0
1.0)が得られるので、これの平均は閾値を超過しな
いことになる。つまり、処理は適合ベクタの第2の要素
を親ベクタの第2の要素で置換する方向に進み、半併合
ベクタ(1.0 0.9)が得られ、これの平均は閾値
を超過する。従って、半併合過程はcontributeフラグを
真に設定しないとしても、子ノードが適合に対して大幅
に関与し得るという事実を考慮しており、高度に関連の
ある情報の検索が行なえることになる。
【0038】前述の実施例では、意味パターン認識にお
いてノードとその先祖の間の意味的関連を用いることの
平均に注目している。このような関連性を用いなけれ
ば、閾値を実質的に引き下げない限り、表現“EXPOSURE
LAMP” (露光ランプ)と“EXPOSURE BULB”(露光電
球)を単独で含むノードと関連する頁を問合せと関連す
る情報を表わすものとして決定することはできないであ
ろう。しかし、閾値を下げるとシステムの性能を劣化さ
せ、対応のない頁の頁数を適合と見做すことになる。
【0039】ステップ10を再度参照すると、関数prop
agate-context が適合を導かない場合、即ち、半併合ベ
クタがnil だと、確実性レベルtree-node-score はステ
ップ12に示すように併合ベクタ要素の平均と等しくな
る量に設定され、ステップ13でcontributeフラグが検
査される。フラグがnil の場合には、適合ベクタ平均が
閾値を超過していたとしてもこの時点で現在ノードは適
合しないと決定される。つまり、検索は別のノードに移
る。
【0040】フラグが真の場合には、併合ベクタ平均を
ステップ14で閾値と比較する。閾値を超過している場
合、即ち、現在のノードが完全な意味的伝播の補助によ
り適合を生ずる。前述したように、contributeフラグを
検査することで、適合が親ベクタの表現するような先祖
ベクタの関与によるだけではなく、現在ノードの関与の
結果でもあることを確認する。
【0041】処理のこの時点で、現在ノードそれ自体
(適合ベクタにより表現される)、意味的伝播を部分的
に利用する現在ノード(半併合ベクタpropagated-resul
tsで表現される)、又は、意味的伝播を全面的に利用す
る現在ノード(併合ベクタmerge-vectorにより表現され
る)のどれが閾値を超過したかを調べる。これら3種類
のベクタの平均は、特定ノードにおける確実性レベルの
得点の別の尺度を表現している。ステップ15及びステ
ップ16に図示したように、確実性レベルtree-node-sc
oreは、contributeフラグが真かnilかにより半併合ベク
タ平均又は併合ベクタ平均のどちらかとなる直前に計算
した点数をこの平均が超過している場合、適合ベクタ平
均new-match-results と等しくなるように設定される。
これ以外の場合、点数は変化しない。これによりステッ
プ17で、現在ノードと問合せの適合について最も正確
な確実性レベルが適合ノードの頁数(又はその他の位置
識別子)と共に保存されるようになしている。
【0042】適合した頁について点数を保存した後、又
は、これ以外に、意味的伝播の補助があっても現在のノ
ードが適合しなかった場合、ステップ18で検査してい
ないノードがツリー構造内に存在している間は、ステッ
プ19で同じレベルの兄弟ノード又は次のレベルの子ノ
ードについて照合を継続する。子ノードを検査する場合
には、ステップ20で、そのノードの親ベクタは意味的
伝播を継続させる目的で現在の併合ベクタに設定する。
ツリー構造全体の検索が終了すると、適合が得られた頁
の頁数をステップ21でこれに対応する確実度レベルと
合わせて表示する。
【0043】図5(a)は本発明の方法を実施するため
に使用する装置の略ブロック図である。問合せは入力装
置51から入力する。全ての計算及び問合せと本文を表
わすツリー構造との比較はCPU52が実行し、表示装
置53に結果を表示する。メモリ54は本文のデータ構
造及びその他の情報を保存するために使用する。図5
(b)は表示のレイアウトの実施例の一つで、フィール
ド55に問合せ入力が表示され対応する情報を含む頁の
頁数とこれに付随する確実性レベルがフィールド56に
表示されることを示している。フィールド57は問合せ
に対応する情報を含む頁を含め説明書の本文を検索する
選択肢を使用者が有することを表わす。
【0044】本実施例において、図5(b)では、使用
説明書を図4(b)のツリー構造で表現した図4(a)
の問合せを入力した結果を示す。フィールド56の“PA
GE:5”(頁5)は“EXPOSURE LAMP” (露光ランプ)の
項が含まれる頁を表わしている。再度、図4(b)を参
照すると、この項目のノードで得られた併合ベクタは
(1.0 1.0)である。つまり、併合ベクタ平均と
これに付随する確実度レベルの点数は(1.0 1.
0)/2=1.0又は100%である。同様に、“PAG
E:8”(頁8)は“EXPOSURE BULB” (露光電球)と表
題のついた細目を表わすノードを含むので、半併合ベク
タ(1.0 0.9)と確実度レベル(1.00.9)
/2=0.95又は95%が得られる。
【0045】以上のことから、本発明は、手作業で索引
と示された本文を繰る必要がなく、目前の作業に関連す
る情報が説明書のどの頁に含まれるかについて相対的確
率と合わせて使用者又は修理技術者が知ることのできる
便利な方法を提供している。
【0046】本発明は、好適実施例との関連で説明した
が、本発明の範囲を逸脱することなく各種の変更及び変
化をなし得ることは当業者には理解されよう。
【0047】
【発明の効果】本発明は、意味パターン認識による文字
列検索方法又はその装置に関して、上述したように構成
したので、使用者等が説明書等における文字列内の情報
に関する問合せを入力するだけで、その問合せに対応す
る情報を発見した位置を使用者等に提示させることがで
き、よって、使用者等は手作業で目次と示された本文を
繰るような必要がなく、目前の作業に関連する情報が説
明書等のどの個所に含まれるかについて相対的確率と合
わせて知ることができ、顧客サービス担当者等にとって
顧客からの問合せに迅速に応答し得るシステムを構築で
きる。
【図面の簡単な説明】
【図1】複写機の説明書の1頁を示す平面図である。
【図2】図1に示した頁からの情報を表わすツリー構造
の模式図である。
【図3】本発明の一実施例の動作を示すフローチャート
である。
【図4】処理例を示し、(a)は問合せの簡略化した意
味表現例の説明図、(b)は説明書の整形した文書に適
用した本実施例の処理例の説明図、(c)は適合ベクタ
の形成を表わす説明図である。
【図5】(a)は本実施例の装置構成を示す概略ブロッ
ク図、(b)は図4(a)(b)の問合せ及び文章デー
タ構造を用いた本発明の動作を示す表示画面例の正面図
である。
【符号の説明】
52 コンピュータ 53 表示手段 54 メモリ装置

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】 自然言語の文字列内の情報をビデオモニ
    タと前記自然言語の文字列を表現するデータ構造を保存
    するためのメモリ装置を含むコンピュータを用いて検索
    するための意味パターン認識による文字列検索方法であ
    って、 前記データ構造は各々が前記文字列内の関連する位置か
    らの情報を表わすノードとレベルとを有するツリー構造
    を有し、前記位置の各々は対応する位置識別子を有し、
    ノード内の前記情報はそのノードの親ノードが表現する
    情報の下位分類集合をなし、各ノードは前記ツリー構造
    内でその親ノードより1レベル下に存在するとともにノ
    ード構成要素を含み、前記親ノード及びノードが表現す
    る情報より一般的分類の情報を表現するツリー構造内の
    高次レベルにあるノードがそのノードの先祖となるよう
    な構造とし、 前記文字列内の情報に関する問合せを問合せデータ構造
    内に形成するステップと、 前記問合せデータ構造をノードと比較して前記問合せと
    前記ノードの表現する情報の間の類似の度合を表わす比
    較値を生成するステップと、 前記問合せと前記ノードの先祖の表現する情報の間の類
    似度を表わす量で前記比較値を拡張して拡張比較値を生
    成するステップと、 前記拡張比較値が所定の下限を超過し前記ノードが前記
    問合せに応じた情報を提供する場合に前記ノードに関連
    する位置識別子を保存するステップとを含むことを特徴
    とする意味パターン認識による文字列検索方法。
  2. 【請求項2】 前記ツリー構造内の各ノードで前記比較
    と拡張と保存のステップを実行するステップと、 前記保存した位置識別子を前記ビデオモニタ上に表示す
    るステップとをさらに含むことを特徴とする請求項1記
    載の意味パターン認識による文字列検索方法。
  3. 【請求項3】 自然言語の文字列内の情報をビデオモニ
    タと前記自然言語の文字列を表現するデータ構造を保存
    するためのメモリ装置を含むコンピュータを用いて検索
    するための意味パターン認識による文字列検索方法であ
    って、 前記データ構造は各々が前記文字列内の関連する位置か
    らの情報を表わすノードとレベルとを有するツリー構造
    を有し、前記位置の各々は対応する位置識別子を有し、
    ノード内の前記情報はそのノードの親ノードが表現する
    情報の下位分類集合をなし、前記ノードの各々は前記ツ
    リー構造内でその親ノードより1レベル下に存在すると
    ともにノード構成要素を含むような構造とし、 各々が問合せ内に含まれる単語又は文節を表現する前記
    問合せの構成要素を含む問合せデータ構造内に前記文字
    列内の情報に関する問合せを形成するステップと、 複数の適合要素を有する適合ベクタを生成し、この適合
    ベクタが前記問合せデータ構造と前記ノードの1つの間
    の類似度を表わしておりまた前記適合要素の各々は所定
    の問合せ要素及び親ベクタの所定の親要素と位置的に対
    応するステップと、 前記適合ベクタを前記親ベクタと併合して複数の併合要
    素を有する併合ベクタを生成し、前記併合要素の各々を
    これに対応する親要素の大きい方と等しくなるように設
    定することによって前記併合要素の各々が所定の親要素
    と位置において対応し前記適合要素が前記対応する親要
    素と対応するようになすステップと、 前記適合要素の何れかがゼロより大きい上に、前記適合
    要素に対応する前記親要素より大きいか又は等しい場合
    に関係フラグを真に設定するステップと、 前記関係フラグを真に設定した場合には、 前記併合要素を平均化して併合ベクタ平均を生成するス
    テップと、 この併合ベクタ平均が所定の閾値と等しいか又はこれを
    超過している場合に前記ノードに関連する前記位置識別
    子を保存し、これによって保存した位置識別子が前記問
    合せに応じた情報を含む前記自然言語文字列内の位置を
    表わすようになすステップと、 前記関係フラグが真に設定されていても又は設定されて
    いなくとも、 前記データ構造内の各ノードで、適合ベクタを生成し、
    併合し、関連フラグを設定し、さらに前記関連フラグが
    真に設定されている場合は、平均化し、保存する前記ス
    テップを実行するステップであって、前記ノードの前記
    親ノードについての前記併合ステップを実行したことか
    ら得られた前記併合ベクタで前記親ベクタを置換した後
    に前記ノード各々について全ての前記ステップが実行さ
    れるようになすステップと、 前記保存した位置識別子を前記ビデオモニタ上に表示す
    るステップとを含むことを特徴とする意味パターン認識
    による文字列検索方法。
  4. 【請求項4】 前記保存するステップは前記保存した位
    置識別子に付随する信頼性の点数として前記併合ベクタ
    平均を保存するステップをさらに含み、 前記表示するステップは前記保存した位置識別子に付随
    する信頼性の点数を前記ビデオモニタ上に表示するステ
    ップをさらに含むことを特徴とする請求項3記載の意味
    パターン認識による文字列検索方法。
  5. 【請求項5】 前記適合ベクタを生成した後に前記適合
    要素の平均をとり適合ベクタ平均を生成するステップ
    と、 前記適合ベクタ平均が前記所定の閾値と等しいか又は超
    過している場合に前記適合ベクタ平均に定数値を加算し
    て拡張適合ベクタ平均を生成するステップをさらに含
    み、 前記保存するステップは、 前記適合ベクタ平均が前記所定の閾値と等しいか又は超
    過するとともに前記関係フラグが真に設定されている場
    合において、 前記拡張適合ベクタ平均が前記併合ベクタ平均より大き
    いとき、前記拡張適合ベクタ平均を前記保存した位置識
    別子に付随する信頼性の点数として表示するために保存
    するステップと、 前記拡張適合ベクタが前記併合ベクタ平均より大きくな
    いとき、前記併合ベクタ平均を前記保存した位置識別子
    に付随する信頼性の点数として表示するために保存する
    ステップをさらに含み、 前記実行ステップは前記データ構造内の各ノードで上記
    ステップを実行するステップをさらに含み、 前記表示ステップは前記保存した位置識別子に付随する
    前記信頼性の点数を前記ビデオモニタ上に表示するステ
    ップをさらに含むことを特徴とする請求項3記載の意味
    パターン認識による文字列検索方法。
  6. 【請求項6】 前記設定ステップの後において、 前記関係フラグが真ではない場合には、 前記親ベクタの要素を1回に1つ前記対応する適合要素
    と連続的に置換して半併合ベクタを生成し、前記半併合
    ベクタは前記半併合ベクタの前記要素の前記平均が前記
    所定の閾値と等しいか又は超過するとともに前記対応す
    る適合要素がゼロ値を超過するまでか、又は前記親ベク
    タの各要素が置換されるまでの何れかにおいて前記置換
    した併合要素を除く前記親ベクタの全ての前記要素を含
    み、その後前記半併合ベクタの前記要素の前記平均が前
    記閾値と等しくない又は超過しない場合に前記半併合ベ
    クタをnil 値に等しく設定するステップと、 前記半併合ベクタがnil ではない場合には、 前記半併合ベクタの要素の平均をとり半併合ベクタ平均
    を生成するステップと、 前記拡張適合ベクタ平均が前記半併合ベクタ平均より大
    きいとき、前記拡張適合ベクタ平均を前記保存した位置
    識別子に付随する信頼性の点数として表示するために保
    存するステップと、 前記拡張適合ベクタ平均が前記半併合ベクタ平均より大
    きくないとき、前記半併合ベクタ平均を前記保存した位
    置識別子に付随する信頼性の点数として表示するために
    保存するステップをさらに含み、 前記実行ステップが前記データ構造内の各ノードで上記
    ステップを実行するステップをさらに含むことを特徴と
    する請求項5記載の意味パターン認識による文字列検索
    方法。
  7. 【請求項7】 前記適合ベクタを生成するステップが、 特定のノードで前記問合せ要素の各々を前記ノード要素
    の各々と比較し前記問合せ要素と前記ノード要素の間の
    類似の度合を表わす要素値を生成するステップと、 前記適合要素に対応する前記問合せ要素を前記ノード要
    素の各々と比較した結果として得られた最大の要素値と
    等しくなるように前記適合要素の各々を設定するステッ
    プとを含むことを特徴とする請求項3記載の意味パター
    ン認識による文字列検索方法。
  8. 【請求項8】 前記比較ステップの後において、 2つ又はそれ以上の問合せ要素を同一の前記ノード要素
    と比較した結果前記2つ又はそれ以上の問合せ要素につ
    いて最大の要素値が得られる場合、 前記最大の要素値の最大のものを選択し前記最大の要素
    値に付随する前記問合せ要素に対応する前記位置におけ
    る前記適合要素を前記最大の要素値に設定するステップ
    と、 前記同一ノードに対する前記最大の適合で得られた前記
    問合せ要素の残りの位置に対応する前記適合要素を前記
    残りの問合せ要素と他の前記ノード要素の比較の結果と
    して得られた次に高い要素値に設定するステップと、 前記残りの問合せ要素のうちの2つ又はそれ以上で前記
    同一ノード内容との最大の適合が得られる場合に前記選
    択及び設定のステップを反復するステップをさらに含む
    ことを特徴とする請求項7記載の意味パターン認識によ
    る文字列検索方法。
  9. 【請求項9】 前記併合ベクタを生成するための前記平
    均化ステップが、 前記併合要素同士を加算して和を生成するステップと、 前記併合ベクタ内の併合要素の数で前記和を除して前記
    併合ベクタ平均を生成するステップとを含むことを特徴
    とする請求項3記載の意味パターン認識による文字列検
    索方法。
  10. 【請求項10】 前記適合ベクタ平均を生成するための
    前記平均化ステップが、 前記適合要素同士を加算して和を生成するステップと、 前記適合ベクタ内の適合要素の数で前記和を除して前記
    適合ベクタ平均を生成するステップとを含むことを特徴
    とする請求項5記載の意味パターン認識による文字列検
    索方法。
  11. 【請求項11】 前記半併合ベクタ平均を生成するため
    の前記平均化ステップが、 前記半併合ベクタの前記要素同士を加算して半併合ベク
    タの和を生成するステップと、 前記半併合ベクタの和を前記半併合ベクタ内の要素の数
    で除して前記半併合ベクタ平均を生成するステップとを
    含むことを特徴とする請求項6記載の意味パターン認識
    による文字列検索方法。
  12. 【請求項12】 使用者が前記問合せを入力するステッ
    プをさらに含むことを特徴とする請求項3記載の意味パ
    ターン認識による文字列検索方法。
  13. 【請求項13】 使用者の入力に従って前記閾値を決定
    するステップをさらに含むことを特徴とする請求項3記
    載の意味パターン認識による文字列検索方法。
  14. 【請求項14】 前記位置識別子が頁数であることを特
    徴とする請求項3記載の意味パターン認識による文字列
    検索方法。
  15. 【請求項15】 前記表示ステップが、前記ビデオモニ
    タ上に前記問合せに対応する情報を含む位置の前記文字
    列を表示するステップをさらに含むことを特徴とする請
    求項3記載の意味パターン認識による文字列検索方法。
  16. 【請求項16】 自然言語の文字列内の情報をビデオモ
    ニタと前記自然言語の文字列を表現するデータ構造を保
    存するためのメモリ装置を含むコンピュータを用いて検
    索するための意味パターン認識による文字列検索装置で
    あって、 前記データ構造は各々が前記文字列内の関連する位置か
    らの情報を表わすノードとレベルとを有するツリー構造
    を有し、前記位置の各々は対応する位置識別子を有し、
    ノード内の前記情報はそのノードの親ノードが表現する
    情報の下位分類集合をなし、各ノードは前記ツリー構造
    内でその親ノードより1レベル下に存在するとともにノ
    ード構成要素を含み、前記親ノード及びノードが表現す
    る情報より一般的分類の情報を表現するツリー構造内の
    高次レベルにあるノードがそのノードの先祖となるよう
    な構造とし、 前記文字列内の情報に関する問合せを問合せデータ構造
    に整形するための問合せ整形手段と、 前記問合せデータ構造をノードと比較して前記問合せと
    前記ノードの表現する前記情報の間の類似性の度合を表
    現する比較値を生成するための比較手段と、 前記問合せと前記ノードの先祖の表わす情報との間の類
    似性の度合を表わす量で前記比較値を拡張して拡張比較
    値を生成するための拡張手段と、 前記拡張比較値が所定の下限を超過しており前記ノード
    が前記問合せに応答する情報を提供する場合に前記ノー
    ドに付随する前記位置識別子を保存するための保存手段
    と、 前記保存した位置識別子を前記ビデオモニタ上に表示す
    るための表示手段とを含むことを特徴とする意味パター
    ン認識による文字列検索装置。
  17. 【請求項17】 自然言語の文字列内の情報をビデオモ
    ニタと前記自然言語の文字列を表現するデータ構造を保
    存するためのメモリ装置を含むコンピュータを用いて検
    索するための意味パターン認識による文字列検索装置で
    あって、 前記データ構造は各々が前記文字列内の関連する位置か
    らの情報を表わすノードとレベルとを有するツリー構造
    を有し、前記位置の各々は対応する位置識別子を有し、
    ノード内の前記情報はそのノードの親ノードが表現する
    情報の下位分類集合をなし、各ノードは前記ツリー構造
    内でその親ノードより1レベル下に存在するとともにノ
    ード構成要素を含み、 問合せ要素を含み前記問合せ要素の各々が前記問合せに
    含まれる語又は句を表わす問合せデータ構造へ前記文字
    列内の情報に関する問合せを整形するための問合せ整形
    手段と、 各々が所定の問合せ要素及び親ベクタの所定の親要素と
    位置的に対応する複数の適合要素を含み前記問合せデー
    タ構造と前記ノードの1つとの間の類似性の度合を表わ
    す適合ベクタを生成するための適合手段と、 前記適合ベクタを前記親ベクタと併合して複数の併合要
    素を有する併合ベクタを生成するための併合手段であっ
    て、前記併合要素の各々をこれの対応する親要素と前記
    対応する親要素に対応する適合要素の大きい方と等しく
    なるように設定することにより前記併合要素の各々が所
    定の親要素と位置的に対応するようになしてあること
    と、 前記適合要素の何れかがゼロより大きい上に前記適合要
    素に対応する前記親要素より大きいか又は等しい場合に
    関連フラグを真に設定するための関連検出手段と、 前記関連フラグが真に設定されているかを検出するため
    の関連検査手段と、 前記関連検査手段に応答して前記併合要素の平均をとり
    併合ベクタ平均を生成するための併合平均化手段と、 前記併合ベクタ平均が所定の閾値と等しい又はこれを超
    過しているかを検出するための閾値検査手段と、 前記併合ベクタ平均が前記所定の閾値と等しい又はこれ
    を超過している場合に前記閾値検査手段に応答して前記
    ノードに関連した前記位置識別子を保存することにより
    保存した位置識別子が前記問合せに対応する情報を含む
    前記自然言語文字列内の位置を表わすようになすための
    保存手段と、 前記親ベクタを前記併合ベクタで置換するための置換手
    段と、 前記ビデオモニタ上に前記保存した位置識別子を表示す
    るための表示手段とを含むことを特徴とする意味パター
    ン認識による文字列検索装置。
  18. 【請求項18】 前記保存手段が、前記併合ベクタ平均
    を前記保存した位置識別子に関連する信頼度の点数とし
    て保存するための手段をさらに含み、 前記表示手段が、前記保存した位置識別子に関連する前
    記信頼度の点数を前記ビデオモニタ上に表示するための
    手段をさらに含むことを特徴とする請求項17記載の意
    味パターン認識による文字列検索装置。
  19. 【請求項19】 前記適合要素の平均をとり適合ベクタ
    平均を生成するための適合平均化手段と、 前記適合ベクタ平均が前記所定の閾値と等しい又はこれ
    を超過している場合に前記適合ベクタ平均に定数値を加
    算して拡張適合ベクタ平均を生成するための報奨手段
    と、 前記拡張適合ベクタ平均と前記併合ベクタ平均の大きい
    方を出力するための比較手段と、 前記比較手段の出力を前記保存した位置識別子に関連す
    る信頼度の点数として表示するために保存するため前記
    保存手段を前記比較手段と結合してあることと、 前記保存した位置識別子に関連する前記信頼度の点数を
    前記ビデオモニタ上に表示するための手段を前記表示手
    段がさらに含むことを特徴とする請求項17記載の意味
    パターン認識による文字列検索装置。
  20. 【請求項20】 前記関連フラグが真ではない場合に前
    記親ベクタの要素を1回に1つずつ前記対応する適合要
    素と置換することにより半併合ベクタを生成して、前記
    半併合ベクタの前記要素の前記平均が前記所定の閾値と
    等しいか又はこれを超過するとともに前記対応する適合
    要素がゼロ値を超過するまで又は前記親ベクタの各要素
    が置換されるまでの何れかで、前記半併合ベクタが前記
    置換した適合要素を除き前記親ベクタの前記要素の全て
    を含むようになすためと、その後前記半併合ベクタの前
    記要素の前記平均が前記閾値と等しくない又はこれを超
    過しない場合に前記半併合ベクタをnil 値に設定するた
    めの前記関連検査手段と結合した半併合手段と、 前記半併合ベクタがnil かを決定するための半併合検査
    手段と、 前記半併合検査手段に応答して前記半併合ベクタの前記
    要素の平均をとり前記半併合ベクタがnil ではない場合
    に半併合ベクタ平均を生成するための半併合平均化手段
    と、 前記拡張適合ベクタ平均と前記半併合ベクタ平均の大き
    い方を出力するための手段をさらに含む前記比較手段を
    さらに含むことを特徴とする請求項19記載の意味パタ
    ーン認識による文字列検索装置。
  21. 【請求項21】 前記適合手段は特定ノードにおいて前
    記問合せ要素の各々を前記ノード要素の各々と比較し前
    記問合せ要素と前記ノード要素の間の類似性の度合を表
    わす要素値を生成するためと、前記適合要素に対応する
    前記問合せ要素を前記ノード要素の各々と比較する結果
    として得られた最大の要素値に前記適合要素の各々を設
    定するための手段を含むことを特徴とする請求項17記
    載の意味パターン認識による文字列検索装置。
  22. 【請求項22】 2つ又はそれ以上の問合せ要素と同一
    の前記ノード内容との比較により前記2つ又はそれ以上
    の問合せ要素について得られた最大の要素値が生じる場
    合検証フラグを設定するための検証手段と、 前記検証手段に結合しており前記最大の要素値の最大の
    ものを選択するとともに前記検証フラグが設定されてい
    る場合に前記最大の要素値に関連する前記問合せ要素に
    対応する位置にある前記適合要素を前記最大の要素値に
    設定するための手段と、 前記同一ノードと最大の適合が得られた前記残りの問合
    せ要素と位置的に対応する前記適合要素を前記検証フラ
    グが設定されている場合に前記残りの問合せ要素と前記
    その他のノード要素との比較の結果として得られた次に
    高い要素値に設定するための手段をさらに含むことを特
    徴とする請求項21記載の意味パターン認識による文字
    列検索装置。
  23. 【請求項23】 使用者が前記問合せを入力できるよう
    になすための問合せ入力手段をさらに含むことを特徴と
    する請求項17記載の意味パターン認識による文字列検
    索装置。
  24. 【請求項24】 使用者からの入力に応じて前記閾値を
    決定するための閾値入力手段をさらに含むことを特徴と
    する請求項17記載の意味パターン認識による文字列検
    索装置。
  25. 【請求項25】 前記位置識別子が頁数をなすことを特
    徴とする請求項17記載の意味パターン認識による文字
    列検索装置。
  26. 【請求項26】 前記表示手段が前記問合せに対応する
    情報を含む前記位置の前記文字列を前記ビデオモニタ上
    に表示するための手段をさらに含むことを特徴とする請
    求項17記載の意味パターン認識による文字列検索装
    置。
JP27875493A 1992-12-10 1993-11-09 意味パターン認識による文字列検索方法及びその装置 Expired - Fee Related JP3170400B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/988,729 US5331554A (en) 1992-12-10 1992-12-10 Method and apparatus for semantic pattern matching for text retrieval
US07/988,729 1992-12-10

Publications (2)

Publication Number Publication Date
JPH06266780A true JPH06266780A (ja) 1994-09-22
JP3170400B2 JP3170400B2 (ja) 2001-05-28

Family

ID=25534429

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27875493A Expired - Fee Related JP3170400B2 (ja) 1992-12-10 1993-11-09 意味パターン認識による文字列検索方法及びその装置

Country Status (4)

Country Link
US (1) US5331554A (ja)
EP (1) EP0601550B1 (ja)
JP (1) JP3170400B2 (ja)
DE (2) DE69330633T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017511524A (ja) * 2014-10-22 2017-04-20 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド マルチラウンドセッションインタラクション方法、システム及びコンピュータ装置
JP2020184294A (ja) * 2019-04-26 2020-11-12 Arithmer株式会社 対話管理サーバ、対話管理方法、及びプログラム

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2696853B1 (fr) * 1992-10-12 1994-12-23 Bull Sa Procédé d'aide à l'optimisation d'une requête d'un système de gestion, de base de données relationnel et procédé d'analyse syntaxique en résultant.
US6131092A (en) * 1992-08-07 2000-10-10 Masand; Brij System and method for identifying matches of query patterns to document text in a document textbase
FR2696852B1 (fr) * 1992-10-12 1994-12-23 Bull Sa Procédé d'aide à l'optimisation d'une requête d'un système de gestion de base de données relationnel.
US5630121A (en) * 1993-02-02 1997-05-13 International Business Machines Corporation Archiving and retrieving multimedia objects using structured indexes
US5953723A (en) * 1993-04-02 1999-09-14 T.M. Patents, L.P. System and method for compressing inverted index files in document search/retrieval system
US5706503A (en) * 1994-05-18 1998-01-06 Etak Inc Method of clustering multi-dimensional related data in a computer database by combining the two verticles of a graph connected by an edge having the highest score
US5517407A (en) * 1994-06-30 1996-05-14 In-Dex Device for including enhancing information with printed information and method for electronic searching thereof
US8799461B2 (en) 1994-11-29 2014-08-05 Apple Inc. System for collecting, analyzing, and transmitting information relevant to transportation networks
US6460036B1 (en) 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US9832610B2 (en) 1994-11-29 2017-11-28 Apple Inc. System for collecting, analyzing, and transmitting information relevant to transportation networks
US6029195A (en) * 1994-11-29 2000-02-22 Herz; Frederick S. M. System for customized electronic identification of desirable objects
US5642502A (en) * 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
US5717913A (en) * 1995-01-03 1998-02-10 University Of Central Florida Method for detecting and extracting text data using database schemas
US5794050A (en) * 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
US6684188B1 (en) * 1996-02-02 2004-01-27 Geoffrey C Mitchell Method for production of medical records and other technical documents
US6298350B1 (en) * 1996-04-29 2001-10-02 Gosudar-Stvenny Nauchno- Tekhnichesky Tsentr Giperinformatsionnykh Tekhnology (GNTTS “GINTEKH”) Method for automatic processing of information materials for customised use
US6457004B1 (en) * 1997-07-03 2002-09-24 Hitachi, Ltd. Document retrieval assisting method, system and service using closely displayed areas for titles and topics
US6006315A (en) * 1996-10-18 1999-12-21 Samsung Electronics Co., Ltd. Computer methods for writing a scalar value to a vector
US5848404A (en) * 1997-03-24 1998-12-08 International Business Machines Corporation Fast query search in large dimension database
US6539430B1 (en) * 1997-03-25 2003-03-25 Symantec Corporation System and method for filtering data received by a computer system
US5996011A (en) * 1997-03-25 1999-11-30 Unified Research Laboratories, Inc. System and method for filtering data received by a computer system
US5895466A (en) * 1997-08-19 1999-04-20 At&T Corp Automated natural language understanding customer service system
US6782370B1 (en) * 1997-09-04 2004-08-24 Cendant Publishing, Inc. System and method for providing recommendation of goods or services based on recorded purchasing history
US5991756A (en) * 1997-11-03 1999-11-23 Yahoo, Inc. Information retrieval from hierarchical compound documents
US6173279B1 (en) * 1998-04-09 2001-01-09 At&T Corp. Method of using a natural language interface to retrieve information from one or more data resources
US6263332B1 (en) * 1998-08-14 2001-07-17 Vignette Corporation System and method for query processing of structured documents
US7630986B1 (en) 1999-10-27 2009-12-08 Pinpoint, Incorporated Secure data interchange
US7013394B1 (en) 2000-04-18 2006-03-14 International Business Machines Corporation Data flow pattern recognition and manipulation
AU2001281111A1 (en) * 2000-08-04 2002-02-18 Infoglide Corporation System and method for comparing heterogeneous data sources
US6795819B2 (en) * 2000-08-04 2004-09-21 Infoglide Corporation System and method for building and maintaining a database
US20020129342A1 (en) * 2001-03-07 2002-09-12 David Kil Data mining apparatus and method with user interface based ground-truth tool and user algorithms
US6491217B2 (en) * 2001-03-31 2002-12-10 Koninklijke Philips Electronics N.V. Machine readable label reader system with versatile response selection
US7028024B1 (en) 2001-07-20 2006-04-11 Vignette Corporation Information retrieval from a collection of information objects tagged with hierarchical keywords
AU2002332971B2 (en) * 2001-10-18 2008-07-03 Yeong Kuang Oon System and method of improved recording of medical transactions
US7801361B2 (en) * 2002-10-15 2010-09-21 Definiens Ag Analyzing pixel data using image, thematic and object layers of a computer-implemented network structure
US7873223B2 (en) * 2002-10-15 2011-01-18 Definiens Ag Cognition integrator and language
US8594410B2 (en) * 2006-08-28 2013-11-26 Definiens Ag Context driven image mining to generate image-based biomarkers
US7603371B1 (en) 2002-12-17 2009-10-13 Vignette Corporation Object based system and method for managing information
US20070073678A1 (en) * 2005-09-23 2007-03-29 Applied Linguistics, Llc Semantic document profiling
JP4419871B2 (ja) * 2005-03-02 2010-02-24 富士ゼロックス株式会社 翻訳依頼装置およびプログラム
US8438142B2 (en) 2005-05-04 2013-05-07 Google Inc. Suggesting and refining user input based on original user input
US20070073745A1 (en) * 2005-09-23 2007-03-29 Applied Linguistics, Llc Similarity metric for semantic profiling
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US20080208847A1 (en) * 2007-02-26 2008-08-28 Fabian Moerchen Relevance ranking for document retrieval
US8989468B2 (en) 2007-05-25 2015-03-24 Definiens Ag Generating an anatomical model using a rule-based segmentation and classification process
US8086441B1 (en) 2007-07-27 2011-12-27 Sonicwall, Inc. Efficient string search
US7792850B1 (en) 2007-07-27 2010-09-07 Sonicwall, Inc. On-the-fly pattern recognition with configurable bounds
US20090063470A1 (en) * 2007-08-28 2009-03-05 Nogacom Ltd. Document management using business objects
US8019748B1 (en) 2007-11-14 2011-09-13 Google Inc. Web search refinement
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
US20100306197A1 (en) * 2008-05-27 2010-12-02 Multi Base Ltd Non-linear representation of video data
US8244739B2 (en) * 2009-01-23 2012-08-14 Nec Corporation Data retrieval device using a skip table
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US8750468B2 (en) * 2009-10-05 2014-06-10 Callspace, Inc. Contextualized telephony message management
CN102193936B (zh) * 2010-03-09 2013-09-18 阿里巴巴集团控股有限公司 一种数据分类的方法及装置
US8527513B2 (en) 2010-08-26 2013-09-03 Lexisnexis, A Division Of Reed Elsevier Inc. Systems and methods for lexicon generation
US10445793B2 (en) * 2011-10-28 2019-10-15 Rakuten, Inc. Review text output system and review text output method
US10642897B2 (en) * 2012-03-23 2020-05-05 Sap Se Distance in contextual network graph
US9116939B2 (en) 2012-09-06 2015-08-25 Empire Technology Development Llc Tree comparison to manage progressive data store switchover with assured performance
WO2015195643A1 (en) * 2014-06-16 2015-12-23 Coldlight Solutions, Llc An architecture and methodology for performing autonomous analytics over multiple actual and virtual devices
EP3195145A4 (en) 2014-09-16 2018-01-24 VoiceBox Technologies Corporation Voice commerce
WO2016044321A1 (en) 2014-09-16 2016-03-24 Min Tang Integration of domain information into state transitions of a finite state transducer for natural language processing
WO2016061309A1 (en) 2014-10-15 2016-04-21 Voicebox Technologies Corporation System and method for providing follow-up responses to prior natural language inputs of a user
US10614799B2 (en) 2014-11-26 2020-04-07 Voicebox Technologies Corporation System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance
US10431214B2 (en) * 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
WO2018023106A1 (en) 2016-07-29 2018-02-01 Erik SWART System and method of disambiguating natural language processing requests
US10860796B2 (en) * 2017-05-16 2020-12-08 Gluru Limited Method and system for vector representation of linearly progressing entities

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5111398A (en) * 1988-11-21 1992-05-05 Xerox Corporation Processing natural language text using autonomous punctuational structure
US5056021A (en) * 1989-06-08 1991-10-08 Carolyn Ausborn Method and apparatus for abstracting concepts from natural language
JP2943447B2 (ja) * 1991-01-30 1999-08-30 三菱電機株式会社 テキスト情報抽出装置とテキスト類似照合装置とテキスト検索システムとテキスト情報抽出方法とテキスト類似照合方法、及び、質問解析装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017511524A (ja) * 2014-10-22 2017-04-20 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド マルチラウンドセッションインタラクション方法、システム及びコンピュータ装置
JP2020184294A (ja) * 2019-04-26 2020-11-12 Arithmer株式会社 対話管理サーバ、対話管理方法、及びプログラム

Also Published As

Publication number Publication date
US5331554A (en) 1994-07-19
EP0601550A3 (en) 1994-10-26
JP3170400B2 (ja) 2001-05-28
DE601550T1 (de) 1995-09-28
DE69330633D1 (de) 2001-09-27
EP0601550B1 (en) 2001-08-22
DE69330633T2 (de) 2002-07-04
EP0601550A2 (en) 1994-06-15

Similar Documents

Publication Publication Date Title
JP3170400B2 (ja) 意味パターン認識による文字列検索方法及びその装置
US7567902B2 (en) Generating speech recognition grammars from a large corpus of data
US7096218B2 (en) Search refinement graphical user interface
US5682539A (en) Anticipated meaning natural language interface
US5257186A (en) Digital computing apparatus for preparing document text
US7933774B1 (en) System and method for automatic generation of a natural language understanding model
JPH02271468A (ja) データ処理方法
JP2005537532A (ja) 自然言語理解アプリケーションを構築するための総合開発ツール
JP3023943B2 (ja) 文書検索装置
JPH11102377A (ja) データベースからドキュメントを検索する方法および装置
JPWO2003034279A1 (ja) 情報検索方法、情報検索プログラム、情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
KR100795930B1 (ko) 검색용 색인 기반 질의어 추천 방법 및 그 시스템
JPH0844771A (ja) 情報検索装置
US7596555B2 (en) Fuzzy recipient and contact search for email workflow and groupware applications
JP2007172260A (ja) 文書ルール作成支援装置および文書ルール作成支援方法並びに文書ルール作成支援プログラム
JPH1115841A (ja) 情報検索装置及び情報検索プログラムを記録した媒体
WO2009113289A1 (ja) 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム
JP3856388B2 (ja) 類義性計算方法、類義性計算プログラム、類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体
US20040054677A1 (en) Method for processing text in a computer and a computer
US7991787B2 (en) Applying search engine technology to HCM employee searches
JPH05250411A (ja) 検索条件式作成装置
CN116501841B (zh) 数据模型模糊查询方法、系统及存储介质
KR101099917B1 (ko) 검색용 색인 기반 질의어 추천 방법 및 그 시스템
JP2001067378A (ja) 文字列類似度算出方法、装置及び記録媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090316

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100316

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees