JP2005128961A

JP2005128961A - データベース検索装置、データベース検索方法およびプログラム

Info

Publication number: JP2005128961A
Application number: JP2003366418A
Authority: JP
Inventors: Momoko Nakatani; 桃子中谷; Masaru Miyamoto; 勝宮本
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2003-10-27
Filing date: 2003-10-27
Publication date: 2005-05-19
Anticipated expiration: 2023-10-27
Also published as: JP4301496B2

Abstract

【課題】ユーザによる入力文章の大部分が曖昧語で構成され、適切に検索することが困難な場合でも、不必要な問い返しを避け、適切な検索結果を得ることができるようにするものである。

【解決手段】ユーザが入力したデータ列と、上記データベースに格納されている複数のデータ列のそれぞれとの間におけるデータ要素同士の類似度に基づく類似度を計算する類似度テーブル生成手段と、データ要素の並びの順序に応じて、類似度を計算する順序関係比較手段と、上記類似度テーブル生成手段が生成した類似度と、上記順序関係比較手段が計算した類似度とに基づいて、データベースに格納されているデータ列毎に、スコアリングするスコアリング手段と、上記スコアリング手段がスコアリングしたスコアに基づいて、候補データ列を、上記データベースに格納されているデータ列から検索する検索手段とを有するデータベース検索装置である。

【選択図】図１

Description

本発明は、所定の商品等を使用中に、困難に遭遇したユーザが、その困難な状況に対する解決法を絞り込むデータベース検索装置、データベース検索方法およびプログラムに関する。

情報化が進み、情報機器の種類や使用方法が、多岐にわたりしかも複雑化することに伴い、情報機器を使いこなせないユーザが増加している。

ユーザが情報機器を使用中に、何らかのトラブルに遭遇した場合、そのユーザは何らかの方法でトラブルシューティングする必要がある。この場合、ユーザは、まず、自分が遭遇したトラブルの状態を的確に把握し、次に、トラブルシューティングの項目を、取扱説明書等から検索するか、または、遭遇したトラブルの状態を、他人に適切に説明し、これによって、解決方法を得る。

しかし、ユーザが、自分のトラブル状況を理解していない場合、表現能力が乏しい場合には、目的とするトラブル解決方法に、ユーザが辿り着くことが困難である。

たとえば、所定の情報機器におけるトラブル解決法検索データベースから、トラブルシューティングの項目を検索する場合、分類されているカテゴリの中から、適切なトラブル解決法を選択ことによって、目的とするページを検索する方式では、システム側が提供する選択肢と、ユーザが考えるトラブル状況の分類とが異なっていることがあり、この場合には、適切な解決方法を探すことができないという問題がある。

また、キーワード検索では、遭遇したトラブルを適切に表現する検索ワードを，正確に記入しなければ、目的とするページに辿り着くことができないので、特に初心者のユーザにとっては、遭遇しているトラブルを一言のワードで表現することが非常に困難であるという問題がある。

ところで、第１の従来例として、製品知識が乏しいユーザ等を対象にし、曖昧な検索用語でも、知りたい情報に辿り着くことができることを目的とした製品サポート用検索システムが知られている（たとえば、特許文献１参照）。

この第１の従来例では、ユーザが「思いつく言葉」を、検索条件として使用するので、質問者が知りたい事柄を表す語が収録されている辞書を使用する。そして、ユーザが入力した入力語が、上記辞書に収録されているどの語と一致するのかを検索するために、入力語だけではなく、入力語からいくつかの文字を削除した語についても、検索の対象にしている。

また、第２の従来例として、ユーザが入力した自然文による入力語を受け付ける入力手段を有し、検索文の中のどのデータベース項目に対応するかが曖昧な場合に、曖昧語の情報を提示することによってユーザに問い返し、また、上記提示された曖昧語の中から、ユーザが選択した内容を、履歴として格納、反映、削除することによって、ユーザの意図に合った検索を行うシステムが知られている（たとえば、特許文献２参照）。
特開２００２−１２３５４１公報特開平７−０９３３６２号公報

しかし、上記第１の従来例は、曖昧さを許容するキーワード検索システムであるので、トラブルに遭遇した初心者ユーザを支援する場合、ユーザの表現力が著しく乏しければ、キーワードのみを使用した検索条件では、適切な検索結果を得ることができないという問題がある。

また、上記第１の従来例では、ユーザに曖昧語を問い返し、検索条件を絞り込む場合、ユーザによる一度の入力で、検索対象がある程度絞り込まれることを前提としているので、入力文章の大部分が曖昧語で構成されていると、適切な検索結果を得るまでに、多くの不必要な問い返しをせざるを得ないという問題がある。

本発明は、ユーザによる入力文章の大部分が曖昧語で構成され、適切に検索することが困難な場合でも、不必要な問い返しを避け、適切な検索結果を得ることができるデータベース検索装置、データベース検索方法およびプログラムを提供することを目的とするものである。

本発明は、単語、節、文章等であるデータ要素を、ユーザに、順番に複数個入力させ、これら入力したデータ要素によって構成されているデータ列を用い、上記データ要素が複数個順番に並んだデータ列によって構成されている文書を、データベースから検索するデータベース検索装置において、ユーザが入力したデータ列と、上記データベースに格納されている複数のデータ列のそれぞれとの間におけるデータ要素同士の類似度に基づく類似度を計算する類似度テーブル生成手段と、データ要素の並びの順序に応じて、類似度を計算する順序関係比較手段と、上記類似度テーブル生成手段が生成した類似度と、上記順序関係比較手段が計算した類似度とに基づいて、データベースに格納されているデータ列毎に、スコアリングするスコアリング手段と、上記スコアリング手段がスコアリングしたスコアに基づいて、候補データ列を、上記データベースに格納されているデータ列から検索する検索手段とを有することを特徴とするデータベース検索装置である。

本発明によれば、ユーザからの順序関係を持つ複数の自然文（または単語、節等）の入力を受け付ける手段を有し、その順序関係をも考慮して検索するので、ユーザによる入力文章の大部分が曖昧語で構成され、適切に検索することが困難な場合であっても、不必要な問い返しを避け、適切な検索結果を得ることができるという効果を奏する。

つまり、請求項１、４、５記載の発明によれば、データ要素単位の比較に加え、順序関係を利用して類似度を算出するので、絞り込みが適切に行われ、これによって、機器に対する知識が乏しく、トラブルに遭遇した際にそのトラブルをうまく表現できないユーザから、利用できる情報を最大限、取り出し、問題解決へ導くことができるという効果を奏する。

請求項２記載の発明によれば、問題状況の表現が著しく曖昧な場合に、各データ列単位では類似するデータベースを絞り込めない場合においても、複数回受信したデータ要素とそれらの順序関係の組み合わせとの整合性を図るので、列単位の比較を、さらに拡張して絞り込むことができ、これによって、ユーザが自分のトラブルを一度では的確に表現できない場合であっても、適切な検索結果に辿り着くことができるという効果を奏する。

インターネットに関するユーザサポートのデータベース検索システムを一例として詳細に説明することによって、本発明を説明する。

図１は、本発明の実施例１である情報機器におけるトラブル解決法検索システム１００を示す図である。

情報機器におけるトラブル解決法検索システム１００は、情報機器についての知識が乏しく、トラブルに遭遇した際にそのトラブルをうまく表現できないユーザから、利用できる情報を最大限取り出し、トラブル解決へ導くシステムである。

情報機器におけるトラブル解決法検索システム１００は、操作手順データベース１０と、候補データ列指定部２０と、データ受信部３０と、データ出力部４０とを有する。

図２は、実施例１における操作手順データベース１０の例を示す図である。

操作手順データベース１０は、少なくともデータＩＤと、データ列（順序を持つデータの並び）とによって構成されている。

データ列は、データ要素ａ、ｂ、ｃ、…によって構成されている一連の手順説明文であり、データ要素ａ、ｂ、ｃ、…は、操作手順である。つまり、「データ要素」は、ユーザが入力した説明文であり、「データ列」は、上記データ要素が並んでいる一連の手順説明文である。

図２に示す例において、データ列は、データ列Ａ、データ列Ｂ、データ列Ｃである。

データ列Ａは、たとえばマニュアル等に記述されている機器の操作手順を構造化したものである。

図３は、実施例１における入力インタフェースの例を示す図である。

データ受信部３０は、トラブル発生までの操作手順を示す入力データ(データ列)を受信する機能を持ち、たとえば、図３に示すようなインタフェースであり、トラブル発生に行ったユーザの操作手順（データ列）であって、ユーザが入力した操作手順(データ列)を受信する。これによって、トラブル発生までにユーザが行った操作(データ列)を、順序立てて入力することを、ユーザが促される。

この入力すべき操作手順(データ列)は、自然文等、なるべくユーザが思った通りに記入することを前提とするので、稚拙な文も多く含まれることが予想される。データ受信部３０が受信した文章（１）→（２）→（３）→…の並びが、検索データ列であり、この検索データ列を構成する文章（１）、（２）、（３）…のそれぞれが、データ要素である。ユーザが、「次へ」と表示されているボタンを押すまで、受信が続行され、データ要素の数は、増え続ける。

候補データ列指定部２０は、類似度テーブル生成部２１と、順序関係比較部２２と、データ列類似度評価部２３とを有する。

データ受信部３０が受信した検索データ列と、操作手順データベース１０に格納されている各データ列との類似度を評価し、類似度の高いデータ列を、候補データ列として指定する。この候補データ列指定部２０は、類似度テーブル生成部２１と、順序関係比較部２２と、データ列類似度評価部２３によって構成されている。

類似度テーブル生成部２１は、操作手順データベース１０に格納されている全ての操作手順データ列を構成する全てのデータ要素と、データ受信部３０から取得した検索データ列を構成する全てのデータ要素との類似度を、それぞれ計算する。

図４は、実施例１におけるデータ要素類似度テーブルを示す図である。

類似度テーブル生成部２１が、操作手順データ列を構成しているデータ要素同士の類似度を計算した結果、図４に示すような類似度テーブルを生成する。

データ要素間の類似度を計算する場合、たとえば、各データ要素の形態素解析を行い、形態素単位で一致率を計算することによって、データ要素間の類似度を計算する。また、名詞・動詞のみの一致率を計算し、データ要素間の類似度を計算するようにしてもよい。

データ要素間の類似度を計算した後に、テーブルに基づいて、データベース１０の各データ列についてスコアリングする。スコアリングする場合、たとえば、予め設定した閾値よりも高い類似度を持つデータ要素の個数を、データベース１０に格納されているデータ列について、スコアとして加算する方法を採用するようにしてもよく、また、閾値よりも高い類似度を持つデータ要素の個数を、データベース１０に格納されているデータ列のデータ要素数で正規化する方法を採用するようにしてもよい。

図４に示す類似度テーブルにおいて、たとえば、閾値を０．６とした場合、データ列Ａについては、データ要素ａとデータ要素（２）との類似度、データ要素ｃとデータ要素（４）との類似度、データ要素ｄとデータ要素（３）との類似度が、それぞれ、０．７、０．９、０．８２であり、閾値０．６を超えており、つまり閾値を超えているデータ要素が、３つ存在する。

所定のデータ列を構成するデータ要素であって、閾値よりも高い類似度を有するデータ要素の個数を、上記所定のデータ列のスコアであるとする。このようにすると、データ列Ａの点数は、３点である。これと同様にすると、データ列Ｂの点数も、３点である。

順序関係比較部２２は、データベース１０に格納されているデータ列において、閾値よりも高い類似度を持つデータ要素が、順序通りに出現していれば、そのデータ列に、スコアを加算する。

図５は、実施例１における順序関係比較部２３が、閾値よりも高い類似度を持つデータ要素の順序関係を比較した結果の例を示す図である。

たとえば、データベース１０に格納されているデータ列Ａについて、閾値を越えているデータ要素ａ、ｃ、ｄは、図５に示すように、その出現順序がａ、ｄ、ｃの順序であり、これに対して、データベース１０に格納されているデータ列Ｂでは、ｆ、ｈ、ｉの順に、順序通りデータ要素が出現しているので、全体として、データ列Ｂのほうが、図５に示すように、より高いスコアを得る。

つまり、実施例１では、順序通りにデータ要素が並んでいるもの程、高いスコアをつける。たとえば、以下の式に従って、スコアを付ける。

Ｓｒ＝Ｓｅ＋Ｓｐ
Ｓｒ：データ列に対するスコア
Ｓｅ：類似度が閾値を超えているデータ要素の数
Ｓｐ：閾値を超えているデータ要素ｘの後ろに、順序通りのデータ要素（データ要素ｘよりも後の順序に位置するデータ要素）ｙが位置している数
データ列Ａの場合、データ要素ａの後ろに、データ要素ａよりも後の順序に位置するデータ要素ｃとデータ要素ｄとが位置しているので、スコアＳｒ＝２である。データ列Ｂの場合、データ要素ｆの後ろに、データ要素ｆよりも後の順序に位置するデータ要素ｈとデータ要素ｉとが位置し、さらに、データ要素ｈの後ろに、データ要素よりも後の順序に位置するデータ要素ｉが位置しているので、スコアＳｒ＝２＋１＝３である。

上記「類似度が閾値を超えているデータ要素の数Ｓｅ」は、データベース１０に格納されているデータ列を構成するデータ要素中に、検索データ列のデータ要素（類似度が閾値以上であるデータ要素）が何個含まれるかを表す指標である。たとえば、データ要素ａと（１）、ｂと（１）、ｃと（１）が、閾値以上である場合、そのデータ列で、類似度が閾値を超えているデータ要素数は、１（Ｓｅ＝１）であり、また、たとえば、ａと（１）、ａと（２）、ａと（３）が閾値以上である場合、そのデータ列で類似度が閾値を超えているデータ要素数は３（Ｓｅ＝３）とみなすことができる。

また、Ｓｒ＝ａＳｅ＋ｂＳｐ（ａ、ｂは重み係数）とし、データ要素数と順序関係とについて、どちらかに重みを与えるスコアリング方法や、そのスコアを、データベース１０内に格納されているデータ列のデータ要素数に応じて、正規化する方法、さらに、Ｓｒ＝Ｓｅ・Ｓｐとする等、データ要素・順序に関するスコアリング方法は、複数考えられ、検索対象やデータベース１０の特徴に応じて、スコアリングの関数を生成する必要がある。

データ列類似度評価部２３は、類似度テーブル生成部２１と順序関係比較部２２とが計算したデータ列のスコアに基づいて、予め設定した閾値を超えたスコアを持つデータを、候補データ列として抽出する。

また、データ列類似度評価部２３は、最もスコアの高いデータ列を、候補データ列とするようにしてもよい。どちらの場合においても、候補データ列が、複数存在してもよい。

データ出力部４０は、候補データ列指定部２０が抽出した候補データを出力する。

図６は、実施例１において、データベース１０を検索する動作を示すフローチャートである。

トラブル状況が発生するまでにユーザが操作したことを、手順に沿ってユーザに入力させた文章を、データ要素（１）、（２）、…として受信し、（１）→（２）→…のデータ要素の一連を検索データ列とする（Ｓ１０）。

検索データ列のデータ要素（１）、（２）…と、操作手順データベース１０内に格納されているデータ列の全てのデータ要素との類似度を、形態素単位の一致率をみる等の方法で計算し、類似度テーブル生成部２１が類似度テーブルを作成する（Ｓ２０）。

上記作成された類似度テーブルにおいて、閾値を超えた類似度を持つデータ要素の出現順序を比較し、スコアリングを行う（Ｓ３０）。たとえば、ステップＳ２０で生成された類似度テーブルを参照し、閾値を超えている類似度の個数をカウントし、出現順序が検索データ列と等しい順序である類似度の個数をカウントし、これら個数の和を算出したものを、そのデータ列のスコアとする（Ｓ３０）。

ステップＳ３０で算出した各データ列のスコアの中で、閾値を超えたスコアを持つデータ列（または、最も大きいスコア値を持つデータ列）を候補データ（トラブル解決法の候補データ）とする（Ｓ４０）。

そして、ステップＳ４０で抽出した候補データを、画面に出力し、処理を終了する（Ｓ５０）。

つまり、実施例１において、操作（＝データ要素）が並べられている操作手順（＝データ列）によって構成されるデータベース１０が存在する場合、ユーザの手順毎の文章入力を受け付け、この入力文章を、データ要素が並べられている検索データ列とし、データベース１０内のデータ列のデータ要素毎の類似度が高いデータ要素を持つデータ列にスコア付けする手段を設け、また、検索データ列と、類似度の高いデータ要素を含むデータ列との間で、データ要素の並びが、検索データ列のデータ要素の並びと同じ順序であるデータ列に、高いスコア付けを行う手段を設けている。

従来は、曖昧な表現でされた問題状況の説明文を、上記説明文のデータ要素単位でしか比較していないので、類似するものが少なく、適切に絞り込むことができない。

ところが、上記実施例１では、機器に対する知識が乏しく、トラブルに遭遇した際に、そのトラブルをうまく表現できないユーザから、利用できる情報を最大限、取り出し、問題解決へ導くことができる。

図７は、本発明の実施例２である情報機器におけるトラブル解決法検索システム２００を示すブロック図である。

トラブル解決法検索システム２００は、問題状況の表現があまりに稚拙で、１つの検索データ列では、類似するデータ列を絞り込めない場合であっても、複数の検索データ列の中のデータ要素の順序関係を加味することによって、適切な検索結果に辿り着くことができる実施例である。

トラブル解決法検索システム２００は、基本的には、トラブル解決法検索システム１００と同じであり、トラブル解決法検索システム１００に、検索データ列生成部６０と、質問抽出部５０とが付加されている点のみが、トラブル解決法検索システム１００とは異なる。

つまり、トラブル解決法検索システム２００は、操作手順データベース１０と、候補データ列指定部２０と、データ受信部３０と、質問抽出部５０と、データ出力部４０との他に、質問抽出部５０と、検索データ列生成部６０とを有する。

質問抽出部５０は、候補データ列指定部２０から候補データを受信し、候補データが１つしか存在しない場合には、絞り込みが完了したとみなし、その候補データを、データ出力部４０にそのまま出力する。

候補データが１つも存在しない場合、または候補データが複数ある場合には、もう一度説明をすることを、ユーザに促す文を、データ出力部４０に出力する。

たとえば、類似度テーブル生成部２１が生成した類似度テーブルにおいて、受信したデータ列を構成する全てのデータ要素の中で、閾値を超える類似度が存在しない場合、それらのデータ要素のうちで、最も類似度の高い値を持つデータ要素について、当該操作内容を、もう一度入力するように、ユーザに促す表示をデータ出力部４０に出力する。

つまり、検索用のデータ要素に対して、データベース１０側のいずれのデータ要素との類似度も閾値以下であれば、質問対象であると考えることができ、質問対象である検索用データ要素の中で、データベース１０側のいずれか１つのデータ要素との類似度が最高であるデータ要素について、ユーザに言い換えを促す文を、データ出力部４０が出力する。

図８は、実施例２における類似度テーブル生成部２１が作ったデータ要素類似度テーブルの例を示す図である。

図９は、実施例２において、順序関係比較部２２による比較結果を示す図である。

たとえば、データ要素類似度テーブルが、図８に示す通りであり、閾値が０．６である場合、データ列Ａもデータ列Ｂもどちらも、図９に示すように、閾値を超えるデータ要素が、順序通りに出現しているので、データ列Ａもデータ列Ｂも、スコアが６点であり、候補データが複数存在している。

この場合、閾値の０．６を超えた類似度が存在しなかったデータ要素（２）、（３）の中で、最も類似度が高いものは、データ要素ａと（２）との類似度０．５である。したがって、データ要素（２）について、もう少し詳しく説明するように、または、データ要素（２）を別の表現で言い換えるように、ユーザに再入力を促す。

このようにするのは、ユーザが情報量の低いデータを入力し、しかも、その入力文が曖昧なである場合、最も情報量の高いと思われる情報であって、利用できる可能性の高い情報を利用しようとするためである。

検索データ列生成部６０は、データ受信部３０から、複数回データ列を受信した場合、複数の受信データ列に基づいて、新たに検索データ列を生成する。この生成した検索データ列の各データ要素と、データベース１０に格納されている全てのデータ列のデータ要素とについて、類似度テーブル生成部２１が、再度、類似度を計算する。

図１０は、実施例２において、はじめに受信データ列Ｉを受信した後に、候補データが１つも存在しない場合か、または、候補データが複数存在する場合におけるデータ列を示す図である。

つまり、図１０は、類似度テーブルにおいて、閾値を超えない複数のデータ要素の中で、データ要素（２）の類似度が最も高いと判断され、データ要素（２）を詳細化するように、ユーザに促した結果、受信データ列ＩＩを得ることができた場合を示す図である。

新たな検索データ列を生成する際に重要なことは、一度、受信した受信データ列Ｉ内の順序（１）→（２）→（３）→（４）において、受信データ列ＩＩの（２）−１→（２）−２→（２）−３→の順序を、生成した検索データ列内で保つことであり、これを保つ限り、そのマージの仕方は、複数考えられる。

図１０に示す例では、前回受信したデータ列の中で、類似度の高かったデータ要素（＝質問を行ったデータ要素）について、新たな受信データ列に置き換えたものを、新たな検索データ列としている。つまり、受信データ列Ｉのデータ要素（２）を、データ要素（２）−１→データ要素（２）−２→データ要素（２）−３のデータ列に置き換えた検索データ列を、新たな検索データ列とする。

この例は、受信データ列Ｉにおいて、データ要素（２）を、受信データ列ＩＩの「（２）−１→（２）−２→（２）−３」に置き換えた検索データ列の生成方法であり、受信データ列Ｉが受信データ列ＩＩに完全に従属している。

しかし、ユーザが何度も入力する際、従属関係を正確に持って回答するとは限らない。たとえば、データ要素（２）が必ずしも、データ要素「（２）−１、（２）−２、（２）−３」と全く同じ状況を示しているとは限らず、ユーザが、データ要素（２）をより詳しく説明しようと試みて、データ要素（１）の内容も含めて、「データ要素（２）−１、（２）−２、（２）−３」のように、言い換える場合も考えられる。

この場合に対処するために、上記方法で生成した検索データ列において、データ要素（１）とデータ要素（２）−１との順序を入れ替えた新たなデータ列を生成し、次候補データ検索列として検索することによって、検索精度が向上する場合もある。

これと同様に、ユーザが、データ要素（３）の内容も含めて、データ要素（２）を言い換えた場合、上記方法で生成した検索データ列におけるデータ要素（３）と２−（３）との順序を入れ替えた次候補検索データ列を生成し、これらの全て、または、これらのうちの１つの検索データ列を、検索として用いるようにしてもよい。

このように、一度、受信した受信データ列Ｉにおける「（１）→（２）→（３）→（４）」の順序と、受信データ列ＩＩにおける「（２）−１→（２）−２→（２）−３」の順序とを保ちながら、次候補検索データ列として、検索データ列を複数、生成するようにしてもよい。

さらに、従属関係を全く持たない回答をした場合に対処するためには、複数回受信した受信データ列Ｉ、ＩＩ、…を、全てそのまま検索データ列として利用するようにしてもよい。

実施例２におけるデータ受信部３０は、実施例１のデータ受信部３０と同じ機能を有し、また、複数回受信した受信データ列を記憶する機能を有する。

類似度テーブル生成部２１は、実施例１の類似度テーブル生成部２１の機能を有し、また、検索データ列が複数存在する場合には、複数個の検索データ列について、それぞれ類似度テーブルを生成する。

実施例２における順序関係比較部２２は、実施例１の順序関係比較部２２と同様の機能を有し、また、データベース１０内のデータ列のそれぞれについて、スコアリングを行う。検索データ列が１つである場合、実施例１における順序関係比較部２２が行なうスコアリンツと同様の方法で、スコアリングを行う。

検索データ列が複数存在している場合、実施例１の順序関係比較部２２が行なうスコアリングと同様に、スコアリングし、それぞれの検索データ列についてスコアリングする。すなわち、データベース１０内の各データ列に対し、検索データ列毎のスコアが計算される。

各検索候補データ列についてスコアを計算した後に、最終的なスコアを算出する方法は、各検索データ列によるスコアリング結果の和を、スコアとして利用する場合や、次候補検索データ列には低い重み付けをし、和をとる方法等、複数考えられ、データベース１０内の各データ列について、最終的なスコアが算出される。

データ出力部４０は、質問抽出部５０で生成された質問や類似検索結果のデータを提示する。

図１１は、実施例２において、データベース１０を検索する動作を示すフローチャートである。

ステップＳ１１、Ｓ１２、Ｓ４１、Ｓ４２以外は、図６に示すフローチャートと同様であるので、上記同様部分の説明を省略する。

データ列の受信回路が初めてであれば（Ｓ１１）、Ｓ２０へ進む。受信回数が２回以上であれば（Ｓ１１）、複数回の受信結果をまとめて、新たな検索データ列を生成し（Ｓ１２）、Ｓ２０へ進む。たとえば、前回の検索データ列を構成する複数のデータ要素の中で、閾値を超えず、最も高い類似度の値を持ったデータ要素を、今回受信した受信データ列に置き換えたものを、新たに検索データ列とすることによって、新たな検索データ列を生成する（Ｓ１２）。

検索データ列を構成するデータ要素（１）、（２）…と、操作手順データベース１０内のデータ列に含まれている全てのデータ要素との類似度を、形態素単位で一致率を調べる等の方法によって計算し、類似度テーブル生成部２１が類似度のテーブルを作成する。そして、検索データ列が複数個存在する場合には、各検索データ列について、類似度テーブルを生成する（Ｓ２０）。

ステップＳ４０で抽出した候補データの数が、１個である場合は、ステップＳ５０へ進み、候補データが０個または複数個である場合には、ステップＳ４２へ進む（Ｓ４１）。

候補データを絞り込む場合、所定のデータ要素に対して言い換えを行うように、ユーザに促す文を出力する。たとえば、類似度テーブルを参照し、検索データ列の中で閾値を超える類似度が存在しなかったデータ要素を選び、その中で最も類似度の高い値を持つデータ要素を選び、そのデータ要素に関して、もう一度詳細化するように促す文を生成する。

上記実施例１によれば、ユーザが行った作業の説明文を、手順に沿って入力させ、上記入力した説明文の順序も、検索条件として用いるので、入力情報から多くの情報を抽出し、検索することができ、初心者ユーザによる状況説明が、支離滅裂で著しく曖昧であっても、トラブル解決へナビゲートすることができる。

上記実施例２によれば、上記データ列をデータベース１０内から絞り込んだ結果（候補データ）が複数ある場合、または候補データが１つもない場合に、適切な絞り込み結果に到達するまで、類似度が比較的高い検索データのデータ要素について、ユーザに問い返し、複数の検索データ列を受信する手段を設け、受信した複数の検索データ列のデータ要素間の順序の整合性を加味して、スコアリングを行う手段を設けたので、問題状況の表現があまりにも稚拙で、各データ列単位では、類似するデータ列を絞り込めない場合であっても、複数回受信した検索データ列の中で、データ要素とそれらの順序関係の組み合わせの整合性を図る（つまり、データ要素とそれらの順序関係の組み合わせの類似性をチェックする）ので、データ列単位の比較をさらに拡張した絞り込みを実行することができる。したがって、ユーザのトラブルを、自分が一度で的確に表現することができない場合でも、複数のデータ列の順序関係を加味し、適切な検索結果に辿り着くことができる。

なお、トラブル解決のためのデータベース検索システムであれば、情報機器におけるトラブル解決法を検索する場合以外でも、トラブル解決法を検索する場合に、上記実施例を応用することができる。

本発明の実施例１である情報機器におけるトラブル解決法検索システム１００を示す図である。実施例１における操作手順データベース１０の例を示す図である。実施例１における入力インタフェースの例を示す図である。実施例１におけるデータ要素類似度テーブルを示す図である。実施例１における順序関係比較部２３が、閾値よりも高い類似度を持つデータ要素の順序関係を比較した結果の例を示す図である。実施例１において、データベース１０を検索する動作を示すフローチャートである。本発明の実施例２である情報機器におけるトラブル解決法検索システム２００を示すブロック図である。実施例２における類似度テーブル生成部２１が作ったデータ要素類似度テーブルの例を示す図である。実施例２において、順序関係比較部２２による比較結果を示す図である。実施例２において、はじめに受信データ列Ｉを受信した後に、候補データが１つも存在しない場合か、または、候補データが複数存在する場合におけるデータ列を示す図である。実施例２において、データベース１０を検索する動作を示すフローチャートである。

符号の説明

１００、２００…情報機器におけるトラブル解決法検索システム、
１０…操作手順データベース、
２０…候補データ列指定部、
２１…類似度テーブル生成部、
２２…順序関係比較部、
２３…データ列類似度評価部、
３０…データ受信部、
４０…データ出力部、
５０…質問抽出部、
６０…検索データ列生成部。

Claims

単語、節、文章等であるデータ要素を、ユーザに、順番に複数個入力させ、これら入力したデータ要素によって構成されているデータ列を用い、上記データ要素が複数個順番に並んだデータ列によって構成されている文書を、データベースから検索するデータベース検索装置において、
ユーザが入力したデータ列と、上記データベースに格納されている複数のデータ列のそれぞれとの間におけるデータ要素同士の類似度に基づく類似度を計算する類似度テーブル生成手段と；
データ要素の並びの順序に応じて、類似度を計算する順序関係比較手段と；
上記類似度テーブル生成手段が生成した類似度と、上記順序関係比較手段が計算した類似度とに基づいて、データベースに格納されているデータ列毎に、スコアリングするスコアリング手段と；
上記スコアリング手段がスコアリングしたスコアに基づいて、候補データ列を、上記データベースに格納されているデータ列から検索する検索手段と；
を有することを特徴とするデータベース検索装置。
請求項１において、
上記検索手段が検索した候補データが複数存在する場合、または、候補データが１つも存在しない場合に、上記類似度が最も高いデータ要素について、ユーザに質問を提示する質問提示手段と；
上記提示された質問に答えてユーザが入力した新たなデータ列を、受信する手段と；
上記受信した複数のデータ要素間の順序の整合性を、加味して、上記スコアリング手段にスコアリングさせるスコアリング制御手段と；
を有することを特徴とするデータベース検索装置。
請求項１において、
上記順序関係比較手段は、閾値よりも高い類似度を持つデータ要素が、順序通りに出現していれば、そのデータ列に、スコアを加算する手段であることを特徴とするデータベース検索装置。
単語、節、文章等であるデータ要素を、ユーザに、順番に複数個入力させ、これら入力したデータ要素によって構成されているデータ列を用い、上記データ要素が複数個順番に並んだデータ列によって構成されている文書を、データベースから検索するデータベース検索方法において、
ユーザが入力したデータ列と、上記データベースに格納されている複数のデータ列のそれぞれとの間におけるデータ要素同士の類似度に基づく類似度を計算する類似度テーブル生成段階と；
データ要素の並びの順序に応じて、類似度を計算する順序関係比較段階と；
上記類似度テーブル生成段階で生成した類似度と、上記順序関係比較段階で計算した類似度とに基づいて、データベースに格納されているデータ列毎に、スコアリングするスコアリング段階と；
上記スコアリング段階でスコアリングしたスコアに基づいて、候補データ列を、上記データベースに格納されているデータ列から検索する検索段階と；
を有することを特徴とするデータベース検索方法。
単語、節、文章等であるデータ要素を、ユーザに、順番に複数個入力させ、これら入力したデータ要素によって構成されているデータ列を用い、上記データ要素が複数個順番に並んだデータ列によって構成されている文書を、データベースから検索するプログラムにおいて、
ユーザが入力したデータ列と、上記データベースに格納されている複数のデータ列のそれぞれとの間におけるデータ要素同士の類似度に基づく類似度を計算する類似度テーブル生成手順と；
データ要素の並びの順序に応じて、類似度を計算する順序関係比較手順と；
上記類似度テーブル生成手順で生成した類似度と、上記順序関係比較手順で計算した類似度とに基づいて、データベースに格納されているデータ列毎に、スコアリングするスコアリング手順と；
上記スコアリング手順でスコアリングしたスコアに基づいて、候補データ列を、上記データベースに格納されているデータ列から検索する検索手順と；
をコンピュータに実行させるプログラム。