JP2005128961A - データベース検索装置、データベース検索方法およびプログラム - Google Patents

データベース検索装置、データベース検索方法およびプログラム Download PDF

Info

Publication number
JP2005128961A
JP2005128961A JP2003366418A JP2003366418A JP2005128961A JP 2005128961 A JP2005128961 A JP 2005128961A JP 2003366418 A JP2003366418 A JP 2003366418A JP 2003366418 A JP2003366418 A JP 2003366418A JP 2005128961 A JP2005128961 A JP 2005128961A
Authority
JP
Japan
Prior art keywords
data
similarity
database
order
data string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003366418A
Other languages
English (en)
Other versions
JP4301496B2 (ja
Inventor
Momoko Nakatani
桃子 中谷
Masaru Miyamoto
勝 宮本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003366418A priority Critical patent/JP4301496B2/ja
Publication of JP2005128961A publication Critical patent/JP2005128961A/ja
Application granted granted Critical
Publication of JP4301496B2 publication Critical patent/JP4301496B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract


【課題】 ユーザによる入力文章の大部分が曖昧語で構成され、適切に検索することが困難な場合でも、不必要な問い返しを避け、適切な検索結果を得ることができるようにするものである。

【解決手段】 ユーザが入力したデータ列と、上記データベースに格納されている複数のデータ列のそれぞれとの間におけるデータ要素同士の類似度に基づく類似度を計算する類似度テーブル生成手段と、データ要素の並びの順序に応じて、類似度を計算する順序関係比較手段と、上記類似度テーブル生成手段が生成した類似度と、上記順序関係比較手段が計算した類似度とに基づいて、データベースに格納されているデータ列毎に、スコアリングするスコアリング手段と、上記スコアリング手段がスコアリングしたスコアに基づいて、候補データ列を、上記データベースに格納されているデータ列から検索する検索手段とを有するデータベース検索装置である。

【選択図】 図1

Description

本発明は、所定の商品等を使用中に、困難に遭遇したユーザが、その困難な状況に対する解決法を絞り込むデータベース検索装置、データベース検索方法およびプログラムに関する。
情報化が進み、情報機器の種類や使用方法が、多岐にわたりしかも複雑化することに伴い、情報機器を使いこなせないユーザが増加している。
ユーザが情報機器を使用中に、何らかのトラブルに遭遇した場合、そのユーザは何らかの方法でトラブルシューティングする必要がある。この場合、ユーザは、まず、自分が遭遇したトラブルの状態を的確に把握し、次に、トラブルシューティングの項目を、取扱説明書等から検索するか、または、遭遇したトラブルの状態を、他人に適切に説明し、これによって、解決方法を得る。
しかし、ユーザが、自分のトラブル状況を理解していない場合、表現能力が乏しい場合には、目的とするトラブル解決方法に、ユーザが辿り着くことが困難である。
たとえば、所定の情報機器におけるトラブル解決法検索データベースから、トラブルシューティングの項目を検索する場合、分類されているカテゴリの中から、適切なトラブル解決法を選択ことによって、目的とするページを検索する方式では、システム側が提供する選択肢と、ユーザが考えるトラブル状況の分類とが異なっていることがあり、この場合には、適切な解決方法を探すことができないという問題がある。
また、キーワード検索では、遭遇したトラブルを適切に表現する検索ワードを,正確に記入しなければ、目的とするページに辿り着くことができないので、特に初心者のユーザにとっては、遭遇しているトラブルを一言のワードで表現することが非常に困難であるという問題がある。
ところで、第1の従来例として、製品知識が乏しいユーザ等を対象にし、曖昧な検索用語でも、知りたい情報に辿り着くことができることを目的とした製品サポート用検索システムが知られている(たとえば、特許文献1参照)。
この第1の従来例では、ユーザが「思いつく言葉」を、検索条件として使用するので、質問者が知りたい事柄を表す語が収録されている辞書を使用する。そして、ユーザが入力した入力語が、上記辞書に収録されているどの語と一致するのかを検索するために、入力語だけではなく、入力語からいくつかの文字を削除した語についても、検索の対象にしている。
また、第2の従来例として、ユーザが入力した自然文による入力語を受け付ける入力手段を有し、検索文の中のどのデータベース項目に対応するかが曖昧な場合に、曖昧語の情報を提示することによってユーザに問い返し、また、上記提示された曖昧語の中から、ユーザが選択した内容を、履歴として格納、反映、削除することによって、ユーザの意図に合った検索を行うシステムが知られている(たとえば、特許文献2参照)。
特開2002−123541公報 特開平7−093362号公報
しかし、上記第1の従来例は、曖昧さを許容するキーワード検索システムであるので、トラブルに遭遇した初心者ユーザを支援する場合、ユーザの表現力が著しく乏しければ、キーワードのみを使用した検索条件では、適切な検索結果を得ることができないという問題がある。
また、上記第1の従来例では、ユーザに曖昧語を問い返し、検索条件を絞り込む場合、ユーザによる一度の入力で、検索対象がある程度絞り込まれることを前提としているので、入力文章の大部分が曖昧語で構成されていると、適切な検索結果を得るまでに、多くの不必要な問い返しをせざるを得ないという問題がある。
本発明は、ユーザによる入力文章の大部分が曖昧語で構成され、適切に検索することが困難な場合でも、不必要な問い返しを避け、適切な検索結果を得ることができるデータベース検索装置、データベース検索方法およびプログラムを提供することを目的とするものである。
本発明は、単語、節、文章等であるデータ要素を、ユーザに、順番に複数個入力させ、これら入力したデータ要素によって構成されているデータ列を用い、上記データ要素が複数個順番に並んだデータ列によって構成されている文書を、データベースから検索するデータベース検索装置において、ユーザが入力したデータ列と、上記データベースに格納されている複数のデータ列のそれぞれとの間におけるデータ要素同士の類似度に基づく類似度を計算する類似度テーブル生成手段と、データ要素の並びの順序に応じて、類似度を計算する順序関係比較手段と、上記類似度テーブル生成手段が生成した類似度と、上記順序関係比較手段が計算した類似度とに基づいて、データベースに格納されているデータ列毎に、スコアリングするスコアリング手段と、上記スコアリング手段がスコアリングしたスコアに基づいて、候補データ列を、上記データベースに格納されているデータ列から検索する検索手段とを有することを特徴とするデータベース検索装置である。
本発明によれば、ユーザからの順序関係を持つ複数の自然文(または単語、節等)の入力を受け付ける手段を有し、その順序関係をも考慮して検索するので、ユーザによる入力文章の大部分が曖昧語で構成され、適切に検索することが困難な場合であっても、不必要な問い返しを避け、適切な検索結果を得ることができるという効果を奏する。
つまり、請求項1、4、5記載の発明によれば、データ要素単位の比較に加え、順序関係を利用して類似度を算出するので、絞り込みが適切に行われ、これによって、機器に対する知識が乏しく、トラブルに遭遇した際にそのトラブルをうまく表現できないユーザから、利用できる情報を最大限、取り出し、問題解決へ導くことができるという効果を奏する。
請求項2記載の発明によれば、問題状況の表現が著しく曖昧な場合に、各データ列単位では類似するデータベースを絞り込めない場合においても、複数回受信したデータ要素とそれらの順序関係の組み合わせとの整合性を図るので、列単位の比較を、さらに拡張して絞り込むことができ、これによって、ユーザが自分のトラブルを一度では的確に表現できない場合であっても、適切な検索結果に辿り着くことができるという効果を奏する。
インターネットに関するユーザサポートのデータベース検索システムを一例として詳細に説明することによって、本発明を説明する。
図1は、本発明の実施例1である情報機器におけるトラブル解決法検索システム100を示す図である。
情報機器におけるトラブル解決法検索システム100は、情報機器についての知識が乏しく、トラブルに遭遇した際にそのトラブルをうまく表現できないユーザから、利用できる情報を最大限取り出し、トラブル解決へ導くシステムである。
情報機器におけるトラブル解決法検索システム100は、操作手順データベース10と、候補データ列指定部20と、データ受信部30と、データ出力部40とを有する。
図2は、実施例1における操作手順データベース10の例を示す図である。
操作手順データベース10は、少なくともデータIDと、データ列(順序を持つデータの並び)とによって構成されている。
データ列は、データ要素a、b、c、…によって構成されている一連の手順説明文であり、データ要素a、b、c、…は、操作手順である。つまり、「データ要素」は、ユーザが入力した説明文であり、「データ列」は、上記データ要素が並んでいる一連の手順説明文である。
図2に示す例において、データ列は、データ列A、データ列B、データ列Cである。
データ列Aは、たとえばマニュアル等に記述されている機器の操作手順を構造化したものである。
図3は、実施例1における入力インタフェースの例を示す図である。
データ受信部30は、トラブル発生までの操作手順を示す入力データ(データ列)を受信する機能を持ち、たとえば、図3に示すようなインタフェースであり、トラブル発生に行ったユーザの操作手順(データ列)であって、ユーザが入力した操作手順(データ列)を受信する。これによって、トラブル発生までにユーザが行った操作(データ列)を、順序立てて入力することを、ユーザが促される。
この入力すべき操作手順(データ列)は、自然文等、なるべくユーザが思った通りに記入することを前提とするので、稚拙な文も多く含まれることが予想される。データ受信部30が受信した文章(1)→(2)→(3)→…の並びが、検索データ列であり、この検索データ列を構成する文章(1)、(2)、(3)…のそれぞれが、データ要素である。ユーザが、「次へ」と表示されているボタンを押すまで、受信が続行され、データ要素の数は、増え続ける。
候補データ列指定部20は、類似度テーブル生成部21と、順序関係比較部22と、データ列類似度評価部23とを有する。
データ受信部30が受信した検索データ列と、操作手順データベース10に格納されている各データ列との類似度を評価し、類似度の高いデータ列を、候補データ列として指定する。この候補データ列指定部20は、類似度テーブル生成部21と、順序関係比較部22と、データ列類似度評価部23によって構成されている。
類似度テーブル生成部21は、操作手順データベース10に格納されている全ての操作手順データ列を構成する全てのデータ要素と、データ受信部30から取得した検索データ列を構成する全てのデータ要素との類似度を、それぞれ計算する。
図4は、実施例1におけるデータ要素類似度テーブルを示す図である。
類似度テーブル生成部21が、操作手順データ列を構成しているデータ要素同士の類似度を計算した結果、図4に示すような類似度テーブルを生成する。
データ要素間の類似度を計算する場合、たとえば、各データ要素の形態素解析を行い、形態素単位で一致率を計算することによって、データ要素間の類似度を計算する。また、名詞・動詞のみの一致率を計算し、データ要素間の類似度を計算するようにしてもよい。
データ要素間の類似度を計算した後に、テーブルに基づいて、データベース10の各データ列についてスコアリングする。スコアリングする場合、たとえば、予め設定した閾値よりも高い類似度を持つデータ要素の個数を、データベース10に格納されているデータ列について、スコアとして加算する方法を採用するようにしてもよく、また、閾値よりも高い類似度を持つデータ要素の個数を、データベース10に格納されているデータ列のデータ要素数で正規化する方法を採用するようにしてもよい。
図4に示す類似度テーブルにおいて、たとえば、閾値を0.6とした場合、データ列Aについては、データ要素aとデータ要素(2)との類似度、データ要素cとデータ要素(4)との類似度、データ要素dとデータ要素(3)との類似度が、それぞれ、0.7、0.9、0.82であり、閾値0.6を超えており、つまり閾値を超えているデータ要素が、3つ存在する。
所定のデータ列を構成するデータ要素であって、閾値よりも高い類似度を有するデータ要素の個数を、上記所定のデータ列のスコアであるとする。このようにすると、データ列Aの点数は、3点である。これと同様にすると、データ列Bの点数も、3点である。
順序関係比較部22は、データベース10に格納されているデータ列において、閾値よりも高い類似度を持つデータ要素が、順序通りに出現していれば、そのデータ列に、スコアを加算する。
図5は、実施例1における順序関係比較部23が、閾値よりも高い類似度を持つデータ要素の順序関係を比較した結果の例を示す図である。
たとえば、データベース10に格納されているデータ列Aについて、閾値を越えているデータ要素a、c、dは、図5に示すように、その出現順序がa、d、cの順序であり、これに対して、データベース10に格納されているデータ列Bでは、f、h、iの順に、順序通りデータ要素が出現しているので、全体として、データ列Bのほうが、図5に示すように、より高いスコアを得る。
つまり、実施例1では、順序通りにデータ要素が並んでいるもの程、高いスコアをつける。たとえば、以下の式に従って、スコアを付ける。
Sr=Se+Sp
Sr:データ列に対するスコア
Se:類似度が閾値を超えているデータ要素の数
Sp:閾値を超えているデータ要素xの後ろに、順序通りのデータ要素(データ要素xよりも後の順序に位置するデータ要素)yが位置している数
データ列Aの場合、データ要素aの後ろに、データ要素aよりも後の順序に位置するデータ要素cとデータ要素dとが位置しているので、スコアSr=2である。データ列Bの場合、データ要素fの後ろに、データ要素fよりも後の順序に位置するデータ要素hとデータ要素iとが位置し、さらに、データ要素hの後ろに、データ要素よりも後の順序に位置するデータ要素iが位置しているので、スコアSr=2+1=3である。
上記「類似度が閾値を超えているデータ要素の数Se」は、データベース10に格納されているデータ列を構成するデータ要素中に、検索データ列のデータ要素(類似度が閾値以上であるデータ要素)が何個含まれるかを表す指標である。たとえば、データ要素aと(1)、bと(1)、cと(1)が、閾値以上である場合、そのデータ列で、類似度が閾値を超えているデータ要素数は、1(Se=1)であり、また、たとえば、aと(1)、aと(2)、aと(3)が閾値以上である場合、そのデータ列で類似度が閾値を超えているデータ要素数は3(Se=3)とみなすことができる。
また、Sr=aSe+bSp(a、bは重み係数)とし、データ要素数と順序関係とについて、どちらかに重みを与えるスコアリング方法や、そのスコアを、データベース10内に格納されているデータ列のデータ要素数に応じて、正規化する方法、さらに、Sr=Se・Spとする等、データ要素・順序に関するスコアリング方法は、複数考えられ、検索対象やデータベース10の特徴に応じて、スコアリングの関数を生成する必要がある。
データ列類似度評価部23は、類似度テーブル生成部21と順序関係比較部22とが計算したデータ列のスコアに基づいて、予め設定した閾値を超えたスコアを持つデータを、候補データ列として抽出する。
また、データ列類似度評価部23は、最もスコアの高いデータ列を、候補データ列とするようにしてもよい。どちらの場合においても、候補データ列が、複数存在してもよい。
データ出力部40は、候補データ列指定部20が抽出した候補データを出力する。
図6は、実施例1において、データベース10を検索する動作を示すフローチャートである。
トラブル状況が発生するまでにユーザが操作したことを、手順に沿ってユーザに入力させた文章を、データ要素(1)、(2)、…として受信し、(1)→(2)→…のデータ要素の一連を検索データ列とする(S10)。
検索データ列のデータ要素(1)、(2)…と、操作手順データベース10内に格納されているデータ列の全てのデータ要素との類似度を、形態素単位の一致率をみる等の方法で計算し、類似度テーブル生成部21が類似度テーブルを作成する(S20)。
上記作成された類似度テーブルにおいて、閾値を超えた類似度を持つデータ要素の出現順序を比較し、スコアリングを行う(S30)。たとえば、ステップS20で生成された類似度テーブルを参照し、閾値を超えている類似度の個数をカウントし、出現順序が検索データ列と等しい順序である類似度の個数をカウントし、これら個数の和を算出したものを、そのデータ列のスコアとする(S30)。
ステップS30で算出した各データ列のスコアの中で、閾値を超えたスコアを持つデータ列(または、最も大きいスコア値を持つデータ列)を候補データ(トラブル解決法の候補データ)とする(S40)。
そして、ステップS40で抽出した候補データを、画面に出力し、処理を終了する(S50)。
つまり、実施例1において、操作(=データ要素)が並べられている操作手順(=データ列)によって構成されるデータベース10が存在する場合、ユーザの手順毎の文章入力を受け付け、この入力文章を、データ要素が並べられている検索データ列とし、データベース10内のデータ列のデータ要素毎の類似度が高いデータ要素を持つデータ列にスコア付けする手段を設け、また、検索データ列と、類似度の高いデータ要素を含むデータ列との間で、データ要素の並びが、検索データ列のデータ要素の並びと同じ順序であるデータ列に、高いスコア付けを行う手段を設けている。
従来は、曖昧な表現でされた問題状況の説明文を、上記説明文のデータ要素単位でしか比較していないので、類似するものが少なく、適切に絞り込むことができない。
ところが、上記実施例1では、機器に対する知識が乏しく、トラブルに遭遇した際に、そのトラブルをうまく表現できないユーザから、利用できる情報を最大限、取り出し、問題解決へ導くことができる。
図7は、本発明の実施例2である情報機器におけるトラブル解決法検索システム200を示すブロック図である。
トラブル解決法検索システム200は、問題状況の表現があまりに稚拙で、1つの検索データ列では、類似するデータ列を絞り込めない場合であっても、複数の検索データ列の中のデータ要素の順序関係を加味することによって、適切な検索結果に辿り着くことができる実施例である。
トラブル解決法検索システム200は、基本的には、トラブル解決法検索システム100と同じであり、トラブル解決法検索システム100に、検索データ列生成部60と、質問抽出部50とが付加されている点のみが、トラブル解決法検索システム100とは異なる。
つまり、トラブル解決法検索システム200は、操作手順データベース10と、候補データ列指定部20と、データ受信部30と、質問抽出部50と、データ出力部40との他に、質問抽出部50と、検索データ列生成部60とを有する。
質問抽出部50は、候補データ列指定部20から候補データを受信し、候補データが1つしか存在しない場合には、絞り込みが完了したとみなし、その候補データを、データ出力部40にそのまま出力する。
候補データが1つも存在しない場合、または候補データが複数ある場合には、もう一度説明をすることを、ユーザに促す文を、データ出力部40に出力する。
たとえば、類似度テーブル生成部21が生成した類似度テーブルにおいて、受信したデータ列を構成する全てのデータ要素の中で、閾値を超える類似度が存在しない場合、それらのデータ要素のうちで、最も類似度の高い値を持つデータ要素について、当該操作内容を、もう一度入力するように、ユーザに促す表示をデータ出力部40に出力する。
つまり、検索用のデータ要素に対して、データベース10側のいずれのデータ要素との類似度も閾値以下であれば、質問対象であると考えることができ、質問対象である検索用データ要素の中で、データベース10側のいずれか1つのデータ要素との類似度が最高であるデータ要素について、ユーザに言い換えを促す文を、データ出力部40が出力する。
図8は、実施例2における類似度テーブル生成部21が作ったデータ要素類似度テーブルの例を示す図である。
図9は、実施例2において、順序関係比較部22による比較結果を示す図である。
たとえば、データ要素類似度テーブルが、図8に示す通りであり、閾値が0.6である場合、データ列Aもデータ列Bもどちらも、図9に示すように、閾値を超えるデータ要素が、順序通りに出現しているので、データ列Aもデータ列Bも、スコアが6点であり、候補データが複数存在している。
この場合、閾値の0.6を超えた類似度が存在しなかったデータ要素(2)、(3)の中で、最も類似度が高いものは、データ要素aと(2)との類似度0.5である。したがって、データ要素(2)について、もう少し詳しく説明するように、または、データ要素(2)を別の表現で言い換えるように、ユーザに再入力を促す。
このようにするのは、ユーザが情報量の低いデータを入力し、しかも、その入力文が曖昧なである場合、最も情報量の高いと思われる情報であって、利用できる可能性の高い情報を利用しようとするためである。
検索データ列生成部60は、データ受信部30から、複数回データ列を受信した場合、複数の受信データ列に基づいて、新たに検索データ列を生成する。この生成した検索データ列の各データ要素と、データベース10に格納されている全てのデータ列のデータ要素とについて、類似度テーブル生成部21が、再度、類似度を計算する。
図10は、実施例2において、はじめに受信データ列Iを受信した後に、候補データが1つも存在しない場合か、または、候補データが複数存在する場合におけるデータ列を示す図である。
つまり、図10は、類似度テーブルにおいて、閾値を超えない複数のデータ要素の中で、データ要素(2)の類似度が最も高いと判断され、データ要素(2)を詳細化するように、ユーザに促した結果、受信データ列IIを得ることができた場合を示す図である。
新たな検索データ列を生成する際に重要なことは、一度、受信した受信データ列I内の順序(1)→(2)→(3)→(4)において、受信データ列IIの(2)−1→(2)−2→(2)−3→の順序を、生成した検索データ列内で保つことであり、これを保つ限り、そのマージの仕方は、複数考えられる。
図10に示す例では、前回受信したデータ列の中で、類似度の高かったデータ要素(=質問を行ったデータ要素)について、新たな受信データ列に置き換えたものを、新たな検索データ列としている。つまり、受信データ列Iのデータ要素(2)を、データ要素(2)−1→データ要素(2)−2→データ要素(2)−3のデータ列に置き換えた検索データ列を、新たな検索データ列とする。
この例は、受信データ列Iにおいて、データ要素(2)を、受信データ列IIの「(2)−1→(2)−2→(2)−3」に置き換えた検索データ列の生成方法であり、受信データ列Iが受信データ列IIに完全に従属している。
しかし、ユーザが何度も入力する際、従属関係を正確に持って回答するとは限らない。たとえば、データ要素(2)が必ずしも、データ要素「(2)−1、(2)−2、(2)−3」と全く同じ状況を示しているとは限らず、ユーザが、データ要素(2)をより詳しく説明しようと試みて、データ要素(1)の内容も含めて、「データ要素(2)−1、(2)−2、(2)−3」のように、言い換える場合も考えられる。
この場合に対処するために、上記方法で生成した検索データ列において、データ要素(1)とデータ要素(2)−1との順序を入れ替えた新たなデータ列を生成し、次候補データ検索列として検索することによって、検索精度が向上する場合もある。
これと同様に、ユーザが、データ要素(3)の内容も含めて、データ要素(2)を言い換えた場合、上記方法で生成した検索データ列におけるデータ要素(3)と2−(3)との順序を入れ替えた次候補検索データ列を生成し、これらの全て、または、これらのうちの1つの検索データ列を、検索として用いるようにしてもよい。
このように、一度、受信した受信データ列Iにおける「(1)→(2)→(3)→(4)」の順序と、受信データ列IIにおける「(2)−1→(2)−2→(2)−3」の順序とを保ちながら、次候補検索データ列として、検索データ列を複数、生成するようにしてもよい。
さらに、従属関係を全く持たない回答をした場合に対処するためには、複数回受信した受信データ列I、II、…を、全てそのまま検索データ列として利用するようにしてもよい。
実施例2におけるデータ受信部30は、実施例1のデータ受信部30と同じ機能を有し、また、複数回受信した受信データ列を記憶する機能を有する。
類似度テーブル生成部21は、実施例1の類似度テーブル生成部21の機能を有し、また、検索データ列が複数存在する場合には、複数個の検索データ列について、それぞれ類似度テーブルを生成する。
実施例2における順序関係比較部22は、実施例1の順序関係比較部22と同様の機能を有し、また、データベース10内のデータ列のそれぞれについて、スコアリングを行う。検索データ列が1つである場合、実施例1における順序関係比較部22が行なうスコアリンツと同様の方法で、スコアリングを行う。
検索データ列が複数存在している場合、実施例1の順序関係比較部22が行なうスコアリングと同様に、スコアリングし、それぞれの検索データ列についてスコアリングする。すなわち、データベース10内の各データ列に対し、検索データ列毎のスコアが計算される。
各検索候補データ列についてスコアを計算した後に、最終的なスコアを算出する方法は、各検索データ列によるスコアリング結果の和を、スコアとして利用する場合や、次候補検索データ列には低い重み付けをし、和をとる方法等、複数考えられ、データベース10内の各データ列について、最終的なスコアが算出される。
データ出力部40は、質問抽出部50で生成された質問や類似検索結果のデータを提示する。
図11は、実施例2において、データベース10を検索する動作を示すフローチャートである。
ステップS11、S12、S41、S42以外は、図6に示すフローチャートと同様であるので、上記同様部分の説明を省略する。
データ列の受信回路が初めてであれば(S11)、S20へ進む。受信回数が2回以上であれば(S11)、複数回の受信結果をまとめて、新たな検索データ列を生成し(S12)、S20へ進む。たとえば、前回の検索データ列を構成する複数のデータ要素の中で、閾値を超えず、最も高い類似度の値を持ったデータ要素を、今回受信した受信データ列に置き換えたものを、新たに検索データ列とすることによって、新たな検索データ列を生成する(S12)。
検索データ列を構成するデータ要素(1)、(2)…と、操作手順データベース10内のデータ列に含まれている全てのデータ要素との類似度を、形態素単位で一致率を調べる等の方法によって計算し、類似度テーブル生成部21が類似度のテーブルを作成する。そして、検索データ列が複数個存在する場合には、各検索データ列について、類似度テーブルを生成する(S20)。
ステップS40で抽出した候補データの数が、1個である場合は、ステップS50へ進み、候補データが0個または複数個である場合には、ステップS42へ進む(S41)。
候補データを絞り込む場合、所定のデータ要素に対して言い換えを行うように、ユーザに促す文を出力する。たとえば、類似度テーブルを参照し、検索データ列の中で閾値を超える類似度が存在しなかったデータ要素を選び、その中で最も類似度の高い値を持つデータ要素を選び、そのデータ要素に関して、もう一度詳細化するように促す文を生成する。
上記実施例1によれば、ユーザが行った作業の説明文を、手順に沿って入力させ、上記入力した説明文の順序も、検索条件として用いるので、入力情報から多くの情報を抽出し、検索することができ、初心者ユーザによる状況説明が、支離滅裂で著しく曖昧であっても、トラブル解決へナビゲートすることができる。
上記実施例2によれば、上記データ列をデータベース10内から絞り込んだ結果(候補データ)が複数ある場合、または候補データが1つもない場合に、適切な絞り込み結果に到達するまで、類似度が比較的高い検索データのデータ要素について、ユーザに問い返し、複数の検索データ列を受信する手段を設け、受信した複数の検索データ列のデータ要素間の順序の整合性を加味して、スコアリングを行う手段を設けたので、問題状況の表現があまりにも稚拙で、各データ列単位では、類似するデータ列を絞り込めない場合であっても、複数回受信した検索データ列の中で、データ要素とそれらの順序関係の組み合わせの整合性を図る(つまり、データ要素とそれらの順序関係の組み合わせの類似性をチェックする)ので、データ列単位の比較をさらに拡張した絞り込みを実行することができる。したがって、ユーザのトラブルを、自分が一度で的確に表現することができない場合でも、複数のデータ列の順序関係を加味し、適切な検索結果に辿り着くことができる。
なお、トラブル解決のためのデータベース検索システムであれば、情報機器におけるトラブル解決法を検索する場合以外でも、トラブル解決法を検索する場合に、上記実施例を応用することができる。
本発明の実施例1である情報機器におけるトラブル解決法検索システム100を示す図である。 実施例1における操作手順データベース10の例を示す図である。 実施例1における入力インタフェースの例を示す図である。 実施例1におけるデータ要素類似度テーブルを示す図である。 実施例1における順序関係比較部23が、閾値よりも高い類似度を持つデータ要素の順序関係を比較した結果の例を示す図である。 実施例1において、データベース10を検索する動作を示すフローチャートである。 本発明の実施例2である情報機器におけるトラブル解決法検索システム200を示すブロック図である。 実施例2における類似度テーブル生成部21が作ったデータ要素類似度テーブルの例を示す図である。 実施例2において、順序関係比較部22による比較結果を示す図である。 実施例2において、はじめに受信データ列Iを受信した後に、候補データが1つも存在しない場合か、または、候補データが複数存在する場合におけるデータ列を示す図である。 実施例2において、データベース10を検索する動作を示すフローチャートである。
符号の説明
100、200…情報機器におけるトラブル解決法検索システム、
10…操作手順データベース、
20…候補データ列指定部、
21…類似度テーブル生成部、
22…順序関係比較部、
23…データ列類似度評価部、
30…データ受信部、
40…データ出力部、
50…質問抽出部、
60…検索データ列生成部。

Claims (5)

  1. 単語、節、文章等であるデータ要素を、ユーザに、順番に複数個入力させ、これら入力したデータ要素によって構成されているデータ列を用い、上記データ要素が複数個順番に並んだデータ列によって構成されている文書を、データベースから検索するデータベース検索装置において、
    ユーザが入力したデータ列と、上記データベースに格納されている複数のデータ列のそれぞれとの間におけるデータ要素同士の類似度に基づく類似度を計算する類似度テーブル生成手段と;
    データ要素の並びの順序に応じて、類似度を計算する順序関係比較手段と;
    上記類似度テーブル生成手段が生成した類似度と、上記順序関係比較手段が計算した類似度とに基づいて、データベースに格納されているデータ列毎に、スコアリングするスコアリング手段と;
    上記スコアリング手段がスコアリングしたスコアに基づいて、候補データ列を、上記データベースに格納されているデータ列から検索する検索手段と;
    を有することを特徴とするデータベース検索装置。
  2. 請求項1において、
    上記検索手段が検索した候補データが複数存在する場合、または、候補データが1つも存在しない場合に、上記類似度が最も高いデータ要素について、ユーザに質問を提示する質問提示手段と;
    上記提示された質問に答えてユーザが入力した新たなデータ列を、受信する手段と;
    上記受信した複数のデータ要素間の順序の整合性を、加味して、上記スコアリング手段にスコアリングさせるスコアリング制御手段と;
    を有することを特徴とするデータベース検索装置。
  3. 請求項1において、
    上記順序関係比較手段は、閾値よりも高い類似度を持つデータ要素が、順序通りに出現していれば、そのデータ列に、スコアを加算する手段であることを特徴とするデータベース検索装置。
  4. 単語、節、文章等であるデータ要素を、ユーザに、順番に複数個入力させ、これら入力したデータ要素によって構成されているデータ列を用い、上記データ要素が複数個順番に並んだデータ列によって構成されている文書を、データベースから検索するデータベース検索方法において、
    ユーザが入力したデータ列と、上記データベースに格納されている複数のデータ列のそれぞれとの間におけるデータ要素同士の類似度に基づく類似度を計算する類似度テーブル生成段階と;
    データ要素の並びの順序に応じて、類似度を計算する順序関係比較段階と;
    上記類似度テーブル生成段階で生成した類似度と、上記順序関係比較段階で計算した類似度とに基づいて、データベースに格納されているデータ列毎に、スコアリングするスコアリング段階と;
    上記スコアリング段階でスコアリングしたスコアに基づいて、候補データ列を、上記データベースに格納されているデータ列から検索する検索段階と;
    を有することを特徴とするデータベース検索方法。
  5. 単語、節、文章等であるデータ要素を、ユーザに、順番に複数個入力させ、これら入力したデータ要素によって構成されているデータ列を用い、上記データ要素が複数個順番に並んだデータ列によって構成されている文書を、データベースから検索するプログラムにおいて、
    ユーザが入力したデータ列と、上記データベースに格納されている複数のデータ列のそれぞれとの間におけるデータ要素同士の類似度に基づく類似度を計算する類似度テーブル生成手順と;
    データ要素の並びの順序に応じて、類似度を計算する順序関係比較手順と;
    上記類似度テーブル生成手順で生成した類似度と、上記順序関係比較手順で計算した類似度とに基づいて、データベースに格納されているデータ列毎に、スコアリングするスコアリング手順と;
    上記スコアリング手順でスコアリングしたスコアに基づいて、候補データ列を、上記データベースに格納されているデータ列から検索する検索手順と;
    をコンピュータに実行させるプログラム。
JP2003366418A 2003-10-27 2003-10-27 データベース検索装置、データベース検索方法およびプログラム Expired - Fee Related JP4301496B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003366418A JP4301496B2 (ja) 2003-10-27 2003-10-27 データベース検索装置、データベース検索方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003366418A JP4301496B2 (ja) 2003-10-27 2003-10-27 データベース検索装置、データベース検索方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2005128961A true JP2005128961A (ja) 2005-05-19
JP4301496B2 JP4301496B2 (ja) 2009-07-22

Family

ID=34644766

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003366418A Expired - Fee Related JP4301496B2 (ja) 2003-10-27 2003-10-27 データベース検索装置、データベース検索方法およびプログラム

Country Status (1)

Country Link
JP (1) JP4301496B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007249975A (ja) * 2006-03-17 2007-09-27 Xerox Corp デバイスの問題を修正するためにユーザを援助する方法、システム、及びシステムの作成方法
JP2010066964A (ja) * 2008-09-10 2010-03-25 Kobe Steel Ltd 文検索装置,文検索プログラム,文検索方法
WO2010077714A3 (en) * 2008-12-09 2010-09-16 University Of Houston System Word sense disambiguation
US7827179B2 (en) 2005-09-02 2010-11-02 Nec Corporation Data clustering system, data clustering method, and data clustering program
WO2011068178A1 (ja) * 2009-12-04 2011-06-09 日本電気株式会社 関連文書検索システム、装置、方法及びプログラム
TWI474139B (zh) * 2012-09-20 2015-02-21 Min Hwei College Of Health Care Man 資料分群方法與其電腦程式軟體
JP2015135637A (ja) * 2014-01-17 2015-07-27 Kddi株式会社 ストーリーを持つ文章間の類似度を導出する類似検索プログラム、装置及び方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7827179B2 (en) 2005-09-02 2010-11-02 Nec Corporation Data clustering system, data clustering method, and data clustering program
JP2007249975A (ja) * 2006-03-17 2007-09-27 Xerox Corp デバイスの問題を修正するためにユーザを援助する方法、システム、及びシステムの作成方法
JP2010066964A (ja) * 2008-09-10 2010-03-25 Kobe Steel Ltd 文検索装置,文検索プログラム,文検索方法
WO2010077714A3 (en) * 2008-12-09 2010-09-16 University Of Houston System Word sense disambiguation
US8260605B2 (en) 2008-12-09 2012-09-04 University Of Houston System Word sense disambiguation
WO2011068178A1 (ja) * 2009-12-04 2011-06-09 日本電気株式会社 関連文書検索システム、装置、方法及びプログラム
JPWO2011068178A1 (ja) * 2009-12-04 2013-04-18 日本電気株式会社 関連文書検索システム、装置、方法及びプログラム
JP5712930B2 (ja) * 2009-12-04 2015-05-07 日本電気株式会社 関連文書検索システム、装置、方法及びプログラム
TWI474139B (zh) * 2012-09-20 2015-02-21 Min Hwei College Of Health Care Man 資料分群方法與其電腦程式軟體
JP2015135637A (ja) * 2014-01-17 2015-07-27 Kddi株式会社 ストーリーを持つ文章間の類似度を導出する類似検索プログラム、装置及び方法

Also Published As

Publication number Publication date
JP4301496B2 (ja) 2009-07-22

Similar Documents

Publication Publication Date Title
US11847176B1 (en) Generating context-based spell corrections of entity names
JP3820242B2 (ja) 質問応答型文書検索システム及び質問応答型文書検索プログラム
US9697249B1 (en) Estimating confidence for query revision models
US9558263B2 (en) Identifying and displaying relationships between candidate answers
CN103927329B (zh) 一种即时搜索方法和系统
US8688727B1 (en) Generating query refinements
US20060230022A1 (en) Integration of multiple query revision models
US20060259475A1 (en) Database system and method for retrieving records from a record library
US20110225180A1 (en) Guided search based on query model
US20060230005A1 (en) Empirical validation of suggested alternative queries
US11531693B2 (en) Information processing apparatus, method and non-transitory computer readable medium
JP2005157524A (ja) 質問応答システムおよび質問応答処理方法
US20120323905A1 (en) Ranking data utilizing attributes associated with semantic sub-keys
JP2009193219A (ja) インデックス作成装置、その方法、プログラム及び記録媒体
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
WO2010109594A1 (ja) 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法
US20120317141A1 (en) System and method for ordering of semantic sub-keys
JP4935243B2 (ja) 検索プログラム、情報検索装置及び情報検索方法
JP2005301856A (ja) 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置
JP4301496B2 (ja) データベース検索装置、データベース検索方法およびプログラム
US9875298B2 (en) Automatic generation of a search query
JP2004355550A (ja) 自然文検索装置、その方法及びプログラム
JP6210865B2 (ja) データ検索システムおよびデータ検索方法
JP2007164635A (ja) 同義語彙獲得方法及び装置及びプログラム
US11681732B2 (en) Tuning query generation patterns

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060405

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090130

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090325

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090417

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120501

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130501

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees