JP2009064097A - 検索結果表示方法、検索結果表示プログラムおよび検索結果表示装置 - Google Patents

検索結果表示方法、検索結果表示プログラムおよび検索結果表示装置 Download PDF

Info

Publication number
JP2009064097A
JP2009064097A JP2007229312A JP2007229312A JP2009064097A JP 2009064097 A JP2009064097 A JP 2009064097A JP 2007229312 A JP2007229312 A JP 2007229312A JP 2007229312 A JP2007229312 A JP 2007229312A JP 2009064097 A JP2009064097 A JP 2009064097A
Authority
JP
Japan
Prior art keywords
display
information
record
displayed
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007229312A
Other languages
English (en)
Inventor
Kaori Hatori
香織 羽鳥
Fumito Iwasaki
史十 岩▲崎▼
Tomoya Tsukahara
朋哉 塚原
Toshiya Sato
俊也 佐藤
Mariko Watanabe
まり子 渡邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Construction Machinery Co Ltd
Hitachi Solutions East Japan Ltd
Original Assignee
Hitachi Construction Machinery Co Ltd
Hitachi East Japan Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Construction Machinery Co Ltd, Hitachi East Japan Solutions Ltd filed Critical Hitachi Construction Machinery Co Ltd
Priority to JP2007229312A priority Critical patent/JP2009064097A/ja
Publication of JP2009064097A publication Critical patent/JP2009064097A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】異なる表示区分間における検索結果の関連性を容易に把握することができることを目的とする。
【解決手段】特徴語同士を関連付ける情報であるレコード番号とが対応付けられた各種インデックス情報を記憶部に記憶しており、特徴語を示す特徴語ラベル3010a〜3010cの表示配置を決定し、特徴語ラベル3010a〜3010cは、検索結果と、表示配置とに従って表示されており、所定の特徴語ラベル3010aが選択されると、各種インデックス情報を参照して、特徴語ラベル3010aに関連性があり、かつ特徴語ラベル3010aとは異なる特徴語ラベル3010b強調表示することによって、特徴語ラベル3010aとは異なる表示エリア3001〜3004に表示されている特徴語ラベル3010bを、表示エリア3001〜3004を越えて強調表示することを特徴とする。
【選択図】図6

Description

本発明は、検索結果表示方法、検索結果表示プログラムおよび検索結果表示装置に関するものである。
互いに関係のある情報同士を線で連結させる、あるいは無関係の情報を背反表示させることによって、情報間の関連表示を行う情報の検索方法およびその装置および情報検索のためのコンピュータプログラムが提示されている(例えば、特許文献1参照)。
また、画面上に検索結果を絞り込むためのラベルを複数個抽出して、これを画面状の所定のエリアに表示し、このラベルを特定することで、検索結果をさらに絞り込む情報検索システムおよび情報検索プログラムが提示されている(例えば、特許文献2参照)。
特開2004−192355号公報 特許第3864235号公報
しかしながら、特許文献1および特許文献2に記載の技術では、情報間の関連表示を行うのは、同一の表示区分内においてのみであった。従って、特許文献1および特許文献2に記載の技術では、異なる表示区分間における検索結果の関連性を把握するのが困難である。ここで、表示区分とは、情報の種類が識別できるようにすることである。例えば、画面内を所定の数に分割した表示エリアごとに情報を表示させたり、表示している情報に当該情報の種類を同時に表示したりすることである。
前記課題に鑑みて、本発明は、異なる表示区分間における検索結果の関連性を容易に把握することができることを目的とする。
前記課題を解決するため、本発明は、複数の項目を有し、各項目には少なくとも1つの要素が記述された検索対象情報が、それぞれ識別子で識別されて複数登録された検索対象情報の集合について、当該集合を、検索語を使用して検索を行い、前記検索語による検索結果を、前記検索対象情報が有する項目の種別に対応する複数の表示区分ごとに表示部に表示し、前記検索結果表示装置は、前記検索対象情報に含まれる要素のそれぞれについて、当該要素を含む検索対象情報と当該要素との関連性を示した関連度を当該検索対象情報の識別子で識別した、関連度と識別子との対を少なくとも1対有する要素ごとの関連度情報を、前記項目ごとに記憶部に複数記憶しており、入力部を介して、前記表示部に表示されている各要素のうち、任意の要素が選択されると、前記記憶部の前記要素ごとの関連度情報を参照することにより、前記識別子を介して前記選択された要素に関連性がある別の要素を、前記記憶部から取得し、当該取得された要素を、前記表示部に修飾表示することによって、異なる前記表示区分に表示されている前記選択された要素とは異なる要素を前記表示部に修飾表示することを特徴とする。
その他の手段については、後記する実施の形態で述べる。
本発明によれば、異なる表示区分間における検索結果の関連性を容易に把握することができる。
以下、本発明の実施の形態を図1〜図27を用いて説明する。
図1は、本実施形態に係る検索結果表示装置の構成例を示す図である。
図1に示すように、検索結果表示装置1は、処理部2、記憶部3、レコードDB(Date Base)4、表示部5および入力部6を有してなる。
処理部2は、情報の処理を行う機能を有し、レコードDB4に格納されているレコードに対し、情報検索を行う検索処理部22と、情報検索の結果を表示部に表示させる表示処理部21とを有する。さらに、表示処理部21は、論理演算処理部211と、強調表示処理部212とをさらに有してなる。論理演算処理部211は、後記して説明するように、取得したレコード番号に対し、AND処理や、OR処理などの論理演算処理を行う機能を有する。強調表示処理部212は、後記して説明するように、選択された特徴語ラベルや、当該特徴語ラベルに関連する特徴語ラベルなどを強調表示するなどの処理を行う機能を有する。
レコードDB4には、検索元のデータである各レコードが保持されている。レコードについては、図2を参照して後記する。
各種インデックス情報31(関連度情報)は、レコードDB4を基に、例えば、特許文献1に記載の技術を適用した結果、出力されるデータであり、レコードの項目ごとに、特徴語(要素)と、レコードとの関連度とが記載されたものである。各種インデックス情報31は、インデクス情報の集合であり、レコードの種類によって、含まれるインデックス情報が異なる。例えば、検索対象となるレコードが、ノートPCの不良報告であれば、各種インデックス情報31は、製品名インデックス情報、タイトルインデックス情報、状況インデックス情報、原因インデックス情報、対策インデックス情報、発生日インデックス情報および発生日データインデックス情報などとなる。各種インデックス情報31の具体的な説明は、図3を参照して後記する。
レコードインデックス情報32は、図3を参照して後記する。
表示部5は、ディスプレイなどからなり、情報を表示する機能を有する。入力部6は、キーボードや、マウスからなり、情報を検索結果表示装置1に入力する機能を有する。
処理部2や、処理部2内の各部21,22,211,212は、図示しないROM(Read Only Memory)や、HD(Hard Disk)に格納されたプログラムが、図示しないRAM(Random Access Memory)に展開され、図示しないCPU(Central Processing Unit)によって実行されることによって具現化する。
また、本実施形態では、レコードDB4や、記憶部3を、検索結果表示装置1内に設けた形態としたが、これに限らず、レコードDB4や、記憶部3に格納されている各種インデックス情報31や、レコードインデックス情報32のうち、少なくとも1つを検索結果表示装置1と異なる装置であり、検索結果表示装置1と通信可能な記憶装置としてもよい。
また、表示部5や、入力部6を、検索結果装置1と通信可能であり、検索結果装置1とは異なる少なくとも1台のPCとしてもよい。このようにすることで、後記するクエリの入力や、特徴語の選択などを、遠隔のPCから入力し、その結果を当該遠隔のPCに表示させることが可能となる。
図2は、レコードの一例を示す図である。
図2では、レコードの一例として、ノートPC(Personal Computer)の不良が発生するごとに作成されるノートPCの不良報告のレコードを示す。
レコード1000は、製品名1001、タイトル1002、状況1003、原因1004、対策1005、発生日1006、発生日データ1007の項目ごとにデータが記入されている。また、レコード1000毎に、レコード1000の識別子としてのレコード番号1008が付されている。
状況1003は、ノートPCの不良が発生した状況に関するデータである。原因1004は、ノートPCにおける不良の原因に関するデータである。対策1005は、当該不良に施した対策に関するデータである。
図1のレコードDB4には、このようなレコードが、ノートPCの不良ごとに、多数保持されている。
図3は、インデックス情報の例を示す図である。
図3に示すインデックス情報は、例えば、特許文献1に記載の技術(検索処理)によって出力される情報であり、(a)は、各種インデックス情報の一例としての状況インデックス情報であり、(b)は、レコードインデックス情報の例である。
図3(a)に示す状況インデックス情報は、図2の状況1003における文を形態素解析し、状況1003における各単語である特徴語と、この特徴語が生じるレコードとの関連性を記述したものである。
状況インデックス情報は、複数の情報2001,2002,・・・からなり、それぞれの情報2001,2002,・・・は、特徴語ID2011、特徴語名称2012、品詞番号2013、(レコード番号2014(図2の符号1008),レコードとの関連度2015)をn回繰り返したものおよび区切り記号2016(−1)を有してなる。ここで、「n」は、対象となる特徴語が現れるレコードの数である。すなわち、情報2001,2002,・・・は、それぞれ1つの特徴語に対応し、この特徴語と、各レコードとの関係を記述している情報である。情報2001,2002,・・・は、区切り記号2016(−1)によって区切られている。
特徴語ID2011は、検索処理において、抽出された特徴語に対し、一意に付されるIDであり、特徴語名称2012は、当該特徴語の名称である。
品詞番号2013は、品詞ごとに付される番号である。例えば、図2(a)における品詞番号2013における「2」は、該当する特徴語が「名詞」であることを示す。
レコード番号2014は、図2で説明したレコード1000に対し、一意に付される番号である。
レコードとの関連度2015は、特徴語と、レコード(文書)との関連の度合いを示す値である。例えば、情報2001より、特徴語「ディスプレイ」は、レコード番号「12」、「14」・・・「112」と関連があり、それぞれのレコードと特徴語との関連度は、符号2015で記述されている値である(このレコード番号が付されているレコードに、特徴語「ディスプレイ」が現れる)。また、情報2002より、特徴語「液晶」は、レコード番号「12」、「14」・・・「112」と関連があり、それぞれのレコードと特徴語との関連度は、符号2015で記述されている値である(このレコード番号が付されているレコードに、特徴語「液晶」が現れる)。関連度2015は、特徴語名称2012に記述されている特徴語が、レコード番号2014を有するレコード中に現れる頻度を示しており、例えば、tf−idf(term frequency-inverted document frequency)法などが用いられる。
図3(b)に示すレコードインデックスは、レコード間の関連度を示す情報である。レコードインデックス情報32(図1参照)は、情報2003,2004・・・からなり、それぞれの情報2003,2004,・・・は、レコード番号2021、(レコード番号2022、レコードとの関連度2023)をn回繰り返したものおよび区切り記号2024(−1)を有してなる。ここで、「n」は、所定のクエリに従って情報検索した結果、抽出されたレコードの数である。すなわち、レコードインデックスは、対象となるレコードと、他のレコードとの関連度を順次記述している情報である。
レコード番号2021は、図2で説明したレコード1000に対し、一意に付される番号である。また、レコード番号2022は、当該レコード番号2021を有するレコードとは異なるレコードのレコード番号である。
関連度2023は、レコード番号2021を有するレコード1000と、レコード番号2022を有するレコード1000との間の関連の度合いを示している。2つのレコード1000間に関連があるとは、2つのレコード1000間に同一の特徴語が現れることである。関連度2023が高いとは、2つのレコード1000間で共通に現れる特徴語の数が多いことであり、関連度2023が低いとは、2つのレコード1000間で共通に現れる特徴語の数が少ないことである。関連度2023は、特許文献1に記載の技術を用いた検索処理を行うことにより算出される。
例えば、情報2003を参照すると、情報2003で対象となっているレコード番号2021「0」は、レコード番号「1」、「2」・・・「133」(レコード番号2022参照)を有するレコード1000と関連があり、それぞれのレコードとの関連度は、符号2023に記述されている。
また、情報2004を参照すると、情報2004で対象となっているレコード番号2021「1」は、レコード番号「0」、「4」・・・「133」(レコード番号2022参照)を有するレコード1000と関連があり、それぞれのレコードとの関連度は、符号2023に記述されている。
レコードインデックス情報32は、特徴語のマッピングや、図17および図18におけるクラスタリングで用いる情報である。
(マップ表示)
図4〜図6を参照して、検索結果をマップ形式表示した場合について説明する(マップ表示の具体的な方法は、特許文献2参照)。
図4〜図6は、本実施形態に係る検索結果画面例を示す図である。
図4〜図6は、例えば、特許文献1に記載の技術(検索処理)によって、図2に示すレコード1000の集合を情報検索し、その結果、抽出された特徴語を、関連度の高い特徴語同士は、近くに配置し、関連度の低い特徴語同士は、遠くに配置した例である。
図4〜図6における検索結果表示画面3000は、図2における項目1001〜1007の少なくとも一部に対応した表示エリアに分かれている。図4〜図6に示す例において、各表示エリアは、第1表示エリア3001、第2表示エリア3002、第3表示エリア3003、レコード識別表示エリア3004およびクエリ入力エリア3005を有する。これらの各表示エリア3001〜3003に、図2における項目1001〜1007のうちのどの項目を対応させて表示させるかは、プルダウンメニュー3006で項目名を指定することにより、容易に切り替え可能である。また、図4〜図6に示す画面例では、画面を表示エリア3001〜3004の4領域に分けたが、これに限らず、レコード1000における項目数の範囲内であれば、いくつの領域に分けてもよい。
レコード識別表示エリア3004には、クエリ入力エリア3005に入力された情報に従って、検索された結果、ヒットしたレコードのタイトル(図2のレコード1000のタイトル1002)が表示される。なお、レコード識別表示エリア3004に表示される内容は、レコードのタイトルに限らず、例えばレコード番号などレコードを識別できる情報であればよい。
図4〜図6に示す画面例において、第1表示エリア3001には、レコード1000(図2参照)における原因1004(図2参照)から抽出された特徴語が、特徴語ラベル3010の形で表示されている。同様に、第2表示エリア3002には、レコード1000(図2参照)における対策1005(図2参照)から抽出された特徴語が、特徴語ラベル3010の形で表示されており、第3表示エリア3003には、レコード1000(図2参照)における状況1003(図2参照)から抽出された特徴語が、特徴語ラベル3010の形で表示されている。
第1表示エリア3001〜第3表示エリア3003において、関連度の高い特徴語ラベル3010同士は、近くに配置し、関連度の低い特徴語ラベル3010同士は、遠くに配置される。特徴語ラベル3010の配置(表示位置)を決定する処理は、特許文献2に記載されている方法であり、関連するレコード1000(図2参照)の表示画面状の配置を決定し(ただし、レコード1000は、表示エリアには表示しない)、このレコードと関連のある特徴語を、予め算出してある関連度に基づいて、当該レコードの近傍に配置する処理である。この処理により、異なるレコードの項目に属するが、互いに関連のある特徴語同士は、表示エリアが異なっても、同様の位置に表示される。例えば、図4において、第1表示エリア3001に表示されている特徴語ラベル3010「コネクタ(3)」と、第3表示エリア3003に表示されている特徴語ラベル3010「赤みがかかる(3)」とは、それぞれの表示エリアの右下方に表示されている。これは、「コネクタ」という特徴語が現れるレコードと、「赤みがかかる」という特徴語が現れるレコードは、類似していることを意味する。しかしながら、逆に、同様の特徴語でも、互いに関連のない特徴語同士は、それぞれの表示エリアにおいて、異なる位置に表示されることになる。例えば、第1表示エリア3001に表示されている特徴語ラベル3010「ディスプレイ(9)」と、第2表示エリア3002に表示されている特徴語ラベル3010「ディスプレイ(1)」と、第3表示エリア3003に表示されている特徴語ラベル3010「ディスプレイ(10)」とは、いずれも「ディスプレイ」である。しかしながら、それぞれの表示エリア内における位置に関し、共通点がない。これは、対応する各項目に対して、「ディスプレイ」が現れるレコードの共通性が低いことを示す。
なお、各特徴語ラベル3010におけるカッコ内の数字は、レコード識別表示エリア3004に表示されている全レコード内の該当する項目において、特徴語ラベル3010に表示されている特徴語が現れる数である。
図5では、図4の画面例で表示されている特徴語ラベル3010のうち、1つを選択した例を示す。
図5における検索結果表示画面3000は、図4における第3表示エリア3003中の特徴語ラベル3010「ちらつく(3)」を選択した結果である。
図5において、選択された特徴語ラベルは、強調表示される(符号3010a)。
そして、選択された特徴語に関連する特徴語ラベル(関連特徴語ラベル)は、符号3010aとは異なる方法で強調表示される(符合3010b)。ここで、関連特徴語とは、選択された特徴語が現れるレコードと共通のレコードにおいて現れる特徴語である。このような特徴語間の関連情報は、各種インデックス情報31(図1参照)を参照することによって取得される。詳細は、図11を参照して後記する。
また、選択された特徴語と関連しない(すなわち、同一レコード内において、選択された特徴語と共に発生することのない)特徴語は、強調表示されない(符号3010c)。
ここで、選択された特徴語ラベルに対する関連特徴語ラベル3010bは、エリア間を超えて強調表示される。
図5の画面が生成される手順は、図11を参照して後記する。
所定の特徴語ラベル3010(図4および図8参照)が選択されると、図4のレコード識別表示エリア3004は、選択レコード表示エリア3004aおよび非選択レコード表示エリア3004bに分かれる。
選択レコード表示エリア3004aには、選択された特徴語「ちらつく」が現れるレコードのタイトルが表示される。すなわち、図3(a)に示す状況インデックス情報などの各種インデックス情報31(図1参照)によって、特徴語とリンクしているレコードが取得され、取得されたレコードが選択レコード表示エリア3004aに表示される。そして、非選択レコード表示エリア3004bには、図4のレコード識別表示エリア3004に表示されているレコードのうち、選択レコード表示エリア3004aに表示されているレコード以外のレコードのタイトルが表示される。
各特徴語ラベル3010a〜3010cにおけるカッコ内の数字も、図4の各特徴語ラベル3010におけるカッコ内の数字から変化する。図5における各特徴語ラベル3010a〜3010cにおけるカッコ内の数字は、選択レコード表示エリア3004aに表示されているレコードの該当する項目において、特徴語ラベル3010a〜3010cに表示されている特徴語が現れるレコード数を示す。例えば、図5の第1表示エリア3001における「ケーブル」は、選択レコード表示エリア3004aに表示されているレコードのうち、2つのレコードに現れることを示している。
このように、選択された特徴語ラベルに対する関連特徴語ラベル3010bが、表示エリア間を超えて強調表示されることにより、各表示エリア間における特徴語の関係がわかり、項目間における特徴語の把握が容易となる。
例えば、図5の画面例では、「ちらつく」という状況が生じた場合、第1表示エリア3001より、原因として「ディスプレイ」や、「ケーブル」や、「コネクタ」などが関連し、第2表示エリア3002より、対策として「交換」や、「新品」などが関連することが、一目で分かる。
さらに、選択レコード表示エリア3004aから、「ちらつく」という特徴語が現れているレコードを検索することが容易となる。
図6では、図5とは異なる特徴語ラベルを選択した例を示す。
図6では、対策の「取り寄せる」の特徴語ラベル3010aを選択した結果を示す。
その他の内容は、図5と同様なので説明を省略する。
本実施形態における検索結果表示は、図2〜図6に示すようなノートPCの不良報告に限らず、例えば、図7〜図10に示すような建設機器における機器情報、部品情報、故障情報などに対して適用することも可能である。
図7は、本実施形態を建設機器における機器情報、部品情報および故障情報を含む建設機器情報に適用した場合のレコードである故障・破損情報の一例を示す図である。
図7(a)および(b)に示すように、レコード1100は、状況1101、機種1102、パーツ1103、担当者1104および発生日1105などの情報(建設機器情報)を有してなり、故障・破損情報ごとに記述される。また、レコード1100毎に、レコード1100の識別子であるレコード番号1106が付されている。
状況1101は、該当する建設機器の故障、破損などの状況を記述した情報であり、機種1102は、故障、破損した建設機器の機種を示す。パーツ1103は、故障、破損などが生じている部品である。担当者1104は、当該故障・破損情報を登録した人物の名前であり、発生日1105は、当該故障、破損などが発生した年月日である。
図8〜図10は、本実施形態を建設機器情報に適用した場合の検索結果画面例を示す図である。
なお、図8〜図10において、図4〜図6の要素と同様の要素に対しては、同一の符号を付して説明を省略する。
図8〜図10の画面例において、レコード識別表示エリア3004には、クエリ入力エリア3005に入力された情報に従って、検索された結果、ヒットしたレコードのタイトル(ここでは、図7の状況1101)が表示される。
そして、図8〜図10に示す画面例では、第1表示エリア3001には、レコード1100(図7参照)における機種1102(図7参照)の特徴語が、特徴語ラベルの形で表示されている。同様に、第2表示エリア3002には、レコード1100(図7参照)におけるパーツ1103(図7参照)の特徴語が、特徴語ラベルの形で表示されており、第3表示エリア3003には、レコード1100(図7参照)におけるすべての内容、すなわち図7における状況1101、機種1102、パーツ1103、担当者1104および発生日1105におけるすべての特徴語が、特徴語ラベル3010a〜3010cの形で表示されている。
そして、図4〜図6と同様に、第1表示エリア3001〜第3表示エリア3003において、関連度の高い特徴語ラベル3010a〜3010c同士は、近くに配置し、関連度の低い特徴語ラベル3010a〜3010c同士は、遠くに配置される。
なお、各特徴語ラベル3010a〜3010cにおけるカッコ内の数字は、図4〜図6と同様である。
図8の例における検索結果表示画面3000は、第2表示エリア3002中の特徴語ラベル3010a「ホース(3)」を選択した結果である。
図5および図6と同様に、図8の画面例においても、選択された特徴語ラベルは、強調表示され(符号3010a)、「ホース」に対する関連特徴語ラベルは、符号3010aとは異なる方法で強調表示される(符合3010b)。また、選択された特徴語「ホース」と関連しない(すなわち、同一レコード内において、選択された特徴語と共に、発生することのない)特徴語は、強調表示されない(符号3010c)。図8に示すように、選択された特徴語ラベルに対する関連特徴語ラベル3010bが、エリア間を超えて強調表示される。
さらに、図4〜図6と同様に、レコード識別表示エリア3004は、選択レコード表示エリア3004aおよび非選択レコード表示エリア3004bに分かれる。
図8の例から、「ホース」に関する故障は、第1表示エリア3001より機種としては「ダンプ」および「ショベル」と関連性があり、さらに、第3表示エリア3003より「移動」、「パワー」などとも関連性があることがわかる。
図9および図10では、図8に示す検索結果表示画面3000において、複数の特徴語ラベルが選択された場合における例を示す。
図9は、第1表示エリア3001の「ショベル(2)」の特徴語ラベル3010aと、第2表示エリア3002の「ホース(2)」の特徴語ラベル3010aとが選択された例である。図10は、第1表示エリア3001の「ダンプ(1)」の特徴語ラベル3010aと、第2表示エリア3002の「ホース(2)」の特徴語ラベル3010aとが選択された例である。
このように、複数の特徴語ラベル3010aが選択された場合、関連特徴語ラベル3010bは、選択された各特徴語ラベル3010aに対する関連特徴語ラベル3010bをAND処理した結果が関連特徴語ラベル3010bとして表示される。
次に、図1および図2を参照しつつ、図11に沿って、本実施形態に係る検索結果表示処理を説明する。
図11は、本実施形態に係る検索結果表示処理の流れを示すフローチャートである。
検索処理部22は、特許文献1に記載の技術によって、入力されたクエリに従って、図2に示すレコード1000の集合体であるレコードDB4を情報検索し、レコード1000の絞込みを行っておく。
なお、各種インデックス情報31や、レコードインデックス情報32は、例えば、1週間に一回の割合で、処理部2がレコードDB4のレコードを対象として前もって作成しておいてもよいし、前記情報検索するたびに検索処理部22が作成してもよい。
表示処理部21は、情報検索の結果や、生成された各種インデックス情報31や、レコードインデックス情報32などに記載されている関連度などを基に、図4に示すような検索結果表示画面を表示部5に表示させる画面表示処理を行う(S101)。
次に、入力部6を介して、特徴語ラベルがクリックされることなどにより、特徴語が選択される(S102)。
すると、論理演算処理部211は、記憶部3の各種インデックス情報31を参照し、該当するインデックス情報中において、選択された特徴語を検索し、その特徴語に関連付けされているレコード番号をすべて取得する(S103)。このとき、同一の表示エリア内で複数の特徴語ラベルが選択されているときは、それらの特徴語から取得されるレコード番号に対し、AND処理またはOR処理など論理演算処理を行う。
複数の表示エリア間または同一の表示エリア内で特徴語ラベルが選択されている場合、処理部2が、それぞれの表示エリアの項目に相当するインデックス情報から、該当するレコード番号を取得する。そして、論理演算処理部211が、取得したレコード番号に対しAND処理や、OR処理などの論理演算処理を行う(S104)。
次に、強調表示処理部212が、ステップS103またはステップS104の処理の結果、出力されたレコード番号に相当するレコードのタイトルなど、レコードを識別する情報を、例えば図5や図6の選択レコード表示エリア3004aのように強調表示をするレコード強調表示処理を行う(S105)。
そして、処理部2は、各種インデックス情報31を参照することによって、ステップS103またはステップS104で取得したレコード番号を含む特徴語を取得すると、強調表示処理部212が、取得した特徴語に相当する特徴語ラベルを関連特徴語ラベルとして強調して修飾表示する特徴語修飾表示処理を行う(S106)。
(ファセット)
図12〜図16は、本実施形態の別の例であるファセット表示形式の例を示す図である。
ファセット表示形式では、情報検索の結果、抽出された検索対象情報の要素を、さらに特定の項目ごとに分類し、この分類の結果を表示した上で、異なる表示区分間における検索結果の関連性を容易に把握することを目的とする。
図12は、特許明細書情報を用いたレコードの例である。
図12〜図14において、レコード4000は、明細書のタイトル4001、出願番号4002、出願人4003、Fターム4004、要約4005(課題および解決手段)などの情報を有する。レコード4000は、図1のレコードDB4に記憶されている情報である。また、レコード4000毎に、レコード4000の識別子であるレコード番号4006が付されている。
図13および図14は、図12のレコードに対し、ファセット分類による情報検索を行った際の画面例を示す図である。
クエリ入力エリア5008に入力された情報を有するレコードを、ファセット選択エリア5001で入力した情報でさらに表示条件を絞り込む。この結果、例えば、特許文献1に記載された検索処理が行われ、図13に示す検索結果表示画面5000が表示部5(図1参照)に表示される。
図13および図14に示す例ではでは、第1ファセット入力窓5002で、「出願人」を選択し、第2ファセット入力窓5003で、「Fターム」を選択した例を示す。第3ファセット入力窓5004は、使用していない。
第1表示エリア5005では、クエリ入力エリア5008に入力された情報に従って検索された情報を、第1ファセット入力窓5002で選択された情報ごとに表示する。図13の例では、クエリ入力エリア5008で入力された「液晶」および「素子」の両方の語を含むレコードを「出願人」ごとに第1表示エリア5005に表示する。出願人の右側に表示されている括弧内の数字は、レコード4000の出願人4003が、表示されている出願人の名称となっているレコード数(出願人レコード数)である。なお、図13に示すように、クエリに従って検索されたレコード数に対する出願人レコード数の割合を、棒グラフの形式で第1表示エリア5005の出願人の表示の下に表示してもよい。すなわち、項目に応じて検索結果を分類し(第1ファセット、第2ファセットなど)、分類ごとに検索結果や、特徴語など(要素)を表示する。
第2表示エリア5006では、第1表示エリア5005に表示されている情報に、第2ファセット入力窓5003で入力した情報によって表示条件を絞り込まれた情報がさらに表示される。図13に示す画面例では、出願人ごとに、Fタームで表示条件を絞り込んだ結果が、第2表示エリア5006に表示される。例えば、図13に示すように、出願人が、「A株式会社」で、Fタームが、「2H091」であるレコードのタイトルおよび出願番号が表示される。そして、次に、出願人が、「A株式会社」で、Fタームが、「2H091−FA23Z」のレコードのタイトルおよび出願番号が表示される。図示されていないが、「A株式会社」が終わると、「B株式会社」について同様の表示が行われる。以下、「C株式会社」、「D株式会社」・・・について同様の表示が行われる。
第3表示エリア5007は、ファセット入力エリアに入力された情報に基づいて情報検索されたレコードのうち、特定の項目の特徴語が表示される。図13の例では、図12に示すレコード4000のうち、要約4005に現れる特徴語が、特徴語ラベル5010として表示される。図12に示すレコード4000のうち、どの項目における特徴語を表示するかは、プルダウンメニュー5009で、項目を指定することによって、容易に切り替え可能である。つまり、各表示エリア5005〜5007では、レコードの項目に対応した形式で、画面(表示エリア)が分割されている。
なお、特徴語ラベル5010におけるカッコ内の数字は、クエリに従って情報検索された結果、ヒットしたすべてのレコードの要約において、該当する特徴語が現れた数である。例えば、表示されている特徴語ラベル5010のうち、「反射」は、ヒットしたレコード中に、36回現れることを示す。
なお、本実施形態では、入力できるファセットの数を3個までとしたが、これに限らず、2個でもよいし、4個以上でもよい。
また、図13では、第3ファセットを用いていないため、ファセットによる情報の絞込みを表示する画面が、2つとなっているが、第3ファセットによりさらに絞り込まれた情報を表示するエリアを表示してもよいことは当然である。
図14では、図13の第3表示エリアのうち、所定の特徴語ラベルを選択したときの画面例を示す。
図14は、図13の第3表示エリア5007で、「膜」および「電極」の特徴語ラベル5010を選択した例である。
選択された特徴語ラベルは、最も強調されて表示される(符号5010a)。
そして、選択された特徴語と関連性のある特徴語ラベル(関連特徴語ラベル)が、選択された特徴語ラベルとは異なる強調方法で強調される(符号5010b)。
また、選択された特徴語と関連性のない特徴語ラベルは、強調されない(符号5010c)。
さらに、第2表示エリア5006における選択された特徴語を要約に含むレコードのタイトルおよび出願番号が強調表示される(下線で表現)。
次に、図1を参照しつつ、図15および図16に沿って、図13および図14における第2表示エリア5006の表示手順(すなわち、第1ファセットで絞り込み、第2ファセットでさらに絞り込んだ結果を表示する手順)を説明する。
なお、図12に示すレコード4000から生成される各種インデックス情報31は、要約に現れる特徴語と、レコードとの関連性を記述した要約インデックス情報や、タイトルに対して同様の情報を記述したタイトルインデックス情報などである。
検索結果表示装置1は、ステップS101またはステップS105のサブルーチンとして図15および図16の処理を行う。その他の処理は、図11に示す処理と同様のため説明を省略する。
図15および図16は、ファセット表示形式におけるレコード強調処理の例を示すフローチャートである。
最初に、入力部6を介して、第1ファセットなどのファセット情報が入力される(図示せず)。
そして、表示処理部21は、図16を参照して後記する出力情報作成処理を行う(S201)。このとき、表示処理部21は、第1ファセットの情報(図13の例では、「出願人」)と、前記した情報検索処理の結果、抽出されたレコード番号の一覧をレコード一覧として出力情報作成処理へ引数としてわたす。
そして、出力情報作成処理の結果、戻り値として返される出力用情報を用いて、表示処理部21が出力用情報の内容を表示部5に表示させる表示処理を行う(S202)。出力用情報の内容は、図16を参照して説明する。
次に、図16の出力情報作成処理(S201)に関する説明を行う。
表示処理部21は、図示しないメモリ上に合計出力用情報のための領域を確保すると、確保した合計出力用情報を「Null」にする(S301)。なお、ステップS308で後記するように、図16に示す出力情報作成処理は、再帰的にくり返し呼び出されるルーチンであるが、合計出力用情報のためのメモリ上の領域は、ルーチンごとに異なる領域が確保される。
そして、表示処理部21は、ステップS201の段階でわたされたファセットの情報(例えば、「出願人」)をキーとして、各種インデックス情報31(ここでは、情報検索処理の際に生成されたファセットインデックス情報)を参照し、該当するファセットに関する特徴語一覧を生成する(S302)。
続いて、表示処理部21は、特徴語一覧に特徴語があるか否かを判定する(S303)。
ステップS303において、特徴語があった場合(S303→Yes)、表示処理部21は、特徴語一覧の一番初めに記述されている特徴語を取得する。そして、表示処理部21は、各種インデックス情報31を参照して、取得した特徴語に関連するレコードのレコード番号をすべて取得して関連レコード一覧を生成する(S304)。
そして、論理演算処理部211は、ステップS201の段階でわたされたレコード一覧内のレコード番号と、ステップS304で生成した関連レコード一覧内のレコード番号とのAND処理を行い(S305)、AND処理の結果、抽出されたレコード番号をANDレコードとする。
次に、表示処理部21は、ANDレコードがあるか否かを判定する(S306)。すなわち、ANDレコードが「Null」ではないか否かを判定する。
ステップS306の結果、ANDレコードがない場合(S306→No)、表示処理部21は、現在の処理の対象となっている特徴語を特徴語一覧から削除し、ステップS303の処理へ戻り、次の特徴語に対し、ステップS303の処理を行う。
ステップS306の結果、ANDレコードがある場合(S306→Yes)、表示処理部21は、現在、処理の対象となっているファセットが末端ファセットであるか否かを判定する(S307)。末端ファセットとは、設定されたファセットの中で最も下位のファセットのことである(図13および図14の例では、第2ファセットが末端ファセット)。
ステップS307の結果、末端ファセットでない場合(S307→No)、表示処理部21は、次のファセット(例えば、現在処理しているファセットが第1ファセットである場合は、第2ファセット)の情報と、新たなレコード一覧としてANDレコードとを引数として、再帰的に出力用情報作成処理を実行し(S308)、戻り値として返されたレコード情報を出力用情報とする。
ステップS307の結果、末端ファセットである場合(S307→Yes)、表示処理部21は、ANDレコードを出力用情報とする(S309)。
ステップS308またはステップS309の処理の後、表示処理部21は、処理対象となっている特徴語と、出力用情報とを対の情報として合計出力用情報に記述する合計出力用情報記述処理を行い(S310)、表示処理部21は、現在の処理の対象となっている特徴語を特徴語一覧から削除し、ステップS303の処理へ戻る。なお、図16に示す処理が図11のステップS105のサブルーチンである場合、選択された特徴語に関連するレコード番号などに強調表示を行うためのマーカを付す。例えば、図13に示す第3表示エリア5007の特徴語ラベル5010のいずれかが選択されている場合、各種インデックス情報31を参照して、関連するレコード番号を取得し、合計出力用情報中の該当するレコード番号にマーカを付す。
合計出力用情報は、図13の第1表示エリア5005や、第2表示エリア5006に表示される情報であり、ファセットごとに生成される。つまり、第1ファセットに対する合計出力用情報が生成され、第2ファセットに対する合計出力用情報が作成される。第3ファセットや、第4ファセットが入力されたときは、それぞれのファセットに対応する合計出力用情報が生成される。合計出力用情報には、ファセット情報と、このファセットに属するレコード番号とが対応付けられて保持されている。
例えば、図13の第2表示エリア5006における情報(任意のタイトルおよび出願番号)が選択された場合は、表示処理部21は、まず、この情報に該当するレコード番号にマーカを付す。そして、表示処理部21は、各種インデックス情報31(図1参照)を参照して、マーカが付されたレコード番号を有する特徴語を検索して、検出された特徴語に対応する特徴語ラベルを強調表示する。
さらに、表示処理部21は、選択された情報が属するファセット以外のファセットに関する合計出力用情報を参照して、選択された情報に対応するレコード番号を検索し、このレコード番号が属するファセット(例えば、図13の例では、第1表示エリア5005の出願人名称)が強調表示される。このような方法で、下位のファセットの情報(ここでは、第2ファセットのFターム)が選択されたとき、関連する上位のファセット(ここでは、第1ファセットの出願人)の情報が強調表示される。ここで、選択された情報と、関連する情報とは、異なる強調方法で強調される。ここで、上位のファセットとは、第nファセットの「n」の値が小さいファセットであり、少ない条件で情報の絞込みを行う。下位のファセットとは、「n」の値が大きいファセットであり、多数の条件で情報の絞込みを行う。
例えば、図13の第1表示エリア5005における情報(出願人名称)が選択された場合、表示処理部21は、まず、このファセットに関する合計出力用情報から、当該ファセットに関するレコード番号をすべて取得する。そして、表示処理部21は、選択された情報が属するファセット以外のファセット(ここでは、第2ファセット)に関する合計出力用情報を参照して、取得したレコード番号にマーカを付す。そして、表示処理部21は、マーカが付されたレコード番号に対応している、第2表示エリア5006に表示されている情報を強調表示する。このような方法で、上位のファセットの情報(ここでは、第1ファセットの出願人)が選択されたとき、関連する下位のファセット(ここでは、第2ファセットのFターム)の情報が強調表示される。ここで、選択された情報と、関連する情報と、選択された情報と関連しない情報とは、異なる強調方法で強調される。
つまり、ファセット表示形式とは、複数の項目を有し、各項目には少なくとも1つの要素が記述された検索対象情報が、それぞれ識別子で識別されて複数登録された検索対象情報の集合について、当該集合を、検索語を使用して検索を行い、前記検索語による検索結果を、前記検索対象情報が有する項目の種別に対応する複数の表示区分ごとに表示部に表示し、前記検索対象情報に含まれる要素のそれぞれについて、当該要素を含む検索対象情報と当該要素との関連性を示した関連度を当該検索対象情報の識別子で識別した、関連度と識別子との対を少なくとも1対有する要素ごとの関連度情報を、前記項目ごとに記憶部に複数記憶しており、前記表示区分のうち、少なくとも1つは、入力部を介して、前記検索対象情報の項目を対象とし、前記検索対象情報を分類する分類情報が入力され、前記検索語による検索により、前記検索対象情報の集合から、前記検索語に対応する検索対象情報を抽出し、前記抽出した各検索対象情報に記述された各要素を前記表示区分に表示する際に、前記分類情報に基づいて分類された前記検索対象情報の要素を、前記分類情報に対応する表示区分ごとに表示し、前記入力部を介して、前記表示部に表示されている各要素のうち、任意の要素が選択されると、前記記憶部の前記要素ごとの関連度情報を参照することにより、前記識別子を介して前記選択された要素に関連性がある別の要素を、前記記憶部から取得し、当該取得された要素を、前記表示部に修飾表示することによって、異なる前記表示区分に表示されている前記選択された要素とは異なる要素を前記表示部に修飾表示することを特徴とする。
また、前記したファセット表示形式の他の表示区分のうち、少なくとも1つは、前記検索語による検索により、前記検索対象情報の集合から、検索語に対応する検索対象情報を抽出し、前記抽出した各検索対象情報に記述された各要素を前記表示区分に表示する際に、前記関連度情報の関連度に基づいて、前記要素の表示位置を決定し、前記要素を、前記決定した表示位置に従って、該当する前記表示区分ごとに前記表示部に表示してもよい。
選択された特徴語ラベル5010(図13参照)の関連特徴語ラベルを強調表示する手順は、図11で説明した手順と同様であるため説明を省略する。
ステップS303において、特徴語一覧に特徴語がない場合(S303→No)、表示処理部21は、合計用出力情報を戻り値として返し(S311)、処理を前のルーチンにおけるステップS308または図15のステップS201へ戻す。
なお、ファセット(各分類)の項目中、どの特徴語にも関連がないレコード、すなわち、ファセットに該当する項目を有さないレコードに関しては、「その他」など情報検索結果とは異なる特徴語を用意し、当該レコードを特徴語「その他」と関連があるレコードとしてインデックス情報を生成しておく。
これにより、ファセット選択した項目の属性がついていないレコードを表示することが可能となる。なお、表示の際に、特徴語「その他」に関連しているレコードを表示するが否かの選択を、ユーザが選択する形式としてもよい。
なお、図14では、第3表示エリア5007に表示されている特徴語ラベル5010aが選択された例を示したが、第1表示エリア5005に表示されている出願人や、第2表示エリア5006に表示されているタイトルおよび出願番号などが選択されてもよい。
このようにファセット表示形式に本実施形態の検索結果表示方法と適用することで、情報検索の結果、情報検索の結果、抽出された検索対象情報の要素を、さらに特定の項目ごとに分類し、この分類の結果を表示した上で、異なる表示区分間における検索結果の関連性を容易に把握することができる。すなわち、ファセット表示における情報間の関連性を容易に把握することができる。
例えば、特許の明細書において、要約に「電極」や「膜」といった特徴語を用いている明細書は、どのようなFタームを用いており、どのような出願人が該当するのかといった情報を、視覚的にわかりやすく表示できる。
図12〜図16では、レコードとして図12に示す特許明細書に関するレコードを適用した例を示したが、これに限らず、例えば、図7に示す建設機器情報のレコードを適用してもよいことは当然である。
(クラスタ表示)
次に、図17〜図19に沿って、本実施形態の別の例であるクラスタ表示形式について説明する。
図17および図18は、本実施形態におけるクラスタ表示の画面例である。
なお、図17および図18において、用いられるレコードは、図2で参照したレコード1000と同様のレコードである。
図17は、情報検索結果をクラスタリングしたクラスタ表示で示したときの画面例である。
クラスタ表示とは、関連性の高い要素のグループを枠で囲み、さらに関連性の高い要素を枠で囲んで表示する表示方法である。クラスタ表示の画面表示処理については、図19を参照して後記する。なお、図17および図18に示す画面例は、レコードとして図2に示すレコード1000を用いた例を示す。
検索結果表示画面6000におけるレコード識別表示エリア6001では、クエリ入力エリア6005で入力されたクエリに従って、レコードDB4を情報検索した結果、検出された結果(レコード)が、レコード同士の関連度(レコード間の距離)に従って、クラスタ表示されている表示エリアである。
レコード同士の関連度に関し、同一の特徴語が多く現れるレコード同士は、関連度が高く、同一の特徴語の現れる数が少ないレコード同士は、関連度が低い。
図17および図18に示す画面例において、第1表示エリア6002は、レコード1000における原因1004(図2参照)で現れた特徴語と、その頻度(カッコ内の数字)を示す表示エリアである。
また、図17および図18に示す画面例において、第2表示エリア6003は、レコード1000におけるヒットしたレコードの製品名1001(図2参照)と、その頻度(カッコ内の数字)を示す表示エリアである。
そして、図17および図18に示す画面例において、第3表示エリア6004には、特徴語が特徴語ラベル6010ごとにクラスタリング6100として表示されている(クラスタ表示)。
レコード識別表示エリア6001や、第3表示エリア6004における枠に付された数字は、クラスタリングにおける関連性の高低を示している。図17および図18の画面例では、大きい数字の枠で囲まれた特徴語や、レコード同士は、関連性が高く、小さい数字で囲まれた特徴語や、レコード同士は、関連性が低い。クラスタリングの手順は、図19を参照して後記する。各レコード間の関連性の度合いである関連度は、例えば、一週間に一回の割合で、処理部2(図1参照)が生成するレコードインデックス32(図1参照)に格納されている。
図18は、第2表示エリア6003における「製品B」を選択した結果を示す画面例である。
図18の例では、「製品B」に関連する情報が、項目を越えて強調表示される。例えば、レコード識別表示エリア6001では、下線で表示し、第3表示エリア6004では、「製品B」に関連する特徴語として強調表示された関連特徴語ラベル6010bと、強調表示されない特徴語ラベル6010cとして表示される。
製品Bに関連する情報の抽出方法は、図11を参照して説明した手順による。
なお、第3表示エリア6004における特徴語ラベル6010(図17参照)のいずれかが選択された場合は、選択された特徴語ラベルが、関連特徴語ラベル6010bとは異なる強調方法で表示されることとなる。
図4〜図6および図8〜図10のようなマップ表示形式、図13および図14のようなファセット表示形式、図17および図18のようなクラスタ表示形式は、各表示形式指定ボタンをクリックなどすることによって、容易に切り替え可能となる。
図1を参照しつつ、図19に沿ってクラスタリングの手順を説明する。
図19は、クラスタリング処理の流れを示すフローチャートである。
まず、表示処理部21は、各エレメント間の距離をすべて算出する(S401)。ここで、エレメントとは、特徴語や、レコードなどクラスタリングの対象となる要素のことである。また、距離の算出方法は、対象がレコードの場合、表示処理部21が、レコードに含まれる特徴語の重要度(例えば、tf−idf法などで算出)を要素としたベクトルを算出する。そして、表示処理部21は、このベクトルのCOS角(つまり、正規化したベクトルの内積)を算出し、このCOS角の値を距離とする。
また、対象が特徴語の場合、表示処理部21が、レコードに含まれるレコードの重要度(例えば、tf−idf法などで算出)を要素としたベクトルを算出する。そして、表示処理部21は、このベクトルのCOS角(つまり、正規化したベクトルの内積)を算出し、このCOS角の値を距離とする。
次に、表示処理部21は、クラスタの生成処理を行う(S402)。具体的には、以下の手順でクラスタを生成する。
まず、表示処理部21は、ステップS401で算出した距離を基に、各エレメントに関し、最も近い距離を有するエレメントで対を作り、これらを1個のグループ(クラスタ)とする(例えば、図17および図18の第3表示エリア6004において、「6」の枠で囲まれたエレメント)。そして、次に近い距離を有するエレメントでクラスタを作る。なお、このとき、次に近い距離を有するエレメント同士が、すでに他のエレメントとクラスタを形成しているとき(異なるクラスタに含まれるエレメント同士のとき)は、クラスタ同士を結合してクラスタを形成する(例えば、図17および図18の第3表示エリア6004において、「5」の枠で囲まれたエレメント)。以下、同様にして、すべてのエレメントを含有するクラスタが作成されるまで、前記処理を繰り返す。
そして、表示処理部21は、ステップS402で生成したクラスタを表示部5に表示させるクラスタ表示処理を行う(S403)。
なお、クラスタ表示を行うこと以外は、図11で説明した処理と同様であり、図17の第3表示エリア6004に表示されている特徴語ラベル6010や、第2表示エリア6003に表示されている製品名ラベル6020が入力部6を介して、選択されると、表示処理部21は、各種インデックス情報31(例えば、図17の特徴語ラベル6010を選択した場合は、情報探索処理の段階で生成された状況インデックス情報)を参照して、関連するレコード番号を取得すると、該当するレコード番号を有するレコード(例えば、レコード識別表示エリア6001に表示されているレコード)を強調表示する。
なお、本実施形態において、各レコード間の距離(関連度)は、所定の期間ごとに処理部2が、全レコード間の距離を算出しているが、これに限らず、検索結果表示画面6000(図17および図18参照)が表示される際に、処理部2によって算出されてもよい。
また、本実施形態では、各レコード間の距離は、項目に関係なく算出されることを前提としているが、これに限らず、例えば、特定の項目を距離算出の対象として、距離を算出してもよい。この場合、例えば、図17および図18における第1表示エリア6001や、第3表示エリア6004に、どの項目を距離算出の対象とするかを、プルダウンメニューなどの形式で指定する図示しない距離算出項目指定エリアを設けて、この距離算出項目指定エリアで指定された項目を距離算出の対象として、検索結果表示画面6000を表示する際に、処理部2が各レコード間の距離を算出してもよい。この場合、レコードインデックス情報32は、必ずしも算出する必要はない。
また、例えば、一週間に一回などの周期で、処理部2が、各レコード間の距離を、すべての項目ごとに算出してもよい。この場合は、レコードインデックス情報32は、各項目ごとに生成されることとなる。
このようにクラスタ表示を行うことにより、エレメント同士の関連性の高低を視覚的に示すことができる。
図17〜図19では、レコードとして図2に示すノートPCの不良報告のレコードを適用した例を示したが、これに限らず、例えば、図7に示す建設機器情報のレコードを適用してもよいことは当然である。
(ファセット+クラスタリング)
次に、図20および図21は、検索結果表示画面の他の例を示す図である。
図20および図21において、図13、図14、図17および図18と同様の要素に対しては、同一の符号を付して説明を省略する。
なお、図20および図21において、適用されるレコードは、図7に示すレコードである。
図20および図21に示す検索結果表示画面5000’は、図13および図14における検索結果表示画面5000の第3表示エリア5007が、図17および図18に示す第3表示エリア6004に置き換わった例である。
図20および図21では、第1ファセット入力窓5002で「機種」が入力され、第2ファセット入力窓5003で「パーツ」が選択された例を示す。
さらに、クエリ入力エリア5008に入力された情報に従って検索された情報を、第1ファセット入力窓5002で選択された情報ごとに表示する。図20の例では、クエリ入力エリア5008で入力された「油漏れ」を含むレコードを「機種」ごとに第1表示エリア5005に表示する。第1表示エリア5005における括弧内の数字は、クエリ入力エリア3005に入力されたクエリに基づいて、情報検索された結果、ヒットしたレコード数である。
そして、第2表示エリア5006では、第1表示エリア5005に表示されている情報に、第2ファセット入力窓5003で入力した情報によって表示条件を絞り込まれた情報が表示される。図20に示す画面例では、「機種」ごとに、「パーツ」で表示条件を絞り込んだ結果が、第2表示エリア5006に表示される。図20の例では、機種が、「ショベル」で、パーツが、「ホース」であるレコード1100(図7参照)の状況1101(図7参照)が表示される。そして、次に、機種が、「ショベル」で、パーツが、「シリンダ」であるレコード1100の状況1101が表示される。そして、「ショベル」が終わると、「クレーン」について同様の表示が行われる。以下、「ダンプ」について同様の表示が行われる。第3ファセットは、選択されていない(第3ファセット入力窓5004参照)。
そして、図20および図21における第3表示エリア6004では、レコード1100におけるすべての項目から取得された特徴語の特徴語ラベル6010がクラスタリング6100として表示されている。クラスタリングの具体的な処理は、図19を参照して前記した通りである。
そして、図21に示す例では、第3表示エリア6004の「油漏れ(3)」が選択され、強調表示されている(特徴語ラベル6010a)。そして、選択された「油漏れ(3)」と関連性のある特徴語が、特徴語ラベル6010aとは異なる強調方法で表示され(特徴語ラベル6010b)、「油漏れ(3)」との関連性がない特徴語の特徴語ラベルは、強調されない(特徴語ラベル6010c)。
さらに、第2表示エリア5006では、選択された特徴語「油漏れ」を含むレコード(図7(a)および(b)の状況1101)が強調表示される(第2表示エリア5006において下線で表現)。
そして、第1表示エリア5005では、選択された特徴語「油漏れ」を含むレコードを有する機種と、ヒット数(括弧内の数字)が表示され、「油漏れ」を含まない機種(例えば、図20の「クレーン」)は、表示されない。
このように、ファセット表示形式と、クラスタ表示形式とを組み合わせることにより、エレメント間の関連性の高低を視覚的に表示できる上、ファセットによる情報の階層化により、選択されたエレメントを有する情報がどのような条件(つまり、ファセット)の下に存在するかを視覚的に表示することができる。
(複数項目同時表示)
次に、図22〜図27に沿って、複数項目の情報を同一の表示エリア内に表示する例を説明する。
(マップ表示)
図22〜図24は、複数項目の特徴語を同一の表示エリア内にマップ表示した画面例である。
なお、図22〜図24に示す例は、レコードとして図2に示すノートPCの不良報告のレコードを適用した例である。
図22〜図24に示す検索結果表示画面7000は、第1表示エリア7001、第2表示エリア7002、第3表示エリア7003、選択レコード表示エリア7004a、非選択レコード表示エリア7004bおよびクエリ入力エリア7005を有してなる。
選択レコード表示エリア7004a、非選択レコード表示エリア7004bおよびクエリ入力エリア7005は、図5および図6における選択レコード表示エリア3004a、非選択レコード表示エリア3004bおよびクエリ入力エリア3005と同様であるため説明を省略する。
第1表示エリア7001、第2表示エリア7002および第3表示エリア7003は、表示項目指定エリア7021,7022,7023を有している。
そして、図22に示す検索結果表示画面7000の表示項目指定エリア7021において「状況」が選択(下線で表現)されることにより、図2のレコード1000の状況1003における特徴語が第1表示エリア7001の特徴語ラベル3010a〜3010cとして表示される。
また、第2表示エリア7002では、表示項目指定エリア7022において「原因」が選択(下線で表現)されることによって、図2のレコード1000の原因1004における特徴語がリスト形式で表示されている。同様に、第3表示エリア7003では、表示項目指定エリア7023において「対策」が選択(下線で表現)されることによって、図2のレコード1000の対策1005における特徴語がリスト形式で表示されている。なお、第1表示エリア7001に表示されている特徴語ラベル3010a〜3010cおよび第2表示エリア7002と、第3表示エリア7003とに表示されている特徴語に付随している括弧内の数字は、図5および図6に示す特徴語ラベル3010a〜3010cにおける括弧内の数字と同様であるため説明を省略する。なお、各表示エリア7001〜7003において、表示されている特徴語は、クエリ入力エリア7005に入力されたクエリに基づいて検索された結果、検出されたレコードにおける特徴語である。
そして、第1表示エリア7001において「ちらつく(3)」が表示されている特徴語ラベル3010aが選択されることにより、特徴語ラベル3010aが強調表示されている。
また、第1表示エリアにおいて「ちらつく」に関連する特徴語ラベルが関連特徴語ラベル3010bとして、特徴語ラベル3010aとは異なる方法で強調表示されている。そして、「ちらつく」とは関連性のない特徴語ラベル3010cは、強調表示されていない。
さらに、第2表示エリア7002および第3表示エリア7003に表示されている特徴語のうち、「ちらつく」に関連する特徴語が強調表示されている(下線で表現)。
そして、図23に示すように、表示項目指定エリア7021において、「状況」に加え「製品名」も選択(下線で表現)されることによって、第1表示エリア7001には、図2のレコード1000の状況1003における特徴語に加え、製品名1001における特徴語も特徴語ラベル7011a〜7011cとして表示される。
特徴語ラベル7011a〜7011cでは、表示されている特徴語が図2のレコード1000におけるどの項目に該当するのかを明確にする目的で「特徴語/項目名(該当するレコード数)」の順に情報が表示されている。すなわち、特徴語に、当該特徴語におけるレコードの項目の情報が付随されて表示されている。
さらに、図24では、表示項目指定エリア7021において、「状況」および「製品名」に加え、「原因」も選択(下線で表現)されることにより、第1表示エリア7001には、図2のレコード1000の状況1003および製品名1001における特徴語に加え、原因1004における特徴語も特徴語ラベル7011a〜7011cとして表示される。
そして、図22と同様に、「ちらつく/状況(3)」が表示されている特徴語ラベル7011aが選択されることにより、特徴語ラベル7011aが強調表示されている。
また、第1表示エリアにおいて「ちらつく」に関連する特徴語ラベルが関連特徴語ラベル7011bとして、特徴語ラベル7011aとは異なる方法で強調表示されている。そして、「ちらつく」とは関連性のない特徴語ラベル7011cは、強調表示されていない。
また、図23および図24における第2表示エリア7002および第3表示エリア7003に表示されている内容は、図22における第2表示エリア7002および第3表示エリア7003に表示されている内容と同様であるため説明を省略する。
図22〜図24に示す画面例における処理は、図11に示す処理と同様であるため、説明を省略する。
(クラスタ表示)
図25〜図27は、複数項目の特徴語を同一の表示エリア内にクラスタ表示した画面例である。
なお、図25〜図27に示す例は、レコードとして図2に示すノートPCの不良報告のレコードを適用した例である。
図25,図26(a)および図27に示す検索結果表示画面8000は、第1表示エリア8001、第2表示エリア8002、第3表示エリア8003、レコード識別表示エリア8004およびクエリ入力エリア8005を有してなる。
図25,図26(a)および図27におけるレコード識別表示エリア8004およびクエリ入力エリア8005は、図17および図18におけるレコード識別表示エリア6001およびクエリ入力エリア6005と同様であるため、説明を省略する。
また、第2表示エリア8002および第3表示エリア8003に表示されている内容は、図22〜図24における第2表示エリア7002および第3表示エリア7003と同様であるため、説明を省略する。
図25に示す検索結果表示画面8000の表示項目指定エリア8021において「状況」が選択される(下線で表現)ことにより、第1表示エリア8001には、図17の第3表示エリア6004と同様に、図2のレコード1000の状況1003における特徴語が、特徴語ラベル8020としてクラスタリング8010内にクラスタ表示されている。
ここで、図26(b)に示すように、表示項目指定エリア8021において、「状況」に加えて「原因」および「製品名」も選択(下線で表現)されることにより、図26(a)に示すように、第1表示エリア8001には、図2のレコード1000の状況1003における特徴語に加え、原因1004における特徴語も特徴語ラベル8022としてクラスタ表示される。
特徴語ラベル8022は、表示されている特徴語が図2のレコード1000におけるどの項目に該当するのかを明確にする目的で「特徴語/項目名(該当するレコード数)」の順に情報が表示されている。なお、図26(a)の第1表示エリア8001は、スクロールされた状態であるため、隠れてしまっているが、第1表示エリア8001の情報には、図26(b)に示す表示項目指定エリア8021が表示されている。
そして、図27に示すように、第1表示エリア8001において「ちらつく/状況(3)」が表示されている特徴語ラベル8022aが選択されることにより、特徴語ラベル8022aが強調表示されている。
さらに、「ちらつく」に関連する特徴語ラベルが関連特徴語ラベル8022bとして、特徴語ラベル8022aとは異なる方法で強調表示されている。そして、「ちらつく」とは関連性のない特徴語ラベル8022cは、強調表示されていない。
さらに、第2表示エリア8002および第3表示エリア8003に表示されている特徴語のうち、「ちらつく」に関連する特徴語が強調表示されている(下線で表現)。
このように、レコードにおける複数の項目を1つの画面内にまとめて表示することにより、画面を効率的に使用することができる。
また、図23、図24及び図26における検索結果表示画面7000,8000に、図13および図14に示すようなファセット選択エリア5001や、第1表示エリア5005や、第2表示エリア5006などを併せて表示してもよい。
図22〜図27では、レコードとして図2に示すノートPCの不良報告のレコードを適用した例を示したが、これに限らず、例えば、図7に示す建設機器情報のレコードを適用してもよいことは当然である。
また、アプリケーションを終了する際に、画面の状態(強調表示の状態など)を記憶部に記憶しておき、次にアプリケーションを起動する際に、前回終了時の画面状態を表示部に表示してもよい。
本実施形態に係る検索結果表示装置の構成例を示す図である。 レコードの一例を示す図である。 インデックス情報の例を示す図である。 本実施形態に係る検索結果画面例を示す図である(その1)。 本実施形態に係る検索結果画面例を示す図である(その2)。 本実施形態に係る検索結果画面例を示す図である(その3)。 本実施形態を建設機器における機器情報、部品情報および故障情報を含む建設機器情報に適用した場合のレコードである故障・破損情報の一例を示す図である。 本実施形態を建設機器情報に適用した場合の検索結果画面例を示す図である(その1)。 本実施形態を建設機器情報に適用した場合の検索結果画面例を示す図である(その2)。 本実施形態を建設機器情報に適用した場合の検索結果画面例を示す図である(その3)。 本実施形態に係る検索結果表示処理の流れを示すフローチャートである。 特許明細書情報を用いたレコードの例である。 図12のレコードに対し、ファセット分類による情報検索を行った際の画面例を示す図である(その1)。 図12のレコードに対し、ファセット分類による情報検索を行った際の画面例を示す図である(その2)。 ファセット表示形式におけるレコード強調処理の例を示すフローチャートである(その1)。 ファセット表示形式におけるレコード強調処理の例を示すフローチャートである(その2)。 本実施形態におけるクラスタ表示の画面例である(その1)。 本実施形態におけるクラスタ表示の画面例である(その2)。 クラスタリング処理の流れを示すフローチャートである。 検索結果表示画面の他の例を示す図である(その1)。 検索結果表示画面の他の例を示す図である(その2)。 複数項目の特徴語を同一の表示エリア内にマップ表示した画面例である(その1)。 複数項目の特徴語を同一の表示エリア内にマップ表示した画面例である(その2)。 複数項目の特徴語を同一の表示エリア内にマップ表示した画面例である(その3)。 複数項目の特徴語を同一の表示エリア内にクラスタ表示した画面例である(その1)。 複数項目の特徴語を同一の表示エリア内にクラスタ表示した画面例である(その2)。 複数項目の特徴語を同一の表示エリア内にクラスタ表示した画面例である(その3)。
符号の説明
1 検索結果表示装置
2 処理部
3 記憶部
4 レコードDB
5 表示部
6 入力部
21 表示処理部
22 検索処理部
31 各種インデックス情報
32 レコードインデックス情報
211 論理演算処理部
212 強調表示処理部
1000,1100,4000 レコード
1008,1106,2014,2021,2022,4006 レコード番号
2001,2002,2003,2004 情報
2011 特徴語ID
2012 特徴語名称
2013 品詞番号
2015,2023 関連度
2016,2024 区切り記号
3000,5000,5000’6000,7000,8000 検索結果表示画面
3001,5005,6002,7001,8001 第1表示エリア
3002,5006,6003,7002,8002 第2表示エリア
3003,5007,6004,7003,8003 第3表示エリア
3004,6001,8004 レコード識別表示エリア
3004a 選択レコード表示エリア
3004b,7004a 非選択レコード表示
3004b,7004b 非選択レコード表示エリア
3005 クエリ入力エリア
3006 プルダウンメニュー
3010,3010a,3010c,5010,5010a,5010c,6010,6010a,6010c,7011a,7011c,8020,8021,8022a,8022c 特徴語ラベル
3010b,5010b,6010b,7011b,8022b 関連特徴語ラベル
5001 ファセット選択エリア
5002 第1ファセット入力窓
5003 第2ファセット入力窓
5004 第3ファセット入力窓
5008,6005,7005,8005 クエリ入力エリア
5009 プルダウンメニュー
6020 製品名ラベル
7021,7021,7023 表示項目指定エリア
8010 クラスタリング
8020 特徴語ラベル
8021 表示項目指定エリア

Claims (9)

  1. 複数の項目を有し、各項目には少なくとも1つの要素が記述された検索対象情報が、それぞれ識別子で識別されて複数登録された検索対象情報の集合について、当該集合を、検索語を使用して検索を行い、前記検索語による検索結果を、前記検索対象情報が有する項目の種別に対応する複数の表示区分ごとに表示部に表示する検索結果表示装置における検索結果表示方法であって、
    前記検索結果表示装置は、
    前記検索対象情報に含まれる要素のそれぞれについて、当該要素を含む検索対象情報と当該要素との関連性を示した関連度を当該検索対象情報の識別子で識別した、関連度と識別子との対を少なくとも1対有する要素ごとの関連度情報を、前記項目ごとに記憶部に複数記憶しており、
    前記検索語による検索により、前記検索対象情報の集合から、前記検索語に対応する検索対象情報を抽出し、前記抽出した各検索対象情報に記述された各要素を前記表示区分に表示する際に、前記関連度情報の関連度に基づいて、前記要素をの表示位置を決定し、前記要素を、前記決定した表示位置に従って、該当する前記表示区分ごとに前記表示部に表示し、
    入力部を介して、前記表示部に表示されている各要素のうち、任意の要素が選択されると、
    前記記憶部の前記要素ごとの関連度情報を参照することにより、前記識別子を介して前記選択された要素に関連性がある別の要素を、前記記憶部から取得し、
    当該取得された要素を、前記表示部に修飾表示することによって、異なる前記表示区分に表示されている前記選択された要素とは異なる要素を前記表示部に修飾表示することを特徴とする検索結果表示方法。
  2. 各表示区分ごとに表示されている要素のうち、前記選択された要素と、前記選択された要素とは関連性がある要素と、前記選択された要素とは関連性のない情報とに対し、それぞれ異なる修飾表示を行うことを特徴とする請求項1に記載の検索結果表示方法。
  3. 前記表示区分とは、前記検索結果表示装置が、前記検索対象情報の項目に対応させて、表示画面を表示エリアとして分割することであることを特徴とする請求項1に記載の検索結果表示方法。
  4. 前記表示区分とは、前記検索結果表示装置が、表示画面に表示されている情報に、当該要素が属する前記検索対象情報の項目に関する情報を付随して、1つの前記表示画面に表示させることであることを特徴とする請求項1に記載の検索結果表示方法。
  5. 前記要素の表示位置とは、前記関連度に基づき、前記要素間の表示画面上における距離を決定することであることを特徴とする請求項1に記載の検索結果表示方法。
  6. 前記要素の表示位置とは、前記表示部に表示されている複数の前記要素を、前記要素間の関連度に応じて、グループ分けするクラスタ表示であることを特徴とする請求項1に記載の検索結果表示方法。
  7. 前記検索対象情報とは、建設機器における機器情報、部品情報および故障情報を含む建設機器情報であることを特徴とする請求項1に記載の検索結果表示方法。
  8. 請求項1から請求項7に記載の検索結果表示方法をコンピュータに実行させることを特徴とする検索結果表示プログラム。
  9. 複数の項目を有し、各項目には少なくとも1つの要素が記述された検索対象情報が、それぞれ識別子で識別されて複数登録された検索対象情報の集合について、当該集合を、検索語を使用して検索を行い、前記検索語による検索結果を、前記検索対象情報が有する項目の種別に対応する複数の表示区分ごとに表示部に表示する検索結果表示装置であって、
    前記検索対象情報に含まれる要素のそれぞれについて、当該要素を含む検索対象情報と当該要素との関連性を示した関連度を当該検索対象情報の識別子で識別した、関連度と識別子との対を少なくとも1対有する要素ごとの関連度情報を、前記項目ごとに複数記憶している記憶部と、
    前記検索語による検索により、前記検索対象情報の集合から、前記検索語に対応する検索対象情報を抽出し、前記抽出した各検索対象情報に記述された各要素を前記表示区分に表示する際に、前記関連度情報の関連度に基づいて、前記要素をの表示位置を決定し、前記要素を、前記決定した表示位置に従って、該当する前記表示区分ごとに前記表示部に表示し、入力部を介して、前記表示部に表示されている各要素のうち、任意の要素が選択されると、前記記憶部の前記要素ごとの関連度情報を参照することにより、前記識別子を介して前記選択された要素に関連性がある別の要素を、前記記憶部から取得し、当該取得された要素を、前記表示部に修飾表示することによって、異なる前記表示区分に表示されている前記選択された要素とは異なる要素を前記表示部に修飾表示する表示処理部とを有することを特徴とする検索結果表示装置。
JP2007229312A 2007-09-04 2007-09-04 検索結果表示方法、検索結果表示プログラムおよび検索結果表示装置 Pending JP2009064097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007229312A JP2009064097A (ja) 2007-09-04 2007-09-04 検索結果表示方法、検索結果表示プログラムおよび検索結果表示装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007229312A JP2009064097A (ja) 2007-09-04 2007-09-04 検索結果表示方法、検索結果表示プログラムおよび検索結果表示装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007239700A Division JP5096850B2 (ja) 2007-09-14 2007-09-14 検索結果表示方法、検索結果表示プログラムおよび検索結果表示装置

Publications (1)

Publication Number Publication Date
JP2009064097A true JP2009064097A (ja) 2009-03-26

Family

ID=40558655

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007229312A Pending JP2009064097A (ja) 2007-09-04 2007-09-04 検索結果表示方法、検索結果表示プログラムおよび検索結果表示装置

Country Status (1)

Country Link
JP (1) JP2009064097A (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185786A (ja) * 1997-09-05 1999-03-30 Hitachi Ltd 文書検索方法、文書検索サービスおよび文書検索支援サービス
JP2003141166A (ja) * 2001-11-06 2003-05-16 Techno Tsurii:Kk 商品カタログ表示装置と商品カタログ表示プログラム
JP2004192355A (ja) * 2002-12-11 2004-07-08 Hitachi East Japan Solutions Ltd 情報の検索方法およびその装置および情報検索のためのコンピュータプログラム
JP2005208838A (ja) * 2004-01-21 2005-08-04 Nippon Telegr & Teleph Corp <Ntt> ラベル表示型文書検索装置、ラベル表示型文書検索方法、ラベル表示型文書検索方法を実行させるコンピュータプログラム並びにこのコンピュータプログラムが格納されたコンピュータ読み取り可能な記録媒体
JP3864235B2 (ja) * 2002-05-24 2006-12-27 株式会社 日立東日本ソリューションズ 情報検索システムおよび情報検索プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185786A (ja) * 1997-09-05 1999-03-30 Hitachi Ltd 文書検索方法、文書検索サービスおよび文書検索支援サービス
JP2003141166A (ja) * 2001-11-06 2003-05-16 Techno Tsurii:Kk 商品カタログ表示装置と商品カタログ表示プログラム
JP3864235B2 (ja) * 2002-05-24 2006-12-27 株式会社 日立東日本ソリューションズ 情報検索システムおよび情報検索プログラム
JP2004192355A (ja) * 2002-12-11 2004-07-08 Hitachi East Japan Solutions Ltd 情報の検索方法およびその装置および情報検索のためのコンピュータプログラム
JP2005208838A (ja) * 2004-01-21 2005-08-04 Nippon Telegr & Teleph Corp <Ntt> ラベル表示型文書検索装置、ラベル表示型文書検索方法、ラベル表示型文書検索方法を実行させるコンピュータプログラム並びにこのコンピュータプログラムが格納されたコンピュータ読み取り可能な記録媒体

Similar Documents

Publication Publication Date Title
US20200394200A1 (en) Website scoring system
CN107122400B (zh) 使用视觉提示细化查询结果的方法、计算系统及存储介质
Koch et al. VarifocalReader—in-depth visual analysis of large text documents
CN104115145B (zh) 生成表示满足搜索准则的对象中的内容实例的标签的显示组的可视化
WO2018072071A1 (zh) 知识图谱构建系统及方法
JP5587989B2 (ja) 観点別特許マップの提供方法
US20170315998A1 (en) Active Knowledge Guidance Based on Deep Document Analysis
US7788269B2 (en) Integration of predefined multi-dimensional and flexibly-ordered dynamic search interfaces
US8799859B2 (en) Augmented design structure matrix visualizations for software system analysis
US20090046898A1 (en) Displaying ranked categories of data in a venn diagram
JP2004287725A (ja) 検索処理方法及びプログラム
US20100306678A1 (en) User interface controls including capturing user mood
JP5096850B2 (ja) 検索結果表示方法、検索結果表示プログラムおよび検索結果表示装置
Healey et al. Interest driven navigation in visualization
JP5494493B2 (ja) 情報検索装置、情報検索方法、及びプログラム
JP5117589B2 (ja) 文書分析装置およびプログラム
US8850071B2 (en) Map intuition system and method
JP2005128872A (ja) 文書検索システム及び文書検索プログラム
JP2005165754A (ja) テキストマイニング分析装置、テキストマイニング分析方法、及びテキストマイニング分析プログラム
JP2006244298A (ja) テキストマイング方法及びテキストマイニング装置
JP2009064097A (ja) 検索結果表示方法、検索結果表示プログラムおよび検索結果表示装置
JP2008135057A (ja) 検索処理方法及びプログラム
JP4525224B2 (ja) ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置
CN111831882A (zh) 一种查询交互方法及装置
Zhao et al. V-Miner: using enhanced parallel coordinates to mine product design and test data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100401

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120416

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120424

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120911