JP2010211821A - 検索システム、検索方法、報告システム、報告方法、及びプログラム - Google Patents
検索システム、検索方法、報告システム、報告方法、及びプログラム Download PDFInfo
- Publication number
- JP2010211821A JP2010211821A JP2010111458A JP2010111458A JP2010211821A JP 2010211821 A JP2010211821 A JP 2010211821A JP 2010111458 A JP2010111458 A JP 2010111458A JP 2010111458 A JP2010111458 A JP 2010111458A JP 2010211821 A JP2010211821 A JP 2010211821A
- Authority
- JP
- Japan
- Prior art keywords
- concept
- document data
- search
- document
- search sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】複数の文書データから、検索文の内容を含む文書データを検索する検索システムであって、複数の文書データを記憶する文書データベースと、階層構造により複数の概念を記憶する概念データベースと、それぞれの文書データに含まれるキーワードに基づいて、当該文書データに対応する文書概念を抽出する文書データ概念抽出部と、検索文に含まれるキーワードに基づいて検索文概念を抽出する検索文概念抽出部と、複数の文書データのそれぞれのうち、検索文概念が文書概念の上位階層又は下位階層の概念となる文書データを検索する概念検索部と、概念検索部により検索された文書データを、検索文により指定される内容を含む文書データとして出力する検索結果出力部とを備える検索システムを提供する。
【選択図】図1
Description
[先行技術文献]
[特許文献1]特開平11−259524号公報
[特許文献2]特許3266586号公報
[非特許文献1]JUSTSYSTEM、「ConceptBase 技術とは」、[online]、平成15年7月30日、JUSTSYSTEM、[平成16年6月30日検索]、インターネット<URL: http://www.justsystem.co.jp/km/whats/search_q_104.html>
[非特許文献2]NRI、「サービスについて(NRIサイバーパテント)」、[online]、[平成16年6月30日検索]、インターネット<URL: http://www.patent.ne.jp/01gaiyo/s-point/06.html>
[非特許文献3]佐々木他、「SVMを用いた学習型質問応答システムSAIQA-II」、情報処理学会論文誌、Vol. 45、No 02、2004年
[非特許文献4]松村他、「単語間の係受け関係を用いた情報検索手法の評価」、情報処理学会論文誌、Vol. 41、No. SIG01-003、2000年
[非特許文献5]T. Nasukawa and T. Nagano, "Text analysis and knowledge mining system", IBM Systems Journal, Vol. 40, No. 4, 2001年
[非特許文献6]Autonomy, "Conceptual Search", [online], [平成16年6月30日検索]、インターネット<URL: http://www.autonomy.com/c/content/Products/IDOL/f/Conceptual_Search>
[非特許文献7]T. Fawcett and F. Provost, "Activity monitoring: Noticing interesting changes in behavior.", In Proc. Fifth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pages 53--62, 1999年
[非特許文献8]Jon Kleinberg, "Bursty and hierarchical structure in streams", In Proc.The 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2002年
[非特許文献9]藤木 稔明,南野 朋之,鈴木 泰裕,奥村 学、「document streamにおけるburstの発見」、情報処理学会研究報告、2004-NL-160、p.85-92
[非特許文献10]山西健司、「テキストマイニングとNLPビジネス」、[online]、NEC、[平成16年6月30日検索]、インターネット<URL:http://it.jeita.or.jp/eltech/committee/knowledge/PDF/2003/Yamanishi.pdf
[非特許文献11]野村総合研究所、「True Tellerとは?」、[online]、[平成16年6月30日検索]、インターネット<URL: http://www.trueteller.net/about/index.shtml>
[非特許文献12]JUSTSYSTEM、「Alize」、[online]、[平成16年6月30日検索]、インターネット<URL: http://www.justsystem.co.jp/km/ssm>
本実施形態に係る概念DB105は、一例として、ある物又は構成要素を特定する概念を上位階層とし、その物又は構成要素の状態等を説明する概念を下位階層とした階層構造を記憶する。
製品の概念階層は、複数の製品のそれぞれの製品名を示す概念の包含関係を階層構造により体系的にまとめたものである。本実施形態においては、不具合の概念階層と同様に、一の概念を包含する他の概念を一の概念の上位階層とする階層構造が用いられる。例えば、図3における「/製品/PC製品/ノート/シリーズA」は、「/製品/PC製品/ノート/シリーズA/モデルA1」及び「/製品/PC製品/ノート/シリーズA/モデルA2」を包含する総称的な製品名を示す概念である。
構成要素の概念階層は、製品を構成する各構成要素を示す各概念の包含関係を、階層構造により体系的にまとめたものである。本実施形態においては、不具合の概念階層と同様に、一の概念を包含する他の概念を一の概念の上位階層とする階層構造が用いられる。例えば、図4における「構成要素/ハードウェア」は、「構成要素/ハードウェア/ハードディスク」、「構成要素/ハードウェア/CPU」、「構成要素/ハードウェア/CDドライブ」、及び「構成要素/ハードウェア/キーボード」を包含する構成要素を示す概念となる。
まず、文書データ正規化部120は、辞書DB110を用いて、文書DB100に記憶された各文書データの形態素解析及び構造解析等のテキスト解析を行う(S500)。次に、文書データ正規化部120は、テキスト解析の結果抽出された各語句を、当該語句の正書に対応するキーワードに置換して、文書データを正規化する(S505)。この際、文書データ正規化部120は、当該語句に対応して一意に定まる概念が辞書中に記録されていた場合、この概念を用いて正規化を行う。
類義語DB115は、検索文及び文書データを正規化するために、図6に例示した正規化規則を記憶する。図6の正規化規則は、「電源を切る」又は「電源を落とす」という表現における「切る」又は「落とす」等の語句を、これらの類義語であるキーワード「遮断(する)」に置換して正規化するための規則である。文書データ正規化部120及び検索文正規化部140は、文書データ又は検索文の構文解析の結果、主語が「電源」、述語が「切る」又は「落とす」となる表現を検出した場合に、述語を「遮断(する)」に置換する。また、文書データ正規化部120及び検索文正規化部140は、単なる語句の置き換えだけでなく、「腹を立てる」を「怒る」に置換したり、「激怒する」を「非常に起こる」に置換する等の表現の正規化を、正規化規則に基づいて行ってもよい。そして、文書データ概念抽出部130は、正規化された文書データから文書概念を抽出し、検索文概念抽出部145は、正規化された検索文から検索文概念を抽出する。
概念抽出規則DB125は、検索文及び文書データから抽出する概念を予め定義するために、図7に例示した概念抽出規則を記憶する。ここで、概念抽出規則は、テキスト解析により得られた文章の構文(係り受け関係等)に基づいて、構文木中の1又は複数のキーワードを、当該1又は複数のキーワードの意味内容を示す概念に変換するための規則である。図7においては、「ハードディスクを認識できない」という文章から抽出されるキーワード「ハードディスク」及び「認識」と、「認識」の係り受け関係"否定"(hitei="1")とに基づいて、概念「/不具合/ハードウェア/ハードディスク」を抽出する規則を定めている。
また、概念抽出規則DB125は、不具合についての概念階層のみでなく、製品や構成要素の概念階層についての概念抽出規則を更に記憶してもよい。
まず、概念検索部150は、検索文から抽出された1又は複数の検索文概念を受け取る。また、概念検索部150は、各文書データについて、当該文書データから抽出された1又は複数の文書概念を受け取る。そして、同一概念出力部800は、検索文概念が文書概念と一致する場合(S900:Yes)に、処理をS940へ進める。これにより、同一概念出力部800は、検索文概念を検索文下位概念に置換できないことを条件として(S945:No)、当該文書データを検索結果として検索結果出力部160に出力する(S910)。ここで、複数の階層構造に対応して複数の検索文概念及び複数の文書概念が抽出されている場合、同一概念出力部800は、検索文概念の全てが、いずれかの文書概念と同一である場合に、当該文書データを検索結果として出力する。例えば、「不具合/ハードウェア/ハードディスク」、「製品/PC製品/ノート/シリーズA/モデルA1」、及び「構成要素/ハードウェア/ハードディスク」の3つの検索文概念が抽出された場合、同一概念出力部800は、これら3つの概念の全てを文書概念として含む文書データを検索結果として出力する。
すなわち例えば、文書データ概念抽出部130が、文書データに含まれるキーワードに基づいて、一の構成要素に不具合があることを示す文書概念を抽出し、検索文概念抽出部145が、検索文に含まれるキーワードに基づいて、当該一の構成要素の一部に不具合があることを示す検索概念を抽出した場合、上位概念取得部810は、当該検索文概念の上位階層の概念である、一の構成要素に不具合があることを示す概念を検索文上位概念として取得する。
すなわち例えば、文書データ概念抽出部130が、文書データに含まれるキーワードに基づいて、一の製品名を示す文書概念を抽出し、検索文概念抽出部145が、検索文に含まれるキーワードに基づいて、当該製品名の下位階層の製品名を示す検索文概念を抽出した場合、上位概念取得部810は、検索文概念の上位階層の製品名に対応する概念を検索文上位概念として取得する。
すなわち例えば、文書データ概念抽出部130が、文書データに含まれるキーワードに基づいて、一の構成要素を示す文書概念を抽出し、検索文概念抽出部145が、検索文に含まれるキーワードに基づいて、当該構成要素の一部の構成要素を示す検索文概念を抽出した場合、上位概念取得部810は、検索文概念の上位階層の構成要素に対応する概念を検索文上位概念として取得する。
ここで、複数の検索文上位概念が取得された場合においては、少なくとも1つの検索文概念を上位階層の検索文上位概念とした場合に、全ての検索文概念又は検索文概念を置き換えた検索文上位概念と一致する文書概念を有する文書データを検索結果として出力する。すなわち、例えば第1の検索文上位概念及び第2の検索文上位概念が取得された場合において、汎化概念出力部820は、第1の検索文概念及び第2の検索文概念の少なくとも一方を上位階層の概念とした場合に、第1の検索文概念と一致する文書概念及び第2の検索文概念と一致する文書概念を有する文書データを検索結果として出力する。
上位概念取得部810は、検索文概念と一致する文書概念を有する文書データが存在しない場合、図9のS920に示したように検索文概念を汎化する。例えば、本図において検索文概念が「…/シリーズA/モデルA3」であった場合、同一概念出力部800は、検索文概念「…/シリーズA/モデルA3」と同一の文書概念を有する文書データを1件も抽出することができない。そこで、上位概念取得部810は、検索文概念「…/シリーズA/モデルA3」を、上位階層の検索文上位概念「…/シリーズA」に置換し汎化する。
表示画面1100は、検索文入力画面1110と、概念操作画面1130と、検索結果出力画面1160とを備える。検索文入力画面1110は、検索システム10の利用者に検索文を入力させるための画面である。検索文正規化部140は、製品の機種名及び検索文を、検索文入力画面1110を用いて入力させ、検索ボタンにより検索開始の指示を受ける。また、検索文入力画面1110は、概念検索部150により汎化又は特化が行われた場合、その旨を例えば「シリーズAモデルA3をシリーズAに汎化しました。」のように表示する。
以上に示した検索システム10は、製品についての問い合わせ及び回答の検索に用いる他、各種の技術情報を文書データとして記憶しておき、検索文に基づいて検索を行う技術情報検索システムとしても使用できる。例えば、検索システム10は、各種の薬についての情報を文書データとして記憶しておき、「がん細胞を増幅させるたんぱく質」等の検索文に概念的に一致する文書データを検索するシステムとして用いられてもよい。
R = #(A∩X) / #A (2)
ここで、Aallは全ての製品、Aは不具合を報告する対象とする製品、Xは不具合に対応する概念又は概念の組、#Cは概念Cに対応する文書データの数を示す。ここで全ての製品とは、相対頻度算出部1210が相対頻度を算出する基準となる基準比率に寄与する複数の製品である。報告システム20は、この基準比率に寄与する製品として、図3に例示した製品の概念階層において、発生する不具合の傾向が略同一と認められる階層に対応する複数の製品を用いてよい。すなわち例えば、報告システム20は、図3における「製品/PC製品/ノート」の下位階層に位置する「シリーズA」、「シリーズB」、及び「シリーズC」等を基準比率に寄与する製品として用いてもよい。
RR1&2base = RR1×RR2×(#(X1∩Aall)×#(X2∩Aall)) / (#(X1∩X2∩Aall)×#Aall) (3)
例えば、概念Xが「/不具合/ハードウェア/インプット・デバイス/ポインティング・デバイス」(={X1})であり、概念Yが「/不具合/ハードウェア/インプット・デバイス/ポインティング・デバイス/マウス」(={Y1})の場合である。
(Yの相対頻度) > α×(Xの相対頻度) (4)
ただし、αは予め定められた割合であり、例えば1.5〜2程度の値をとる。
例えば、概念Xが「/構成要素/ハードウェア/ファン」(={X1})であり、概念Yが「/構成要素/ハードウェア/ファン」(=Y1)&&「/問題/ハードウェア/騒音」(=Y2)の場合である。なお、"&&"は、概念Yが、概念Y1及び概念Y2のAND条件であることを示す。
(Yの相対頻度)>α×(XとZが独立事象である場合のYの相対頻度(RR1&2base)) (5)
20 報告システム
100 文書DB
105 概念DB
106 製品DB
107 構成要素DB
110 辞書DB
115 類義語DB
120 文書データ正規化部
125 概念抽出規則DB
130 文書データ概念抽出部
135 検索インデクスDB
140 検索文正規化部
145 検索文概念抽出部
150 概念検索部
155 概念選択支援部
160 検索結果出力部
800 同一概念出力部
810 上位概念取得部
820 汎化概念出力部
830 下位概念取得部
840 特化概念出力部
1100 表示画面
1110 検索文入力画面
1130 概念操作画面
1160 検索結果出力画面
1200 概念比率算出部
1203 全製品概念比率算出部
1206 特定製品概念比率算出部
1210 相対頻度算出部
1220 多頻度概念選択部
1230 優先概念選択部
1240 基準頻度算出部
1250 通知部
1900 コンピュータ
2000 CPU
2010 ROM
2020 RAM
2030 通信インターフェイス
2040 ハードディスクドライブ
2050 フレキシブルディスク・ドライブ
2060 CD−ROMドライブ
2070 入出力チップ
2075 グラフィック・コントローラ
2080 表示装置
2082 ホスト・コントローラ
2084 入出力コントローラ
2090 フレキシブルディスク
2095 CD−ROM
Claims (20)
- 複数の文書データから、入力された検索文により指定される内容を含む文書データを検索する検索システムであって、
前記複数の文書データを記憶する文書データベースと、
一の概念を包含する他の概念を当該一の概念の上位階層とする階層構造により、予め定められた複数の概念を記憶する概念データベースと、
それぞれの前記文書データに含まれるキーワードに基づいて、当該文書データに対応する前記概念である文書概念を抽出する文書データ概念抽出部と、
前記検索文に含まれるキーワードに基づいて、前記検索文に対応する前記概念である検索文概念を抽出する検索文概念抽出部と、
前記複数の文書データのそれぞれのうち、前記検索文概念が前記文書概念の上位階層又は下位階層の概念となる前記文書データを検索する概念検索部と、
前記概念検索部により検索された前記文書データを、前記検索文により指定される内容を含む前記文書データとして出力する検索結果出力部と
を備える検索システム。 - 1又は複数の前記キーワードと、当該1又は複数のキーワードの意味内容を示す前記概念との組を含む概念抽出規則を記憶する概念抽出規則データベースを更に備え、
前記検索文概念抽出部は、いずれかの前記概念抽出規則に含まれる前記1又は複数のキーワードが前記検索文に含まれる場合に、当該概念抽出規則に含まれる前記概念を、前記検索文概念として抽出する
請求項1記載の検索システム。 - 前記文書データ概念抽出部は、いずれかの前記概念抽出規則に含まれる前記1又は複数のキーワードが前記文書データに含まれる場合に、当該概念抽出規則に含まれる前記概念を、前記文書概念として抽出する
請求項2記載の検索システム。 - それぞれの前記文書データについて、前記文書データ概念抽出部により抽出された、当該文書データの前記文書概念と、当該文書データとの対応付けを記憶する検索インデクスデータベースを更に備え、
前記概念検索部は、前記検索文概念が、前記検索文が入力される前に前記検索インデクスデータベースに格納された前記文書概念の上位階層又は下位階層の概念となる場合に、当該文書概念に対応する前記文書データを検索結果として出力する
請求項1記載の検索システム。 - 予め定められた語句と、当該語句の類義語である前記キーワードとの対応付けを記憶する類義語データベースと、
それぞれの前記文書データに含まれる前記語句を、当該語句の類義語である前記キーワードに置換することにより当該文書データを正規化する文書データ正規化部と、
前記検索文に含まれる前記語句を、当該語句の類義語である前記キーワードに置換することにより前記検索文を正規化する検索文正規化部と
を更に備え、
前記文書データ概念抽出部は、正規化された前記文書データから前記文書概念を抽出し、
前記検索文概念抽出部は、正規化された前記検索文から前記検索文概念を抽出する
請求項1記載の検索システム。 - 前記概念検索部は、
前記検索文概念が、前記文書概念と一致しない場合に、前記検索文概念の上位階層の概念である検索文上位概念を取得する上位概念取得部と、
前記検索文上位概念が、前記文書概念と一致する場合に、当該文書データを検索結果として出力する汎化概念出力部と
を有する請求項1記載の検索システム。 - 前記概念データベースは、前記複数の概念のそれぞれを、第1の前記階層構造又は第2の前記階層構造のノードとして記憶し、
前記文書データ概念抽出部は、前記文書データに対応して、前記第1の階層構造に属する第1の前記文書概念及び前記第2の階層構造に属する第2の前記文書概念を抽出し、
前記検索文概念抽出部は、前記検索文に対応して、前記第1の階層構造に属する第1の前記検索文概念及び前記第2の階層構造に属する第2の前記検索文概念を抽出し、
前記上位概念取得部は、前記第1の検索文概念及び前記第2の検索文概念が、前記第1の文書概念及び前記第2の文書概念とそれぞれ同一でない場合に、前記第1の検索文概念の上位階層の第1の前記検索文上位概念と、前記第2の検索文概念の上位階層の第2の前記検索文上位概念とを取得し、
前記汎化概念出力部は、前記第1の検索文上位概念及び前記第1の文書概念と、前記第2の検索文概念及び前記第2の文書概念とがそれぞれ同一となる第1の前記文書データの数が、前記第1の検索文概念及び前記第1の文書概念と、前記第2の検索文上位概念及び前記第2の文書概念とがそれぞれ同一となる第2の前記文書データの数より小さい場合に、前記第1の文書データを検索結果として出力する
請求項6記載の検索システム。 - 前記概念検索部は、
前記検索文概念と同一の前記文書概念を有する前記文書データの全てが、前記検索文概念の下位階層の概念である検索文下位概念と同一の前記文書概念を有する場合に、前記検索文概念を、当該検索文下位概念に置換する下位概念取得部と、
前記検索文下位概念が前記文書概念と一致する前記文書データを検索結果として出力する特化概念出力部と
を有する請求項1記載の検索システム。 - 前記概念データベースは、製品についての複数の不具合を特定する前記複数の概念を記憶し、
前記文書データベースは、それぞれの前記不具合について、当該不具合の内容を示す前記文書データを記憶し、
前記検索文概念抽出部は、利用者により入力された、前記製品についての前記不具合を検索するための前記検索文に対応する前記検索文概念を抽出し、
前記検索結果出力部は、前記概念検索部により検索された前記文書データを、前記利用者により入力された前記製品についての前記不具合の内容を示す前記文書データとして出力する
請求項1記載の検索システム。 - 前記概念データベースは、前記製品の構成要素に不具合があることを示す前記概念の下位階層に、当該構成要素の不具合の状態を示す前記概念を設けた階層構造により前記複数の概念を記憶し、
前記文書データ概念抽出部は、前記文書データに含まれるキーワードに基づいて、一の前記構成要素に不具合があることを示す前記文書概念を抽出し、
前記検索文概念抽出部は、前記検索文に含まれるキーワードに基づいて、前記一の構成要素の不具合の状態を示す前記検索文概念を抽出し、
前記概念検索部は、
前記検索文概念の上位階層の前記概念である、前記一の構成要素に不具合があることを示す前記概念を検索文上位概念として取得する上位概念取得部と、
前記検索文上位概念と一致する、前記一の構成要素に不具合があることを示す前記文書概念を有する前記文書データを、検索結果として出力する汎化概念出力部と
を有する
請求項1記載の検索システム。 - 前記製品の各構成要素の包含関係を階層構造により記憶する構成要素データベースを更に備え、
前記文書データ概念抽出部は、前記文書データに含まれるキーワードに基づいて、前記文書データに記述された前記構成要素を示す前記文書概念を更に抽出し、
前記検索文概念抽出部は、前記検索文に含まれるキーワードに基づいて、前記検索文に記述された前記構成要素を示す前記検索文概念を更に抽出し、
前記上位概念取得部は、前記構成要素に不具合があること又は前記構成要素の不具合の状態を示す第1の前記検索文概念の上位階層となる前記概念と、前記構成要素を示す第2の前記検索文概念の上位階層となる前記概念とを取得し、
前記汎化概念出力部は、前記第1の検索文概念及び前記第2の検索文概念の少なくとも一方を上位階層の前記概念とした場合に、前記第1の検索文概念と一致する前記文書概念及び前記第2の検索文概念と一致する前記文書概念を有する前記文書データを検索結果として出力する
請求項10記載の検索システム。 - 複数の前記製品の製品名の包含関係を階層構造により記憶する製品データベースを更に備え、
前記文書データ概念抽出部は、前記文書データに含まれるキーワードに基づいて、前記文書データに記述された前記製品名を示す前記文書概念を更に抽出し、
前記検索文概念抽出部は、前記検索文に含まれるキーワードに基づいて、前記検索文概念抽出部に記述された前記製品名を示す前記検索文概念を更に抽出し、
前記上位概念取得部は、前記構成要素に不具合があること又は前記構成要素の不具合の状態を示す第1の前記検索文概念の上位階層となる前記概念と、前記製品名を示す第2の前記検索文概念の上位階層となる前記概念とを取得し、
前記汎化概念出力部は、前記第1の検索文概念及び前記第2の検索文概念の少なくとも一方を上位階層の前記概念とした場合に、前記第1の検索文概念と一致する前記文書概念及び前記第2の検索文概念と一致する前記文書概念を有する前記文書データを検索結果として出力する
請求項10記載の検索システム。 - 入力された文書データを順次記憶する文書データベースと、
一の概念を包含する他の概念を当該一の概念の上位階層とする階層構造により、予め定められた複数の概念を記憶する概念データベースと、
それぞれの前記文書データに含まれるキーワードに基づいて、当該文書データに対応する前記概念である文書概念を抽出する文書データ概念抽出部と、
前記文書データベース内の前記文書データの数に対する、それぞれの前記概念に対応する前記文書データの数の比率を算出する概念比率算出部と、
それぞれの前記概念に対応する基準比率に対する、前記概念比率算出部により算出された比率の大きさを示す相対頻度を算出する相対頻度算出部と、
前記複数の概念のうち、前記相対頻度が予め定められたしきい値以上となる前記概念を選択する多頻度概念選択部と、
前記多頻度概念選択部が選択した第1の前記概念と、前記第1の概念の上位階層の第2の前記概念との一方を、前記第1の概念及び前記第2の概念の相対頻度に基づいて選択する優先概念選択部と、
前記第1の概念又は前記第2の概念のうち、前記優先概念選択部により選択された前記概念の相対頻度が高くなっていることを、使用者へ通知する通知部と
を備える報告システム。 - 前記文書データベースは、複数の製品のそれぞれについて、当該製品の不具合の内容を示す文書データを記憶し、
前記概念データベースは、製品についての複数の不具合を特定する前記複数の概念を記憶し、
前記文書データ概念抽出部は、それぞれの前記文書データに含まれるキーワードに基づいて、当該文書データに対応する前記概念である文書概念を抽出し、
前記概念比率算出部は、
前記複数の製品について、前記文書データの数に対する、それぞれの前記概念に対応する前記文書データの数の比率を算出する全製品概念比率算出部と、
少なくとも1つの前記製品についての前記文書データの数に対する、それぞれの前記概念に対応する当該製品についての前記文書データの数の比率を算出する特定製品概念比率算出部と
を有し、
前記相対頻度算出部は、前記全製品概念比率算出部により算出された比率に対する、前記特定製品概念比率算出部により算出された比率の大きさを示す前記相対頻度を算出し、
前記多頻度概念選択部は、前記複数の概念のうち、前記少なくとも1つの製品についての前記相対頻度が、前記予め定められたしきい値以上となる前記概念を選択し、
前記優先概念選択部は、前記多頻度概念選択部が選択した前記第1の概念と、前記第1の概念の上位階層の前記第2の概念との一方を、前記第1の概念及び前記第2の概念の相対頻度に基づいて選択し、
前記通知部は、前記第1の概念又は前記第2の概念のうち、前記優先概念選択部により選択された前記概念に対応する不具合が前記少なくとも1つの製品に多発していることを、当該検索システムの使用者へ通知する
請求項13記載の報告システム。 - 前記優先概念選択部は、前記第1の概念の相対頻度が、前記第2の概念の相対頻度と比較して予め定められた割合以上大きい場合に前記第1の概念を選択し、前記予め定められた割合以上大きくない場合に前記第2の概念を選択する請求項13記載の報告システム。
- 前記概念データベースは、前記複数の概念のそれぞれを、第1の前記階層構造又は第2の前記階層構造のノードとして記憶し、
前記文書データ概念抽出部は、前記文書データに対応して、前記第1の階層構造に属する第1の前記文書概念及び前記第2の階層構造に属する第2の前記文書概念を抽出し、
前記概念比率算出部は、前記文書データベース内の前記文書データの数に対する、前記第1の階層構造の前記概念に対応する前記文書データの数の第1比率と、前記第2の階層構造の前記概念に対応する前記文書データの数の第2比率と、前記第1の階層構造の前記概念及び前記第2の階層構造の前記概念の組み合わせに対応する前記文書データの数の第3比率とを算出し、
前記相対頻度算出部は、前記第1の階層構造の前記概念に対応する基準比率に対する前記第1比率の大きさを示す第1相対頻度と、前記第2の階層構造の前記概念に対応する基準比率に対する前記第2比率の大きさを示す第2相対頻度と、前記第1の階層構造の前記概念及び前記第2の階層構造の前記概念の組み合わせに対応する基準比率に対する、前記第3比率の大きさを示す第3相対頻度とを算出し、
前記多頻度概念選択部は、前記第1の階層構造の前記概念及び前記第2の階層構造の前記概念の組み合わせのうち、前記相対頻度が前記しきい値以上となる前記第1の階層構造の第3の概念及び前記第2の階層構造の第4の概念の組を選択し、
当該報告システムは、前記第3の概念についての前記第1相対頻度及び前記第4の概念についての前記第2相対頻度に基づいて、前記第3の概念及び前記第4の概念が独立事象であった場合における前記第3相対頻度の計算値を算出する基準頻度算出部を更に備え、
前記優先概念選択部は、前記第3相対頻度が、前記第3の概念及び前記第4の概念が独立事象であった場合における当該第3相対頻度の計算値と比較して予め定められた割合以上大きい場合に、前記第3の概念及び前記第4の概念の組み合わせを選択し、前記予め定められた割合以上大きくない場合に、前記第3の概念を選択し、
前記通知部は、前記優先概念選択部により選択された前記第3の概念及び前記第4の概念の組み合わせ、又は前記第3の概念の相対頻度が高くなっていることを、使用者へ通知する
請求項13記載の報告システム。 - 複数の文書データから、入力された検索文により指定される内容を含む文書データを検索する検索システムによる検索方法であって、
前記複数の文書データを記憶する文書データベース記憶段階と、
一の概念を包含する他の概念を当該一の概念の上位階層とする階層構造により、予め定められた複数の概念を記憶する概念データベース段階段階と、
それぞれの前記文書データに含まれるキーワードに基づいて、当該文書データに対応する前記概念である文書概念を抽出する文書データ概念抽出段階と、
前記検索文に含まれるキーワードに基づいて、前記検索文に対応する前記概念である検索文概念を抽出する検索文概念抽出段階と、
前記複数の文書データのそれぞれのうち、前記検索文概念が前記文書概念の上位階層又は下位階層の概念となる前記文書データを検索する概念検索段階と、
前記概念検索部により検索された前記文書データを、前記検索文により指定される内容を含む前記文書データとして出力する検索結果出力段階と
を備える検索方法。 - 複数の文書データが順次入力される報告システムにおける報告方法であって、
入力された文書データを順次記憶する文書データベース記憶段階と、
一の概念を包含する他の概念を当該一の概念の上位階層とする階層構造により、予め定められた複数の概念を記憶する概念データベース記憶段階と、
それぞれの前記文書データに含まれるキーワードに基づいて、当該文書データに対応する前記概念である文書概念を抽出する文書データ概念抽出段階と、
前記文書データベース記憶段階において記憶された前記文書データの数に対する、それぞれの前記概念に対応する前記文書データの数の比率を算出する概念比率算出段階と、
それぞれの前記概念に対応する基準比率に対する、前記概念比率算出段階により算出された比率の大きさを示す相対頻度を算出する相対頻度算出段階と、
前記複数の概念のうち、前記相対頻度が予め定められたしきい値以上となる前記概念を選択する多頻度概念選択段階と、
前記多頻度概念選択段階が選択した第1の前記概念と、前記第1の概念の上位階層の第2の前記概念との一方を、前記第1の概念及び前記第2の概念の相対頻度に基づいて選択する優先概念選択段階と、
前記第1の概念又は前記第2の概念のうち、前記優先概念選択段階により選択された前記概念の相対頻度が高くなっていることを、使用者へ通知する通知段階と
を備える報告方法。 - 複数の文書データから、入力された検索文により指定される内容を含む文書データを検索する検索システム用のプログラムであって、
当該プログラムは、前記検索システムを、
前記複数の文書データを記憶する文書データベースと、
一の概念を包含する他の概念を当該一の概念の上位階層とする階層構造により、予め定められた複数の概念を記憶する概念データベースと、
それぞれの前記文書データに含まれるキーワードに基づいて、当該文書データに対応する前記概念である文書概念を抽出する文書データ概念抽出部と、
前記検索文に含まれるキーワードに基づいて、前記検索文に対応する前記概念である検索文概念を抽出する検索文概念抽出部と、
前記複数の文書データのそれぞれのうち、前記検索文概念が前記文書概念の上位階層又は下位階層の概念となる前記文書データを検索する概念検索部と、
前記概念検索部により検索された前記文書データを、前記検索文により指定される内容を含む前記文書データとして出力する検索結果出力部と
して機能させるプログラム。 - 複数の文書データが順次入力される報告システム用のプログラムであって、
当該プログラムは、前記報告システムを、
入力された文書データを順次記憶する文書データベースと、
一の概念を包含する他の概念を当該一の概念の上位階層とする階層構造により、予め定められた複数の概念を記憶する概念データベースと、
それぞれの前記文書データに含まれるキーワードに基づいて、当該文書データに対応する前記概念である文書概念を抽出する文書データ概念抽出部と、
前記文書データベース内の前記文書データの数に対する、それぞれの前記概念に対応する前記文書データの数の比率を算出する概念比率算出部と、
それぞれの前記概念に対応する基準比率に対する、前記概念比率算出部により算出された比率の大きさを示す相対頻度を算出する相対頻度算出部と、
前記複数の概念のうち、前記相対頻度が予め定められたしきい値以上となる前記概念を選択する多頻度概念選択部と、
前記多頻度概念選択部が選択した第1の前記概念と、前記第1の概念の上位階層の第2の前記概念との一方を、前記第1の概念及び前記第2の概念の相対頻度に基づいて選択する優先概念選択部と、
前記第1の概念又は前記第2の概念のうち、前記優先概念選択部により選択された前記概念の相対頻度が高くなっていることを、使用者へ通知する通知部と
して機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010111458A JP5046170B2 (ja) | 2010-05-13 | 2010-05-13 | 検索システム、検索方法、報告システム、報告方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010111458A JP5046170B2 (ja) | 2010-05-13 | 2010-05-13 | 検索システム、検索方法、報告システム、報告方法、及びプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004206567A Division JP4587163B2 (ja) | 2004-07-13 | 2004-07-13 | 検索システム、検索方法、報告システム、報告方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010211821A true JP2010211821A (ja) | 2010-09-24 |
JP5046170B2 JP5046170B2 (ja) | 2012-10-10 |
Family
ID=42971834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010111458A Expired - Fee Related JP5046170B2 (ja) | 2010-05-13 | 2010-05-13 | 検索システム、検索方法、報告システム、報告方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5046170B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012203779A (ja) * | 2011-03-28 | 2012-10-22 | Fuji Xerox Co Ltd | プログラム及び情報処理装置 |
JP2015141323A (ja) * | 2014-01-29 | 2015-08-03 | トヨタ自動車株式会社 | 情報収集方法、対話システム及び情報収集装置 |
JP2016095723A (ja) * | 2014-11-14 | 2016-05-26 | 富士通株式会社 | 対応情報生成プログラム、対応情報生成装置及び対応情報生成方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001273381A (ja) * | 2000-03-28 | 2001-10-05 | Shigeo Kaneda | 流行予測支援方法、流行予測支援装置、及び流行予測支援プログラムを格納した記憶媒体 |
JP2003281161A (ja) * | 2002-03-19 | 2003-10-03 | Seiko Epson Corp | 情報分類方法、情報分類装置、プログラムおよび記録媒体 |
-
2010
- 2010-05-13 JP JP2010111458A patent/JP5046170B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001273381A (ja) * | 2000-03-28 | 2001-10-05 | Shigeo Kaneda | 流行予測支援方法、流行予測支援装置、及び流行予測支援プログラムを格納した記憶媒体 |
JP2003281161A (ja) * | 2002-03-19 | 2003-10-03 | Seiko Epson Corp | 情報分類方法、情報分類装置、プログラムおよび記録媒体 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012203779A (ja) * | 2011-03-28 | 2012-10-22 | Fuji Xerox Co Ltd | プログラム及び情報処理装置 |
JP2015141323A (ja) * | 2014-01-29 | 2015-08-03 | トヨタ自動車株式会社 | 情報収集方法、対話システム及び情報収集装置 |
JP2016095723A (ja) * | 2014-11-14 | 2016-05-26 | 富士通株式会社 | 対応情報生成プログラム、対応情報生成装置及び対応情報生成方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5046170B2 (ja) | 2012-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4587163B2 (ja) | 検索システム、検索方法、報告システム、報告方法、及びプログラム | |
US20200320086A1 (en) | Method and system for content recommendation | |
US10394830B1 (en) | Sentiment detection as a ranking signal for reviewable entities | |
US8712926B2 (en) | Using rule induction to identify emerging trends in unstructured text streams | |
Maedche et al. | The ontology extraction & maintenance framework Text-To-Onto | |
JP5241828B2 (ja) | 辞書の単語及び熟語の判定 | |
CA2711665C (en) | Aspect-based sentiment summarization | |
US20160085742A1 (en) | Automated collective term and phrase index | |
JP5313337B2 (ja) | モバイル・コンピューティング装置に対する検索結果の提供 | |
US7284009B2 (en) | System and method for command line prediction | |
US20100235340A1 (en) | System and method for knowledge research | |
US20090070322A1 (en) | Browsing knowledge on the basis of semantic relations | |
US20090094208A1 (en) | Automatically Generating A Hierarchy Of Terms | |
WO2008098956A1 (en) | Method and apparatus for automatically discovering features in free form heterogeneous data | |
JP2010055618A (ja) | トピックを基にした検索を提供する方法及びシステム | |
WO2008083504A1 (en) | Method and system for information discovery and text analysis | |
WO2009100081A1 (en) | System and method for utilizing advanced search and highlighting techniques for isolating subsets of relevant data | |
JPWO2008146807A1 (ja) | オントロジ処理装置、オントロジ処理方法、及びオントロジ処理プログラム | |
JP2012093927A (ja) | ファイル管理装置及びファイル管理方法 | |
US20080215585A1 (en) | System and method for creation, representation, and delivery of document corpus entity co-occurrence information | |
US20060215298A1 (en) | Information presentation apparatus, and information presentation method and program for use therein | |
JP5218409B2 (ja) | 関連情報検索システム及び関連情報検索方法 | |
JP5836893B2 (ja) | ファイル管理装置、ファイル管理方法、及びプログラム | |
JP5046170B2 (ja) | 検索システム、検索方法、報告システム、報告方法、及びプログラム | |
US20160246794A1 (en) | Method for entity-driven alerts based on disambiguated features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120612 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20120613 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120706 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150727 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |