JP2005063284A - 実績管理支援システム及び実績管理支援プログラム - Google Patents
実績管理支援システム及び実績管理支援プログラム Download PDFInfo
- Publication number
- JP2005063284A JP2005063284A JP2003294851A JP2003294851A JP2005063284A JP 2005063284 A JP2005063284 A JP 2005063284A JP 2003294851 A JP2003294851 A JP 2003294851A JP 2003294851 A JP2003294851 A JP 2003294851A JP 2005063284 A JP2005063284 A JP 2005063284A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- search
- important word
- string class
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】「CL13フリーズ」という検索質問文が入力されたとすると、S601、S602、S604を行わないでS606又はS608で検索質問文として「CL13フリーズ」という文字列が取得される。そしてS607又はS609においては、インデックスDBのデータテーブルが参照され当該インデックスDBに格納された重要語Wと一致する一致文字列が「CL13フリーズ」の全体又は一部に含まれるか否かが判断され、含まれると判断されると当該一致文字列が検索キーとして切り出される。この検索キーを用いて検索がなされる。
【選択図】図9B
Description
具体的には、あるトラブルについて検索したところ、いくつかの対応実績が見つかったときに、同様の原因で発生するトラブルが他の設備でも発生するのか否かがシステムに負荷をかけずに短時間で簡単に連想的に検索でき未然に対応策を練ることを可能とするシステムが求められていた。
本発明の第二の目的は、専門知識を持たなくても簡単に使用できる実績管理支援システム及び実績管理支援プログラムを提供することにある。
「サフィックス」とはテキスト中に存在する全ての文字からテキストの終端までの部分文字列をいう。換言すれば「サフィックス」とは「何らかの区切り(セル番号毎、列毎など)単位」における「何らかの意味をなす完成文又は未完成文」に存在する全ての文字からの終端までの部分文字列ということができる。「その比較結果」とはテキストが同一かどうかとか、テキストの長さは同一かどうかといった観点による比較結果をいう。「文字列クラス」とはサフィックスから切り出された文字列をいい、特に限定されないが、例えば、比較するサフィックスどうしの共通部分や、比較するサフィックスどうしに全く共通部分がないときはそのサフィックスそのものなどをいう。「文字列クラス群」とは少なくとも一つの文字列クラスからなる群をいう。「出現頻度」とは知識抽出対象DBの全部又は一部から切り出された文字列クラスが出現する頻度をいう。
「包含関係」とは、「ボー」と、「ボード」を比較したときに「ボー」は「ボード」に包含されるという関係をいう。「下位文字列クラス」とは包含されるほうの文字列クラスといい、「上位文字列クラス」とは包含するほうの文字列クラスをいい、例えば、「ボー」と「ボード」とでは、「ボー」が下位文字列クラス、「ボード」が上位文字列クラスとなる。また「前記下位文字列クラスは前記上位文字列クラスと見なして」とは、例えば、下位文字列クラスたる「ボー」を上位文字列クラスたる「ボード」として抽出するということを意味するものである。
「重要語」とは文字列クラスからある条件を満たすことにより抽出されたデータであればよい。これにより工場やオフィスで使用される専門用語、キーワードが重要語として抽出されるからである。
「位置情報」とは直接的なものでも間接的なものでもよく、最終的に知識抽出対象DBのどこに格納されているかを示すものであればよい。「重要語をキー」とは、重要語を引けばそれに対応づけられた情報(ここでは当該重要語の位置情報)が全て得られることを意味し、「位置情報をキー」とは、位置情報を引けばそれに対応づけられた情報(ここでは当該位置(例えば、セル番号で示される位置)に格納されている重要語)が全て得られることを意味する。「検索質問文」とはユーザにより入力されたデータ又は知識抽出対象DBに格納されたあるフィールドに属するセルのデータのことをいい、任意の文字列からなるものであればよい。
インデックス生成手段は、知識抽出/辞書構築手段により抽出された重要語と、当該重要語が前記知識抽出対象DBのどこに格納されているかを示す位置情報とを含むインデックスを前記重要語又は前記位置情報をキーとして生成する。検索質問文入力手段を介して任意の文字列が検索質問文として入力される。任意の文字列が検索質問文として入力され得るためユーザが専門知識を持たなくても簡単に使用される。検索キー生成手段は、前記インデックスを参照することにより、当該インデックスに格納された重要語と一致する一致文字列を、当該検索質問文がその全体又は一部に含むか否かを判断し、当該一致文字列を検索キーとして切り出す。そのためシステム特有の知識辞書としての重要語辞書が自動的に利用され検索処理が行われる。
またインデックスが作成されるため特化された範囲で検索を行うことができ、処理速度の向上に寄与するものとなる。また検索キーがユーザによって入力される検索質問文から切り出されるため、検索質問文として受け付けられる文字列を予め登録しておかなくても完全自動処理が実現される。
「重要度」とは出現頻度に基づくものであればよく、通常は出現頻度が多いものほど重要度が高く、出現頻度が少ないものほど重要度が低いものととらえて差し支えないが、これに限定されるものではない。すなわち、ここでいう「重要度」は出現頻度が高くても不要なものは除去し、出現頻度が少なくても重要なものは当然包含する意味である。本発明の場合、第一知識抽出/辞書構築手段、第二知識抽出/辞書構築手段及び第三知識抽出/辞書構築手段から選ばれる少なくとも一つの手段により不要なものが除去されていることで具体的な構成が示されているものといえる。また「重要度」とは換言すれば、DBにおいて重要語がどれだけ特徴的であるかを示す尺度ともいえる。
本発明に係る実績管理支援システム及び実績管理支援プログラムは、検索質問文入力手段を介して検索質問文として任意の文字列が入力されると、検索キー生成手段が前記インデックスを参照することにより、当該インデックスに格納された重要語と一致する一致文字列を、当該検索質問文がその全体又は一部に含むか否かを判断し、当該一致文字列を検索キーとして切り出すものであるから、ユーザは専門知識を持たなくても簡単に使用することができるという効果がある。
[一実施形態の概要]
本発明の一実施形態に係るトラブル保全管理支援システムAは、DB再利用モジュールBを構成するDB知識抽出モジュールC及びDB知識検索モジュールDにおける情報処理がサフィックスアレイを用いた新規な手法によって実現されている点に特徴がある。
図1Aは本発明の一実施形態に係るトラブル保全管理支援システムAの構成を示したもの、図1BはDB再利用モジュールBの構成を示したものである。また図2AはリレーショナルDB1(以下「RDB1」とする)に格納されている知識の一例としてデータテーブルT10を示したもの、図2B〜図2Dはそれぞれ、重要語辞書DB8a,8b,8c,8d(以下、重要語辞書DBを総称する場合には、単に「重要語辞書DB8」とする)、インデックスDB10a,10b,10c,10d(以下、インデックスDBを総称する場合には、単に「インデックスDB10」とする)、重要度DB11a,11b,11c,11d(以下、重要度DBを総称する場合には単に「重要度DB11」とする)に格納されるデータテーブルT20〜T40又はその一部の一例を示したものである。
重要語辞書DB8a、インデックスDB10a、重要度DB11aは、トラブル保全管理支援システムAが知識抽出対象とするRDB1に格納された図2Aに示したデータテーブルT10のうち、「トラブル事象」というフィールドに属するデータを対象として構築されたDBである。重要語辞書DB8b、インデックスDB10b、重要度DB11bは、同図に示したデータテーブルT10のうち、「原因」というフィールドに属するデータを対象として構築されたDBである。重要語辞書DB8c、インデックスDB10c、重要度DB11cは、同図に示したデータテーブルT10のうち、「処置」というフィールドに属するデータを対象として構築されたDBである。重要語辞書DB8d、インデックスDB10d、重要度DB11dは、同図に示したデータテーブルT10のうち、「対策」というフィールドに属するデータを対象として構築されたDBである。
図3Aはトラブル保全管理支援システムAをDB知識検索モジュールDとして起動させたときの起動画面SC1の画面構成を示したものである。起動画面では、例えば、タイトル21、入力支援表示22、ユーザ入力欄23、実行ボタン24が表示される。
選択フィールド内の検索結果26としては、図3B〜Eに示したように、選択フィールドとしてキーボードやマウス入力により選択された選択フィールドを示すフィールド名26a、当該選択フィールドに属するセルのうち「キーボードやマウス入力により入力されユーザ入力欄23に表示されている検索質問文から切り出された検索キー」を含有するセル(「含有セル」ともいう)の含有セル内容26b、含有セルを含むレコード(検索してヒットしたレコード)の当該フィールドにおける通し番号26c、類似度26dが各レコード毎に類似度が高い順に表示される。類似度の計算の方法については後述するが、出現頻度に基づいて求められる重要度に基づいて求められる数値であり類似度が高いほど検索質問文と関連性が高く類似度が低いほど検索質問文と関連性が低い。
また図3Dの含有セル内容26bによれば、検索質問文が少し異なっていても検索結果には差がない。例えば、1番目の「LS異常で停止」と、2番目の「LS異常にて停止」とでは厳密には「で」と「にて」との違いがあるが、検索質問文に含まれている重要語Wがトラブル事象に含まれているか否かに基づいて検索されるため、重要語Wが含まれている限り重要語辞書DBには存在しないテキストの存在の有無やテキストの違いは検索結果には影響が出ない。このことは、図の含有セル内容26bの3番目の「W/W LS異常にて停止」と、4番目の「W/W LS異常で停止」、更に7番目の「ウォッシャーLS異常にて停止」と、8番目の「ウォッシャーLS異常で停止」でも同様である。
更に図3F〜Gに示したようにユーザチェック欄26eを設けることもできる。図3Fのチェックが無い状態において、同図に示したように7番目と8番目の欄にユーザチェックを行い、実行ボタン24が押されると、図3Gに示したようにユーザチェックが付されたトラブル事象に係るレコードについては省略して表示される。従って、検索結果のうち必要なデータのみを表示させることができる。例えば、図3Dであれば(同図ではユーザチェック欄は省略されているが)、その1番目と2番目、3番目と4番目、7番目と8番目は、検索結果としては同一と判断できるので、図3F〜Gのようにチェック欄を設けてチェックを付することにより表示を省略することができる。
検索結果27に表示されるレコード数は、表示スペースの関係から検索結果26に表示されるレコード数(この例では10件)よりも少ない。そのため検索結果26に表示されたレコードから選択的に検索結果27に表示されることとなる。初期設定では検索結果26に表示されるレコードのうち第一番目からデータが表示される。セル内容26bはマウスカーソルで選択すると、色を変えるなどして選択表示されるようになっており、これをダブルクリックすれば、ダブルクリックしたセル内容26bに対応するレコードの内容から順番に検索結果27に表示されるように構成される。
DB再利用モジュールBは、DB知識抽出モジュールCと、DB知識検索モジュールDとを含む。DB知識抽出モジュールCにおいては、データテーブルT10の特定データDT(例えばトラブル事象、原因、処置、対策のフィールド(列))のデータ一群が読み出され、これに対して処理がなされ、DBの再構築、すなわち、重要語辞書DB8と、インデックスDB10と、重要度DB11の構築がなされる。DB再利用モジュールBの起動はDB再利用モジュールBが実装されている図示しないコンピュータから、生産工場の非稼働時になされるようになっている。メモリの競合によるデータ不一致の問題を排除するためである。DB再利用モジュールBの起動は入出力装置2を介して特権ユーザの操作により起動されるようにしてもよい。
DB知識抽出モジュールCについて更に説明する。DB知識抽出モジュールCは、重要語抽出/辞書構築部7と、DB再構築部9とを含み、これらにより、重要語辞書DB8と、インデックスDB10と、重要度DB11とが構築される。
読み出し方については、位置情報Lを単位として処理対象となる特定データDTを一度に全て読み込んでおきその後のサフィックスアレイSAの生成以降の処理に供するように構成しても良いし、位置情報Lを単位として読み込む度にサフィックスアレイSAの生成を行って文字列クラスCの切りだし以降の処理に供するように構成してもよい。特定データDTに数字が含まれる場合には、全ての数字を合わせた状態が一つの文字として読み出されるように構成してもよい。位置情報Lは直接アドレスでも間接アドレスでもよくあらゆる手法により表すことが可能である。
補正項α、βとしては定数が設定される。重要度Wiの計算は、相互情報量、dice co-efficient, tf*idf値などの計算法により行うこともできる。出現頻度Tiは、データテーブルT30aの位置情報Lの個数を計算することにより求めることができる。又は再構成部9を介して重要語辞書DB8を引くことにより求めることもできる。
DB知識検索モジュールDは、入力部12と、参照部13と、出力部14とからなる。これらは、インデックスDB10と、重要度DB11を直接参照することにより、入出力装置2を介して入力される一般ユーザからの情報要求に応じ、RDB1から必要なデータを取り出して当該一般ユーザに情報を提供すべく他のデータと共にモニタ2bに表示するものである。インデックスDB10と、重要度DB11は重要語辞書DB8に格納された重要語Wに基づいて構築されたDBであり、インデックスDB10と、重要度DB11とを直接参照するということは、結局、重要度辞書DB8を間接的に参照していることになる。
尚、図1Bに示した重要語抽出/辞書構築部7、再構築部9、入力部12、参照部13及び出力部14は、これらを同一のコンピュータに実装することもできるし、ネットワークを介して相互にデータのやりとりができる限り別々のコンピュータに実装することもできる。図4はそのコンピュータのブロック構成の一例を示したものである。
図5AはDB知識抽出の全体概略フローチャートであり、重要語辞書DB8の構築は(1)サフィックスアレイSAの結合及びソート(S100)、(2)文字列クラスの切出し(S200)、(3)重要語Wの抽出と重要語辞書DB8の構築(S300)という手順からなる。既に述べたが「サフィックスアレイ」とは、テキストをそのテキスト中に存在する全ての文字からテキストの終端までの部分文字列(サフィックス;接尾辞)の集合(n−gram集合)であると考え、その集合を辞書順に並べたデータ構造をいう。また「サフィックス」とはテキスト中に存在する全ての文字からテキストの終端までのテキストをいう。
次に図5Bを参照してS100のサフィックスアレイSAの統合及びソートの処理について説明する。同図に示したように、S101においてはRDB1からデータテーブルT10の位置情報Lとしての「セル番号」と特定データDTとしての「トラブル事象」とが配列順に一度に読み出され、図6Aに示したデータテーブルT21としてRAM領域に格納される(S101)。
次に図5Cを参照してS200の文字列クラス切出処理について説明する。S201においてはカウンタiと、サフィックス総数jとに所定の値が設定される。カウンタiには初期値として0が設定され、サフィックス総数jにはS104で「ソート及び統合」された全サフィックス数が設定される(図6Eから図6Fの例では62が設定される)。次にS202においては「i番目のサフィックス」と「(i−1)番目のサフィックス」とが比較され一致部分があるかどうか判断される。
図6Eから図6Fの例ではS204において「カウンタi←62」となるまでS202からS205の処理が繰り返し行われる。図6Eに示したデータテーブルT25のサフィックスについて左上から順番に通番13→通番26→通番53→、…、→通番54→通番03、…、→通番42というように最後まで処理に供されたサフィックスは処理結果に応じて文字列クラスCとして切り出され図6Fに示したデータテーブルT26として格納される(S203)。図6Fには図6Eに示したサフィックスを切り出した結果を例示している。
次に図5Dを参照して重要語抽出処理について説明する。
S301においては、カウンタiが0に設定され、文字列クラスC総数jが設定される。図6Hの例では除外された文字列クラスCが除外されて総数jとして設定されるため、例えば、「36−X(X:除外された文字列クラス総数)」が設定される。
図6Hの例ではS206において「カウンタi←(36−X)(X:除外された文字列クラス総数)」となるまでS302からS307の処理が繰り返し行われる。
例えば文字列クラスC1とC2とを比較すると、これらは包含関係にあるため数1により計算するとGap(C1,C2)=|log8/8|=0<閾値T2となるため、文字列クラスC2は文字列クラスC1に圧縮されて、文字列クラスC1と見なして重要語辞書DB8へ登録される。「13ランバス」は「13ランバス加熱」として登録される。
また例えば文字列クラスC2とC3とを比較すると、これらは包含関係にないため文字列クラスC3はそのまま独立クラスと見なして重要語辞書DB8へ登録される。
また例えば文字列クラスC20とC21とを比較すると、これらは包含関係にあるため数1により計算するとGap(C20,C21)=|log8/1000|=2.096>閾値T2となるため、文字列クラスC21は文字列クラスC1に圧縮されることなくそのまま独立クラスとして重要語辞書DB8へ登録される。
再構築部9においては知識関連付けとして、図8Aに示したようにインデックスDB10の構築(S400)と、重要度DB11の構築(S500)とが行われる。
再構築部9におけるインデックスDB10の構築について図8Bを参照して説明する。
S401においては図5Aから図5Dのフローチャートの処理によって抽出された重要語Wと位置情報Lとが図7に示したデータテーブルT29から取り出される。そしてデータテーブルT30a、T30bが例えばハッシュ構造で作成され、インデックスDB10として格納される(図2D参照)。
次に再構築部9における重要度DB11の構築について図8Cを参照して説明する。
まずS501においてカウンタiに初期値0が設定されるとともに、全データ数jに重要語Wの総数が設定される。次にS502とS503においてそれぞれ共起頻度Ciと出現頻度Tiとが求められる。共起頻度CiはデータテーブルT30aを参照して、ある重要語Wが出現する位置情報L(例えば、「固有の番号」や「セル番号」)を得た後、データテーブルT30bを参照することにより、これらの位置情報L(例えば、「固有の番号」や「セル番号」)で示される位置に含まれる他の重要語Wの種類の総数を数えることにより求められる。従って、共起するパターンが何度出てきてもそれは1通りとしてカウントされる。出現頻度TiはデータテーブルT30aの重要語Wごとの位置情報Lがいくつあるかに基づいてカウントすることにより求めることができる。
一般ユーザが入出力装置(コンピュータ)2からトラブル保全管理支援プログラムを起動させると、図3Aの起動画面SC1が表示される。そして図9Aに示したように検索質問文qの入力と検索キーの切り出し処理(S600)、参照及び演算処理(S700)、検索結果の出力処理(S800)がなされる。
図9Bを参照して検索質問文qの入力と検索キーの切り出し処理について説明する。
(1)起動時における検索キーSの切り出し(図3A)の場合
起動時においては、図3Aの起動画面SC1が表示され、一般ユーザからユーザ入力欄23に検索質問文qが入力される。そして実行ボタン24が押されると(S601:YES)、S606に進む。
起動画面SC1上で図9Dに示したように一般ユーザにより、例えば、「CL13フリーズ」というデータが入力されたとすると(検索範囲としては起動画面SC1では「トラブル事象」というフィールドが自動的に選択される)、検索質問文qとして「CL13フリーズ」という文字列が取得される。そしてS607においては、インデックスDB10のデータテーブルT30aが参照され、当該インデックスDB10に格納された重要語Wと一致する一致文字列が、一般ユーザによって入力された検索質問文qの全体又は一部に含まれるか否かが判断され、含まれると判断されると当該一致文字列が検索キーSとして切り出される。ここでは「CL13」と「フリーズ」とが切り出される。
起動時以降においては、図3Bなどに示した検索画面SC2が表示され、一般ユーザからユーザ入力欄23に検索質問文qが入力され、フィールド選択欄25で検索範囲とするフィールドが選択される。フィールド選択欄25で何も選択されなければそのとき選択されているフィールドが引き続き選択される。そして実行ボタン24が押されると(S601:NO、S602:NO、S604:NO)、S606に進む。なおここでは「トラブル事象」が選択フィールドとして選択されているとする。
検索画面SC2上で図9Dに示したように一般ユーザにより、例えば、「CL13フリーズ」というデータが入力されたとすると、検索質問文qとして「CL13フリーズ」という文字列が取得される。そしてS607においては、インデックスDB10のデータテーブルT30aが参照され、当該インデックスDB10に格納された重要語Wと一致する一致文字列が、キーボードやマウスによってユーザから入力された検索質問文qの全体又は一部に含まれるか否かが判断され、含まれると判断されると当該一致文字列が検索キーSとして切り出される。ここでは「CL13」と「フリーズ」とが切り出される。
次に起動後における処理について説明する。図3Bなどに示した検索画面SC2が表示された状態で一般ユーザによっていずれかの含有セル内容26bがダブルクリックされたとすると(S601:NO、S602:YES)、S603に進み、ダブルクリックされたトラブル事象に属する含有セル内容26bが含まれるレコードの当該含有セル以外のセル内容、すなわち、原因、処置、対策などのフィールドに属する非含有セル内容27cが結果表示27の一番上の位置に表示される。二番目以降は表示可能な数だけ、レコードの含有セル内容26bに対応する非含有セル内容27cが順次表示される。
次に逆引き検索の処理について説明する。図3Bなどに示した検索画面SC2が表示された状態で一般ユーザによっていずれかの非含有セル内容27c、例えば図3Bの「トラニオン調整不良」を選択してこれがダブルクリックされたとすると(S601:NO、S602:NO、S604:YES)、S605に進む。S605においては「トラニオン調整不良」が属するフィールドとして「原因」が選択フィールドとして自動的に設定される。すなわち、フィールド選択欄25を原因にしなくても自動的に「原因」が選択フィールドとして自動的に設定される。
S700の処理では、S607又はS609において切り出された検索キーSとインデックスDB10中の重要語Wとが照合される(S701)。そしてS702においては検索キーSと一致する重要語Wの位置情報L(例えば、「固有の番号」や「セル番号」)が参照されるが、このとき重要語Wが複数含まれている場合には、そのうちの重要語Wが一つでも一致したときには位置情報Lが参照される。例えば検索質問文q={CL13フリーズ}である場合には、重要語Wとして「CL13」と「フリーズ」が取り出され、「CL13」と「フリーズ」のうち一つでも含まれている位置情報Lが参照される。位置情報Lは、類似度simを求めるのに用いられる。
S709において記憶された優先順位に従ってRDB1から表示対象となる位置情報Lに係るレコード(行)のデータが順次読み出される(S801)。そして、S802においてはユーザからのフィードバックを反映させるべく、図3Fのようにチェック欄26eにチェックが付されていないか否かが判断される。チェックが付されていなければ(S802:NO)、S803に進み、優先順位に基づいてRDB1から読み出されたデータが図3B〜Eのように表示される(S803)。一方、表示された状態が図3Fのチェック欄26eのチェックがない状態である場合に、ユーザによってチェックが付され、実行ボタン24が押されると、図3Gのようにチェックが付されたトラブル事象については省略して表示される(S804)。
B DB再利用モジュール
C DB知識抽出モジュール
D DB知識検索モジュール
Claims (10)
- 一又は複数のフィールドからなるレコードを単位とするトラブル情報が格納された知識抽出対象データベース(以下単に「DB」とする)から当該トラブル情報を取り出して処理を行う実績管理支援システムであって、
前記トラブル情報に含まれるサフィックスを取り出してサフィックス群を生成し、当該サフィックス群を構成する各サフィックスどうしを比較して、その比較結果に基づいて文字列クラスを切り出し文字列クラス群を生成する文字列クラス群生成手段と、
前記文字列クラス群を構成する各文字列クラスの出現頻度に基づいて文字列クラスを選択する文字列クラス選択手段と、
少なくとも、前記各文字列クラスが当該各文字列クラス以外の他の文字列クラスと包含関係にあるか否かに基づいて重要語を抽出し重要語辞書を構築する第一知識抽出/辞書構築手段、包含関係にある下位文字列クラスと上位文字列クラスそれぞれの出現頻度に基づいて当該下位文字列クラスを重要語として抽出し重要語辞書を構築する第二知識抽出/辞書構築手段、及び、包含関係にある下位文字列クラスと上位文字列クラスそれぞれの出現頻度に基づいて前記下位文字列クラスを前記上位文字列クラスと見なして重要語として抽出し重要語辞書を構築する第三知識抽出/辞書構築手段のうちいずれかを含む知識抽出/辞書構築手段と、
前記知識抽出/辞書構築手段により抽出された重要語と、当該重要語が前記知識抽出対象DBのどこに格納されているかを示す位置情報とを含むインデックスを前記重要語又は前記位置情報をキーとして生成するインデックス生成手段と、
任意の文字列が検索質問文として入力される検索質問文入力手段と、
前記インデックスを参照することにより、当該インデックスに格納された重要語と一致する一致文字列を、当該検索質問文がその全体又は一部に含むか否かを判断し、当該一致文字列を検索キーとして切り出す検索キー生成手段とを備えたことを特徴とする実績管理支援システム。 - 前記検索キーを検索するのに前記知識抽出対象DBのどのフィールドを検索範囲とするかを選択するフィールド選択手段と、
前記フィールド選択手段によって検索範囲として選択されたフィールド(以下単に「選択フィールド」という)を検出するフィールド検出手段と、
前記選択フィールドに属するセルのうち前記検索キーを含むセル(以下単に「含有セル」という)を検索する検索手段と、
前記重要語の出現頻度に基づいて当該重要語の重要度を求める重要度演算手段と、
前記検索キーを要素とし、前記重要度演算手段により求められた重要度をその値とする検索キーベクトルと、前記含有セルに含まれる重要語を要素とし、前記重要度演算手段により求められた重要度をその値とする索引ベクトルとに基づいて当該含有セルの類似度を求める類似度演算手段とを備えたことを特徴とする請求項1に記載の実績管理支援システム。 - 当該含有セル以外のセルであって当該含有セルが含まれるレコードと同じレコードに含まれるいずれかのセル(以下単に「非含有セル」という)に格納されたデータを検索質問文として設定する連想検索設定手段を備え、
前記検索キー生成手段は、前記インデックスを参照することにより、当該非含有セルに含まれる重要語を検索キーとして切り出すことを特徴とする請求項2に記載の実績管理支援システム。 - 前記含有セルに格納されたデータと、前記非含有セルに格納されたデータとを識別可能に表示する表示手段を備えたことを特徴とする請求項3に記載の実績管理支援システム。
- 前記表示手段は、前記類似度に基づいてデータを表示することを特徴とする請求項4に記載の実績管理支援システム。
- 一又は複数のフィールドからなるレコードを単位とするトラブル情報が格納された知識抽出対象データベース(以下単に「DB」とする)から当該トラブル情報を取り出してコンピュータに処理を行わせるための実績管理支援プログラムであって、
コンピュータを、
前記トラブル情報に含まれるサフィックスを取り出してサフィックス群を生成し、当該サフィックス群を構成する各サフィックスどうしを比較して、その比較結果に基づいて文字列クラスを切り出し文字列クラス群を生成する文字列クラス群生成手段、
前記文字列クラス群を構成する各文字列クラスの出現頻度に基づいて文字列クラスを選択する文字列クラス選択手段、
少なくとも、前記各文字列クラスが当該各文字列クラス以外の他の文字列クラスと包含関係にあるか否かに基づいて重要語を抽出し重要語辞書を構築する第一知識抽出/辞書構築手段、包含関係にある下位文字列クラスと上位文字列クラスそれぞれの出現頻度に基づいて当該下位文字列クラスを重要語として抽出し重要語辞書を構築する第二知識抽出/辞書構築手段、及び、包含関係にある下位文字列クラスと上位文字列クラスそれぞれの出現頻度に基づいて前記下位文字列クラスを前記上位文字列クラスと見なして重要語として抽出し重要語辞書を構築する第三知識抽出/辞書構築手段のうちいずれかを含む知識抽出/辞書構築手段、
前記知識抽出/辞書構築手段により抽出された重要語と、当該重要語が前記知識抽出対象DBのどこに格納されているかを示す位置情報とを含むインデックスを前記重要語又は前記位置情報をキーとして生成するインデックス生成手段、
任意の文字列が検索質問文として入力される検索質問文入力手段、
前記インデックスを参照することにより、当該インデックスに格納された重要語と一致する一致文字列を、当該検索質問文がその全体又は一部に含むか否かを判断し、当該一致文字列を検索キーとして切り出す検索キー生成手段として機能させるための実績管理支援プログラム。 - コンピュータを、
前記検索キーを検索するのに前記知識抽出対象DBのどのフィールドを検索範囲とするかを選択するフィールド選択手段、
前記フィールド選択手段によって検索範囲として選択されたフィールド(以下単に「選択フィールド」という)を検出するフィールド検出手段、
前記選択フィールドに属するセルのうち前記検索キーを含むセル(以下単に「含有セル」という)を検索する検索手段、
前記重要語の出現頻度に基づいて当該重要語の重要度を求める重要度演算手段、
前記検索キーを要素とし、前記重要度演算手段により求められた重要度をその値とする検索キーベクトルと、前記含有セルに含まれる重要語を要素とし、前記重要度演算手段により求められた重要度をその値とする索引ベクトルとに基づいて当該含有セルの類似度を求める類似度演算手段として機能させるための請求項6に記載の実績管理支援プログラム。 - コンピュータを、
当該含有セル以外のセルであって当該含有セルが含まれるレコードと同じレコードに含まれるいずれかのセル(以下単に「非含有セル」という)に格納されたデータを検索質問文として設定する連想検索設定手段として機能させるととともに、
前記検索キー生成手段を、前記インデックスを参照することにより、当該非含有セルに含まれる重要語を検索キーとして切り出すものとして機能させることを特徴とする請求項7に記載の実績管理支援プログラム。 - コンピュータを、
前記含有セルに格納されたデータと、前記非含有セルに格納されたデータとを識別可能に表示する表示手段として機能させるための請求項8に記載の実績管理支援プログラム。 - 前記表示手段を、前記類似度に基づいてデータを表示するものとして機能させることを特徴とする請求項9に記載の実績管理支援プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003294851A JP4572265B2 (ja) | 2003-08-19 | 2003-08-19 | 実績管理支援システム及び実績管理支援プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003294851A JP4572265B2 (ja) | 2003-08-19 | 2003-08-19 | 実績管理支援システム及び実績管理支援プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005063284A true JP2005063284A (ja) | 2005-03-10 |
JP4572265B2 JP4572265B2 (ja) | 2010-11-04 |
Family
ID=34371261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003294851A Expired - Fee Related JP4572265B2 (ja) | 2003-08-19 | 2003-08-19 | 実績管理支援システム及び実績管理支援プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4572265B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7646545B2 (en) | 2005-08-24 | 2010-01-12 | Sony Corporation | Optical element |
JP2020009333A (ja) * | 2018-07-11 | 2020-01-16 | Zホールディングス株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
-
2003
- 2003-08-19 JP JP2003294851A patent/JP4572265B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7646545B2 (en) | 2005-08-24 | 2010-01-12 | Sony Corporation | Optical element |
US8064141B2 (en) | 2005-08-24 | 2011-11-22 | Sony Corporation | Optical element |
JP2020009333A (ja) * | 2018-07-11 | 2020-01-16 | Zホールディングス株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4572265B2 (ja) | 2010-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Stavrianou et al. | Overview and semantic issues of text mining | |
US6505150B2 (en) | Article and method of automatically filtering information retrieval results using test genre | |
US9183281B2 (en) | Context-based document unit recommendation for sensemaking tasks | |
US7644047B2 (en) | Semantic similarity based document retrieval | |
JP5316158B2 (ja) | 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体 | |
EP2410445A1 (en) | A method for creating a dynamic relationship | |
JP2010055618A (ja) | トピックを基にした検索を提供する方法及びシステム | |
Krishnaveni et al. | Automatic text summarization by local scoring and ranking for improving coherence | |
JP4091146B2 (ja) | 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
Yehia et al. | Text mining and knowledge discovery from big data: challenges and promise | |
Zen et al. | TF-IDF Method and Vector Space Model Regarding the Covid-19 Vaccine on Online News | |
KR20170045403A (ko) | 가중치에 의한 다수 분야별 검색 기능을 구비한 지식관리 시스템 | |
JP2001184358A (ja) | カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体 | |
US6973423B1 (en) | Article and method of automatically determining text genre using surface features of untagged texts | |
JP2009086903A (ja) | 検索サービス装置 | |
JP4572265B2 (ja) | 実績管理支援システム及び実績管理支援プログラム | |
JP7264115B2 (ja) | 情報検索システム | |
Roche et al. | AcroDef: A quality measure for discriminating expansions of ambiguous acronyms | |
Mallek et al. | Automatic detection of variable data in web document: Graphical representation on demand | |
JP2007272699A (ja) | 文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラム | |
JP2007026116A (ja) | 概念検索システム及び概念検索方法 | |
JP2005032179A (ja) | データベース知識抽出システム、データベース知識検索システム並びにデータベース知識抽出プログラム、データベース知識検索プログラム | |
CN112559768B (zh) | 一种短文本图谱化及推荐方法 | |
Udoh et al. | Mining documents in a small enterprise using WordStat | |
Torres-Parejo et al. | Text retrieval and visualization in databases using tag clouds |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060809 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060809 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061110 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20061221 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20061221 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091130 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100209 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |