JP6181033B2 - 文書検索装置、文書検索方法、及び、文書検索プログラム - Google Patents

文書検索装置、文書検索方法、及び、文書検索プログラム Download PDF

Info

Publication number
JP6181033B2
JP6181033B2 JP2014241843A JP2014241843A JP6181033B2 JP 6181033 B2 JP6181033 B2 JP 6181033B2 JP 2014241843 A JP2014241843 A JP 2014241843A JP 2014241843 A JP2014241843 A JP 2014241843A JP 6181033 B2 JP6181033 B2 JP 6181033B2
Authority
JP
Japan
Prior art keywords
keyword
document
related keyword
user
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014241843A
Other languages
English (en)
Other versions
JP2016021217A (ja
Inventor
楢崎 博司
博司 楢崎
直樹 赤毛
直樹 赤毛
理人 井筒
理人 井筒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP2014241843A priority Critical patent/JP6181033B2/ja
Publication of JP2016021217A publication Critical patent/JP2016021217A/ja
Application granted granted Critical
Publication of JP6181033B2 publication Critical patent/JP6181033B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、キーワードによる文書検索技術に関するものである。
近年、キーワードを指定して、大量のデジタル化された文書から、所望する文書を検索することが行われている。
例えば、特許文献1では、ユーザの嗜好を表す複数のキーワードの出現頻度等から、基準文書と他の文書との類似度が算出される。この類似度が大きいほど、他の文書はユーザの嗜好に近いものであるとされる。また、この類似度に応じて、文書間の線分の表示状態が変更されて表示され、視覚的に文書間の類似度が示される。
また、特許文献2では、階層構造を有するファイルが、例えばツリー構造で表示される際に、階層の深さに応じて、ノード間の関係線の表示態様が変更されて表示される。
上記従来技術では、ユーザは、文書間の線分や、ノード間の関係線の表示態様に応じて、所望の文書やファイルを選択することができる。
また、特許文献3に開示された技術は、予め、要注意箇所を抽出するための検索キーと対応情報とを関連付けて記憶しておき、文書から検索キーを用いて要注意箇所を抽出し、抽出された要注意箇所に対する対応情報を出力する。
特許文献3の従来技術では、予め検索キーと対応情報との紐付け行い、検索方法をルール化しておくことで、注意すべき情報(所望する文書)を見つけ出すことができる。
特開2000−194723号公報 特開平5−307613号公報 特開2010−257413号公報
ここで、検索対象の文書が、例えば、仕様書である場合は、目的に適った適切な文書が、ユーザによって検索される必要がある。仕様書は、材料、製品、サービス等が明確に満たさなければならない要求事項を記述した文書であるからである。従って、ユーザは、膨大な仕様書の中から、参照すべき仕様書を、過不足なく、容易に検索できることが望ましい。
しかし、ユーザが任意のキーワードを入力し、入力されたキーワードを含む仕様書を検索する場合には、キーワードの出現頻度が少ないからといって、重要ではない仕様書であるとは限らない場合がある。また、ユーザにとって必要な仕様の記載が、ユーザが参照しようと思っている仕様書に含まれていない場合や、ユーザが必要な仕様書であると気づいていない場合等がある。更には、ユーザが入力するキーワードが、仕様書での表記方法と異なる等、参照すべき仕様書の検索には適切でないキーワードである場合もあり得る。また、仕様書は、その対象が多岐に渡り、更には、更新が繰り返されることが多々あることから、予め、キーワード検索の方法をルール化しておくことは難しい。
そこで、本発明は、ユーザが所望する文書の検索を行う際に、検索を支援することを目的とする。
本発明にかかる一態様に係る文書検索装置は、表示手段を備えた文書検索装置であって、ユーザから入力された注目キーワードを取得する注目キーワード取得手段と、複数の単語を記憶する記憶手段と、1以上の所定の文書から、前記注目キーワードと所定の関係がある単語であって、前記記憶手段に記憶されている単語を、関連キーワードとして抽出する関連キーワード抽出手段と、前記注目キーワードと前記関連キーワード抽出手段で抽出された前記関連キーワードとを前記表示手段に表示する表示制御手段とを備え、前記文書は、所定の区切文字によって区切られた複数の文から構成されており、前記所定の関係は、前記注目キーワードが含まれる文書中の、所定の文字列が含まれる文に含まれていることであり、前記関連キーワード抽出手段は、前記注目キーワードが含まれる文書中の、前記所定の文字列が含まれる文に含まれる単語であって、前記記憶手段に記憶されている単語を、前記関連キーワードとして抽出することを特徴とする。
そして、本発明の他の一態様に係る文書検索方法は、複数の単語を記憶する記憶手段と、表示手段とを備えた文書検索装置で用いられる文書検索方法あって、ユーザから入力された注目キーワードを取得する注目キーワード取得ステップと、1以上の所定の文書から、前記注目キーワードと所定の関係がある単語であって、前記記憶手段に記憶されている単語を、関連キーワードとして抽出する関連キーワード抽出ステップと、前記注目キーワードと前記関連キーワード抽出ステップで抽出された前記関連キーワードとを前記表示手段に表示する表示制御ステップとを備え、前記文書は、所定の区切文字によって区切られた複数の文から構成されており、前記所定の関係は、前記注目キーワードが含まれる文書中の、所定の文字列が含まれる文に含まれていることであり、前記関連キーワード抽出ステップは、前記注目キーワードが含まれる文書中の、前記所定の文字列が含まれる文に含まれる単語であって、前記記憶手段に記憶されている単語を、前記関連キーワードとして抽出することを特徴とする。
そして、本発明の他の一態様に係る文書検索プログラムは、複数の単語を記憶する記憶手段と、表示手段とを備えた文書検索装置で用いられる文書検索プログラムであって、ユーザから入力された注目キーワードを取得する注目キーワード取得手段と、1以上の所定の文書から、前記注目キーワードと所定の関係がある単語であって、前記記憶手段に記憶されている単語を、関連キーワードとして抽出する関連キーワード抽出手段と、前記注目キーワードと前記関連キーワード抽出手段で抽出された前記関連キーワードとを前記表示手段に表示する表示制御手段として、コンピュータを機能させ、前記文書は、所定の区切文字によって区切られた複数の文から構成されており、前記所定の関係は、前記注目キーワードが含まれる文書中の、所定の文字列が含まれる文に含まれていることであり、前記関連キーワード抽出手段は、前記注目キーワードが含まれる文書中の、前記所定の文字列が含まれる文に含まれる単語であって、前記記憶手段に記憶されている単語を、前記関連キーワードとして抽出することを特徴とする。
このような構成の文書検索装置、文書検索方法、及び、文書検索プログラムによれば、ユーザが入力した注目キーワードと所定の関連の関連キーワードを、検索対象の文書から抽出して表示するので、ユーザは、自分が経験不足から思いつかなかったキーワードや、経験による思い込みから入力しなかったキーワードや、忘れていたキーワード等に気付く確率が高くなる。キーワードに気付くことで、結果的に、適切な文書中の仕様記述部分を検索することが可能となる。また、文書の種類に応じた、例えば、文書が仕様書であれば、「しなければならない。」等の文字列が含まれる文は重要な事項が記載されていると推定できるので、ユーザが検索すべきキーワードが関連キーワードとして抽出される可能性が高くなる。
また、上述の文書検索装置において、前記所定の関係として、単語の数を示す情報を、ユーザから取得する関係取得手段を、更に備え、前記関連キーワード抽出手段は、前記注目キーワードの前記文書内の記載位置から前記関係取得手段で取得された数の単語の範囲内に記載されている単語であって、前記記憶手段に記憶されている単語を、前記関連キーワードとして抽出することが好ましい。
また、上述の文書検索装置において、前記文書は、所定の区切記号によって区切られた複数の文から構成されており、前記所定の関係は、前記注目キーワードが含まれる文に含まれていることであり、前記関連キーワード抽出手段は、前記注目キーワードが含まれる文に含まれる単語であって、前記記憶手段に記憶されている単語を、前記関連キーワードとして抽出することが好ましい。
この構成によれば、注目キーワードに近い位置に記載されているキーワードが関連キーワードとして抽出されるので、ユーザが検索すべきキーワードが関連キーワードとして抽出される可能性が高くなる。
また、上述の文書検索装置において、前記記憶手段に記憶されている複数の単語は、複数のグループに分けられており、前記所定の関係として、前記グループを示す情報を、ユーザから取得するグループ取得手段を、更に備え、前記関連キーワード抽出手段は、前記注目キーワードが含まれる文書中の、前記グループ取得手段が取得した情報が示すグループに含まれる単語であって、前記注目キーワードと共に所定数以上の前記文書内に記載されている単語を、前記関連キーワードとして抽出することが好ましい。
この構成によれば、グループに属さないキーワードは抽出されないので、ユーザが検索しなくてもよいキーワードが関連キーワードとして抽出されなくなる。また、注目キーワードと共に記載された仕様書が所定数に満たないキーワード、つまり、注目キーワードとの関連性が薄いと思われるキーワードは抽出されなくなる。
また、上述の文書検索装置において、前記注目キーワード取得手段は、取得した注目キーワードの他に、前記注目キーワードとみなす1以上の単語を、みなし注目キーワードとしてユーザから取得し、前記関連キーワード抽出手段は、前記注目キーワード及び前記みなし注目キーワードのうちのいずれかと前記所定の関係がある単語であって、前記記憶手段に記憶されている単語を、前記関連キーワードとして抽出することが好ましい。
また、上述の文書検索装置において、前記みなし注目キーワードは、前記注目キーワードが含まれる文字列から成る単語、又は、前記注目キーワードの一部分の文字列から成る単語であることが好ましい。
また、上述の文書検索装置において、前記関連キーワード抽出手段は、抽出した関連キーワードの他に、前記関連キーワードとみなす1以上の単語を、みなし関連キーワードとしてユーザから取得し、前記文書に記載されている前記みなし関連キーワードを、前記関連キーワードとして抽出することが好ましい。
また、上述の文書検索装置において、前記みなし関連キーワードは、前記関連キーワードが含まれる文字列から成る単語、又は、前記関連キーワードの一部分の文字列から成る単語であることが好ましい。
この構成によれば、例えば、語尾等が変化したキーワードも、仕様書から抽出されるので、より的確なキーワードの抽出が可能となる。
また、上述の文書検索装置において、前記関連キーワード抽出手段で抽出された前記関連キーワードから、ユーザが選択した関連キーワードを取得する関連キーワード選択手段を、更に備え、前記表示手段は、前記注目キーワード及び前記関連キーワード選択手段で取得された関連キーワードが記載されている前記文書のうち、前記注目キーワード及び前記関連キーワードが記載されている部分を、前記表示手段に表示することが好ましい。
また、上述の文書検索装置において、前記表示手段が表示する前記部分は、前記注目キーワードと前記関連キーワードの前後それぞれ所定数の単語とが含まれる部分であることが好ましい。
この構成によれば、注目キーワー及び関連キーワードが記載されている文書中の箇所が表示されるので、ユーザは、文書の内容を確認して、必要な文書であるか否かを判断することが可能となる。
また、上述の文書検索装置において、前記注目キーワードと、前記関連キーワード選択手段で取得された関連キーワードとを対応付けた履歴情報を記憶する検索履歴記憶手段と、前記検索履歴記憶手段に記憶されている履歴情報から関連キーワードを抽出するか否かの指示を取得する履歴利用指示取得手段とを、更に備え、前記関連キーワード抽出手段は、前記履歴利用指示取得手段により前記履歴情報から関連キーワードを抽出する指示を取得した場合には、前記注目キーワード取得手段で取得された注目キーワードの関連キーワードとして、前記検索履歴記憶手段に当該注目キーワードと対応付けて記憶されている関連キーワードを、抽出することが好ましい。
また、上述の文書検索装置において、ユーザを識別するためのユーザ識別子を取得するユーザ識別子取得手段を、更に備え、前記履歴情報は、前記注目キーワードと、前記関連キーワード選択手段が取得した関連キーワードと、当該関連キーワードを選択したユーザのユーザ識別子とを対応付けたものであり、前記履歴利用指示取得手段は、更に、前記履歴情報から関連キーワードを抽出するために用いるユーザ識別子である抽出識別子を取得し、前記関連キーワード抽出手段は、前記履歴利用指示取得手段により前記履歴情報から関連キーワードを抽出する指示を取得した場合には、前記注目キーワード取得手段で取得された注目キーワードの関連キーワードとして、前記抽出識別子と同じユーザ識別子及び当該注目キーワードに対応付けて前記検索履歴記憶手段に記憶されている関連キーワードを抽出することが好ましい。
この構成によれば、ユーザは、他のユーザが選択した関連キーワード知ることができるので、自分では選択しなかったであろう関連キーワードが含まれる仕様書を参照することが可能となり、結果的に、製品の制作において参照する必要がある仕様書を、漏れなく検出できる可能性が高くなる。
また、上述の文書検索装置において、前記関連キーワード抽出手段で抽出された前記関連キーワードから、ユーザが選択した関連キーワードを取得する関連キーワード選択手段を、更に備え、前記表示手段は、前記注目キーワード及び前記関連キーワード選択手段で取得された関連キーワードが記載されている前記文書を表す第1図形であって、前記関連キーワードが記載されている前記文書内の位置を示す第2図形が重ねて表示された第1図形を前記表示手段に表示することが好ましい。
本発明の他の一態様に係る文書検索装置は、表示手段を備えた文書検索装置であって、ユーザから入力された注目キーワードを取得する注目キーワード取得手段と、複数の単語を記憶する記憶手段と、1以上の所定の文書から、前記注目キーワードと所定の関係がある単語であって、前記記憶手段に記憶されている単語を、関連キーワードとして抽出する関連キーワード抽出手段と、前記注目キーワードと前記関連キーワード抽出手段で抽出された前記関連キーワードとを前記表示手段に表示する表示制御手段と、前記関連キーワード抽出手段で抽出された前記関連キーワードから、ユーザが選択した関連キーワードを取得する関連キーワード選択手段と、を備え、前記表示手段は、前記注目キーワード及び前記関連キーワード選択手段で取得された関連キーワードが記載されている前記文書を表す第1図形であって、前記関連キーワードが記載されている前記文書内の位置を示す第2図形が重ねて表示された第1図形を前記表示手段に表示し、前記表示手段が表示する前記第1図形は、円であり、前記第2図形は、前記円の中心点と円周上の点とを結ぶ線分であり、前記表示手段は、前記文書の総ページ数を360度と対応付けた場合に、前記文書の1ページ目を示す基準線分から、前記関連キーワードが記載されているページが対応する角度だけ回転させた方向に沿うように、前記関連キーワードが記載されているページを表す前記線分を表示することが好ましい。
また、上述の文書検索装置において、前記表示手段は、1ページに記載されている前記関連キーワードの数に応じて、表示態様を変えて前記線分を表示することが好ましい。
この構成によれば、ユーザが選択した関連キーワードと注目キーワードとが記載されている文書と、その記載ページとが図形で表示されるので、文書の数や文書内のキーワードの記載ページ数を視覚的に認識することが可能となる。
本発明にかかる文書検索装置は、ユーザが所望する文書の検索を行う際に、検索を支援することができる。
実施形態1の文書検索装置の機能ブロックの構成例を示す図である。 注目キーワードを入力した際の画面例を示す図である。 関連キーワードを選択した際の画面例を示す図である。 関連キーワードを手入力した際の画面例を示す図である。 キーワードを含む仕様書のページを表示させた場合の画面例を示す図である。 キーワードを含む仕様書の部分を表示させた場合の画面例を示す図である。 関連キーワードを追加入力した際の画面例を示す図である。 キーワードを含む仕様書の部分を表示させた場合の画面例を示す図である。 1つの仕様書(文書)を示す画像を説明するための図である。 単語情報テーブルの構成及び内容の例を示す図である。 実施形態1の文書検索処理のフローチャートである。 実施形態2の文書検索装置の機能ブロックの構成例を示す図である。 ユーザIDを入力する画面例を示す図である。 注目キーワードを入力した際の画面例を示す図である。 関連キーワードを選択した際の画面例を示す図である。 キーワードを含む仕様書の部分を表示させた場合の画面例を示す図である。 ユーザIDを入力する画面例を示す図である。 検索履歴記憶部から抽出した関連キーワードを表示させた画面例を示す図である。 検索履歴テーブルの構成及び内容の例を示す図である。 実施形態2のユーザ別検索処理のフローチャートである。 実施形態2の文書検索処理のフローチャートである。
<実施形態1>
実施形態では、検索対象の文書の一例として、製品の設計仕様書を用い、製品の製作者であるユーザが仕様書を検索する場合を説明する。キーワード検索によって参照すべき仕様書を検索する場合、特に、複数のキーワードを組み合わせて仕様書を検索する場合は、経験からキーワードを組み合わせることが多い為、経験上稀な組み合わせでの検索を行うことは少ない。しかし、製品によっては、稀な組み合わせでの仕様が記載されている場合があり、このような場合には、必要な仕様書が検索されず、製品が仕様通りに作成されない場合が生じ得る。例えば、鋳物(Cast)では、通常、超音波検査(UT)が行われ、溶接(Weld)では、通常、X線検査(RT)が行われる場合、鋳物の検査条件に「RT」が指定されているような場合には、見逃されることが発生し得る。また、仕様書が、他の仕様書を参照している場合などには、漏れが発生しやすい。また、設計変更が発生した場合に、その影響がどの部品(仕様書)にまで及ぶのかを、判断するのが難しい場合がある。
実施形態では、数百の仕様書(ファイル)を対象に、キーワード検索を行う。基本的に、ユーザは、文書検索装置1000を用いて、任意のキーワードを指定して、参照すべき仕様書の検索を開始し、自動的に抽出して提示されるキーワードを選択、追加しながら検索を繰り返して、参照すべき仕様書を見つける。文書検索装置1000は、以下の機能により、このようなユーザの仕様書検索を支援する。
まず、文書検索装置1000は、ユーザが最初に入力した1つのキーワード(注目キーワード)に関連あるキーワード(関連キーワード)を、仕様書から抽出してユーザに提示する。抽出条件は、ユーザが指定することができる。また、ユーザは、キーワードと同一視するキーワード(みなしキーワード)を指定することができる。例えば、語尾が変化したキーワードも、抽出することができるようにである。
次に、文書検索装置1000は、関連キーワードが記載されている仕様書の数、仕様書中のキーワードが記載されているページの数、ページの位置等を、ユーザが直感的に且つ視覚的に認識できるように、画像で表示する。
また、文書検索装置1000は、キーワードが記載されている仕様書の部分を、ユーザの指示に応じて、抜き出して表示する。ユーザは、仕様書全部ではなくキーワード近辺のみをチェックすることができるので、参照すべき仕様書であるかを迅速に判断することができる。
ユーザは、提示された関連キーワードを選択したり、更にキーワードを追加したりしながら、また、キーワードが記載された部分の内容を確認しながら、参照しなければならない仕様書を絞り込むことができる。つまり、文書検索装置1000が関連キーワードを提示することで、ユーザは、例えば経験不足から思いつかなかったキーワードや、忘れていたキーワードに気づくことでき、結果として、必要な仕様書の見落としや、参照すべき仕様書の絞り込みが可能となる。
以下、文書検索装置1000について、図を用いて説明する。
<検索画面>
まず、文書検索装置1000が備える表示部に表示される検索画面の基本構成について、図2を用いて説明する。
図2は、注目キーワードを入力した際の画面例を示す図である。「注目キーワード」とは、ユーザが最初に入力するキーワードである。実施形態では、仕様書は英語で記載されているものとし、キーワードもアルファベットで入力される。実施形態では、単語とは、ブランクで区切られた2文字以上の連続した英数字文字および小数点などの記号の並びをいうものとする。
検索画面WIN1は、注目キーワード入力領域10、関連キーワード抽出条件設定領域20、仕様書名表示領域30、図形表示領域40、仕様書一覧表示領域50、キーワード一覧表示領域60、関連キーワード入力領域70、みなしキーワード表示領域80、更新ボタン90、テキスト消去ボタン91、及び、文書一括表示ボタン92を備える。
注目キーワード入力領域10は、ユーザが注目キーワードを入力する領域である。ユーザは、キーボード等を用いて、文書検索処理において最初のキーワードを、注目キーワードとして注目キーワード入力領域10に入力する。図2では、「weld」が入力されている。
関連キーワード抽出条件設定領域20は、注目キーワードに関連するキーワードを仕様書から関連キーワードとして抽出するための条件を、ユーザが設定する領域である。実施形態では、関連キーワード抽出条件設定領域20は、4つのトラックバーと、6つのチェックボックスを有する。実施形態では、検索範囲を示す検索範囲条件と、関連キーワードの属性を示す属性条件との2つを、抽出条件として設定する。4つのトラックバーのうちのトラックバーαで、検索範囲を設定し、トラックバーβ、λ1、及び、チェックボックスで、キーワードの属性を設定する。
トラックバーαによって、単語の数が指定され、仕様書中の注目キーワードの記載位置の前後、指定された数の単語が検索範囲とされる。例えば、「15」が設定されると、各注目キーワードの前後15単語分の領域が検索範囲となる。
トラックバーβによって、単語が出現するファイル数の下限値が指定され、注目キーワードが記載されている仕様書(1又は複数)に、指定されたファイル数以上に出現する単語を、関連キーワードの検索対象とする。例えば、「2」が設定されると、注目キーワードと同時に出現するファイル数が2以上である語句が関連キーワードの対象となる。トラックバーγ1によって、tf−idf(term frequency−inverse document frequency)の値が指定され、指定された値、例えば「0.030568」よりも高い値の単語が、関連キーワードの対象とされる。tf−idfは、文書中に出現した特定の単語がどのくらい特徴的であるかを識別するための指標のことであり、tfは、その文書の中で特定の単語が出現した回数を表し、idfは、コーパス全体の中でその文書を含む文書数の自然対数を表し、tf×idfが、その文書中におけるその単語のtf−idf値となる。トラックバーγ2は、未実装となっている。
チェックボックスでは、抽出対象となる関連キーワードの分類(カテゴリ)が指定される。例えば、図2の検索画面WIN1では、「部品」、「検査」、「材質」、「電気」、「ASME」、「カテゴリ条件なし」の6つの分類が指定できる。ASMEとは、規格の種類であり、American Society of Mechanical Enggineersの規格を示す。例えば、「部品」が選択されると、部品のカテゴリに属する単語が、関連キーワードとして抽出される。
尚、抽出条件は、これらに限られず、他の条件を設定できるようにしてもよい。例えば、注目キーワードが含まれている文のみを検索範囲としたり、所定の語句が含まれている文のみを検索範囲とする等である。所定の語句とは、例えば、英語で書かれた仕様書であれば「should be」、「shall be」、日本語で書かれた仕様書であれば「必要である」、「でなければならない」等である。ここで、文とは、所定の区切り記号で区切られた文字列である。所定の区切り記号とは、例えば、日本語であれば句読点「。」、英語であればコロン「.」である。
仕様書名表示領域30は、仕様書の名称やページ数が表示される領域である。図形表示領域40に表示されている仕様書を示す図形(画像)が、ユーザがマウスポインタを当てる等の動作により選択されると、選択された仕様書の名称やページ番号が表示される。
ここで、図形表示領域40に表示される仕様書を示す画像について、図9を用いて説明する。図9は、1つの仕様書を示す図形(画像)を説明するための図である。1つの円が、1つの仕様書を表す。各仕様書は、それぞれ同じ大きさの円で表されるものとする。半径を示す線分の1本が、1ページを示し、線分G91(以下、「基準線分G91」という。)が1ページ目を示す。仕様書の全ページ数が360度と対応し、ページを示す線分と基準線分G91との中心角θがページ数を示す。例えば、仕様書の全ページ数が360ページである場合には、30ページ目を示す線分G92と、基準線分G91との成す角(中心角)は30度となる。また、ページを表す線分は、ページに記載されているキーワードに応じて、その表示態様を変えて表示される。例えば、記載されているキーワードの個数等により、線種、線色等の表示態様が変更される。例えば、関連キーワードのうち2つの関連キーワードがユーザによって選択されている場合に、注目キーワード及びユーザによって選択されている関連キーワードのすべて、つまり3つのキーワードが記載されているページは、線分G93で示すように太線で表示し、注目キーワードと関連キーワード1つが記載されているページは、線分G94で示すように破線で表示し、注目キーワードのみが記載されているページは、線分G92が示すように細線で表示するなどである。また、仕様書の種類に応じて、円の線種、色を変更することとしてもよい。
尚、図9では、仕様書を示す図形を、円としているが、楕円、多角形等の閉曲線であってもよい。また、仕様書を示す図形を、点としてもよい。この場合は、仕様書を示す点を中心点として、ページを示す線分が放射線状に表示される。
次に、図形表示領域40は、仕様書とキーワードとの関係が図形(画像)で表示される領域である。注目キーワード入力領域10に入力された注目キーワードが、図形表示領域40の中心に、矩形で囲まれて表示され(画像G21)、画像G21を中心として、注目キーワードが記載されている仕様書の画像(図9)が、円状に表示される(画像G20)。更に、画像G21を中心として、矩形で囲まれた関連キーワードが、円状に表示される(画像G22)。画像G22として表示されている関連キーワードは、関連キーワード抽出条件設定領域20で指定された条件で抽出された関連キーワードである。
仕様書一覧表示領域50は、注目キーワードが記載されている仕様書、つまり、図形表示領域40に画像G20として表示されている仕様書の名称が、ツリー構造で表示される。尚、仕様書一覧表示領域50に表示される仕様書の名称は、ユーザのオペレーションに応じて変化し、例えば、画像G22として表示されている関連キーワードが選択されると、注目キーワード及び選択された関連キーワードが記載された仕様書の名称が、表示される。
キーワード一覧表示領域60は、注目キーワード、及び、関連キーワードの一覧が表示される領域である。注目キーワードは1番目に記載され、関連キーワードは2番目以降に記載される。図形表示領域40に画像G21として表示されている注目キーワードと、画像G22として表示されている関連キーワードとが表示される。以下、「注目キーワード」及び「関連キーワード」を示す場合は、単に「キーワード」という。
関連キーワード入力領域70は、図形表示領域40に画像G22として表示されている関連キーワード以外の関連キーワード、つまり、関連キーワード抽出条件設定領域20で設定された抽出条件で抽出されなかった関連キーワードを、ユーザが入力する領域である。
みなしキーワード表示領域80は、キーワード一覧表示領域60で指定されたキーワードとリンクさせて検索するキーワード(みなしキーワード)を指定する領域である。例えば、キーワード一覧表示領域60で、キーワードが選択(反転表示)されると、みなしキーワード表示領域80に、選択されたキーワードの「みなしキーワード候補のリスト」が表示される。リストの最初には、キーワード一覧表示領域60で選択されているキーワードが記載され、チェックボックスにはチェックが入っている。リストの2番目以降のみなしキーワード候補であって、対応する左側のチェックボックスにチェックが入っているキーワードが、現在のみなしキーワードである。ユーザは、必要に応じて、チェックボックスのチェックを外したり、チェックを入れたりして、みなしキーワードを変更する。注目キーワードのみなしキーワードである「みなし注目キーワード」は、注目キーワードが文書検索される際に、同時に文書検索され、関連キーワードのみなしキーワードである「みなし関連キーワード」は、関連キーワードが文書検索される際に、同時に文書検索される。
更新ボタン90は、関連キーワードの更新の指示を受け付けるボタンであり、ユーザによって押下されると、関連キーワード抽出条件設定領域20に設定されている抽出条件を用いて、検索処理が行われ、図形表示領域40に結果が表示される。ユーザが、関連キーワード抽出条件設定領域20において抽出条件を変更し、変更を反映させるために更新ボタン90を押下する。
テキスト消去ボタン91は、図形表示領域40の画像G22として表示されている関連キーワードのうち、ユーザによって選択されていない関連キーワードの消去の指示を受けるボタンである。ユーザは、選択している関連キーワードのみを表示させたい場合に、テキスト消去ボタン91を押下する。
文書一括表示ボタン92は、仕様書内のキーワードが記載されている部分の表示の指示を受け付けるボタンである。注目キーワード又は関連キーワードが記載されている仕様書のページが、別ウィンドウに表示される。
<オペレーション例>
図2〜図7を用いて、文書検索処理のオペレーション例を説明する。
ユーザが、図2に示すように、「weld」を注目キーワード入力領域10に入力すると、図形表示領域40に、「weld」が画像G21として表示される。
仕様書一覧表示領域50には、注目キーワードが記載されている仕様書の一覧が表示される。
キーワード一覧表示領域60には、注目キーワード「weld」が表示され、みなしキーワード表示領域80には、注目キーワード「weld」を含めて、みなしキーワード候補のリストが表示される。現在の注目キーワードにはチェックが入っている。
ここで、ユーザが、更新ボタン90を押下すると、関連キーワード抽出条件設定領域20に設定されている抽出条件で抽出された関連キーワード、「battery」、「bolt」等が、画像G20として表示される。
また、キーワード一覧表示領域60には、注目キーワード「weld」、及び、関連キーワード「battery」、「bolt」等が表示される。仕様書名表示領域30には、図形表示領域40内のカーソルが載っている図形が示す仕様書の名称が表示されている。
ここで、ユーザが、画像G22として表示されている関連キーワードの1つ「cable」を選択、例えばマウスでクリックすると、図3に示す画面となる。
図形表示領域40に表示されている関連キーワード「cable」(画像G30)が強調表示、例えば他の関連キーワードと異なる色(字体、大きさ等)で表示される。そして、関連キーワード「cable」が記載されている仕様書が強調表示、例えば、画像G31に示すように、仕様書を示す図形(図9参照)が、前面に表示され、仕様書を示す円内には、キーワードが記載されているページを示す線分(半径)が表示される。また、関連キーワード「cable」の画像G30と、画像G31等の仕様書の画像とは、画像G32で示すような線分で結ばれる。この線分は、関連キーワードと、その関連キーワードが記載されている仕様書との結びつきを視覚的に表し、ユーザが正確にその結びつきを認識できるようにするものである。以下、「リンク線分」というものとする。
仕様書一覧表示領域50は、注目キーワード「weld」と、関連キーワード「cable」との双方が記載されている仕様書の名称が表示される。
キーワード一覧表示領域60は、キーワード「cable」が強調表示、例えば、太線で表示され(矢印61参照)、みなしキーワード表示領域80には、キーワード「cable」のみなしキーワード候補のリストが表示される。図3では、「cablebus」が、みなしキーワードとして選択されている(矢印81参照)。
次に、ユーザは、図4に示すように、関連キーワード入力領域70に、キーボード等を用いて、2つの関連キーワード「shield」(矢印71参照)、「protection」(矢印72参照)を入力する。つまり、ユーザは、自動的に抽出された関連キーワード以外に、関連キーワードを追加する。追加された関連キーワード「protection」は、図形表示領域40に画像G41として、「shield」は画像G42として表示される。
ここで、ユーザが、図形表示領域40に画像G41として表示されている「protection」を選択すると、「protection」が強調表示された画像となる。そして、関連キーワード「protection」が記載されている仕様書を示す図形(図9参照)が、前面に表示され、それぞれが、画像G41とリンク線分で結ばれる。
仕様書一覧表示領域50には、注目キーワード「weld」と、関連キーワード「cable」との双方が記載されている仕様書に加えて、注目キーワード「weld」と、関連キーワード「protection」との双方が記載されている仕様書の名称が追加されて表示される。
図4において、ユーザが文書一括表示ボタン92を押下すると、図5に示すような
ドキュメント画面WIN2が表示される。尚、図5では、表示されている仕様書の一部が丸印により上書きされて内容が不明瞭となっているが、実際には、仕様書の該当箇所が表示される。図6、8等の表示も同様である。
ドキュメント画面WIN2には、図4において、ユーザにより選択されている関連キーワード「cable」、「protection」の両方が記載されている仕様書の該当ページの内容が表示される。該当する仕様書の名称が表示され(矢印D50参照)、該当のページ数が表示される(矢印D51)。ページ内容には、関連キーワード「cable」(矢印D55参照)、「protection」(矢印D54参照)が、下線付き文字列として表示される。また、注目キーワード「weld」のみなし注目キーワード「Welding」(矢印D52参照)、「welds」(矢印D53参照)等が、強調表示される。
ここで、ユーザは、ドキュメント画面WIN2の表示内容を変更して、図6のように表示させることができる。図6に示すように、フィルタリング語句領域D60に、関連キーワード「protection」を入力し、前領域D61に「10」を設定し、後領域D62に「10」を入力する。そうすると、仕様書ごとに、フィルタリング語句領域D60に入力された「protection」が記載された位置の前10単語、後10単語の部分であって、注目キーワードが記載されている部分を、表示する。例えば、領域D63には、「protection」の単語D64の前後それぞれ10単語ずつの部分であって、みなし注目キーワード「welding」が記載されている部分が表示されている。
次に、図7の検索画面WIN1において、ユーザが、図形表示領域40に画像G42として表示されている「shield」を選択すると、「shield」が強調表示された画像となる。そして、関連キーワード「shield」が記載されている仕様書を示す図形(図9参照)が、前面に表示され、それぞれが、画像G42とリンク線分で結ばれる。
仕様書一覧表示領域50には、更に、注目キーワード「weld」と、関連キーワード「shield」との双方が記載されている仕様書の名称が追加されて表示される。
みなしキーワード表示領域80には、関連キーワード入力領域70で反転表示されているキーワード「shield」のみなしキーワード候補のリストが表示される。「shield」が最初に記載され(矢印82参照)、みなしキーワードとして「shielded」が選択されている(矢印83参照)。
ここで、ユーザが、文書一括表示ボタン92を押下し、表示されたドキュメント画面WIN2のフィルタリング語句領域D60、前領域D61、後領域D62にそれぞれ「cable shield」、「20」、「20」と入力すると、図8に示すようなドキュメント画面WIN2が表示される。つまり、仕様書ごとに、キーワード一覧表示領域60に入力された「cable」又は「shield」が記載された位置の前20単語、後20単語の部分であって、注目キーワードが記載されている部分を、表示する。例えば、表示領域D83には、3つの部分が表示され、1つ目の部分として、みなし関連キーワード「Shieled」(単語D84)の前後それぞれ20単語ずつの部分であって、みなし注目キーワード「welding」、「welded」が記載されている部分が表示されている。2つ目の部分として、みなし関連キーワード「Self−Shieled」(単語D85)の前後それぞれ20単語ずつの部分であって、みなし注目キーワード「welding」、「welded」が記載されている部分が表示され、3つ目の部分として、みなし関連キーワード「cables」(単語D86)の前後それぞれ20単語ずつの部分であって、みなし注目キーワード「welding」が記載されている部分が表示されている。
文書検索装置1000は、図5、6、8に示すように、ドキュメント画面WIN2にキーワードが記載された仕様書の部分を表示させることが容易にできるので、ユーザは、仕様書の内容を容易に確認することができる。従って、参照するべきドキュメントであるか否かを、迅速に判断でき、参照すべきであったのに参照しなかった事態が生じることを減らすことが可能となる。
<構成>
図1は、文書検索装置1000の構成例を示す図である。
文書検索装置1000は、検索制御部1100、表示部1110、操作部1120、注目キーワード取得部1200、みなしキーワード取得部1210、関連キーワード抽出部1300、抽出条件取得部1310、画像データ作成部1400、ドキュメント画面表示部1410、部品図形記憶部1500、設計仕様書記憶部1600、及び、単語辞書記憶部1700を備える。
部品図形記憶部1500は、図形表示領域40に表示する為の部品の図形、例えば、仕様書を表す円形の図形(図9参照)、線色、線の太さ等の、図形表示領域40に表示する画像を作成するのに必要な情報を、予め記憶する。
設計仕様書記憶部1600は、検索対象の仕様書を記憶する。
単語辞書記憶部1700は、いわゆる辞書データを記憶し、設計仕様書記憶部1600に記憶してある仕様書に記載してある単語であって、キーワード(みなしキーワード)と成り得る単語を、予め抽出して記憶する。
図10は、単語情報テーブル1710の構成及び内容の例を示す図である。単語情報テーブル1710は、1つの単語に1つ作成され、単語辞書記憶部1700に予め記憶される。
単語情報テーブル1710は、単語1711、カテゴリ1712、tf−idf値1713、仕様書ID1714、総頁数1715、及び、記載位置1716を備える。
単語1711は、単語の文字列を示す。
カテゴリ1712は、単語1711が示す単語の、カテゴリを示す。カテゴリは、検索画面WIN1の関連キーワード抽出条件設定領域20で指定されるカテゴリのうちの、いずれかのカテゴリが登録される。
tf−idf値1713は、単語1711が示す単語の、tf−idf値を示す。tf−idf値は、検索画面WIN1の関連キーワード抽出条件設定領域20で指定されるtf−idf値と比較される。
仕様書ID1714は、単語1711が示す単語が記載されている仕様書を特定するための識別子である。実施形態では、識別子として、仕様書の名称を用いる。
総頁数1715は、仕様書ID1714が示す仕様書の総頁数を示す。
記載位置1716は、仕様書ID1714が示す仕様書において、単語1711が示す単語が記載されている位置が、記載されている位置の数n個(nは1以上の整数)登録される。具体的には、位置として、ページ、行、語数が登録される。例えば、仕様書ID1714が「ID001」のレコードには、記載位置1716の「位置1」として「10/14/2」が登録されている。これは、単語1711の「cable」は、識別子が「ID001」の仕様書の、10ページの14行目の2単語目に記載されていることを示す。尚、「−」は、記載がない事を示す。例えば、仕様書ID1714が「ID099」のレコードには、記載位置1716の「位置2」として「−」が登録されている。これは、単語1711の「cable」は、識別子が「ID099」の仕様書には、1箇所にのみ記載があることを示す。
尚、図10では、単語情報をテーブル形式で記憶しているが、この形式に限られるものではなく、単語ごとに各情報が対応付けられていればよい。また更に、tf−idf値1713〜記載位置1716は、予め作成しておかずに、キーワード検索の際に、必要に応じて作成されることとしてもよい。
次に、検索制御部1100は、各機能部を制御し、ユーザ操作に応じて、仕様書を検索する機能を実現する。例えば、検索制御部1100は、検索画面WIN1を表示部1110に表示し、操作部1120からユーザの操作を取得し、操作に応じて各機能部を制御し、各機能部の処置結果を必要に応じて検索画面WIN1に反映させる。また、検索制御部1100は、注目キーワード取得部1200によって取得された注目キーワードや、関連キーワード抽出部1300によって抽出された関連キーワード、みなしキーワード取得部1210によって取得されたみなしキーワード、及び、ユーザによって選択された関連キーワード等を記憶して管理し、適時、設計仕様書記憶部1600に記憶されている仕様書のキーワードの検索を行う。尚、検索制御部1100が記憶しているキーワード等は、必要に応じて他の機能部からの参照が可能であるとする。
表示部1110は、操作部1120から入力されたコマンド、検索画面WIN1、ドキュメント画面WIN2等を出力する機器であり、例えばCRT(Cathode Ray Tube)ディスプレイ、LCD(Liquid Crystal Display)、有機EL(Electro Luminesence)ディスプレイ又はプラズマディスプレイ等の表示装置等である。
操作部1120は、文書検索処理開始指示等の各種コマンド、キーワード等の各種データを文書検索装置1000に入力する機器であり、例えば、キーボードやマウス等である。
注目キーワード取得部1200は、注目キーワードを取得する。具体的には、注目キーワード入力領域10に入力された1又は複数の文字からなる文字列を、注目キーワードとして取得する。尚、キーワードとして用いることができる文字は、文書検索装置1000で検索対象となる仕様書に応じて定められ、文字には、ひらがな、漢字、カタカナ、アルファベット等の文字、数字、記号、符号等を含み、半角全角を問わない。
みなしキーワード取得部1210は、みなし注目キーワード又はみなし関連キーワードを取得する。具体的には、キーワード一覧表示領域60に表示されているキーワードのうちのいずれか1つが選択されると、みなしキーワード表示領域80にみなしキーワード候補のリストを表示する。この際、既にみなしキーワードとして選択されているものがある場合は、チェックボックスにチェックを入れて表示する。そして、みなしキーワード表示領域80に表示されているキーワード候補のうち、選択されたキーワードをみなしキーワードとして取得する。
また、みなしキーワード取得部1210は、みなしキーワード表示領域80に表示するみなしキーワード候補として、キーワード一覧表示領域60で選択されているキーワードと関連する単語を、単語辞書記憶部1700に記憶されている単語から抽出して表示する。関連する単語とは、例えば、キーワードを含む単語、キーワードの一部である単語等である。キーワードが「weld」である場合、「backweld」、「eld」等が、みなしキーワード候補として表示される。
関連キーワード抽出部1300は、注目キーワードに関連する関連キーワードを設計仕様書記憶部1600に記憶されている仕様書から抽出する。抽出された関連キーワードは、検索制御部1100によって画像データ作成部1400に渡され、関連キーワードの画像(図2の画像G22等参照)を表示させる等の処理が行われる。
抽出条件取得部1310は、関連キーワード抽出条件設定領域20に設定されている抽出条件を読み出し、関連キーワード抽出部1300に渡す。抽出条件は、大きく2つある。1つ目は、検索範囲であり、2つ目は、キーワードの属性である。例えば、図2の検索画面WIN1の関連キーワード抽出条件設定領域20においてユーザは、4つのトラックバーのうちのトラックバーαで、検索範囲を設定する。また、トラックバーβ、λ1、及び、チェックボックスで、キーワードの属性を設定する。具体的には、トラックバーαによって指定された数の単語が、具体的には、仕様書中の注目キーワードの記載位置の前後の単語が、検索範囲と設定される。また、関連キーワードの属性として、トラックバーβによって指定されたファイル数以上のファイルで注目キーワードと共に出現する単語であることが設定され、トラックバーγ1によって指定されたtf−idf値以上の値であることが指定され、チェックボックスによって指定されたカテゴリの単語であることが指定される。
抽出条件取得部1310から抽出条件として、検索範囲条件と属性条件とを取得した関連キーワード抽出部1300は、まず、設計仕様書記憶部1600に記憶されている各仕様書内の検索範囲条件の範囲内の単語を抽出する。例えば、検索範囲の条件が、注目キーワードの前後15単語である場合には、単語1711として注目キーワード「weld」が設定されている単語情報テーブル1710(図10参照)が参照される。仕様書ID1714として「ID001」、記載位置1716の「位置1」として「20/10/6」と設定されているとする。関連キーワード抽出部1300は、名称「ID001」の仕様書の20ページ目の10行目の第6番目の単語から、前後15単語の部分を検索範囲と判断し、設計仕様書記憶部1600から名称「ID001」の仕様書を読み出して検索範囲内の単語を抽出する。関連キーワード抽出部1300は、記載位置1716の「位置n」まで、同様に、単語を抽出する。更に、関連キーワード抽出部1300は、仕様書ID1714として設定されている他の仕様書についても、同様に、単語を抽出する。尚、関連キーワード抽出部1300が抽出する単語は、単語辞書記憶部1700に記憶されている単語である。
そして、関連キーワード抽出部1300は、抽出した単語の属性が抽出条件取得部1310から取得した属性条件に合致するか否かを、単語辞書記憶部1700を参照して判断し、属性条件に合致する場合は、その単語を関連キーワードとして抽出する。例えば、関連キーワード抽出条件設定領域20のチェックボックスでチェックされたカテゴリが「部品」、トラックバーγ1によって指定されたtf−idf値が「0.03」、トラックバーβによって指定されたファイル数が「1」であるとする。関連キーワード抽出部1300は、抽出した単語、例えば、「cable」について、図10に示す単語情報テーブル1710を参照し、カテゴリ1712が「部品」であり、tf−idf値1713が「0.043」であり、仕様書ID1714が示す仕様書のうちに、注目キーワード「weld」が記載された仕様書が1個以上ある場合に、「cable」を関連キーワードとして抽出する。詳細には、関連キーワード抽出部1300は、単語1711として注目キーワード「weld」が設定されている単語情報テーブル1710の仕様書ID1714が示す仕様書名と同じ名称が、単語1711として「cable」が設定されている単語情報テーブル1710の仕様書ID1714が示す仕様書名として現れる数をカウントし、その数が、トラックバーβによって指定されたファイル数以上であれば、「cable」を関連キーワードとして抽出する。
画像データ作成部1400は、検索画面WIN1の図形表示領域40に表示する画像データを作成する。その際、画像データ作成部1400は、部品図形記憶部1500から各部品の画像データを読み出し、読み出した画像データを所定位置に配置して、図形表示領域40に表示する画像データを作成し、検索制御部1100を介して表示部1110に表示する。例えば、図3の図形表示領域40に表示されている画像G31を作成する場合を考える。画像G31が示す仕様書の名称は、「ID001」する。この仕様書は、注目キーワード「weld」及び関連キーワード「cable」が記載されている仕様書であるので、画像データ作成部1400は、単語1711に「weld」が設定されている単語情報テーブル1710(図10参照)を読み出し、仕様書ID1714として「ID001」が設定されているレコードの、総頁数1715及び記載位置1716を読み出す。総頁数1715として「360」設定されているので、総頁数は360頁である。記載位置1716の「位置1」として登録されているデータは「10/14/2」であるので、画像データ作成部1400は、10ページ目に相当する位置、つまり、1ページ目を示す基準線分から10度だけ回転させた方向に沿った線分を表示する。画像データ作成部1400は、更に、同様に、記載位置1716の「位置n」までの線分を表示する。また、画像データ作成部1400は、単語1711に「cable」が設定されている単語情報テーブル1710(図10参照)を読み出し、同様に、線分を表示する。画像データ作成部1400は、重なる線分、つまり、複数種類のキーワードが記載されているページの線分は、予め決められた線種で表示する。
ドキュメント画面表示部1410は、キーワードが記載されている仕様書の内容の所定部分を、ドキュメント画面WIN2に表示する。具体的には、文書一括表示ボタン92が押下されると、ドキュメント画面表示部1410は、検索画面WIN1とは別のウィンドウであるドキュメント画面WIN2を作成し、注目キーワード、及び、現在選択されている関連キーワードが記載されている仕様書の部分を、例えば、ページ単位で表示する(図5参照)。
また、図6に示すように、ドキュメント画面WIN2のフィルタリング語句領域D60にキーワードが入力され、前領域D61又は後領域D62に語数が設定されると、ドキュメント画面表示部1410は、フィルタリング語句領域D60に設定されたキーワードの前後それぞれ、前領域D61及び後領域D62で設定された語数の部分を表示する。
例えば、関連キーワード「cable」の前後20単語の部分を表示する場合、ドキュメント画面表示部1410は、単語1711として「cable」が設定されている単語情報テーブル1710(図10参照)を参照する。仕様書ID1714として「ID001」、記載位置1716の「位置1」として「10/14/2」が設定されているので、ドキュメント画面表示部1410は、設計仕様書記憶部1600から名称が「ID001」の仕様書を読み出し、10ページ目の14行目の第2番目の単語から、前後20単語を読み出し、ドキュメント画面WIN2に表示する。また、ドキュメント画面表示部1410は、同様に、記載位置1716の「位置n」まで、仕様書の該当部分を表示する。更に、ドキュメント画面表示部1410は、仕様書ID1714として設定されている他の仕様書についても、同様に表示する。
<動作>
以下、文書検索装置1000の動作について、図11を用いて説明する。
図11は、文書検索装置1000の文書検索処理のフローチャートである。
ユーザが、操作部1120を操作して、文書検索処理の開始を指示する。指示を検出した検索制御部1100は、表示部1110に検索画面WIN1(図4参照)を表示させる。そして、検索制御部1100は、注目キーワード入力領域10のみを入力可能として、注目キーワード取得部1200に注目キーワードの取得を指示する。
注目キーワード取得部1200は、注目キーワード入力領域10に入力された文字列を注目キーワードとして取得する。検索制御部1100は、注目キーワード取得部1200が取得した注目キーワードを、画像データ作成部1400に渡して画像(画像G21参照)を作成させ、表示させる(ステップS10)。また、検索制御部1100は、みなしキーワード取得部1210指示して、関連キーワード入力領域70に注目キーワードを表示させ、みなしキーワード表示領域80にみなし注目キーワード候補のリストを表示させる。また、検索制御部1100は、設計仕様書記憶部1600に記憶されている仕様書のうち、注目キーワードが記載されている仕様書を検索し、図形表示領域40に表示させる(画像G20参照)。具体的には、例えば、注目キーワード「weld」である場合、検索制御部1100は、単語1711に「weld」が設定されている単語情報テーブル1710(図10参照)を読み出し、仕様書ID1714として登録されている仕様書の数を画像データ作成部1400に渡す。画像データ作成部1400は、渡された数の仕様書を示す図形(図9参照)を作成し、図形表示領域40に等角度で円形に配置して描画する。尚、検索制御部1100は、図形表示領域40に表示されている仕様書を示す図形と、仕様書ID1714として登録されている仕様書の名称との対応付けを記憶しておく。カーソルが図形上に載ったことを検知すると、検索制御部1100は、仕様書名表示領域30に、当該図形と対応付けられている仕様書の名称を表示し、ページを示す線分上にカーソルが載ったときは、そのページ数も表示する。
検索制御部1100は、検索画面WIN1へのユーザによる操作を待つ。
ここで、キーワード一覧表示領域60に表示されているキーワードが選択されたことを検出すると(ステップS11:Yes)、検索制御部1100は、みなしキーワード取得部1210に、みなしキーワードの取得の指示を出す。みなしキーワード取得部1210は、上述したように、選択されたキーワードのみなしキーワード候補をみなしキーワード表示領域80に表示し、チェックされたキーワードをみなしキーワードとして取得する(ステップS12)。
関連キーワード抽出条件設定領域20のトラックバーまたはチェックボックスが操作されたことを検出すると(ステップS13:Yes)、検索制御部1100は、抽出条件取得部1310に、抽出条件の取得の指示を出す。抽出条件取得部1310は、上述したように、設定された抽出条件を取得する(ステップS14)。
更新ボタン90が押下されたことを検出すると(ステップS15:Yes)、検索制御部1100は、関連キーワード抽出部1300に、関連キーワードの抽出の指示を出す。関連キーワード抽出部1300は、上述したように、抽出条件取得部1310から抽出条件を取得し、取得した抽出条件に基づいて、設計仕様書記憶部1600に記憶されている仕様書から関連キーワードを抽出する。そして、検索制御部1100は、関連キーワード抽出部1300が抽出した関連キーワードを画像データ作成部1400に渡して、図形表示領域40に関連キーワードの画像(画像G22等)を表示させる。また、検索制御部1100は、関連キーワード抽出部1300が抽出した関連キーワードをみなしキーワード取得部1210に渡して、キーワード一覧表示領域60に関連キーワードを表示させる。(ステップS16)。
図形表示領域40に表示されている関連キーワードが選択されたことを検出すると(ステップS17:Yes)、検索制御部1100は、選択された関連キーワードが単語1711として設定された単語情報テーブル1710を単語辞書記憶部1700から読み出し、仕様書ID1714として設定されている仕様書の図形を、画像データ作成部1400に作成させ、表示させる。図3の図形表示領域40に示すように、選択された関連キーワードが記載された仕様書の図形が前面に表示され(画像G31参照)、リンク線分G32が表示される。また、検索制御部1100は、選択された関連キーワードが記載されている仕様書の名称を、仕様書一覧表示領域50に追加表示する(ステップS18)。
文書一括表示ボタン92が押下されたことを検出すると(ステップS19:Yes)、検索制御部1100は、ドキュメント画面表示部1410に仕様書の内容の表示の指示を出す。ドキュメント画面表示部1410は、上述したように、ドキュメント画面WIN2を表示し、図5に示すように、注目キーワード及び選択されている関連キーワードが記載されているページを表示する。また、図6に示すように、フィルタリング語句領域D60、前領域D61、後領域D62にドキュメントの表示条件が設定されている場合は、その条件に応じて、仕様書の該当部分を表示する(ステップS20)。
このように、ユーザは、関連キーワードを選択し、そして、仕様書の内容を確認することを、必要に応じて繰り返しながら、参照する必要がある仕様書を、漏れなく検出することができる。
<実施形態2>
実施形態1では、ユーザは、文書検索装置1000に注目キーワードを入力し、その関連キーワードを自ら選択することにより、適切な仕様書を検出した。実施形態2では、ユーザは、自ら選択した関連キーワードだけでなく、他のユーザが選択した関連キーワードも用いて、適切な仕様書を検出する。
実施形態2の文書検索装置2000は、ユーザ毎に、文書検索の履歴を記憶する。具体的には、文書検索装置2000は、ユーザが選択した関連キーワードを注目キーワードと対応付けて、検索履歴としてユーザ毎に記憶しておく。そして、ユーザは、自らが関連キーワードを選択する際に、他のユーザが選択した関連キーワードを画面に表示させ、その関連キーワードが含まれる仕様書を参照する。
従って、ユーザは、自分では選択しなかったであろう関連キーワードが含まれる仕様書を参照することができ、結果的に、製品の制作において参照する必要がある仕様書を、漏れなく検出できる可能性を高めることができる。
以下、文書検索装置2000について、図を用いて説明する。尚、文書検索装置2000の説明に用いる図、及び、実施形態1の文書検索装置1000の説明に用いた図において、同一の符号を付した構成は、同一の構成であることを示し、適宜、その説明を省略する。
<検索画面>
まず、文書検索装置2000が備える表示部1110に表示される画面について、図13、14を用いて説明する。
図13は、ユーザを特定するための情報(以下、「ユーザID」という。)を入力するためのログイン画面WIN3である。ログイン画面WIN3は、ユーザID入力領域1、OKボタン2、及び、キャンセルボタン3を備える。
ユーザID入力領域1は、文書検索装置2000の使用を開始するユーザが、自身のユーザIDを入力する領域である。OKボタン2は、ログインの指示を受け付けるボタンである。このOKボタン2がユーザによって押下されると、ユーザID入力領域1に入力されているユーザIDの認証が行われ、認証が成功すると図14に示す検索画面WIN4が表示される。ユーザIDの認証が失敗すると、ユーザID入力領域1へのユーザIDの再入力が促される。また、キャンセルボタン3は、ログイン操作の中止を受け付けるボタンである。このキャンセルボタン3がユーザによって押下されると、ユーザID入力領域1がクリアされ、ユーザIDの認証は行われない。
次に、図14の検索画面WIN4を用いて、検索画面の基本構成を説明する。
図14は、注目キーワードを入力した際の画面例を示す図である。文書検索装置2000の検索画面WIN4は、基本的に、実施形態1の文書検索装置1000の検索画面WIN1(図2等参照)と同様であるが、以下の2点が異なる。
1つ目の相違点は、履歴検索条件設定領域13を備えることである。履歴検索条件設定領域13は、他のユーザの検索履歴を用いて文書検索を行うことを、ユーザが指示するための領域である。履歴検索条件設定領域13は、履歴有効チェックボックス11と、ユーザ指定領域12とを有する。履歴有効チェックボックス11は、履歴を用いて検索することを指定する場合に、ユーザがチェックを入れるボックスである。また、ユーザ指定領域12には、ユーザID、例えば、ユーザの名称と、チェックボックスとが対応付けられて表示されている。ユーザは、検索に用いる履歴を指定するために、ユーザ指定領域12のチェックボックスにチェックを入れる。例えば、ユーザが、ユーザIDが「A」のユーザの履歴を検索に用いる場合には、ユーザID「A」と対応付けられているチェックボックスにチェックを入れる。また、複数のチェックボックスにチェックが入れられた場合には、チェックが入れられたチェックボックスに対応するユーザIDの複数の履歴が検索に用いられる。また、文書検索装置2000では、履歴有効チェックボックス11にチェックが入っているが、ユーザ指定領域12のチェックボックスにチェックが入っていない場合には、ユーザの選択は行われなかったと判断され、全てのユーザIDの履歴が検索に用いられるものとする。尚、ユーザ指定領域12のチェックボックスは、1つのみにチェックが入れられるようにしてもよく、また、チェックが入っていない場合は、履歴を用いた検索を行わないこととしてもよい。
2つ目の相違点は、履歴表示ボタン93を備えることである。履歴表示ボタン93は、検索履歴を表示する指示を受け付けるボタンであり、ユーザによって押下されると、検索履歴が表示された別画面が表示される。
<オペレーション例>
図13〜図18を用いて、実施形態2の文書検索処理のオペレーション例を説明する。
まず、ユーザは、文書検索装置2000の表示部1110に表示されているログイン画面WIN3(図13参照)のユーザID入力領域1に、自分のユーザIDである「C」を入力し、OKボタン2を押下すると、検索画面WIN4(図14参照)が表示される。
そして、ユーザID「C」のユーザ(以下、「ユーザC」という。)が、「ut」を注目キーワード入力領域10に入力すると、図形表示領域40に、「ut」が画像G50として表示される。
ユーザCが、更新ボタン90を押下すると、関連キーワード抽出条件設定領域20に設定されている抽出条件で抽出された関連キーワード、「post」、「pmi」等が、画像G51として表示される。
ここで、ユーザCが、画像G51として表示されている関連キーワードの1つ「pipe」を選択すると、図15に示す画面となる。
図形表示領域40に表示されている関連キーワード「pipe」(画像G52)が強調表示され、関連キーワード「pipe」が記載されている仕様書を示す図形(図9参照)が、前面に表示される。
次に、ユーザCが文書一括表示ボタン92を押下すると、図16に示すようなドキュメント画面WIN2が表示される。
図16に示すドキュメント画面WIN2には、注目キーワード「ut」と、ユーザにより選択されている関連キーワード「pipe」が記載されている仕様書の該当ページの内容が表示される。該当する仕様書の名称が表示され(矢印D70参照)、該当のページ数が表示される(矢印D71)。ページ内容には、注目キーワード「ut」(矢印D72参照)等、及び、関連キーワード「pipe」(矢印D73参照)等が、強調表示される。
ドキュメント画面WIN2に表示された仕様書を参照したユーザCは、検索処理終了の操作、例えば、所定のボタンを押下する操作を操作部1120に対して行う。表示部1110には、検索画面WIN4に代えて、ログイン画面WIN3が表示される。
次に、ユーザID「C」のユーザとは別のユーザである、ユーザID「D」のユーザ(以下、「ユーザD」という。)が、ログイン画面WIN3のユーザID入力領域1に、自分のユーザIDである「D」を入力し(図17参照)、OKボタン2を押下すると、検索画面WIN4(図18参照)が表示される。
ユーザDが、「ut」を注目キーワード入力領域10に入力すると、図形表示領域40に、「ut」が画像G53として表示される。そして、ユーザDが、履歴有効チェックボックス11にチェックを入れ、ユーザ指定領域12のユーザID「C」と対応するチェックボックスにチェックを入れ、更新ボタン90を押下すると、注目キーワードが「ut」のときにユーザCが選択した関連キーワード「pipe」が、画像G54として表示される。
ここで、ユーザDが、画像G54として表示されている関連キーワード「pipe」を選択すると、関連キーワード「pipe」が記載されている仕様書が強調表示され、画像G54と結ばれたリンク線が表示される。
そして、ユーザDが文書一括表示ボタン92を押下すると、図16に示すようなドキュメント画面WIN2が表示される。つまり、ユーザCが参照した仕様書が表示される。
文書検索装置2000は、図18に示すように、他のユーザが選択した関連キーワードを表示させることができ、図16に示すような、他のユーザが参照した仕様書の部分を表示させることが容易にできる。従って、ユーザは、自分では選択しないような、あるいは思いつかないような関連キーワードを用いて検索された仕様書の内容を確認することができるので、参照すべきであったのに参照しなかった事態が生じることを減らすことが可能となる。
図18の画面例では、ユーザCの履歴を用いた例を示しているが、履歴有効チェックボックス11にチェックが入っているが、ユーザ指定領域12のチェックボックスにチェックが入っていない場合には、ユーザC以外の他のユーザが選択した関連キーワードも、図形表示領域40に表示される。また、ユーザ指定領域12で複数のユーザを指定した場合には、指定されたユーザそれぞれが選択した関連キーワードがまとめて表示される。
<構成>
次に、文書検索装置2000の構成について説明する。図12は、文書検索装置2000の構成例を示す図である。
文書検索装置2000は、検索制御部2100、表示部1110、操作部1120、注目キーワード取得部1200、みなしキーワード取得部1210、抽出条件取得部1310、画像データ作成部1400、ドキュメント画面表示部1410、部品図形記憶部1500、設計仕様書記憶部1600、単語辞書記憶部1700、ユーザID取得部2200、検索履歴作成部2300、抽出ユーザ選択部2400、関連キーワード抽出部2500、及び、検索履歴記憶部2600を備える。
実施形態2の文書検索装置2000の構成が、実施形態1の文書検索装置1000構成と異なる点は、大きく以下の2点である。
1点目は、ユーザ毎の検索履歴を記憶するための機能部を有する点である。この機能を実現するために、文書検索装置2000には、ユーザID取得部2200、検索履歴作成部2300、及び、検索履歴記憶部2600を備えている。
2点目は、他のユーザが選択した関連キーワードを用いた文書検索を行う機能である。この機能を実現するために、抽出ユーザ選択部2400を備え、また、関連キーワード抽出部2500を、文書検索装置1000の関連キーワード抽出部1300に代えて、備えている。
以下、文書検索装置1000と異なる点について、説明する。尚、文書検索装置2000の表示部1110、操作部1120、注目キーワード取得部1200、みなしキーワード取得部1210、抽出条件取得部1310、画像データ作成部1400、ドキュメント画面表示部1410、部品図形記憶部1500、設計仕様書記憶部1600、単語辞書記憶部1700は、文書検索装置1000の同符号の機能部と同様の機能を有する。
検索制御部2100は、検索制御部1100と同様に、各機能部を制御し、ユーザ操作に応じて、仕様書を検索する機能を実現する。検索制御部2100は、ユーザの操作に応じて、ログイン画面WIN3、又は、検索画面WIN4を表示する。また、検索制御部2100は、注目キーワードや、関連キーワード等を記憶して管理し、適時、設計仕様書記憶部1600に記憶されている仕様書のキーワードの検索を行う。尚、検索制御部2100が記憶しているキーワード等は、必要に応じて他の機能部からの参照が可能であるとする。
ユーザID取得部2200は、いわゆるログイン処理部であり、文書検索装置2000の使用を開始するユーザのユーザIDを取得する。具体的には、ユーザID取得部2200は、ログイン画面WIN3のOKボタン2が押下されたことを、検索制御部2100を介して検知すると、ユーザID入力領域1に入力された文字列をユーザIDとして読み込む。そして、ユーザID取得部2200は、読み込んだユーザIDの認証を行う。例えば、ユーザID取得部2200は、予め、文書検索装置2000の使用を許可されているユーザIDのリストを記憶しておき、読み込んだユーザIDが、このリストに登録されている場合に認証が成功したと判断し、登録されていない場合に認証が失敗したと判断する。
認証を行ったユーザID取得部2200は、認証結果を検索制御部2100に通知する。認証結果が成功である場合には、検索制御部2100は、検索画面WIN4を表示部1110に表示し、認証が失敗である場合には、ログイン画面WIN3のユーザID入力領域1をクリアする。また、ユーザID取得部2200は、認証に成功した場合には、そのユーザIDを検索履歴作成部2300に通知する。
検索履歴作成部2300は、検索履歴を作成し、検索履歴記憶部2600に記憶させる。検索履歴作成部2300は、ユーザが文書一括表示ボタン92を押下したことを検索制御部2100を介して検知すると、検索制御部2100が記憶している注目キーワードと関連キーワードとを読み出し、また、検索制御部2100を介してドキュメント画面表示部1410がドキュメント画面WIN2に表示したページ内容を取得し、これらのデータとユーザID取得部2200から通知されたユーザIDとを対応付けて、検索履歴を作成して検索履歴記憶部2600に記憶させる。
検索履歴記憶部2600は、検索履歴を記憶する。検索履歴は、ユーザの操作に応じて、検索履歴作成部2300によって記憶される。
図19は、検索履歴記憶部2600に記憶される検索履歴テーブル2610の構成及び内容の例を示す図である。検索履歴テーブル2610は、ユーザが文書一括表示ボタン92を押下する都度、表示する仕様書ごとに1レコードが作成され、追加される。
検索履歴テーブル2610は、番号2611、ユーザID2612、検索ID2613、注目キーワード2614、関連キーワード2615、仕様書ID2616、及び、内容2617を備える。
番号2611は、検索履歴テーブル2610に登録されているレコード番号を示す。レコード番号は、1から昇順に設定される。
ユーザID2612は、ログインしているユーザを特定するための識別子を示す。
検索ID2613は、文書一括表示ボタン92が押下され、文書検索が実行される毎に振られる番号を示す。つまり、何回目の文書検索であるかを示す番号であり、文書検索の識別子と言える。
注目キーワード2614は、検索ID2613が示す文書検索において用いられた注目キーワードを示す。
関連キーワード2615は、検索ID2613が示す文書検索において用いられた関連キーワードを示す。図19では、関連キーワード2615として1つのキーワードを記載しているが、複数であってもよい。
仕様書ID2616は、検索ID2613が示す文書検索によって抽出され、ドキュメント画面WIN2に表示された仕様書を特定するための識別子(名称)を示す。
内容2617は、検索ID2613が示す文書検索によって抽出され、ドキュメント画面WIN2に表示された仕様書の記載内容を示す。尚、内容2617として設定される記載内容は、ドキュメント画面WIN2に表示された記載内容の一部でも良い。
例えば、図15に示すように、ユーザCが、注目キーワード入力領域10に「ut」を入力し、関連キーワード「pipe」を選択して、文書一括表示ボタン92を押下して図16に示すようなドキュメント画面WIN2を表示させた場合を考える。検索履歴テーブル2610には、番号2611として「5」が設定されているレコードまでが登録されているとする。検索履歴作成部2300は、番号2611として「6」を設定し、ユーザID2612として「C」を設定し、注目キーワード2614として「ut」を設定し、関連キーワード2615として「pipe」を設定し、仕様書ID2616として「3」を設定し(矢印D70参照)、内容2617としてページの内容を設定したレコードを作成する。そして、検索履歴作成部2300は、番号2611として「5」が設定されているレコードに検索ID2613として設定されている「3」に1を加算した「4」を、そのレコードに検索ID2613として設定し、そのレコードを検索履歴テーブル2610に追加する。ドキュメント画面WIN2に表示されている仕様書の部分の数の、検索ID2613として「4」が設定されたレコードを作成して、検索履歴テーブル2610に追加する。
次に、図12の抽出ユーザ選択部2400は、履歴検索条件設定領域13(図14参照)に設定されている履歴検索条件を読み出し、関連キーワード抽出部2500に渡す。履歴検索条件は、2つの項目を含む。1つ目の項目は、履歴検索を行うか否かであり、2つ目の項目は、どのユーザの履歴を使用するかである。ユーザは、履歴検索を行うか否かを、履歴検索条件設定領域13の履歴有効チェックボックス11で指定し、使用する履歴のユーザを、ユーザ指定領域12で指定する。
関連キーワード抽出部2500は、抽出ユーザ選択部2400から渡された履歴検索条件に応じて、関連キーワードを抽出する。抽出された関連キーワードは、検索制御部2100によって画像データ作成部1400に渡され、関連キーワードの画像(図14の画像G51等参照)を表示させる等の処理が行われる。
具体的には、関連キーワード抽出部2500は、抽出ユーザ選択部2400から渡された履歴検索条件が、履歴検索を行わないことを示す場合には、文書検索装置1000の関連キーワード抽出部1300と同様に、抽出条件取得部1310から渡された抽出条件に応じて、注目キーワードに関連する関連キーワードを設計仕様書記憶部1600に記憶されている仕様書から抽出する。
一方、履歴検索条件が、履歴検索を行うことを示す場合には、関連キーワード抽出部2500は、抽出ユーザ選択部2400から渡された履歴検索条件で示されたユーザ(以下、「抽出ユーザ」という。)が選択した関連キーワードを、検索履歴テーブル2610から読み出す。例えば、図18に示すように、ユーザDが、「ut」を注目キーワード入力領域10に入力し、履歴有効チェックボックス11にチェックを入れ、ユーザ指定領域12のユーザID「C」と対応するチェックボックスにチェックを入れ、更新ボタン90を押下した場合を考える。関連キーワード抽出部2500は、検索履歴テーブル2610から、ユーザID2612として「C」が設定され、注目キーワード2614として「ut」が設定されているレコードを、番号2611「1」から順に検索する。そして、見つかったレコード、具体的は、番号2611が「6」〜「10」のレコードから関連キーワード2615として設定されているキーワード「pipe」を、関連キーワードとして読み出す。尚、図17では、関連キーワード2615として設定されているキーワードは「pipe」だけであるが、例えば、ユーザID2612として「C」が設定され、注目キーワード2614として「ut」が設定され、関連キーワード2615として「steam」が設定されたレコードが見つかった場合には、「steam」も、関連キーワードとして読み出す。ユーザCが、選択する関連キーワードを変えて、文書検索を行った場合の履歴だからである。また、検索ID2613として設定されている検索IDは異なるが、ユーザID2612として「C」が設定され、注目キーワード2614として「ut」が設定されているレコードが見つかった場合には、それらのレコードの関連キーワード2615として設定されているキーワードも、関連キーワードとして読み出すこととしてもよく、又は、検索IDが最も大きいレコードから関連キーワードを読み出す等としてもよい。
また、抽出ユーザが複数である場合、例えば、更に、ユーザID「E」に対応するチェックボックスにもチェックが入っていた場合には、関連キーワード抽出部2500は、検索履歴テーブル2610から、ユーザID2612として「E」が設定され、注目キーワード2614として「ut」が設定されているレコードを検索する。
また、履歴検索条件が、履歴検索を行うことを示す場合であるが、ユーザ指定領域12のユーザIDと対応するチェックボックスのいずれにもチェックは入っていない場合には、関連キーワード抽出部2500は、検索履歴テーブル2610から、注目キーワード2614として「ut」が設定されているレコードを検索する。そして、見つかったレコードに関連キーワード2615として設定されているキーワードを、関連キーワードとして読み出す。
<動作>
以下、文書検索装置2000の動作について、図20、21を用いて説明する。上述のように、実施形態2の文書検索装置2000が行う文書検索処理は、実施形態1の文書検索装置1000が行う文書検索処理に加えて、他のユーザが選択した関連キーワードを用いた文書検索を行うものである。従って、実施形態1の文書検索装置1000の文書検索処理のフローチャート(図11)と異なる点に重点を置いて説明する。
図20は、文書検索装置2000のユーザ別検索処理のフローチャートである。
ユーザが、表示部1110に表示されている検索画面WIN3(図13参照)のユーザID入力領域1に、自分のユーザIDを入力し、OKボタン2を押下する。OKボタン2が押下されたことを検出した検索制御部2100は、OKボタン2が押下された旨をユーザID取得部2200に通知する。
通知を受けたユーザID取得部2200は、ユーザIDを取得する(ステップS30)。具体的には、ユーザID取得部2200は、ユーザID入力領域1に入力されたユーザIDの認証を行い、認証結果を検索制御部2100に通知する。認証結果が成功である場合には、検索制御部2100は、検索画面WIN4を表示部1110に表示し、認証が失敗である場合には、ログイン画面WIN3のユーザID入力領域1をクリアする。また、ユーザID取得部2200は、認証に成功した場合には、そのユーザIDを検索履歴作成部2300に通知する。
検索画面WIN4を表示部1110に表示した検索制御部2100は、ユーザが終了操作を行ったことを検出するまで(ステップS32:No)、文書検索処理を行う(ステップS31)。検索制御部2100は、ユーザが終了操作を行ったことを検出すると(ステップS32:Yes)、検索画面WIN4を消去しログイン画面WIN3を表示する等の終了処理を行い、ユーザ別検索処理を終了する。
次に、図20のフローチャートにおけるステップS31の文書検索処理について、図21を用いて説明する。図21は、文書検索処理のフローチャートである。
図21のフローチャートにおいて、図11のフローチャートと同じ番号のステップの処理は、図11のフローチャートのステップの処理と同様である。従って、図11のフローチャートと異なる、ステップS50、S51、S52を含む処理、つまり、ステップS15において、更新ボタン90が押下された場合の処理と、ステップS19において、文書一括表示ボタン92が押下された場合の処理との2つの処理について説明する。
まず、ステップS15において、更新ボタン90が押下された場合の処理について説明する。
検索制御部2100は、更新ボタン90が押下されたことを検出すると(ステップS15:Yes)、関連キーワード抽出部2500に、関連キーワードの抽出の指示を出す。
指示を受けた関連キーワード抽出部2500は、まず、抽出ユーザ選択部2400から履歴検索条件を取得する(ステップS50)。
抽出ユーザ選択部2400から取得した履歴検索条件が、履歴検索を行うことを示す場合(ステップS50:Yes)、関連キーワード抽出部2500は、上述したように、履歴検索条件で示されたユーザ(抽出ユーザ)が選択した関連キーワードを、検索履歴テーブル2610から読み出す。そして、検索制御部2100は、関連キーワード抽出部2500が抽出した関連キーワードを画像データ作成部1400に渡して、図形表示領域40に関連キーワードの画像(図18の画像G54)を表示させる。また、検索制御部2100は、関連キーワード抽出部2500が抽出した関連キーワードをみなしキーワード取得部1210に渡して、キーワード一覧表示領域60に関連キーワードを表示させる。(ステップS51)。
一方、抽出ユーザ選択部2400から取得した履歴検索条件が、履歴検索を行わないことを示す場合(ステップS50:No)、関連キーワード抽出部2500は、上述したように、抽出条件取得部1310から抽出条件を取得し、取得した抽出条件に基づいて、設計仕様書記憶部1600に記憶されている仕様書から関連キーワードを抽出する。そして、検索制御部2100は、関連キーワード抽出部2500が抽出した関連キーワードを画像データ作成部1400に渡して、図形表示領域40に関連キーワードの画像(図14の画像G51)を表示させる。また、検索制御部2100は、関連キーワード抽出部2500が抽出した関連キーワードをみなしキーワード取得部1210に渡して、キーワード一覧表示領域60に関連キーワードを表示させる。(ステップS16)。
次に、ステップS19において、文書一括表示ボタン92が押下された場合の処理について説明する。
検索制御部2100は、文書一括表示ボタン92が押下されたことを検出すると(ステップS19:Yes)、ドキュメント画面表示部1410に仕様書の内容の表示の指示を出す。ドキュメント画面表示部1410は、上述したように、ドキュメント画面WIN2を表示し、図5、16に示すように、注目キーワード及び選択されている関連キーワードが記載されているページを表示する。また、図6に示すように、フィルタリング語句領域D60、前領域D61、後領域D62にドキュメントの表示条件が設定されている場合は、その条件に応じて、仕様書の該当部分を表示する(ステップS20)。
ドキュメント画面表示部1410に仕様書の内容の表示の指示を出した検索制御部2100は、検索履歴作成部2300に検索履歴を記憶するよう指示する。
指示を受けた検索履歴作成部2300は、検索履歴のレコードを作成し、検索履歴テーブル2610に追加する(ステップS52)。具体的には、検索履歴作成部2300は、図20のステップS30においてユーザID取得部2200から通知されたユーザID、ステップS20においてドキュメント画面表示部1410が仕様書の表示(検索)に用いた注目キーワード及び関連キーワード、ドキュメント画面WIN2に表示した仕様書のID及びページ内容を用いて、上述のように、表示した仕様書の部分毎に1レコードを作成し、検索履歴テーブル2610に追加する。
このように、ユーザは、自分が選択した関連キーワードだけでなく、他のユーザが選択した関連キーワードが記載されている仕様書の内容を確認することによって、自分だけでは参照しなかったかもしれない仕様書であるが参照すべき仕様書を、検出することができる。
本発明を表現するために、上述において図面を参照しながら実施形態を通して本発明を適切且つ十分に説明したが、当業者であれば上述の実施形態を変更および/または改良することは容易に為し得ることであると認識すべきである。したがって、当業者が実施する変更形態または改良形態が、請求の範囲に記載された請求項の権利範囲を離脱するレベルのものでない限り、当該変更形態または当該改良形態は、当該請求項の権利範囲に包括されると解釈される。
WIN1 WIN4 検索画面
WIN2 ドキュメント画面
WIN3 ログイン画面
1000 2000 文書検索装置
1100 2100 検索制御部
1200 注目キーワード取得部
1210 みなしキーワード取得部
1300 2500 関連キーワード抽出部
1310 抽出条件取得部
1400 画像データ作成部
1410 ドキュメント画面表示部
1500 部品図形記憶部
1600 設計仕様書記憶部
1700 単語辞書記憶部
2200 ユーザID取得部
2300 検索履歴作成部
2400 抽出ユーザ選択部
2600 検索履歴記憶部

Claims (17)

  1. 表示手段を備えた文書検索装置であって、
    ユーザから入力された注目キーワードを取得する注目キーワード取得手段と、
    複数の単語を記憶する記憶手段と、
    1以上の所定の文書から、前記注目キーワードと所定の関係がある単語であって、前記記憶手段に記憶されている単語を、関連キーワードとして抽出する関連キーワード抽出手段と、
    前記注目キーワードと前記関連キーワード抽出手段で抽出された前記関連キーワードとを前記表示手段に表示する表示制御手段と
    を備え
    前記文書は、所定の区切文字によって区切られた複数の文から構成されており、
    前記所定の関係は、前記注目キーワードが含まれる文書中の、所定の文字列が含まれる文に含まれていることであり、
    前記関連キーワード抽出手段は、前記注目キーワードが含まれる文書中の、前記所定の文字列が含まれる文に含まれる単語であって、前記記憶手段に記憶されている単語を、前記関連キーワードとして抽出する
    とを特徴とする文書検索装置。
  2. 前記所定の関係として、単語の数を示す情報を、ユーザから取得する関係取得手段を、更に備え、
    前記関連キーワード抽出手段は、前記注目キーワードの前記文書内の記載位置から前記関係取得手段で取得された数の単語の範囲内に記載されている単語であって、前記記憶手段に記憶されている単語を、前記関連キーワードとして抽出する
    ことを特徴とする請求項1に記載の文書検索装置。
  3. 前記文書は、所定の区切記号によって区切られた複数の文から構成されており、
    前記所定の関係は、前記注目キーワードが含まれる文に含まれていることであり、
    前記関連キーワード抽出手段は、前記注目キーワードが含まれる文に含まれる単語であって、前記記憶手段に記憶されている単語を、前記関連キーワードとして抽出する
    ことを特徴とする請求項1又は2に記載の文書検索装置。
  4. 前記記憶手段に記憶されている複数の単語は、複数のグループに分けられており、
    前記所定の関係として、前記グループを示す情報を、ユーザから取得するグループ取得手段を、更に備え、
    前記関連キーワード抽出手段は、前記注目キーワードが含まれる文書中の、前記グループ取得手段が取得した情報が示すグループに含まれる単語であって、前記注目キーワードと共に所定数以上の前記文書内に記載されている単語を、前記関連キーワードとして抽出する
    ことを特徴とする請求項1〜のいずれか一項に記載の文書検索装置。
  5. 前記注目キーワード取得手段は、取得した注目キーワードの他に、前記注目キーワードとみなす1以上の単語を、みなし注目キーワードとしてユーザから取得し、
    前記関連キーワード抽出手段は、前記注目キーワード及び前記みなし注目キーワードのうちのいずれかと前記所定の関係がある単語であって、前記記憶手段に記憶されている単語を、前記関連キーワードとして抽出する
    ことを特徴とする請求項1〜のいずれか一項に記載の文書検索装置。
  6. 前記みなし注目キーワードは、前記注目キーワードが含まれる文字列から成る単語、又は、前記注目キーワードの一部分の文字列から成る単語である
    ことを特徴とする請求項に記載の文書検索装置。
  7. 前記関連キーワード抽出手段は、抽出した関連キーワードの他に、前記関連キーワードとみなす1以上の単語を、みなし関連キーワードとしてユーザから取得し、前記文書に記載されている前記みなし関連キーワードを、前記関連キーワードとして抽出する
    ことを特徴とする請求項1〜のいずれか一項に記載の文書検索装置。
  8. 前記みなし関連キーワードは、前記関連キーワードが含まれる文字列から成る単語、又は、前記関連キーワードの一部分の文字列から成る単語である
    ことを特徴とする請求項に記載の文書検索装置。
  9. 前記関連キーワード抽出手段で抽出された前記関連キーワードから、ユーザが選択した関連キーワードを取得する関連キーワード選択手段を、更に備え、
    前記表示手段は、前記注目キーワード及び前記関連キーワード選択手段で取得された関連キーワードが記載されている前記文書のうち、前記注目キーワード及び前記関連キーワードが記載されている部分を、前記表示手段に表示する
    ことを特徴とする請求項1〜のいずれか一項に記載の文書検索装置。
  10. 前記表示手段が表示する前記部分は、前記注目キーワードと前記関連キーワードの前後それぞれ所定数の単語とが含まれる部分である
    ことを特徴とする請求項に記載の文書検索装置。
  11. 前記注目キーワードと、前記関連キーワード選択手段で取得された関連キーワードとを対応付けた履歴情報を記憶する検索履歴記憶手段と、
    前記検索履歴記憶手段に記憶されている履歴情報から関連キーワードを抽出するか否かの指示を取得する履歴利用指示取得手段とを、更に備え、
    前記関連キーワード抽出手段は、前記履歴利用指示取得手段により前記履歴情報から関連キーワードを抽出する指示を取得した場合には、前記注目キーワード取得手段で取得された注目キーワードの関連キーワードとして、前記検索履歴記憶手段に当該注目キーワードと対応付けて記憶されている関連キーワードを、抽出する
    ことを特徴とする請求項9又は10に記載の文書検索装置。
  12. ユーザを識別するためのユーザ識別子を取得するユーザ識別子取得手段を、更に備え、
    前記履歴情報は、前記注目キーワードと、前記関連キーワード選択手段が取得した関連キーワードと、当該関連キーワードを選択したユーザのユーザ識別子とを対応付けたものであり、
    前記履歴利用指示取得手段は、更に、前記履歴情報から関連キーワードを抽出するために用いるユーザ識別子である抽出識別子を取得し、
    前記関連キーワード抽出手段は、前記履歴利用指示取得手段により前記履歴情報から関連キーワードを抽出する指示を取得した場合には、前記注目キーワード取得手段で取得された注目キーワードの関連キーワードとして、前記抽出識別子と同じユーザ識別子及び当該注目キーワードに対応付けて前記検索履歴記憶手段に記憶されている関連キーワードを抽出する
    ことを特徴とする請求項11に記載の文書検索装置。
  13. 前記関連キーワード抽出手段で抽出された前記関連キーワードから、ユーザが選択した関連キーワードを取得する関連キーワード選択手段を、更に備え、
    前記表示手段は、前記注目キーワード及び前記関連キーワード選択手段で取得された関連キーワードが記載されている前記文書を表す第1図形であって、前記関連キーワードが記載されている前記文書内の位置を示す第2図形が重ねて表示された第1図形を前記表示手段に表示する
    ことを特徴とする請求項1〜12のいずれか一項に記載の文書検索装置。
  14. 表示手段を備えた文書検索装置であって、
    ユーザから入力された注目キーワードを取得する注目キーワード取得手段と、
    複数の単語を記憶する記憶手段と、
    1以上の所定の文書から、前記注目キーワードと所定の関係がある単語であって、前記記憶手段に記憶されている単語を、関連キーワードとして抽出する関連キーワード抽出手段と、
    前記注目キーワードと前記関連キーワード抽出手段で抽出された前記関連キーワードとを前記表示手段に表示する表示制御手段と、
    前記関連キーワード抽出手段で抽出された前記関連キーワードから、ユーザが選択した関連キーワードを取得する関連キーワード選択手段と、を備え、
    前記表示手段は、前記注目キーワード及び前記関連キーワード選択手段で取得された関連キーワードが記載されている前記文書を表す第1図形であって、前記関連キーワードが
    記載されている前記文書内の位置を示す第2図形が重ねて表示された第1図形を前記表示手段に表示し、
    前記表示手段が表示する前記第1図形は、円であり、前記第2図形は、前記円の中心点と円周上の点とを結ぶ線分であり、
    前記表示手段は、前記文書の総ページ数を360度と対応付けた場合に、前記文書の1ページ目を示す基準線分から、前記関連キーワードが記載されているページが対応する角度だけ回転させた方向に沿うように、前記関連キーワードが記載されているページを表す前記線分を表示する
    ことを特徴とする文書検索装置。
  15. 前記表示手段は、1ページに記載されている前記関連キーワードの数に応じて、表示態様を変えて前記線分を表示する
    ことを特徴とする請求項14に記載の文書検索装置。
  16. 複数の単語を記憶する記憶手段と、表示手段とを備えた文書検索装置で用いられる文書検索方法あって、
    ユーザから入力された注目キーワードを取得する注目キーワード取得ステップと、
    1以上の所定の文書から、前記注目キーワードと所定の関係がある単語であって、前記記憶手段に記憶されている単語を、関連キーワードとして抽出する関連キーワード抽出ステップと、
    前記注目キーワードと前記関連キーワード抽出ステップで抽出された前記関連キーワードとを前記表示手段に表示する表示制御ステップと
    を備え
    前記文書は、所定の区切文字によって区切られた複数の文から構成されており、
    前記所定の関係は、前記注目キーワードが含まれる文書中の、所定の文字列が含まれる文に含まれていることであり、
    前記関連キーワード抽出ステップは、前記注目キーワードが含まれる文書中の、前記所定の文字列が含まれる文に含まれる単語であって、前記記憶手段に記憶されている単語を、前記関連キーワードとして抽出する
    とを特徴とする文書検索方法。
  17. 複数の単語を記憶する記憶手段と、表示手段とを備えた文書検索装置で用いられる文書検索プログラムであって、
    ユーザから入力された注目キーワードを取得する注目キーワード取得手段と、
    1以上の所定の文書から、前記注目キーワードと所定の関係がある単語であって、前記記憶手段に記憶されている単語を、関連キーワードとして抽出する関連キーワード抽出手段と、
    前記注目キーワードと前記関連キーワード抽出手段で抽出された前記関連キーワードとを前記表示手段に表示する表示制御手段として、
    コンピュータを機能させ
    前記文書は、所定の区切文字によって区切られた複数の文から構成されており、
    前記所定の関係は、前記注目キーワードが含まれる文書中の、所定の文字列が含まれる文に含まれていることであり、
    前記関連キーワード抽出手段は、前記注目キーワードが含まれる文書中の、前記所定の文字列が含まれる文に含まれる単語であって、前記記憶手段に記憶されている単語を、前記関連キーワードとして抽出する
    とを特徴とする文書検索プログラム。
JP2014241843A 2014-06-20 2014-11-28 文書検索装置、文書検索方法、及び、文書検索プログラム Expired - Fee Related JP6181033B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014241843A JP6181033B2 (ja) 2014-06-20 2014-11-28 文書検索装置、文書検索方法、及び、文書検索プログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014127205 2014-06-20
JP2014127205 2014-06-20
JP2014241843A JP6181033B2 (ja) 2014-06-20 2014-11-28 文書検索装置、文書検索方法、及び、文書検索プログラム

Publications (2)

Publication Number Publication Date
JP2016021217A JP2016021217A (ja) 2016-02-04
JP6181033B2 true JP6181033B2 (ja) 2017-08-16

Family

ID=55266005

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014241843A Expired - Fee Related JP6181033B2 (ja) 2014-06-20 2014-11-28 文書検索装置、文書検索方法、及び、文書検索プログラム

Country Status (1)

Country Link
JP (1) JP6181033B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9582777B2 (en) * 2012-06-21 2017-02-28 Centerpoint Properties Trust Point-in-time requirement tracking methods and apparatus
JP6382423B1 (ja) * 2017-10-05 2018-08-29 株式会社リクルートホールディングス 情報処理装置、画面出力方法及びプログラム
CN114303141A (zh) * 2019-10-01 2022-04-08 杰富意钢铁株式会社 信息检索系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3960530B2 (ja) * 2002-06-19 2007-08-15 株式会社日立製作所 テキストマイニングプログラム、方法、及び装置
JP2005251115A (ja) * 2004-03-08 2005-09-15 Shogakukan Inc 連想検索システムおよび連想検索方法
JP2007148948A (ja) * 2005-11-30 2007-06-14 Hitachi Ltd 文書検索プログラム
US7793230B2 (en) * 2006-11-30 2010-09-07 Microsoft Corporation Search term location graph

Also Published As

Publication number Publication date
JP2016021217A (ja) 2016-02-04

Similar Documents

Publication Publication Date Title
US10929603B2 (en) Context-based text auto completion
CN107025217B (zh) 同义转换文生成方法、装置、记录介质以及机器翻译系统
US20140304579A1 (en) Understanding Interconnected Documents
BRPI1008402B1 (pt) Método e aparelho para gerenciamento de informação de texto
US10769370B2 (en) Methods and apparatus for spell checking
US10067921B2 (en) Information processing apparatus, information processing method, and information processing program
JP6181033B2 (ja) 文書検索装置、文書検索方法、及び、文書検索プログラム
US9875298B2 (en) Automatic generation of a search query
US20180144309A1 (en) System and Method for Determining Valid Request and Commitment Patterns in Electronic Messages
JP5271526B2 (ja) 商標検索システム及び商標検索サーバ
JP5127553B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
Heinzerling et al. Visual error analysis for entity linking
JP2018112806A (ja) 画像関連付け装置、画像データベース、画像検索装置、画像検索システム及びプログラム
JP5123350B2 (ja) テストケース作成システム、方法およびプログラム
JP2006039871A (ja) 類義語検索装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、情報検索装置
JP5752073B2 (ja) データ修正装置
JP2011065597A (ja) データ検索装置、データ検索方法及びプログラム
JP6712521B2 (ja) 検索式提示システム、検索式提示方法、およびプログラム
JP2014146076A (ja) 文字列抽出方法、文字列抽出装置、および文字列抽出プログラム
Witmer et al. Mining Wikipedia Article Clusters for Geospatial Entities and Relationships.
JP2013175136A (ja) トレース支援装置、トレース支援システム、トレース支援方法、およびトレース支援プログラム
JP2012190313A (ja) 画像処理装置およびプログラム
US9990420B2 (en) Method of searching and generating a relevant search string
US20150309991A1 (en) Input support device, input support method, and input support program
JP2017068307A (ja) 情報検索装置及びその制御方法、情報検索用プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160901

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170523

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170519

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170719

R150 Certificate of patent or registration of utility model

Ref document number: 6181033

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees