JP2002015001A - 概念検索装置、概念検索方法、概念検索プログラムを記録した記録媒体およびコンピュータプログラム - Google Patents
概念検索装置、概念検索方法、概念検索プログラムを記録した記録媒体およびコンピュータプログラムInfo
- Publication number
- JP2002015001A JP2002015001A JP2000197027A JP2000197027A JP2002015001A JP 2002015001 A JP2002015001 A JP 2002015001A JP 2000197027 A JP2000197027 A JP 2000197027A JP 2000197027 A JP2000197027 A JP 2000197027A JP 2002015001 A JP2002015001 A JP 2002015001A
- Authority
- JP
- Japan
- Prior art keywords
- search
- vector
- target document
- group
- procedure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 229
- 238000004590 computer program Methods 0.000 title claims description 5
- 239000013598 vector Substances 0.000 claims abstract description 600
- 238000004364 calculation method Methods 0.000 claims description 73
- 238000009825 accumulation Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 46
- 238000010586 diagram Methods 0.000 description 22
- 238000005516 engineering process Methods 0.000 description 9
- 238000000605 extraction Methods 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
文書群であって、且つ一文書当たりの単語数が多い検索
対象文書に対して概念検索を行えること。 【構成】 辞書作成用文書群から辞書機能をなすステム
ベクトルを作成するステムベクトル作成手順と、前記ス
テムベクトルおよび検索対象文書群から検索対象文書ベ
クトル群を作成する検索対象文書ベクトル作成手順と、
クライアントから入力された検索用文章と前記ステムベ
クトルとから検索用文章ベクトルを作成する検索用文章
ベクトル作成手順と、その検索用文章ベクトルと前記検
索対象文書ベクトル群とのベクトル演算値を演算するベ
クトル演算手順と、演算されたベクトル演算値の順に検
索対象文書群をソート出力するソート手順とを備え、辞
書作成用文書群および検索対象文書群の少なくとも一方
は、特許情報文献群とする。
Description
文献についての検索システムに対して、概念検索を応用
したものである。
からキーワードを切り出し、インデックスファイルを作
成する。そしてそのインデックスファイルと、検索のた
めに入力されたキーワードとのマッチングによってヒッ
トした文書をピックアップする方法が一般に用いられて
いる。
する文書がヒットするため、検索が終了するまではヒッ
ト件数を把握できない。そのため、期待していたヒット
件数よりも少ないヒット数しか得られない場合には、検
索キーワードの再検討が必要となる。一方、期待してい
たヒット件数よりも多いヒット数を得てしまった場合に
も、いわゆる絞り込みと呼ばれる検索キーワードの再検
討が必要となる。
いた検索技術(概念検索技術)が誕生した。この技術
は、予め辞書作成用の文種から形態素解析などによって
単語を切り出し、各単語に基本となるベクトルを付与し
て、辞書機能をなすベクトル群(ステムベクトル)を生
成する。そのステムベクトルをもとにして、検索対象文
書全体のベクトルを決定し、検索対象文書群から検索対
象文書ベクトル群を生成する。その結果、検索対象文書
は、各々一文書あたり一つのベクトルを持つこととな
る。検索を実行する際には、検索のために入力した文章
をステムベクトルに基づいて検索文章ベクトルを生成
し、その検索文章ベクトルと前記検索対象文書ベクトル
群との内積を演算し、内積値の高い検索対象文書から所
定件数を出力させる。
連度の高い文書から順に所定件数を必ず出力させること
が可能となり、キーワード検索による欠点を克服でき
る。 (調査結果)なお、本出願人は、特許出願、実用新案登
録出願を調査し、関連技術として次の技術を抽出した。
0号は、「言語解析認識処理の方法等」に関するもので
ある。そしてその技術は、操作者が自由に入力した自然
語、入力文に対して柔軟に適応する機能を備えて作動す
ることを特徴とする。そのほか、特願平9−21929
9号、特願平11−4523号などを抽出した。
検索では、検索対象文書に含まれる単語にてヒットする
ようにするため、ステムベクトルを生成する際に、検索
対象となる検索対象文書自身を用いていた。そのため、
検索対象文書が追加されると、ステムベクトルに歪みが
生じることとなる。この歪みを補正するためには、検索
対象文書が更新または追加されるたびにステムベクトル
を再生成する必要がある。このため、検索対象文書が更
新または追加が頻繁に行われる動的な文書群の検索には
採用されてこなかった。
文書当たりの単語数が多かったりする場合には、検索対
象文書ベクトルの生成には、ハードウェアへの負荷が大
きく、時間が掛かっていた。ところで、一文書当たりの
単語数が多い場合、その中の特定範囲について、他の範
囲よりも価値を高める工夫がされる場合が多い。具体的
には、学術論文における抄録(サマリー)、特許情報に
おける要約書や特許請求の範囲などである。
加が頻繁に行われる動的な検索対象文書群であって、且
つ一文書当たりの単語数が多い検索対象文書に対し、概
念検索を達成するための技術を提供することにある。こ
こで、請求項1から請求項28に記載の発明の目的は、
更新または追加が頻繁に行われる動的な検索対象文書群
であって、且つ一文書当たりの単語数が多い検索対象文
書に対して概念検索を行える装置を提供することであ
る。
発明の目的は、更新または追加が頻繁に行われる動的な
検索対象文書群であって、且つ一文書当たりの単語数が
多い検索対象文書に対して概念検索を行える方法を提供
することである。また、請求項43から請求項46に記
載の発明の目的は、更新または追加が頻繁に行われる動
的な検索対象文書群であって、且つ一文書当たりの単語
数が多い検索対象文書に対して概念検索を行えるコンピ
ュータプログラムを提供することである。
を達成するためのものである。 (請求項1)請求項1記載の発明は、クライアント・サ
ーバシステムにおけるサーバに備えられる装置であっ
て、辞書作成用文書群から辞書機能をなすステムベクト
ルを作成するステムベクトル作成手段と、 前記ステム
ベクトルおよび検索対象文書群から検索対象文書ベクト
ル群を作成する検索対象文書ベクトル作成手段と、 ク
ライアントから入力された検索用文章と前記ステムベク
トルとから検索用文章ベクトルを作成する検索用文章ベ
クトル作成手段と、 その検索用文章ベクトルと前記検
索対象文書ベクトル群とのベクトル演算値を演算するベ
クトル演算手段と、 演算されたベクトル演算値の順に
検索対象文書群をソートして、クライアントへソート結
果を出力するソート手段とを備え、 辞書作成用文書群
および検索対象文書群の少なくとも一方は、特許情報文
献群とした概念検索装置に係る。
テム」は、LANで接続されたもののほか、イントラネッ
ト上のクライアント・サーバシステム、クライアントが
サーバ運営者と契約してインターネットなどのネットワ
ークにて接続された場合を含む。「ベクトル」とは、多
次元のベクトルをいい、数次元から数百次元である。あ
まり少ないと精度が下がり、あまり多いと演算負担が大
きいので、精度および演算負担に鑑みて、次元数を決定
する。後述する実施形態では「280次元」とした。
索対象文書ベクトルと検索用文章ベクトルとの内積値を
いうが、各種の係数を掛けたり、外積としたりする他の
計算手法を採用する場合もある。「辞書作成用文書群お
よび検索対象文書群」としては、特許情報文献の他、新
聞記事、学術書などを用いる。
開公報、特許された特許公報、以前の特許法の下で出願
公告された公告公報、実用新案登録出願に係る文献、特
許出願を審査するために用いられる公開技報、技術論文
などをいう。 (作用)まず、ステムベクトル作成手段が辞書作成用文
書群から辞書機能をなすステムベクトルを作成し、検索
対象文書ベクトル作成手段が前記ステムベクトルおよび
検索対象文書群から検索対象文書ベクトル群を作成す
る。続いて、検索用文章ベクトル作成手段が、クライア
ントから入力された検索用文章と前記ステムベクトルと
から検索用文章ベクトルを作成し、ベクトル演算手段が
その検索用文章ベクトルと前記検索対象文書ベクトル群
とのベクトル演算値を演算する。そして、ソート手段が
演算されたベクトル演算値の順に検索対象文書群を並べ
たソート結果をクライアントへ出力する。
少なくとも一方は、特許情報文献群としているので、特
許文献検索に適している。また、更新または追加が頻繁
に行われる動的な検索対象文書群であって、且つ一文書
当たりの単語数が多い検索対象文書に対し、概念検索を
達成できる。更に、辞書作成用文書群について検索対象
文書群とは異なる種類の文献とすると、質の異なった概
念検索が行える。
項1記載の概念検索装置を限定したものであり、辞書作
成用文書群は、辞書作成用文書群がなす群の中の一部分
とした概念検索装置に係る。 (用語説明)「辞書作成用文書群がなす群の中の一部
分」とは、ある数の辞書作成用文書群の中から選ばれた
数の辞書作成用文書群の意である。例えば、隔年毎に区
切られた10年分の文書群の中の5年分の文書群であ
る。
文書群がなす群の中の一部分としているので、ステムベ
クトルの作成が短時間で行える。 (請求項3)請求項3記載の発明は、請求項1または請
求項2のいずれか記載の概念検索装置を限定したもので
あり、辞書作成用文書群は、辞書作成用文書群における
各々の辞書作成用文書の所定部分とした概念検索装置に
係る。
各々の辞書作成用文書の所定部分」とは、例えば、辞書
作成用文書群が技術論文である場合に技術論文における
サマリー、辞書作成用文書群が特許出願書類である場合
における特許請求の範囲、要約書、請求項1、発明の詳
細な説明、など、あるいはそれらの組み合わせである。
文書群における各々の辞書作成用文書の所定部分として
いるので、ステムベクトルの作成が短時間で行える。 (請求項4)請求項4記載の発明は、請求項1から請求
項3のいずれかに記載の概念検索装置を限定したもので
あり、検索対象文書群は、特許情報文献群における各々
の特許出願文献の所定部分とした概念検索装置に係る。
々の特許出願文献の所定部分」とは、例えば、特許請求
の範囲、要約書、請求項1、発明の詳細な説明のいずれ
か、あるいはそれらの組み合わせなどである。 (作用)検索対象文書群を、特許情報文献群における各
々の特許出願文献の所定部分としたので、検索対象文書
ベクトルの作成、ベクトル演算値の演算などが短時間で
行える。
項1から請求項4のいずれかに記載の概念検索装置を限
定したものであり、ソート手段は、所定スコアとして予
め入力されたスコアデータを上回る検索対象文書群をク
ライアントへ出力することとした概念検索装置に係る。
アントの操作者が入力したり、サーバがクライアントへ
選択してもらうような入力手段を提供したりして予め決
定することをいう。ベクトル演算値が内積値である場合
には、完全一致スコアが1.00であるので、それより
も低い値を入力することとなる。なお、ソート手段によ
る出力後に再入力することができるようにしてもよい。
いうことがないが、所定スコアを入力してあれば、その
スコアデータを上回る検索対象文書群をクライアントへ
出力することができる。所定スコアとして例えば「0.
6」を予め入力しておくと、0.6を上回る検索対象文
書群が高スコア順にソートされて出力されることとな
る。
項5記載の概念検索装置を限定したものであり、スコア
データを上回る検索対象文書群のうち、最高スコアおよ
び最低スコアをクライアントへ出力することとした概念
検索装置に係る。 (作用)最高スコアおよび最低スコアがクライアントへ
出力されるので、概念検索の検証、検索用文章について
の再検討などが行える。
項1から請求項5のいずれかに記載の概念検索装置を限
定したものであり、所定出力数として予め入力されたデ
ータ件数の検索対象文書群をクライアントへ出力するこ
ととした概念検索装置に係る。
アントの操作者が入力したり、サーバがクライアントへ
選択してもらうような入力手段を提供したりして予め決
定することをいう。なお、ソート手段による出力後に再
入力することができるようにしてもよい。また、請求項
5にいう「所定スコア」と組み合わせ、例えば、「50
件までで且つ所定スコア=0.7以上」というように決
定することができるようにしてもよい。
いうことがないが、所定出力数を入力してあれば、その
数の検索対象文書群をクライアントへ出力することがで
きる。 (請求項8)請求項8記載の発明は、請求項7記載の概
念検索装置を限定したものであり、ソート手段は、出力
される検索対象文書群のうち、最高スコアおよび最低ス
コアをクライアントへ出力することとした概念検索装置
に係る。
ライアントへ出力されるので、概念検索の検証、検索用
文章についての再検討などが行える。 (請求項9)請求項9記載の発明は、請求項1から請求
項8のいずれかに記載の概念検索装置を限定したもので
あり、クライアントから通常検索のためのキーワードま
たは分類等を入力された場合に、キーワード検索または
分類検索等の通常検索を行って、その検索結果をクライ
アントへ出力させるための通常検索手段を備えた概念検
索装置に係る。
られた分類を指定したり、検索対象文書において使用さ
れているキーワードなどについてヒットしている文書を
検索するものである。論理式(and、×、or、+など)
を採用することができるようにしている場合が一般的で
ある。
ら通常検索のためのキーワードまたは分類を入力された
場合に通常検索を行う。そして、その通常検索結果を更
なる概念検索に用いたり、概念検索の後に通常検索を行
ったりすることができる。 (請求項10)請求項10記載の発明は、請求項9記載
の概念検索装置を限定したものであり、ソート結果に対
してクライアントから通常検索のためのキーワードまた
は分類等を入力された場合に、通常検索を行うこととし
た概念検索装置に係る。
通常検索を行わせることができる。従って、欲する情報
を入手しやすくなる。 (請求項11)請求項11記載の発明は、請求項9また
は請求項10のいずれかに記載の概念検索装置を限定し
たものであり、通常検索手段は、検索結果の書誌的事項
を一覧表示させる一覧表示機能と、 当該一覧表示の中
からクライアントが選択した検索対象文書を呼び出し
て、その検索対象文書の一部または全部を、クライアン
トへ出力させるためのリンク機能とを備えた概念検索装
置に係る。
対象文書におけるインデックス的な情報であって、例え
ば、技術論文におけるタイトルや筆者名、特許情報書類
における発明の名称や出願公開番号などである。「一覧
表示機能」とは、複数の書誌的事項を表にして出力させ
る機能をいう。
索結果の書誌的事項を一覧表示させる。次いで、リンク
機能が、クライアントが一覧表示から選択した検索対象
文書を呼び出して、その検索対象文書の一部または全部
を、クライアントへ出力させる。ここにおいて、欲しい
情報か否かの判断を素早く行うことができる。
請求項11記載の概念検索装置を限定したものであり、
通常検索手段のリンク機能は、検索対象文書の一部また
は全部を、コピーアンドペースト可能であるようにクラ
イアントへ出力することとした概念検索装置に係る。
索対象文書の一部または全部は、コピーアンドペースト
可能である。したがって、続けて検索、特に概念検索を
行う場合などにおいて、検索用文章を考えたり、タイプ
したりするという入力の手間が軽減できる。
請求項9または請求項10のいずれかに記載の概念検索
装置を限定したものであり、通常検索手段は、検索結果
の書誌的事項を一覧表示させる一覧表示機能と、当該一
覧表示の中からクライアントが選択した検索対象文書の
一部または全部を、検索用文章とすることが可能なリン
ク機能とを備えた概念検索装置に係る。
一覧表示機能によって書誌的事項が一覧表示される。そ
の中から検索対象文書の一部または全部をクライアント
が選択すると、リンク機能が選択された検索対象文書の
一部または全部を検索用文章として採択し、ベクトル演
算手段によってベクトル演算値を演算する。ここにおい
て、クライアントユーザは、検索用文章を入力する手間
が要らないというメリットがある。
請求項9から請求項13のいずれかに記載の概念検索装
置を限定したものであり、検索対象文書ベクトル作成手
段が作成した検索対象文書ベクトル群の中から所定の検
索対象文書ベクトル群を抽出するベクトル群抽出手段を
備え、 そのベクトル群抽出手段は、通常検索手段の検
索結果を用いて検索対象文書ベクトル群を抽出すること
とした概念検索装置に係る。
文書ベクトル作成手段の作成した検索対象文書ベクトル
群の中から所定の検索対象文書ベクトル群を抽出する。
そして、そのベクトル群抽出手段は、通常検索手段の検
索結果を用いて検索対象文書ベクトル群を抽出する。こ
のようにすると、すべての検索対象ベクトル群を用いて
ベクトル演算する場合に比べて、ベクトル演算の数を絞
ることができ、演算が短時間で行える。
請求項9から請求項13のいずれかに記載の概念検索装
置を限定したものであり、通常検索手段は、ソート手段
に対して検索結果を用いたソート結果を出力させること
とした概念検索装置に係る。
は、ソート手段がソート結果を出力する際に用いる。通
常検索にいう「ヒット数」は概念検索には存在しない
が、ソート出力の際に通常検索の検索結果、すなわちヒ
ット数を用いることができる。 (請求項16)請求項16記載の発明は、請求項9から
請求項13のいずれかに記載の概念検索装置を限定した
ものであり、検索対象文書ベクトル作成手段は、通常検
索手段の検索結果に対応する検索対象文書群を用いて検
索対象文書ベクトル群を作成することとした概念検索装
置に係る。
全検索対象文書群を絞り込むのに用いる。そこで絞り込
まれた検索対象群を用いて、検索対象文書ベクトルが作
成され、ベクトル演算され、ソート結果が出力される。
このため、全検索対象文書群を用いる場合に比べてベク
トル演算の数を絞ることができ、演算が短時間で行え
る。
請求項9から請求項16のいずれかに記載の概念検索装
置を限定したものであり、ベクトル演算手段によって演
算されたベクトル演算値における所定値以上のソート結
果を記憶するソート結果記憶手段を備え、 通常検索手
段は、ソート結果記憶手段に記憶された所定ベクトル演
算値以上の検索対象文書群を用いて通常検索を行うこと
とした概念検索装置に係る。
手段によって演算されたベクトル演算値における所定値
以上のソート結果を記憶する。そして、通常検索手段
は、ソート結果記憶手段に記憶された所定ベクトル演算
値以上の検索対象文書群を用いてキーワード検索または
分類検索を行う。これにより、概念検索による絞り込み
結果に対して、キーワード検索または分類検索が行え
る。
請求項1から請求項17のいずれかに記載の概念検索装
置を限定したものであり、ソート手段は、ソート結果の
書誌的事項を一覧表示させる一覧表示機能と、 当該書
誌的事項の中からクライアントが選択した検索対象文書
を呼び出して、その検索対象文書の一部または全部を、
クライアントへ出力させるためのリンク機能とを備えた
概念検索装置に係る。
覧表示機能によって書誌的事項が一覧表示される。次い
で、リンク機能が、クライアントが一覧表示から選択し
た検索対象文書を呼び出して、その検索対象文書の一部
または全部を、クライアントへ出力させる。ここにおい
て、欲しい情報か否かの判断を素早く行うことができ
る。
請求項1から請求項18のいずれかに記載の概念検索装
置を限定したものであり、予め所定の検索用文章を入力
して登録しておく検索用文章蓄積手段を備え、 ベクト
ル演算手段は、検索対象文書群が更新または追加された
ら、その検索用文章蓄積手段に登録された検索用文章を
用いてベクトル演算値を演算することとし、ソート手段
は、更新または追加された検索対象文書群についてソー
ト出力することとした概念検索装置に係る。
れば、所定の検索用文章を入力し、サーバの検索用文章
蓄積手段へ登録しておく。検索対象文書群が更新または
追加されたら、ベクトル演算手段は、その検索用文章蓄
積手段に登録された検索用文章を用いてベクトル演算値
を演算する。そして、ソート手段が更新または追加され
た検索対象文書群についてソート出力する。予め登録し
た検索用文章に対するベクトル演算値が演算され、出力
されるので、いわゆるSDIサービスを実現できること
となる。
請求項1から請求項18のいずれかに記載の概念検索装
置を限定したものであり、予め所定の検索用文章を入力
し、その検索用文章を用いて作成した検索用文章ベクト
ルを登録しておく検索用文章ベクトル蓄積手段を備え、
ベクトル演算手段は、検索対象文書群が更新または追
加されたら、その検索用文章ベクトル蓄積手段に登録さ
れた検索用文章ベクトルを用いてベクトル演算値を演算
することとし、 ソート手段は、更新または追加された
検索対象文書群についてソート出力することとした概念
検索装置に係る。
れば、所定の検索用文章を入力する。すると、検索用文
章ベクトル作成手段が検索用文章ベクトルを作成し、検
索用文章ベクトル蓄積手段へ登録する。検索対象文書群
が更新または追加されたら、ベクトル演算手段は、その
検索用文章蓄積手段に登録された検索用文章を用いてベ
クトル演算値を演算する。そして、ソート手段が更新ま
たは追加された検索対象文書群についてソート出力す
る。所定の検索用文章に対する検索用文章ベクトルが予
め作成されているので、ベクトル演算が早く行えるとい
う利点がある。
請求項19または請求項20のいずれかに記載の概念検
索装置を限定したものであり、予め入力する検索用文章
を複数入力するとともに、 ソート手段は、それら検索
用文章に対応させてソート結果を出力させることとした
概念検索装置に係る。
索用文章を複数入力する。ベクトル演算手段は、それら
複数の検索用文章を用いてベクトル演算値をそれぞれ演
算する。そして、ソート手段は、それら検索用文章に対
応させてソート結果を出力させる。例えば、複数の研究
テーマを抱える一人の研究者に対して、研究テーマごと
に検索用文章を入力しておく。すると、その検索用文章
ごとにソート結果を得られる。
請求項1から請求項21のいずれかに記載の概念検索装
置を限定したものであり、ソート手段による出力に基づ
いて作成した新たな検索用文章を再入力するための再入
力手段をクライアントへ提供し、 検索用文章ベクトル
作成手段は、再入力された検索用文章を用いて新たな検
索用文章ベクトルを作成し、 ベクトル演算手段は、そ
の新たな検索用文章ベクトルを用いて新たなベクトル演
算値を演算し、 ソート手段は、その新たなベクトル演
算値に基づいてソートすることとした概念検索装置に係
る。
後、そのソート出力に基づいて作成した新たな検索用文
章を再入力するための再入力手段をクライアントへ提供
し、クライアントユーザは、新たな検索用文章を入力す
る。その新たな検索用文章によって新たな検索用文章ベ
クトルを作成し、ベクトル演算手段は、新たなベクトル
演算値を演算し、ソート手段が新たなベクトル演算値に
基づくソートを行う。
請求項22記載の概念検索装置を限定したものであり、
ソート手段は、ソート結果の書誌的事項を一覧表示させ
る一覧表示機能と、 当該書誌的事項の中からクライア
ントが選択した検索対象文書を呼び出して、その検索対
象文書の一部または全部を、クライアントへ出力させる
ためのリンク機能とを備えるとともに、 前記リンク機
能は、検索対象文書の一部または全部を、コピーアンド
ペースト可能であるようにクライアントへ出力すること
とした概念検索装置に係る。
てソート結果の書誌的事項を一覧表示される。そして、
リンク機能を用いて出力させた検索対象文書の一部また
は全部は、コピーアンドペースト可能である。したがっ
て、続けて概念検索を行う場合などにおいて、検索用文
章を考えたり、タイプしたりするという入力の手間が軽
減できる。
請求項22記載の概念検索装置を限定したものであり、
ソート手段は、ソート結果の書誌的事項を一覧表示させ
る一覧表示機能を備え、再入力手段は、前記一覧表示の
中から検索対象文書の一部または全部を、検索用文章と
して選択可能することで入力を代行するリンク機能を備
えた概念検索装置に係る。
表示機能によって書誌的事項が一覧表示される。その中
から検索対象文書の一部または全部をクライアントが選
択すると、リンク機能が選択された検索対象文書の一部
または全部を検索用文章として採択し、ベクトル演算手
段によってベクトル演算値を演算する。ここにおいて、
クライアントユーザは、検索用文章を入力する手間が要
らないというメリットがある。
請求項1から請求項24のいずれかに記載の概念検索装
置を限定したものであり、ステムベクトル作成手段は、
複数の辞書作成用文書群から当該数のステムベクトルを
作成し、 ベクトル演算手段は、検索対象文書群をステ
ムベクトルごとにベクトル演算値を演算し、 ソート手
段は、各検索対象文書群を、最も高いベクトル演算値の
ステムベクトルへ振り分けてソート結果を出力させるこ
ととした概念検索装置に係る。
えば、特許情報文献において技術分野ごとに作成した
り、複数の発行時期に対して所定期間ごと、具体的に
は、1999年の1年間、1990年代の10年間、と
いった期間ごとに作成する。または、辞書作成用文書群
の分類ごと、具体的には、特許公報、公開公報、実用新
案登録公報ごとに作成する。
の辞書作成用文書群、例えば年度ごと、文書種類ごとに
当該数のステムベクトルを作成する。そして、ベクトル
演算手段が、検索対象文書群をステムベクトルごとにベ
クトル演算値を演算し、ソート手段が、各検索対象文書
群を、最も高いベクトル演算値のステムベクトルへ振り
分けてソート結果を出力する。検索対象文書群は、複数
のステムベクトルごとに設けられたカテゴリーのいずれ
かひとつに振り分けられることとなる。ここにおいて、
辞書作成用文書群ごとにソート結果を得ることができ
る。複数のステムベクトルを時代ごとに作成した場合、
ソート手段がそれら複数のステムベクトルに対応させて
ソート結果を出力させることとしているので、時代ごと
に推移する言葉、キーワード、用語などに細かく対応し
た概念検索が可能となる。
請求項1から請求項25のいずれかに記載の概念検索装
置を限定したものであり、検索対象文書ベクトル作成手
段は、検索対象文書群における所定部分ごとに検索対象
文書ベクトル群を作成し、 ベクトル演算手段は、その
検索対象文書ベクトル群を用いてベクトル演算値を演算
し、 ソート手段は、所定部分ごとにベクトル演算値を
クライアントへ出力することとした概念検索装置に係
る。
手段が、検索対象文書群における所定部分ごとに検索対
象文書ベクトル群を作成する。そして、ベクトル演算手
段が、その検索対象文書ベクトル群を用いてベクトル演
算値を演算し、ソート手段が、所定部分ごとにベクトル
演算値をクライアントへ出力する。ここにおいて、検索
対象文書群における所定部分ごとにソート結果を得るこ
とができる。
一般にパテントマップと呼ばれている出力方式にて直接
出力する概念検索装置であり、請求項1から請求項26
のいずれかに記載の概念検索装置を限定したものであ
る。すなわち、検索対象文書群は、所定母集団の検索対
象文書群とし、 検索用文章ベクトル作成手段は、前記
検索対象文書群に対して複数の検索用文章による複数の
検索用文章ベクトルを作成し、 ソート手段は、前記検
索用文章ベクトルに基づく複数の座標軸に対するベクト
ル演算値をプロットしてクライアントへ出力することと
した概念検索装置に係る。
団へ、何らかの手段によって絞られる。そして、検索用
文章ベクトル作成手段が、前記検索対象文書群に対して
複数の検索用文章による複数の検索用文章ベクトルを作
成する。そして、ソート手段が、前記検索用文章ベクト
ルに基づく複数の座標軸に対するベクトル演算値をプロ
ットしてクライアントへ出力する。
請求項27記載の概念検索装置を限定したものであり、
ソート手段は、所定のプロットにおける検索対象文書群
の書誌的事項の一部を、クライアントへ出力可能とした
概念検索装置に係る。
群の書誌的事項の一部がクライアントへ出力できるの
で、使いやすい。 (請求項29)請求項29記載の発明は、請求項1に対
応させた方法発明であって、辞書作成用文書群から辞書
機能をなすステムベクトルを作成するステムベクトル作
成手順と、 前記ステムベクトルおよび検索対象文書群
から検索対象文書ベクトル群を作成する検索対象文書ベ
クトル作成手順と、 クライアントから入力された検索
用文章と前記ステムベクトルとから検索用文章ベクトル
を作成する検索用文章ベクトル作成手順と、 その検索
用文章ベクトルと前記検索対象文書ベクトル群とのベク
トル演算値を演算するベクトル演算手順と、 演算され
たベクトル演算値の順に検索対象文書群をソートして、
クライアントへソート結果を出力するソート手順とを備
え、 辞書作成用文書群および検索対象文書群の少なく
とも一方は、特許情報文献群とした概念検索方法に係
る。
請求項9に対応させた方法発明であって、クライアント
から通常検索のためのキーワードまたは分類を入力され
た場合に、キーワード検索または分類による通常検索を
行って、その検索結果をクライアントへ出力させるため
の通常検索手順とを備えた概念検索方法に係る。
請求項11に対応させた方法発明であって、請求項30
記載の概念検索方法を限定したものである。すなわち、
通常検索手順には、検索結果の書誌的事項を一覧表示さ
せる一覧表示手順と、 当該書誌的事項の中からクライ
アントが選択した検索対象文書を呼び出して、その検索
対象文書の一部または全部を、クライアントへ出力させ
るためのリンク手順と含むこととした概念検索方法に係
る。
請求項13に対応させた方法発明であって、辞書作成用
文書群から辞書機能をなすステムベクトルを作成するス
テムベクトル作成手順と、 前記ステムベクトルおよび
検索対象文書群から検索対象文書ベクトル群を作成する
検索対象文書ベクトル作成手順と、 クライアントから
通常検索のためのキーワードまたは分類を入力された場
合に、キーワード検索または分類による通常検索を行っ
て、その検索結果の書誌的事項をクライアントへ一覧表
示させる通常検索一覧表示手順と、 当該書誌的事項の
中からクライアントが選択した検索対象文書の一部又は
全部を、検索用文章とし、その検索用文章と前記ステム
ベクトルとから検索用文章ベクトルを作成する検索用文
章ベクトル作成手順と、 その検索用文章ベクトルと前
記検索対象文書ベクトル群とのベクトル演算値を演算す
るベクトル演算手順と、 演算されたベクトル演算値の
順に検索対象文書群をソートして、クライアントへソー
ト結果を出力するソート手順とを備え、 辞書作成用文
書群および検索対象文書群の少なくとも一方は、特許情
報文献群とした概念検索方法に係る。
請求項17に対応させた方法発明であって、請求項30
または請求項32に記載の概念検索方法を限定したもの
である。すなわち、ベクトル演算手順によって演算され
たベクトル演算値における所定値以上のソート結果を記
憶するソート結果記憶手順を備え、 通常検索手順にお
いては、ソート結果記憶手順において記憶された所定ベ
クトル演算値以上の検索対象文書群を用いてキーワード
検索または分類検索を行うこととした概念検索方法に係
る。
請求項18に対応させた方法発明であって、請求項29
から請求項33のいずれかに記載の概念検索方法を限定
したものである。すなわち、ソート手順においては、書
誌的事項を一覧表示するとともに、 当該書誌的事項に
対応する検索対象文書の一部又は全部を出力させること
が可能であるように検索対象文書群とのリンク機能を備
えた概念検索方法に係る。
請求項19に対応させた方法発明であって、請求項29
から請求項34のいずれかに記載の概念検索方法を限定
したものである。すなわち、予め所定の検索用文章を入
力して登録しておく検索用文章蓄積手順を備え、 ベク
トル演算手順においては、検索対象文書群が更新または
追加されたら、その検索用文章蓄積手段によって登録さ
れた検索用文章を用いてベクトル演算値を演算すること
とし、 ソート手順においては、更新または追加された
検索対象文書群についてソート出力することとした概念
検索方法に係る。
請求項20に対応させた方法発明であって、請求項29
から請求項34のいずれかに記載の概念検索方法を限定
したものである。すなわち、予め所定の検索用文章を入
力し、その検索用文章を用いて作成した検索用文章ベク
トルを登録しておく検索用文章ベクトル蓄積手順を備
え、 ベクトル演算手順においては、検索対象文書群が
更新または追加されたら、その検索用文章ベクトル蓄積
手順によって登録された検索用文章ベクトルを用いてベ
クトル演算値を演算することとし、 ソート手順におい
ては、更新または追加された検索対象文書群についてソ
ート出力することとした概念検索方法に係る。
請求項22に対応させた方法発明であって、請求項29
から請求項36のいずれかに記載の概念検索方法を限定
したものである。すなわち、ソート手順による出力に基
づいて作成した新たな検索用文章を再入力するための再
入力手段をクライアントへ提供する再入力提供手順を備
え、 検索用文章ベクトル作成手順は、再入力された検
索用文章を用いて新たな検索用文章ベクトルを作成し、
ベクトル演算手順においては、その新たな検索用文章
ベクトルを用いて新たなベクトル演算値を演算し、 ソ
ート手順においては、その新たなベクトル演算値に基づ
いてソートすることとした概念検索方法に係る。
請求項23に対応させた方法発明であって、請求項37
記載の概念検索方法を限定したものである。すなわち、
ソート手順は、ソート結果の書誌的事項を一覧表示させ
る一覧表示手順と、 当該書誌的事項の中からクライア
ントが選択した検索対象文書を呼び出して、その検索対
象文書の一部または全部を、クライアントへ出力させる
ためのリンク手順とを備えるとともに、 前記リンク手
順は、検索対象文書の一部または全部を、コピーアンド
ペースト可能であるようにクライアントへ出力すること
とした概念検索方法に係る。
請求項24に対応させた方法発明であって、請求項29
から請求項36のいずれかに記載の概念検索方法を限定
したものである。すなわち、ソート結果の書誌的事項を
一覧表示させる一覧表示手順と、 当該書誌的事項の中
からクライアントが選択した検索対象文書の一部又は全
部を、検索対象文章として再入力する検索用文章再入力
手順とを備え、 検索用文章ベクトル作成手順は、再入
力された検索用文章を用いて新たな検索用文章ベクトル
を作成し、 ベクトル演算手順においては、その新たな
検索用文章ベクトルを用いて新たなベクトル演算値を演
算し、 ソート手順においては、その新たなベクトル演
算値に基づいてソートすることとした概念検索方法に係
る。
請求項25に対応させた方法発明であって、請求項29
から請求項39のいずれかに記載の概念検索方法を限定
したものである。すなわち、ステムベクトル作成手順に
おいて、複数のステムベクトルを作成し、ベクトル演算
手順においては、検索対象文書群をステムベクトルごと
にベクトル演算値を演算し、 ソート手順においては、
各検索対象文書群を、最も高いベクトル演算値のステム
ベクトルへ振り分けてソート結果を出力させることとし
た概念検索方法に係る。
請求項26に対応させた方法発明であって、請求項29
から請求項40のいずれかに記載の概念検索方法を限定
したものである。すなわち、検索対象文書ベクトル作成
手順においては、検索対象文書群における所定部分ごと
に検索対象文書ベクトル群を作成し、 ベクトル演算手
順においては、その検索対象文書ベクトル群を用いてベ
クトル演算値を演算し、 ソート手順においては、所定
部分ごとにベクトル演算値をクライアントへ出力するこ
ととした概念検索方法に係る。
請求項27に対応させた方法発明であって、請求項29
から請求項41のいずれかに記載の概念検索方法を限定
したものである。すなわち、検索対象文書群は、所定母
集団の検索対象文書群とし、 検索用文章ベクトル作成
手順においては、前記検索対象文書群に対して複数の検
索用文章による複数の検索用文章ベクトルを作成し、
ソート手順においては、前記検索用文章ベクトルに基づ
く複数の座標軸に対するベクトル演算値をプロットして
クライアントへ出力することとした概念検索方法に係
る。
どに記載した概念検索装置に係る発明に対応する方法発
明を提供することもできる。 (請求項43)請求項43記載の発明は、プログラムを
記録したコンピュータ読み取り可能な記録媒体に係る。
そして、そのプログラムは、辞書作成用文書群から辞書
機能をなすステムベクトルを作成するステムベクトル作
成手順と、 前記ステムベクトルおよび検索対象文書群
から検索対象文書ベクトル群を作成する検索対象文書ベ
クトル作成手順と、 クライアントから入力された検索
用文章と前記ステムベクトルとから検索用文章ベクトル
を作成する検索用文章ベクトル作成手順と、 その検索
用文章ベクトルと前記検索対象文書ベクトル群とのベク
トル演算値を演算するベクトル演算手順と、 演算され
たベクトル演算値の順に検索対象文書群をソートして、
クライアントへソート結果を出力するソート手順とを備
え、辞書作成用文書群および検索対象文書群の少なくと
も一方は、特許情報文献群としたプログラムとする。
空間を占有し得ないプログラムを担持することができる
媒体であり、例えば、フロッピー(登録商標)ディス
ク、ハードディスク、CD−ROM、MO(光磁気ディ
スク)、DVD−ROM、PDなどである。 (請求項44)請求項44記載の発明もまた、プログラ
ムを記録したコンピュータ読み取り可能な記録媒体に係
る。そして、そのプログラムは、特許情報文献群からな
る辞書作成用文書群から辞書機能をなすステムベクトル
を作成するステムベクトル作成手順と、 前記ステムベ
クトルおよび特許情報文献群からなる検索対象文書群か
ら検索対象文書ベクトル群を作成する検索対象文書ベク
トル作成手順と、 クライアントから入力された検索用
文章と前記ステムベクトルとから検索用文章ベクトルを
作成する検索用文章ベクトル作成手順と、 その検索用
文章ベクトルと前記検索対象文書ベクトル群とのベクト
ル演算値を演算するベクトル演算手順と、演算されたベ
クトル演算値の順に検索対象文書群をソートして、クラ
イアントへソート結果を出力するソート手順と、 クラ
イアントから通常検索のためのキーワードまたは分類を
入力された場合に、キーワード検索または分類検索を行
って、その検索結果をクライアントへ出力させるための
通常検索手順とを備えたプログラムとする。
た、プログラムを記録したコンピュータ読み取り可能な
記録媒体に係る。そして、そのプログラムは、特許情報
文献群からなる辞書作成用文書群から辞書機能をなすス
テムベクトルを作成するステムベクトル作成手順と、
前記ステムベクトルおよび特許情報文献群からなる検索
対象文書群から検索対象文書ベクトル群を作成する検索
対象文書ベクトル作成手順と、 クライアントから入力
された検索用文章と前記ステムベクトルとから検索用文
章ベクトルを作成する検索用文章ベクトル作成手順と、
その検索用文章ベクトルと前記検索対象文書ベクトル
群とのベクトル演算値を演算するベクトル演算手順と、
演算されたベクトル演算値の順に検索対象文書群をソー
トして、クライアントへソート結果を出力するソート手
順と、 そのソート手順による出力に基づいて作成した
新たな検索用文章を再入力するための再入力手段をクラ
イアントへ提供する再入力提供手順を備える。 更に、
前記検索用文章ベクトル作成手順は、再入力された検索
用文章を用いて新たな検索用文章ベクトルを作成し、
ベクトル演算手順においては、その新たな検索用文章ベ
クトルを用いて新たなベクトル演算値を演算し、 ソー
ト手順においては、その新たなベクトル演算値に基づい
てソートするプログラムとする。
項34などに記載の方法発明に対応するプログラム記録
媒体発明を提供することもできる。 (請求項46)請求項46記載の発明は、 特許情報文
献群から辞書機能をなすステムベクトルを作成するステ
ムベクトル作成手順と、 前記ステムベクトルおよび特
許情報文献群から検索対象文書ベクトル群を作成する検
索対象文書ベクトル作成手順と、 クライアントから入
力された検索用文章と前記ステムベクトルとから検索用
文章ベクトルを作成する検索用文章ベクトル作成手順
と、 その検索用文章ベクトルと前記検索対象文書ベク
トル群とのベクトル演算値を演算するベクトル演算手順
と、 演算されたベクトル演算値の順に検索対象文書群
をソートして、クライアントへソート結果を出力するソ
ート手順とを備えたコンピュータプログラムに係る。
面に基づいて、更に詳しく説明する。ここで使用する図
面は、図1乃至図19である。なお、図1から図15
は、本発明の実施形態を示す概念図であり、図16乃至
図19は、本発明の実施形態における画面出力の主要部
を示したものである。
を示す概念図であり、クライアント・サーバシステムに
おけるサーバに備えられる装置である。クライアントユ
ーザは、サーバを運営する事業主体との契約に基づい
て、会員IDおよびパスワードの提供を受け、インター
ネットにて接続して、サーバが提供するサービスを利用
する。
能をなすステムベクトルを作成するステムベクトル作成
手段と、前記ステムベクトルおよび検索対象文書群から
検索対象文書ベクトル群を作成する検索対象文書ベクト
ル作成手段と、クライアントから入力された検索用文章
と前記ステムベクトルとから検索用文章ベクトルを作成
する検索用文章ベクトル作成手段と、その検索用文章ベ
クトルと前記検索対象文書ベクトル群とのベクトル演算
値を演算するベクトル演算手段と、演算されたベクトル
演算値の順に検索対象文書群をソートして、クライアン
トへソート結果を出力するソート手段とを備えている。
出力手段へ出力されるベクトル演算値の範囲を予め設定
する「設定ベクトル演算値」を記憶する設定値記憶手段
を備えている。この設定値については、図16において
再度説明する。ここで、辞書作成用文書群および検索対
象文書群とも、特許情報文献群としている。ここにいう
「特許情報文献」とは、特許出願された公開公報、特許
された特許公報、以前の特許法の下で出願公告された公
告公報、実用新案登録出願に係る文献、特許出願を審査
するために用いられる公開技報、技術論文などを含んで
いる。
を考慮して「280次元」とした。また、ベクトル演算
としては、「内積」を演算することとした。クライアン
トユーザは、サーバと契約し、インターネットにて接続
可能なクライアントである。クライアントユーザは、サ
ーバから別途付与されたIDとパスワードとを用いてサ
ーバが提供する上記概念検索システムへアクセスする。
クトル作成手段が辞書作成用文書群から辞書機能をなす
ステムベクトルを作成し、検索対象文書ベクトル作成手
段が前記ステムベクトルおよび検索対象文書群から検索
対象文書ベクトル群を作成する。続いて、検索用文章ベ
クトル作成手段が、クライアントから入力された検索用
文章と前記ステムベクトルとから検索用文章ベクトルを
作成し、ベクトル演算手段がその検索用文章ベクトルと
前記検索対象文書ベクトル群とのベクトル演算値を演算
する。また、所定ベクトル演算値の設定手段にて設定し
た設定値をサーバへ送る。そして、ソート手段が演算さ
れたベクトル演算値の順に、設定値の数だけ検索対象文
書群を並べたソート結果をクライアントへ出力する。
少なくとも一方は、特許情報文献群としているので、特
許文献検索に適している。また、更新または追加が頻繁
に行われる動的な検索対象文書群であって、且つ一文書
当たりの単語数が多い検索対象文書たる特許情報文献に
対し、概念検索を達成できる。 (第一の実施形態のバリエーション)第一のバリエーシ
ョンとして、辞書作成用文書群を、辞書作成用文書群が
なす群の中の一部分とすることができる。すなわち、辞
書を作成するための文書群が数年分の特許公報とする場
合、例えば1年分の特許公報に限ることとする。この場
合、辞書作成用文書群を、辞書作成用文書群がなす群の
中の一部分としているので、ステムベクトルの作成が短
時間で行える。また、年々変化する技術の傾向に合致し
た概念検索を行えることが期待できる。
文書群を、辞書作成用文書群における各々の辞書作成用
文書の所定部分とすることができる。すなわち、辞書を
作成するための文書群が数年分の特許公報とする場合、
その特許公報における要約書の部分のみ、または特許請
求の範囲のみ、あるいはそれらの組合せを辞書作成用文
書群とするのである。このようにすれば、ステムベクト
ルの作成が短時間で行える。
書群は、特許情報文献群における各々の特許出願文献の
所定部分とすることができる。すなわち、数年分の特許
公報が存在する場合、検索対象文書群を、例えば、特許
請求の範囲、要約書、あるいはそれらの組み合わせとす
るのである。その場合、検索対象文書ベクトルの作成、
ベクトル演算値の演算などが短時間で行える。
実施形態について説明する。第一の実施形態との相違点
は、クライアントから通常検索のためのキーワードまた
は分類等を入力された場合に、キーワード検索または分
類検索等の通常検索を行って、その検索結果をクライア
ントへ出力させるための通常検索手段を備えている点で
ある。この実施形態では、通常検索によって絞り込んだ
検索結果に対して概念検索が行えるものである。
た分類を指定したり、検索対象文書において使用されて
いるキーワードなどについてヒットしている文書を検索
するものである。論理式(and、×、or、+など)を採
用することができるようにしている場合が一般的であ
る。特許情報文献の検索の場合、「出願人」、技術用語
などのキーワードや「国際特許分類」といった分類記号
によって絞り込みを行える。
実施形態について説明する。前述の実施形態との相違点
は、通常検索の結果を用いて、概念検索を連続して行え
る点である。なお、概念検索を連続して行う場合、二度
目以後の概念検索は、「類似検索」と定義する。
は、クライアントに対して一覧表示として出力される。
そして、その一覧表示の書誌的事項から、クライアント
が類似検索のための検索用文章を指定すれば、サーバの
リンク機能が検索用文章の入力を代行する。指定された
検索用文章を用いて検索用文章ベクトル作成手段は、検
索用文章ベクトルを作成する。そして、検索対象文書ベ
クトル群とのベクトル演算を行い、ソート結果をクライ
アントへ出力させる。
ザが入力しなければならないが(この様子は図4に示
す)、この実施形態には、その入力を簡略化するリンク
機能を備えている。このリンク機能については、図18
の説明において詳述する。 (図4)図4は、クライアントユーザの操作の一例を示
したものである。まず、ソート結果として一覧表示出力
がなされたとする。ここでは、特許情報文献の書誌的事
項が一覧表示されている。この中で、「D欄」に、「要
約 請求」とあるのは、それぞれが当該特許情報文献に
おける要約書、特許請求の範囲を表しており、ポインタ
によってこれをクリックする。
献情報情報における要約書がクライアントへ画面出力す
る。ここで提供される画面出力は、コピーアンドペース
トが可能であるように提供されている。したがって、ユ
ーザは、出力された要約書における必要な部分を、検索
用文章の入力欄へコピーアンドペーストすることができ
る。
をクリックすれば、コピーアンドペーストしなくても自
動的に検索用文章を入力したとして処理することによ
り、クライアントユーザの操作を省略するようにしても
よい。 (図5)続いて、図5に基づいて、第四の実施形態につ
いて説明する。前述の実施形態との相違点は、検索対象
文書ベクトル作成手段が作成した検索対象文書ベクトル
群の中から所定の検索対象文書ベクトル群を抽出するベ
クトル群抽出手段を備え、そのベクトル群抽出手段は、
通常検索手段の検索結果を用いて検索対象文書ベクトル
群を抽出することとした点である。
トル作成手段の作成した検索対象文書ベクトル群の中か
ら所定の検索対象文書ベクトル群を抽出する。そして、
そのベクトル群抽出手段は、通常検索手段の検索結果を
用いて検索対象文書ベクトル群を抽出する。このように
すると、すべての検索対象ベクトル群を用いてベクトル
演算する場合に比べて、ベクトル演算の数を絞ることが
でき、演算が短時間で行えるというメリットがある。
実施形態について説明する。前述の実施形態との相違点
は、通常検索手段につき、ソート手段に対して検索結果
を用いたソート結果を出力させることとした点である。
すなわち、通常検索手段が検索した検索結果は、ソート
手段がソート結果を出力する際に用いるのである。通常
検索においては一般的な「ヒット数」ということが概念
検索には存在しないが、ソート出力の際に通常検索の検
索結果、すなわちヒット数を用いることができる。
実施形態について説明する。前述の実施形態との相違点
は、検索対象文書ベクトル作成手段について、通常検索
手段の検索結果に対応する検索対象文書群を用いて検索
対象文書ベクトル群を作成することとした点である。す
なわち、通常検索手段が検索した結果は、全検索対象文
書群を絞り込むのに用いる。そこで絞り込まれた検索対
象群を用いて、検索対象文書ベクトルが作成され、ベク
トル演算され、ソート結果が出力される。このため、全
検索対象文書群を用いる場合に比べてベクトル演算の数
を絞ることができ、演算が短時間で行える。
実施形態について説明する。前述の実施形態との相違点
は、ベクトル演算値について設定値を入力可能としてお
き、ベクトル演算手段によって演算されたベクトル演算
値における所定値以上のソート結果を記憶するソート結
果記憶手段を備える点である。更に、通常検索手段は、
ソート結果記憶手段に記憶された所定ベクトル演算値以
上の検索対象文書群を用いて通常検索を行うこととして
いる。
って演算されたベクトル演算値における所定値以上のソ
ート結果を記憶する。そして、通常検索手段は、ソート
結果記憶手段に記憶された所定ベクトル演算値以上の検
索対象文書群を用いてキーワード検索または分類検索を
行う。これにより、概念検索による絞り込み結果に対し
て、キーワード検索または分類検索が行える。
実施形態について説明する。前述の実施形態との相違点
は、予め所定の検索用文章を入力して登録しておく検索
用文章蓄積手段を備えた点である。更に、ベクトル演算
手段は、検索対象文書群が更新または追加されたら、そ
の検索用文章蓄積手段に登録された検索用文章を用いて
ベクトル演算値を演算することとしており、ソート手段
は、更新または追加された検索対象文書群についてソー
ト出力することとしている。
定の検索用文章を入力し、サーバの検索用文章蓄積手段
へ登録しておく。例えば、自分が課題としている研究テ
ーマに関する検索用文章である。検索対象文書群が更新
または追加されたら、ベクトル演算手段は、その検索用
文章蓄積手段に登録された検索用文章を用いてベクトル
演算値を演算する。そして、ソート手段が更新または追
加された検索対象文書群についてソート出力する。
れるが、クライアントユーザは、その追加された検索対
象文書群についての概念検索のソート結果を受け取るこ
とができる。予め指定した検索用文章に対し、クライア
ントユーザはいわゆるSDIサービスを受けることでき
ることとなる。 (図10)続いて、図10に基づいて、第九の実施形態
について説明する。前述の実施形態との相違点は、予め
所定の検索用文章を入力し、その検索用文章を用いて作
成した検索用文章ベクトルを登録しておく検索用文章ベ
クトル蓄積手段を備えた点である。そして、ベクトル演
算手段は、検索対象文書群が更新または追加されたら、
その検索用文章ベクトル蓄積手段に登録された検索用文
章ベクトルを用いてベクトル演算値を演算することと
し、ソート手段は、更新または追加された検索対象文書
群についてクライアントへソート出力することとしてい
る。
定の検索用文章を入力する。すると、検索用文章ベクト
ル作成手段が検索用文章ベクトルを作成し、検索用文章
ベクトル蓄積手段へ登録する。検索対象文書群が更新ま
たは追加されたら、ベクトル演算手段は、その検索用文
章蓄積手段に登録された検索用文章を用いてベクトル演
算値を演算する。そして、ソート手段が更新または追加
された検索対象文書群についてソート出力する。所定の
検索用文章に対する検索用文章ベクトルが予め作成され
ているので、ベクトル演算が早く行えるという利点があ
る。
十の実施形態について説明する。前述の実施形態との相
違点は、ソート手段による出力に基づいて作成した新た
な検索用文章を再入力するための再入力手段をクライア
ントへ提供している点である。検索用文章ベクトル作成
手段は、再入力された検索用文章を用いて新たな検索用
文章ベクトルを作成し、ベクトル演算手段は、その新た
な検索用文章ベクトルを用いて新たなベクトル演算値を
演算し、ソート手段は、その新たなベクトル演算値に基
づいてソートすることとしている。
事項を一覧表示させる一覧表示機能と、当該書誌的事項
の中からクライアントが選択した検索対象文書を呼び出
して、その検索対象文書の一部または全部を、クライア
ントへ出力させるためのリンク機能とを備えるととも
に、前記リンク機能は、検索対象文書の一部または全部
を、コピーアンドペースト可能であるようにクライアン
トへ出力することとしている。 なお、サーバ上におい
て、クリックすれば、コピーアンドペーストしなくても
自動的に検索用文章を入力したとして処理することによ
り、クライアントユーザの操作を省略するようにしても
よい。
出力後、そのソート出力に基づいて作成した新たな検索
用文章を再入力するための再入力手段をクライアントへ
提供する。クライアントユーザは、リンク機能を用いる
などして、新たな検索用文章2を入力する。サーバでは
その新たな検索用文章2によって新たな検索用文章ベク
トルを作成し、ベクトル演算手段は、新たなベクトル演
算値を演算し、ソート手段が新たなベクトル演算値に基
づくソートを行う。連続的な概念検索が可能であり、検
索精度を徐々に高め、欲する情報を入手しやすい環境を
クライアントユーザへ提供している。
十一の実施形態について説明する。前述の実施形態との
相違点は、ステムベクトル作成手段において、三群の辞
書作成用文書群(A,B,C)から三つのステムベクト
ル(A,B,C)を作成することとした点である。ま
た、ベクトル演算手段は、検索対象文書群をステムベク
トルごとにベクトル演算値(A,B,C)を演算し、ソ
ート手段は、各検索対象文書群を、最も高いベクトル演
算値のステムベクトルへ振り分けてソート結果(A,
B,C)を出力させることとしている。
野ごと、または複数の発行時期に対して所定期間ごと、
具体的には、1999年の1年間、1990年代の10
年間、といった期間ごとに作成する。または、辞書作成
用文書群の分類ごと、具体的には、特許公報、公開公
報、実用新案登録公報ごとに作成することとしてもよ
い。
成用文書群、例えば年度ごと、文書種類ごとに当該数の
ステムベクトルを作成する。そして、ベクトル演算手段
が、検索対象文書群をステムベクトルごとにベクトル演
算値を演算し、ソート手段が、各検索対象文書群を、最
も高いベクトル演算値のステムベクトルへ振り分けてソ
ート結果を出力する。検索対象文書群は、複数のステム
ベクトルごとに設けられたカテゴリーのいずれかひとつ
に振り分けられることとなる。ここにおいて、辞書作成
用文書群ごとにソート結果を得ることができる。複数の
ステムベクトルを時代ごとに作成した場合、ソート手段
がそれら複数のステムベクトルに対応させてソート結果
を出力させることとしているので、時代ごとに推移する
言葉、キーワード、用語などに細かく対応した概念検索
が可能となる。
十二の実施形態について説明する。前述の実施形態との
相違点は、検索対象文書ベクトル作成手段について、検
索対象文書群における所定部分ごとに検索対象文書ベク
トル群を作成することとした点である。すなわち、特許
情報において請求項1、要約書という所定部分が存在す
るが、その所定部分ごとに「請求項1ベクトル群」、
「要約書ベクトル群」といった検索対象文書ベクトルを
作成するのである。そして、ベクトル演算手段は、それ
らの検索対象文書ベクトル群を用いてベクトル演算値を
演算し、ソート手段は、所定部分ごとにベクトル演算値
をクライアントへ出力する。ここにおいて、検索対象文
書群における所定部分ごとにソート結果を得ることがで
きる。
開公報aの要約書では、最高スコアとしての80.2を
得たが、請求項1では65.5で、ランク13位、とい
った結果を得ることができる。 (図14)続いて、図14に基づいて、パテントマップ
的な出力の一例を示す概念図である。検索用文章を2種
類入力し、それらによるベクトル演算値をそれぞれ縦軸
と横軸に採用する。そして、2種類のベクトル演算値と
も、所定スコア以上を記録した検索対象文書をプロット
して出力したものである。
と、当該プロットに該当する文書の書誌的事項が画面出
力されるようにしている。更に、図示は省略するが、ク
リックすれば、当該文書の全文が出力されるようにして
いる。 (図15)図15に記載した実施形態は、クライアント
が入力した検索用文章が、検索用文章ベクトル作成手段
に用いる言語と異なる場合に、当該言語を検索用文章ベ
クトル作成手段に用いる言語へ翻訳する翻訳手段を備
え、 検索用文章ベクトル作成手段は、前記翻訳手段に
よって翻訳された翻訳検索用文章を用いて検索用文章ベ
クトルを作成することとした概念検索装置である。
検索用文章が、検索用文章ベクトル作成手段に用いる言
語と異なる場合に、当該言語を検索用文章ベクトル作成
手段に用いる言語へ翻訳する。検索用文章ベクトル作成
手段は、その翻訳検索用文章を用いて検索用文章ベクト
ルを作成する。ここにおいて、検索用文章が他言語であ
っても、翻訳手段が翻訳可能な文章であれば、そのまま
検索に用いることができる。
が入力した検索用文章が、検索用文章ベクトル作成手段
に用いる言語と異なる場合に、当該言語を検索用文章ベ
クトル作成手段に用いる言語へ翻訳する翻訳手順を備
え、 検索用文章ベクトル作成手順においては、前記翻
訳手順によって翻訳された翻訳検索用文章を用いて検索
用文章ベクトルを作成する概念検索方法を提供すること
もできる。
ラムとしては、特許情報文献群からなる辞書作成用文書
群から辞書機能をなすステムベクトルを作成するステム
ベクトル作成手順と、 前記ステムベクトルおよび特許
情報文献群からなる検索対象文書群から検索対象文書ベ
クトル群を作成する検索対象文書ベクトル作成手順と、
クライアントから入力された検索用文章が検索用文章
ベクトル作成手段に用いる言語と異なる場合に、当該言
語を検索用文章ベクトル作成手段に用いる言語へ翻訳す
る翻訳手順と、 翻訳された検索用文章と前記ステムベ
クトルとから検索用文章ベクトルを作成する検索用文章
ベクトル作成手順と、 その検索用文章ベクトルと前記
検索対象文書ベクトル群とのベクトル演算値を演算する
ベクトル演算手順と、 演算されたベクトル演算値の順
に検索対象文書群をソートして、クライアントに係る出
力手段へソート結果を出力するソート手順とを備えたプ
ログラムを提供することもできる。
の検索用文章の入力画面として、サーバからクライアン
トへ提供される画面出力を示している。「検索項目」の
右側には、プルダウン選択メニューとして、検索対象文
書群の選択ボタン(10)を用意している。この検索項目と
は、検索対象文書群たる特許情報書類のうちの一部分を
表している。画面には、「要約」が選択された状態とな
っているが、特許請求の範囲、請求項1、発明の詳細な
説明、あるいはそれらの組合せなどが選択できるように
なっている。
択メニューとして、ソート出力数の選択ボタン(11)を用
意している。この一覧表示数とは、概念検索には「ヒッ
ト数」という考え方がなく、ベクトル演算値として全て
の検索対象文書群がスコア化されるので、出力表示させ
る数を制限するために設けたものである。図16の画面
には、「100」が選択された状態となっているが、こ
れは、ベクトル演算値のスコアが高い順に100件を一
覧表示させるという指示となる。
スが用意されている。これは、検索用文章の入力欄(12)
である。キーワードや分類、論理式などの入力と異な
り、文章を入力する。検索用文章の入力を終えたら、図
16の中央下部付近にある検索開始ボタン(13)をクリッ
クして、概念検索を開始する。
開始ボタン(13)をクリックした結果、サーバが概念検索
を終え、クライアントへその結果を出力した状態であ
る。図中の左上には、ソート出力数の表示欄(20)があ
り、図16でのソート出力数の選択ボタン(11)に対応し
た件数たる「上位100件」を表示している。またその
右隣には、当該100件のうちの最高スコアと最低スコ
アとを表示するスコア範囲表示欄(21)が出力される。ベ
クトル演算としては、内戚を計算するのであるから、最
高点は1.000であるが、点数を見やすくするため
に、100倍して表示することとしている。
る結果が得られなかったと判断する場合には、図17の
下側に用意されている検索対象文書群の選択ボタン(1
0)、ソート出力数の選択ボタン(11)、検索用文章の入力
欄(12)などに対して、再入力をして、検索開始ボタン(1
3)を再クリックする。一方、スコア範囲表示欄(21)を見
て、希望する結果をおおむね得られたと判断した場合に
は、スコア範囲表示欄(21)の右隣にある一覧表示ボタン
(22)をクリックする。すると、図18のような画面出力
が提供される。
章が再現され、どのような検索結果なのかを表示してい
る。一方、下半分には、表示件数100件のうちの一部
が一覧表示(30)として出力されている。一覧表示(30)
は、一行欄にて、1件の出願公開書類における書誌的事
項を示している。一覧表示(30)における左から2番目の
欄は、スコア表示欄(31)となっている。このスコア表示
欄(31)の最上に表示されるスコアは、図17におけるス
コア範囲表示欄(21)のスコアと一致している。
される出願公開書類における「要約」または「特許請求
の範囲」に記載された文章を、そのまま概念検索のため
の検索用文章として採用する「類似検索」をさせるため
のリンクボタン(33)である。このリンクボタン(33)をク
リックすると、図19に示すような出力画面が提供され
る。すなわち、図4に示した「コピーアンドペースト」
の作業をクライアントにて行わずに済むよう、サーバが
提供しているのである。
を備えており、そのリンクボタン(32)をクリックする
と、当該文献の全文を出力させることができる。 (図19)図19は、特許の出願公開書類における要約
によって類似検索を行わせた結果の出力画面の一部を示
しており、その上半分には、検索用文章として採用され
た文章の出所が再現されて表示している。一方、下半分
には、再び表示件数100件のうちの一部が一覧表示(3
0)として出力されている。
左から2番目の欄は、最高スコア表示(34)として10
0.0が出力される。これは、図18の出力画面にて選
択した類似検索において、完全一致する特許出願を選択
してくるのであるから、満点となって当然である。な
お、図19に示した欄の最右欄は、図18と同じリンク
ボタン(32,33)が用意されており、さらなる「類似検
索」が行えるようになっている。
よれば、更新または追加が頻繁に行われる動的な検索対
象文書群であって、且つ一文書当たりの単語数が多い検
索対象文書に対して概念検索を行える装置を提供するこ
とができた。また、請求項29から請求項42に記載の
発明によれば、更新または追加が頻繁に行われる動的な
検索対象文書群であって、且つ一文書当たりの単語数が
多い検索対象文書に対して概念検索を行える方法を提供
することができた。
発明によれば、更新または追加が頻繁に行われる動的な
検索対象文書群であって、且つ一文書当たりの単語数が
多い検索対象文書に対して概念検索を行えるコンピュー
タプログラムを提供することができた。
である。
す概念図である。
として、サーバからクライアントへ提供される画面出力
の一部を示す図である。
示す図である。
似検索を行わせた結果の出力画面の一部を示した図であ
る。
力数の選択ボタン 12 検索用文章の入力欄 13 検索開始
ボタン 20 ソート出力数の表示欄 21 スコア範
囲表示欄 22 一覧表示の要求ボタン 30 一覧表示 31 スコア表
示欄 32 リンクボタン 33 リンクボ
タン 34 最高スコア表示
Claims (46)
- 【請求項1】辞書作成用文書群から辞書機能をなすステ
ムベクトルを作成するステムベクトル作成手段と、 前記ステムベクトルおよび検索対象文書群から検索対象
文書ベクトル群を作成する検索対象文書ベクトル作成手
段と、 クライアントから入力された検索用文章と前記ステムベ
クトルとから検索用文章ベクトルを作成する検索用文章
ベクトル作成手段と、 その検索用文章ベクトルと前記検索対象文書ベクトル群
とのベクトル演算値を演算するベクトル演算手段と、 演算されたベクトル演算値の順に検索対象文書群をソー
トして、クライアントへソート結果を出力するソート手
段とを備え、 辞書作成用文書群および検索対象文書群の少なくとも一
方は、特許情報文献群とした概念検索装置。 - 【請求項2】辞書作成用文書群は、辞書作成用文書群が
なす群の中の一部分とした請求項1記載の概念検索装
置。 - 【請求項3】辞書作成用文書群は、辞書作成用文書群に
おける各々の辞書作成用文書の所定部分とした請求項1
または請求項2記載の概念検索装置。 - 【請求項4】検索対象文書群は、特許情報文献群におけ
る各々の特許出願文献の所定部分とした請求項1から請
求項3のいずれかに記載の概念検索装置。 - 【請求項5】ソート手段は、所定スコアとして予め入力
されたスコアデータを上回る検索対象文書群をクライア
ントへ出力することとした請求項1から請求項4のいず
れかに記載の概念検索装置。 - 【請求項6】ソート手段は、スコアデータを上回る検索
対象文書群のうち、最高スコアおよび最低スコアをクラ
イアントへ出力することとした請求項5記載の概念検索
装置。 - 【請求項7】ソート手段は、所定出力数として予め入力
されたデータ件数の検索対象文書群をクライアントへ出
力することとした請求項1から請求項5のいずれかに記
載の概念検索装置。 - 【請求項8】ソート手段は、出力される検索対象文書群
のうち、最高スコアおよび最低スコアをクライアントへ
出力することとした請求項7記載の概念検索装置。 - 【請求項9】クライアントから通常検索のためのキーワ
ードまたは分類等を入力された場合に、キーワード検索
または分類検索等の通常検索を行って、その検索結果を
クライアントへ出力させるための通常検索手段を備えた
請求項1から請求項8のいずれかに記載の概念検索装
置。 - 【請求項10】通常検索手段は、ソート結果に対してク
ライアントから通常検索のためのキーワードまたは分類
等を入力された場合に、通常検索を行うこととした請求
項9記載の概念検索装置。 - 【請求項11】通常検索手段は、検索結果の書誌的事項
を一覧表示させる一覧表示機能と、 当該一覧表示の中からクライアントが選択した検索対象
文書を呼び出して、その検索対象文書の一部または全部
を、クライアントへ出力させるためのリンク機能とを備
えた請求項9または請求項10のいずれかに記載の概念
検索装置。 - 【請求項12】通常検索手段のリンク機能は、検索対象
文書の一部または全部を、コピーアンドペースト可能で
あるようにクライアントへ出力することとした請求項1
1記載の概念検索装置。 - 【請求項13】通常検索手段は、検索結果の書誌的事項
を一覧表示させる一覧表示機能と、 当該一覧表示の中からクライアントが選択した検索対象
文書の一部または全部を、検索用文章とすることが可能
なリンク機能とを備えた請求項9または請求項10のい
ずれかに記載の概念検索装置。 - 【請求項14】検索対象文書ベクトル作成手段が作成し
た検索対象文書ベクトル群の中から所定の検索対象文書
ベクトル群を抽出するベクトル群抽出手段を備え そのベクトル群抽出手段は、通常検索手段の検索結果を
用いて検索対象文書ベクトル群を抽出することとした請
求項9から請求項13のいずれかに記載の概念検索装
置。 - 【請求項15】通常検索手段は、ソート手段に対して検
索結果を用いたソート結果を出力させることとした請求
項9から請求項13のいずれかに記載の概念検索装置。 - 【請求項16】検索対象文書ベクトル作成手段は、通常
検索手段の検索結果に対応する検索対象文書群を用いて
検索対象文書ベクトル群を作成することとした請求項9
から請求項13のいずれかに記載の概念検索装置。 - 【請求項17】ベクトル演算手段によって演算されたベ
クトル演算値における所定値以上のソート結果を記憶す
るソート結果記憶手段を備え、 通常検索手段は、ソート結果記憶手段に記憶された所定
ベクトル演算値以上の検索対象文書群を用いて通常検索
を行うこととした請求項9から請求項16のいずれかに
記載の概念検索装置。 - 【請求項18】ソート手段は、ソート結果の書誌的事項
を一覧表示させる一覧表示機能と、 当該書誌的事項の中からクライアントが選択した検索対
象文書を呼び出して、その検索対象文書の一部または全
部を、クライアントへ出力させるためのリンク機能とを
備えた請求項1から請求項17のいずれかに記載の概念
検索装置。 - 【請求項19】予め所定の検索用文章を入力して登録し
ておく検索用文章蓄積手段を備え、 ベクトル演算手段は、検索対象文書群が更新または追加
されたら、その検索用文章蓄積手段に登録された検索用
文章を用いてベクトル演算値を演算することとし、 ソート手段は、更新または追加された検索対象文書群に
ついてソート出力することとした請求項1から請求項1
8のいずれかに記載の概念検索装置。 - 【請求項20】予め所定の検索用文章を入力し、その検
索用文章を用いて作成した検索用文章ベクトルを登録し
ておく検索用文章ベクトル蓄積手段を備え、 ベクトル演算手段は、検索対象文書群が更新または追加
されたら、その検索用文章ベクトル蓄積手段に登録され
た検索用文章ベクトルを用いてベクトル演算値を演算す
ることとし、 ソート手段は、更新または追加された検索対象文書群に
ついてソート出力することとした請求項1から請求項1
8のいずれかに記載の概念検索装置。 - 【請求項21】予め入力する検索用文章を複数入力する
とともに、 ソート手段は、それら検索用文章に対応させてソート結
果を出力させることとした請求項19または請求項20
のいずれかに記載の概念検索装置。 - 【請求項22】ソート手段による出力に基づいて作成し
た新たな検索用文章を再入力するための再入力手段をク
ライアントへ提供し、 検索用文章ベクトル作成手段は、再入力された検索用文
章を用いて新たな検索用文章ベクトルを作成し、 ベクトル演算手段は、その新たな検索用文章ベクトルを
用いて新たなベクトル演算値を演算し、 ソート手段は、その新たなベクトル演算値に基づいてソ
ートすることとした請求項1から請求項21のいずれか
に記載の概念検索装置。 - 【請求項23】ソート手段は、ソート結果の書誌的事項
を一覧表示させる一覧表示機能と、 当該書誌的事項の中からクライアントが選択した検索対
象文書を呼び出して、その検索対象文書の一部または全
部を、クライアントへ出力させるためのリンク機能とを
備えるとともに、 前記リンク機能は、検索対象文書の一部または全部を、
コピーアンドペースト可能であるようにクライアントへ
出力することとした請求項22記載の概念検索装置。 - 【請求項24】ソート手段は、ソート結果の書誌的事項
を一覧表示させる一覧表示機能を備え、 再入力手段は、前記一覧表示の中から検索対象文書の一
部または全部を、検索用文章として選択可能することで
入力を代行するリンク機能を備えた請求項22記載の概
念検索装置。 - 【請求項25】ステムベクトル作成手段は、複数の辞書
作成用文書群から当該数のステムベクトルを作成し、 ベクトル演算手段は、検索対象文書群をステムベクトル
ごとにベクトル演算値を演算し、 ソート手段は、各検索対象文書群を、最も高いベクトル
演算値のステムベクトルへ振り分けてソート結果を出力
させることとした請求項1から請求項24のいずれかに
記載の概念検索装置。 - 【請求項26】検索対象文書ベクトル作成手段は、検索
対象文書群における所定部分ごとに検索対象文書ベクト
ル群を作成し、 ベクトル演算手段は、その検索対象文書ベクトル群を用
いてベクトル演算値を演算し、 ソート手段は、所定部分ごとにベクトル演算値をクライ
アントへ出力することとした請求項1から請求項25の
いずれかに記載の概念検索装置。 - 【請求項27】検索対象文書群は、所定母集団の検索対
象文書群とし、 検索用文章ベクトル作成手段は、前記検索対象文書群に
対して複数の検索用文章による複数の検索用文章ベクト
ルを作成し、 ソート手段は、前記検索用文章ベクトルに基づく複数の
座標軸に対するベクトル演算値をプロットしてクライア
ントへ出力することとした請求項1から請求項26のい
ずれかに記載の概念検索装置。 - 【請求項28】ソート手段は、所定のプロットにおける
検索対象文書群の書誌的事項の一部を、クライアントへ
出力可能とした請求項27記載の概念検索装置。 - 【請求項29】辞書作成用文書群から辞書機能をなすス
テムベクトルを作成するステムベクトル作成手順と、 前記ステムベクトルおよび検索対象文書群から検索対象
文書ベクトル群を作成する検索対象文書ベクトル作成手
順と、 クライアントから入力された検索用文章と前記ステムベ
クトルとから検索用文章ベクトルを作成する検索用文章
ベクトル作成手順と、 その検索用文章ベクトルと前記検索対象文書ベクトル群
とのベクトル演算値を演算するベクトル演算手順と、 演算されたベクトル演算値の順に検索対象文書群をソー
トして、クライアントへソート結果を出力するソート手
順とを備え、 辞書作成用文書群および検索対象文書群の少なくとも一
方は、特許情報文献群とした概念検索方法。 - 【請求項30】クライアントから通常検索のためのキー
ワードまたは分類を入力された場合に、キーワード検索
または分類による通常検索を行って、その検索結果をク
ライアントへ出力させるための通常検索手順を備えた請
求項29記載の概念検索方法。 - 【請求項31】通常検索手順には、検索結果の書誌的事
項を一覧表示させる一覧表示手順と、当該書誌的事項の
中からクライアントが選択した検索対象文書を呼び出し
て、その検索対象文書の一部または全部を、クライアン
トへ出力させるためのリンク手順と含むこととした請求
項30記載の概念検索方法。 - 【請求項32】辞書作成用文書群から辞書機能をなすス
テムベクトルを作成するステムベクトル作成手順と、 前記ステムベクトルおよび検索対象文書群から検索対象
文書ベクトル群を作成する検索対象文書ベクトル作成手
順と、 クライアントから通常検索のためのキーワードまたは分
類を入力された場合に、キーワード検索または分類によ
る通常検索を行って、その検索結果の書誌的事項をクラ
イアントへ一覧表示させる通常検索一覧表示手順と、 当該書誌的事項の中からクライアントが選択した検索対
象文書の一部又は全部を、検索用文章とし、その検索用
文章と前記ステムベクトルとから検索用文章ベクトルを
作成する検索用文章ベクトル作成手順と、 その検索用文章ベクトルと前記検索対象文書ベクトル群
とのベクトル演算値を演算するベクトル演算手順と、 演算されたベクトル演算値の順に検索対象文書群をソー
トして、クライアントへソート結果を出力するソート手
順とを備え、 辞書作成用文書群および検索対象文書群の少なくとも一
方は、特許情報文献群とした概念検索方法。 - 【請求項33】ベクトル演算手順によって演算されたベ
クトル演算値における所定値以上のソート結果を記憶す
るソート結果記憶手順を備え、 通常検索手順においては、ソート結果記憶手順において
記憶された所定ベクトル演算値以上の検索対象文書群を
用いてキーワード検索または分類検索を行うこととした
請求項30または請求項32に記載の概念検索方法。 - 【請求項34】ソート手順においては、書誌的事項を一
覧表示するとともに、 当該書誌的事項に対応する検索対象文書の一部又は全部
を出力させることが可能であるように検索対象文書群と
のリンク機能を備えた請求項29から請求項33のいず
れかに記載の概念検索方法。 - 【請求項35】予め所定の検索用文章を入力して登録し
ておく検索用文章蓄積手順を備え、 ベクトル演算手順においては、検索対象文書群が更新ま
たは追加されたら、その検索用文章蓄積手段によって登
録された検索用文章を用いてベクトル演算値を演算する
こととし、 ソート手順においては、更新または追加された検索対象
文書群についてソート出力することとした請求項29か
ら請求項34のいずれかに記載の概念検索方法。 - 【請求項36】予め所定の検索用文章を入力し、その検
索用文章を用いて作成した検索用文章ベクトルを登録し
ておく検索用文章ベクトル蓄積手順を備え、 ベクトル演算手順においては、検索対象文書群が更新ま
たは追加されたら、その検索用文章ベクトル蓄積手順に
よって登録された検索用文章ベクトルを用いてベクトル
演算値を演算することとし、 ソート手順においては、更新または追加された検索対象
文書群についてソート出力することとした請求項29か
ら請求項34のいずれかに記載の概念検索方法。 - 【請求項37】ソート手順による出力に基づいて作成し
た新たな検索用文章を再入力するための再入力手段をク
ライアントへ提供する再入力提供手順を備え、 検索用文章ベクトル作成手順は、再入力された検索用文
章を用いて新たな検索用文章ベクトルを作成し、 ベクトル演算手順においては、その新たな検索用文章ベ
クトルを用いて新たなベクトル演算値を演算し、 ソート手順においては、その新たなベクトル演算値に基
づいてソートすることとした請求項29から請求項36
のいずれかに記載の概念検索方法。 - 【請求項38】ソート手順は、ソート結果の書誌的事項
を一覧表示させる一覧表示手順と、 当該書誌的事項の中からクライアントが選択した検索対
象文書を呼び出して、その検索対象文書の一部または全
部を、クライアントへ出力させるためのリンク手順とを
備えるとともに、 前記リンク手順は、検索対象文書の一部または全部を、
コピーアンドペースト可能であるようにクライアントへ
出力することとした請求項37記載の概念検索方法。 - 【請求項39】ソート結果の書誌的事項を一覧表示させ
る一覧表示手順と、 当該書誌的事項の中からクライアントが選択した検索対
象文書の一部又は全部を、検索対象文章として再入力す
る検索用文章再入力手順とを備え、 検索用文章ベクトル作成手順は、再入力された検索用文
章を用いて新たな検索用文章ベクトルを作成し、 ベクトル演算手順においては、その新たな検索用文章ベ
クトルを用いて新たなベクトル演算値を演算し、 ソート手順においては、その新たなベクトル演算値に基
づいてソートすることとした請求項29から請求項36
のいずれかに記載の概念検索方法。 - 【請求項40】ステムベクトル作成手順において、複数
のステムベクトルを作成し、 ベクトル演算手順においては、検索対象文書群をステム
ベクトルごとにベクトル演算値を演算し、 ソート手順においては、各検索対象文書群を、最も高い
ベクトル演算値のステムベクトルへ振り分けてソート結
果を出力させることとした請求項29から請求項39の
いずれかに記載の概念検索方法。 - 【請求項41】検索対象文書ベクトル作成手順において
は、検索対象文書群における所定部分ごとに検索対象文
書ベクトル群を作成し、 ベクトル演算手順においては、その検索対象文書ベクト
ル群を用いてベクトル演算値を演算し、 ソート手順においては、所定部分ごとにベクトル演算値
をクライアントへ出力することとした請求項29から請
求項40のいずれかに記載の概念検索方法。 - 【請求項42】検索対象文書群は、所定母集団の検索対
象文書群とし、 検索用文章ベクトル作成手順においては、前記検索対象
文書群に対して複数の検索用文章による複数の検索用文
章ベクトルを作成し、 ソート手順においては、前記検索用文章ベクトルに基づ
く複数の座標軸に対するベクトル演算値をプロットして
クライアントへ出力することとした請求項29から請求
項41のいずれかに記載の概念検索方法。 - 【請求項43】プログラムを記録したコンピュータ読み
取り可能な記録媒体であって、 そのプログラムは、辞書作成用文書群から辞書機能をな
すステムベクトルを作成するステムベクトル作成手順
と、 前記ステムベクトルおよび検索対象文書群から検索対象
文書ベクトル群を作成する検索対象文書ベクトル作成手
順と、 クライアントから入力された検索用文章と前記ステムベ
クトルとから検索用文章ベクトルを作成する検索用文章
ベクトル作成手順と、 その検索用文章ベクトルと前記検索対象文書ベクトル群
とのベクトル演算値を演算するベクトル演算手順と、 演算されたベクトル演算値の順に検索対象文書群をソー
トして、クライアントへソート結果を出力するソート手
順とを備え、辞書作成用文書群および検索対象文書群の
少なくとも一方は、特許情報文献群としたプログラムと
したコンピュータ読み取り可能な記録媒体。 - 【請求項44】プログラムを記録したコンピュータ読み
取り可能な記録媒体であって、 そのプログラムは、特許情報文献群からなる辞書作成用
文書群から辞書機能をなすステムベクトルを作成するス
テムベクトル作成手順と、 前記ステムベクトルおよび特許情報文献群からなる検索
対象文書群から検索対象文書ベクトル群を作成する検索
対象文書ベクトル作成手順と、 クライアントから入力された検索用文章と前記ステムベ
クトルとから検索用文章ベクトルを作成する検索用文章
ベクトル作成手順と、 その検索用文章ベクトルと前記検索対象文書ベクトル群
とのベクトル演算値を演算するベクトル演算手順と、 演算されたベクトル演算値の順に検索対象文書群をソー
トして、クライアントへソート結果を出力するソート手
順と、 クライアントから通常検索のためのキーワードまたは分
類を入力された場合に、キーワード検索または分類検索
を行って、その検索結果をクライアントへ出力させるた
めの通常検索手順とを備えたプログラムとしたコンピュ
ータ読み取り可能な記録媒体。 - 【請求項45】プログラムを記録したコンピュータ読み
取り可能な記録媒体であって、 そのプログラムは、特許情報文献群からなる辞書作成用
文書群から辞書機能をなすステムベクトルを作成するス
テムベクトル作成手順と、 前記ステムベクトルおよび
特許情報文献群からなる検索対象文書群から検索対象文
書ベクトル群を作成する検索対象文書ベクトル作成手順
と、 クライアントから入力された検索用文章と前記ス
テムベクトルとから検索用文章ベクトルを作成する検索
用文章ベクトル作成手順と、 その検索用文章ベクトル
と前記検索対象文書ベクトル群とのベクトル演算値を演
算するベクトル演算手順と、 演算されたベクトル演算
値の順に検索対象文書群をソートして、クライアントへ
ソート結果を出力するソート手順と、 そのソート手順
による出力に基づいて作成した新たな検索用文章を再入
力するための再入力手段をクライアントへ提供する再入
力提供手順を備え、 検索用文章ベクトル作成手順は、再入力された検索用文
章を用いて新たな検索用文章ベクトルを作成し、 ベク
トル演算手順においては、その新たな検索用文章ベクト
ルを用いて新たなベクトル演算値を演算し、 ソート手
順においては、その新たなベクトル演算値に基づいてソ
ートするプログラムとしたとしたコンピュータ読み取り
可能な記録媒体。 - 【請求項46】特許情報文献群から辞書機能をなすステ
ムベクトルを作成するステムベクトル作成手順と、 前記ステムベクトルおよび特許情報文献群から検索対象
文書ベクトル群を作成する検索対象文書ベクトル作成手
順と、 クライアントから入力された検索用文章と前記ステムベ
クトルとから検索用文章ベクトルを作成する検索用文章
ベクトル作成手順と、 その検索用文章ベクトルと前記検索対象文書ベクトル群
とのベクトル演算値を演算するベクトル演算手順と、 演算されたベクトル演算値の順に検索対象文書群をソー
トして、クライアントへソート結果を出力するソート手
順とを備えたコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000197027A JP4497337B2 (ja) | 2000-06-29 | 2000-06-29 | 概念検索装置およびコンピュータプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000197027A JP4497337B2 (ja) | 2000-06-29 | 2000-06-29 | 概念検索装置およびコンピュータプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002015001A true JP2002015001A (ja) | 2002-01-18 |
JP4497337B2 JP4497337B2 (ja) | 2010-07-07 |
Family
ID=18695416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000197027A Expired - Lifetime JP4497337B2 (ja) | 2000-06-29 | 2000-06-29 | 概念検索装置およびコンピュータプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4497337B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005066837A1 (ja) * | 2003-12-26 | 2005-07-21 | Matsushita Electric Industrial Co., Ltd. | 辞書作成装置および辞書作成方法 |
US8189304B2 (en) | 2008-12-15 | 2012-05-29 | Hitachi Global Storage Technologies Netherlands B.V. | Magnetoresistive magnetic head having a cpp element using a heusler alloy layer and a high saturation magnetization layer |
JP2012526319A (ja) * | 2009-05-08 | 2012-10-25 | シーピーエー ソフトウェア リミテッド | 電子ドキュメントコレクション内の複数選択ドキュメントを標的調査する方法、システムおよび装置 |
US8818979B2 (en) | 2007-05-17 | 2014-08-26 | Valuenex Consulting Inc. | Document retrieving apparatus and document retrieving method |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH096799A (ja) * | 1995-06-19 | 1997-01-10 | Sharp Corp | 文書分類装置及び文書検索装置 |
-
2000
- 2000-06-29 JP JP2000197027A patent/JP4497337B2/ja not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH096799A (ja) * | 1995-06-19 | 1997-01-10 | Sharp Corp | 文書分類装置及び文書検索装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005066837A1 (ja) * | 2003-12-26 | 2005-07-21 | Matsushita Electric Industrial Co., Ltd. | 辞書作成装置および辞書作成方法 |
US7840565B2 (en) | 2003-12-26 | 2010-11-23 | Panasonic Corporation | Dictionary creation device and dictionary creation method |
US7921113B2 (en) | 2003-12-26 | 2011-04-05 | Panasonic Corporation | Dictionary creation device and dictionary creation method |
US8818979B2 (en) | 2007-05-17 | 2014-08-26 | Valuenex Consulting Inc. | Document retrieving apparatus and document retrieving method |
US8189304B2 (en) | 2008-12-15 | 2012-05-29 | Hitachi Global Storage Technologies Netherlands B.V. | Magnetoresistive magnetic head having a cpp element using a heusler alloy layer and a high saturation magnetization layer |
JP2012526319A (ja) * | 2009-05-08 | 2012-10-25 | シーピーエー ソフトウェア リミテッド | 電子ドキュメントコレクション内の複数選択ドキュメントを標的調査する方法、システムおよび装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4497337B2 (ja) | 2010-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6904429B2 (en) | Information retrieval apparatus and information retrieval method | |
JP3691844B2 (ja) | 文書処理方法 | |
JP3266586B2 (ja) | データ分析システム | |
JPH09101990A (ja) | 情報フィルタリング装置 | |
JP2004318510A (ja) | 対訳情報作成装置、対訳情報作成用プログラム、対訳情報作成方法、対訳情報検索装置、対訳情報検索用プログラム及び対訳情報検索方法 | |
JPH1049543A (ja) | 文書検索装置 | |
Revanth et al. | Nl2sql: Natural language to sql query translator | |
JP4497337B2 (ja) | 概念検索装置およびコンピュータプログラムを記録した記録媒体 | |
JP4057962B2 (ja) | 質問応答装置、質問応答方法及びプログラム | |
JPH1145268A (ja) | 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4428703B2 (ja) | 情報検索方法及びそのシステム並びにコンピュータプログラム | |
JPH1145252A (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4384736B2 (ja) | 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4426893B2 (ja) | 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置 | |
JP2002183195A (ja) | 概念検索方式 | |
JP4138048B2 (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2529418B2 (ja) | 文書検索装置 | |
JP4497338B2 (ja) | 概念検索装置およびコンピュータプログラムを記録した記録媒体 | |
JPH1145256A (ja) | 文書管理支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4493825B2 (ja) | 非テキスト入力に基づく概念検索装置およびコンピュータプログラムを記録した記録媒体 | |
JPH1145254A (ja) | 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH1145249A (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH1145251A (ja) | 検索機能を用いた情報分析支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP3444223B2 (ja) | データベース登録装置 | |
JPH1145255A (ja) | 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100311 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100331 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100407 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4497337 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140423 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |