JP2018005758A - 文献検索装置、文献検索方法およびコンピュータプログラム - Google Patents
文献検索装置、文献検索方法およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2018005758A JP2018005758A JP2016134961A JP2016134961A JP2018005758A JP 2018005758 A JP2018005758 A JP 2018005758A JP 2016134961 A JP2016134961 A JP 2016134961A JP 2016134961 A JP2016134961 A JP 2016134961A JP 2018005758 A JP2018005758 A JP 2018005758A
- Authority
- JP
- Japan
- Prior art keywords
- document
- extracted
- documents
- noise
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 29
- 238000004590 computer program Methods 0.000 title claims description 8
- 239000000284 extract Substances 0.000 claims abstract description 15
- 238000001514 detection method Methods 0.000 claims description 95
- 238000000605 extraction Methods 0.000 claims description 38
- 238000012986 modification Methods 0.000 description 25
- 230000004048 modification Effects 0.000 description 25
- 230000008569 process Effects 0.000 description 18
- 238000004891 communication Methods 0.000 description 8
- 238000013332 literature search Methods 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 239000000470 constituent Substances 0.000 description 3
- 230000012447 hatching Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 238000000546 chi-square test Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012553 document review Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】文献検索装置10は、他の文献との間で引用関係が結ばれうる複数の文献の中から特定の文献を抽出するための条件をユーザ端末16から取得する。文献検索装置10は、文献DB12に格納された複数の文献の中から上記条件を満たす文献を抽出する。文献検索装置10は、抽出された複数の抽出文献のそれぞれと他の文献との引用関係に基づいて、複数の抽出文献に含まれないが複数の抽出文献との関連性が高いと見込まれる漏れ文献と、複数の抽出文献に含まれるが非抽出文献との関連性が高いと見込まれるノイズ文献の少なくとも一方を検出する。文献検索装置10は、漏れ文献またはノイズ文献に関する情報をユーザ端末16へ提供する。
【選択図】図1
Description
実施例の文献検索装置は、検索により抽出された特許群の引用情報および被引用情報に基づいて特許検索におけるノイズと漏れを予測する特徴と、検索により抽出された特許群を母集団とした引用マップを表示する特徴を備える。
特許に関する各種調査において、特許文献を格納したデータベースをユーザが与えた検索条件にて検索し、目的とする特許文献を抽出することがある。ユーザが与えた検索条件(検索式)が適切でない場合、本来抽出されるべき目的の特許文献が十分に抽出されず、すなわち検索の漏れが発生することがある。また、抽出された特許文献に、目的とする特許文献に該当しないノイズの特許文献が含まれることもある。
通常、特許検索結果は、複数の特許文献が表形式で一覧表示されることが多い。実施例の文献検索装置は、検索により抽出された複数の特許文献と他の文献との引用関係を示す引用マップを用いて特許検索結果をユーザへ提示する。引用マップは、検索により抽出された複数の特許文献を示す複数のオブジェクトを、引用関係に基づいて関連づけた態様で配置した画像である。これにより、検索により抽出された複数の特許文献の関係をユーザが直観的に把握できるように支援する。
図7は、文献検索装置10の動作を示すフローチャートである。特許文献を検索すべきユーザは、図4に示した検索画面50に検索条件を入力し、検索実行操作を入力する。ユーザ端末16は、検索画面50に入力された検索条件を含む検索要求を文献検索装置10へ送信する。要求取得部26が、ユーザ端末16から送信された検索要求を受信すると(S10のY)、検索部28は、文献DB12に記憶された複数の特許文献の中から、検索要求に含まれる検索条件を満たす特許文献を検索する(S12)。
上記実施例では、対象文献のオブジェクトを出願人ごとに縦軸(Y軸)の異なる位置に配置したが、変形例として、対象文献のオブジェクトを出願人ごとに奥行き方向(Z軸)の異なる位置に配置してもよい。具体的には、引用マップ生成部40は、第1の対象文献と第2の対象文献間で出願人または著者が異なる場合に、第1の対象文献を示すオブジェクトと、第2の対象文献を示すオブジェクトを、奥行き方向の異なる位置に配置した三次元の引用マップ(三次元グラフとも言える)を生成してもよい。
引用マップ生成部40は、第1の対象文献(すなわち抽出特許、漏れ特許、もしくは抽出特許と引用関係がある他の特許)が、第2の対象文献を原出願とする分割出願であり、または、第1の対象文献が第2の対象文献を基礎出願とする優先権主張出願である場合、第1の対象文献を示すオブジェクトと第2の対象文献を示すオブジェクトを、引用マップにおける奥行き方向(Z軸上)の異なる位置に配置した三次元の引用マップ(三次元グラフとも言える)を生成してもよい。
引用マップ生成部40は、出願人が異なる複数の対象特許を示す複数のオブジェクトを引用マップの異なる縦位置に配置することに代えて、複数のオブジェクトを出願人ごとに異なる態様で配置してもよい。例えば、出願人ごとに異なる色や異なるマークを付加してもよい。また、引用マップ生成部40は、引用マップにおいて引用関係を示す矢印線を、引用種別を示す情報を付加して配置してもよく、各矢印線を引用種別ごとに異なる態様(例えば異なる色や異なる線種)に設定してもよい。引用種別は、引用関係を設定した主体の種類および引用タイミングの種類を含み、具体的には、出願人による引用、審査時の引用、審判時の引用、拒絶理由通知の引用、拒絶査定の引用等を含む。さらにまた、引用マップ生成部40は、各対象文献のオブジェクトの近傍に、各対象文献の引用数(他の対象文献を引用する個数)を示す情報と、各対象文献の被引用数(他の対象文献により引用される個数)を示す情報とを設定してもよい。
既述したように、文献間の引用関係は、出願人または著者により申告されることがあり、これとともに/またはこれに代えて、審査または審判の過程(拒絶理由通知書等)で設定されることがある。実施例では言及していないが、必要文献検出部31、漏れ検出部32およびノイズ検出部34は、出願人または著者により申告された引用関係を除外し、審査および審判の過程で設定された引用関係に基づいて、必要特許、漏れ特許、ノイズ特許を検出してもよい。言い換えれば、出願人または著者により申告された引用関係を、必要特許、漏れ特許、ノイズ特許の検出に反映させず、審査および審判の過程で設定された引用関係のみを必要特許、漏れ特許、ノイズ特許の検出に反映させてもよい。出願人または著者により申告された引用関係は相対的に正確度が低く、審査および審判の過程で設定された引用関係は相対的に正確度が高い。第4変形例によると、必要特許、漏れ特許、ノイズ特許の検出の正確度を高めることができる。
上記実施例では言及していないが、引用マップ生成部40は、出願人または著者により申告された引用関係を除外し、審査および審判の過程で設定された引用関係に基づいて、対象文献を示すオブジェクトを関連づけた引用マップを生成してもよい。言い換えれば、引用マップ生成部40は、出願人または著者により申告された引用関係を反映させず、審査および審判の過程で設定された引用関係のみを反映してオブジェクト間の矢印線を設定してもよい。第5変形例によると、引用マップが示す引用関係の正確度を高め、言い換えれば、内容が実際に類似する文献のつながりを示す引用マップを生成できる。
文献検索装置10は、複数の必要特許に共通する語句を抽出する第1抽出部をさらに備えてもよい。第1抽出部は、所定割合(例えば30%)以上の必要特許(または抽出特許)の文献データが含む共通のキーワード(またはキーフレーズ)を抽出してもよい。検索結果生成部36は、第1抽出部により抽出された語句を、検索条件に加えるべき候補、例えば現在の検索式に対してOR条件で加えるべき語句として検索結果データに含めてもよい。所定割合は、文献情報サービス会社の知見や経験に基づき定められてもよく、情報システム100を用いた実験により適切な値が決定されてもよい。共通のキーワードは、技術分類コード(例えばIPC)であってもよく、特許請求の範囲等に記載された文字列であってもよい。
図4に関連して一部既述したように、要求取得部26により取得される検索条件は複数の検索項目(およびキーワード)を含んでもよい。検索部28は、複数の検索項目のそれぞれを満たす特許文献を抽出するとともに、複数の検索項目の組み合わせを満たす特許文献を抽出してもよい。必要文献検出部31と漏れ検出部32は、上記実施例の構成に加えて、検索項目ごとに抽出された特許文献群を母集団として、その母集団における各文献の引用関係に基づいて、検索項目ごとの必要特許および漏れ特許を検出してもよい。ノイズ検出部34は、上記実施例の構成に加えて、検索項目ごとに抽出された特許文献群を母集団として、その母集団における各文献の引用関係に基づいて、検索項目ごとのノイズ特許を検出してもよい。検索結果提供部38は、上記実施例の構成に加えて、複数の検索項目のそれぞれに対応付けて漏れ特許(必要特許)とノイズ特許の少なくとも一方に関する情報を出力してもよい。
Claims (18)
- ユーザから入力された条件であって、他の文献との間で引用関係が結ばれうる複数の文献の中から特定の文献を抽出するための条件を取得する取得部と、
所定の記憶部に格納された前記複数の文献の中から、前記取得部により取得された条件を満たす文献を複数抽出する検索部と、
前記検索部により抽出された複数の抽出文献のそれぞれと他の文献との引用関係に基づいて、前記複数の抽出文献に含まれないが前記複数の抽出文献との関連性が高いと見込まれる文献である漏れ文献と、前記複数の抽出文献に含まれるが非抽出文献との関連性が高いと見込まれる文献であるノイズ文献の少なくとも一方を検出する検出部と、
前記検出部により検出された漏れ文献またはノイズ文献に関する情報をユーザへ提示する出力部と、
を備えることを特徴とする文献検索装置。 - 前記検出部は、前記複数の抽出文献のうち少なくとも1つを引用する文献であり、かつ、前記複数の抽出文献のうち少なくとも1つにより引用される文献を必要文献として検出する必要文献検出部を含むことを特徴とする請求項1に記載の文献検索装置。
- 前記必要文献検出部により検出された必要文献のうち、前記複数の抽出文献に含まれない必要文献を前記漏れ文献として検出する漏れ検出部をさらに含むことを特徴とする請求項2に記載の文献検索装置。
- 前記必要文献検出部は、ユーザにより指定された引用数以上の抽出文献を引用する文献であり、かつ、ユーザにより指定された被引用数以上の抽出文献により引用される文献を前記必要文献として検出することを特徴とする請求項2または3に記載の文献検索装置。
- 前記取得部は、第1の文献と第2の文献の間に直接的または間接的な引用関係が結ばれる場合の、第1の文献から第2の文献に至るまでの世代数であって、前記必要文献の検出条件となる世代数の指定をユーザから受け付け、
前記必要文献検出部は、ユーザにより指定された世代数の範囲内で前記複数の抽出文献のうち少なくとも1つを直接的または間接的に引用する文献であり、かつ、ユーザにより指定された世代数の範囲内で前記複数の抽出文献のうち少なくとも1つにより直接的または間接的に引用される文献を前記必要文献として検出することを特徴とする請求項2から4のいずれかに記載の文献検索装置。 - 前記出力部は、必要文献が抽出文献に含まれるか否かに関する比率を示す情報をユーザへ提示することを特徴とする請求項2から5のいずれかに記載の文献検索装置。
- 前記出力部は、漏れ文献と必要文献の比率を示す情報をユーザへ提示することを特徴とする請求項2から5のいずれかに記載の文献検索装置。
- 前記検出部は、或る抽出文献が引用する非抽出文献の数が所定数以上であり、および/または、前記或る抽出文献が引用される非抽出文献の数が所定数以上である場合に、前記或る抽出文献を前記ノイズ文献として検出するノイズ検出部を含むことを特徴とする請求項1から7のいずれかに記載の文献検索装置。
- 前記検出部は、或る抽出文献が引用する非抽出文献の数が所定数以上であって引用する抽出文献がなく、かつ、前記或る抽出文献が引用される非抽出文献の数が所定数以上であって引用される抽出文献がない場合に、前記或る抽出文献を前記ノイズ文献として検出するノイズ検出部を含むことを特徴とする請求項1から7のいずれかに記載の文献検索装置。
- 前記ノイズ検出部は、或る抽出文献が引用する非抽出文献の数がユーザにより指定された引用数以上であり、および/または、前記或る抽出文献が引用される非抽出文献の数がユーザにより指定された被引用数以上である場合に、前記或る抽出文献を前記ノイズ文献として検出することを特徴とする請求項8または9に記載の文献検索装置。
- 前記取得部は、第1の文献と第2の文献の間に直接的または間接的な引用関係が結ばれる場合の、第1の文献から第2の文献に至るまでの世代数であって、前記ノイズ文献の検出条件となる世代数の指定をユーザから受け付け、
前記ノイズ検出部は、ユーザにより指定された世代数の範囲内で或る抽出文献が直接的または間接的に引用する非抽出文献の数が所定数以上であり、および/または、ユーザにより指定された世代数の範囲内で前記或る抽出文献が直接的または間接的に引用される非抽出文献の数が所定数以上である場合に、前記或る抽出文献を前記ノイズ文献として検出することを特徴とする請求項8から10のいずれかに記載の文献検索装置。 - 前記出力部は、抽出文献におけるノイズ文献の比率を示す情報をユーザへ提示することを特徴とする請求項1から11のいずれかに記載の文献検索装置。
- 前記複数の抽出文献は産業財産権に関する公報であり、
前記検出部は、各抽出文献と他の文献との引用関係のうち、出願人から申告された引用関係を除外し、審査で設定された引用関係に基づいて、前記漏れ文献と前記ノイズ文献の少なくとも一方を検出することを特徴とする請求項1から12のいずれかに記載の文献検索装置。 - 複数の必要文献に共通する語句を抽出する抽出部をさらに備えることを特徴とする請求項2に記載の文献検索装置。
- 漏れ文献には含まれるが、他の必要文献には含まれない語句を、漏れ文献の特徴語として抽出する抽出部をさらに備えることを特徴とする請求項3に記載の文献検索装置。
- ノイズ文献には含まれるが必要文献には含まれない語句を、ノイズ文献の特徴語として抽出する抽出部をさらに備えることを特徴とする請求項2に記載の文献検索装置。
- ユーザから入力された条件であって、他の文献との間で引用関係が結ばれうる複数の文献の中から特定の文献を抽出するための条件を取得するステップと、
所定の記憶部に格納された前記複数の文献の中から、前記取得するステップで取得された条件を満たす文献を複数抽出するステップと、
前記抽出するステップで抽出された複数の抽出文献のそれぞれと他の文献との引用関係に基づいて、前記複数の抽出文献に含まれないが前記複数の抽出文献との関連性が高いと見込まれる文献である漏れ文献と、前記複数の抽出文献に含まれるが非抽出文献との関連性が高いと見込まれる文献であるノイズ文献の少なくとも一方を検出するステップと、
前記検出するステップで検出された漏れ文献またはノイズ文献に関する情報をユーザへ提示するステップと、
をコンピュータが実行することを特徴とする文献検索方法。 - ユーザから入力された条件であって、他の文献との間で引用関係が結ばれうる複数の文献の中から特定の文献を抽出するための条件を取得する機能と、
所定の記憶部に格納された前記複数の文献の中から、前記取得する機能により取得された条件を満たす文献を複数抽出する機能と、
前記抽出する機能により抽出された複数の抽出文献のそれぞれと他の文献との引用関係に基づいて、前記複数の抽出文献に含まれないが前記複数の抽出文献との関連性が高いと見込まれる文献である漏れ文献と、前記複数の抽出文献に含まれるが非抽出文献との関連性が高いと見込まれる文献であるノイズ文献の少なくとも一方を検出する機能と、
前記検出する機能により検出された漏れ文献またはノイズ文献に関する情報をユーザへ提示する機能と、
をコンピュータに実現させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016134961A JP6707410B2 (ja) | 2016-07-07 | 2016-07-07 | 文献検索装置、文献検索方法およびコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016134961A JP6707410B2 (ja) | 2016-07-07 | 2016-07-07 | 文献検索装置、文献検索方法およびコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018005758A true JP2018005758A (ja) | 2018-01-11 |
JP6707410B2 JP6707410B2 (ja) | 2020-06-10 |
Family
ID=60949273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016134961A Active JP6707410B2 (ja) | 2016-07-07 | 2016-07-07 | 文献検索装置、文献検索方法およびコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6707410B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114780671A (zh) * | 2022-03-14 | 2022-07-22 | 珠海横琴濠麦科技有限公司 | 一种专利引用关系的显示方法、计算机装置、计算机可读存储介质 |
-
2016
- 2016-07-07 JP JP2016134961A patent/JP6707410B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114780671A (zh) * | 2022-03-14 | 2022-07-22 | 珠海横琴濠麦科技有限公司 | 一种专利引用关系的显示方法、计算机装置、计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6707410B2 (ja) | 2020-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10169337B2 (en) | Converting data into natural language form | |
US8145617B1 (en) | Generation of document snippets based on queries and search results | |
CN109074383B (zh) | 文档背景内可视化的文档搜索 | |
CN107122400B (zh) | 使用视觉提示细化查询结果的方法、计算系统及存储介质 | |
AU2010328181B2 (en) | Resource search operations | |
KR20160124079A (ko) | 인-메모리 데이터베이스 탐색을 위한 시스템 및 방법 | |
JP5185402B2 (ja) | 文書検索装置、文書検索方法、及び文書検索プログラム | |
US11379536B2 (en) | Classification device, classification method, generation method, classification program, and generation program | |
US10936667B2 (en) | Indication of search result | |
US20140181099A1 (en) | User management of electronic documents | |
US20230205796A1 (en) | Method and system for document retrieval and exploration augmented by knowledge graphs | |
US8700624B1 (en) | Collaborative search apps platform for web search | |
JP2024091709A (ja) | 文作成装置、文作成方法および文作成プログラム | |
JP2010123036A (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
US9886497B2 (en) | Indexing presentation slides | |
JP6707410B2 (ja) | 文献検索装置、文献検索方法およびコンピュータプログラム | |
JP2018005759A (ja) | 引用マップ生成装置、引用マップ生成方法およびコンピュータプログラム | |
JP2010272006A (ja) | 関係抽出装置、関係抽出方法、及びプログラム | |
JP6727097B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2020091607A (ja) | 検索システム、及び検索方法 | |
JP6534454B2 (ja) | 情報検索方法及び情報検索装置並びに情報検索システム | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
JP6153262B2 (ja) | 対象文章を象徴する簡易文を推定するプログラム、装置及びサーバ | |
JP5826148B2 (ja) | 図面管理サーバ及びこれを用いた図面管理システム | |
US9420052B2 (en) | Web navigation using web navigation pattern histories |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190408 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200407 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200519 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200520 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6707410 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |