JP5347878B2 - 文献間関係解析装置、該プログラム、及び該方法 - Google Patents
文献間関係解析装置、該プログラム、及び該方法 Download PDFInfo
- Publication number
- JP5347878B2 JP5347878B2 JP2009225367A JP2009225367A JP5347878B2 JP 5347878 B2 JP5347878 B2 JP 5347878B2 JP 2009225367 A JP2009225367 A JP 2009225367A JP 2009225367 A JP2009225367 A JP 2009225367A JP 5347878 B2 JP5347878 B2 JP 5347878B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- task
- cited
- citation
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 92
- 238000004458 analytical method Methods 0.000 title claims description 21
- 230000007704 transition Effects 0.000 claims abstract description 107
- 230000008569 process Effects 0.000 claims description 57
- 238000012545 processing Methods 0.000 claims description 35
- 230000010354 integration Effects 0.000 claims description 20
- 239000000284 extract Substances 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 description 21
- 238000005516 engineering process Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000002457 bidirectional effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 239000013585 weight reducing agent Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本明細書は、文献間の関係の解析技術に関する。
技術文書検索装置は、特許文献や技術論文などの技術文書を検索することができるものである。このような技術文書検索装置の一例に、検索部と、技術要素に対応付けた技術文書及びキーワードの情報を含む技術マップが記憶された技術マップ記憶部と、技術文書間の類似度を判定する文書類似度判定部とを有するものがある(例えば、特許文献1)。この技術文書検索装置において、文書類似度判定部が検索部によって検索された技術文書と技術マップに含まれる技術文書との類似度を判定し、その判定された類似度に基づいて、検索された技術文書を技術マップの技術要素に分類することができる。これにより、技術マップの情報を用いて、検索結果を適切に分類したり絞り込むことができる。
また、技術文書の課題記述部と効果記述部を解析して技術動向予測に役立つ情報を提供することができる技術動向予測支援装置がある。このような技術動向予測支援装置の一例として次のようなものがある。まず、技術文書から課題記述部と効果記述部を抽出し、課題記述部と効果記述部から技術が実現する事柄を表す技術表現を抽出する。その抽出した技術表現が表す事柄がビジネスに与える影響度を判定する。それから、抽出した技術表現に命名して、技術マップを作成する(例えば、特許文献2)。これにより作成される技術マップは、技術の実現にかかる時間とビジネスに与える影響度に関する軸をもち、抽出された技術表現の名称が該当する座標上に表示される。
引用関係が連鎖した所定の文献の集合において、文献の属する課題間において課題の推移を解析したい場合がある。
そこで、ある文献の集合において、引用関係に基づいて、文献の属する課題間の課題の推移を明確にすることができる文献間関係解析装置を提供する。
そこで、ある文献の集合において、引用関係に基づいて、文献の属する課題間の課題の推移を明確にすることができる文献間関係解析装置を提供する。
文献間関係解析装置は、解析の対象とする文献の文献データを取得し、該文献データに記載されている引用文献を抽出し、該文献と抽出した引用文献とを関係付けた引用関係情報を生成し記憶部に格納する引用関係情報生成手段と、前記取得した解析の対象とする文献の文献データに記載されている課題を抽出し、該文献と課題とを対応付けて記憶部に格納する課題情報抽出手段と、前記記憶部に格納した引用関係情報に基づいて、文献と該文献の引用文献、さらに該引用文献と該引用文献の引用文献、と連鎖する引用関係を求めて、求めた引用関係から、前記文献毎に、文献と該文献の引用関係に含まれる他の文献を引用連鎖文献集合として記憶部に格納する引用連鎖文献集合生成手段と、前記引用連鎖文献集合及び前記記憶部に格納した各文献と課題との対応に基づいて、同一の引用連鎖文献集合に属せず、且つ、同一の課題に対応付けられている文献同士を同じ課題グループに統合する課題グループ統合手段と、前記課題グループに属する文献と他の課題グループに属する文献との間の引用関係に基づいて、各課題グループ間の課題の推移情報を設定する課題推移情報設定手段と、前記設定した課題の推移情報に基づいて、前記課題グループ間の課題の推移を出力する出力手段と、を備える。
文献間関係解析装置によれば、ある文献の集合において、引用関係に基づいて、文献の属する課題間の課題の推移を明確にすることができる。
本発明の一実施形態として、技術文献の一例である特許文献間の課題の推移を取り出して表示することを説明する。
特許分析では課題に注目した分析が有用である。引用情報を利用することで、「引用されている特許の課題」を解決した結果、「引用している特許の課題」が出てくるという個々の課題の推移を取り出すことが出来る。そこで、例えば、図1を用いて説明する特許情報構築装置が考えられる。
特許分析では課題に注目した分析が有用である。引用情報を利用することで、「引用されている特許の課題」を解決した結果、「引用している特許の課題」が出てくるという個々の課題の推移を取り出すことが出来る。そこで、例えば、図1を用いて説明する特許情報構築装置が考えられる。
図1は、特許情報構築装置による、ある特許文献集合における特定の課題をユーザが指定し、その課題に関する課題間の関係を表示した例を示す。まず、特許文献の明細書テキストデータから、特許文献の課題語、引用関係、引用している特許文献の内容説明および未解決課題を抽出する。その抽出した情報を特許文献に対応付けて課題関係性データベースに蓄積する。課題関係性データベースを利用して、特許文献の課題語から特許文献を絞り込む。絞り込んだ特許文献の内容説明についてクラスタリングを行い、最上位クラスタの内容説明に未解決課題を対応付ける。その対応付けにより、特許文献の課題と、課題から発生した未解決課題の関係性を明確にすることができる。図1は、その対応付けの結果を視覚的に表示装置に表示した一例である。
図1の例では、ユーザが指定した課題「分類精度」1に対し、「辞書」2的なアプローチを行うと、「辞書作成コスト」4と「辞書メンテコスト」5という未解決課題があることが視覚的に明確に示されている。同様に、ユーザが指定した課題「分類精度」1に対し、「機械学習」3的なアプローチを行うと、「正解データ作成コスト」6と「モデル可読性」7という未解決課題があることが視覚的に明確に示されている。
ところが、この例では、特許文献集合全体を見渡した課題のまとめ上げを行っていないため、課題の時系列的な流れが保存されるとは限らず、適切な課題の推移が得られない場合がある。したがって、その特許文献集合における課題の推移を確認したい場合には、この技術だけでは課題の時系列的な流れが必ずしも保存されないため、十分ではない。そのため、課題を適切な粒度にまとめる必要がある。
一方、特許文献間における課題の推移を確認したい場合、単に課題でグルーピングするだけでは、的確な(すなわち、引用に基づく課題の時系列的な前後関係が保存されるような)課題の推移とならない。本来は図2に示すような出力態様で、特許文献間における課題の推移が認識できることが望ましい。
図2は、特許文献間における課題の推移関係を示す図である。図2において、アルファベットを円形で囲んだ図形は、特許文献を示す。図2では、A〜Jで示される特許文献が存在する。四角形で表された図形11〜16は、四角形にある特許文献の課題を示す。
図2では、特許文献A,Bの課題は「耐久性」11に関する課題である。特許文献C,Dの課題は「小型化」12に関する課題である。特許文献E,F,Jの課題は「耐久性」13に関する課題である。特許文献Gの課題は「自律性」14に関する課題である。特許文献Hの課題は「コスト」15に関する課題である。特許文献Iの課題は「軽量化」16に関する課題である。
実線の矢印は、特許文献間の引用関係を表し、矢印の始点側にある特許文献において、矢印の終点側にある特許文献が引用されていることを示す。例えば、特許文献C,Eとの関係(C←E)を言えば、特許文献Eは、特許文献Cを引用している。また、例えば、特許文献A,Cとの関係(A←C)を言えば、特許文献Cは、特許文献Aを引用している。
破線の矢印は、特許文献間の課題の推移を表し、矢印の始点側にある特許文献の課題から矢印の終点側にある特許文献の課題へと推移している。例えば、特許文献A,C,Eのラインでは課題が「耐久性」11から「小型化」12へ、「小型化」12から「耐久性」13へ推移している。
このように、図2では、例えば、単なる「耐久性」11に関する課題と、「小型化」12を前提条件とした「耐久性」13に関する課題がきちんと分けられている。すなわち、特許文献Eは特許文献Cを引用している場合(C←E)、特許文献Cの課題は特許文献Eの課題の前提条件であると考えられる。しかしながら、単に課題でグルーピングするだけだと、図3のようになる。
図3は、図2で示す特許文献間の関係を単に課題でグルーピングした場合の課題間の関係を示す図である。図2と異なり、図3では、単なる「耐久性」11と、「小型化」12を前提条件とした「耐久性」13とが一緒になってしまう。このようになるのは、課題をまとめる際に引用関係にある特許文献間の時系列順を考慮していないためである。
もう1つの問題として、課題の時系列的な流れが読み取り難いことが挙げられる。例えば、特許文献Aから特許文献Cへの課題の推移と、特許文献Cから特許文献Eへの課題の推移とにより、「耐久性」(11&13)と「小型化」12との間の課題の推移が双方向となってしまう。この問題も、課題をまとめる際に引用関係にある特許文献の時系列順を考慮していないためである。そこで、図4に示すように、引用関係にある特許文献の時系列順を考慮してまとめることが考えられる。
図4は、引用関係に無い特許文献の属する課題同士をグループ化した場合の課題間の関係を示す図である。図4は、図2で説明した特許文献のうち、特許文献A〜Fに着目したものである。特許文献Eが特許文献Cを引用している場合(C←E)、特許文献Cの課題は特許文献Eの課題の前提条件を表すと考えられる。
そこで、ある特許文献において引用されている特許文献を順次遡って、引用されている先願の特許文献を累積的に取得し、さらに、ある特許文献を引用している特許文献を順次辿って、引用している後願の特許文献を累積的に取得する。それから、特許文献Qにおいて、特許文献Pが引用されている場合(引用関係:P←Q←R)、引用されている先願の特許文献Pと、このPを引用している特許文献Qとを同じまとまりに含めないという制約を付けて課題をまとめるようにする。また、特許文献Qと、このQを引用している後願の特許文献Rとを同じまとまりに含めないという制約を付けて課題をまとめるようにする。これにより、「引用している−引用されている」関係を反映するように課題をまとめることができる。
一方で、前提条件が異なる課題をすべて分けると、図5に示すように、課題がバラバラになり過ぎてしまう。図5では、特許文献Jの「耐久性」13bと特許文献E,Fの「耐久性」13aが別々になっている。課題「耐久性」13aに属する特許文献Jと課題「耐久性」13bに属する特許文献E,Fとは引用関係にはなく、必ずしも分ける必要は無い。
そこで、図6に示すように、ある課題の前提条件となる課題が異なっている場合であって、そのある課題に含まれる特許文献間に引用関係が無い場合は、同じ課題については分けないで、グループ化を行うようにする。すなわち、文献間の引用関係から連鎖的な引用関係を求め、同一の連鎖上になく同一課題である文献同士を同じグループにまとめ、各課題グループの文献間の引用関係に基づいて、各課題グループ間の課題の推移を求めるようにする。それでは、以下に本実施の形態について詳述する。
図7は、本実施形態における特許情報構築システム20の構成概念を示す。特許情報構築システム20は、特許情報構築装置21、特許データベース(以下、特許DBという)30、表示部29を含んでいる。
特許DB30は、例えば、独立行政法人工業所有権情報・研修館により提供されている、特許庁保有の工業所有権情報データや、民間の事業者により提供されている特許情報サービスなどを利用することができる。
特許情報構築装置21は、特許情報受付部22、課題推移管理部23、描画部27、記憶部28を含んでいる。課題推移管理部23は、先願後願特許文献集合管理部24、課題グループ管理部25、課題グループ推移管理部26を含む。これらの構成要素については、以下にて詳述する。表示部29は、例えばディスプレイ等の出力装置であるがこれに限定されない。例えば、出力装置であれば、プリンタ等の出力装置または記録装置等であってもよい。
図8は、本実施形態における特許情報構築装置21により行われる、与えられた特許文献集合に含まれる課題グループ(同じ課題を持つ特許文献の部分集合)と、その課題グループ間の推移関係を求める全体の処理フローを示す。図9〜図13は、図8の各処理の詳細なフローを示す。
まず、特許情報受付部21は、特許DB30から複数の特許文献Qの書誌的事項データ及び明細書テキストデータを含む特許文献データを取得する。特許情報受付部21は、その取得した各特許文献Qの明細書のテキストデータ(以下、明細書データという)から、特許文献Qが引用している特許文献Pを抽出する。それから、特許情報受付部21は、その抽出した特許文献Pからこの特許文献Pを引用している特許文献Qが検索できるように、引用関係にある特許文献Pを特定する情報と特許文献Qを特定する情報とを対応付けて記憶部28に登録する(S1)。ここで、特許文献を特定する情報とは、その特許文献の出願公開番号、出願番号等をいう。以下では、単に特許文献X(X=P,Q,・・・等)で特許文献を表す場合、出願公開番号、出願番号等のその特許文献Xを特定する情報で示しているものとする。S1の処理の一例としては先行技術文献の欄に記載した非特許文献1にその方法があるが、その処理について図9を用いて説明する。
まず、特許情報受付部21は、上述したように、特許DB30から複数の特許文献Qの書誌的事項データ及び明細書データを含む特許文献データを取得する(S1−1)。特許情報受付部21は、その取得した特許文献Qのいずれかの明細書データを読み込む(S1−2)。
次に特許情報受付部21は、読み込んだ特許文献Qの明細書データから、その特許文献Qにおいて引用されている特許文献Pの名称や所在等を抽出する(S1−3)。すなわち、特許情報受付部21は、特許文献Qの明細書データから、その特許文献Qの明細書データで開示されている発明に関連する文献公知発明が開示されている特許文献の所在を示す情報を探し出す。例えば、特許情報受付部21は、特許文献Qの明細書データの、見出し[特許文献○]が付されている部位、又は、見出し[従来の技術]若しくは[背景技術]が付されている文章ブロックから『特開平YY-XXXXX号公報』などの特許文献の番号を探し出す。
そして、特許情報受付部21は、特許文献Qの明細書データにおいて引用されている特許文献Pと、特許文献Pを引用している特許文献Qとを対応付けて、図14に示す引用関係テーブル41に格納する(S1−4)。引用関係テーブル41は、記憶部28に格納されている。
次に、特許情報受付部21は、特許文献Qの明細書データから課題を抽出する(S1−5)。この処理の例としては、キーワードやキーフレーズ(例えば、「Xが向上する」など)に注目し、「X」を課題として抽出する手法がある。また、任意に決定した課題となる語(例えば、「コスト」、「精度」など)を収集した課題語辞書を作成し、辞書中の課題語を課題として抽出する手法もある。さらには、予め定めたルールを用いて課題語を抽出する手法もある。例えば、明細書データから抽出した文節間の係り受けの関係『XX−YY』をキーとして検索し、「安定性が−向上する」が検索結果として得られたときには、「安定性」を課題語として抽出するような手法である。
これらの課題語の抽出手法は、特許文献の明細書データの見出し[発明が解決しようとする課題]が付されている文章ブロックから優先的に抽出するなどの手法を併用することもある。なお、本明細書において、文章ブロックとは、ある見出しに属する文章や段落のまとまりを意味するものとする。
さらに、キーワードや課題語を用いて検索した課題語の検索結果を分類体系に従って分類する手法も知られており、明細書データの見出し[従来の技術]などが付されている文章ブロックに記載されている課題語のみを利用して分類する手法もある。
また課題語を、言い回しや、IPC分類等の分類定義などを用いて抽出し、分類を行う手法や、特許文献データを課題語に基づいてリンク付けする手法などもある。
さらに、抽出した課題語を用いた特許DBからの検索結果を、例えば、検索した課題語と検索件数とを時系列に並べる等して分類することで、それらの課題の件数の増減や、課題の変化を調査するという手法もある。
さらに、抽出した課題語を用いた特許DBからの検索結果を、例えば、検索した課題語と検索件数とを時系列に並べる等して分類することで、それらの課題の件数の増減や、課題の変化を調査するという手法もある。
次に、特許情報受付部21は、その特許文献Qの書誌的事項データより出願日を取得する(S1−6)。
特許情報受付部21は、その抽出した課題と出願日とをその特許文献Qと関係付けて、図15に示す特許文献情報テーブル40に格納する。特許文献情報テーブル40は、記憶部28に格納されている。
特許情報受付部21は、その抽出した課題と出願日とをその特許文献Qと関係付けて、図15に示す特許文献情報テーブル40に格納する。特許文献情報テーブル40は、記憶部28に格納されている。
特許情報受付部21は、S1−1で取得した全ての特許文献QについてS1−2〜S1−7の処理を行う。S1−1で取得した全ての特許文献QについてS1−2〜S1−7の処理が行われた場合(S1−8で「Yes」)、S1の処理は終了する。
なお、ある特許文献と、そのある特許文献において引用されている特許文献の発明者が同一の場合には、それらの特許文献は密接に関連しており、さらに、それらの出願日がかなり近ければ特に密接していると考えられる。そのような場合には、それらの特許文献を1つとして取り扱ってもよい。具体的には、一方の特許文献を特許文献集合Sから除外するようにしてもよい。
次に、先願後願特許文献集合管理部24は、S1において処理された任意の特許文献集合Sに含まれる各特許文献Pについて、引用関係に基づく先願特許文献集合及び後願特許文献集合を求める(S2)。S2の処理について、図10を用いて説明する。
先願後願特許文献集合管理部24は、特許文献Pnが引用している特許文献Pn-1を芋づる式に辿り、辿りついた各特許文献Pn-iを特許文献Pnの先願特許文献集合に加える(S2−1)。これについて、図14、図16を用いて説明する。なお、nは任意の整数、i=1,2,3,・・・,n−1であり、PnはS1において処理された任意の特許文献集合Sに含まれる各特許文献である。
先願後願特許文献集合管理部24は、特許文献集合Sに含まれる各特許文献A−Jを特許文献Pとして次のように、順に処理を行う。まず、特許文献Aについて説明する。図14の引用関係テーブル41において、特許文献Aは[引用している特許文献]にはないから、図16(a)の先願特許文献集合テーブル42に示すように、特許文献Aに対する先願特許文献集合に格納される特許文献はない。特許文献Bについても同様に、特許文献Bに対する先願特許文献集合には特許文献が存在しない。なお、先願特許文献集合テーブル42は、記憶部28に格納されている。
次に、特許文献Cについて説明する。図14の引用関係テーブル41において、特許文献Cは[引用している特許文献]にあり、その特許文献Cに対応する[引用されている特許文献]として特許文献Aがある。この場合、図16(a)の先願特許文献集合テーブル42に示すように、特許文献Cに対する先願特許文献集合に特許文献Aを追加する。上述の通り、特許文献Aは、[引用している特許文献]にはないから、特許文献Cに関するS2−1の処理は終了する。
次に、特許文献Dについて説明する。図14の引用関係テーブル41において、特許文献Dは[引用している特許文献]にあり、その特許文献Dに対応する[引用されている特許文献]として特許文献A,Bがある。この場合、図16(a)の先願特許文献集合テーブル42に示すように、特許文献Dに対する先願特許文献集合に、特許文献A,Bを追加する。上述の通り、特許文献A,Bは、[引用している特許文献]にはなく、特許文献A,Bそれぞれに対応する[引用されている特許文献]が存在しない。よって、特許文献Dに関するS2−1の処理は終了する。
次に、特許文献Eについて説明する。図14の引用関係テーブル41において、特許文献Eは[引用している特許文献]にあり、その特許文献Eに対応する[引用されている特許文献]として特許文献Cが存在する。この場合、図16(a)の先願特許文献集合テーブル42に示すように、特許文献Eに対する先願特許文献集合に、特許文献Cを追加する。上述の通り、特許文献Cは、[引用している特許文献]にあり、特許文献Cに対応する[引用されている特許文献]は特許文献Aである。よって、図16(a)の先願特許文献集合テーブル42に示すように、特許文献Eに対する先願特許文献集合に、特許文献Aを追加する。上述の通り、特許文献Aは、[引用している特許文献]にはなく、特許文献Aに対応する[引用されている特許文献]が存在しないから、特許文献Eに関するS2−1の処理は終了する。
以降、同様に、先願後願特許文献集合管理部24は、各特許文献F−Jについて、引用されている特許文献を芋づる式に辿り、辿りついた各特許文献を自身の先願特許文献集合に加える処理を行う。
S2−1の処理は要するに、ある特許文献に注目した場合に、その注目した特許文献を要素とする引例関係の連鎖によるルートにおいて、その注目した特許文献の先願となる全ての特許文献を、その注目した特許文献についての先願特許文献集合とするものである。例えば、図2において特許文献Fに注目した場合、特許文献Fを要素とする引例関係の連鎖によるルートは、ルートADFHと、ルートBDFHとである。この場合、特許文献Fの先願である特許文献は特許文献A,B,Dであるから、特許文献Fの先願特許文献集合はA,B,Dとなる。
次に、先願後願特許文献集合管理部24は、特許文献Pnを引用している特許文献Pn+1(=Q)を芋づる式に辿り、辿りついた各特許文献Pn+iを特許文献Pnの後願特許文献集合に加える(S2−2)。これについて、図14、図16を用いて説明する。
先願後願特許文献集合管理部24は、特許文献集合Sに含まれる各特許文献A−Iを特許文献Pとして次のように、順に処理を行う。まず、特許文献Aについて説明する。図14の引用関係テーブル41において、特許文献Aは[引用されている特許文献]にあり、[引用されている特許文献]Aに対応する[引用している特許文献]はC,D,Iである。よって、図16(b)の後願特許文献集合テーブル43に示すように、特許文献Aに対する後願特許文献集合に、特許文献C,D,Iを追加する。また、[引用されている特許文献]Cに対応する[引用している特許文献]は特許文献Eである。[引用されている特許文献]Dに対応する[引用している特許文献]は特許文献F,Gである。[引用されている特許文献]Iに対応する[引用している特許文献]は特許文献Jである。よって、図16(b)の後願特許文献集合テーブル43に示すように、特許文献Aに対する後願特許文献集合に、E,F,G,Jを追加する。また、[引用されている特許文献]E,G,Jに対応する[引用している特許文献]はなく、[引用されている特許文献]Fに対応する[引用している特許文献]は特許文献Hであり、特許文献Fに対応する[引用している特許文献]は特許文献Hである。よって、図16(b)の後願特許文献集合テーブル43に示すように、特許文献Aに対する後願特許文献集合に、特許文献Hを追加する。[引用されている特許文献]にHはない。なお、追加しようとしている特許文献が既に集合に含まれている場合には1つにまとめられる。これにより、特許文献Aに関するS2−2の処理は終了する。なお、後願特許文献集合テーブル43は、記憶部28に格納されている。
以降、同様に、先願後願特許文献集合管理部24は、各特許文献B−Jについて、自身を引用している特許文献を芋づる式に辿り、辿りついた各特許文献を自身の後願特許文献集合に加える処理(S2−2)を行う。
S2−2の処理は要するに、ある特許文献に注目した場合に、その注目した特許文献を要素とする引例関係の連鎖によるルートにおいて、その注目した特許文献の後願となる全ての特許文献を、その注目した特許文献についての後願特許文献集合とするものである。例えば、図2において特許文献Dに注目した場合、特許文献Fを要素とする引例関係の連鎖によるルートは、ルートADFHと、ルートADG、ルートBDFH、ルートBDGである。この場合、特許文献Dの後願である特許文献は特許文献F,G,Hであるから、特許文献Fの先願特許文献集合はF,G,Hとなる。
次に、課題グループ管理部25は、特許文献集合Sに含まれる特許文献P毎に課題グループを作成する(S3)。すなわち、1つの特許文献について1つの課題グループが形成される。ここでは、課題グループ管理部25は、特許文献情報テーブル40から、特許文献の特定情報と、その特許文献の特定情報に対応する課題を取得する。課題グループ管理部25は、その取得した特許文献の特定情報と、その課題とをそれぞれ、図17に示す作業用の課題グループテーブル50の「特許文献」、「課題グループ」に格納する。課題グループテーブル50は、記憶部28に格納されている。
次に、課題グループ管理部25は、課題グループをまとめる(S4)。S4の処理について、図11を用いて説明する。まず、課題グループ管理部25は、特許文献集合Sに「処理済み」としてマーキングされていない特許文献があるかを判断する(S4−1)。S4の処理が初めての場合には、特許文献集合Sに含まれる特許文献については「処理済み」のマーキングはされていない。なお、以下では、特許文献集合Sに含まれる任意の特許文献をP及びP’で表す。
課題グループ管理部25は、特許文献集合Sにおける「処理済み」のマーキングがされていない特許文献Pについて、特許文献Pと関連度が最も大きい特許文献P’を見つける(S4−2)。なお、後述するように、特許文献Pに対する特許文献P’の関連度をvalue_diff(P’,P)により表す。S4−2の処理については、図12を用いて詳述する。
課題グループ管理部25は、特許文献集合Sに含まれる特許文献のうち、特許文献Pと、各特許文献P’との関連度を取得するために、順に次の処理を行う。まず、変数max_valueが0で初期化される。カウンタ変数aが1で初期化され、特許文献集合Sに含まれる特許文献数が変数bに格納される(S4−2−1)。
次に、a≦bか判定する(S4−2−2)。a≦bの場合(S4−2−2で「Yes」)、特許文献集合Sのa番目の特許文献をP’とする。特許文献P’は「処理済み」のマーキングがされているか、あるいはP’=Pであるかが判定される(S4−2−3)。
特許文献P’が「処理済み」のマーキングがされている、あるいはP’=Pである場合(S4−2−3で「Yes」)、aをインクリメントして次の特許文献P’を選択し(S4−2−11)、S4−2−2へ戻る。
それ以外の場合(S4−2−3で「No」)、図17の課題グループテーブル50に基づいて、特許文献P’が特許文献Pと同じ課題に属するか否かが判断される(S4−2−4)。特許文献P’が特許文献Pと同じ課題に属しない場合(S4−2−4で「No」)、aをインクリメントして次の特許文献P’を選択し(S4−2−11)、S4−2−2へ戻る。
特許文献P’が特許文献Pと同じ課題に属する場合(S4−2−4で「Yes」)、先願特許文献集合テーブル42または後願特許文献集合テーブル43に基づいて、特許文献P’が特許文献Pの先願特許文献集合か後願特許文献集合のいずれかに属するかが判断される(S4−2−5)。特許文献P’が特許文献Pの先願特許文献集合か後願特許文献集合のいずれかに属する場合(S4−2−5で「Yes」)、aをインクリメントして次の特許文献P’を選択し(S4−2−11)、S4−2−2へ戻る。
特許文献P’が特許文献Pの先願特許文献集合及び後願特許文献集合のいずれにも属しない場合(S4−2−5で「No」)、特許文献Pの属する課題グループと特許文献P’の属する課題グループとの間の課題の推移が求められる(S4−2−6)。図2において説明したように、例えば、特許文献P’が特許文献Pを引用している場合には、特許文献Pの属する課題グループから特許文献P’の属する課題グループへ課題が推移していると判定される。S4−2−6では、後述するS5(S5−5〜S5−11)の処理を実行し、特許文献Pの属する課題グループと特許文献P’の属する課題グループとの間の課題の推移が求められる。その結果、特許文献P’が特許文献Pを引用している場合、特許文献Pの属する課題グループから特許文献P’の属する課題グループへの課題推移フラグがセットされる。また、特許文献Pが特許文献P’を引用している場合、特許文献P’の属する課題グループから特許文献Pの属する課題グループへの課題推移フラグがセットされる。
S4−2−6の処理によりセットされた課題推移フラグの示す課題の推移の向きに基づいて、特許文献Pを特許文献P’の課題グループに入れると課題の推移が双方向になるかが判断される(S4−2−7)。Pが属する課題グループからP’が属する課題グループへの課題推移フラグと、P’が属する課題グループからPが属する課題グループへの課題推移フラグとのいずれもがセットされている場合に、2つの課題グループ間の課題の推移が双方向になると判断され(S4−2−7で「Yes」)、aをインクリメントして次の特許文献P’を選択し(S4−2−11)、S4−2−2へ戻る。
Pが属する課題グループからP’が属する課題グループへの課題推移フラグか、P’が属する課題グループからPが属する課題グループへの課題推移フラグかのいずれか一方がセットされている場合(S4−2−7で「No」)、次に示すように、特許文献P’と特許文献Pの関連度value_diff(P’,P)が算出される(S4−2−8)。
関連度value_diff(P’,P)=1/(|P’の出願年−Pの出願年|+1)
算出されたvalue_diff(P’,P)とこれまでの最大値max_valueとを比較する(S4−2−9)。
算出されたvalue_diff(P’,P)とこれまでの最大値max_valueとを比較する(S4−2−9)。
value_diff(P’,P)>max_valueの場合(S4−2−9で「Yes」)、max_valueをvalue_diff(P’,P)の値で更新し、nearest(P)に「P’」をセットする(S4−2−10)。その後、aをインクリメントして次の特許文献P’を選択し(S4−2−11)、S4−2−2へ戻る。
一方、value_diff(P’,P)≦max_valueの場合(S4−2−9で「No」)、aをインクリメントして次の特許文献P’を選択し(S4−2−11)、S4−2−2へ戻る。
特許文献集合Sに含まれる全ての特許文献について、a≦bの間、S4−2−2〜S4−2−11の処理を繰り返す。a>bとなれば(S4−2−2で「No」)、max_valueの値をnearest_value(P)にセットする(S4−2−12)。これにより、S4−2の処理は終了する。
S4−2の処理例を説明する。例えば、特許集団Sが図17で示される1課題グループ1特許文献からなる特許文献の集合である場合、特許文献PがAであるとすると、このAに対して、B〜Jがそれぞれ処理対象となる。まず、P=A、P’=Bの場合、課題が同一で、BがAの先願特許文献集合及び後願特許文献集合のいずれにも属せず、課題の推移も双方向にならないという条件Zを満たすから、AとB間の関連度が算出される。例えば、図15に示すように、特許文献Aの出願年は1994年、特許文献Bの出願年は1992年であるから、value_diff(A,B)=1/(|1994−1992|+1)=1/3≒0.33が得られる。この場合、max_value=0.33、nearest(A)=Bとなる。この処理を繰り返すと、nearest_value(A)=0.33が得られる。
特許文献Sに含まれる各特許文献を特許文献Pとし、各特許文献PについてS4−2の処理を行う(S4−3)。その結果、特許文献集合Sの各特許文献Pについて、nearest_value(P)が算出される。すなわち、S4−2の処理を、特許文献A,B,・・・,Jそれぞれを特許文献Pとして順次行う。その結果、例えば図18で示す関連度作業テーブル61が得られる。
次に、関連度作業テーブル61において、特許文献集合Sの「処理済み」ではない特許文献Pのうち、nearest(P)に特許文献を特定する情報が格納されており、nearest_value(P)が最も大きい特許文献Pを取得する。そのときの特許文献PをMとする(S4−4)。ただし、最も大きいnearest_value(P)を有する特許文献Pが複数存在する場合には、例えば、関連度作業テーブル61の上位側にある特許文献PをMとする。例えば、図18の例では、最も大きいnearest_value(P)=0.5を有する特許文献Pには、特許文献C,D,E,Jが存在する。この場合、関連度作業テーブル61の上位側にある特許文献CをMとする。
次に、そのようなMが存在しないかが判定される(S4−5)。Mが存在しないのは、特許文献集合Sの「処理済み」ではない特許文献Pとして、(特許文献G,H、Iのように)その特許と同じ課題の特許文献が他に無いような特許文献しか残っていないような場合である。Mが存在しない場合(S4−5で「Yes」)、本フローは終了する。
Mが存在する場合(S4−5で「No」)、Mの属する課題グループと、nearest(M)の属する課題グループを新たな課題グループへとマージする(S4−6)。上記の例では、Mとしての特許文献Cが属する課題グループ「小型化」と、nearest(C)としての特許文献Dが属する課題グループ「小型化」を新たな課題グループへとマージする。すると、図19の作業用課題グループテーブル50aに示すように、特許文献C,Dがマージされている。
その後、Mとnearest(M)を「処理済み」としてマーキングする(S4−7)。上記の例の場合、特許文献CとDを「処理済み」としてマーキングする。
特許文献集合Sに含まれる特許文献の全てが「処理済み」としてマーキングされるまでS4−1からS4−8の処理が繰り返される。特許文献集合Sに含まれる特許文献の全てが「処理済み」としてマーキングされたと判定された場合(S4−1で「No」)、S4の処理を終了する。そうすると、課題が同じで、引用関係になく、関連度が高い特許文献の属する課題グループ同士がマージされる。上記の例では、最終的に、図19の作業用課題グループテーブル50bに示すように、特許文献A,Bがマージされ、特許文献C,Dがマージされ、特許文献E,F,Jがマージされる。
特許文献集合Sに含まれる特許文献の全てが「処理済み」としてマーキングされるまでS4−1からS4−8の処理が繰り返される。特許文献集合Sに含まれる特許文献の全てが「処理済み」としてマーキングされたと判定された場合(S4−1で「No」)、S4の処理を終了する。そうすると、課題が同じで、引用関係になく、関連度が高い特許文献の属する課題グループ同士がマージされる。上記の例では、最終的に、図19の作業用課題グループテーブル50bに示すように、特許文献A,Bがマージされ、特許文献C,Dがマージされ、特許文献E,F,Jがマージされる。
次に、課題グループ推移管理部26は、課題グループ間の推移を求める(S5)。S5の処理について、図14のフローを用いて説明する。図14のフローにおいて、課題グループ推移管理部26は、特許集団Sに含まれる課題グループから、2つの課題グループの組み合わせを順次選択し、その選択された一方の課題グループに含まれる特許文献が他方の課題グループに含まれる特許文献と引用関係にある場合、課題推移フラグを付与する。なお、特許集団Sに含まれる任意の2つの課題グループをGi、Gjで表すとする。ここで、i=1,2,3,・・・n(n:課題グループの総数)、j=1,2,3,・・・m(m:課題グループの総数)である。課題グループGiに含まれる特許文献数をα、課題グループGjに含まれる特許文献数をβで表す。
まず、n=m=「課題グループの総数」とし、カウンタ変数i=1,j=1として初期化する(S5−1)。ここで、図19の作業用課題グループテーブル50bの課題グループを上から順に、G1〜G6で表すと、図20に示すようになる。この場合、n=m=6となる。
次に、i≦nか否かが判定される。この例では、i=1であるので(S5−2で「Yes」)、次にj≦mか否かが判定される(S5−3)。この場合、j=1なので(S5−3で「Yes」)、i≧jか否かが判定される(S5−4)。この場合、i=j=1、すなわち、Gi=Gj=G1であり、G1に対する処理対象グループが自分自身になるので、この場合、処理は行われず(S5−4で「Yes」)、jはインクリメントされ、次の課題グループが選択される(S5−13)。
すると、S5−3で「Yes」に進み、S5−4で再びi≧jが判定される。この場合、i=1、j=2であるから(すなわち、Gi=G1,Gj=G2)、S5−5へ進む。これ以降の処理は、Giに含まれる各特許文献Pkに対する、Gjに含まれる各特許文献P’lとの組み合わせにおいて、一方の特許文献が他方の特許文献を引用しているかどうかに関する処理が行われる。なお、kはGiに含まれる特許文献をカウントするためのカウンタ変数であり、lはGjに含まれる特許文献をカウントするためのカウンタ変数である。
まず、k=1、α=「課題グループGiに含まれる特許文献数」とする(S5−5)。この場合、課題グループGi(=G1)に含まれる特許文献はA,Bの2つであるから、α=2となる。それから、k≦αかどうか判定される(S5−6)。この場合、k=1、α=2であるから、S5−7の処理へ進む。
l=1、β=課題グループGjに含まれる特許文献数とする(S5−7)。この場合、課題グループGj(=G2)に含まれる特許文献はC,Dの2つであるから、β=2となる。それから、l≦βかどうか判定される(S5−8)。この場合、l=1、β=2であるから、S5−9の処理へ進む。
次に、引用関係テーブル41を参照して、課題グループGjに含まれる特許文献P’lが、課題グループGiに含まれる特許文献Pkを引用している場合には、課題グループGiから課題グループGjへの課題推移フラグをセットする(S5−9)。図20の例では、図14の引用関係テーブル41によれば、課題グループG2に含まれる特許文献P’1(=C)が、課題グループG1に含まれる特許文献P1(=A)を引用しているので、図21に示すように、課題グループG1から課題グループG2への課題推移フラグを課題推移フラグテーブル65にセットする。課題推移フラグテーブル65は、記憶部28に格納されている。
また、引用関係テーブル41を参照して、課題グループGiに含まれる特許文献Pkが、課題グループGjに含まれる特許文献P’lを引用している場合には、課題グループGjから課題グループGiへの課題推移フラグをセットする(S5−10)。図20の例では、図14の引用関係テーブル41によれば、課題グループG1に含まれる特許文献P1(=A)は、課題グループG2に含まれる特許文献P’1(=C)を引用していないので、課題グループG2から課題グループG1への課題推移フラグはセットされない。
それから、lがインクリメントされて、課題グループGjに含まれる次の特許文献P’lが選択され(S5−11)その特許文献P’lについて処理が行われる。図20の例では、図14の引用関係テーブル41によれば、課題グループG2に含まれる特許文献P’2(=D)が、課題グループG1に含まれる特許文献P1(=A)を引用している。この場合、課題グループG1から課題グループG2への課題推移フラグが課題推移フラグテーブル65にセットされる(S5−9)。なお、この場合、課題グループG1から課題グループG2への課題推移フラグは既にセットされているので、省略してもよい。
それからlがインクリメントされて課題グループGjに含まれる次の特許文献P’lが選択される(S5−11)。l≦βを満たさなくなると(S5−8で「No」)、kをインクリメントして課題グループGiに含まれる次の特許文献Pkが選択され(S5−12)、S5−7〜S5−11の処理が行われる。この例では、課題グループG1に含まれる特許文献P2(=B)と、課題グループG2に含まれる各特許文献P’1(=C),P’2(=D)とについてS5−7〜S5−11の処理が行われる。
G1に含まれる各特許文献と、G2に含まれる各特許文献との間についての課題推移フラグのセット処理(S5−9,S5−10)が終了すれば(S5−6で「No」)、jをインクリメントし、次の課題グループGjが選択される(S5−13)。この例では、Gi(=G1)に対して、Gj(=G3)についてS5−4〜S5−12の処理を行う。この処理をj=6(G6)となるまで続ける。
jが6を超えて、j≦mを満たさなくなった場合(S5−3で「No」)、iがインクリメントされ、次の課題グループGjが選択される(S5−14)。すると、次からは課題グループG2に対しての課題グループGjの処理に移行する。この場合、Gi(=G2)に対するGj(=G1)の処理は、既に行ったGi(=G1)に対するGj(=G2)の処理と同様である。したがって、この組み合わせの処理は行われず(S5−4で「Yes」)、jをインクリメントして次の課題グループGjが選択される(S5−13)。すると、i=j=2となり、Gi(=G2)に対するGj(=G2)の処理(自分自身との処理)になる。したがって、この組み合わせの処理も行われず(S5−4で「Yes」)、jをインクリメントして次の課題グループGjが選択される(S5−13)。すると、i=2、j=3となり、Gi(=G2)に対するGj(=G3)の処理になるので、S5−5〜S5−12の処理が行われる。
このような処理がi≦nを満たさなくなるまで行われる。上記の例では、i=7となれば(S5−2で「No」)、本フローの処理は終了する。そうすると、図21に示す課題推移フラグテーブル65が完成する。
描画部27は、その課題推移フラグテーブル65に基づいて、特許文献の課題グループ間の課題の推移が視覚的に認識できる課題フローを描画する。図22は、課題フローの描画例を示す。
なお、上記では出願日に基づいて関連度を算出したが、これに限られない。例えば、変形例1として、対比する特許文献において、共通するキーワードを用いている頻度に基づいて関連度を算出してもよい。例えば、双方の特許文献の明細書データにおいて共通するキーワードが多く用いているほど、その2つの特許文献の関連度の値が大きくなるようにしてもよい。なお、キーワードは、予め重み付けされていてもよい。
また、例えば、変形例2として、共引用に基づいて関連度を算出してもよい。例えば、特許文献A,Bを同時に引用している特許文献の数が多いほど、特許文献A,Bについての共引用の関連度は高くなる。
また、例えば、変形例3として、書誌結合に基づいて関連度を算出してもよい。例えば、特許文献A,Bの両方が引用している特許文献が共通する場合、その共通する特許文献の数が多いほど、特許文献A,Bについての書誌結合の関連度は高くなる。
また、上記実施形態で用いた出願日に基づいた方法及び変形例1〜3を2以上組み合わせて関連度を算出してもよい。
また、本実施形態では特許文献(書誌的事項データ及び明細書データ)を入力データとしたがこれに限定されない。例えば、特許文献において引用されているものであれば、非特許文献に関しても適用することができる。この場合、特許DBと学術論文DB等からそれらの文献のテキストデータを取得し、課題と引用している文献とを抽出して本実施形態に係る処理を行うことができる。また、特許文献に限らず、例えば、学術文献、評論等の、課題と、引用している文献とを有する文献データであれば本実施形態に適用することができる。
また、本実施形態では特許文献(書誌的事項データ及び明細書データ)を入力データとしたがこれに限定されない。例えば、特許文献において引用されているものであれば、非特許文献に関しても適用することができる。この場合、特許DBと学術論文DB等からそれらの文献のテキストデータを取得し、課題と引用している文献とを抽出して本実施形態に係る処理を行うことができる。また、特許文献に限らず、例えば、学術文献、評論等の、課題と、引用している文献とを有する文献データであれば本実施形態に適用することができる。
本実施形態によれば、文献間関係解析装置としての特許情報構築装置21は、引用関係情報生成手段、課題情報抽出手段、引用連鎖文献集合生成手段、課題グループ統合手段、課題推移情報設定手段、出力手段を含む。
引用関係情報生成手段は、解析の対象とする文献の文献データを取得し、該文献データに記載されている引用文献を抽出し、該文献と抽出した引用文献とを関係付けた引用関係情報を生成し記憶部に格納する。引用関係情報生成手段による引用関係情報の生成は、例えば本実施形態で言えば、特許文献受付部22による引用関係テーブル41の生成に相当する。
課題情報抽出手段は、前記取得した解析の対象とする文献の文献データに記載されている課題を抽出し、該文献と課題とを対応付けて記憶部に格納する。課題情報抽出手段は、による処理は、例えば本実施形態で言えば、特許文献受付部22による課題グループテーブル50の生成に相当する。
引用連鎖文献集合生成手段は、前記記憶部に格納した引用関係情報に基づいて、文献と該文献の引用文献、さらに該引用文献と該引用文献の引用文献、と連鎖する引用関係を求める。引用連鎖文献集合生成手段は、求めた引用関係から、前記文献毎に、文献と該文献の引用関係に含まれる他の文献を引用連鎖文献集合として記憶部に格納する。具体的には、前記引用連鎖文献集合生成手段は、前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第1の文献と該第1の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求める。引用連鎖文献集合生成手段は、該引用関係に含まれる文献を該第1の文献についての第1の引用連鎖文献集合(先願特許文献集合)として記憶部に格納する。また、前記引用連鎖文献集合生成手段は、前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第2の文献と該第2の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求める。それから、引用連鎖文献集合生成手段は、該引用関係に含まれる文献を、該第2の文献についての第2の引用連鎖文献集合(後願特許文献集合)として記憶部に格納する。引用連鎖文献集合生成手段は、例えば本実施形態で言えば、先願後願特許文献集合管理部24に相当する。
課題グループ統合手段は、前記引用連鎖文献集合及び前記記憶部に格納した各文献と課題との対応に基づいて、同一の引用連鎖文献集合に属せず、且つ、同一の課題に対応付けられている文献同士を同じ課題グループに統合する。具体的には、課題グループ統合手段は、文献集合に含まれる文献のうち文献が同じ課題に属し(S4−2−4)、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について次の処理を行う(S4−2−5)。まず、課題グループ統合手段は、該各文献同士がどの程度関連しているかを示す指標である関連度を算出し(S4−2−8)、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する。より、具体的には、課題グループ統合手段は、前記文献集合に含まれる文献のうち文献が同じ課題に属し(S4−2−4)、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について次の処理を行う(S4−2−5)。課題グループ統合手段は、一方の文献が他方の文献の属する課題グループに含まれるいずれの文献をも引用せず、かつ、該一方の文献が該他方の文献の属する課題グループに含まれるいずれの文献において引用されていない文献同士の関連度を算出する(S4−2−7、S4−2−8)。それから、課題グループ統合手段は、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する。課題グループ統合手段は、例えば本実施形態で言えば、課題グループ管理部25に相当する。
なお、前記関連度は、前記2つの文献の出願日の近さに応じて算出する方法、前記2つの文献で共通するキーワードを用いている頻度に応じて算出される方法、共引用による方法、書誌結合による方法のうち1つまたは2以上の組み合わせを用いて得られた値である。
課題推移情報設定手段は、前記統合されて得られた各課題グループに属する文献と他の課題グループに属する文献との間の引用関係に基づいて、各課題グループ間の課題の推移情報を設定する。具体的には、前記課題推移情報設定手段は、前記複数の課題グループについて、前記引用関係情報に基づいて、前記各課題グループに属する前記文献と、該課題グループと異なる課題グループに属する前記文献との間に引用関係があるかを判定する。それから、課題推移情報設定手段は、該判定の結果、引用関係がある場合、引用されている文献の属する課題グループから引用している文献の属する課題グループへ課題が推移している旨を示す課題推移情報を設定する。課題推移情報設定手段は、例えば本実施形態で言えば、課題グループ推移管理部26に相当する。
出力手段は、前記設定した課題の推移情報に基づいて、前記課題グループ間の課題の推移を出力する。出力手段は、例えば本実施形態で言えば、描画部27に相当する。
このように構成することにより、文献間の引用関係から連鎖的な引用関係を求め、同一の連鎖上になく同一課題である文献同士を同じグループにまとめ、各課題グループの文献間の引用関係に基づいて、各課題グループ間の課題の推移を求めることができる。これにより、特許文献の属する課題間の課題の推移を明確にすることができる。
このように構成することにより、文献間の引用関係から連鎖的な引用関係を求め、同一の連鎖上になく同一課題である文献同士を同じグループにまとめ、各課題グループの文献間の引用関係に基づいて、各課題グループ間の課題の推移を求めることができる。これにより、特許文献の属する課題間の課題の推移を明確にすることができる。
次に図23について説明する。図23は、本実施形態における特許情報構築装置21の各部の機能を実現するコンピュータ70のハードウェア構成の一例を示す。
図23において、コンピュータ70は、CPU71、ROM72、RAM73、ハードディスク装置(HDD)74、インタフェース装置(I/F)75、入力装置76、出力装置77を備えている。これらの要素はいずれもバス78に接続されており、CPU71の管理の下で各種のデータを相互に授受することができる。
図23において、コンピュータ70は、CPU71、ROM72、RAM73、ハードディスク装置(HDD)74、インタフェース装置(I/F)75、入力装置76、出力装置77を備えている。これらの要素はいずれもバス78に接続されており、CPU71の管理の下で各種のデータを相互に授受することができる。
CPU71は、この特許情報構築装置21全体の動作を制御する中央演算処理装置である。ここで、ROM(Read Only Memory)72は、各種の制御動作を行うための制御プログラムを格納する。RAM(Random Access Memory)73は、CPU71が制御プログラムを実行する際に必要に応じて使用する作業用の一時記憶領域を提供する。ROM72には、CPU71が実行する基本制御プログラムが予め格納されている。CPU71は、ROM72に格納されている基本制御プログラムをCPU71が読み出してその実行を開始すると、コンピュータ70の各部の制御が可能となる。
HDD74は、CPU71によって実行される各種の制御プログラムやデータ、テーブル等を記憶しておく記憶装置である。CPU71はハードディスク装置74に記憶されている上述した実施形態に係る処理フローの制御プログラムを読み出して実行する。よって、本実施形態に係るプログラムを読み込んだCPU71は、特許情報受付部22、課題推移管理部23(先願後願特許文献集合管理部24、課題グループ管理部25、課題グループ推移管理部26)、描画部27として機能することができる。ハードディスク装置74は、記憶部28として機能する。
I/F装置75は、外部コンピュータ等から特許情報構築装置21に特許DBのデータなどが通信ネットワークを介して入力される場合に、コンピュータ70との各種データの授受の管理を行う。
入力装置76は、例えばキーボード装置やマウス装置であり、特許情報構築装置21に検索キー、キーフレーズ、および課題語などを入力するのに使用される。入力装置76は、利用者により操作されると、取得した入力情報をCPU71に送付する。
出力装置77は、特許情報構築装置21の処理結果等を出力する。出力装置77は、特許情報構築装置21の表示部29として機能する。
なお、図23に示した構成から明らかなように、コンピュータ70の構成は標準的なコンピュータの多くが備えている構成である。したがって、標準的なコンピュータによって特許情報構築装置21の前述した各部の機能が実現できる。
なお、図23に示した構成から明らかなように、コンピュータ70の構成は標準的なコンピュータの多くが備えている構成である。したがって、標準的なコンピュータによって特許情報構築装置21の前述した各部の機能が実現できる。
なお、本実施形態は、以上に述べた実施の形態に限定されるものではなく、その要旨を逸脱しない範囲内で種々の構成または実施形態を取ることができる。
上記実施形態に関し、更に以下の付記を開示する。
(付記1)
解析の対象とする文献の文献データを取得し、該文献データに記載されている引用文献を抽出し、該文献と抽出した引用文献とを関係付けた引用関係情報を生成し記憶部に格納する引用関係情報生成手段と、
前記取得した解析の対象とする文献の文献データに記載されている課題を抽出し、該文献と課題とを対応付けて記憶部に格納する課題情報抽出手段と、
前記記憶部に格納した引用関係情報に基づいて、文献と該文献の引用文献、さらに該引用文献と該引用文献の引用文献、と連鎖する引用関係を求めて、求めた引用関係から、前記文献毎に、文献と該文献の引用関係に含まれる他の文献を引用連鎖文献集合として記憶部に格納する引用連鎖文献集合生成手段と、
前記引用連鎖文献集合及び前記記憶部に格納した各文献と課題との対応に基づいて、同一の引用連鎖文献集合に属せず、且つ、同一の課題に対応付けられている文献同士を同じ課題グループに統合する課題グループ統合手段と、
前記課題グループに属する文献と他の課題グループに属する文献との間の引用関係に基づいて、各課題グループ間の課題の推移情報を設定する課題推移情報設定手段と、
前記設定した課題の推移情報に基づいて、前記課題グループ間の課題の推移を出力する出力手段と、
を備えることを特徴とする文献間関係解析装置。
(付記2)
前記引用連鎖文献集合生成手段は、
前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第1の文献と該第1の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求めて、該引用関係に含まれる文献を該第1の文献についての第1の引用連鎖文献集合として記憶部に格納し、
前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第2の文献と該第2の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求めて、該引用関係に含まれる文献を、該第2の文献についての第2の引用連鎖文献集合として記憶部に格納し、
前記課題グループ統合手段は、前記文献集合に含まれる文献のうち同じ課題に属し、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について、該各文献同士がどの程度関連しているかを示す指標である関連度を算出し、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する
ことを特徴とする付記1に記載の文献間関係解析装置。
(付記3)
前記課題グループ統合手段は、前記文献集合に含まれる文献のうち文献が同じ課題に属し、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について、一方の文献が他方の文献の属する課題グループに含まれるいずれの文献をも引用せず、かつ、該一方の文献が該他方の文献の属する課題グループに含まれるいずれの文献において引用されていない文献同士の関連度を算出し、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する
ことを特徴とする付記2に記載の文献間関係解析装置。
(付記4)
前記課題推移情報設定手段は、前記複数の課題グループについて、前記引用関係情報に基づいて、前記各課題グループに属する前記文献と、該課題グループと異なる課題グループに属する前記文献との間に引用関係があるかを判定し、該判定の結果、引用関係がある場合、引用されている文献の属する課題グループから引用している文献の属する課題グループへ課題が推移している旨を示す課題推移情報を設定する
ことを特徴とする付記1〜3のうちいずれか1項に記載の文献間関係解析装置。
(付記5)
前記関連度は、前記2つの文献の出願日の近さに応じて算出する方法、前記2つの文献で共通するキーワードを用いている頻度に応じて算出される方法、共引用による方法、書誌結合による方法のうち1つまたは2以上の組み合わせを用いて得られた値である
ことを特徴とする付記3または4に記載の文献間関係解析装置。
(付記6)
文献間の関係を解析する処理をコンピュータに実行させる文献間関係解析プログラムであって、
解析の対象とする文献の文献データを取得し、該文献データに記載されている引用文献を抽出し、該文献と抽出した引用文献とを関係付けた引用関係情報を生成し記憶部に格納する引用関係情報生成処理と、
前記取得した解析の対象とする文献の文献データに記載されている課題を抽出し、該文献と課題とを対応付けて記憶部に格納する課題情報抽出処理と、
前記記憶部に格納した引用関係情報に基づいて、文献と該文献の引用文献、さらに該引用文献と該引用文献の引用文献、と連鎖する引用関係を求めて、求めた引用関係から、前記文献毎に、文献と該文献の引用関係に含まれる他の文献を引用連鎖文献集合として記憶部に格納する引用連鎖文献集合生成処理と、
前記引用連鎖文献集合及び前記記憶部に格納した各文献と課題との対応に基づいて、同一の引用連鎖文献集合に属せず、且つ、同一の課題に対応付けられている文献同士を同じ課題グループに統合する課題グループ統合処理と、
前記課題グループに属する文献と他の課題グループに属する文献との間の引用関係に基づいて、各課題グループ間の課題の推移情報を設定する課題推移情報設定処理と、
前記設定した課題の推移情報に基づいて、前記課題グループ間の課題の推移を出力する出力処理と、
をコンピュータに実行させることを特徴とする文献間関係解析プログラム。
(付記7)
前記引用連鎖文献集合生成処理は、
前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第1の文献と該第1の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求めて、該引用関係に含まれる文献を該第1の文献についての第1の引用連鎖文献集合として記憶部に格納し、
前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第2の文献と該第2の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求めて、該引用関係に含まれる文献を、該第2の文献についての第2の引用連鎖文献集合として記憶部に格納し、
前記課題グループ統合処理は、前記文献集合に含まれる文献のうち同じ課題に属し、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について、該各文献同士がどの程度関連しているかを示す指標である関連度を算出し、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する
ことを特徴とする付記6に記載の文献間関係解析プログラム。
(付記8)
前記課題グループ統合処理は、前記文献集合に含まれる文献のうち文献が同じ課題に属し、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について、一方の文献が他方の文献の属する課題グループに含まれるいずれの文献をも引用せず、かつ、該一方の文献が該他方の文献の属する課題グループに含まれるいずれの文献において引用されていない文献同士の関連度を算出し、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する
ことを特徴とする付記7に記載の文献間関係解析プログラム。
(付記9)
前記課題推移情報設定処理は、前記複数の課題グループについて、前記引用関係情報に基づいて、前記各課題グループに属する前記文献と、該課題グループと異なる課題グループに属する前記文献との間に引用関係があるかを判定し、該判定の結果、引用関係がある場合、引用されている文献の属する課題グループから引用している文献の属する課題グループへ課題が推移している旨を示す課題推移情報を設定する
ことを特徴とする付記6〜8のうちいずれか1項に記載の文献間関係解析プログラム。
(付記10)
前記関連度は、前記2つの文献の出願日の近さに応じて算出する方法、前記2つの文献で共通するキーワードを用いている頻度に応じて算出される方法、共引用による方法、書誌結合による方法のうち1つまたは2以上の組み合わせを用いて得られた値である
ことを特徴とする付記8または9に記載の文献間関係解析プログラム。
(付記11)
文献間の関係を解析する文献間関係解析方法であって、
解析の対象とする文献の文献データを取得し、該文献データに記載されている引用文献を抽出し、該文献と抽出した引用文献とを関係付けた引用関係情報を生成し記憶部に格納し、
前記取得した解析の対象とする文献の文献データに記載されている課題を抽出し、該文献と課題とを対応付けて記憶部に格納し、
前記記憶部に格納した引用関係情報に基づいて、文献と該文献の引用文献、さらに該引用文献と該引用文献の引用文献、と連鎖する引用関係を求めて、求めた引用関係から、前記文献毎に、文献と該文献の引用関係に含まれる他の文献を引用連鎖文献集合として記憶部に格納し、
前記引用連鎖文献集合及び前記記憶部に格納した各文献と課題との対応に基づいて、同一の引用連鎖文献集合に属せず、且つ、同一の課題に対応付けられている文献同士を同じ課題グループに統合し、
前記課題グループに属する文献と他の課題グループに属する文献との間の引用関係に基づいて、各課題グループ間の課題の推移情報を設定し、
前記設定した課題の推移情報に基づいて、前記課題グループ間の課題の推移を出力する、
ことをコンピュータが実行することを特徴とする文献間関係解析方法。
(付記12)
前記求めた引用関係から、前記文献毎に、文献と該文献の引用関係に含まれる他の文献を引用連鎖文献集合として記憶部に格納する処理では、
前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第1の文献と該第1の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求めて、該引用関係に含まれる文献を該第1の文献についての第1の引用連鎖文献集合として記憶部に格納し、
前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第2の文献と該第2の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求めて、該引用関係に含まれる文献を、該第2の文献についての第2の引用連鎖文献集合として記憶部に格納し、
前記課題グループの統合処理では、前記文献集合に含まれる文献のうち同じ課題に属し、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について、該各文献同士がどの程度関連しているかを示す指標である関連度を算出し、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する
ことをコンピュータが実行することを特徴とする付記11に記載の文献間関係解析方法。
(付記13)
前記課題グループの統合では、前記文献集合に含まれる文献のうち文献が同じ課題に属し、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について、一方の文献が他方の文献の属する課題グループに含まれるいずれの文献をも引用せず、かつ、該一方の文献が該他方の文献の属する課題グループに含まれるいずれの文献において引用されていない文献同士の関連度を算出し、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する
ことをコンピュータが実行することを特徴とする付記12に記載の文献間関係解析方法。
(付記14)
前記課題推移情報の設定では、前記複数の課題グループについて、前記引用関係情報に基づいて、前記各課題グループに属する前記文献と、該課題グループと異なる課題グループに属する前記文献との間に引用関係があるかを判定し、該判定の結果、引用関係がある場合、引用されている文献の属する課題グループから引用している文献の属する課題グループへ課題が推移している旨を示す課題推移情報を設定する
ことをコンピュータが実行することを特徴とする付記11〜13のうちいずれか1項に記載の文献間関係解析方法。
(付記15)
前記関連度は、前記2つの文献の出願日の近さに応じて算出する方法、前記2つの文献で共通するキーワードを用いている頻度に応じて算出される方法、共引用による方法、書誌結合による方法のうち1つまたは2以上の組み合わせを用いて得られた値である
ことをコンピュータが実行することを特徴とする付記13または14に記載の文献間関係解析方法。
(付記1)
解析の対象とする文献の文献データを取得し、該文献データに記載されている引用文献を抽出し、該文献と抽出した引用文献とを関係付けた引用関係情報を生成し記憶部に格納する引用関係情報生成手段と、
前記取得した解析の対象とする文献の文献データに記載されている課題を抽出し、該文献と課題とを対応付けて記憶部に格納する課題情報抽出手段と、
前記記憶部に格納した引用関係情報に基づいて、文献と該文献の引用文献、さらに該引用文献と該引用文献の引用文献、と連鎖する引用関係を求めて、求めた引用関係から、前記文献毎に、文献と該文献の引用関係に含まれる他の文献を引用連鎖文献集合として記憶部に格納する引用連鎖文献集合生成手段と、
前記引用連鎖文献集合及び前記記憶部に格納した各文献と課題との対応に基づいて、同一の引用連鎖文献集合に属せず、且つ、同一の課題に対応付けられている文献同士を同じ課題グループに統合する課題グループ統合手段と、
前記課題グループに属する文献と他の課題グループに属する文献との間の引用関係に基づいて、各課題グループ間の課題の推移情報を設定する課題推移情報設定手段と、
前記設定した課題の推移情報に基づいて、前記課題グループ間の課題の推移を出力する出力手段と、
を備えることを特徴とする文献間関係解析装置。
(付記2)
前記引用連鎖文献集合生成手段は、
前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第1の文献と該第1の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求めて、該引用関係に含まれる文献を該第1の文献についての第1の引用連鎖文献集合として記憶部に格納し、
前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第2の文献と該第2の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求めて、該引用関係に含まれる文献を、該第2の文献についての第2の引用連鎖文献集合として記憶部に格納し、
前記課題グループ統合手段は、前記文献集合に含まれる文献のうち同じ課題に属し、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について、該各文献同士がどの程度関連しているかを示す指標である関連度を算出し、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する
ことを特徴とする付記1に記載の文献間関係解析装置。
(付記3)
前記課題グループ統合手段は、前記文献集合に含まれる文献のうち文献が同じ課題に属し、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について、一方の文献が他方の文献の属する課題グループに含まれるいずれの文献をも引用せず、かつ、該一方の文献が該他方の文献の属する課題グループに含まれるいずれの文献において引用されていない文献同士の関連度を算出し、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する
ことを特徴とする付記2に記載の文献間関係解析装置。
(付記4)
前記課題推移情報設定手段は、前記複数の課題グループについて、前記引用関係情報に基づいて、前記各課題グループに属する前記文献と、該課題グループと異なる課題グループに属する前記文献との間に引用関係があるかを判定し、該判定の結果、引用関係がある場合、引用されている文献の属する課題グループから引用している文献の属する課題グループへ課題が推移している旨を示す課題推移情報を設定する
ことを特徴とする付記1〜3のうちいずれか1項に記載の文献間関係解析装置。
(付記5)
前記関連度は、前記2つの文献の出願日の近さに応じて算出する方法、前記2つの文献で共通するキーワードを用いている頻度に応じて算出される方法、共引用による方法、書誌結合による方法のうち1つまたは2以上の組み合わせを用いて得られた値である
ことを特徴とする付記3または4に記載の文献間関係解析装置。
(付記6)
文献間の関係を解析する処理をコンピュータに実行させる文献間関係解析プログラムであって、
解析の対象とする文献の文献データを取得し、該文献データに記載されている引用文献を抽出し、該文献と抽出した引用文献とを関係付けた引用関係情報を生成し記憶部に格納する引用関係情報生成処理と、
前記取得した解析の対象とする文献の文献データに記載されている課題を抽出し、該文献と課題とを対応付けて記憶部に格納する課題情報抽出処理と、
前記記憶部に格納した引用関係情報に基づいて、文献と該文献の引用文献、さらに該引用文献と該引用文献の引用文献、と連鎖する引用関係を求めて、求めた引用関係から、前記文献毎に、文献と該文献の引用関係に含まれる他の文献を引用連鎖文献集合として記憶部に格納する引用連鎖文献集合生成処理と、
前記引用連鎖文献集合及び前記記憶部に格納した各文献と課題との対応に基づいて、同一の引用連鎖文献集合に属せず、且つ、同一の課題に対応付けられている文献同士を同じ課題グループに統合する課題グループ統合処理と、
前記課題グループに属する文献と他の課題グループに属する文献との間の引用関係に基づいて、各課題グループ間の課題の推移情報を設定する課題推移情報設定処理と、
前記設定した課題の推移情報に基づいて、前記課題グループ間の課題の推移を出力する出力処理と、
をコンピュータに実行させることを特徴とする文献間関係解析プログラム。
(付記7)
前記引用連鎖文献集合生成処理は、
前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第1の文献と該第1の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求めて、該引用関係に含まれる文献を該第1の文献についての第1の引用連鎖文献集合として記憶部に格納し、
前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第2の文献と該第2の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求めて、該引用関係に含まれる文献を、該第2の文献についての第2の引用連鎖文献集合として記憶部に格納し、
前記課題グループ統合処理は、前記文献集合に含まれる文献のうち同じ課題に属し、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について、該各文献同士がどの程度関連しているかを示す指標である関連度を算出し、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する
ことを特徴とする付記6に記載の文献間関係解析プログラム。
(付記8)
前記課題グループ統合処理は、前記文献集合に含まれる文献のうち文献が同じ課題に属し、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について、一方の文献が他方の文献の属する課題グループに含まれるいずれの文献をも引用せず、かつ、該一方の文献が該他方の文献の属する課題グループに含まれるいずれの文献において引用されていない文献同士の関連度を算出し、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する
ことを特徴とする付記7に記載の文献間関係解析プログラム。
(付記9)
前記課題推移情報設定処理は、前記複数の課題グループについて、前記引用関係情報に基づいて、前記各課題グループに属する前記文献と、該課題グループと異なる課題グループに属する前記文献との間に引用関係があるかを判定し、該判定の結果、引用関係がある場合、引用されている文献の属する課題グループから引用している文献の属する課題グループへ課題が推移している旨を示す課題推移情報を設定する
ことを特徴とする付記6〜8のうちいずれか1項に記載の文献間関係解析プログラム。
(付記10)
前記関連度は、前記2つの文献の出願日の近さに応じて算出する方法、前記2つの文献で共通するキーワードを用いている頻度に応じて算出される方法、共引用による方法、書誌結合による方法のうち1つまたは2以上の組み合わせを用いて得られた値である
ことを特徴とする付記8または9に記載の文献間関係解析プログラム。
(付記11)
文献間の関係を解析する文献間関係解析方法であって、
解析の対象とする文献の文献データを取得し、該文献データに記載されている引用文献を抽出し、該文献と抽出した引用文献とを関係付けた引用関係情報を生成し記憶部に格納し、
前記取得した解析の対象とする文献の文献データに記載されている課題を抽出し、該文献と課題とを対応付けて記憶部に格納し、
前記記憶部に格納した引用関係情報に基づいて、文献と該文献の引用文献、さらに該引用文献と該引用文献の引用文献、と連鎖する引用関係を求めて、求めた引用関係から、前記文献毎に、文献と該文献の引用関係に含まれる他の文献を引用連鎖文献集合として記憶部に格納し、
前記引用連鎖文献集合及び前記記憶部に格納した各文献と課題との対応に基づいて、同一の引用連鎖文献集合に属せず、且つ、同一の課題に対応付けられている文献同士を同じ課題グループに統合し、
前記課題グループに属する文献と他の課題グループに属する文献との間の引用関係に基づいて、各課題グループ間の課題の推移情報を設定し、
前記設定した課題の推移情報に基づいて、前記課題グループ間の課題の推移を出力する、
ことをコンピュータが実行することを特徴とする文献間関係解析方法。
(付記12)
前記求めた引用関係から、前記文献毎に、文献と該文献の引用関係に含まれる他の文献を引用連鎖文献集合として記憶部に格納する処理では、
前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第1の文献と該第1の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求めて、該引用関係に含まれる文献を該第1の文献についての第1の引用連鎖文献集合として記憶部に格納し、
前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第2の文献と該第2の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求めて、該引用関係に含まれる文献を、該第2の文献についての第2の引用連鎖文献集合として記憶部に格納し、
前記課題グループの統合処理では、前記文献集合に含まれる文献のうち同じ課題に属し、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について、該各文献同士がどの程度関連しているかを示す指標である関連度を算出し、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する
ことをコンピュータが実行することを特徴とする付記11に記載の文献間関係解析方法。
(付記13)
前記課題グループの統合では、前記文献集合に含まれる文献のうち文献が同じ課題に属し、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について、一方の文献が他方の文献の属する課題グループに含まれるいずれの文献をも引用せず、かつ、該一方の文献が該他方の文献の属する課題グループに含まれるいずれの文献において引用されていない文献同士の関連度を算出し、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する
ことをコンピュータが実行することを特徴とする付記12に記載の文献間関係解析方法。
(付記14)
前記課題推移情報の設定では、前記複数の課題グループについて、前記引用関係情報に基づいて、前記各課題グループに属する前記文献と、該課題グループと異なる課題グループに属する前記文献との間に引用関係があるかを判定し、該判定の結果、引用関係がある場合、引用されている文献の属する課題グループから引用している文献の属する課題グループへ課題が推移している旨を示す課題推移情報を設定する
ことをコンピュータが実行することを特徴とする付記11〜13のうちいずれか1項に記載の文献間関係解析方法。
(付記15)
前記関連度は、前記2つの文献の出願日の近さに応じて算出する方法、前記2つの文献で共通するキーワードを用いている頻度に応じて算出される方法、共引用による方法、書誌結合による方法のうち1つまたは2以上の組み合わせを用いて得られた値である
ことをコンピュータが実行することを特徴とする付記13または14に記載の文献間関係解析方法。
20 特許情報構築システム
21 特許情報構築装置
22 特許情報受付部
23 課題推移管理部
24 先願後願特許文献集合管理部
25 課題グループ管理部
26 課題グループ推移管理部
27 描画部
28 記憶部
29 表示部
30 特許DB
21 特許情報構築装置
22 特許情報受付部
23 課題推移管理部
24 先願後願特許文献集合管理部
25 課題グループ管理部
26 課題グループ推移管理部
27 描画部
28 記憶部
29 表示部
30 特許DB
Claims (7)
- 解析の対象とする文献の文献データを取得し、該文献データに記載されている引用文献を抽出し、該文献と抽出した引用文献とを関係付けた引用関係情報を生成し記憶部に格納する引用関係情報生成手段と、
前記取得した解析の対象とする文献の文献データに記載されている課題を抽出し、該文献と課題とを対応付けて記憶部に格納する課題情報抽出手段と、
前記記憶部に格納した引用関係情報に基づいて、文献と該文献の引用文献、さらに該引用文献と該引用文献の引用文献、と連鎖する引用関係を求めて、求めた引用関係から、前記文献毎に、文献と該文献の引用関係に含まれる他の文献を引用連鎖文献集合として記憶部に格納する引用連鎖文献集合生成手段と、
前記引用連鎖文献集合及び前記記憶部に格納した各文献と課題との対応に基づいて、同一の引用連鎖文献集合に属せず、且つ、同一の課題に対応付けられている文献同士を同じ課題グループに統合する課題グループ統合手段と、
前記課題グループに属する文献と他の課題グループに属する文献との間の引用関係に基づいて、各課題グループ間の課題の推移情報を設定する課題推移情報設定手段と、
前記設定した課題の推移情報に基づいて、前記課題グループ間の課題の推移を出力する出力手段と、
を備えることを特徴とする文献間関係解析装置。 - 前記引用連鎖文献集合生成手段は、
前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第1の文献と該第1の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求めて、該引用関係に含まれる文献を該第1の文献についての第1の引用連鎖文献集合として記憶部に格納し、
前記引用関係情報に基づいて、前記文献集合のうちの任意の文献である第2の文献と該第2の文献の引用文献、該引用文献と該引用文献の引用文献と連鎖する引用関係を求めて、該引用関係に含まれる文献を、該第2の文献についての第2の引用連鎖文献集合として記憶部に格納し、
前記課題グループ統合手段は、前記文献集合に含まれる文献のうち同じ課題に属し、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について、該各文献同士がどの程度関連しているかを示す指標である関連度を算出し、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する
ことを特徴とする請求項1に記載の文献間関係解析装置。 - 前記課題グループ統合手段は、前記文献集合に含まれる文献のうち文献が同じ課題に属し、かつそれぞれの文献が相互にそれぞれの前記第1及び第2の引用連鎖文献集合に含まれていない各文献について、一方の文献が他方の文献の属する課題グループに含まれるいずれの文献をも引用せず、かつ、該一方の文献が該他方の文献の属する課題グループに含まれるいずれの文献において引用されていない文献同士の関連度を算出し、該算出した関連度が最も高い2つの文献を1つの課題グループとして統合する
ことを特徴とする請求項2に記載の文献間関係解析装置。 - 前記課題推移情報設定手段は、前記複数の課題グループについて、前記引用関係情報に基づいて、前記各課題グループに属する前記文献と、該課題グループと異なる課題グループに属する前記文献との間に引用関係があるかを判定し、該判定の結果、引用関係がある場合、引用されている文献の属する課題グループから引用している文献の属する課題グループへ課題が推移している旨を示す課題推移情報を設定する
ことを特徴とする請求項1〜3のうちいずれか1項に記載の文献間関係解析装置。 - 前記関連度は、前記2つの文献の出願日の近さに応じて算出する方法、前記2つの文献で共通するキーワードを用いている頻度に応じて算出される方法、共引用による方法、書誌結合による方法のうち1つまたは2以上の組み合わせを用いて得られた値である
ことを特徴とする請求項3または4に記載の文献間関係解析装置。 - 文献間の関係を解析する処理をコンピュータに実行させる文献間関係解析プログラムであって、
解析の対象とする文献の文献データを取得し、該文献データに記載されている引用文献を抽出し、該文献と抽出した引用文献とを関係付けた引用関係情報を生成し記憶部に格納する引用関係情報生成処理と、
前記取得した解析の対象とする文献の文献データに記載されている課題を抽出し、該文献と課題とを対応付けて記憶部に格納する課題情報抽出処理と、
前記記憶部に格納した引用関係情報に基づいて、文献と該文献の引用文献、さらに該引用文献と該引用文献の引用文献、と連鎖する引用関係を求めて、求めた引用関係から、前記文献毎に、文献と該文献の引用関係に含まれる他の文献を引用連鎖文献集合として記憶部に格納する引用連鎖文献集合生成処理と、
前記引用連鎖文献集合及び前記記憶部に格納した各文献と課題との対応に基づいて、同一の引用連鎖文献集合に属せず、且つ、同一の課題に対応付けられている文献同士を同じ課題グループに統合する課題グループ統合処理と、
前記課題グループに属する文献と他の課題グループに属する文献との間の引用関係に基づいて、各課題グループ間の課題の推移情報を設定する課題推移情報設定処理と、
前記設定した課題の推移情報に基づいて、前記課題グループ間の課題の推移を出力する出力処理と、
をコンピュータに実行させることを特徴とする文献間関係解析プログラム。 - 文献間の関係を解析する文献間関係解析方法であって、
解析の対象とする文献の文献データを取得し、該文献データに記載されている引用文献を抽出し、該文献と抽出した引用文献とを関係付けた引用関係情報を生成し記憶部に格納し、
前記取得した解析の対象とする文献の文献データに記載されている課題を抽出し、該文献と課題とを対応付けて記憶部に格納し、
前記記憶部に格納した引用関係情報に基づいて、文献と該文献の引用文献、さらに該引用文献と該引用文献の引用文献、と連鎖する引用関係を求めて、求めた引用関係から、前記文献毎に、文献と該文献の引用関係に含まれる他の文献を引用連鎖文献集合として記憶部に格納し、
前記引用連鎖文献集合及び前記記憶部に格納した各文献と課題との対応に基づいて、同一の引用連鎖文献集合に属せず、且つ、同一の課題に対応付けられている文献同士を同じ課題グループに統合し、
前記課題グループに属する文献と他の課題グループに属する文献との間の引用関係に基づいて、各課題グループ間の課題の推移情報を設定し、
前記設定した課題の推移情報に基づいて、前記課題グループ間の課題の推移を出力する、
ことをコンピュータが実行することを特徴とする文献間関係解析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009225367A JP5347878B2 (ja) | 2009-09-29 | 2009-09-29 | 文献間関係解析装置、該プログラム、及び該方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009225367A JP5347878B2 (ja) | 2009-09-29 | 2009-09-29 | 文献間関係解析装置、該プログラム、及び該方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011076254A JP2011076254A (ja) | 2011-04-14 |
JP5347878B2 true JP5347878B2 (ja) | 2013-11-20 |
Family
ID=44020189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009225367A Expired - Fee Related JP5347878B2 (ja) | 2009-09-29 | 2009-09-29 | 文献間関係解析装置、該プログラム、及び該方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5347878B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108733634A (zh) * | 2017-04-20 | 2018-11-02 | 北大方正集团有限公司 | 参考文献的识别方法及识别装置 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101523279B1 (ko) | 2011-03-30 | 2015-05-27 | 스미토모 겐키 가부시키가이샤 | 쇼벨 |
CN105824791B (zh) * | 2016-03-17 | 2018-11-23 | 北京信息科技大学 | 一种参考文献格式检查方法 |
JP6978735B2 (ja) * | 2019-04-09 | 2021-12-08 | 株式会社AI Samurai | 文書検索装置、文書検索方法、及び、文書検索プログラム |
WO2024004835A1 (ja) * | 2022-06-27 | 2024-01-04 | 国立大学法人 東京大学 | オブジェクト分析装置、及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4477389B2 (ja) * | 2004-03-24 | 2010-06-09 | 株式会社エヌ・ティ・ティ・データ | 情報間関係性解析装置、情報間関係性解析方法、プログラムおよび記録媒体 |
-
2009
- 2009-09-29 JP JP2009225367A patent/JP5347878B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108733634A (zh) * | 2017-04-20 | 2018-11-02 | 北大方正集团有限公司 | 参考文献的识别方法及识别装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2011076254A (ja) | 2011-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11741173B2 (en) | Related notes and multi-layer search in personal and shared content | |
CN111373392B (zh) | 文献分类装置 | |
JP5587989B2 (ja) | 観点別特許マップの提供方法 | |
US20110106797A1 (en) | Document relevancy operator | |
JP2009003541A (ja) | データベースのインデックス作成システム、方法及びプログラム | |
CN102456016B (zh) | 一种对搜索结果进行排序的方法及装置 | |
JP5347878B2 (ja) | 文献間関係解析装置、該プログラム、及び該方法 | |
Mahmood et al. | Query based information retrieval and knowledge extraction using Hadith datasets | |
JP2005122295A (ja) | 関係図作成プログラム、関係図作成方法、および関係図作成装置 | |
CN102385596A (zh) | 一种诗句的搜索方法及装置 | |
US11907278B2 (en) | Method and apparatus for deriving keywords based on technical document database | |
JP2005122510A (ja) | 話題構造抽出方法及び装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 | |
CN101763424B (zh) | 根据文件内容确定特征词并用于检索的方法 | |
JP2012104051A (ja) | 文書インデックス作成装置 | |
CN112949287B (zh) | 热词挖掘方法、系统、计算机设备和存储介质 | |
JP2000020538A (ja) | 情報検索方法、情報検索装置および情報検索プログラム記憶媒体 | |
KR101113787B1 (ko) | 텍스트 색인 장치 및 방법 | |
JP2019061522A (ja) | 文書推薦システム、文書推薦方法および文書推薦プログラム | |
WO2014002212A1 (ja) | 文書関連付け方法および文書検索方法、文書関連付け装置および文書検索装置、並びにそのためのプログラム | |
CN103164491A (zh) | 一种数据处理和检索的方法及设备 | |
US20090299997A1 (en) | Grouping work support processing method and apparatus | |
CN109062898A (zh) | 特征词去重方法、装置、设备及其存储介质 | |
Manna et al. | Information retrieval-based question answering system on foods and recipes | |
KR20190139735A (ko) | 논리연산 입력테이블에 입력된 키워드를 이용한 데이터 검색 및 정렬방법과 그 시스템 | |
Obukhov et al. | Application of machine learning for document classification and processing in adaptive information systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120605 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130712 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130723 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130805 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |