JP7148809B2 - 文献群解析装置、文献群解析方法及びプログラム - Google Patents

文献群解析装置、文献群解析方法及びプログラム Download PDF

Info

Publication number
JP7148809B2
JP7148809B2 JP2019229003A JP2019229003A JP7148809B2 JP 7148809 B2 JP7148809 B2 JP 7148809B2 JP 2019229003 A JP2019229003 A JP 2019229003A JP 2019229003 A JP2019229003 A JP 2019229003A JP 7148809 B2 JP7148809 B2 JP 7148809B2
Authority
JP
Japan
Prior art keywords
document
information
link strength
documents
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019229003A
Other languages
English (en)
Other versions
JP2021096742A (ja
Inventor
美咲 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daikin Industries Ltd
Original Assignee
Daikin Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daikin Industries Ltd filed Critical Daikin Industries Ltd
Priority to JP2019229003A priority Critical patent/JP7148809B2/ja
Publication of JP2021096742A publication Critical patent/JP2021096742A/ja
Application granted granted Critical
Publication of JP7148809B2 publication Critical patent/JP7148809B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示は、文献群解析技術に関する。
特許文献は新たなアイデアを具現化するための技術を開示するだけでなく、アイデアを実現するための前提、課題、周辺技術なども開示している。国際調査報告や拒絶理由通知書などに示される引用-被引用関係を利用して、特許文献間の引用ネットワークを構築することが試みられている。
特開2009-146213号公報
本開示では、文献間の引用ネットワークにおける文献群のクラスタリング技術を提案する。
本開示の一態様は、
文献群の文献情報を取得する文献情報取得部と、
前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定するリンク強度決定部と、
前記リンク強度に基づき前記文献群をクラスタリングするクラスタ形成部と、を有する文献群解析装置が提供される。
本態様によると、技術分野などに基づき引用ネットワークにおける文献群をクラスタリングすることができる。
一実施例では、前記リンク強度決定部は、第1の文献に対する引用情報に基づき、前記第1の文献と第2の文献との間のリンク強度を決定してもよい。
本実施例によると、国際調査報告や拒絶理由通知書などの引用情報に基づき文献間の類似性を示すリンク強度を設定することができる。
一実施例では、前記リンク強度決定部は、第1の文献に記載されている先行技術情報に基づき、前記第1の文献と第2の文献との間のリンク強度を決定してもよい。
本実施例によると、出願人や著者によって自ら開示された先行技術文献や引用文献を示す先行技術情報に基づき文献間の類似性を示すリンク強度を設定することができる。
一実施例では、前記リンク強度決定部は、第1の文献と第2の文献とに共通して含まれるキーワードに基づき、前記第1の文献と第2の文献との間のリンク強度を決定してもよい。
一実施例では、前記キーワードは、個別の技術分野に対応して予め設定されてもよい。
本実施例では、文献の文書情報に共通に含まれる各技術分野に特有のキーワードに基づき文献間の類似性を示すリンク強度を設定することができる。
本開示の他の態様は、プロセッサが、文献群の文献情報を取得するステップと、
前記プロセッサが、前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定するステップと、
前記プロセッサが、前記リンク強度に基づき前記文献群をクラスタリングするステップと、
を有する文献群解析方法が提供される。
本態様によると、技術分野などに基づき引用ネットワークにおける文献群をクラスタリングすることができる。
本開示の他の態様は、
文献群の文献情報を取得する処理と、
前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定する処理と、
前記リンク強度に基づき前記文献群をクラスタリングする処理と、
をコンピュータに実行させるプログラムが提供される。
本態様によると、技術分野などに基づき引用ネットワークにおける文献群をクラスタリングすることができる。
本開示の他の態様は、
クラスタリングしたとき、特許性の判断結果、発明者引用及び指定されたキーワードの共通した特許数が、リンク数から算出したクラスタに存在する特許数より高い割合で存在する文献群解析装置が提供される。
本態様によると、技術分野などに基づき引用ネットワークにおける文献群をクラスタリングすることができる。
本開示の一実施例による文献群解析装置を示す概略図である。 本開示の一実施例による文献群解析装置の機能構成を示すブロック図である。 本開示の一実施例による一例となるリンク情報を示す図である。 本開示の一実施例による一例となるカテゴリ情報を示す図である。 本開示の一実施例による文献群解析処理を示すフローチャートである。 本開示の一実施例によるリンク強度決定処理を示すフローチャートである。 本開示の一実施例によるリンク強度決定処理を示すフローチャートである。 本開示の一実施例によるキーワード選択を示す図である。 本開示の一実施例によるクラスタリング処理を示すフローチャートである。 本開示の一実施例によるクラスタリング結果の具体例を示す概略図である。 本開示の一実施例による文献群解析装置のハードウェア構成を示すブロック図である。
以下、実施形態を説明する。
以下の実施形態では、引用-被引用関係やキーワードの類似性に基づき文献群をクラスタリングする文献群解析装置が開示される。
[本開示の概略]
文献間の引用ネットワークにおける従来の文献クラスタリングでは、ユーザが望む観点と異なる分類が行われていた。本開示による文献群解析装置では、特徴量に基づき統計的に処理を行うのではなく、より人の観点に近い形でクラスタリングが行われる。図1に示されるように、本開示の実施例による文献群解析装置100は、特許公報などの特許文献の文献群を取得すると、各文献をノードとし、文献間の関連性の強さを示すリンク強度が付与された重み付きエッジとから構成されるグラフ構造を有する引用ネットワークを導出し、引用ネットワークにおいて技術分野の類似性に基づき文献群をクラスタリングする。これにより、引用ネットワークにおいて技術分野が類似する文献群を把握することが可能になる。
なお、以下の実施例では、英語により記載された特許文献(例えば、米国特許公報、欧州特許公報、国際公開公報など)、論文、学術雑誌等に着目するが、本開示による文献群は、必ずしもこれに限定されず、日本語や他の言語による文献にもまた同様に適用可能である。実際、非英語文献を扱う場合、その対応英文公報や英語の翻訳文などは容易に取得できることが多く、対応英文公報や翻訳文を代用してもよい。
[文献群解析装置]
まず、図2~4を参照して、本開示の一実施例による文献群解析装置100を説明する。図2は、本開示の一実施例による文献群解析装置100の機能構成を示すブロック図である。
図2に示されるように、文献群装置100は、文献情報取得部110、リンク強度決定部120及びクラスタ形成部130を有する。
文献情報取得部110は、文献群の文献情報を取得する。一例として、各文献の文献情報は、当該文献と他の文献との間の関連性を示すリンク情報を含んでもよく、文献情報取得部110は、特許文献などの各文献についてリンク情報を取得してもよい。リンク情報は、例えば、特許文献において出願人自身によって開示された先行技術文献や論文の著者自身によって開示された引用文献、国際調査機関による国際調査報告、各国特許庁による審査結果(例えば、オフィスアクションなど)などの引用情報において指摘された被引用文献を示すものであってもよい。例えば、特許文献について、リンク情報は、図3に示されるように、対象文献、当該対象文献の新規性等を否定しうる他の被引用文献、及び当該対象文献によって新規性等が否定されうる他の引用文献から構成されてもよい。
図3に示されるリンク情報の具体例では、文献"EP1737XXX"は、被引用文献"US2004060XXX"及び"US6260XXX"と、引用文献"EP1621XXX"及び"RU2661XXX"を有することが示されている。このため、文献"EP1737XXX"を示すノードは、引用ネットワークにおいて"US2004060XXX"、"US6260XXX"、"EP1621XXX"及び"RU2661XXX"を示す各ノードとそれぞれリンクを有することになる。同様に、文献"US2006021XXX"は、被引用文献"US2004060XXX"及び"US2004123XXX"と、引用文献"US2010012XXX"及び"US2010071XXX"を有することが示されている。このため、文献"US2006021XXX"を示すノードは、引用ネットワークにおいて"US2004060XXX"、"US2004123XXX"、 "US2010012XXX"及び"US2010071XXX"を示す各ノードとそれぞれリンクを有することになる。以下同様に、各文献のリンク情報から文献間のリンクが設定できる。
また、リンク情報は、当該文献と先行技術文献又は被引用文献との関連性又は類似性の程度を示すカテゴリ情報を含んでもよい。例えば、国際調査報告において、当該特許発明の新規性を否定しうる先行技術文献はカテゴリ"X"として分類され、当該特許発明の進歩性を否定しうる先行技術文献はカテゴリ"Y"として分類され、当該特許発明の関連技術を示す先行技術文献はカテゴリ"A"として分類される。一般に、関連性又は類似性の強さは、"X">"Y">"A"である。カテゴリ情報は、このような当該文献と他の文献との間の関連性又は類似性の強さを示す値によって表されてもよい。例えば、カテゴリ情報は、図4に示されるように、文献"EP1737XXX"に対して、被引用文献"US2004060XXX"がカテゴリ"X"であることが示されている。また、文献"US2006555XXX"に対して、被引用文献"EP2494XXX"がカテゴリ"Y"であり、被引用文献"JP2002046XXX"がカテゴリAであることが示されている。
また、他の例として、各文献の文献情報は、当該文献の文書情報を含んでもよく、文献情報取得部110は、特許文献などの各文献について文書情報を取得してもよい。文書情報は、例えば、特許文献の明細書、特許請求の範囲、図面、要約などの1つ以上又はこれらの一部(例えば、明細書の発明の概要、請求項1、選択図など)を含んでもよい。典型的には、文書情報には、当該特許発明の技術分野や特徴を示すキーワードが含まれていると考えられ、文献間に共通のキーワードが含まれる場合、これらの文献の技術分野や特徴は類似していると想定される。
また、他の実施例では、文献情報取得部110は、引用文献と被引用文献との関連性に関する関連性情報を取得してもよい。例えば、関連性情報は、特許性の判断結果を示す引用情報(いわゆる、X文献、A文献などのカテゴリ情報)、引用文献が発明者による引用か否かを示す情報、又は引用文献と被引用文献との間で共通するキーワードの類似性を示す情報を含んでもよい。ここで、共通するキーワードは、例えば、調査実行者などによって指定されてもよく、典型的には、特定の技術分野の特徴を示すものであってもよい。また、関連性情報は、引用文献と被引用文献との間で共通するキーワードの抽出範囲を、課題、請求項、要約及び名称の1つ以上の項目毎に指定してもよい。リンク強度決定部120は、文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定する。
一実施例では、リンク強度決定部120は、文献Aに対する引用情報に基づき、文献Aと文献Bとの間のリンク強度を決定してもよい。例えば、引用情報は、国際調査機関による国際調査報告、各国特許庁による審査結果(例えば、オフィスアクションなど)などであってもよい。具体的には、引用情報が国際調査報告である場合、リンク強度決定部120は、文献Aの国際調査報告に示される先行技術文献Bと当該先行技術文献Bのカテゴリ情報とに基づき、文献Aと文献Bとの間のリンク強度を設定する。例えば、文献Bがカテゴリ"X"として指摘されている場合、リンク強度決定部120は、文献Aと文献Bとの間にリンク強度xのリンクを設定してもよい。あるいは、文献Bがカテゴリ"Y"として指摘されている場合、リンク強度決定部120は、文献Aと文献Bとの間にリンク強度yのリンクを設定してもよい。あるいは、文献Bがカテゴリ"A"として指摘されている場合、リンク強度決定部120は、文献Aと文献Bとの間にリンク強度aのリンクを設定してもよい。ここで、リンク強度の大きさは、x>y>aである。
また、引用情報が審査官によって通知されたオフィスアクションなどの審査結果である場合、リンク強度決定部120は、文献Aのオフィスアクションで引用された先行技術文献Bと当該先行技術文献Bを引用した拒絶理由とに基づき、文献Aと文献Bとの間のリンク強度を設定する。例えば、文献Bが新規性の拒絶理由の引例として引用されている場合、リンク強度決定部120は、文献Aと文献Bとの間にリンク強度xのリンクを設定してもよい。あるいは、文献Bが進歩性の拒絶理由の引例として引用されている場合、リンク強度決定部120は、文献Aと文献Bとの間にリンク強度yのリンクを設定してもよい。あるいは、文献Bが関連技術を示す参考文献として指摘されている場合、リンク強度決定部120は、文献Aと文献Bとの間にリンク強度aのリンクを設定してもよい。ここで、リンク強度の大きさは、x>y>aである。
他の実施例では、リンク強度決定部120は、文献Aに記載されている先行技術情報に基づき、文献Aと文献Bとの間のリンク強度を決定してもよい。具体的には、文献Aが特許文献である場合、明細書や米国出願時に提出されるIDS(Information Disclosure Statement)には、出願人等が本発明に関連すると自ら考える先行技術文献が開示される。また、文献Aが論文、学術雑誌等である場合、引用文献が著者によって開示される。リンク強度決定部120は、文献Aに開示された先行技術文献Bや引用文献Bに基づき、文献Aと文献Bとの間にリンクを設定すると共に、当該リンクに付されるリンク強度を決定する。例えば、明細書やIDSに開示された先行技術文献については、リンク強度決定部120は、上述したカテゴリ"X"及び新規性の拒絶理由を受けた引例と同様に、リンク強度xを設定してもよい。あるいは、論文等に開示された引用文献については、リンク強度決定部120は、上述したx,y,aの何れか、あるいは、他の値を設定してもよい。
更なる他の実施例では、リンク強度決定部120は、文献Aと文献Bとに共通して含まれるキーワードに基づき、文献Aと文献Bとの間のリンク強度を決定してもよい。一例として、当該キーワードは、個別の技術分野に対応して、文献群解析装置100のオペレータなどによって予め設定されてもよい。
例えば、当該キーワードは、重要度に基づき選択されてもよい。単語の重要度の一例となる指標として、限定することなく、公知のtf-idf(Term Frequency-Inverse Document Frequency)が利用されてもよい。tf-idfは、以下のように定義される。
tf-idf(t,d)=tf(t,d)・idf(t
ここで、tf(t,d)は文書d内での単語tの出現頻度を表し、idf(t)は文書間での単語tの共通度の指標の逆数である。tf-idfは、特定の文書内での出現頻度は高いが、全文書においてはあまり出現しない単語を抽出するのに利用される。具体的には、用意された全ての文献の各単語についてtf-idfを算出し、所定の閾値以上のtf-idf値を有する単語からキーワードが選択されてもよい。
また、他の例として、当該キーワードは、関連性の高い文献間に共通して出現する単語であって、所定の閾値以上の重要度(例えば、tf-idf値)を有する単語であってもよい。具体的には、文献Aと、文献Aに対するカテゴリ"X"の文献Bとに共通して出現する単語が抽出され、抽出された単語のうち所定の閾値以上のtf-idf値を有する単語がキーワードとして選択されてもよい。
リンク強度決定部120は、このようにして抽出されたキーワードを利用して、リンクが設定されている文献Aと文献Bとに出現する共通の単語を特定し、特定した単語がキーワードとして登録されているか判断する。特定した単語がキーワードとして登録されている場合、リンク強度決定部120は、文献Aと文献Bとの間のリンクにリンク強度を設定してもよい。例えば、文献Aと文献Bとに共通して出現するキーワードの個数に応じて、リンク強度決定部120はリンク強度を決定してもよい。すなわち、文献Aと文献Bとに共通して出現するキーワードの個数が多いほど、リンク強度決定部120は、より大きなリンク強度を設定してもよい。
上述した関連性情報が共通するキーワードの抽出範囲を、課題、請求項、要約及び名称の1つ以上の項目毎に指定している場合、リンク強度決定部120は、文献全体の代わりに、指定されている抽出範囲に共通するキーワードが存在するか検出し、当該抽出範囲において検出された共通するキーワードに基づき、上述したリンク強度設定と同様にして、文献間のリンク強度を設定してもよい。
クラスタ形成部130は、リンク強度に基づき文献群をクラスタリングする。具体的には、クラスタ形成部130は、リンク強度から算出されるモジュラリティに基づき、文献群をクラスタリングしてもよい。例えば、クラスタ形成部130はまず、計算の高速化のため、リンク数が最小のノードAを特定し、ノードAと接続される全てのノード(例えば、ノードB,C,D)を検出する。そして、クラスタ形成部130は、2つのノードA,B、A,C及びA,Dの各ペアに対して、2つのノードを同一クラスタに属しているとみなし、モジュラリティを算出する。具体的には、クラスタ形成部130は、各ペアに対して、以下の式に従ってモジュラリティQを算出する。
Figure 0007148809000001
ただし、eijはクラスタiとクラスタjとを接続するリンク強度の合計であり、aはクラスタiとクラスタjとを接続する各リンク強度であり、mは全リンクのリンク強度の合計である。
全てのペアに対してモジュラリティを算出した後、クラスタ形成部130は、算出したモジュラリティが最大となるペアを同一クラスタに属すると判断し、当該ペアを1つのノードと仮定して、リンク数が最小のノードを特定し、上述したクラスタリング処理を繰り返す。クラスタ形成部130は、モジュラリティが収束するまで上記を繰り返し、最大値をとる条件を結果として出力する。
しかしながら、本開示によるクラスタリング処理は、必ずしもこれに限定されず、他の何れか適切なクラスタリング手法が利用されてもよい。
[文献群解析処理]
次に、図5~9を参照して、本開示の一実施例による文献群解析処理を説明する。当該文献群解析処理は、上述した文献群解析装置100によって実現され、例えば、文献群解析装置100のプロセッサがプログラム又は命令を実行することによって実現されてもよい。図5は、本開示の一実施例による文献群解析処理を示すフローチャートである。
図5に示されるように、ステップS101において、文献群解析装置100は、文献群の文献情報を取得する。具体的には、文献群解析装置100は、文献データベースなどから各文献の文献情報(例えば、リンク情報、文書情報など)を取得する。
例えば、各文献のリンク情報は、当該文献と他の文献との間の関連性を示す何れかの情報である。例えば、当該文献が特許文献である場合、リンク情報は、出願人によって開示された先行技術文献、国際調査報告や審査結果(例えば、オフィスアクションなど)などの引用情報において指摘された被引用文献などであってもよい。また、リンク情報は、当該文献と先行技術文献又は被引用文献との関連性又は類似性の程度を示すカテゴリ情報を含んでもよい。また、各文献の文書情報は、例えば、特許文献の明細書、特許請求の範囲、図面、要約などの1つ以上又はこれらの一部を含んでもよい。
ステップS102において、文献群解析装置100は、文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定する。
一例として、文献群解析装置100は、各文献について、当該文献に対する引用情報に基づき当該文献と被引用文献及び引用文献の各文献との間にリンクを設定し、カテゴリ情報などに基づき当該文献と被引用文献及び引用文献の各文献との間のリンク強度を決定する。
具体的には、図6に示されるように、ステップS201において、文献群解析装置100は、各文献のリンク情報を取得する。
ステップS202において、文献群解析装置100は、リンク情報からカテゴリ情報を取得する。
ステップS203において、文献群解析装置100は、カテゴリ情報に基づきリンク強度を設定する。例えば、当該文献Aに対してカテゴリ"X"として指摘された文献Bについて、文献群解析装置100は、文献Aと文献Bとの間のリンクにリンク強度xを設定してもよい。また、当該文献Aに対してカテゴリ"Y"として指摘された文献Bについて、文献群解析装置100は、文献Aと文献Bとの間のリンクにリンク強度yを設定してもよい。さらに、当該文献Aに対してカテゴリ"A"として指摘された文献Bについて、文献群解析装置100は、文献Aと文献Bとの間のリンクにリンク強度aを設定してもよい。ただし、リンク強度は、x>y>aとなる。
他の例として、文献群解析装置100は、各文献について、当該文献に記載されている先行技術情報に基づき、当該文献と記載されている文献との間にリンクを設定し、リンク強度を所定値に設定してもよい。例えば、文献Aの先行技術文献又は引用文献として文献Bが開示されている場合、文献群解析装置100は、文献Aと文献Bとの間のリンクに所定値を設定してもよい。
更なる他の例として、文献群解析装置100は、各文献について、当該文献と他の文献とに共通して含まれるキーワードに基づき、当該文献と他の文献との間にリンクを設定し、検出した共通のキーワードの個数などに基づきリンク強度を決定してもよい。
具体的には、図7に示されるように、ステップS301において、文献群解析装置100は、文献A,Bの文書情報から文献A,B間に共通する単語を検出する。
ステップS302において、文献群解析装置100は、検出した単語からキーワードを特定する。例えば、当該キーワードは、個別の技術分野に対応して予め設定されてもよい。あるいは、当該キーワードは、tf-idfなどの単語の重要度を示す指標から算出された重要度に基づき選択されてもよい。図8(a)に示されるように、所定の閾値以上の重要度を有する"demand control"及び"energy management"がキーワードとして選択されてもよい。あるいは、当該キーワードは、関連性の高い文献間に共通して出現し、所定の閾値以上の重要度を有する単語から選択されてもよい。例えば、図8(b)に示されるように、文献"EP1727XXX"に対してカテゴリ"X"の文献"US2004063XXX"について、所定の閾値以上の重要度の単語から、共通に出現する単語"demand"がキーワードとして選択されてもよい。
ステップS303において、文献群解析装置100は、共通のキーワードに基づきリンク強度を設定してもよい。
図5に戻って、ステップS103において、文献群解析装置100は、リンク強度に基づき文献群をクラスタリングする。
具体的には、図9に示されるように、ステップS401において、文献群解析装置100は、リンク数が最小となるノードを検出する。
ステップS402において、文献群解析装置100は、検出されたノードに隣接する全ノードを抽出する。
ステップS403において、文献群解析装置100は、モジュラリティを算出する。
ステップS404において、文献群解析装置100は、モジュラリティが最大となるペアノードを同一クラスタとして設定し、当該2つのノードを1つのノードにまとめる。
ステップS405において、文献群解析装置100は、所定の終了条件を充足したか判断し、終了条件を充足してない場合(S405:NO)、ステップS401に戻って、上述した処理を繰り返す。他方、終了条件を充足した場合(S405:YES)、文献群解析装置100は、当該クラスタリング処理を終了し、最終的に獲得されたクラスタリング結果を出力する。ここで、終了条件は、例えば、モジュラリティの収束であってもよい。
また、他の実施例によると、文献群解析装置100は、特許性の判断結果、発明者引用及び指定されたキーワードの共通した特許数が、リンク数から算出したクラスタに存在する特許数より高い割合で存在するように、文献群をクラスタリングすることができる。例えば、図10(a)に示される従来のクラスタリングの具体例では、IoT関連、業務用空調関連及び家庭用空調関連の特許が、引用被引用関係に基づきクラスタリングされている。クラスタリング結果から分かるように、同一技術に関する特許であっても、引用関係が少ないときには同一のクラスタにクラスタリングされない。また、家庭用空調関連の特許であっても、業務用空調から多く引用されているものについては、業務用空調関連のクラスタに分類されてしまう。例えば、お掃除機能に関して、業務用空調関連の特許から家庭用空調関連の特許への引用が多いなどがあげられる。
一方、本開示による文献群解析処理によると、図10(b)に示されるように、リンクAでは、引用関係は疎であるが、キーワードの類似性からリンク強度が高く設定されるため、同一技術に関する特許が同一クラスタに分類できる。また、リンクBでは、引用関係がXである場合、関連性が高いと判定され、同一技術に関する特許が同一クラスタに分類できる。また、リンクCでは、発明者による引用である場合、リンク強度が高く設定されるため、同一技術に関する特許が同一クラスタに分類できる。このように、リンク強度に基づきクラスタリングが実行されることによって、共通するキーワード、引用関係がXである特許が同一クラスタにクラスタリングできる。
[文献群解析装置のハードウェア構成]
文献群解析装置100は、例えば、図11に示されるようなハードウェア構成を有してもよい。すなわち、文献群解析装置100は、バスBを介し相互接続されるドライブ装置101、補助記憶装置102、メモリ装置103、CPU(Central Processing Unit)104、インタフェース装置105及び通信装置106を有する。
文献群解析装置100における上述した各種機能及び処理を実現するプログラムを含む各種コンピュータプログラムは、CD-ROM(Compact Disk-Read Only Memory)などの記録媒体107によって提供されてもよい。プログラムを記憶した記録媒体107がドライブ装置101にセットされると、プログラムが記録媒体107からドライブ装置101を介して補助記憶装置102にインストールされる。但し、プログラムは必ずしも記録媒体107からインストールされる必要はなく、ネットワークなどを介し何れかの外部装置からダウンロードするようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータなどを格納する。メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムやデータを読み出して格納する。プロセッサとして機能するCPU104は、メモリ装置103に格納されたプログラムやプログラムを実行するのに必要なパラメータなどの各種データに従って、上述した文献群解析装置100の各種機能及び処理を実行する。インタフェース装置105は、ネットワーク又は外部装置に接続するための通信インタフェースとして用いられる。通信装置106は、外部装置と通信するための各種通信処理を実行する。
しかしながら、文献群解析装置100は、上述したハードウェア構成に限定されるものでなく、他の何れか適切な回路などのハードウェア構成により実現されてもよい。
以上、実施形態を説明したが、特許請求の範囲の趣旨及び範囲から逸脱することなく、形態や詳細の多用な変更が可能なことが理解されるであろう。
100 文献群解析装置
110 文献情報取得部
120 リンク強度決定部
130 クラスタ形成部

Claims (13)

  1. 文献群の文献情報を取得する文献情報取得部と、
    前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定するリンク強度決定部と、
    前記リンク強度に基づき前記文献群をクラスタリングするクラスタ形成部と、
    を有し、
    前記リンク強度決定部は、前記文献群に属する第1の文献に対する引用情報に基づき、前記第1の文献と前記文献群に属する第2の文献との間のリンク強度を決定し、
    前記文献情報は、特許性の判断結果を示す引用情報を含む 、文献群解析装置。
  2. 前記リンク強度決定部は、前記第1の文献に関する文書に記載されている文献に基づき、前記第1の文献と前記第2の文献との間のリンク強度を決定する、請求項1記載の文献群解析装置。
  3. 前記リンク強度決定部は、前記第1の文献に記載されている文献に基づき、前記第1の文献と前記第2の文献との間のリンク強度を決定する、請求項1記載の文献群解析装置。
  4. プロセッサが、文献群の文献情報を取得するステップと、
    前記プロセッサが、前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定するステップと、
    前記プロセッサが、前記リンク強度に基づき前記文献群をクラスタリングするステップと、
    を有し、
    前記リンク強度を決定するステップでは、前記文献群に属する第1の文献に対する引用情報に基づき、前記第1の文献と前記文献群に属する第2の文献との間のリンク強度を決定し、
    前記文献情報は、特許性の判断結果を示す引用情報を含む 、文献群解析方法。
  5. 文献群の文献情報を取得する処理と、
    前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定する処理と、
    前記リンク強度に基づき前記文献群をクラスタリングする処理と、
    をコンピュータに実行させ、
    前記リンク強度を決定する処理では、前記文献群に属する第1の文献に対する引用情報に基づき、前記第1の文献と前記文献群に属する第2の文献との間のリンク強度を決定し、
    前記文献情報は、特許性の判断結果を示す引用情報を含む、プログラム。
  6. 引用文献と被引用文献との関連性に関する関連性情報を取得する文献情報取得部と、
    前記関連性情報に基づき、文献間の関連性の強さを示すリンク強度を決定するリンク強度決定部と、
    前記リンク強度に基づき前記文献群をクラスタリングするクラスタ形成部と、
    を有し、
    前記関連性情報は、特許性の判断結果を示す引用情報を含む、 文献群解析装置。
  7. 前記関連性情報は、引用文献が発明者による引用か否かを示す情報を含む、請求項記載の文献群解析装置。
  8. 前記関連性情報は、引用文献と被引用文献との間で共通するキーワードの類似性を示す情報を含む、請求項6又は7記載の文献群解析装置。
  9. 前記関連性情報は、引用文献と被引用文献との間で共通するキーワードの抽出範囲を、課題、請求項、要約及び名称の1つ以上の項目毎に指定する、請求項6乃至何れか一項記載の文献群解析装置。
  10. 前記クラスタ形成部は、前記関連性情報に基づき取得したクラスタリング結果に対して、引用文献と被引用文献との間で共通するキーワードを利用して前記文献群を再クラスタリングする、請求項6乃至何れか一項記載の文献群解析装置。
  11. クラスタリングしたとき、特許性の判断結果、発明者引用及び指定されたキーワードの共通した特許数が、リンク数から算出したクラスタに存在する特許数より高い割合で存在する、請求項6乃至10何れか一項記載の文献群解析装置。
  12. プロセッサが、引用文献と被引用文献との関連性に関する関連性情報を取得するステップと、
    前記プロセッサが、前記関連性情報に基づき、文献間の関連性の強さを示すリンク強度を決定するステップと、
    前記プロセッサが、前記リンク強度に基づき前記文献群をクラスタリングするステップと、
    を有し、
    前記関連性情報は、特許性の判断結果を示す引用情報を含む、 文献群解析方法。
  13. 引用文献と被引用文献との関連性に関する関連性情報を取得する処理と、
    前記関連性情報に基づき、文献間の関連性の強さを示すリンク強度を決定する処理と、
    前記リンク強度に基づき前記文献群をクラスタリングする処理と、
    をコンピュータに実行させ
    前記関連性情報は、特許性の判断結果を示す引用情報を含む、 プログラム。
JP2019229003A 2019-12-19 2019-12-19 文献群解析装置、文献群解析方法及びプログラム Active JP7148809B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019229003A JP7148809B2 (ja) 2019-12-19 2019-12-19 文献群解析装置、文献群解析方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019229003A JP7148809B2 (ja) 2019-12-19 2019-12-19 文献群解析装置、文献群解析方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2021096742A JP2021096742A (ja) 2021-06-24
JP7148809B2 true JP7148809B2 (ja) 2022-10-06

Family

ID=76431655

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019229003A Active JP7148809B2 (ja) 2019-12-19 2019-12-19 文献群解析装置、文献群解析方法及びプログラム

Country Status (1)

Country Link
JP (1) JP7148809B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024004835A1 (ja) * 2022-06-27 2024-01-04 国立大学法人 東京大学 オブジェクト分析装置、及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010044617A (ja) 2008-08-13 2010-02-25 Fuji Xerox Co Ltd 表示情報生成装置、及びプログラム
WO2013031962A1 (ja) 2011-08-31 2013-03-07 株式会社ニコン サーバ装置、仕様決定方法、及び仕様決定プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010044617A (ja) 2008-08-13 2010-02-25 Fuji Xerox Co Ltd 表示情報生成装置、及びプログラム
WO2013031962A1 (ja) 2011-08-31 2013-03-07 株式会社ニコン サーバ装置、仕様決定方法、及び仕様決定プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Nee Jan van Eck, Ludo Waltman,Citation-based clustering of publications using CitNetExplorer and VOSviewer,Springer,Springer,2017年02月27日
榊 剛史、松尾 豊、石塚 満,制約付きクラスタリングを用いた論文分類,人工知能学会全国大会論文集,日本,社団法人人工知能学会,2006年12月07日,第20回,1A1-1

Also Published As

Publication number Publication date
JP2021096742A (ja) 2021-06-24

Similar Documents

Publication Publication Date Title
KR101715432B1 (ko) 단어쌍취득장치, 단어쌍취득방법 및 기록 매체
US9189539B2 (en) Electronic content curating mechanisms
WO2020215667A1 (zh) 文本内容快速去重方法、装置、计算机设备及存储介质
CN108647322B (zh) 基于词网识别大量Web文本信息相似度的方法
CN108132927A (zh) 一种融合图结构与节点关联的关键词提取方法
KR101638535B1 (ko) 사용자 검색어 연관 이슈패턴 검출 방법, 이를 수행하는 이슈패턴 검출 서버 및 이를 저장하는 기록매체
JP7148809B2 (ja) 文献群解析装置、文献群解析方法及びプログラム
Kılınç et al. Multi‐level reranking approach for bug localization
JP2019204246A (ja) 学習データ作成方法及び学習データ作成装置
CN111341458A (zh) 基于多层级结构相似度的单基因病名称推荐方法和系统
JP7172187B2 (ja) 情報表示方法、情報表示プログラムおよび情報表示装置
JP3765801B2 (ja) 対訳表現抽出装置、対訳表現抽出方法、および対訳表現抽出プログラム
Gao et al. Lda-based topic formation and topic-sentence reinforcement for graph-based multi-document summarization
JP2006301959A (ja) 文書処理装置、文書処理方法、文書処理プログラムおよびコンピュータに読み取り可能な記録媒体
Bashir Combining pre-retrieval query quality predictors using genetic programming
Abalorio et al. Extended Max-Occurrence with Normalized Non-Occurrence as MONO Term Weighting Modification to Improve Text Classification
Sybrandt et al. Validation and topic-driven ranking for biomedical hypothesis generation systems
CN113449063B (zh) 一种构建文档结构信息检索库的方法及装置
KR101266504B1 (ko) 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법
KR102639880B1 (ko) 문서 내의 유의어를 대표어로 관리하기 위한 인공지능기반 유의어 치환방법
Lee et al. A comparative study on statistical machine learning algorithms and thresholding strategies for automatic text categorization
JP5903372B2 (ja) キーワード関連度スコア算出装置、キーワード関連度スコア算出方法、及びプログラム
Abd El-Monsef et al. Combining FA words with vector space models for Arabic text categorization
Silveira et al. Ranking keyphrases from semantic and syntactic features of textual terms
JP2004206355A (ja) テキスト自動分類方法及び装置並びにプログラム及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200805

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220905

R151 Written notification of patent or utility model registration

Ref document number: 7148809

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151