JP2021096742A - 文献群解析装置、文献群解析方法及びプログラム - Google Patents
文献群解析装置、文献群解析方法及びプログラム Download PDFInfo
- Publication number
- JP2021096742A JP2021096742A JP2019229003A JP2019229003A JP2021096742A JP 2021096742 A JP2021096742 A JP 2021096742A JP 2019229003 A JP2019229003 A JP 2019229003A JP 2019229003 A JP2019229003 A JP 2019229003A JP 2021096742 A JP2021096742 A JP 2021096742A
- Authority
- JP
- Japan
- Prior art keywords
- document
- information
- link strength
- group
- link
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 44
- 238000000034 method Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 20
- 238000000605 extraction Methods 0.000 claims description 5
- 238000004378 air conditioning Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 230000006854 communication Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
文献群の文献情報を取得する文献情報取得部と、
前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定するリンク強度決定部と、
前記リンク強度に基づき前記文献群をクラスタリングするクラスタ形成部と、を有する文献群解析装置が提供される。
前記プロセッサが、前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定するステップと、
前記プロセッサが、前記リンク強度に基づき前記文献群をクラスタリングするステップと、
を有する文献群解析方法が提供される。
文献群の文献情報を取得する処理と、
前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定する処理と、
前記リンク強度に基づき前記文献群をクラスタリングする処理と、
をコンピュータに実行させるプログラムが提供される。
クラスタリングしたとき、特許性の判断結果、発明者引用及び指定されたキーワードの共通した特許数が、リンク数から算出したクラスタに存在する特許数より高い割合で存在する文献群解析装置が提供される。
[本開示の概略]
文献間の引用ネットワークにおける従来の文献クラスタリングでは、ユーザが望む観点と異なる分類が行われていた。本開示による文献群解析装置では、特徴量に基づき統計的に処理を行うのではなく、より人の観点に近い形でクラスタリングが行われる。図1に示されるように、本開示の実施例による文献群解析装置100は、特許公報などの特許文献の文献群を取得すると、各文献をノードとし、文献間の関連性の強さを示すリンク強度が付与された重み付きエッジとから構成されるグラフ構造を有する引用ネットワークを導出し、引用ネットワークにおいて技術分野の類似性に基づき文献群をクラスタリングする。これにより、引用ネットワークにおいて技術分野が類似する文献群を把握することが可能になる。
[文献群解析装置]
まず、図2〜4を参照して、本開示の一実施例による文献群解析装置100を説明する。図2は、本開示の一実施例による文献群解析装置100の機能構成を示すブロック図である。
ここで、tf(ti,dj)は文書dj内での単語tiの出現頻度を表し、idf(ti)は文書間での単語tiの共通度の指標の逆数である。tf−idfは、特定の文書内での出現頻度は高いが、全文書においてはあまり出現しない単語を抽出するのに利用される。具体的には、用意された全ての文献の各単語についてtf−idfを算出し、所定の閾値以上のtf−idf値を有する単語からキーワードが選択されてもよい。
[文献群解析処理]
次に、図5〜9を参照して、本開示の一実施例による文献群解析処理を説明する。当該文献群解析処理は、上述した文献群解析装置100によって実現され、例えば、文献群解析装置100のプロセッサがプログラム又は命令を実行することによって実現されてもよい。図5は、本開示の一実施例による文献群解析処理を示すフローチャートである。
[文献群解析装置のハードウェア構成]
文献群解析装置100は、例えば、図11に示されるようなハードウェア構成を有してもよい。すなわち、文献群解析装置100は、バスBを介し相互接続されるドライブ装置101、補助記憶装置102、メモリ装置103、CPU(Central Processing Unit)104、インタフェース装置105及び通信装置106を有する。
110 文献情報取得部
120 リンク強度決定部
130 クラスタ形成部
Claims (16)
- 文献群の文献情報を取得する文献情報取得部と、
前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定するリンク強度決定部と、
前記リンク強度に基づき前記文献群をクラスタリングするクラスタ形成部と、
を有する文献群解析装置。 - 前記リンク強度決定部は、第1の文献に対する引用情報に基づき、前記第1の文献と第2の文献との間のリンク強度を決定する、請求項1記載の文献群解析装置。
- 前記リンク強度決定部は、第1の文献に記載されている先行技術情報に基づき、前記第1の文献と第2の文献との間のリンク強度を決定する、請求項1又は2記載の文献群解析装置。
- 前記リンク強度決定部は、第1の文献と第2の文献とに共通して含まれるキーワードに基づき、前記第1の文献と第2の文献との間のリンク強度を決定する、請求項1乃至3何れか一項記載の文献群解析装置。
- 前記キーワードは、個別の技術分野に対応して予め設定される、請求項4記載の文献群解析装置。
- プロセッサが、文献群の文献情報を取得するステップと、
前記プロセッサが、前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定するステップと、
前記プロセッサが、前記リンク強度に基づき前記文献群をクラスタリングするステップと、
を有する文献群解析方法。 - 文献群の文献情報を取得する処理と、
前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定する処理と、
前記リンク強度に基づき前記文献群をクラスタリングする処理と、
をコンピュータに実行させるプログラム。 - 引用文献と被引用文献との関連性に関する関連性情報を取得する文献情報取得部と、
前記関連性情報に基づき、文献間の関連性の強さを示すリンク強度を決定するリンク強度決定部と、
前記リンク強度に基づき前記文献群をクラスタリングするクラスタ形成部と、
を有する文献群解析装置。 - 前記関連性情報は、特許性の判断結果を示す引用情報を含む、請求項8記載の文献群解析装置。
- 前記関連性情報は、引用文献が発明者による引用か否かを示す情報を含む、請求項8又は9記載の文献群解析装置。
- 前記関連性情報は、引用文献と被引用文献との間で共通するキーワードの類似性を示す情報を含む、請求項8乃至10何れか一項記載の文献群解析装置。
- 前記関連性情報は、引用文献と被引用文献との間で共通するキーワードの抽出範囲を、課題、請求項、要約及び名称の1つ以上の項目毎に指定する、請求項8乃至11何れか一項記載の文献群解析装置。
- 前記クラスタ形成部は、前記関連性情報に基づき取得したクラスタリング結果に対して、引用文献と被引用文献との間で共通するキーワードを利用して前記文献群を再クラスタリングする、請求項8乃至12何れか一項記載の文献群解析装置。
- プロセッサが、引用文献と被引用文献との関連性に関する関連性情報を取得するステップと、
前記プロセッサが、前記関連性情報に基づき、文献間の関連性の強さを示すリンク強度を決定するステップと、
前記プロセッサが、前記リンク強度に基づき前記文献群をクラスタリングするステップと、
を有する文献群解析方法。 - 引用文献と被引用文献との関連性に関する関連性情報を取得する処理と、
前記関連性情報に基づき、文献間の関連性の強さを示すリンク強度を決定する処理と、
前記リンク強度に基づき前記文献群をクラスタリングする処理と、
をコンピュータに実行させるプログラム。 - クラスタリングしたとき、特許性の判断結果、発明者引用及び指定されたキーワードの共通した特許数が、リンク数から算出したクラスタに存在する特許数より高い割合で存在する文献群解析装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019229003A JP7148809B2 (ja) | 2019-12-19 | 2019-12-19 | 文献群解析装置、文献群解析方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019229003A JP7148809B2 (ja) | 2019-12-19 | 2019-12-19 | 文献群解析装置、文献群解析方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021096742A true JP2021096742A (ja) | 2021-06-24 |
JP7148809B2 JP7148809B2 (ja) | 2022-10-06 |
Family
ID=76431655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019229003A Active JP7148809B2 (ja) | 2019-12-19 | 2019-12-19 | 文献群解析装置、文献群解析方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7148809B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024004835A1 (ja) * | 2022-06-27 | 2024-01-04 | 国立大学法人 東京大学 | オブジェクト分析装置、及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010044617A (ja) * | 2008-08-13 | 2010-02-25 | Fuji Xerox Co Ltd | 表示情報生成装置、及びプログラム |
WO2013031962A1 (ja) * | 2011-08-31 | 2013-03-07 | 株式会社ニコン | サーバ装置、仕様決定方法、及び仕様決定プログラム |
-
2019
- 2019-12-19 JP JP2019229003A patent/JP7148809B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010044617A (ja) * | 2008-08-13 | 2010-02-25 | Fuji Xerox Co Ltd | 表示情報生成装置、及びプログラム |
WO2013031962A1 (ja) * | 2011-08-31 | 2013-03-07 | 株式会社ニコン | サーバ装置、仕様決定方法、及び仕様決定プログラム |
Non-Patent Citations (2)
Title |
---|
NEE JAN VAN ECK, LUDO WALTMAN: "Citation-based clustering of publications using CitNetExplorer and VOSviewer", SPRINGER, JPN6022014426, 27 February 2017 (2017-02-27), ISSN: 0004753280 * |
榊 剛史、松尾 豊、石塚 満: "制約付きクラスタリングを用いた論文分類", 人工知能学会全国大会論文集, vol. 第20回, JPN6021035905, 7 December 2006 (2006-12-07), JP, ISSN: 0004753281 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024004835A1 (ja) * | 2022-06-27 | 2024-01-04 | 国立大学法人 東京大学 | オブジェクト分析装置、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7148809B2 (ja) | 2022-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240028571A1 (en) | Automatic entity resolution with rules detection and generation system | |
CN111883223B (zh) | 患者样本数据中结构变异的报告解读方法及系统 | |
JP2009151760A (ja) | オブジェクト間競合指標計算方法およびシステム | |
CN110928986B (zh) | 法律证据的排序和推荐方法、装置、设备及存储介质 | |
CN112100396B (zh) | 一种数据处理方法和装置 | |
US10248626B1 (en) | Method and system for document similarity analysis based on common denominator similarity | |
Kolchinsky et al. | Classification of protein-protein interaction full-text documents using text and citation network features | |
Lyu et al. | Truth discovery by claim and source embedding | |
KR101823463B1 (ko) | 연구자 검색 서비스 제공 장치 및 그 방법 | |
KR101638535B1 (ko) | 사용자 검색어 연관 이슈패턴 검출 방법, 이를 수행하는 이슈패턴 검출 서버 및 이를 저장하는 기록매체 | |
US20190362187A1 (en) | Training data creation method and training data creation apparatus | |
CN111341458B (zh) | 基于多层级结构相似度的单基因病名称推荐方法和系统 | |
US8862586B2 (en) | Document analysis system | |
JP2018124617A (ja) | 教師データ収集装置、教師データ収集方法、及びプログラム | |
CN110135326B (zh) | 一种身份认证方法、电子设备及计算机可读存储介质 | |
JP5720536B2 (ja) | 秘匿化データの検索のための情報処理方法及び装置 | |
JP2021096742A (ja) | 文献群解析装置、文献群解析方法及びプログラム | |
CN112668723B (zh) | 一种机器学习方法及系统 | |
JPWO2019234827A1 (ja) | 情報処理装置、判定方法、及びプログラム | |
KR20160061866A (ko) | 개체간 암묵적 관계 추론을 통한 정보 추출 증강 시스템 및 이를 이용한 정보 추출 방법 | |
CN114862257A (zh) | 一种数据源质量的评估方法、装置和设备 | |
CN107423822A (zh) | 贝叶斯网络构建方法及装置 | |
JP6057084B2 (ja) | データ処理装置、条件付関数従属性ルール統合方法及びプログラム | |
US10521436B2 (en) | Systems and methods for data and information source reliability estimation | |
WO2014141452A1 (ja) | 文書分析装置及び文書分析プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200805 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210914 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220603 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220823 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220905 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7148809 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |