JP7148809B2 - 文献群解析装置、文献群解析方法及びプログラム - Google Patents
文献群解析装置、文献群解析方法及びプログラム Download PDFInfo
- Publication number
- JP7148809B2 JP7148809B2 JP2019229003A JP2019229003A JP7148809B2 JP 7148809 B2 JP7148809 B2 JP 7148809B2 JP 2019229003 A JP2019229003 A JP 2019229003A JP 2019229003 A JP2019229003 A JP 2019229003A JP 7148809 B2 JP7148809 B2 JP 7148809B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- information
- link strength
- documents
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
文献群の文献情報を取得する文献情報取得部と、
前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定するリンク強度決定部と、
前記リンク強度に基づき前記文献群をクラスタリングするクラスタ形成部と、を有する文献群解析装置が提供される。
前記プロセッサが、前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定するステップと、
前記プロセッサが、前記リンク強度に基づき前記文献群をクラスタリングするステップと、
を有する文献群解析方法が提供される。
文献群の文献情報を取得する処理と、
前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定する処理と、
前記リンク強度に基づき前記文献群をクラスタリングする処理と、
をコンピュータに実行させるプログラムが提供される。
クラスタリングしたとき、特許性の判断結果、発明者引用及び指定されたキーワードの共通した特許数が、リンク数から算出したクラスタに存在する特許数より高い割合で存在する文献群解析装置が提供される。
[本開示の概略]
文献間の引用ネットワークにおける従来の文献クラスタリングでは、ユーザが望む観点と異なる分類が行われていた。本開示による文献群解析装置では、特徴量に基づき統計的に処理を行うのではなく、より人の観点に近い形でクラスタリングが行われる。図1に示されるように、本開示の実施例による文献群解析装置100は、特許公報などの特許文献の文献群を取得すると、各文献をノードとし、文献間の関連性の強さを示すリンク強度が付与された重み付きエッジとから構成されるグラフ構造を有する引用ネットワークを導出し、引用ネットワークにおいて技術分野の類似性に基づき文献群をクラスタリングする。これにより、引用ネットワークにおいて技術分野が類似する文献群を把握することが可能になる。
[文献群解析装置]
まず、図2~4を参照して、本開示の一実施例による文献群解析装置100を説明する。図2は、本開示の一実施例による文献群解析装置100の機能構成を示すブロック図である。
ここで、tf(ti,dj)は文書dj内での単語tiの出現頻度を表し、idf(ti)は文書間での単語tiの共通度の指標の逆数である。tf-idfは、特定の文書内での出現頻度は高いが、全文書においてはあまり出現しない単語を抽出するのに利用される。具体的には、用意された全ての文献の各単語についてtf-idfを算出し、所定の閾値以上のtf-idf値を有する単語からキーワードが選択されてもよい。
[文献群解析処理]
次に、図5~9を参照して、本開示の一実施例による文献群解析処理を説明する。当該文献群解析処理は、上述した文献群解析装置100によって実現され、例えば、文献群解析装置100のプロセッサがプログラム又は命令を実行することによって実現されてもよい。図5は、本開示の一実施例による文献群解析処理を示すフローチャートである。
[文献群解析装置のハードウェア構成]
文献群解析装置100は、例えば、図11に示されるようなハードウェア構成を有してもよい。すなわち、文献群解析装置100は、バスBを介し相互接続されるドライブ装置101、補助記憶装置102、メモリ装置103、CPU(Central Processing Unit)104、インタフェース装置105及び通信装置106を有する。
110 文献情報取得部
120 リンク強度決定部
130 クラスタ形成部
Claims (13)
- 文献群の文献情報を取得する文献情報取得部と、
前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定するリンク強度決定部と、
前記リンク強度に基づき前記文献群をクラスタリングするクラスタ形成部と、
を有し、
前記リンク強度決定部は、前記文献群に属する第1の文献に対する引用情報に基づき、前記第1の文献と前記文献群に属する第2の文献との間のリンク強度を決定し、
前記文献情報は、特許性の判断結果を示す引用情報を含む 、文献群解析装置。 - 前記リンク強度決定部は、前記第1の文献に関する文書に記載されている文献に基づき、前記第1の文献と前記第2の文献との間のリンク強度を決定する、請求項1記載の文献群解析装置。
- 前記リンク強度決定部は、前記第1の文献に記載されている文献に基づき、前記第1の文献と前記第2の文献との間のリンク強度を決定する、請求項1記載の文献群解析装置。
- プロセッサが、文献群の文献情報を取得するステップと、
前記プロセッサが、前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定するステップと、
前記プロセッサが、前記リンク強度に基づき前記文献群をクラスタリングするステップと、
を有し、
前記リンク強度を決定するステップでは、前記文献群に属する第1の文献に対する引用情報に基づき、前記第1の文献と前記文献群に属する第2の文献との間のリンク強度を決定し、
前記文献情報は、特許性の判断結果を示す引用情報を含む 、文献群解析方法。 - 文献群の文献情報を取得する処理と、
前記文献情報に基づき、文献間の関連性の強さを示すリンク強度を決定する処理と、
前記リンク強度に基づき前記文献群をクラスタリングする処理と、
をコンピュータに実行させ、
前記リンク強度を決定する処理では、前記文献群に属する第1の文献に対する引用情報に基づき、前記第1の文献と前記文献群に属する第2の文献との間のリンク強度を決定し、
前記文献情報は、特許性の判断結果を示す引用情報を含む、プログラム。 - 引用文献と被引用文献との関連性に関する関連性情報を取得する文献情報取得部と、
前記関連性情報に基づき、文献間の関連性の強さを示すリンク強度を決定するリンク強度決定部と、
前記リンク強度に基づき前記文献群をクラスタリングするクラスタ形成部と、
を有し、
前記関連性情報は、特許性の判断結果を示す引用情報を含む、 文献群解析装置。 - 前記関連性情報は、引用文献が発明者による引用か否かを示す情報を含む、請求項6記載の文献群解析装置。
- 前記関連性情報は、引用文献と被引用文献との間で共通するキーワードの類似性を示す情報を含む、請求項6又は7記載の文献群解析装置。
- 前記関連性情報は、引用文献と被引用文献との間で共通するキーワードの抽出範囲を、課題、請求項、要約及び名称の1つ以上の項目毎に指定する、請求項6乃至8何れか一項記載の文献群解析装置。
- 前記クラスタ形成部は、前記関連性情報に基づき取得したクラスタリング結果に対して、引用文献と被引用文献との間で共通するキーワードを利用して前記文献群を再クラスタリングする、請求項6乃至9何れか一項記載の文献群解析装置。
- クラスタリングしたとき、特許性の判断結果、発明者引用及び指定されたキーワードの共通した特許数が、リンク数から算出したクラスタに存在する特許数より高い割合で存在する、請求項6乃至10何れか一項記載の文献群解析装置。
- プロセッサが、引用文献と被引用文献との関連性に関する関連性情報を取得するステップと、
前記プロセッサが、前記関連性情報に基づき、文献間の関連性の強さを示すリンク強度を決定するステップと、
前記プロセッサが、前記リンク強度に基づき前記文献群をクラスタリングするステップと、
を有し、
前記関連性情報は、特許性の判断結果を示す引用情報を含む、 文献群解析方法。 - 引用文献と被引用文献との関連性に関する関連性情報を取得する処理と、
前記関連性情報に基づき、文献間の関連性の強さを示すリンク強度を決定する処理と、
前記リンク強度に基づき前記文献群をクラスタリングする処理と、
をコンピュータに実行させ、
前記関連性情報は、特許性の判断結果を示す引用情報を含む、 プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019229003A JP7148809B2 (ja) | 2019-12-19 | 2019-12-19 | 文献群解析装置、文献群解析方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019229003A JP7148809B2 (ja) | 2019-12-19 | 2019-12-19 | 文献群解析装置、文献群解析方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021096742A JP2021096742A (ja) | 2021-06-24 |
JP7148809B2 true JP7148809B2 (ja) | 2022-10-06 |
Family
ID=76431655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019229003A Active JP7148809B2 (ja) | 2019-12-19 | 2019-12-19 | 文献群解析装置、文献群解析方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7148809B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024004835A1 (ja) * | 2022-06-27 | 2024-01-04 | 国立大学法人 東京大学 | オブジェクト分析装置、及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010044617A (ja) | 2008-08-13 | 2010-02-25 | Fuji Xerox Co Ltd | 表示情報生成装置、及びプログラム |
WO2013031962A1 (ja) | 2011-08-31 | 2013-03-07 | 株式会社ニコン | サーバ装置、仕様決定方法、及び仕様決定プログラム |
-
2019
- 2019-12-19 JP JP2019229003A patent/JP7148809B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010044617A (ja) | 2008-08-13 | 2010-02-25 | Fuji Xerox Co Ltd | 表示情報生成装置、及びプログラム |
WO2013031962A1 (ja) | 2011-08-31 | 2013-03-07 | 株式会社ニコン | サーバ装置、仕様決定方法、及び仕様決定プログラム |
Non-Patent Citations (2)
Title |
---|
Nee Jan van Eck, Ludo Waltman,Citation-based clustering of publications using CitNetExplorer and VOSviewer,Springer,Springer,2017年02月27日 |
榊 剛史、松尾 豊、石塚 満,制約付きクラスタリングを用いた論文分類,人工知能学会全国大会論文集,日本,社団法人人工知能学会,2006年12月07日,第20回,1A1-1 |
Also Published As
Publication number | Publication date |
---|---|
JP2021096742A (ja) | 2021-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101715432B1 (ko) | 단어쌍취득장치, 단어쌍취득방법 및 기록 매체 | |
US9189539B2 (en) | Electronic content curating mechanisms | |
WO2020215667A1 (zh) | 文本内容快速去重方法、装置、计算机设备及存储介质 | |
CN108647322B (zh) | 基于词网识别大量Web文本信息相似度的方法 | |
CN108132927A (zh) | 一种融合图结构与节点关联的关键词提取方法 | |
KR101638535B1 (ko) | 사용자 검색어 연관 이슈패턴 검출 방법, 이를 수행하는 이슈패턴 검출 서버 및 이를 저장하는 기록매체 | |
JP7148809B2 (ja) | 文献群解析装置、文献群解析方法及びプログラム | |
Kılınç et al. | Multi‐level reranking approach for bug localization | |
JP2019204246A (ja) | 学習データ作成方法及び学習データ作成装置 | |
CN111341458A (zh) | 基于多层级结构相似度的单基因病名称推荐方法和系统 | |
JP7172187B2 (ja) | 情報表示方法、情報表示プログラムおよび情報表示装置 | |
JP3765801B2 (ja) | 対訳表現抽出装置、対訳表現抽出方法、および対訳表現抽出プログラム | |
Gao et al. | Lda-based topic formation and topic-sentence reinforcement for graph-based multi-document summarization | |
JP2006301959A (ja) | 文書処理装置、文書処理方法、文書処理プログラムおよびコンピュータに読み取り可能な記録媒体 | |
Bashir | Combining pre-retrieval query quality predictors using genetic programming | |
Abalorio et al. | Extended Max-Occurrence with Normalized Non-Occurrence as MONO Term Weighting Modification to Improve Text Classification | |
Sybrandt et al. | Validation and topic-driven ranking for biomedical hypothesis generation systems | |
CN113449063B (zh) | 一种构建文档结构信息检索库的方法及装置 | |
KR101266504B1 (ko) | 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법 | |
KR102639880B1 (ko) | 문서 내의 유의어를 대표어로 관리하기 위한 인공지능기반 유의어 치환방법 | |
Lee et al. | A comparative study on statistical machine learning algorithms and thresholding strategies for automatic text categorization | |
JP5903372B2 (ja) | キーワード関連度スコア算出装置、キーワード関連度スコア算出方法、及びプログラム | |
Abd El-Monsef et al. | Combining FA words with vector space models for Arabic text categorization | |
Silveira et al. | Ranking keyphrases from semantic and syntactic features of textual terms | |
JP2004206355A (ja) | テキスト自動分類方法及び装置並びにプログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200805 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210914 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220603 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220823 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220905 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7148809 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |