JP2007241459A - ドキュメントデータ分析装置 - Google Patents

ドキュメントデータ分析装置 Download PDF

Info

Publication number
JP2007241459A
JP2007241459A JP2006060124A JP2006060124A JP2007241459A JP 2007241459 A JP2007241459 A JP 2007241459A JP 2006060124 A JP2006060124 A JP 2006060124A JP 2006060124 A JP2006060124 A JP 2006060124A JP 2007241459 A JP2007241459 A JP 2007241459A
Authority
JP
Japan
Prior art keywords
document
documents
activity
citation
seed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006060124A
Other languages
English (en)
Inventor
Hiroshi Okamoto
洋 岡本
Yukihiro Tsuboshita
幸寛 坪下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006060124A priority Critical patent/JP2007241459A/ja
Priority to US11/515,870 priority patent/US7734567B2/en
Publication of JP2007241459A publication Critical patent/JP2007241459A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザが分析条件として指定した文脈からの観点でドキュメントの開示状況を提示できるドキュメントデータ分析装置を提供する。
【解決手段】引用関係が規定された複数のドキュメント群を保持するデータベースにアクセス可能に接続されるドキュメントデータ分析装置であって、ユーザが指定する分析条件に基づき、データベースに保持された各ドキュメントの初期活性値を決定し、当該初期活性値とドキュメント間の引用関係とに基づいて活性伝播処理を実行して、当該活性伝播処理の結果を表示する。ここで上記分析条件は、ドキュメントの検索条件と、活性伝播処理の種となる種ドキュメント群の指定と、の少なくとも一方を含む。
【選択図】図1

Description

本発明は、特許文献など、引用関係の規定されたドキュメント群の関係分析を行うドキュメントデータ分析装置に関する。
特許文献を含む科学技術文献では、文献間で引用が頻繁に行われる。例えば学術論文であれば、他の論文を引用して作成されることが多く、また特許文献では審査の過程で、当該特許文献に記載の発明と同等な技術を開示した文献などが引用文献として列挙される。
このような状況の下、特許文献や学術論文等、科学技術文献における引用関係に基づいて、指定された文献から引用関係を芋蔓式にたどることにより、樹形図のようなものを抽出したり、個々の技術文献の重要度を「引用度数」により演算する技術が種々開発されている(例えば特許文献1)。
特開2000−148789号公報
しかしながら、引用関係を芋蔓式に辿ってゆくと、限りなく範囲が広がってしまう。そこで、どこかでトレースを打ち切る必要がある。しかしながら、トレースの範囲が狭過ぎると、必要な文書が多く抜け漏れてしまう。一方、トレースの範囲が広すぎると、不必要な文書が多く混じり込んでしまう。トレースをどこで打ち切れば関連文書群を抽出できるかについて、先行技術は基準を示さない。従って、現実にユーザが所望するような、ドキュメントの状況情報、すなわち特許文献でいえば、全体の出願状況を示すパテントマップのような情報を得ることが困難になっている。
さらに、ユーザにとって所望の文献であるか否かを表す尺度(重要度)は、引用度数で定まるものではなく、ユーザがクエリーで指定する情報(文脈)に依存するものである。従来例のものでは、文脈に関わらず引用度数にてドキュメントの重要度が決められるので、この点からも、従来技術においては、現実にユーザが所望するような、全体の出願状況を示すパテントマップのような情報を得ることが困難になっている。
本発明は上記実情に鑑みて為されたもので、ユーザが指定した文脈からの観点でドキュメントの開示状況を提示できるドキュメントデータ分析装置を提供することを、その目的の一つとする。
上記従来例の問題点を解決するための本発明は、引用関係が規定された複数のドキュメント群を保持するデータベースにアクセス可能に接続されるドキュメントデータ分析装置であって、ユーザが指定する分析条件に基づき、前記データベースに保持された各ドキュメントの初期活性値を決定する手段と、前記初期活性値と前記ドキュメント間の引用関係とに基づいて活性伝播処理を実行する手段と、当該活性伝播処理の結果を表示する表示手段と、を含み、前記分析条件が、ドキュメントの検索条件と、活性伝播処理の種となる種ドキュメント群の指定と、の少なくとも一方を含むことを特徴としている。
このようにしたことで、分析条件によって指定されたユーザの文脈の観点で、ドキュメントの開示状況を提示できる。
ここで前記表示手段は、所定の連携条件を満足するドキュメント群をグループとして他から識別可能に表示することとしてもよい。
また、本発明の一態様は、ドキュメントデータ分析方法であって、引用関係が規定された複数のドキュメント群を保持するデータベースにアクセス可能に接続されるコンピュータを用い、ユーザが指定する分析条件に基づき、前記データベースに保持された各ドキュメントの初期活性値を決定する工程と、前記初期活性値と前記ドキュメント間の引用関係とに基づいて活性伝播処理を実行する工程と、当該活性伝播処理の結果を表示させる工程と、を実行させ、前記分析条件が、ドキュメントの検索条件と、活性伝播処理の種となる種ドキュメント群の指定と、の少なくとも一方を含むことを特徴としている。
また、本発明の別の態様は、引用関係が規定された複数のドキュメント群を保持するデータベースにアクセス可能に接続されるコンピュータによって実行されるプログラムであって、ユーザが指定する分析条件に基づき、前記データベースに保持された各ドキュメントの初期活性値を決定する手順と、前記初期活性値と前記ドキュメント間の引用関係とに基づいて活性伝播処理を実行する手順と、当該活性伝播処理の結果を表示する表示させる手順と、をコンピュータに実行させ、前記分析条件が、ドキュメントの検索条件と、活性伝播処理の種となる種ドキュメント群の指定と、の少なくとも一方を含むことを特徴としている。
本発明の実施の形態について図面を参照しながら説明する。本実施の形態に係るドキュメントデータ分析装置は、図1に示すように、制御部11、記憶部12、ストレージ部13、操作部14、及び表示部15を含んで構成される。
制御部11は、CPUなどのプログラム制御デバイスであり、記憶部12に格納されているプログラムに従って動作する。本実施の形態では、制御部11は、ユーザが指定する分析条件に基づき、処理の対象となるドキュメントの各々の初期活性値を決定し、当該初期活性値とドキュメント間の引用関係とに基づいて活性伝播処理を実行する。この制御部11の具体的な処理の内容については後述する。
記憶部12は、RAMやROMなどの記憶素子を含んで構成される。この記憶部12は、制御部11によって実行されるプログラムを保持している。また、この記憶部12は、制御部11のワークメモリとしても動作する。
ストレージ部13は、ハードディスクなどであり、本発明におけるデータベースとして機能する。このストレージ部13には、処理の対象となるドキュメント群が格納されている。また、各ドキュメントには、引用関係の情報が規定されている。引用関係の情報は、例えば図2に示すように、引用元のドキュメントを特定する情報(ドキュメント識別子)と、引用先のドキュメントを特定するドキュメント識別子とを関連づけたものである。なお、ドキュメントAが、ドキュメントBを引用している場合、ドキュメントAが引用先、ドキュメントBが引用元となる。
操作部14は、キーボードやマウスなどであり、利用者の操作を受けて、当該指示操作の内容を制御部11に出力する。表示部15は、ディスプレイなどであり、制御部11から入力される指示に従って情報を表示する。
以下の説明では、本実施の形態におけるドキュメントは特許文献であるとし、図3に示すように、ドキュメント識別子と、ドキュメントの実体データ(特許文献を構成するテキスト文書など)と、書誌的情報としての出願人情報、出願日情報、権利化されているか否か、権利が消滅しているか、権利を取得できない状態となっている(拒絶査定が確定している場合など)か否か(以下、権利の死活情報と呼ぶ)などの情報が関連づけられてストレージ部13に格納されているものとする。
制御部11は、操作部14から分析条件の入力を受けて、ドキュメントデータの分析処理を開始する。ここで分析条件は例えばストレージ部13に格納されたドキュメントに関する検索条件であり、その具体的な例としては、検索キーワードや、書誌的条件(出願人や分類符号など)を指定するものがある。また分析条件の別の例は、ストレージ部13に格納されたドキュメントの一部を種ドキュメント群として指定するものである。
制御部11は、分析条件とともに分析開始の指示を受けて図4に示す処理を開始し、ストレージ部13に格納されたドキュメントD1,D2,…について、活性伝播処理のための初期活性値(ここではスカラー値とする)を定める(S1)。ここで初期活性値は、例えば検索キーワードとして入力された文字列と、各ドキュメントとの類似度の値とすることができる。類似度の演算には、ドキュメントと検索キーワードとの双方に出現する単語を抽出し、その出現頻度などの情報で重みづけする方法など、広く知られたものを採用できる。
また、検索キーワードや書誌的条件の指定に基づいてドキュメントを検索し、検索結果として得られたドキュメント群を種ドキュメント群として、種ドキュメント群に属するドキュメントについての活性値をゼロでない値(例えば上記類似度の値、または定数値)とし、種ドキュメント群に属しないドキュメントの活性値を「0」として初期活性値を定めてもよい。なお、種ドキュメント群自体が分析条件として指定された場合も同様にして初期活性値を定めることができる。
こうして制御部11は、各ドキュメントについての初期活性値のベクトル量
Figure 2007241459
を得る。
ここでNは、ドキュメントの総数、Xiは、i番目のドキュメントDiの活性値である。この(1)式で表されるベクトルを、活性パターンと呼ぶ。
制御部11は、この活性パターンを次の方法で更新する(伝播ステップ)。すなわち、i番目のドキュメントの活性値Xiを、このi番目のドキュメントDiを引用する(i番目のドキュメントを引用元として関連づけられている)ドキュメントDj1,Dj2,…(i≠j1、i≠j2…)群と、このi番目のドキュメントDiが引用している(i番目のドキュメントを引用先として関連づけられている)ドキュメントDk1,Dk2,…(i≠k1、i≠k2…)群とを用いて、
Figure 2007241459
として更新する(S2)。
ここで引用元のドキュメントの活性値を引数とする関数g、引用先のドキュメントの活性値を引数とする関数hはいずれも、引数としているドキュメントの内容(含まれる文字列その他)に因らずにその形が定められる関数であるとする。また関数fは、i番目のドキュメントの内容に依存せずにその形が定められる関数である。これらの関数f,g,hの具体的な形は活性伝播の種類によって定められる。
ここでは、活性伝播処理として、特開2005−216187号公報に開示の方法、Tsuboshita, Y. & Okamoto, H. (2005). Information Retrieval Based on a Neural-Network System with Multi-stable Neurons. In W. Duch et al. (Eds.), ICANN 2005, LNCS 3697. (865 - 872) Berlin, Heidelberg: Springer-Verlagに記載される方法、広く知られた活性拡散の方法(Anderson, J., R., Pirolli, P., L., "Spread of Activation", Journal of Experimental Psychology: Learning, Memory, and Cognition, Vol. 10, No. 4, 791-798 (1984). )等、種々の方法を採用できる。
さらに制御部11は、活性パターンが平衡状態に達したか否かを判定する(S3)。この判定は、活性パターンから定められる所定のスカラー関数等(リアプノフ関数等)を考え、更新前の活性パターンに対するこの関数の値と、更新後の活性パターンに対するこの関数の値との差のが予め定めたしきい値未満となったか否かによって判断する。ここでは、上記差の大きさがしきい値未満となっていない、すなわち活性パターンが平衡状態に達していないと判定したときに、処理S2に戻って、再度伝播ステップを実行する。
また、処理S3において活性パターンが平衡状態に達したと判定すると、この平衡状態において所定の値(通常は0に設定される)以上の活性値が付されたドキュメントが、それらの間の引用関係と共に表示される(S4)。
ここで、種ドキュメント群との類似度は、種ドキュメント群に属するドキュメントから得られる単語の出現頻度など、種ドキュメント群に関わるベクトル値と、部分活性パターンに係るドキュメント群に関わる同様のベクトル値との比較によって演算することができる。
なお、このように活性パターンの要素の部分集合について、組み合わせを列挙して、それらの中から下記選抜条件を満たすものを見つけ出す操作は、計算量が大きくなる。しかしながら、活性伝播の平衡状態は近似的に上記選抜条件を満たしている状態にあり、さらに平衡状態自体の導出は、有限時間で実行することができるので、現実には多大な計算量を要することなく選抜条件を満足する部分活性パターンを見いだすことができる。
すなわち、まず、活性パターンの要素集合の可能な部分集合について、そのすべて、またはその一部について部分集合に属する要素の組み合わせからなる複数の部分活性パターンを生成する。そして、部分活性パターンのうち、
「種ドキュメント群、または検索条件との類似度が最大値となり、かつ各ドキュメントの活性値が(2)式を満足する」
との選抜条件を満たす部分活性パターンを選択する。
この処理S5にて選択された部分活性パターンを関連ドキュメント群として、制御部11は、関連ドキュメント群に含まれるドキュメントをアイコン表示し、処理を終了する。
このように本実施の形態では、活性伝播の方法を用いることにより、ユーザが分析条件としてクエリーで指定する技術領域に対する関連文書群を抽出することができ、さらにこれを引用関係に基づいてネットワーク様に可視化することにより、指定された技術領域の状況の把握を支援することが可能になる。すなわち、抽出された特許等の技術文献群において、どれが主でありどれが従であるか、どの引用関係が幹でありどの引用関係が枝であるか、等を視覚的に把握することができるようになる。
さらにこの処理S6におけるアイコン表示では、関連ドキュメント群に含まれる各ドキュメントについて、引用先から引用元へと伸びる矢印などを併せて表示して(この矢印は影響力の方向を表す)、引用関係を明示してもよい(図5)。なお、このようにアイコンを散点的に表示し、グラフ図として表示する技術は広く知られているので、ここでの詳細な説明を省略する。
また、図5に示すように、各ドキュメントの活性値(平衡状態での活性値)に応じて対応するアイコンのサイズを変化させてもよい。または分析条件として検索キーワードが指定された場合は、当該検索キーワードとの類似度でアイコンのサイズを変化させてもよい。
さらに、各ドキュメントのアイコンは、ドキュメントに関連づけられている書誌的情報に基づいて色分けしたり、形状を異ならせたり、図柄を変更するなどしてもよい。例えば出願人別に色分けするなどが考えられる。
さらに、図6に示すように、「同一の出願人に係る複数のドキュメント(注目ドキュメント群)であって、当該注目ドキュメント群に属しない、一つのドキュメントを共通の引用元とするドキュメント同士」を連携条件の一つとして、かかる連携条件にある注目ドキュメント群を他のドキュメントとは識別可能に表示してもよい(P)。例えば、当該注目ドキュメント群を線で囲むなどする方法がある。また「同一の出願人に係るドキュメント同士であって、互いに引用関係(いずれか一方を引用元、他方を引用先とする関係)によって連鎖的に結ばれているもの同士」との連携条件を用いて、ある出願人が連鎖的に出願しているドキュメント同士を連携しているドキュメントとして、他のドキュメントとは識別可能に表示してもよい(Q)。
さらにこのアイコン表示は、図5,図6のように二次元的である必要はなく、各ドキュメントに関連づけられた書誌的情報としての出願日の情報に基づき、三次元的に配列してもよい(図7)。ユーザは、この仮想的な三次元空間を回転させるなどして時間的経過や、関連ドキュメントの状況を視認できる。
さらに、権利の死活情報が関連づけられている場合は、当該死活情報に基づくマークをアイコンに付して、あるいはアイコンの形状や模様を変更して表示してもよい。図5,図6では、権利が消滅しているか、権利取得できなくなった案件の公報について、Xマークを付して表示する例を示している。
なお、ある特許出願の審査の過程で引用されるドキュメントは特許文献に限られない。そこで、ストレージ部13は、ドキュメントとして特許文献以外の文献(非特許文献)を併せて蓄積しておき、非特許文献がここでアイコン表示されるときには、特許文献とは識別可能な状態で表示してもよい。例えば、アイコンを異ならせたり、色を変化させるなどの方法で識別可能とすることができる。
このように本実施の形態によると、ユーザが分析条件として指定した文脈からの観点で関連するドキュメント間の関係性、すなわち、それらに記載される内容(例えば特許におけるならば技術思想)の関係性を提示できる。
なお、ここまでの説明ではドキュメントは特許文献であるとしたが、これに限らず、引用関係のある論文や、その他技術文献、判例、その他であっても構わない。
本発明の実施の形態に係るドキュメントデータ分析装置の一例を表す構成ブロック図である。 本発明の実施の形態に係るドキュメントデータ分析装置が参照するドキュメントの引用関係を規定するデータベースの例を表す説明図である。 本発明の実施の形態に係るドキュメントデータ分析装置にアクセス可能に接続されるドキュメントのデータベースの例を表す説明図である。 本発明の実施の形態に係るドキュメントデータ分析装置におけるドキュメントデータの分析処理の例を表すフローチャート図である。 本発明の実施の形態に係るドキュメントデータ分析装置による分析結果の表示例を表す説明図である。 本発明の実施の形態に係るドキュメントデータ分析装置による分析結果の別の表示例を表す説明図である。 本発明の実施の形態に係るドキュメントデータ分析装置による分析結果のさらに別の表示例を表す説明図である。
符号の説明
11 制御部、12 記憶部、13 ストレージ部、14 操作部、15 表示部。

Claims (4)

  1. 引用関係が規定された複数のドキュメント群を保持するデータベースにアクセス可能に接続され、
    ユーザが指定する分析条件に基づき、前記データベースに保持された各ドキュメントの初期活性値を決定する手段と、
    前記初期活性値と前記ドキュメント間の引用関係とに基づいて活性伝播処理を実行する手段と、
    当該活性伝播処理の結果を表示する表示手段と、
    を含み、
    前記分析条件が、ドキュメントの検索条件と、活性伝播処理の種となる種ドキュメント群の指定と、の少なくとも一方を含むことを特徴とするドキュメントデータ分析装置。
  2. 請求項1に記載のドキュメントデータ分析装置であって、
    前記表示手段は、所定の連携条件を満足するドキュメント群をグループとして他から識別可能に表示することを特徴とするドキュメントデータ分析装置。
  3. 引用関係が規定された複数のドキュメント群を保持するデータベースにアクセス可能に接続されるコンピュータを用い、
    ユーザが指定する分析条件に基づき、前記データベースに保持された各ドキュメントの初期活性値を決定する工程と、
    前記初期活性値と前記ドキュメント間の引用関係とに基づいて活性伝播処理を実行する工程と、
    当該活性伝播処理の結果を表示させる工程と、を実行させ、
    前記分析条件が、ドキュメントの検索条件と、活性伝播処理の種となる種ドキュメント群の指定と、の少なくとも一方を含むことを特徴とするドキュメントデータ分析方法。
  4. 引用関係が規定された複数のドキュメント群を保持するデータベースにアクセス可能に接続されるコンピュータに、
    ユーザが指定する分析条件に基づき、前記データベースに保持された各ドキュメントの初期活性値を決定する手順と、
    前記初期活性値と前記ドキュメント間の引用関係とに基づいて活性伝播処理を実行する手順と、
    当該活性伝播処理の結果を表示する表示させる手順と、を実行させ、
    前記分析条件が、ドキュメントの検索条件と、活性伝播処理の種となる種ドキュメント群の指定と、の少なくとも一方を含むことを特徴とするプログラム。
JP2006060124A 2006-03-06 2006-03-06 ドキュメントデータ分析装置 Pending JP2007241459A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006060124A JP2007241459A (ja) 2006-03-06 2006-03-06 ドキュメントデータ分析装置
US11/515,870 US7734567B2 (en) 2006-03-06 2006-09-06 Document data analysis apparatus, method of document data analysis, computer readable medium and computer data signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006060124A JP2007241459A (ja) 2006-03-06 2006-03-06 ドキュメントデータ分析装置

Publications (1)

Publication Number Publication Date
JP2007241459A true JP2007241459A (ja) 2007-09-20

Family

ID=38472568

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006060124A Pending JP2007241459A (ja) 2006-03-06 2006-03-06 ドキュメントデータ分析装置

Country Status (2)

Country Link
US (1) US7734567B2 (ja)
JP (1) JP2007241459A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116536A (ja) * 2007-11-05 2009-05-28 Hatsumei-Tsushin Co Ltd 文献情報表示装置及び文献情報表示方法
JP2010061531A (ja) * 2008-09-05 2010-03-18 Fuji Xerox Co Ltd 情報処理装置及びプログラム
JP2010140296A (ja) * 2008-12-12 2010-06-24 Fuji Xerox Co Ltd 情報分析装置及びプログラム
JP2010140096A (ja) * 2008-12-09 2010-06-24 Fuji Xerox Co Ltd 情報分析装置及びプログラム
JP2012164224A (ja) * 2011-02-08 2012-08-30 Fuji Xerox Co Ltd 情報処理装置および情報処理システム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3104288A1 (en) 2007-10-15 2016-12-14 Lexisnexis Group System and method for searching for documents
US20090313316A1 (en) * 2008-06-17 2009-12-17 Bloomberg Finance L.P. Embedded composite indicators of document status
CN102279893B (zh) * 2011-09-19 2015-07-22 索意互动(北京)信息技术有限公司 文献群组多对多自动分析
US10331721B2 (en) * 2012-06-21 2019-06-25 Autodesk, Inc. Systems and methods for visualizing relationships between publications
JP6390239B2 (ja) * 2014-07-25 2018-09-19 富士ゼロックス株式会社 情報処理装置、及びプログラム
US10635705B2 (en) * 2015-05-14 2020-04-28 Emory University Methods, systems and computer readable storage media for determining relevant documents based on citation information
CN111858518B (zh) * 2020-07-09 2022-10-25 北京字节跳动网络技术有限公司 一种引用文档的更新方法、装置、电子设备及存储介质

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6339767B1 (en) * 1997-06-02 2002-01-15 Aurigin Systems, Inc. Using hyperbolic trees to visualize data generated by patent-centric and group-oriented data processing
US5991751A (en) * 1997-06-02 1999-11-23 Smartpatents, Inc. System, method, and computer program product for patent-centric and group-oriented data processing
JP2883528B2 (ja) * 1993-12-07 1999-04-19 シャープ株式会社 電子装置
US5802515A (en) * 1996-06-11 1998-09-01 Massachusetts Institute Of Technology Randomized query generation and document relevance ranking for robust information retrieval from a database
US5933145A (en) * 1997-04-17 1999-08-03 Microsoft Corporation Method and system for visually indicating a selection query
JP3356667B2 (ja) * 1997-11-14 2002-12-16 松下電器産業株式会社 アイコン表示装置
US6289342B1 (en) * 1998-01-05 2001-09-11 Nec Research Institute, Inc. Autonomous citation indexing and literature browsing using citation context
JP2000148789A (ja) 1998-11-05 2000-05-30 Inpatekku Kk 特許情報等の引用文献分析方法及び引用文献分析装置
US6347319B1 (en) * 1999-06-04 2002-02-12 Hewlett-Packard Company Methods of obtaining listings of information from databases
US6421668B1 (en) * 1999-08-05 2002-07-16 Agilent Technologies, Inc. Method and system for partitioning data into subsets of related data
US20010027452A1 (en) * 2000-02-01 2001-10-04 Tropper Matthew Bruce System and method to identify documents in a database which relate to a given document by using recursive searching and no keywords
JP2005038414A (ja) * 2003-06-30 2005-02-10 Fuji Photo Film Co Ltd ファイル管理プログラム、ファイル管理方法、ファイル管理装置、撮像装置及び記録媒体
US7281005B2 (en) * 2003-10-20 2007-10-09 Telenor Asa Backward and forward non-normalized link weight analysis method, system, and computer program product
JP4543687B2 (ja) 2004-01-30 2010-09-15 富士ゼロックス株式会社 データ分析装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116536A (ja) * 2007-11-05 2009-05-28 Hatsumei-Tsushin Co Ltd 文献情報表示装置及び文献情報表示方法
JP2010061531A (ja) * 2008-09-05 2010-03-18 Fuji Xerox Co Ltd 情報処理装置及びプログラム
JP2010140096A (ja) * 2008-12-09 2010-06-24 Fuji Xerox Co Ltd 情報分析装置及びプログラム
JP2010140296A (ja) * 2008-12-12 2010-06-24 Fuji Xerox Co Ltd 情報分析装置及びプログラム
JP2012164224A (ja) * 2011-02-08 2012-08-30 Fuji Xerox Co Ltd 情報処理装置および情報処理システム

Also Published As

Publication number Publication date
US20070208707A1 (en) 2007-09-06
US7734567B2 (en) 2010-06-08

Similar Documents

Publication Publication Date Title
JP2007241459A (ja) ドキュメントデータ分析装置
JP5689919B2 (ja) 情報処理装置、情報処理方法、コンピュータプログラムおよびコンピュータ可読メモリ媒体
Shneiderman Inventing discovery tools: Combining information visualization with data mining
Bolger et al. MapMan visualization of RNA-seq data using Mercator4 functional annotations
CN109478191B (zh) 文本挖掘方法、记录介质及文本挖掘装置
JP6205771B2 (ja) 議論支援プログラム、議論支援方法及び議論支援サーバ
JP2010066808A (ja) 情報処理装置及び検索方法
JP6336252B2 (ja) レポート作成支援装置、その制御方法、及びプログラム
US20020174141A1 (en) Method and system for automated data manipulation in an electronic spreadsheet program or the like
JP2006155556A (ja) テキストマイニング方法及びテキストマイニングサーバ
JP4356541B2 (ja) 特許マップ作成支援システム、そのプログラム、及び分析装置
JP6380871B1 (ja) 特許文献集合の分析方法
JP4247026B2 (ja) キーワード頻度算出方法及びそれを実行するプログラム
JP2016134079A (ja) 分析プログラム、分析方法及び分析装置
JP2009032180A (ja) テキストマイニング装置及びテキストマイニング方法
JP2009020689A (ja) データ検索方法及びデータ検索装置
US20160070856A1 (en) Variant-calling on data from amplicon-based sequencing methods
JP4189251B2 (ja) キーワード解析方法及びそれに使用するプログラム
JP2005056081A (ja) 文書管理装置及び記録媒体
JP6987003B2 (ja) テキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置
JP2009003731A (ja) 特許検索システム
JP2001178463A (ja) 類似発現パターン抽出方法及び関連生体高分子抽出方法
US20220083508A1 (en) Techniques for intuitive visualization and analysis of life science information
Day et al. A consensus program for molecular sequences
Acuña et al. A family of tree-based generators for bubbles in directed graphs

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071113

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071115