JP6070936B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP6070936B2
JP6070936B2 JP2013016345A JP2013016345A JP6070936B2 JP 6070936 B2 JP6070936 B2 JP 6070936B2 JP 2013016345 A JP2013016345 A JP 2013016345A JP 2013016345 A JP2013016345 A JP 2013016345A JP 6070936 B2 JP6070936 B2 JP 6070936B2
Authority
JP
Japan
Prior art keywords
document
change
similarity
unit
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013016345A
Other languages
English (en)
Other versions
JP2014149564A (ja
Inventor
正樹 若尾
正樹 若尾
芳雄 堀内
芳雄 堀内
健二 内田
健二 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2013016345A priority Critical patent/JP6070936B2/ja
Priority to US14/168,233 priority patent/US9275020B2/en
Publication of JP2014149564A publication Critical patent/JP2014149564A/ja
Priority to US14/943,654 priority patent/US10169393B2/en
Application granted granted Critical
Publication of JP6070936B2 publication Critical patent/JP6070936B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2358Change logging, detection, and notification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/71Version control; Configuration management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。
ソースファイルに含まれる類似する複数のソースコードを検出し、これらのソースコードをユーザに共通化させる方法が知られている。(例えば、特許文献1参照)。
[特許文献1] 特開2009−086814号公報
しかし、あるユーザが類似する複数のソースコードのうち1つを修正した場合、他のソースコードは修正されないままとなり、不具合の原因となることがあった。このような問題は、ソースコードのみならず各種の文書の間でも発生する。
本発明の第1の態様においては、複数の文書間の類似度を算出する算出部と、第1の文書が変更されたことに応じて、変更前における第1の文書に対して第1基準以上の類似度を有する第2の文書を特定する特定部と、特定された第2の文書をユーザに通知する通知部とを備える情報処理装置、当該情報処理装置に用いられるプログラム、及び、当該銃砲処理装置により実行される方法を提供する。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
本実施形態の情報処理装置10の構成を示す。 本実施形態の情報処理装置10の処理フローを示す。 本実施形態の情報処理装置10が処理する複数の文書の例を示す。 本実施形態の情報処理装置10によるグループ化の一例を示す。 本実施形態の情報処理装置10による通知及び再グループ化の一例を示す。 本実施形態の情報処理装置10による通知及び再グループ化の一例を示す。 本実施形態の情報処理装置10による通知及び再グループ化の一例を示す。 コンピュータ1900のハードウェア構成の一例を示す。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、本実施形態の情報処理装置10の構成を示す。本実施形態において情報処理装置10は、複数のソースコード等の文書間の類似度を算出し、複数の文書のうち1つの文書に変更があった場合に、変更前の当該1つの文書と類似度の高い他の文書に関係するユーザ(例えば、文書の作成者、文書のレビュー担当者、及び/又は、複数の文書に係るプログラム開発をマネジメントするプロジェクトマネージャ)に、変更があった旨を通知する。
これにより、例えば、ある文書から引用されて記載されることにより、類似する文書が生成された場合等において、情報処理装置10は、一方の文書が変更されたことを他方の文書の関係者に知らせることができる。情報処理装置10は、入力部100、設定部106、算出部110、グループ生成部120、記憶部130、特定部140、更新部150、及び通知部160を備える。
入力部100は、複数の文書を入力する。本実施形態において、複数の文書のそれぞれはプログラムのソースコードである。ここで、各文書は、ソースファイル全体であってよく、ソースファイルのコードの一部(例えば、ルーチン、関数、その他の任意の単位)であってもよい。これに代えて、複数の文書のそれぞれは、自然言語で書かれた文章、ドキュメント等であってもよい。ここで、複数の文書の中には、他の文書をコピー又は引用して作成したクローン(ソースコードの場合にはコードクローン)が存在し得る。
入力部100は、入力した複数の文書を、複数の文書のそれぞれに関係するユーザの名前及びメールアドレス等のユーザ情報とともに、記憶部130に格納する。
入力部100は、ユーザによる編集作業により変更された文書を入力する。例えば、入力部100は、複数の文書のうち、変更対象となる第1の文書(「変更対象文書」と示す)が編集されたことに応じて、編集による変更後の変更対象文書を入力し、算出部110及び記憶部130に供給すると共に、変更対象文書に変更があった旨を特定部140に通知する。また、入力部100は、文書の変更の通知に関する設定を受け取り、設定部106に供給する。入力部100は、説明取得部102及び必要性取得部104を有する。
説明取得部102は、変更対象文書の変更に伴い、変更対象文書の変更内容を説明する説明文を、ユーザから取得する。説明取得部102は、取得した説明文を記憶部130に格納する。
必要性取得部104は、変更対象文書の変更に伴い、他の文書の変更が必要か否かを示す必要性情報をユーザから取得する。必要性取得部104は、取得した必要性情報を記憶部130に格納する。
設定部106は、入力部100を介して、変更前の変更対象文書に類似する1又は複数の第2の文書(「類似文書」と示す)に関係するユーザに対して、変更対象文書の変更を通知するか否かの指示をユーザから受け取る。設定部106は、当該指示に基づく設定を記憶部130に格納する。
算出部110は、記憶部130から複数の文書を読み出して、複数の文書間の類似度を算出する。算出部110は、算出した複数の文書間の類似度をグループ生成部120に供給する。
グループ生成部120は、算出部110から受け取った複数の文書間の類似度に基づいて、複数の文書のうち互いに予め定められた第1基準以上の類似度を有する2以上の文書をグループ化する。グループ生成部120は、複数の文書間の類似度及び各文書が属するグループの情報を記憶部130に格納する。
記憶部130は、情報処理装置10の各要素から受け取った情報を格納し、格納した情報を各要素に供給する。記憶部130は、情報処理装置10の主記憶装置、補助記憶装置、又は、情報処理装置10の外部に設けられた記憶装置であってもよい。記憶部130は、文書記憶部131、属性記憶部132、設定記憶部133、及び、ユーザ記憶部134を有する。
文書記憶部131は、入力部100から受け取った複数の文書を格納する。属性記憶部132は、複数の文書のそれぞれに対応付けて、文書の属性を記憶する。ここで、属性記憶部132は、文書の属性の一例として、複数の文書間の類似度及び各文書が属するグループの情報、文書の変更に伴い入力された説明文、文書が変更された場合の通知の要否を示す必要性情報を格納する。設定記憶部133は、設定部106から受け取った設定を格納する。ユーザ記憶部134は、入力部100から受け取った複数の文書のそれぞれに関係するユーザを格納する。
特定部140は、変更対象文書が変更されたことに応じて、変更対象文書と同一のグループに属する文書を特定し、同一のグループに属する文書のうち、変更前における変更対象文書に対して予め定められた第1基準以上の類似度を有する類似文書を特定する。
また、特定部140は、変更前における変更対象文書及び類似文書が非常に高い類似度を有するか否か、より具体的には、変更前における変更対象文書及び類似文書の類似度が、第1基準よりも高い第2基準以上であるか否かを判断する。特定部140は、当該判断結果に応じて、特定された類似文書の情報を更新部150又は通知部160に供給する。
更新部150は、類似度が非常に高い文書間の変更に伴い、他方の文書の更新情報を自動的に生成する。具体的には、更新部150は、類似文書の情報を特定部140から受け取り、変更対象文書に対する変更を類似文書に対して反映した類似文書の更新版を生成する。更新部150は、類似文書の更新版を文書記憶部131に格納し、更新した旨の更新情報を通知部160に供給する。
通知部160は、特定された類似文書の情報を特定部140から受け取り、ユーザに通知する。例えば、通知部160は、類似文書に関係するユーザをユーザ記憶部134から取得して、当該ユーザに対して、変更対象文書の変更情報及び類似文書を特定する情報を通知する。また、通知部160は、更新部150から更新情報を受け取った場合、類似文書の情報等に代えて、当該更新情報を通知してよい。
このように、本実施形態の情報処理装置10は、複数の文書の類似度を算出し、複数の文書のうち変更対象文書が変更されたことに応じて、変更前の変更対象文書と第1基準以上類似する類似文書を特定し、類似文書に関係するユーザに変更対象文書に変更があったこと等を通知する。これにより、情報処理装置10は、類似文書に関係するユーザに、変更対象文書と同様に類似文書を変更するように促すことができる。
図2は、本実施形態の情報処理装置10の処理フローを示す。本実施形態において、情報処理装置10は、プログラム開発において作成される1又は複数のソースファイルを管理する管理装置であってよく、S100からS122までの処理を実行する。
S100において、入力部100は、複数の文書として、情報処理装置10が管理する1又は複数のソースファイルを入力し、当該ソースファイルの少なくとも一部分の互いに類似する複数のソースコードを複数の文書として検出する。具体的には、入力部100は、1又は複数のソースファイルから、予め定められた長さ以上の同一の/類似する複数の文字列を検出することにより、ソースファイルから複数の類似する範囲を複数の文書として切り出す。
一例として、入力部100は、1又は複数のプログラムのソースファイルを入力し、ソースファイルからCCFinder等のコードクローン検出ツールを用いて複数の類似する又は同一のソースコードをコードクローンとして検出する。入力部100は、当該検出された複数のソースコードを複数の文書として文書記憶部131に格納する。
これに代えて、入力部100は、ソースファイルの一部であるルーチン又は関数等を単位として切り出し、このソースコードを複数の文書として格納してよい。入力部100は、複数の文書とともに当該複数の文書のそれぞれに関係するユーザを文書記憶部131に格納する。
また、設定部106は、入力部100を介して、文書の変更を当該文書と類似する文書に関係するユーザに対して通知するか否かの指示をユーザから受け取り、設定記憶部133に記憶する。
次に、S102において、算出部110は、複数の文書間の類似度を算出する。具体的には、算出部110は、文書記憶部131から複数の文書を読み出し、当該複数の文書において一致する文字列の数及び/又は長さ、及び/又は、複数の文書に含まれるコマンド、クラス、ファンクション、及び、変数の種類及び/又は名称等に基づいて、複数の文書間の類似度を算出する。この際、算出部110は、文書となるソースコードの処理フローの類似性に応じて類似度を算出してもよい。算出部110は、算出した複数の文書間の類似度をグループ生成部120に供給する。
次に、S104において、グループ生成部120は、算出部110から受け取った複数の文書間の類似度に基づいて、複数の文書のうち互いに予め定められた第1基準以上の類似度を有する2以上の文書をグループ化する。
例えば、グループ生成部120は、文書Aと文書Bの類似度、文書Aと文書Cの類似度、及び、文書Bと文書Cの類似度がいずれも予め定められた第1基準以上である場合、文書A、文書B、及び文書Cを同一グループとなるようにグループ化する。グループ生成部120は、複数の文書間の類似度及びグループの情報を属性記憶部132に格納する。
次に、S106において、入力部100は、複数の文書のうち変更対象文書が変更されたことに応じて、変更された変更対象文書を入力する。例えば、入力部100は、ソースファイルの更新版をチェックインし、当該更新版を、文書記憶部131から読み出した複数の文書と対比する。これにより、入力部100は、更新版に含まれる複数の文書に対応する文書を検出する。入力部100は、検出された複数の文書にする文書のうち更新版において変更があった文書を、変更された変更対象文書として入力する。
これに代えて、入力部100は、複数の文書のいずれかに対応する、変更されたソースコード等の文書を、変更された変更対象文書としてユーザから直接入力してもよい。入力部100は、変更後の変更対象文書を文書記憶部131に格納し、変更対象文書に変更があった旨を特定部140に通知する。
ここで、説明取得部102は、変更対象文書の変更内容を説明する説明文を、ユーザからの入力を受け、又は、ソースファイルの更新版から抽出することにより取得し、属性記憶部132に格納してよい。また、必要性取得部104は、変更対象文書の変更に伴う他の文書の変更が必要か否かを示す必要性情報をソースファイルの更新版又はユーザから直接から取得して属性記憶部132に記憶してよい。
次に、S110において、特定部140は、属性記憶部132に格納された複数の文書に係るグループ及び類似度の情報を読み出し、複数の文書から変更対象文書と同一のグループに属する文書を特定する。特定部140は、変更対象文書と同じグループに属する文書のうち、変更前における変更対象文書に対して第1基準以上の類似度を有する1又は複数の類似文書を特定する。
次に、S112において、特定部140は、変更前の変更対象文書との類似度が第1基準よりも高い第2基準以上となる類似文書が1つ以上存在するか否かを判断する。特定部140は、類似度が第2基準以上となる文書が1つ以上存在すれば、第2基準以上となる類似文書及び他の類似文書の情報を更新部150に供給し、処理をS114に進める。
特定部140は、全ての特定された類似文書と変更前の変更対象文書との類似度が第2基準未満であれば、類似文書の情報を通知部160に供給し、処理をS116に進める。
S114において、更新部150は、類似文書の情報を特定部140から受け取り、文書記憶部131から変更後の変更対象文書及び変更対象文書との類似度が第2基準以上となる類似文書を読み出す。更新部150は、読み出した類似文書に対して、変更対象文書に対する変更と同一の変更をしてよい。
また、例えば、更新部150は、変更対象文書と類似文書との間で処理フローは同じであるが使用される変数名が異なる場合には、変更対象文書に対する変更を類似文書における変数名を用いて適用させてよい。これにより、更新部150は、変更対象文書の変更を類似文書に反映した類似文書の更新版を生成する。
更新部150は、類似文書の更新版を文書記憶部131に格納し、類似文書を更新した旨の更新情報を通知部160に供給する。通知部160は、更新された類似文書に関係するユーザをユーザ記憶部134から取得して、当該ユーザに対して当該更新情報を通知する。また、通知部160は、更新されなかった類似文書に関係するユーザをユーザ記憶部134から取得して、当該ユーザに対して当該変更対象文書の変更及び類似文書の情報を通知する。
S116において、通知部160は、特定された類似文書の情報を特定部140から受け取り、類似文書に関係するユーザをユーザ記憶部134から取得して、当該ユーザに対して、変更対象文書の変更及び類似文書の情報を通知する。
ここで、通知部160は、設定記憶部133から変更対象文書の変更を類似文書に関係するユーザに対して通知するか否かの指示に基づく設定を読み出し、変更対象文書の変更を類似文書に関係するユーザに対して通知しない旨の設定がされていないことを条件として、変更対象文書の変更等をユーザに通知してもよい。これにより、通知部160は、文書の作成者等が通知を希望する場合のみ変更対象文書の変更を通知することができる。
また、通知部160は、属性記憶部132から変更対象文書の変更内容を説明する説明文を読み出し、類似文書に関係するユーザに対して当該説明文を通知してよい。これにより、情報処理装置10は、類似文書に関係するユーザが類似文書を変更する際に、変更対象文書の変更内容を参考させることができる。
また、通知部160は、属性記憶部132から変更対象文書の変更に伴う他の文書の変更が必要か否かを示す必要性情報を読み出し、類似文書に関係するユーザに対して当該必要性情報を通知してよい。これにより、情報処理装置10は、類似文書を変更する必要がないにもかかわらず、類似文書に関係するユーザが類似文書を変更することを防ぐ。
次に、S118において、算出部110は、文書記憶部131から変更前後の変更対象文書を読み出し、変更前の変更対象文書および変更後の変更対象文書の類似度を算出する。算出部110は、算出した類似度が予め定められた第3基準以上であれば処理をS106に戻し、当該第3基準未満であれば処理をS120に進める。
S120において、算出部110は、変更された変更対象文書を含む複数の文書間の類似度をS102と同様に再計算する。算出部110は、変更された文書と他の文書との間の類似度を算出し、変更されなかった文書同士の類似度の算出を省略してよい。
例えば、算出部110は、S114の処理が実行された場合、変更対象文書と他の文書との類似度、及び、類似文書のうち更新された文書と他の文書との類似度を計算してよい。算出部110は、S116の処理が実行された場合、変更対象文書と他の文書との類似度を計算してよい。算出部110は、算出した複数の文書間の類似度をグループ生成部120に供給する。
次に、S122において、グループ生成部120は、算出部110から受け取った複数の文書間の類似度に基づいて、変更後の変更対象文書を含む複数の文書のうち互いに予め定められた第1基準以上の類似度を有する2以上の文書を再グループ化する。
例えば、グループ生成部120は、変更された文書が、既存の一のグループを構成する全ての文書との間で予め定められた第1基準以上の類似度を有する場合、当該変更された文書を当該一のグループに加える。
一例として、文書A、B及びCが一のグループに含まれ、文書Dが変更されたことにより、文書Dが文書A、B及びCの全ての間の類似度が予め定められた第1基準以上となった場合には、グループ生成部120は、文書Dを文書A、B及びCからなる一のグループに追加する。
また、グループ生成部120は、変更された文書が、既存の一のグループを構成する文書の一部との間で予め定められた第1基準以上の類似度を有する場合、当該変更された文書と一部の文書とで構成される新しいグループを生成する。
一例として、文書A、B及びCが一のグループに含まれ、当該変更された文書Dと文書Aの類似度が第1基準以上となるが、文書Dと文書B及びCとの間の類似度が第1基準未満となる場合は、グループ生成部120は、文書Aと文書Dからなる新しいグループを生成する。
グループ生成部120は、変更された変更対象文書が属するグループ内の他の文書に対する変更対象文書の類似度が予め定められた第1基準未満となった場合においても、変更対象文書を当該グループ内の文書として維持してよい。
例えば、文書B及びCと同一グループに含まれる文書Aを修正したことにより、文書Bと文書Cの類似度が予め定められた第1基準以上となるが、文書Aと文書Bの類似度及び文書Aと文書Cの類似度が当該第1基準未満となるに至ったとしても、グループ生成部120は、文書A、文書B及び文書Cを同一グループとして維持してよい。
また、グループ生成部120は、再グループ化の結果、第1のグループに属する文書の組が、第2のグループに属する文書の組の部分集合となったことに応じて、第1のグループを削除して第2のグループに統合してよい。これにより、情報処理装置10は、重複するグループの処理を省略することができる。
グループ生成部120は、再計算された複数の文書間の類似度、及び、再グループ化されたグループの情報を属性記憶部132に格納する。次に、情報処理装置10は、処理をS106に戻す。
このように、本実施形態の情報処理装置10は、変更前の変更対象文書と類似する類似文書に関係するユーザに通知をすることにより、類似文書のユーザに対して変更対象文書と同様の変更をするように促すことができる。
また、本実施形態の情報処理装置10は、変更前の変更対象文書と類似文書が第1基準よりも大きい第2基準以上に類似するか否かを判断し、第2基準以上に類似する場合には類似文書を変更対象文書の変更に追随するように変更する。これにより、情報処理装置10は、変更前の変更対象文書が類似文書のコピーである等、両者が非常に類似する場合に、類似文書のユーザが類似文書を自ら変更する手間を省くことができる。
また、本実施形態の情報処理装置10は、変更前後の変更対象文書の類似度が予め定められた第3の基準以上であることを条件として、S120及びS122における変更対象文書と他の一部の文書との間の類似度の再計算を省略する。これにより、情報処理装置10は、変更対象文書の変更が軽微である場合には、再グループ化の処理を省略して処理負担を軽減することができる。
また、本実施形態の情報処理装置10は、一度グループに組み入れた文書を、グループ内の他の文書との類似度が下がった場合においてもグループ内に維持してよい。これにより、情報処理装置10は、元々の関連性の高かった複数の文書同士を、後の変更に関わらず紐づけておくことができる。
また、本実施形態の変形例として、情報処理装置10は、S112の判断結果を条件としてS114で類似文書を更新することに代えて/加えて、S106において「変更対象文書の変更に伴う他の文書の変更が必要である」旨の必要性情報を取得したことをさらに条件として、S114で類似文書を更新してもよい。
また、本実施形態の変形例として、情報処理装置10は、S118において「変更前後の変更対象文書の類似度が第3基準以上である」と判断した場合であっても、変更前の変更対象文書との類似度が、第1基準に対して予め定められた範囲内にある類似文書と変更後の変更対象文書との類似度を再計算し、変更対象文書と他の文書及び当該類似文書と他の文書とを再グループ化してもよい。
例えば、算出部110は、類似文書の少なくとも一部と変更前の変更対象文書との類似度が、第1基準−予め定められた値以上である場合、又は、第1基準±予め定められた値の範囲内である場合、当該少なくとも一部の類似文書と変更後の変更対象文書との類似度を再計算してよい。これにより、情報処理装置10は、変更対象文書と類似文書との類似度が第1の基準近傍であり、変更対象文書の変更により変更対象文書と類似文書のグループ関係が変更される可能性が高い場合に、グループ化の処理を実行することができる。
図3は、本実施形態の情報処理装置10が処理する複数の文書の例を示す。図示するように複数の文書A〜Dは、ソースファイルに含まれるコードクローン等の複数の類似するソースコードである。複数の文書A〜Dは、単一のソースファイルに複数含まれてよく、複数のソースファイル1及び2にまたがって含まれてよい。
図4〜7は、本実施形態の情報処理装置10による通知及びグループ化の一例を示す。まず、図4に示す通り、情報処理装置10は、文書A、文書B、文書C、及び文書Dを文書記憶部131に格納して管理する。文書Aは、文書B及びCとの類似度が0.9であり、文書Dとの類似度が0.8である。文書Bは、文書Cとの類似度は0.9であり、文書Dとの類似度が0.6である。文書Cは、文書Dとの類似度が0.6である。
情報処理装置10は、例えば、類似度0.7を第1基準として用い、類似度が0.7以上である文書A及びDをグループ化し(グループ1)、同様に相互の類似度が0.7以上である文書A、B及びCをグループ化する(グループ2)。
図5は、文書Aを変更した場合における情報処理装置10の通知及び再グループ化の一例を示す。通知部160は、文書Aを変更したことに応じて、変更前の文書Aとの類似度が第1基準の0.7以上であった文書B、文書C及び文書Dに関係するユーザに対して、文書Aを変更した旨の通知をする。
また、算出部110は、変更された文書Aと文書B、文書C及び文書Dとの類似度を再計算する。その結果、算出部110は、文書Aと文書Bとの類似度を0.6と算出し、文書Aと文書Cとの類似度を0.6と算出し、文書Aと文書Dとの類似度を0.9と算出する。
グループ生成部120は、類似度0.7を第1基準として、再計算された類似度が0.7以上である文書A及びDをグループ1として維持する。ここで、グループ生成部120は、変更後の文書Aと文書B及びCとの類似度は第1基準よりも小さい0.6であるが、文書Aの変更前に同一のグループであった文書A、B及びCをグループ2として維持する。
図6は、さらに文書Bを変更した場合における情報処理装置10の通知及び再グループ化の一例を示す。通知部160は、文書Bを変更したことに応じて、変更前の文書Bとの類似度が第1基準の0.7以上であった文書Cに関係するユーザに対して、文書Bを変更した旨の通知をする。情報処理装置10は、文書Bの変更を変更済の文書Aのユーザに通知しない。
また、算出部110は、変更された文書Bと文書A、文書C及び文書Dとの類似度を再計算する。その結果、算出部110は、文書Bと文書Aとの類似度を0.9と算出し、文書Bと文書Cとの類似度を0.6と算出し、文書Bと文書Dとの類似度を0.9と算出する。
グループ生成部120は、類似度0.7を第1基準として、文書A、B及びD間の類似度が全て第1基準0.7以上になったことに応じて、文書A及びDからなるグループ1に文書Bを追加する。また、グループ生成部120は、文書Bの変更前に同一のグループであった文書A、B及びCをグループ2として維持する。
図7は、さらに文書Cを変更した場合における情報処理装置10の通知及び再グループ化の一例を示す。変更前の文書Cとの類似度が第1基準の0.7以上であった文書が存在しないので、通知部160は、変更済の文書A及びBのいずれのユーザに対しても文書Cを変更した旨の通知をしない。
算出部110は、変更された文書Cと文書A、文書B及び文書Dとの類似度を再計算する。その結果、算出部110は、文書Cと文書Aとの類似度を0.9と算出し、文書Bと文書Cとの類似度を0.9と算出し、文書Bと文書Dとの類似度を0.9と算出する。
グループ生成部120は、類似度0.7を第1基準として、文書A、B、C及びD間の類似度が全て第1基準0.7以上になったことに応じて、文書A、B及びDからなるグループ1に文書Cを追加し、文書A、B及びCからなるグループ2に文書Dを追加する。ここで、グループ生成部120は、グループ1とグループ2が文書A、B、C及びDから構成される同一集合になったので、属性記憶部132からグループ1を削除してグループ2に統合する。
このように、本実施形態の情報処理装置10は、変更前の変更対象文書と類似する類似文書に関係するユーザに対して通知をする。これにより、情報処理装置10は、ユーザへの第1の文章の変更の通知が冗長になることを防ぐ。
図8は、情報処理装置10として機能するコンピュータ1900のハードウェア構成の一例を示す。本実施形態に係るコンピュータ1900は、ホスト・コントローラ2082により相互に接続されるCPU2000、RAM2020、グラフィック・コントローラ2075、及び表示装置2080を有するCPU周辺部と、入出力コントローラ2084によりホスト・コントローラ2082に接続される通信インターフェイス2030、ハードディスクドライブ2040、及びCD−ROMドライブ2060を有する入出力部と、入出力コントローラ2084に接続されるROM2010、フレキシブルディスク・ドライブ2050、及び入出力チップ2070を有するレガシー入出力部を備える。
ホスト・コントローラ2082は、RAM2020と、高い転送レートでRAM2020をアクセスするCPU2000及びグラフィック・コントローラ2075とを接続する。CPU2000は、ROM2010及びRAM2020に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ2075は、CPU2000等がRAM2020内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置2080上に表示させる。これに代えて、グラフィック・コントローラ2075は、CPU2000等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。
入出力コントローラ2084は、ホスト・コントローラ2082と、比較的高速な入出力装置である通信インターフェイス2030、ハードディスクドライブ2040、CD−ROMドライブ2060を接続する。通信インターフェイス2030は、有線又は無線によりネットワークを介して他の装置と通信する。また、通信インターフェイスは、入力部100、更新部150、及び通知部160等が情報処理装置10の外部のユーザ等と通信を行うハードウェアとして機能する。ハードディスクドライブ2040は、コンピュータ1900内のCPU2000が使用するプログラム及びデータを格納する。CD−ROMドライブ2060は、CD−ROM2095からプログラム又はデータを読み取り、RAM2020を介してハードディスクドライブ2040に提供する。
また、入出力コントローラ2084には、ROM2010と、フレキシブルディスク・ドライブ2050、及び入出力チップ2070の比較的低速な入出力装置とが接続される。ROM2010は、コンピュータ1900が起動時に実行するブート・プログラム、及び/又は、コンピュータ1900のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ2050は、フレキシブルディスク2090からプログラム又はデータを読み取り、RAM2020を介してハードディスクドライブ2040に提供する。入出力チップ2070は、フレキシブルディスク・ドライブ2050を入出力コントローラ2084へと接続するとともに、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を入出力コントローラ2084へと接続する。
RAM2020を介してハードディスクドライブ2040に提供されるプログラムは、フレキシブルディスク2090、CD−ROM2095、又はICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、RAM2020を介してコンピュータ1900内のハードディスクドライブ2040にインストールされ、CPU2000において実行される。
コンピュータ1900にインストールされ、コンピュータ1900を情報処理装置10として機能させるプログラムは、入力モジュールと、説明取得モジュールと、必要性取得モジュールと、設定モジュールと、算出モジュールと、グループ生成モジュールと、特定モジュールと、通知モジュールと、更新モジュールとを備える。これらのプログラム又はモジュールは、CPU2000等に働きかけて、コンピュータ1900を、入力部100と、説明取得部102と、必要性取得部104と、設定部106と、算出部110と、グループ生成部120と、特定部140と、更新部150と、通知部160としてそれぞれ機能させてよい。
これらのプログラムに記述された情報処理は、コンピュータ1900に読込まれることにより、ソフトウェアと上述した各種のハードウェア資源とが協働した具体的手段である入力部100と、説明取得部102と、必要性取得部104と、設定部106と、算出部110と、グループ生成部120と、特定部140と、更新部150と、通知部160として機能する。そして、これらの具体的手段によって、本実施形態におけるコンピュータ1900の使用目的に応じた情報の演算又は加工を実現することにより、使用目的に応じた特有の情報処理装置10が構築される。
一例として、コンピュータ1900と外部の装置等との間で通信を行う場合には、CPU2000は、RAM2020上にロードされた通信プログラムを実行し、通信プログラムに記述された処理内容に基づいて、通信インターフェイス2030に対して通信処理を指示する。通信インターフェイス2030は、CPU2000の制御を受けて、RAM2020、ハードディスクドライブ2040、フレキシブルディスク2090、又はCD−ROM2095等の記憶装置上に設けた送信バッファ領域等に記憶された送信データを読み出してネットワークへと送信し、もしくは、ネットワークから受信した受信データを記憶装置上に設けた受信バッファ領域等へと書き込む。このように、通信インターフェイス2030は、DMA(ダイレクト・メモリ・アクセス)方式により記憶装置との間で送受信データを転送してもよく、これに代えて、CPU2000が転送元の記憶装置又は通信インターフェイス2030からデータを読み出し、転送先の通信インターフェイス2030又は記憶装置へとデータを書き込むことにより送受信データを転送してもよい。
また、CPU2000は、ハードディスクドライブ2040、CD−ROMドライブ2060(CD−ROM2095)、フレキシブルディスク・ドライブ2050(フレキシブルディスク2090)等の外部記憶装置に格納されたファイルまたはデータベース等の中から、全部または必要な部分をDMA転送等によりRAM2020へと読み込ませ、RAM2020上のデータに対して各種の処理を行う。そして、CPU2000は、処理を終えたデータを、DMA転送等により外部記憶装置へと書き戻す。このような処理において、RAM2020は、外部記憶装置の内容を一時的に保持するものとみなせるから、本実施形態においてはRAM2020及び外部記憶装置等をメモリ、記憶部、または記憶装置等と総称し、例えば、記憶部130、文書記憶部131、属性記憶部132、設定記憶部133、及び、ユーザ記憶部134として機能する。本実施形態における各種のプログラム、データ、テーブル、データベース等の各種の情報は、このような記憶装置上に格納されて、情報処理の対象となる。なお、CPU2000は、RAM2020の一部をキャッシュメモリに保持し、キャッシュメモリ上で読み書きを行うこともできる。このような形態においても、キャッシュメモリはRAM2020の機能の一部を担うから、本実施形態においては、区別して示す場合を除き、キャッシュメモリもRAM2020、メモリ、及び/又は記憶装置に含まれるものとする。
また、CPU2000は、RAM2020から読み出したデータに対して、プログラムの命令列により指定された、本実施形態中に記載した各種の演算、情報の加工、条件判断、情報の検索・置換等を含む各種の処理を行い、RAM2020へと書き戻す。例えば、CPU2000は、条件判断を行う場合においては、本実施形態において示した各種の変数が、他の変数または定数と比較して、大きい、小さい、以上、以下、等しい等の条件を満たすか否かを判断し、条件が成立した場合(又は不成立であった場合)に、異なる命令列へと分岐し、またはサブルーチンを呼び出す。
また、CPU2000は、記憶装置内のファイルまたはデータベース等に格納された情報を検索することができる。例えば、第1属性の属性値に対し第2属性の属性値がそれぞれ対応付けられた複数のエントリが記憶装置に格納されている場合において、CPU2000は、記憶装置に格納されている複数のエントリの中から第1属性の属性値が指定された条件と一致するエントリを検索し、そのエントリに格納されている第2属性の属性値を読み出すことにより、所定の条件を満たす第1属性に対応付けられた第2属性の属性値を得ることができる。
以上に示したプログラム又はモジュールは、外部の記録媒体に格納されてもよい。記録媒体としては、フレキシブルディスク2090、CD−ROM2095の他に、DVD又はCD等の光学記録媒体、MO等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワーク又はインターネットに接続されたサーバシステムに設けたハードディスク又はRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムをコンピュータ1900に提供してもよい。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。そのような変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
10 情報処理装置、100 入力部、102 説明取得部、104 必要性取得部、106 設定部、110 算出部、120 グループ生成部、130 記憶部、131 文書記憶部、132 属性記憶部、133 設定記憶部、134 ユーザ記憶部、140 特定部、150 更新部、160 通知部、1900 コンピュータ、2000 CPU、2010 ROM、2020 RAM、2030 通信インターフェイス、2040 ハードディスクドライブ、2050 フレキシブルディスク・ドライブ、2060 CD−ROMドライブ、2070 入出力チップ、2075 グラフィック・コントローラ、2080 表示装置、2082 ホスト・コントローラ、2084 入出力コントローラ、2090 フレキシブルディスク、2095 CD−ROM

Claims (15)

  1. 複数の文書間の類似度を算出する算出部と、
    第1の文書が変更されたことに応じて、変更前における前記第1の文書に対して第1基準以上の類似度を有する第2の文書を特定する特定部と、
    特定された前記第2の文書をユーザに通知する通知部と、
    変更前における前記第1の文書および前記第2の文書の類似度が、前記第1基準よりも高い第2基準以上であることを条件として、前記第1の文書に対する変更を前記第2の文書に対して反映した前記第2の文書の更新版を生成する更新部と、
    を備える情報処理装置。
  2. 複数の文書間の類似度を算出する算出部と、
    第1の文書が変更されたことに応じて、変更前における前記第1の文書に対して第1基準以上の類似度を有する第2の文書を特定する特定部と、
    特定された前記第2の文書をユーザに通知する通知部と、
    を備え、
    前記算出部は、変更前の前記第1の文書および変更後の前記第1の文書の類似度を算出し、
    変更前後の前記第1の文書の類似度が第3基準以上であることを条件として、前記第1の文書と他の一部の文書との間の類似度の再計算を省略する、
    情報処理装置。
  3. 前記複数の文書のそれぞれに関係するユーザを記憶するユーザ記憶部を備え、
    前記通知部は、特定された前記第2の文書に関係するユーザを前記ユーザ記憶部から取得して、当該ユーザに対して前記第1の文書の変更を通知する
    請求項1又は2に記載の情報処理装置。
  4. 前記複数の文書のうち互いに第1基準以上の類似度を有する2以上の文書をグループ化するグループ生成部をさらに備え、
    前記特定部は、前記第1の文書が変更されたことに応じて、前記第1の文書と同一のグループに属する前記第2の文書を特定する
    請求項1から3のいずれか1項に記載の情報処理装置。
  5. 前記グループ生成部は、前記第1の文書が変更されたことに応じて前記第1の文書が属するグループ内の他の文書に対する前記第1の文書の類似度が第1基準未満となった場合においても、前記第1の文書を当該グループ内の文書として維持し、
    前記特定部は、前記第1の文書が変更されたことに応じて、前記第1の文書と同一のグループに属し、かつ変更前の前記第1の文書に対して第1基準以上の類似度を有する前記第2の文書を特定する
    請求項に記載の情報処理装置。
  6. 前記グループ生成部は、第1のグループに属する文書の組が、第2のグループに属する文書の組の部分集合となったことに応じて、前記第1のグループを削除して前記第2のグループに統合する請求項またはに記載の情報処理装置。
  7. 前記第1の文書の変更内容を説明する説明文をユーザから取得する説明取得部をさらに備え、
    前記通知部は、前記第2の文書に関係するユーザに対して前記説明文を通知する
    請求項1からのいずれか一項に記載の情報処理装置。
  8. 前記第1の文書の変更に伴う他の文書の変更が必要か否かを示す必要性情報をユーザから取得する必要性取得部をさらに備え、
    前記通知部は、前記第2の文書に関係するユーザに対して前記必要性情報を通知する
    請求項1からのいずれか一項に記載の情報処理装置。
  9. 変更前における前記第1の文書および前記第2の文書の類似度が、前記第1基準よりも高い第2基準以上であることを条件として、前記第1の文書に対する変更を前記第2の文書に対して反映した前記第2の文書の更新版を生成する更新部をさらに備える請求項項に記載の情報処理装置。
  10. 前記第1の文書の変更を前記第2の文書に関係するユーザに対して通知するか否かをユーザからの指示に基づき設定する設定部をさらに備え、
    前記通知部は、前記第1の文書の変更を前記第2の文書に関係するユーザに対して通知しない旨の設定がされていないことを条件として、前記第1の文書の変更をユーザに通知する
    請求項1からのいずれか一項に記載の情報処理装置。
  11. 当該情報処理装置は、プログラム開発において作成される複数のソースファイルを管理する管理装置として機能し、
    前記算出部は、一のソースファイルの更新版がチェックインされたことに応じて、当該管理装置が管理する前記複数のソースファイルの少なくとも一部分のソースコードである前記複数の文書間の類似度を算出する
    請求項1から10のいずれか一項に記載の情報処理装置。
  12. コンピュータを
    複数の文書間の類似度を算出する算出部と、
    第1の文書が変更されたことに応じて、変更前における前記第1の文書に対して第1基準以上の類似度を有する第2の文書を特定する特定部と、
    特定された前記第2の文書をユーザに通知する通知部と、
    変更前における前記第1の文書および前記第2の文書の類似度が、前記第1基準よりも高い第2基準以上であることを条件として、前記第1の文書に対する変更を前記第2の文書に対して反映した前記第2の文書の更新版を生成する更新部と、
    として機能させるプログラム。
  13. コンピュータを
    複数の文書間の類似度を算出する算出部と、
    第1の文書が変更されたことに応じて、変更前における前記第1の文書に対して第1基準以上の類似度を有する第2の文書を特定する特定部と、
    特定された前記第2の文書をユーザに通知する通知部と、
    として機能させ、
    前記算出部は、変更前の前記第1の文書および変更後の前記第1の文書の類似度を算出し、
    変更前後の前記第1の文書の類似度が第3基準以上であることを条件として、前記第1の文書と他の一部の文書との間の類似度の再計算を省略する、
    プログラム。
  14. 複数の文書間の類似度を算出する算出段階と、
    第1の文書が変更されたことに応じて、変更前における前記第1の文書に対して第1基準以上の類似度を有する第2の文書を特定する特定段階と、
    特定された前記第2の文書をユーザに通知する通知段階と、
    変更前における前記第1の文書および前記第2の文書の類似度が、前記第1基準よりも高い第2基準以上であることを条件として、前記第1の文書に対する変更を前記第2の文書に対して反映した前記第2の文書の更新版を生成する更新段階と、
    を備える情報処理方法。
  15. 複数の文書間の類似度を算出する算出段階と、
    第1の文書が変更されたことに応じて、変更前における前記第1の文書に対して第1基準以上の類似度を有する第2の文書を特定する特定段階と、
    特定された前記第2の文書をユーザに通知する通知段階と、
    を備え、
    前記算出段階において、変更前の前記第1の文書および変更後の前記第1の文書の類似度を算出し、変更前後の前記第1の文書の類似度が第3基準以上であることを条件として、前記第1の文書と他の一部の文書との間の類似度の再計算を省略する、
    情報処理方法。
JP2013016345A 2013-01-31 2013-01-31 情報処理装置、情報処理方法及びプログラム Active JP6070936B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013016345A JP6070936B2 (ja) 2013-01-31 2013-01-31 情報処理装置、情報処理方法及びプログラム
US14/168,233 US9275020B2 (en) 2013-01-31 2014-01-30 Tracking changes among similar documents
US14/943,654 US10169393B2 (en) 2013-01-31 2015-11-17 Tracking changes among similar documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013016345A JP6070936B2 (ja) 2013-01-31 2013-01-31 情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014149564A JP2014149564A (ja) 2014-08-21
JP6070936B2 true JP6070936B2 (ja) 2017-02-01

Family

ID=51223024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013016345A Active JP6070936B2 (ja) 2013-01-31 2013-01-31 情報処理装置、情報処理方法及びプログラム

Country Status (2)

Country Link
US (2) US9275020B2 (ja)
JP (1) JP6070936B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6070936B2 (ja) * 2013-01-31 2017-02-01 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理方法及びプログラム
US10249068B2 (en) 2015-04-29 2019-04-02 International Business Machines Corporation User experience for multiple uploads of documents based on similar source material
US10262052B2 (en) 2016-08-08 2019-04-16 International Business Machines Corporation On demand synchronization of information
JP6824053B2 (ja) * 2017-01-26 2021-02-03 三菱電機株式会社 関係分析装置および関係分析プログラム
US10902037B2 (en) * 2017-08-28 2021-01-26 International Business Machines Corporation Cognitive data curation on an interactive infrastructure management system
CN108182202B (zh) * 2017-12-07 2021-01-05 广东智媒云图科技股份有限公司 内容更新通知方法、装置、电子设备及存储介质
JP7183592B2 (ja) * 2018-07-02 2022-12-06 富士フイルムビジネスイノベーション株式会社 業務テンプレート変更装置及びプログラム
JP7331404B2 (ja) * 2019-03-25 2023-08-23 富士フイルムビジネスイノベーション株式会社 文書管理装置及びプログラム
US11567913B2 (en) * 2019-04-10 2023-01-31 Veritas Technologies Llc Method and system for improving efficiency in the management of data references
JP2021039624A (ja) * 2019-09-04 2021-03-11 富士ゼロックス株式会社 情報処理装置および情報処理システム
US11437038B2 (en) 2020-12-11 2022-09-06 International Business Machines Corporation Recognition and restructuring of previously presented materials
US20230185859A1 (en) * 2021-12-13 2023-06-15 Toshiba Tec Kabushiki Kaisha Document management device, document management method, and non-transitory recording medium

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3632354B2 (ja) * 1997-02-12 2005-03-23 Kddi株式会社 情報検索装置
US7493568B2 (en) * 2001-01-26 2009-02-17 Microsoft Corporation System and method for browsing properties of an electronic document
JP4399127B2 (ja) * 2001-05-14 2010-01-13 株式会社日立製作所 文書管理方法及び装置並びにその処理プログラム及びそれを格納した記憶媒体
US6778979B2 (en) * 2001-08-13 2004-08-17 Xerox Corporation System for automatically generating queries
US7133862B2 (en) * 2001-08-13 2006-11-07 Xerox Corporation System with user directed enrichment and import/export control
US6732090B2 (en) * 2001-08-13 2004-05-04 Xerox Corporation Meta-document management system with user definable personalities
JP2004062479A (ja) * 2002-07-29 2004-02-26 Fujitsu Ltd 情報収集装置、方法及びプログラム
US7290018B2 (en) * 2002-10-23 2007-10-30 Sap Aktiengesellschaft Change-driven replication of data
JP4360942B2 (ja) 2004-03-05 2009-11-11 三菱電機株式会社 ソフトウェア開発支援装置
JP2005301859A (ja) 2004-04-15 2005-10-27 Fujitsu Ltd コード検索プログラム及びコード検索装置
JP2006031292A (ja) * 2004-07-14 2006-02-02 Fuji Xerox Co Ltd 文書処理装置、文書処理方法及び文書処理プログラム
US7814105B2 (en) * 2004-10-27 2010-10-12 Harris Corporation Method for domain identification of documents in a document database
US20070101256A1 (en) 2005-11-01 2007-05-03 Charles Simonyi Perfect source control
US20070112867A1 (en) * 2005-11-15 2007-05-17 Clairvoyance Corporation Methods and apparatus for rank-based response set clustering
JP2009086814A (ja) 2007-09-28 2009-04-23 Hitachi Software Eng Co Ltd ソースコード管理システム
JP2009276862A (ja) * 2008-05-13 2009-11-26 Ricoh Co Ltd 文書管理システム、サーバ装置、クライアント装置、文書管理方法、プログラムおよび記録媒体
JP4816699B2 (ja) * 2008-09-03 2011-11-16 ソニー株式会社 楽曲処理方法、楽曲処理装置、及びプログラム
US8744135B2 (en) * 2008-09-16 2014-06-03 Kendyl A. Román Methods and data structures for multiple combined improved searchable formatted documents including citation and corpus generation
JP4762327B2 (ja) * 2009-03-24 2011-08-31 シャープ株式会社 画像処理装置及び画像形成装置
JP2010277572A (ja) 2009-04-28 2010-12-09 Sharp Corp コード生成プログラム、それを記録したコンピュータ読み取り可能な記録媒体、コード生成装置、およびコード生成方法
JP5345020B2 (ja) 2009-08-27 2013-11-20 新日鉄住金ソリューションズ株式会社 クローンコード検出評価装置、クローンコード検出評価方法及びプログラム
JP2013074461A (ja) * 2011-09-28 2013-04-22 Casio Comput Co Ltd 画像処理装置、画像処理方法及びプログラム
US20130212100A1 (en) * 2012-01-23 2013-08-15 Google Inc. Estimating rate of change of documents
US8826430B2 (en) * 2012-11-13 2014-09-02 Palo Alto Research Center Incorporated Method and system for tracing information leaks in organizations through syntactic and linguistic signatures
JP6070936B2 (ja) * 2013-01-31 2017-02-01 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理方法及びプログラム
JP6318588B2 (ja) * 2013-12-04 2018-05-09 富士通株式会社 生体認証装置、生体認証方法及び生体認証用コンピュータプログラム
JP6544900B2 (ja) * 2014-09-17 2019-07-17 キヤノン株式会社 オブジェクト識別装置、オブジェクト識別方法及びプログラム
US9767380B2 (en) * 2015-04-13 2017-09-19 Varian Medical Systems International Ag. Image comparison tool tolerant to deformable image matching

Also Published As

Publication number Publication date
US20140212053A1 (en) 2014-07-31
US20160350354A1 (en) 2016-12-01
JP2014149564A (ja) 2014-08-21
US10169393B2 (en) 2019-01-01
US9275020B2 (en) 2016-03-01

Similar Documents

Publication Publication Date Title
JP6070936B2 (ja) 情報処理装置、情報処理方法及びプログラム
US10496755B2 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium storing program
US8494996B2 (en) Creation and revision of network object graph topology for a network performance management system
US7689578B2 (en) Dealing with annotation versioning through multiple versioning policies and management thereof
US8201079B2 (en) Maintaining annotations for distributed and versioned files
US8219591B2 (en) Graph query adaptation
US8732127B1 (en) Method and system for managing versioned structured documents in a database
US20160371238A1 (en) Computing device and method for converting unstructured data to structured data
JP6982049B2 (ja) インデックスを管理するための方法、装置、設備及び記憶媒体
CN107526746B (zh) 管理文档索引的方法和设备
JP6048957B2 (ja) 情報処理装置、プログラム、及び情報処理方法
JP5555550B2 (ja) データ変換方法、その装置およびそのプログラム
JP2018045286A (ja) 前処理装置、インデックス追加ツリーデータ修正方法及びインデックス追加ツリーデータ修正プログラム
US10394551B2 (en) Managing kernel application binary interface/application programming interface-based discrepancies relating to kernel packages
JP5943356B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
WO2022262240A1 (zh) 数据处理方法、电子设备及存储介质
WO2023081032A1 (en) Query-based database redaction
JP4251633B2 (ja) 判定装置、プログラム、記録媒体、及び判定方法
JP7381290B2 (ja) 計算機システム及びデータの管理方法
JP2020024507A (ja) 文書ファイル移行装置
JP6124640B2 (ja) 文書管理装置、情報処理方法及びプログラム
CN112988668B (zh) 基于PostgreSQL的流式文档处理方法、装置以及装置的应用方法
WO2023223424A1 (ja) ドキュメント生成装置、プログラム及びドキュメント生成方法
JP5696280B1 (ja) 用語統一システム及び用語統一プログラム、並びに用語統一方法
US9984173B2 (en) Automated value analysis in legacy data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161129

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20161201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161220

R150 Certificate of patent or registration of utility model

Ref document number: 6070936

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150