JP5064510B2 - デジタル文書を管理するコンピュータベースツール - Google Patents
デジタル文書を管理するコンピュータベースツール Download PDFInfo
- Publication number
- JP5064510B2 JP5064510B2 JP2009533901A JP2009533901A JP5064510B2 JP 5064510 B2 JP5064510 B2 JP 5064510B2 JP 2009533901 A JP2009533901 A JP 2009533901A JP 2009533901 A JP2009533901 A JP 2009533901A JP 5064510 B2 JP5064510 B2 JP 5064510B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- signature
- imprint
- function
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006870 function Effects 0.000 claims description 306
- 238000000034 method Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims 4
- 230000001419 dependent effect Effects 0.000 description 28
- 230000000875 corresponding effect Effects 0.000 description 18
- 238000007726 management method Methods 0.000 description 17
- 238000012986 modification Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 238000007792 addition Methods 0.000 description 8
- 230000018109 developmental process Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 238000003860 storage Methods 0.000 description 7
- 230000001186 cumulative effect Effects 0.000 description 5
- JHLDJOBIUVJSTG-UHFFFAOYSA-N tdiq Chemical compound C1CNCC2=C1C=C1OCOC1=C2 JHLDJOBIUVJSTG-UHFFFAOYSA-N 0.000 description 5
- 238000005520 cutting process Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 description 3
- 230000008033 biological extinction Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
- G06F21/105—Arrangements for software license management or administration, e.g. for managing licenses at corporate level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2151—Time stamp
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/71—Version control; Configuration management
Description
用語「Pi」はデジタル文書セットを示す。例えば、セットPiはソフトウェアプロジェクトであり、このソフトウェアプロジェクトは、「sources(ソース)」として知られる(即ち、直接実行できないが、一連の実行可能な命令にコンパイルされるように意図されたコンピュータコードを含んだ)タイプのコンピュータファイルセットと、ソフトウェア用の記述、文書化、および/または全ての準備文書を含むテキストファイルのような関連デジタル文書とを備えていてもよい。また、文書セットPiは、データベースを使用して編成されたファイル、XML(「eXtensible Markup Language」(拡張マークアップ言語)を表す)タイプまたはSVG(「Scale Vector Graphics」(スケーラブル・ベクトル・グラフィックス)を表す)タイプのファイルから作成されることができる。
Pi={Sij|jは{1、・・・、Ji}に属する}
である。
Sij={Oijl|lは{1、・・・、Lij}に属する}
である。
図1を参照すると、電子文書100を管理するツールは、インプリント生成モジュールSignM110を備え、このSignM110の配列は、文書セットPiにおける文書のコンテンツの特徴を示すデジタル署名のセットを有するデジタルインプリントEiを当該文書セットPiに関連付けできるようになっている。
モジュールSignM110は、文書Oijlのコンテンツのデジタル文書インプリントEijlの特徴を確立できる文書インプリント生成関数signO()を備えている。デジタル文書インプリントEijlは、文書Oijlのコンテンツに従って生成されたデジタル署名セットを備えている。
文書識別子Oijl、例えば、指数i、j、lの値からなる識別子、
文書Oijlにおける要素インプリントEijlkのそれぞれへの参照、例えば、指数i、j、l、kからなる参照、
文書Oijlの時間基準TPijlの値、例えば日付Tij。
状態インプリント識別子Eij、例えば指数i、jの値からなる識別子、および、
例えば指数i、j、1からなる状態Sijの文書インプリントEijlのそれぞれへの参照。
文書セットインプリントEiの識別子、例えば指数iの値からなる識別子、および、
例えば指数i、jからなる状態インプリントEijのそれぞれへの参照。
指数iの値を記憶する列COL301と、指数jの値を記憶する列COL302と、指数lの値を記憶する列COL303と、指数kの値を記憶する列COL304とからなる文書要素への参照、
列COL305においてこの文書要素の署名の値、
列COL306においてこの要素の属の値、
列COL307においてこの要素が開始された文書の時間基準の値、
列COL308においてこの要素が開始された文書の属性の値。
例えば値i、j、l、kを備えた前記特定の署名を含んだ要素インプリメントEijlkの識別子と、
ベースWDB120内の要素インプリントEijlkに関して文書インプリントEijlの時間基準TPijl、例えば日付Tijと、
を保持するように配列され、
関数SignTp()はテーブルSignTb[]を満たすように配列されて、その署名値が見つかったベースWDB120内に記憶された要素インプリントEijlk毎に識別子を含むようにしている。
前記署名値Niqを記憶する1つの列(COL601)と、
コンテンツが署名値Niqを生成した文書要素の指数の値i、jqp、lqp、kqpを記憶する複数の列(COL602〜COL605)と、
前記文書要素が始まった文書の時間基準TPi、jqp、lqp、この場合には日付Ti、jqp(COL606)と、
署名データムの値Viq(COL609)と、
該当する場合には、前記要素AEiqp、jqp、lqp、kqpの属性の値(COL607)と、
前記文書要素AOi、jqp、lqpが始まった文書の属性の値(COL608)と、
文書データムの値Wiq(COL610)と、
を含み;
このテーブルは、署名値Niqを含む全ての要素インプリント、即ちこの場合にはr個のインプリントEi、jq1、lq1、kq1〜Ei、jqr、lqr、kqrを記憶するように満たされている。
文書セットPiの識別子、例えば指数iと、
それぞれの異なる署名値Niqと、
前記の署名値Niqに関連した署名データムViqと、
を記憶している。
署名値Niqを記憶する1つの列(COL601)と、
その署名値Niqが始まった文書要素Ci、jqp、lqp、kqpへの参照、この場合に指数i、j、l、kの値の形態での文書要素Ci、jqp、lqp、kqpへの参照(COL602〜COL605)と、
その文書要素Ci、jqp、lqp、kqpが始まった文書Oi、jqp、lqpの時間基準TPi、jqp、lqp(COL606)、この場合には日付Tiqp、jqpと、
署名データムViqの値(COL609)と、
該当する場合には要素Ci、jqp、lqp、kqpの属性AEi、jqp、lqp、kqpの値(COL607)と、
文書要素Ci、jqp、lqp、kqpが始まった文書Oi、jqp、lqpの属性AOi、jqp、lqpの値(COL608)と、
文書データムWiqの値(COL610)と、
を含み、
前記テーブルは、文書セットPiの全ての署名値Niqを同時にもたらすように満たされている。言い換えれば、ここで記述された実施の形態は、同一のテーブル内において、文書セットPiの署名値Niq毎に作成されたテーブル602と同じタイプの複数のテーブルを組み合わせることから構成されている。
関数signO()は、図7を参照して、ある特定の実施の形態において詳細に記述される。
例えばテキストタイプの文書の書式のみに関連し、恐らくは自動的に実行されている修正(例えば、連続したスペース文字または空行の追加)、および、
例えば関数名あるいは変数名の変更、または、著作権についての参照の削除あるいは追加のようなコンテンツの書き換え。
文書要素のサイズ、例えばソースファイル関数の場合には多数のコード行数または文字と、
低い関連性の指数に関係した署名リストであって、恐らく1タイプの文書に特有であるリストにおける署名の存在と、
文書への貢献の観点からその文書および/またはアクティビティへの貢献者の数。
ある特定の実施の形態では、関数dat()は、考慮中の署名Niqの存在期間を署名データムViqとして確立するように設計されている。
ある特定の実施の形態では、モジュールSignM110は、例えばCVSタイプのバージョン管理ツールまたはそれと同等のものと対話を行なうように設計されている。
文書セット内の1文書が変更されたら直ぐに新規な状態、または
同一貢献の過程で多数の文書を変更する新規な状態。
図10にPDBベース130の構造の一例が示される。
別の行の署名値と異なった、文書セットPiの特定の署名値Niqを記憶する署名列1002と、
例えば指数iの値の記憶する文書セットへの参照列1004と、
署名データムNiqの値に関連した署名データムViq、例えばこの場合では文書セットPi内での署名値Niqの出現日付TAiqを記憶する署名データム列1006。
要素データムZiq、例えばこの場合には関連性指数Biqの値を記憶する要素属性データム用列1008と、
文書データムWiq、例えばこの場合には貢献者識別子Aiqを記憶する文書データム列1010。
本発明によるツールは文書セット比較モジュールComM140を備え、この文書セット比較モジュールComM140は、ベースPDB130において文書セットPiと別の文書セットPi′との両方に関連する署名値のセットを生成するように設計されている。これにより、文書セットPiの文書要素Oijlが別の文書セットPi′内で見つけられていることを決定することが可能になる。
署名値Nmと、
その署名値に対してソース文書セットPOmへの(即ち、文書セットP1またはP2の一方への)参照と、
その署名値に対して宛先文書セットPDmへの(即ち、文書セットP1またはP2の他方への)参照と、
を備えるようになり、テーブルPdepTb[]は、セットE′12の各署名値Nmをカウントするように満たされ、ソース文書セットPOmおよび宛先文書セットPDmは、署名データV1mおよびV2mから開始する方位関数dir()を使って、即ちセットE′1およびE′2内で署名値Nmに対応する署名データV1qおよびV2q′の値をそれぞれ使って決定される。ソース文書セットによって、署名値Nmを伴う文書要素Cijlkが宛先文書セット内へインポートされた可能性が最も高い文書セットが表される。
署名データV1mおよびV2mから確立されるかもしれない従属属性Fm、例えばソース文書セットPOm内での署名値Nmの最初の出現日付と、
文書属性データW1qおよびW2qから確立されるかもしれない文書従属属性Gm、例えば署名値を生成する要素が始まった文書タイプを特徴付け、または時間基準の信頼性指数を特徴付けるデータと、
要素属性データZ1qおよびZ2qから確立されるかもしれない要素従属属性Hm、例えば署名値Nmを生成する要素のサイズの指摘。
関数comp()は、テーブルPdepTb[]の従属性を寄せ集めることが可能な集合関数を呼び出すように配列されている。これは、このテーブルPdepTb[]内の属性の数が相当数である場合には特に有利である。
POmがP1と等値になるようにE″12の全ての従属性と、
POmがP2と等値になるようにE″12の全ての従属性(ステップ1300)。
POmがP1と等値になるようにテーブルPdepTb[]内の行、即ち署名値Nmおよびそれらの値に関連するデータと、
POmがP2と等値になるようにテーブルPdepTb[]内の行、即ち署名値Nmおよびそれらの値に関連するデータ。
当該集合体に含まれている署名値Nm(およびこれにより従属性)の数、
例えば文書従属属性Gmから計算された時間基準の信頼性指数の平均値、および/または、
署名値Nmが当該集合体に含まれた文書要素の累積サイズ、例えばそれらの署名の要素従属属性Hmから計算される累積サイズを示す値。
従属性または集合体のサブセットDe12uを確立するように、配列されてもよい(ステップ1402)。言い換えれば、関数agrDep2()は、署名が文書セットP1内に同一の出現日付を有する集合体De12uにセットD12を分割するように配列されている。
この実施の形態では、モジュールComM140は、前述した意味において、1つの文書セットPiをいくつかの文書セットPi′と比較するように配列されている。
署名値Nmと、
その署名値に対してソース文書セットPOmへの(即ち、特に、セットP1またはセットPnのうちの1つへの)参照と、
その署名値に対して宛先文書セットPDm(即ち、POmがP1と同等である場合には特定のセットPn、または、POmが特定のセットPnと同等である場合にはセットP1)への参照。
署名値V1およびVnmに基づいて確立できる従属属性Fm、例えば、ソース文書セットPOm内での署名値Nmの最初の出現日付と、
文書属性データW1qおよびWnqに基づいて確立できる文書従属属性Gm、例えば、署名値生成要素が始まった文書のタイプを、または、時間基準の信頼性の指数を特徴付けるデータムと、
要素属性データZ1qおよびZnqに基づいて確立できる要素従属属性Hm、例えば、署名値生成要素Nmのサイズの表示。
宛先文書セットの状態、
貢献者の識別子、および/または、
時間間隔。
この実施の形態では、モジュールComM140は、多数の文書セットPiを相互に比較するように配置されている。モジュールComM140は、文書セットPi毎に関数comp1N()を連続的に呼び出して、従属性E″NNのセットを確立するように配置された比較関数compNN()を備えている。
権利管理モジュールRightsM150は、モジュールComM140およびベースPDB130と対話するように配列されている。
ソース文書セットPOmへの参照のセット(これ以降Pi′と示す)、
ソース文書セットPi′の各々に関連した要素属性AEi′、jqp、lqp、kqpのセット、
ソース文書セットPi′の各々に関連した文書属性AOi′、jqp、lqpのセット、例えば全ての貢献者識別子Ai′、jqp、
ソース文書セットPi′の各々に関連した状態属性ASi′、jqpのセット、および/または、
文書要素の時間基準のセット、例えば日付Ti′、jqpのセット。
従属属性Fmのセット、文書従属属性Gm、および/または要素従属属性Hm、および/または、
従属性集合体の各々に関連した属性のセット、例えば、ライセンスを表す従属属性。
本発明は、各文書が署名に関連した要素に細分化される場合に最大の価値を持つ。しかしながら、例えばその細分化が目的なく、または当該目的にとって価値がない場合には、要素に細分化することができない文書もある。そのような場合には、署名は、全体として考えられる文書に関連付けられるかもしれない。
ここまでの詳細な記述は、本質的には、ソフトウェア開発プロジェクトの範囲に入る。ここで記述された手段は、自動化できるとともに、特にソフトウェアの法的ステータスを定義することを可能にするツールを提供する。これは、ひとたび個人貢献者と彼等の法的ステータスの数とが増加すると、ますますそのように、そのステータスが長期にわたって発展するにつれ、特に難しい作業であることが知られる。ソフトウェアがコンポーネントに基づく場合および/または共同開発されている場合には、この作業はより一層困難なものになる。
各人がどのように貢献したかを、および、権利の対応する割り当てを正確に解決することは可能でなかったという理由だけで、共同作業の勝手な資格と、
些細であると判断され影響力のある作者の個性と対面させられた、不当に看過する貢献。
(1)ライセンス互換性の問題に自身を限定せずに法的に識別された外部貢献の法的ステータス、
(2)一連の製造工程のどの段階からソフトウェアの集積部品が始まるのか、
(3)使用するプロジェクトの識別によりオープンソースコードの「配布率」、即ちその「悪評」。
a)第1の時間基準(TPijl)を有する第1(j=1)の文書コンテンツ(Oijl)を考慮するステップと、
b)選択した規則に従って、この第1の文書コンテンツを要素(Cijlk)に細分化するステップ(200)と、
c)ステップb)で得た各文書要素(Cijlk)をそのコンテンツの署名(Nijlk)と比較するステップと、
d)第1の文書コンテンツに対して、ステップb)で取得した署名のうち少なくともいくつかと、この第1の文書コンテンツの前記第1の時間基準の識別子とを備えたインプリント(Eijl)を記憶するステップと、
e)毎回(j=j+1)、時間基準を有する少なくとも1つの他の文書コンテンツのためにステップa)〜d)を繰り返すステップと、
f)第1の署名値(Nijlk)を作業値(Niq)として考慮するステップと、
g)この作業値を含むインプリント(Eijl)の時間基準識別子(TPijl)にタイムクロック関数(dat())を適用し、統合された時間基準として、前記タイムクロック関数の結果値(Viq)にその作業値(Niq)を関連付けするステップと、
h)毎回、作業値(Niq)として別の署名値(Nijlk)を使用してステップf)〜h)を繰り返すステップと、
i)各署名値とその統合された時間基準との間の通信を記憶するステップ。
タイムクロック関数(dat())は、署名データム(Viq)として、リスト上の最も古い時間基準(TPi、jqp、lqp)の識別子と、リスト上の最新の時間基準(TPi、jqp、lqp)の識別子とのうちから選択した少なくとも1つを確立するように配列されている。
ステップc)は、各文書要素(Cijlk)が、この文書要素に関する要素属性(AEijlk)にさらに関連付けられるという事実を備え、
ステップd)において、インプリント(Eijl)は、要素属性(AEijlk)の少なくともいくつかの識別子も備え、
ステップg)において、タイムクロック関数(dat())は、特に条件を確認する場合に、時間選択に対して要素属性識別子(AEijlk)を考慮するように配列されている。
ステップd)において、インプリント(Eijl)は要素の署名を備え、要素属性(AEijlk)は特定の値よりも大きく、
ステップc)において、要素属性は、文書要素のコンテンツに関する統計データに依存する。
ステップa)において、文書コンテンツ(Oijl)は文書属性(AOijl)をも有し、
ステップd)において、インプリント(Eijl)は第1の文書コンテンツの前記文書属性の識別子をも備え、
ステップg)は、作業値を含んだインプリント(Eijl)の文書属性識別子(AOijl)に認証関数(Aut())を適用し、統合された文書属性データムとして、前記認証関数の結果値(Wiq)にその作業値(Niq)を関連付けることをさらに備え、
ステップi)は、各署名値とその統合された文書属性データムとの間の通信を記憶するということもまた備える。
ステップg)において、認証関数は、作業値を含むインプリント(Eijl)の時間基準識別子にも適用される。
文書コンテンツ属性(AOijl)は、前記文書コンテンツ(Oijl)への貢献者の識別子を備え、
(例えばステップd)において)予想されることは、少なくとも1つの公知の文書コンテンツ構造(Oijl)が認識されるべきであること、および、構造が認識された文書の存在下で、その文書が、インプリント(Eijl)の確立に伴われるその構造の特徴を示すデータム(702)と関連付けられるべきことであり、
(例えばステップa)において)予想されることは、クリーンアップ済みの文書コンテンツ(O′ijl)が、文書コンテンツ(Oijl)に基づいて、文書コンテンツ(Oijl)の構造の特徴を示す前記データムに依存する所定の規則の第1のセットに従って確立されるべきであるのに対し、一連の動作b)〜d)が、このようなクリーンアップ済みの文書要素(C′ijlk)に基づいて実行されることであり、
(例えばステップb)において)予想されることは、クリーンアップ済みの文書要素(C′ijlk)が、文書(Oijl)の構造の特徴を示すデータムに特に依存する所定の規則の第2のセットに従って、文書要素(Cijlk)から確立されるべきであるのに対し、一連の動作b)〜d)が、こうして取得したクリーンアップ済みの文書要素(C′ijlk)に基づいて実行されることである。
所与の署名値(Niq)に対し、時間基準識別子(TPi、jqp、lqp)のリストが、その署名値(Niq)を含むインプリント(Ei、jqp、lqp)用に決定され、
統合された時間基準(Viq)が署名値(Niq)毎に確立され、リスト上で最も古い時間基準(Tpi、jqp、lqp)の識別子を検索する(または、リスト上で最新の時間基準(Tpi、jqp、lpq)を検索するように別の時間基準を適用する)。
α)第1の識別子(1)と第2の識別子(2)をそれぞれ有する第1のセットのインプリント(E′1)と第2のセットのインプリント(E′2)が比較され;第1のセットのインプリント(E′1)は、第1の識別子(1)に対応する署名値(Niq)および統合済み時間基準(Viq)を備え;また、第2のセットのインプリント(E′2)は、前記第2の識別子(2)に対応する署名値(N2q′)およびその統合済み時間基準(V2q′)を備え、
β)成功した比較のセットは、従属性のサブセット(E″12)を提供し;それらに共通する署名値(N1q:N2q′)毎に、このサブセットは、前記第1および第2のセットのインプリント用に、対応する統合済み時間基準(V1q;V2q′)を含み、
γ)各従属性の方向または方位は定義(または事前定義)され;最も普通の方法は、最も早い時間で起源または「ソース」を配置し、その後の時間に宛先または「ターゲット」(PDm)を配置することである。一般に、これは、統合済み時間基準(V1q、V2q′)に基づいて適用された所定の規則のセットを意味する。インプリントが共通の署名値(N1q)を有する第1の識別子(1)と第2の識別子(2)を見ると、この方位付け動作によって第1および第2の識別子(1;2)の一方を起源または「ソース」識別子(POm)として、他方の識別子(2;1)を宛先または「ターゲット」識別子(PDm)として適格にすることが可能になる。
まだグループ化されていない最も古い(1304)共通署名(Nm)を取り、それを、この最も古い(1306)共通署名(Nm)よりも早い「ソース」側の時間基準から生じた他の共通署名(Nm)と共にグループ化し、
所与のグループから、まだグループ化されていない共通の署名のうち最も古い署名に「ターゲット」時間基準が続く共通の署名を取り出し(1310)、
反復は、ループ基準の所与の最後が確認されるまで実行される。
N個の文書(またはこれらのいくつか)に関して、可能な1〜1個の比較が全て実行される。合計N(N−1)個の可能な比較が存在する。これにより、複数の従属性サブセットが提供され、結合時にそのサブセットが1つの従属性セットを作り出す:
従属性が前述したように方位付けられ;
これらの従属性サブセット内(または従属性セット内)の署名毎に、当該署名用の「ターゲット」時間基準が、当該署名に対して、Nセットのインプリントの中で最も古い状態に後続する従属性が除去される。
インプリントおよび任意の従属性から検証された日付入り貢献者リストを確立する。
Claims (26)
- 時間基準を有する文書のコンテンツを記憶するメモリを備える文書管理用のコンピュータベース装置であって、
所与の規則に従って文書コンテンツを要素に細分化できる抽出装置(200)と、
そのコンテンツの署名を戻すために文書要素を処理できる署名生成器(202)と、
文書コンテンツに対して、当該文書コンテンツ用の時間基準と、その文書コンテンツを要素に変換するために前記抽出装置(200)を呼び出すことにより取得された署名の少なくともいくつかとを備えたインプリントを確立し、それから、こうして取得された前記要素に対して前記署名生成器(202)を確立できるインプリント生成器(signO())と、
時間基準識別子のリストから時間選択の所定関数の結果を計算できるタイムクロックモジュール(dat())と、
スーパーバイザー(110)と、を備え、前記スーパーバイザーは、
少なくとも2つの文書コンテンツ上で前記インプリント生成器(signO())を動作させ、複数の署名を有する2つのインプリントを同時に生成するように、
署名値毎に、前記タイムクロックモジュール(dat())を、毎回同じ署名値を含む前記インプリントの少なくともいくつかの時間基準識別子のリストと共に繰り返し呼び出し、これにより、署名値毎に統合済み時間基準を提供するように、
各署名値とその統合済み時間基準との間の通信を記憶するように、
配列されていることを特徴とする、コンピュータベース装置。 - 前記タイムクロックモジュールによって計算された所定の時間選択の関数は、結果の値として、前記リスト上で最も古い時間基準識別子と、前記リスト上で最新の時間基準識別子との中から選択した少なくとも1つを決定するように配列されていることを特徴とする、請求項1に記載の装置。
- 文書要素に関する要素属性を戻すために、その文書要素を処理できるコンテンツクオリファイア(eval())もまた備えていることを特徴とする、請求項1または2に記載の装置。
- 前記インプリント生成器(signO())は、文書コンテンツに対し、前記抽出装置(200)から得た要素のために前記コンテンツ識別子(eval())を呼び出すことにより文書コンテンツの要素属性の少なくともいくつかの識別子をも備えたインプリントを確立することができ、
時間選択の前記所定の関数は、時間選択に対して、要素属性識別子を考慮するように配列されており、
前記スーパーバイザー(110)は、毎回、前記タイムクロックモジュール(dat())を、前記同一の署名値と、関連する要素属性識別子とを含んだ前記インプリントの時間基準識別子のリストと共に繰り返し呼び出すように配列されていることを特徴とする、請求項3に記載の装置。 - 前記インプリント生成器は、文書コンテンツに対し、この文書コンテンツの前記時間基準を備えたインプリントと、要素属性が特定の状況を検証する文書要素の署名とを確立するように配列されていることを特徴とする、請求項3または4に記載の装置。
- 前記コンテンツクオリファイア(eval())は、文書要素のコンテンツに関する所定の統計タイプの関数の結果値を要素属性として戻すために、文書要素を処理できることを特徴とする、請求項3〜5のいずれか一項に記載の装置。
- それぞれが少なくとも1つの文書コンテンツ属性をも有する文書の少なくとも幾つかにおいて、
前記インプリント生成器(sign())は、文書コンテンツに対して、その文書コンテンツの前記属性の識別子をも備えたインプリントを確立できることを特徴とする、請求項1〜6のいずれか一項に記載の装置。 - 文書コンテンツの属性の識別子のリストから、所定の文書属性選択関数の前記結果の値を、時間基準識別子のリストの関数として計算できる認証モジュール(aut())をさらに備えていることを特徴とする、請求項7に記載の装置。
- 前記スーパーバイザー(110)は、
毎回、同一の署名値を含む前記インプリントの文書コンテンツの属性の前記識別子のリストと共に、認証モジュール(aut())を繰り返し呼び出し、これにより、署名値毎に統合済み文書コンテンツ属性データムを提供するように、
各署名値と、その統合済み文書コンテンツ属性データムとの間の通信を記憶するように配列されていることを特徴とする、請求項8に記載の装置。 - 前記文書コンテンツ属性は、前記文書コンテンツへの貢献者の識別子を備えていることを特徴とする、請求項7〜9のいずれか一項に記載の装置。
- 文書コンテンツの少なくとも1つの公知の構造を認識できるとともに、その構造が認識された文書の存在下で、その特徴を示すデータム(702)をその文書と関連付けできるクオリファイアモジュール(type())をさらに備え、
前記インプリント生成器(signO())は、前記クオリファイアモジュール(type())を呼び出して前記インプリントを確立するように配列されていることを特徴とする、請求項1〜10のいずれか一項に記載の装置。 - 前記文書のコンテンツの構造の特徴を示す前記データムに依存する第1の所定の規則のセットに従ってクリーンアップされた文書コンテンツを、文書コンテンツから確立するように配列された第1のフィルタリングモジュール(filterA())をさらに備え、
前記インプリント生成器(signO())は、クリーンアップ済みの文書コンテンツを得るために、1つの文書に対して、前記第1のフィルタリングモジュール(filterA())を呼び出すように、および、このクリーンアップ済みの文書コンテンツを要素に変換するために前記抽出装置(200)を呼び出すことによってインプリントを確立するように配列され、それから、要素用の前記署名生成器(202)はこのように取得されていることを特徴とする、請求項11に記載の装置。 - 前記文書構造の特徴を示すデータムに依存し第2の所定の規則のセットに従って、文書要素から、クリーンアップされた文書要素を確立するように配列された第2のフィルタリングモジュール(filterB())をさらに備え、
前記インプリント生成器(signO())は、前記抽出装置(200)を呼び出すことによって取得された前記文書要素からクリーンアップ済みの文書要素を取得するために、1つの文書に対して、前記第2のフィルタリングモジュール(filterB())を呼び出すように配列され、これにより、これらのクリーンアップ済みの文書要素のための前記署名生成器(202)はこのように取得されていることを特徴とする、請求項11または12に記載の装置。 - 前記スーパーバイザー(110)は、統合済み時間基準を署名値毎に供給するために、毎回、同一の署名値を含んだ前記インプリントの全ての時間基準識別子のリストと共に、前記タイムクロックモジュール(dat())を繰り返し呼び出すように配列されていることを特徴とする、請求項1〜13のいずれか一項に記載の装置。
- 前記スーパーバイザー(110)は、それぞれの署名値用の新規に統合された時間基準を供給するために、毎回署名値とその書名値用の統合済み時間基準とを含んだインプリントの時間基準識別子と共に、署名値毎に、前記タイムクロックモジュール(dat())を繰り返し呼び出すように配列されていることを特徴とする、請求項1〜14のいずれか一項に記載の装置。
- 前記タイムクロックモジュール(dat())は、時間基準識別子の前記リストを、前記文書コンテンツの時間基準のセットと比較するように、この比較から、結果の値として、前記リスト内の時間期間の識別子を推定するように配列されており、それぞれの時間期間は時間基準のセットに関連する連続した時間基準から作成されていることを特徴とする、請求項1〜15のいずれか一項に記載の装置。
- 前記コンピュータベース装置は、文書コンテンツのバージョンを管理するツールと対話するように配列されており、前記メモリは、前記バージョン管理ツールから前記文書コンテンツ用の時間基準を受信することを特徴とする、請求項1〜16のいずれか一項に記載の装置。
- 文書コンテンツのバージョンを管理する前記ツールもまた貢献者識別子を前記文書コンテンツの各々と関連付けでき、前記メモリもまたこの種の貢献者識別子を受信することを特徴とする、請求項17に記載の装置。
- 前記スーパーバイザー(110)は、
文書コンテンツのバージョンを管理するツールと対話して、複数の文書コンテンツから互いに異なった文書コンテンツのサブセットを確立するように配列され、
複数の署名を共に有するインプリントを得るために、前記文書コンテンツのサブセットの各々の上で前記インプリント生成器(signO())を動作するように配列され、
前記サブセットから取得したインプリントの時間識別子と、前記署名値が始まった前記サブセットの前記文書コンテンツと同一である前記文書コンテンツの各々の時間識別子とを同時に備えるリストを使って、前記サブセット用に取得した署名値毎に、タイムクロックモジュール(dat())を繰り返し呼び出すように配列されていることを特徴とする、請求項17または18に記載の装置。 - 前記スーパーバイザー(110)は、
各署名値とその時間基準との間での通信に加えて、前記署名値および前記時間基準が始まった文書コンテンツのセットの識別子をも記憶するように配列されていることを特徴とする、請求項1〜20のいずれか一項に記載の装置。 - 第1の識別子と第2の識別子をそれぞれ有する第1のセットのインプリントと第2のセットのインプリントを比較でき、前記第1のセットのインプリントは、前記第1の識別子に対応する署名値およびそれらの統合済み時間基準を備え、前記第2のセットのインプリントは、前記第2の識別子に対応する署名値およびその統合済み時間基準を備え、成功した比較のセットは、サブセットの従属性に、それに共通の署名値毎に前記第1および第2のセットのインプリント用に対応する統合済み時間基準を提供するインプリント比較装置(comp())と、
所定の規則のセットに従って、前記統合済み時間基準に基づいて、共通の署名値に対して、第1および第2の識別子のうち一方を元または「ソース」識別子として、他方の識別子を宛先または「ターゲット」識別子として修飾できる方位付けモジュール(dir())とをさらに備え、
前記インプリント比較装置(comp())は、前記ソースとターゲットとの差異を提案するために、対応する統合済み時間基準を備える従属性の前記サブセットの署名値毎に、前記方位モジュール(dir())を呼び出しできることを特徴とする、請求項20に記載の装置。 - 前記方位モジュール(dir())は、ソース文書コンテンツのセットの識別子として、
最も古い統合済み時間基準に対応する前記識別子を確立するように配列されていることを特徴とする、請求項21に記載の装置。 - 前記第1および第2のセットのインプリントの間の前記従属性のサブセットを分割し、前記署名の起源の識別子に従って前記サブセットを細分化するように、次に、以下の分割基準の少なくとも1つの反復適用に基づいて、従属性の集合体をそれぞれ制作するように配列されたモジュール(agrDep1())をさらに備え、
未だグループ化されていない最も古い共通署名(1304)を取り、それを、この最も古い共通署名(1306)よりも早い「ソース」側で時間基準から生じる他の共通署名と共にグループ化し、
「ターゲット」時間基準がまだグループ化されていない前記共通署名の中で最も古い署名より後である共通署名を、所与のグループから除去し(1310)、
所与のエンドオブループ基準が検証されるまで前記反復が継続することを特徴とする、請求項22に記載の装置。 - Nセットのインプリントを受信でき、次に、前記インプリントのセットのうち少なくとも一つをその他と比較することにより、複数の従属性サブセットを提供する前記署名の少なくとも幾つかに対して、1つのインプリントのセットから別のセットへ方位付け比較を実行でき、それから、これらの従属性サブセット内の署名毎に、当該署名用の「ターゲット」時間基準が、当該署名用の前記Nセットのインプリントのうち最も古い日付よりも後である従属性を除去できるマルチ文書比較装置をさらに備えていることを特徴とする、請求項21〜23のいずれか一項に記載の装置。
- 前記インプリントおよび任意の従属性に基づいて検証される貢献者の日付付きリストを作成できるグローバル文書管理モジュール(150)を備えることを特徴とする、請求項21〜24のいずれか一項に記載の装置。
- 前記文書コンテンツは、所与の文書、文書状態、文書バージョン、および、いくつかの文書バージョンを含む可能性のある文書のセットの中から選択した少なくとも2つのカテゴリに従って識別できることを特徴とする、請求項1〜25のいずれか一項に記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0609464A FR2907934B1 (fr) | 2006-10-27 | 2006-10-27 | Outil informatique de gestion de documents numeriques |
FR06/09464 | 2006-10-27 | ||
PCT/FR2007/001766 WO2008059124A2 (fr) | 2006-10-27 | 2007-10-25 | Outil informatique de gestion de documents numeriques |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010507852A JP2010507852A (ja) | 2010-03-11 |
JP5064510B2 true JP5064510B2 (ja) | 2012-10-31 |
Family
ID=38255266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009533901A Active JP5064510B2 (ja) | 2006-10-27 | 2007-10-25 | デジタル文書を管理するコンピュータベースツール |
Country Status (9)
Country | Link |
---|---|
US (1) | US8566369B2 (ja) |
EP (1) | EP2084644B1 (ja) |
JP (1) | JP5064510B2 (ja) |
CN (1) | CN101568928B (ja) |
BR (1) | BRPI0718427A2 (ja) |
CA (1) | CA2667111C (ja) |
ES (1) | ES2401727T3 (ja) |
FR (1) | FR2907934B1 (ja) |
WO (1) | WO2008059124A2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009097459A1 (en) * | 2008-01-29 | 2009-08-06 | Educational Testing Service | System and method for disambiguating the effect of text document length on vector-based similarit scores |
WO2009146536A1 (en) * | 2008-06-02 | 2009-12-10 | Corporation De L'ecole Polytechnique De Montreal | File presence detection and monitoring |
US10303722B2 (en) | 2009-05-05 | 2019-05-28 | Oracle America, Inc. | System and method for content selection for web page indexing |
US20100287152A1 (en) | 2009-05-05 | 2010-11-11 | Paul A. Lipari | System, method and computer readable medium for web crawling |
US8321382B2 (en) * | 2010-03-25 | 2012-11-27 | Xerox Corporation | Validating aggregate documents |
JP2012175552A (ja) * | 2011-02-23 | 2012-09-10 | Seiko Instruments Inc | 情報処理装置、及び情報処理プログラム |
CA2741212C (en) | 2011-05-27 | 2020-12-08 | Ibm Canada Limited - Ibm Canada Limitee | Automated self-service user support based on ontology analysis |
US8849776B2 (en) * | 2011-10-17 | 2014-09-30 | Yahoo! Inc. | Method and system for resolving data inconsistency |
CA2767676C (en) * | 2012-02-08 | 2022-03-01 | Ibm Canada Limited - Ibm Canada Limitee | Attribution using semantic analysis |
FR3046688B1 (fr) * | 2016-01-07 | 2018-01-12 | Guillaume Rousseau | Dispositif d'aide au referencement de documents numeriques |
CN110968413A (zh) * | 2018-09-28 | 2020-04-07 | 华为技术有限公司 | 一种数据管理方法、装置和服务器 |
US11354409B1 (en) * | 2020-02-11 | 2022-06-07 | Trend Micro Inc. | Malware detection using locality sensitive hashing of API call sequences |
US11537392B2 (en) * | 2021-01-04 | 2022-12-27 | Capital One Services, Llc | Dynamic review of software updates after pull requests |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6282698B1 (en) * | 1998-02-09 | 2001-08-28 | Lucent Technologies Inc. | Detecting similarities in Java sources from bytecodes |
CA2317139C (en) * | 1999-09-01 | 2006-08-08 | Nippon Telegraph And Telephone Corporation | Folder type time stamping system and distributed time stamping system |
US6658423B1 (en) * | 2001-01-24 | 2003-12-02 | Google, Inc. | Detecting duplicate and near-duplicate files |
JP2004260664A (ja) * | 2003-02-27 | 2004-09-16 | Nec Corp | タイムスタンプ付与機能をもつxml署名生成システム,装置,方法およびプログラム |
JP4257269B2 (ja) * | 2004-07-13 | 2009-04-22 | 日本電気株式会社 | メタデータ送信装置及びメタデータ受信装置 |
WO2006008847A1 (ja) * | 2004-07-20 | 2006-01-26 | Fujitsu Limited | 電子文書管理システム |
US7809695B2 (en) * | 2004-08-23 | 2010-10-05 | Thomson Reuters Global Resources | Information retrieval systems with duplicate document detection and presentation functions |
US7574742B2 (en) * | 2004-11-15 | 2009-08-11 | Industrial Technology Research Institute | System and method of string matching for uniform data classification |
US20070168671A1 (en) * | 2006-01-16 | 2007-07-19 | Fujitsu Limited | Digital document management system, digital document management method, and digital document management program |
-
2006
- 2006-10-27 FR FR0609464A patent/FR2907934B1/fr not_active Expired - Fee Related
-
2007
- 2007-10-25 ES ES07866439T patent/ES2401727T3/es active Active
- 2007-10-25 BR BRPI0718427-1A2A patent/BRPI0718427A2/pt not_active IP Right Cessation
- 2007-10-25 EP EP07866439A patent/EP2084644B1/fr active Active
- 2007-10-25 WO PCT/FR2007/001766 patent/WO2008059124A2/fr active Application Filing
- 2007-10-25 US US12/312,168 patent/US8566369B2/en active Active
- 2007-10-25 JP JP2009533901A patent/JP5064510B2/ja active Active
- 2007-10-25 CN CN2007800457782A patent/CN101568928B/zh active Active
- 2007-10-25 CA CA2667111A patent/CA2667111C/fr active Active
Also Published As
Publication number | Publication date |
---|---|
ES2401727T3 (es) | 2013-04-24 |
CA2667111A1 (fr) | 2008-05-22 |
US8566369B2 (en) | 2013-10-22 |
CN101568928B (zh) | 2013-07-31 |
US20100049760A1 (en) | 2010-02-25 |
FR2907934A1 (fr) | 2008-05-02 |
BRPI0718427A2 (pt) | 2013-11-12 |
FR2907934B1 (fr) | 2009-02-06 |
EP2084644B1 (fr) | 2012-12-05 |
WO2008059124A3 (fr) | 2008-11-06 |
CN101568928A (zh) | 2009-10-28 |
JP2010507852A (ja) | 2010-03-11 |
WO2008059124A2 (fr) | 2008-05-22 |
EP2084644A2 (fr) | 2009-08-05 |
CA2667111C (fr) | 2016-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5064510B2 (ja) | デジタル文書を管理するコンピュータベースツール | |
CN109063421B (zh) | 一种开源许可证合规性分析与冲突性检测方法 | |
Prowell et al. | Cleanroom software engineering: technology and process | |
JP5306360B2 (ja) | データ記録を一致させるシステムの分析のための方法およびシステム | |
US8645332B1 (en) | Systems and methods for capturing data refinement actions based on visualized search of information | |
US20100030795A1 (en) | Maintaining referential integrity while masking | |
JP2000148461A (ja) | ソフトウェアモデル及び既存のソ―スコ―ドを同期化させる方法及びその装置 | |
CN110442847B (zh) | 基于代码仓库过程管理的代码相似性检测方法及装置 | |
Cheah et al. | Provenance analysis: Towards quality provenance | |
CN110134663B (zh) | 组织结构数据处理方法、装置、电子设备 | |
US20080133455A1 (en) | Method of processing data | |
US7159171B2 (en) | Structured document management system, structured document management method, search device and search method | |
FI119160B (fi) | Tietokannan hallintajärjestelmä | |
CN106777097B (zh) | 一种元数据分层扩展时的合并方法 | |
CN105824792A (zh) | 文本比对方法和设备 | |
US8359592B2 (en) | Identifying groups and subgroups | |
Schlie et al. | Incremental feature model synthesis for clone-and-own software systems in MATLAB/Simulink | |
CN114118944A (zh) | 一种取证实验室分级管理方法、终端设备及存储介质 | |
CN107402920A (zh) | 确定关系数据库表关联复杂度的方法和装置 | |
CN112381229B (zh) | 一种基于三维数模的知识集成系统及方法 | |
Silva et al. | Assisting data warehousing populating processes design through modelling using coloured petri nets | |
Hara et al. | Incremental data fusion based on provenance information | |
Santangelo | Rise of the machines | |
CN114491195A (zh) | 特征数据识别方法及装置、电子设备、存储介质 | |
CN114416735A (zh) | 数据存储方法、查询方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120321 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120620 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120717 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120808 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5064510 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150817 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |