TW201510922A - 數位資訊分析系統、數位資訊分析方法及數位資訊分析程式 - Google Patents

數位資訊分析系統、數位資訊分析方法及數位資訊分析程式 Download PDF

Info

Publication number
TW201510922A
TW201510922A TW103128571A TW103128571A TW201510922A TW 201510922 A TW201510922 A TW 201510922A TW 103128571 A TW103128571 A TW 103128571A TW 103128571 A TW103128571 A TW 103128571A TW 201510922 A TW201510922 A TW 201510922A
Authority
TW
Taiwan
Prior art keywords
information
digital information
parameter set
unit
update
Prior art date
Application number
TW103128571A
Other languages
English (en)
Inventor
Masahiro Morimoto
Hideki Takeda
Kazumi Hasuko
Original Assignee
Ubic Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ubic Inc filed Critical Ubic Inc
Publication of TW201510922A publication Critical patent/TW201510922A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本發明提供一種使用元資料之數位資訊分析系統、數位資訊 分析方法、及數位資訊分析程式。 數位資訊分析系統1具備:元資料取得部16,其係取得與 數位資訊相關連之元資料;第一更新部20,其係依據元資料以及與預定之特定事項有關的第一數位資訊之關係,對指定之語素更新將指定語素對第一數位資訊之加權資訊、與指定語素對與預定之特定事項無關的第二數位資訊之加權資訊相對應的加權參數集;及第二更新部22,其係使用第一更新部20所更新之加權參數集,更新指定語素與數位資訊之關連性。

Description

數位資訊分析系統、數位資訊分析方法及數位資訊分析程式
本發明係關於一種數位資訊分析系統、數位資訊分析方法、及數位資訊分析程式。特別是,本發明係關於藉由進一步使用數位資訊附帶之參數可使分析精度提高的數位資訊分析系統、數位資訊分析方法、及數位資訊分析程式。
過去已知一種系統,係顯示所記錄之數位資訊,複數個文件檔案分別設定顯示是否與用戶資訊中包含之用戶中任何一個用戶相關的用戶特定資訊,以所設定之用戶特定資訊記錄於記憶部的方式作設定,指定至少一人以上之用戶,檢索設定有對應於指定之用戶的用戶特定資訊之文件檔案,經由顯示部設定顯示所檢索之文件檔案是否與訴訟相關的附帶資訊,依據附帶資訊而輸出與訴訟相關之文件檔案(例如參照專利文獻1)。採用記載於專利文獻1之系統時,僅抽出與特定者有關之數位文件資訊,可謀求減輕製作訴訟之證據資料時的作業負擔。
【先前技術文獻】 【專利文獻】
[專利文獻1]日本特開2012-181851號公報
記載於專利文獻1之系統中,除了藉由文件檔案之語素解析而獲得的結果之外,藉由使用該文件檔案之元資料,可使分析精度提高,並且可謀求進一步減輕作業負擔。
因此,本發明之目的為提供一種使用元資料可使分析精度提高之數位資訊分析系統、數位資訊分析方法、及數位資訊分析程式。
為了達成上述目的,本發明提供一種數位資訊分析系統,其具備:元資料取得部,其係取得與儲存於資訊處理裝置之數位資訊相關連的元資料;第一更新部,其係依據元資料以及與預定之特定事項有關的第一數位資訊之關係,對指定之語素更新將指定語素對第一數位資訊之加權資訊、與指定語素對與預定之特定事項無關的第二數位資訊之加權資訊相對應的加權參數集;及第二更新部,其係使用第一更新部所更新之加權參數集,更新指定語素與數位資訊之關連性。
此外,上述數位資訊分析系統中亦可進一步具備:參數集取得部,其係取得加權參數集;及關係性資訊儲存部,其係儲存顯示元資料與第一數位資訊之關係性的關係性資訊,數位資訊係儲存於資訊處理裝置之調查對象的對象數位資訊,元資料取得部取得與對象數位資訊相關連之複數個元資料中至少1個元資料,第一更新部依據與元資料取得部所取得之元資料相對應而關係性資訊儲存部所儲存的關係性資訊,更新加權參數集,第二更新部使用加權參數集更新顯示指定語素與對象數位資訊之關連性強度的強度資訊。
此外,上述數位資訊分析系統中,指定語素之加權資訊亦可 包含出現頻率資訊,其係顯示指定語素在第一數位資訊或第二數位資訊中之出現頻率。
此外,上述數位資訊分析系統中,元資料亦可係構造性元資料或記述性元資料。
此外,上述數位資訊分析系統中,亦可由參數集取得部取得包含與複數個語素之各個預先相對應的強度資訊之黏合參數(Scoring Parameter),第一更新部依據與元資料取得部所取得之參數相對應而儲存於關係性資訊儲存部的關係性資訊,更新參數集取得部所取得之黏合參數,第二更新部使用第一更新部所更新之黏合參數亦可更新強度資訊。
此外,上述數位資訊分析系統中亦可進一步具備:關連性判斷部,其係依據對象數位資訊之語素解析結果與強度資訊,判斷與對象數位資訊之預定特定事項的關連性;及判斷結果設定部,其係將關連性判斷部之判斷結果與對象數位資訊相對應。
此外,上述數位資訊分析系統中,預定之特地事項亦可係顯示關係到訴訟之資訊。
此外,為了達成上述目的,本發明提供一種數位資訊分析方法,其具備以下階段:元資料取得階段,其係對指定之語素取得與儲存於資訊處理裝置之數位資訊相關連的元資料;第一更新階段,其係依據元資料以及與預定之特定事項有關的第一數位資訊之關係,對指定之語素更新將指定語素對第一數位資訊之加權資訊、與指定語素對與預定之特定事項無關的第二數位資訊之加權資訊相對應的加權參數集;及第二更新階段,其係使用在第一更新階段所更新之加權參數集,更新指定語素與數位資訊 之關連性。
此外,為了達成上述目的,本發明提供一種數位資訊分析程式,係使電腦實現以下功能:元資料取得功能,其係取得與儲存於資訊處理裝置之數位資訊相關連的元資料;第一更新功能,其係依據元資料以及與預定之特定事項有關的第一數位資訊之關係,對指定之語素更新將指定語素對第一數位資訊之加權資訊、與指定語素對與預定之特定事項無關的第二數位資訊之加權資訊相對應的加權參數集;及第二更新功能,其係使用第一更新功能所更新之加權參數集,更新指定語素與數位資訊之關連性。
採用本發明之數位資訊分析系統、數位資訊分析方法、及數位資訊分析程式時,可提供使用元資料可使分析精度提高之數位資訊分析系統、數位資訊分析方法、及數位資訊分析程式。
1‧‧‧數位資訊分析系統
2‧‧‧資訊處理裝置
10‧‧‧參數集儲存部
12‧‧‧輸入部
14‧‧‧參數集取得部
16‧‧‧元資料取得部
18‧‧‧關係性資訊儲存部
20‧‧‧第一更新部
22‧‧‧第二更新部
24‧‧‧關連性判斷部
26‧‧‧判斷結果設定部
28‧‧‧輸出部
1500‧‧‧CPU
1510‧‧‧晶片集
1520‧‧‧圖形控制器
1530‧‧‧記憶體
1540‧‧‧記憶裝置
1545‧‧‧讀取/寫入裝置
1550‧‧‧通信介面
1560‧‧‧輸入裝置
第一圖係本實施形態之數位資訊分析系統的功能構成方塊圖。
第二圖係本發明之實施形態的數位資訊分析系統之處理流程圖。
第三圖係本實施形態之數位資訊分析系統的硬體構成圖。
[實施形態]
(數位資訊分析系統1之概要)
本實施形態之數位資訊分析系統1係從儲存於用戶終端或伺服器等之資訊處理裝置2的複數個數位資訊,自動抽出與預定之特定事項具 有關連性的數位資訊之系統,且係使用數位資訊附帶之元資料,自動修正或更新顯示語素與目的之數位資訊的關連性強度之語素加權值的系統。
另外,本實施形態中,元資料係文件之附帶資訊、追加資訊、補充資訊、特性等,且係用於進一步處理輸入資訊(亦即,關鍵字、文件等)或追加於輸入資訊之語素資訊等的資訊、及/或輸入資訊或輸入資訊的處理結果之資訊。
此外,預定之特定事項,例如係顯示與訴訟相關之資訊。而後,本實施形態之數位資訊分析系統1,例如可適用於發生違法存取或洩漏機密資訊等關於電腦的犯罪或法律糾紛時,為了查明犯罪及糾紛原因及進行搜查,而收集及分析必要之電子記錄的數位資訊,以明瞭其法律證據性之技術的鑑識。
另外,本實施形態中之伺服器係1個以上之伺服器,且亦可包含複數個伺服器而構成。例如,伺服器包含郵件伺服器、檔案伺服器、或文件管理伺服器等可儲存數位資訊之伺服器。此外,用戶終端係1個以上之用戶終端,且亦可包含複數個用戶終端而構成。例如用戶終端包含個人電腦、筆記型電腦、平板PC、或行動電話等之攜帶式通信終端等。
(數位資訊分析系統1之詳細內容)
第一圖顯示本實施形態之數位資訊分析系統的功能構成方塊之一例。
本實施形態之數位資訊分析系統1具備:參數集儲存部10,其係儲存將語素對與預定之特定事項有關的數位資訊之加權資訊、及語素對與預定之特定事項無關的數位資訊之加權資訊,與複數個語素之各個相 對應的加權參數集;參數集取得部14,其係從輸入於參數集儲存部10或輸入部12之資訊取得加權參數集;元資料取得部16,其係取得與儲存於資訊處理裝置2之數位資訊相關連的元資料;及關係性資訊儲存部18,其係儲存顯示元資料與數位資訊之關係性的關係性資訊。
此外,數位資訊分析系統1具備:更新加權參數集之第一更 新部20;更新顯示語素與數位資訊之關連性強度的強度資訊(亦即,語素之「加權值」)之第二更新部22;依據檢查對象之數位資訊的語素解析結果,判斷預定之特定事項與該數位資訊之關連性的關連性判斷部24;將關連性判斷部24之判斷結果與該數位資訊相對應的判斷結果設定部26;及將判斷結果設定部26之設定結果輸出外部之輸出部28。
另外,輸出部28係可顯示數位資訊之顯示器等顯示裝置、及/或將數位資訊輸出至指定媒體之印表機等輸出裝置。再者,輸出部28亦可藉由將輸出之資訊記錄於磁性記錄媒體、光學記錄媒體等記錄媒體而輸出。
(資訊處理裝置2)
資訊處理裝置2具有:儲存複數個數位資訊之數位資訊儲存部;及將數位資訊輸出外部之資訊輸出部。數位資訊儲存部儲存包含文章資訊之文件檔案、正文檔案、或電子郵件等複數個數位資訊。數位資訊儲存部依來自元資料取得部16之發動,將指定之數位資訊的元資料供給至元資料取得部16。另外,數位資訊分析系統1與資訊處理裝置2可藉由網際網路等通信網路、或LAN等有線或無線網路等連接成可相互通信。此外,數位資訊分析系統1亦可具備資訊處理裝置2具有之功能及構成的一部分或全部。
(參數集儲存部10)
參數集儲存部10對指定之語素(例如關鍵字),儲存將指定語素對與預定之特定事項有關的第一數位資訊之加權資訊、與指定語素對與預定之特定事項無關的第二數位資訊之加權資訊相對應的加權參數集。亦即,參數集儲存部10對一個語素,將對該一個語素之第一數位資訊的第一加權資訊、與對該一個語素之第二數位資訊的第二加權資訊相對應,儲存該一個語素、第一加權資訊及第二加權資訊作為加權參數集。
此處,在本實施形態中,有時將第一數位資訊稱為與預定之特定事項有關的文件之「HOT文件」,並將第二數位資訊稱為與預定之特定事項無關的文件之「Non-HOT文件」。此外,加權資訊例如可包含在數位資訊中顯示指定之語素出現的頻率之出現頻率資訊。
例如,假定存在「內密」之語素作為關鍵字。此時,在關於預定之特定事項(例如違法行為等)的文件(HOT文件)中,該語素出現之頻率(文件頻率)遠比在Non-HOT文件中該語素出現之頻率多時,表示與該HOT文件之關連性的語素之「加權值」,該語素對該HOT文件之加權值比該語素對Non-HOT文件之加權值大。顯示語素之「加權值」愈大,該語素在HOT文件中出現愈多。參數集儲存部10依來自參數集取得部14之發動,將加權參數集供給至參數集取得部14。
(參數集取得部14)
參數集取得部14取得儲存於參數集儲存部10之加權參數集,或是輸入至輸入部12之加權參數集。另外,參數集取得部14亦可於HOT文件中之一個語素的出現次數設為Nhot,將Non-HOT文件中之該語素的出現 次處設為Nnon-hot時,具有計算Nhot/Nnon-hot之值的功能。
此外,參數集取得部14亦可取得包含與複數個語素之各個預先相對應的強度資訊之黏合參數。另外,本實施形態中,所謂黏合參數,係複數個語素之加權值。因此,參數集取得部14取得顯示與複數個語素之各個相對應的加權值之資訊。另外,此時,參數集儲存部10可儲存黏合參數。參數集取得部14將取得之加權參數集、黏合參數、及/或顯示計算結果之資訊供給至第一更新部20。
(元資料取得部16)
元資料取得部16取得與儲存於資訊處理裝置2之調查對象的對象數位資訊相關連之複數個元資料中的至少1個元資料。具體而言,元資料係構造性元資料或記述性元資料。例如,元資料係電子郵件之郵件標頭(顯示收發信之屬性的資訊、顯示發信時刻之資訊、顯示收信時刻之資訊、顯示TO/CC/BCC之資訊等)、或文件之特性(顯示檔案製作時刻之資訊、顯示檔案製作者之資訊、顯示製作檔案之資訊處理終端的資訊、更新時刻資訊等)等。當對象數位資訊係電子郵件時,元資料之一例係特定電子郵件之發信者的資訊(亦即,係唯一識別發信者之識別資訊(發信者識別資訊))。元資料取得部16將取得之元資料供給至第一更新部20。
(關係性資訊儲存部18)
關係性資訊儲存部18儲存顯示元資料與第一數位資訊之關係性的關係性資訊。例如,說明元資料係電子郵件之發信者識別資訊的情況。此時,係依據顯示一個發信者識別資訊所識別之發信者,是否藉由任何收信者多次傳送相當於HOT文件之電子郵件的資訊來決定關係性。亦 即,一個發信者對複數個收信者中之特定收信者(或是複數個特定收信者),比其他收信者多次傳送相當於HOT文件之電子郵件時,關係性資訊顯示之關係性為「高」。關係性資訊儲存部18將該關係性資訊與複數個元資料之各個相對應來儲存。關係性資訊儲存部18將關係性資訊供給至第一更新部20。
(第一更新部20)
第一更新部20依據與元資料取得部16所取得之元資料相對應而關係性資訊儲存部18儲存的關係性資訊,更新參數集取得部14所取得之加權參數集。第一更新部20依據元資料與指定之語素是否與HOT文件相關,來更新加權參數集。如第一更新部20在「內密」之語素存在情況下,從元資料(亦即元資料中包含之特性)掌握之從第一發信者傳送至其他收信者的電子郵件,比從第二發信者傳送至其他收信者之電子郵件,與HOT文件之關連性高時,則使用文件頻率等之資訊修正或更新加權參數集。
此外,第一更新部20亦可依據與元資料取得部16所取得之元資料相對應而儲存於關係性資訊儲存部18的關係性資訊,更新參數集取得部14所取得之黏合參數。再者,第一更新部20於元資料中含有複數個特性時,亦可使用依各特性之有無而不同的參數,來修正或更新加權參數集及/或黏合參數。
例如,說明一個元資料中含有特性p1與特性p2之情況,且HOT文件與Non-HOT文件存在之情況。此時,假設存在具有p1之HOT文件、具有p2之HOT文件、具有p1之Non-HOT文件、具有p2之Non-HOT文件。第一更新部20例如判斷文件中是否含有特性。而後,第一更新部20可就複數 個特性分別算出具有特性之HOT文件數與不具特性之HOT文件數。第一更新部20亦可依據複數個特性之各個的有無,與上述同樣地修正或更新加權參數集或黏合參數。
此外,第一更新部20如不論有無特性而存在複數個HOT文件時,亦可分割成具有特性之HOT文件與不具特性之HOT文件的2個群來管理。同樣地,第一更新部20於存在複數個Non-HOT文件時,亦可分割成具有特性之Non-HOT文件與不具特性之Non-HOT文件的2個群來管理。第一更新部20將更新後之加權參數集及/或黏合參數供給至第二更新部22。
(第二更新部22)
第二更新部22使用第一更新部20所更新之加權參數集,並且使用與第一更新部20同樣之計算方法,更新顯示指定之語素與對象數位資訊的關連性強度之強度資訊。此外,第二更新部22亦可使用第一更新部20所更新之黏合參數來更新強度資訊。例如,第二更新部22可依據具有特性之HOT文件數、不具特性之HOT文件數、具有特性之Non-HOT文件數、及不具特性之Non-HOT文件數來執行更新處理。
此外,第二更新部22在從第一更新部20取得黏合參數時,可使用更新後之黏合參數執行更新處理。第二更新部22將更新後之各資訊供給至關連性判斷部24。
(關連性判斷部24、判斷結果設定部26)
關連性判斷部24依據對象數位資訊之語素解析結果與強度資訊,判斷對象數位資訊與預定之特定事項的關連性。關連性判斷部24將顯示判斷結果之資訊供給至判斷結果設定部26。而後,判斷結果設定部26 將關連性判斷部24之判斷結果與對象數位資訊相對應。判斷結果設定部26將已與判斷結果相對應之對象數位資訊供給至輸出部28。
(數位資訊分析方法之概要)
第二圖顯示本發明之實施形態的數位資訊分析系統之處理流程的一例。
首先,參數集取得部14從參數集儲存部10或輸入輸入部12之資訊取得加權參數集(步驟10。以下以「S」表示「步驟」)。參數集取得部14將取得之加權參數集供給至第一更新部20。
另外,元資料取得部16從資訊處理裝置2取得對象數位資訊之元資料(S15)。元資料取得部16將取得之元資料供給至第一更新部20。第一更新部20依據從元資料取得部16取得之元資料及關係性資訊儲存部18所儲存之關係性資訊,修正或更新從參數集取得部14所取得之加權參數集(S20)。第一更新部20進行修正或更新,並將加權參數集供給至第二更新部22。
第二更新部22使用從第一更新部20取得之加權參數集,更新顯示指定之語素與對象數位資訊的關連性強度之強度資訊(S25)。第二更新部22將更新後之強度資訊供給至關連性判斷部24。關連性判斷部24使用更新後之強度資訊及對象數位資訊的語素解析結果,判斷對象數位資訊與預定之特定事項的關連性(S30)。關連性判斷部24將顯示判斷結果之資訊供給至判斷結果設定部26。判斷結果設定部26將顯示判斷結果之資訊與對象數位資訊相對應。而後,輸出部28將顯示判斷結果之資訊相對應的對象數位資訊輸出至外部。
第三圖顯示本發明之實施形態的數位資訊分析系統之硬體構成的一例。
本實施形態之數位資訊分析系統1具備:CPU1500;隨機存取記憶體(RAM)、唯讀記憶體(ROM)及/或快閃ROM等的記憶體1530;記憶資料之記憶裝置1540;從記錄媒體讀取資料及/或在記錄媒體中寫入資料之讀取/寫入裝置1545;輸入資料之輸入裝置1560;與外部之通信機器進行資料收發的通信介面1550;及將CPU1500、圖形控制器1520、記憶體1530、記憶裝置1540、讀取/寫入裝置1545、輸入裝置1560、及通信介面1550彼此可通信地連接之晶片集1510。
晶片集1510藉由將記憶體1530、存取記憶體1530而執行指定之處理的CPU1500、及控制外部顯示裝置之顯示的圖形控制器1520相互連接,來執行各構成要素間之資料交接。CPU1500依據儲存於記憶體1530之程式動作來控制各構成要素。圖形控制器1520依據設於記憶體1530中之緩衝器上暫時存放的影像資料,使影像顯示於指定之顯示裝置上。
此外,晶片集1510連接記憶裝置1540、讀取/寫入裝置1545及通信介面1550。記憶裝置1540儲存數位資訊分析系統1之CPU1500使用的程式與資料。記憶裝置1540例如係快閃記憶體。讀取/寫入裝置1545從記憶程式及/或資料之記憶媒體讀取程式及/或資料,並將讀取之程式及/或資料儲存於記憶裝置1540。讀取/寫入裝置1545例如經由通信介面1550,從網際網路上之伺服器取得指定的程式,並將所取得之程式儲存於記憶裝置1540。
通信介面1550經由通信網路執行與外部裝置之資料收發。此外,通信介面1550在通信網路不通時,亦可不經由通信網路而與外部裝置 執行資料的收發。而後,鍵盤、輸入板、滑鼠等輸入裝置1560經由指定之介面與晶片集1510連接。
儲存於記憶裝置1540之數位資訊分析系統1用的數位資訊分析程式,經由網際網路等通信網路、或磁性記錄媒體、光學記錄媒體等記錄媒體提供至記憶裝置1540。而後,儲存於記憶裝置1540之數位資訊分析系統1用的數位資訊分析程式藉由CPU1500來執行。
藉由本實施形態之數位資訊分析系統1而執行的數位資訊分析程式被CPU1500發動,而使數位資訊分析系統1發揮在第一圖及第二圖中說明之參數集儲存部10、輸入部12、參數集取得部14、元資料取得部16、關係性資訊儲存部18、第一更新部20、第二更新部22、關連性判斷部24、判斷結果設定部26及輸出部28的功能。
(實施形態之效果)
本實施形態之數位資訊分析系統1由於參照文件之元資料,以指定之判斷基準將複數個文件檔案細分化成是否為相當於具有(或不具)指定特性之HOT文件的文件,或是相當於具有(或不具)指定特性之Non-HOT文件的文件等,並修正或更新語素之加權值,因此可提供精度高之辨識系統。
以上係說明本發明之實施形態,不過上述記載之實施形態並非限定申請專利範圍之發明者。此外,請注意實施形態中說明之特徵的全部組合,在用於解決發明之課題的手段上不一定是必須。再者,上述實施形態之技術性要素,亦可單獨適用,亦可分割成如程式零件與硬體零件的複數個部分來適用。
1‧‧‧數位資訊分析系統
2‧‧‧資訊處理裝置
10‧‧‧參數集儲存部
12‧‧‧輸入部
14‧‧‧參數集取得部
16‧‧‧元資料取得部
18‧‧‧關係性資訊儲存部
20‧‧‧第一更新部
22‧‧‧第二更新部
24‧‧‧關連性判斷部
26‧‧‧判斷結果設定部
28‧‧‧輸出部

Claims (9)

  1. 一種數位資訊分析系統,其具備:元資料取得部,其係取得與儲存於資訊處理裝置之數位資訊相關連的元資料;第一更新部,其係依據前述元資料以及與預定之特定事項有關的第一數位資訊之關係,對指定之語素更新加權參數集,該加權參數集係與前述指定語素對前述第一數位資訊之加權資訊、以及與前述指定語素對第二數位資訊之加權資訊相對應,其中該第二數位資訊與前述預定之特定事項無關;及第二更新部,其係使用前述第一更新部所更新之前述加權參數集,更新前述指定語素與前述數位資訊之關連性。
  2. 如申請專利範圍第1項之數位資訊分析系統,其中進一步具備:參數集取得部,其係取得前述加權參數集;及關係性資訊儲存部,其係儲存顯示前述元資料與前述第一數位資訊之關係性的關係性資訊,前述數位資訊係儲存於前述資訊處理裝置之調查對象的對象數位資訊,前述元資料取得部取得與前述對象數位資訊相關連之複數個元資料中至少1個元資料,前述第一更新部依據與前述元資料取得部所取得之前述元資料相對應而前述關係性資訊儲存部所儲存的前述關係性資訊,更新前述加權參數集, 前述第二更新部使用前述加權參數集,更新強度資訊,該強度資訊顯示前述指定語素與前述對象數位資訊之關連性強度。
  3. 如申請專利範圍第2項之數位資訊分析系統,其中前述指定語素之加權資訊包含出現頻率資訊,其係顯示前述指定語素在前述第一數位資訊或前述第二數位資訊中之出現頻率。
  4. 如申請專利範圍第1項至第3項中任一項之數位資訊分析系統,其中前述元資料係構造性元資料或記述性元資料。
  5. 如申請專利範圍第1項至第4項中任一項之數位資訊分析系統,其中前述參數集取得部係取得包含與複數個語素之各個預先相對應的強度資訊之黏合參數(Scoring Parameter),前述第一更新部依據與前述元資料取得部所取得之前述參數相對應而儲存於前述關係性資訊儲存部的前述關係性資訊,更新前述參數集取得部所取得之前述黏合參數,前述第二更新部使用前述第一更新部所更新之前述黏合參數來更新前述強度資訊。
  6. 如申請專利範圍第1項至第5項中任一項之數位資訊分析系統,其中進一步具備:關連性判斷部,其係依據前述對象數位資訊之語素解析結果與前述強度資訊,判斷與前述對象數位資訊之前述預定特定事項的關連性;及判斷結果設定部,其係將前述關連性判斷部之判斷結果與前述對象數位資訊相對應。
  7. 如申請專利範圍第1項至第6項中任一項之數位資訊分析系統,其中前述預定之特地事項係顯示關係到訴訟之資訊。
  8. 一種數位資訊分析方法,其具備以下階段:元資料取得階段,其係取得與儲存於資訊處理裝置之數位資訊相關連的元資料;第一更新階段,其係依據前述元資料以及與預定之特定事項有關的第一數位資訊之關係,對指定之語素更新加權參數集,該加權參數集係與前述指定語素對前述第一數位資訊之加權資訊、以及與前述指定語素對第二數位資訊之加權資訊相對應,其中該第二數位資訊與前述預定之特定事項無關;及第二更新階段,其係使用在前述第一更新階段所更新之前述加權參數集,更新前述指定語素與前述數位資訊之關連性。
  9. 一種數位資訊分析程式,係使電腦實現以下功能:元資料取得功能,其係取得與儲存於資訊處理裝置之數位資訊相關連的元資料;第一更新功能,其係依據前述元資料以及與預定之特定事項有關的第一數位資訊之關係,對指定之語素更新加權參數集,該加權參數集係與前述指定語素對前述第一數位資訊之加權資訊、以及與前述指定語素對第二數位資訊之加權資訊相對應,其中該第二數位資訊與前述預定之特定事項無關;及第二更新功能,其係使用前述第一更新功能所更新之前述加權參數集,更新前述指定語素與前述數位資訊之關連性。
TW103128571A 2013-09-10 2014-08-20 數位資訊分析系統、數位資訊分析方法及數位資訊分析程式 TW201510922A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013187084 2013-09-10

Publications (1)

Publication Number Publication Date
TW201510922A true TW201510922A (zh) 2015-03-16

Family

ID=52665604

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103128571A TW201510922A (zh) 2013-09-10 2014-08-20 數位資訊分析系統、數位資訊分析方法及數位資訊分析程式

Country Status (2)

Country Link
TW (1) TW201510922A (zh)
WO (1) WO2015037498A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003016106A (ja) * 2001-06-29 2003-01-17 Fuji Xerox Co Ltd 関連度値算出装置
JP4568144B2 (ja) * 2005-03-02 2010-10-27 日本放送協会 情報提示装置及び情報提示プログラム
JP4898934B2 (ja) * 2010-03-29 2012-03-21 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP5567049B2 (ja) * 2012-02-29 2014-08-06 株式会社Ubic 文書分別システム及び文書分別方法並びに文書分別プログラム

Also Published As

Publication number Publication date
WO2015037498A1 (ja) 2015-03-19

Similar Documents

Publication Publication Date Title
US20210350070A1 (en) Distributed Document Co-Authoring and Processing
US20230359690A1 (en) Systems and methods for generating a resource preview in a communication session
US20120192064A1 (en) Distributed document processing and management
US11798208B2 (en) Computerized systems and methods for graph data modeling
US20090292762A1 (en) Method, Apparatus, and Computer Program Product for Publishing Content
KR20120036831A (ko) 갱신들의 소셜 네트워킹 서비스 내로의 통합
US8600970B2 (en) Server-side search of email attachments
US11836142B2 (en) Intelligent ranking of search results
EP3356951B1 (en) Managing a database of patterns used to identify subsequences in logs
US11418592B2 (en) Uploading user and system data from a source location to a destination location
TW201513035A (zh) 相關關係顯示系統、相關關係顯示方法及相關關係顯示程式
US20210004583A1 (en) Revealing Content Reuse Using Coarse Analysis
JP6390139B2 (ja) 文書検索装置、文書検索方法、プログラム、及び、文書検索システム
US20130036478A1 (en) Identifying and Redacting Privileged Information
US20160219058A1 (en) System and method for file sharing
CN110457610B (zh) 信息推荐方法、装置、终端、服务器及存储介质
JP2011203964A (ja) 文書管理システム及び方法
JP2009251957A (ja) 興味情報特定システム、興味情報特定方法、および興味情報特定用プログラム
US8190559B2 (en) Document management apparatus, storage medium storing program for document management apparatus, and method for managing documents
US10055433B2 (en) Referenced content indexing
WO2023164210A1 (en) System, method, and computer program product for inserting citations into a textual document
KR101174398B1 (ko) 컨텐츠 추천 장치 및 방법
US8949248B2 (en) Method and apparatus for generating a web page
CN111343265B (zh) 信息推送方法、装置、设备及可读存储介质
TW201510922A (zh) 數位資訊分析系統、數位資訊分析方法及數位資訊分析程式