TW202201243A - 建立用於完美自動化剖析的增強型文件的系統及方法 - Google Patents

建立用於完美自動化剖析的增強型文件的系統及方法 Download PDF

Info

Publication number
TW202201243A
TW202201243A TW110116782A TW110116782A TW202201243A TW 202201243 A TW202201243 A TW 202201243A TW 110116782 A TW110116782 A TW 110116782A TW 110116782 A TW110116782 A TW 110116782A TW 202201243 A TW202201243 A TW 202201243A
Authority
TW
Taiwan
Prior art keywords
document
file
enhanced
byte string
metadata
Prior art date
Application number
TW110116782A
Other languages
English (en)
Inventor
詹姆士 弗羅德利希
強恩 葛雷斯
基普 代納德
普卡 班答里
Original Assignee
詹姆士 弗羅德利希
強恩 葛雷斯
基普 代納德
普卡 班答里
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 詹姆士 弗羅德利希, 強恩 葛雷斯, 基普 代納德, 普卡 班答里 filed Critical 詹姆士 弗羅德利希
Publication of TW202201243A publication Critical patent/TW202201243A/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • G06F16/3323Query formulation using system suggestions using document space presentation or visualization, e.g. category, hierarchy or range presentation and selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/383Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/106Enforcing content protection by specific content processing
    • G06F21/1063Personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/131Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/44Secrecy systems
    • H04N1/4446Hiding of documents or document information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/44Secrecy systems
    • H04N1/448Rendering the image unintelligible, e.g. scrambling
    • H04N1/4486Rendering the image unintelligible, e.g. scrambling using digital data encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Business, Economics & Management (AREA)
  • Signal Processing (AREA)
  • Human Resources & Organizations (AREA)
  • Library & Information Science (AREA)
  • Bioethics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Document Processing Apparatus (AREA)
  • Sheet Holders (AREA)

Abstract

所揭露的增強型文件創建和剖析系統處理增強型文件,其允許以較佳的視覺方式呈現文件內容,同時確保自動剖析器可以準確地擷取文件內容而沒有任何內容被丟棄或錯誤呈現。增強型文件創建系統可透過根據定義的模式(schema)對文件內容進行編碼,可選地將所得結構化資料加密為加密的位元組字串,以及將該加密的位元組字串嵌入到渲染的文件中作為不可見元資料,來創建增強型文件。產生的增強型文件可以由能夠提取、解密和解碼嵌入文件元資料的增強文件剖析系統進行完整和準確的剖析。

Description

建立用於完美自動化剖析的增強型文件的系統及方法
以下揭露一般涉及用於創建允許使用自動化方法完美剖析增強型文件的增強型電子文件的系統和方法。
電子文件通常以檔案格式儲存,例如Microsoft Word 的DOCX格式或Adobe Acrobat的PDF格式,允許以對人類讀者俱有視覺吸引力的方式渲染文件。但是這些格式通常以非結構化的方式儲存資訊,這使得自動剖析軟體(或剖析器)難以準確解釋電子文件,從而導致資料誤讀或分類錯誤。例如,求職者通常會準備一份精確格式的簡歷(例如,作為DOCX或PDF檔案),他們可以在提交線上工作申請的過程中上傳該簡歷。格式化的簡歷經常透過申請人追蹤系統(ATS)或其他簡歷審查系統進行處理,這些系統可能嘗試使用剖析軟體來剖析簡歷以從簡歷中提取重要資訊。簡歷審查系統可以基於預先選擇的資格或其他分析,使用提取的資訊來過濾招聘方的人力資源人員要查看的簡歷。如果未從求職者的簡歷中正確提取資訊,則簡歷可能永遠不會發送給人工審閱者,或者人工審閱者可能正在查看有關求職者的不正確資訊。雖然某些檔案格式允許以結構化方式(例如,根據定義的XML或JSON模式)儲存資訊,這可以提高機器可讀性,但這些原始文字資料格式無法擷取此類資訊將如何以視覺方式呈現給個人。因此,需要能夠創建對人類讀者具有視覺吸引力並且能夠被剖析器準確解譯的電子文件。
本發明揭露的增強型文件創建系統試圖透過根據定義的模式(schema)對文件內容進行編碼,可選地將所得結構化資料加密為加密的位元組字串,以及將該加密的位元組字串嵌入到文件中作為不可見元資料,來解決在將自動剖析技術應用於非結構化文件時所面臨的上述限制。產生的文件可以由能夠提取、解密和解碼嵌入文件元資料的增強型文件剖析系統進行完整和準確的剖析。在一些實施例中,增強型文件創建系統可以儲存與文件識別符相關聯的編碼(並且可選地加密)的文件內容,其可以替代地嵌入文件中作為不可見元資料。在這種情況下,增強型文件剖析系統可以提取嵌入的文件識別符,從增強型文件創建系統請求與之關聯的編碼內容,並對從增強型文件創建系統接收的結構化資料進行解碼(和解密)以完美剖析該文件。透過這種方式,可以創建單個文件,允許個人以他們喜歡的視覺方式呈現文件內容以獲得最大的影響,同時還確保剖析器或其他類似工具可以準確擷取(capture)文件內容,而無需丟棄或誤表示任何內容。
圖1圖示其中可以部屬本發明的例示性環境100。如圖所示,環境100可以包括一或多個使用者101,每個使用者具有使用者裝置102(例如,個人電腦、蜂巢式電話、PDA等),使用者101可以使用該使用者裝置102來與增強型文件創建系統110和文件提交系統160。增強型文件創建系統110可以承載文件創建平台180,使用者101可以透過網際網路140(例如,使用使用者裝置102上的網頁瀏覽器)來與該平台進行界接以創建和格式化初始文件150,查看和更新文件,並將文件導出為增強型文件151。舉例來說,增強型文件創建系統110可以承載使用者101可以用來創建、查看和更新簡歷以及輸出簡歷成為增強型簡歷文件之簡歷創建平台(例如www.myperfectresume.com或www.zety.com)。作為另一個實例,增強型文件創建系統110可以承載納稅申報準備平台,使用者101可以透過該平台準備他們的個人所得稅申報表。 例如,文件創建平台180可以透過向使用者101呈現可填寫的表格、提示使用者101輸入特定資訊的導引、WYSWIG編輯器等來允許使用者101創建初始文件150。回應於以特定檔案格式(例如,以Microsoft Word的DOCX格式或Adobe Acrobat的PDF格式)輸出初始文件150的使用者請求,增強型文件創建系統110可以將初始文件150輸出為增強型文件151,即透過根據定義的模式對文件內容進行編碼並將結構化內容嵌入到增強型文件151中作為不可見元資料。增強型文件創建系統110可以在將結構化內容嵌入增強型文件151中之前可選地將結構化內容加密。在一些實施例中,增強型文件創建系統110可以將與輸出的文件識別符相關聯的編碼(並且可選地加密)的內容儲存在文件資料庫116中。輸出的文件識別符可以被嵌入到增強型文件151中以替代(或除了)嵌入編碼內容本身,並且可以稍後用於從增強型文件創建系統110(例如,透過增強型文件剖析系統130)請求該編碼內容。 使用者101然後可以將增強型文件151提交給文件提交系統160。例如,文件提交系統160可以提供文件提交平台190,使用者101可以透過網際網路140(例如,使用使用者裝置102上的網頁瀏覽器)與該平台進行界接,以特定方式上傳和處理增強型文件151。舉例來說,文件提交系統160可以是工作申請板,其可以向使用者101提供透過上傳簡歷和其他申請文件(例如,求職信、推薦信)來搜索職位發布和申請工作的能力等),然後可以透過ATS或其他簡歷過濾系統進行處理。 文件提交系統160可以呼叫增強型文件剖析系統130來提取和處理嵌入的元資料以完整和準確地剖析增強型文件151,該文件提交系統160可以利用該增強型文件剖析系統來進一步處理增強型文件151。例如,增強型文件剖析系統130可以提供公共或對外的服務(例如,SOAP或REST網頁服務),文件提交系統160可以調用該服務來剖析增強型文件151。舉例來說,工作申請板(job application board)可以接收由使用者上傳的增強型簡歷並將其作為剖析請求的一部分發送到增強型簡歷剖析系統130。增強型簡歷剖析系統130可以判定該簡歷是否實際上是增強型簡歷,並且可以提取和(如果需要)解密嵌入的元資料,並將提取的編碼的簡歷內容回傳到工作申請板。在一些實施例中,增強型文件剖析系統130可以進一步處理提取的內容以將其設置在可由工作申請板使用的形式中(例如,基於定義模式的一些或所有欄位和元素映射到另一個工作申請板使用的模式)。工作申請板可以使用由增強型剖析系統130回傳的結構化資料來為使用者自動完成工作申請表的一或多個欄位(例如,結構化資料中的一些或所有元素和欄位對該應用程式表的元素和欄位的映射)。作為另一個實例,文件提交系統160可以是之前描述的報稅準備平台,其可以允許使用者101提交前幾年的增強型報稅文件。報稅準備平台可以運用增強型文件剖析系統130來提取和處理嵌入的元資料以完整和準確地提取增強型報稅文件中所包含的資訊。報稅準備平台進而可以利用該資訊來計算及/或填充使用者101正在準備的當前申報中的欄位。 在輸出文件識別符被嵌入於增強型文件151中之實施例中,增強型文件剖析系統130可提取文件識別符並且從增強型文件創建系統110請求該相關編碼的內容。例如,增強型文件創建系統110可以提供公共或對外的服務(例如,SOAP或REST網頁服務),文件剖析系統130可以調用該服務來請求編碼的內容(例如,透過傳遞提取的文件識別符)。增強型文件創建系統110可以將請求的內容回傳到增強型文件剖析系統130,增強型文件剖析系統130然後可以將編碼的內容傳回到文件提交系統160以進行進一步處理。作為對增強型文件創建系統110的請求的一部分,增強型文件剖析系統130可能能夠指定應該回傳的編碼內容的格式(例如,JSON、HTML、RTF或TXT格式)。與之前相同,增強型文件剖析系統130可以進一步處理編碼的內容以將其設置在文件提交系統160所預期的形式中(例如,基於定義模式的一些或所有欄位和元素映射到另一個文件提交系統160使用的模式)。 增強型文件創建系統110還可以要求增強型文件剖析系統130將其自身作為請求的一部分進行認證(例如,透過傳遞與增強型文件剖析系統130相關聯的唯一許可金鑰,或採用一些其他合適的認證機制)。增強型文件創建系統110還可以驗證增強型文件151自其最初被輸出以來未被更改,以提供附加的安全層並確保回傳到增強型文件剖析系統130的編碼內容是準確的。例如,增強型簡歷可以在輸出後被使用者修改,或者可以被另一個人重新利用,但可以保留輸出的文件識別符作為嵌入的元資料。在這種情況下,與輸出的文件識別符相關聯的編碼內容將不再對應於增強型文件151的內容,並且不應回傳到增強型文件剖析系統130。為了執行該驗證,增強型文件創建系統110可以要求增強型文件剖析系統130提供由使用者上傳的增強型文件151的雜湊值作為請求的一部分,該增強型文件創建系統110然後可以將增強型文件151的雜湊值與儲存在文件資料庫116中的編碼內容的雜湊值進行比較。若雜湊值匹配,則增強型文件創建系統110可以將編碼的內容回傳到增強型文件剖析系統130,但若雜湊值不匹配,則可取而代之發送適當的錯誤訊息。在替代實施例中,增強型文件剖析系統130可以連同請求一起提供增強型文件151,並且增強型文件創建系統110可以負責計算增強型文件151的雜湊值。 雖然文件提交系統160和增強型文件剖析系統130被示為單獨的系統,但不必如此,並且文件剖析系統130的組件及/或功能可以整合在文件提交系統160本身內。例如,下面描述的文件剖析系統130的邏輯組件可以被提供在文件提交系統160上(例如,作為可由文件提交系統160使用的可執行庫)。在一些實施例中,文件提交系統160可以提供小部件(widget)作為文件提交平台190的一部分(例如,安裝在工作申請表上),透過該小部件,使用者101將能夠直接提交增強型文件151以被完美剖析(即,小部件作為增強型文件剖析系統130運行)。使用者101可具有一或多個透過小部件可以提交或否則提供增強型文件151至文件提交系統160之選項。例如,使用者101可能能夠透過小部件上傳先前輸出的增強型文件151。 在一些實施例中,小部件可以查看使用者是否與增強型文件創建系統110或文件創建平台180有關係,並且可以允許使用者選擇直接從該處提交之增強型文件151。例如,使用者101可能能夠直接從增強型文件創建系統110(例如,透過公共或對外的REST或SOAP服務)取回(retrieve)增強型文件151。在使用者101已經透過文件創建平台180創建了多個增強型文件151的情況下,可以提示使用者101選擇他們想要提交的文件。相反地,如果使用者101還沒有創建增強型文件151,則使用者101可以被重導向到文件創建平台180以便創建其增強型文件。 在若干情況下,小部件可能要求使用者要進行認證以能夠提交或否則提供該增強型文件151至文件提交系統160。例如,小部件可以檢測cookie的存在,指示使用者101登錄到文件創建平台180,並且可以提示使用者101確認該使用者是否希望提交增強型文件151。這樣,使用者101能夠控制增強型文件151是否被提供給文件提交系統160,並且增強型文件創建系統110可以追蹤和促進增強型文件151的使用。如果沒有偵測到這樣的cookie,則在被允許繼續之前可以提示使用者101登錄文件創建平台180。在其他實施例中,小工具可以要求使用者將來自文件創建系統110的對增強型文件151的持續存取(例如,通孔OAuth或類似的存取委託協議)委託給文件提交系統160。以此方式,使用者101可以例如授予文件提交系統160在未來檢查增強型文件151的更新版本、接收後續文件修訂的通知、或接收關於使用者101的其他相關資訊及/或增強型文件(例如,允許文件提交系統160檢查使用者的求職狀態、面試的可能性等)的能力。文件創建平台180還可要求文件提交系統160在傳送增強型文件151之前對其自身進行驗證(例如,使用先前提供的許可金鑰或類似的驗證機制),從而為使用者資訊的交換提供另一層安全性。 一旦使用者上傳、選擇或創建了他們想要提交給文件提交系統160的增強型文件151,小部件就可以提取嵌入其中的編碼內容。在使用者101已經選擇直接從增強型文件創建系統110取回增強型文件151的情況下,增強型文件創建系統110可以簡單地回傳編碼內容本身。小工具又可以將編碼內容內的一或多個欄位映射到文件提交平台190中的對應欄位(例如,到工作申請表中的對應欄位)。 增強型文件創建系統110可以包括一或多個通訊介面111(例如,WiFi通訊介面或LAN介面)、一或多個處理器112、記憶體113、儲存裝置114,其可以包含表面庫114a、以及一或多個資料庫,其包括使用者資料庫117、加密密碼資料庫115和文件資料庫116。記憶體113可以包括文件創建平台邏輯120、編碼邏輯121、去敏感(desensitization)邏輯122、渲染邏輯123、加密邏輯124、嵌入邏輯125和許可伺服器(license server)邏輯126,處理器112可以利用它們來提供如下所述系統功能。 例如,文件創建平台邏輯120可以允許增強型文件創建系統110提供文件創建平台180,使用者101可以透過該平台創建初始文件150。例如,增強型文件創建系統110可以利用文件創建平台邏輯120來使用者101呈現具有使用者101可以填寫、選擇或以其他方式完成的可填寫表格元素或欄位的網站或傳送門。例如,文件創建平台邏輯120可以向使用者呈現簡歷構建工具,該工具可以提示使用者選擇簡歷模板,或者可以基於使用者101的一或多個屬性自動選擇簡歷模板,這些屬性可以是儲存在使用者資料庫117中(例如,作為使用者設定檔的一部分)。 基於所選擇的模板,文件創建平台邏輯120然後可以產生簡歷表格,其中一或多個空白部分具有一或多個欄位或其他表格元素供使用者101完成。例如,這些部分可以針對使用者的個人識別資訊、教育背景、工作經驗等。作為另一個實例,文件創建平台180可以向使用者101呈現使用者101可以選擇包括在初始文件150中的部分的列表。透過文件創建平台180,使用者101可以選擇要編輯的部分或段落,並且可以呈現該部分或段落的文字輸入表格。使用者101然後可以修改該部分的文字並調整格式輸入(例如,定位、樣式等)。在某些情況下,簡歷表格本質上可能是動態的,例如,允許使用者添加或刪除部分(例如,對於每個就讀的學院或大學,或者他們從事過的每個工作)。 文件創建平台180也可允許使用者101在初始文件150中包括一或多個圖形元素。例如,可以詢問使用者101上傳要包括在初始文件150中的設定檔圖像,或者圖形元素可以由文件創建平台邏輯120回應於透過文件創建平台180所提供的一或多個使用者輸入而產生。例如,如圖3所示,簡歷構建工具可以向使用者101呈現與使用者101可能具有的特定技能相對應的多個浮動塊(slider)控件,使用者101可以基於他們的熟練程度來調整這些浮動塊控件。作為另一個實例,如圖4所示,簡歷構建工具可以提示使用者他們可能擁有的特定技能或嗜好,並且可以呈現圖標、表情符號、字母組合、圖像、gif或其他代表這些技能、嗜好的圖形,或其他屬性,然後使用者可以選擇將其置於簡歷中。所選擇的圖形可以包括對應的描述,使用者101可能能夠改變該描述。在其他情況下,簡歷構建工具可以允許使用者101上傳他們自己的影像或圖形元素,並且作為上傳過程的一部分,可以提示使用者提供描述及/或識別技能、嗜好或與其關聯之其他屬性。 在一些實施例中,文件創建平台180可以向使用者提供在文件資料庫116中以特定狀態保存初始文件150的能力,並且可以利用文件編碼邏輯121來進行上述操作。在這種情況下,文件創建平台180可以允許使用者101恢復先前保存的文件以供查看、輸出或進一步修改用。文件創建平台180還可以允許使用者101提供現有的非增強型文件,該增強型文件創建系統110可以使用剖析軟體來剖析該文件。透過剖析文件提取的資訊可以被文件產生平台邏輯120分析以識別一或多個部分(section)的存在,並且為初始文件150的對應於識別部分的可填寫表格元素播種(seed)或預填充。初始文件150然後可以被編碼為結構化資料並且使用如下討論的文件編碼邏輯121嵌入到增強型文件151中。使用者101還能夠在預填充的文件內容被編碼和嵌入到增強型文件151之前對其進行編輯,例如,以糾正由於對非增強型文件的自動剖析而導致的任何錯誤或遺漏。 文件編碼邏輯121又可用於根據基於每個表格元素的已知語義含義與透過關聯化之其內的內容的定義模式(例如,專有或標準化的XML或JSON模式)將初始文件150編碼為結構化資料。例如,文件編碼邏輯121可以將使用者101完成的簡歷的每個部分或段落映射到定義模式內的特定元素和欄位。舉例來說,簡歷的工作歷史部分可以包含使用者工作的記錄,具有對應於使用者101所擔任的每個職位的段落或子部分。每個職位還可以包含與雇主名稱、就業日期和經驗描述相對應的元素。基於每個元素的語義(例如,屬於工作歷史部分或要求雇主姓名),文件編碼邏輯121能夠根據結構化模式將使用者輸入的內容編碼為結構化資料。 文件編碼邏輯121可以將編碼的文件儲存在文件資料庫116中。在一些實施例中,文件編碼邏輯121可以基於透過文件創建平台180提供的使用者輸入(例如,透過點擊儲存按鈕)來編碼和儲存該初始文件150。雖然在其他情況下,文件編碼邏輯121可以即時編碼和儲存初始文件150的每個表格元素,如由使用者完成的(例如,當表格元素失去焦點時)。這樣,文件創建平台180可以保持初始文件150的狀態,並允許使用者101在多個工作階段(session)中更新和修改文件。編碼文件可以與文件識別符相關聯地儲存在文件資料庫116中,文件識別符可以用作編碼文件的特定實例的版本識別符。 在初始文件150包括圖形元素的情況下——傳統剖析器通常難以解譯並且經常被這樣的剖析器忽視——文件編碼邏輯121可以將圖形元素中的視覺指示符映射到定義模式內的欄位的值。例如,圖2圖示圖形元素210,其示出使用者可以包括在簡歷中的該使用者101對各種設計技能的熟練程度,該圖形元素可以由文件創建平台180回應於對使用者101呈現之一組與其設計能力相關的問題或提示來產生。增強型文件創建系統110又可以將圖形元素210編碼為結構化資料220。類似地,圖5圖示圖形元素510,其示出使用者101在先前工作中執行的各種角色,增強型文件創建系統110可以將其編碼成結構化資料520。 作為另一個實例,圖3示出圖形元素310,它由一系列浮動塊控件311-314組成,使用者可以調整這些浮動塊控件以反映他們對特定標的技能或專業知識的水平。如圖所示,文件編碼邏輯121可以將圖形元素310編碼為結構化資料320,其中每個浮動塊控件311a-311d的值反映在編碼的文件之對應浮動塊控件321a-321d中的「技能熟練度」欄位322a-322d中。圖4圖示另一個實例,其中使用者可以回應關於使用者技能402的提示而從提供給使用者的一列表之圖形元素401中選擇出圖形元素410。圖形元素可具有相關聯的描述411,其可由使用者101透過選擇過程提供或修改。在輸出成為增強型文件451時,只有圖形元素將是可見的,但是與圖形元素相關聯的附加資訊(例如其描述)仍然可以被編碼為結構化資料420並嵌入其中。在一些情況下,模式可以規定圖形元素本身也被包括在結構化資料中(例如,作為位元組字串,或參考圖形元素在增強型文件的可見部分中的位置)。例如,使用者的設定檔圖像可以在結構化資料中編碼為具有描述欄位的圖形元素,該欄位可以取值「設定檔圖像」,以及base64表示欄位,該欄位可以包含影像的位元組字串表示。 在一些實施例中,文件編碼邏輯121還可以基於各個文件元素的語義來擴充編碼內容。舉例來說,使用先前描述的簡歷創建工具所創建的簡歷可以指示求職者具有作為收銀員的豐富經驗。為了提高簡歷不被任何軟體過濾器(例如,由ATS應用的過濾器)忽略並呈現給人工審閱者的機會,文件編碼邏輯121可以另外將該經驗表徵為「金錢處理」或「客戶關係」在編碼文件中。以這種方式擴充之增強型文件151還可以幫助提供增強型或改善的匹配經驗(例如,對於尋找合格求職者的雇主),因為擴充之資訊可以使文件更有可能回應於特定文件搜尋或查詢(例如,簡歷資料庫之搜尋或查詢等)而出現。這些附加的描述符可能不會在增強型文件151中可見化地渲染,但將持續存在於嵌入其中的編碼內容中。 在其他實施例中,增強型文件創建系統110可以允許使用者101將初始文件150內的內容指定為不可見、編校或以其他方式隱藏。例如,積極就業的求職者可能不希望他們當前的雇主知道他們正在尋找新的機會,因此可能不願意分發他們的簡歷。使用者101可能能夠編校或隱藏某些資訊(例如,他們的個人識別資訊、他們當前雇主的姓名、推薦信或他們想要保護的任何其他資訊)以使其在簡歷上不可見,同時仍然包括它作為嵌入其中的編碼內容。在一些情況下,文件創建系統110可以在增強型文件151中包括旗標或參數,其指示獲得了使用者同意以在增強型文件151內嵌入資訊及/或允許處理嵌入資訊,例如,透過通過增強型文件創建平台180向使用者101呈現服務條款或選擇加入提示。此外,如下所述,增強型文件151可以具有互動方法,透過該方法可以提供關於增強型文件151的回饋。在這種情況下,增強型文件151可以允許招聘者或招聘方請求存取以查看這樣的資訊,這些資訊可以直接或間接地傳達給增強型文件151的使用者101以供其同意。 又在其他實施例中,增強型文件創建系統110可以單獨提示使用者101提供初始文件150之外的附加內容,該文件編碼邏輯121可以包括作為編碼內容。以這種方式,增強型文件151可以攜帶適合由增強型文件剖析系統130提取的附加資訊,同時在渲染時保持初始文件150的視覺外觀。例如,使用者101通常會嘗試將其簡歷的長度限制為一頁,但這通常需要省略潛在的相關資訊,例如第二技能或先前的工作經驗,這可能最終會損害求職者被找到和僱用的機會。作為另一個實例,增強型文件創建系統110可以包括不同語言的內容的替代版本。 又在另一個實施例中,增強型文件創建系統110可以自動化選擇初始文件150中何內容將是可見及/或包括作為編碼的內容。例如,使用者101可能能夠提供工作描述或特定工作申請的URL,該增強型文件創建系統110可以對其進行分析以判定初始文件150中的哪些內容最相關,以進行可見化渲染,而文件編碼邏輯121包括剩餘內容的所有、一些或無內容作為編碼內容。 在一些情況下,增強型文件創建系統110可以自動包括相關資訊作為可以幫助或協助處理增強型文件151的編碼內容。例如,求職者經常被要求提供基本的書目資訊(bibliographic information)(例如郵寄地址、工作授權狀態等)或隨簡歷一起提交求職信。在申請多個工作時重複輸入此資訊可能是一項費力且單調的工作,這經常會阻止求職者完成工作申請。這樣的資訊可能已經被先前擷取(例如,在註冊過程中,或在完成不同的工作申請時)並作為使用者設定檔的一部分儲存在使用者資料庫117中,而是可以作為編碼內容被包括在增強型文件151內允許增強型文件剖析系統130可以自動化提取該資訊並將該資訊提供給文件提交系統160以簡化求職者的申請過程。作為另一個實例,在增強型文件151可以是企業使用的訂單採購或履行表格的情況下,增強型文件創建系統110可能能夠包括相關發票、交付表格和收據(例如,包含訂單的逐項細目分類,以及相關的成本和運輸資訊)作為編碼內容。 圖6提供了增強型文件創建系統110可以用來編碼初始文件150的專有模式的高階視圖。如圖所示,專有模式可以提供分層編碼結構,其中文件可以分解為文件、節、段落和文件資料元素,每個元素具有特定欄位。因為增強型文件剖析系統130可以由不同方(entity)實現或部署,所以可能需要針對特定實例或實現的專有模式的自定映射。為了減少或消除必要的自定量(amount of customization)並允許剖析增強可用於更廣泛數量的增強型文件剖析系統130,一些實施例可以利用開放標準。在這種情況下,文件編碼邏輯121可以將根據文件創建平台180使用的專有模式編碼的資料轉譯成開放標準模式。例如,增強型文件創建系統110可以將根據圖6中所示的模式編碼的資料轉譯成HR開放標準聯盟公佈的HR-JSON或HR-XML模式。然而,這樣的標準化模式本身可能無法適應專有模式中可能定義的完整元素和值之集合,並且可能會進行擴展以適應附加的結構、功能或行為。 去敏感邏輯122可以允許增強型文件創建系統110對編碼文件進行去敏感化,以確保增強型文件151中不包括敏感的使用者資訊(例如,SSN、照片、個人識別資訊等)。例如,去敏感邏輯122可以處理編碼文件(即,在初始文件150已經被編碼並儲存在文件資料庫116中之後)並且將任何敏感使用者資訊標記為從轉譯到開放標準模式中排除(若有發生此種轉譯的情況下),及/或在渲染編碼的文件之前將其排除。 渲染邏輯123可以允許增強型文件創建系統110以特定檔案格式(例如,Microsoft Word的DOCX格式或Adobe Acrobat的PDF格式)渲染編碼文件(或去敏感或轉譯的文件,視情況而定),其在一些實施例,可以由使用者101指定。例如,渲染邏輯123可以用於從編碼內容產生中間檔案,其中該文件內容的視覺外觀(即,文件內容的定位和樣式)可以由與初始文件150相關聯的表面定義(skin definition)所提供,該表面定義可以是儲存在表面庫114a中和從表面庫114a中取回。例如,增強型文件創建系統110可以產生包括具有指定CSS樣式的不同HTML元素以及鏈接的CSS樣式表以控制文件內容的位置和樣式(即,視覺外觀)的HTML檔案。增強型文件創建系統110可接著將中間檔案轉換成特定檔案格式,如Microsoft Word之DOCX格式或Adobe Acrobat之PDF格式。透過這樣做,增強型文件創建系統110可以利用公共可用的轉換庫,例如Aspose(用於HTML到DOCX的轉換)或ABCpdf(用於HTML到PDF的轉換)。 在一些實施例中,渲染邏輯123可允許增強型文件創建系統110包括一或多互動方法(例如在互動式按鈕、超聯結等形式),透過其可提供與增強型文件151相關之回饋。舉例來說,一旦求職者提交工作申請,他們就會等待招聘方的回應。該回應可能永遠不會到來,並且使用者101可能擔心簡歷從未到達人工審閱者(例如,如果它沒有被正確剖析)。透過在簡曆本身內提供互動式按鈕或其他互動方法,人工審閱者可以能夠快速且自動地採取行動,例如,通知使用者101他們的簡歷已經被審閱及/或他們是否被考慮能勝任該職位,自動聯繫使用者101以安排面試或請求推薦人等。所提供的互動方法還能夠透過嵌入邏輯125來利用嵌入在文件中的內容。例如,增強型文件151可以提供一種機制,由此人工審閱者可以判定增強型文件151的更新版本是否可用並且如果可用則請求更新版本(例如,透過調用對公眾的API並傳遞加密金鑰或嵌入在增強型文件151中的導出文件識別符)。 增強型文件創建系統110可以附加地或替代地提供介面(例如,以公共或對外的REST或SOAP服務的形式),透過該介面可以提供關於增強型文件151的回饋。例如,透過該介面,文件提交系統160及/或增強型文件剖析系統130能夠更新增強型文件創建系統110的處理狀態為增強型文件151之處理狀態(例如,接收、處理、批准/拒絕或其他自定狀態)(例如,透過傳遞狀態指示符、加密金鑰或輸出之文件識別符、以及若API需要則傳遞許可金鑰)。增強型文件創建系統110還可以提供使用者101可以透過其接收和對關於增強型文件151的回饋產生回應的介面。這樣,增強型文件創建系統110可以允許使用者101和文件提交系統160及/或操作它的一方之間的雙向通訊。 加密邏輯124可以允許增強型文件創建系統110產生加密金鑰(例如,透過使用像PBKDF2這樣的加密金鑰產生演算法),其可以用於將編碼文件進行加密(例如,使用像AES那樣的加密演算法)以創建編碼內容的加密的位元組字串。在編碼文件被去敏感及/或轉譯的實施例中,加密邏輯124可以將去敏感及/或轉譯的內容進行加密。產生的加密金鑰可以使用加密密碼,該密碼可以被儲存在加密密碼資料庫115中並從該資料庫取回,另外該加密金鑰還可以使用隨機產生的鹽或初始化向量。在增強型文件創建系統110充當加密許可伺服器的實施例中,產生的加密金鑰可以被分配唯一的加密金鑰識別符,並與初始文件150相關聯地儲存在加密密碼資料庫115中,這類似地可以是分配了唯一的文件識別符。每次將初始文件150作為增強型文件151輸出時(例如,隨著使用者更新或修改初始文件150),增強型文件創建系統110可以產生新的加密金鑰。以此方式,加密金鑰識別符還可以充當版本識別符,以識別輸出的初始文件150的每個版本。在一些實施例中,增強型文件創建系統110可以在輸出時與文件資料庫116中的導出文件識別符相關聯地儲存編碼文件(或去敏感或轉譯的文件)。以此方式,增強型文件創建系統110可以維護已輸出的初始文件150的每個版本。 嵌入邏輯125又可以允許增強型文件創建系統110將編碼的並且可選地加密的內容嵌入到渲染的文件中作為不可見元資料。例如,嵌入邏輯125可以在加密的位元組字串的開頭預先添加用於產生金鑰的任何鹽或初始化向量。替代地,在增強型文件創建系統110作用為加密許可伺服器之實施例中,嵌入邏輯125可預先添加與產生的加密金鑰相關的加密金鑰識別符。然後可以將修改後的位元組字串作為不可見元資料寫入轉換後的文件中(例如,寫入Microsoft Word DOCX 或Adobe Acrobat PDF檔案的“自定特性”)。在增強型文件創建110在輸出編碼文件時將其儲存的實施例中,嵌入邏輯125可以附加地或替代地嵌入與輸出的編碼文件相關聯的輸出文件識別符。雖然前面描述了加密內容的嵌入,但是應該理解的是,編碼內容不需要被加密並且可以嵌入作為未加密的位元組字串。 某些檔案格式可能會限制將不可見元資料寫入轉換文件的形式,例如,需要數對ID-值或限制值的尺寸或長度(例如,小於255字元的長度之字串)。嵌入邏輯125可以允許增強型文件創建系統110判定轉換文件的檔案格式,並操縱位元組字串以符合任何該格式可能對其中儲存的不可見元資料造成的限制。 在一些實施例中,嵌入邏輯125可允許增強型文件創建系統110嵌入自定碼或巨集碼(macro)以執行特定功能。例如,增強型文件創建系統110可以創建巨集碼,該巨集碼將在使用者101即將修改增強型文件151時產生提醒訊息,以警告使用者101在文件創建平台180之外進行的任何更改可能會導致文件剖析之不完善。在一些情況下,增強型文件創建系統110可以防止使用者101做出任何改變。在其他實施例中,增強型文件創建系統110可以在增強型文件151內嵌入巨集碼,該巨集碼將允許在文件的視覺外觀中做出的改變與包含在其中的嵌入內容同步。例如,巨集碼可以將更新的內容發送到增強型文件創建系統110(例如,經由API或網頁服務),該系統可以執行編碼過程以產生更新的編碼內容,該內容可以被可選地加密並嵌入回增強型文件151中。 許可伺服器邏輯126可以允許增強型文件創建系統110充當許可伺服器,允許增強型文件創建系統110控制增強型文件剖析系統130是否能夠(即,被許可)提取及/或解密嵌入在使用者101的增強型文件151中的不可見元資料。透過限制提取及/或解密嵌入的內容的能力,該嵌入的內容可以包括敏感的使用者資訊(在不執行去敏感的實施例中)或其他人類讀者不可見的其他個人細節,增強型文件創建系統110能夠使得使用者之資訊即使在被輸出後仍受到保護,並僅允許授權人員可以獲得該內容。許可伺服器邏輯126還可以允許增強型文件創建系統110使加密金鑰和輸出的文件識別符逾期,這有效地操作以使嵌入的內容逾期。以此方式,增強型文件創建系統110能夠防止提取和使用可能不再準確的使用者資訊(例如,如果使用者的聯繫資訊已經被改變,或者如果文件中的錯誤被更正)。 許可伺服器邏輯126可以向增強型文件創建系統110提供為特定剖析方或剖析方的特定應用程式創建唯一許可金鑰的能力,該剖析方可能需要連同任何的請求提交該金鑰。許可伺服器邏輯126還可允許增強型文件創建系統110將許可金鑰的使用限制於特定系統(例如,基於域、IP位址子網等),將許可金鑰的使用現置於特定的請求率或量(例如,最大的每天或小時量或總體最大的量)。許可伺服器邏輯126可以允許增強型文件創建系統110刪除、停用及/或啟用許可金鑰。透過停用金鑰,它可能不再被授權使用,但仍可保留在系統內,例如用於審計追蹤之目的。 增強型文件創建系統110可以提供對外的服務(例如,SOAP或REST網頁服務),文件剖析系統130在具有被授權的許可金鑰的情況下可以調用以請求與特定加密識別符對應的加密金鑰。在成功驗證許可金鑰時,這可能涉及檢查許可金鑰是否存在,是當前在活動的的,並且沒有超過存取限制,該增強型文件創建系統110可以基於所請求的加密識別來從加密密碼資料庫115取回該加密金鑰,並將其回傳到提出該請求的增強型文件剖析系統130。在增強型文件創建110在輸出時儲存該編碼的文件之實施例中,增強型文件剖析系統130可以能夠調用該服務以請求該編碼內容本身(例如,透過提供與有效許可金鑰一起輸出的編碼文件相關的輸出文件識別符或加密金鑰識別符)。例如,回應於使從增強型文件創建系統110輸出的特定增強型文件151逾期的使用者請求,許可伺服器邏輯126還可允許增強型文件創建系統110基於加密金鑰識別符或相關聯的文件識別符使加密金鑰或編碼內容逾期或刪除。 在一些實施例中,增強型文件創建系統110可以允許文件提交系統160及/或增強型文件剖析系統130向增強型文件創建系統110註冊增強型文件151(例如,透過對公眾的API註冊通知URL),使得當使用者101更新或以其他方式改變初始文件150並將該文件輸出作為更新的增強型文件151時,增強型文件創建系統110可以自動通知文件提交系統160及/或增強型文件剖析系統130。在其他實施例中,文件提交系統160及/或增強型文件剖析系統130可以能夠查詢增強型文件創建系統110(例如,透過調用對公眾的API並傳遞加密金鑰或輸出的文件識別符),以查看增強型文件151是否有更新版本可用,或者用以請求替代格式之增強型文件151(例如,以HTML、RTF或TXT格式),其可能能夠被更好地處理。 增強型文件創建系統110還可以從文件提交系統160及/或增強型文件剖析系統130接收關於增強型文件151的狀態的通知(或其他回饋)。例如,文件提交系統160及/或增強型文件剖析系統130可以向增強型文件創建系統110提供增強型文件151被接收並成功剖析的通知、當試圖剖析增強型文件時發生錯誤或文件為某種方式上為損壞的通知、或一些其他相關於文件狀態的通知(例如,透過觸發包括在增強型文件151之嵌入內容內的通知URL或調用由增強型文件創建系統110提供的對公眾API)。文件提交系統160及/或增強型文件剖析系統130可以連帶通知提供附加情境資訊。例如,在使用者101透過工作申請板提交簡歷的情況下,通知不僅可以指示簡歷的狀態(例如,如被接收、成功剖析或正在審查)而且還提供關於提交的附加細節(例如,識別提交簡歷的公司或職位)。增強型文件創建系統110還可以回應於接收到通知而採取一或多個動作。例如,如果發生會阻止增強型文件151被剖析的錯誤,則可以自動通知使用者101,以允許使用者101重新提交增增強型文件151或採取其他糾正動作。作為另一實例,增強型文件創建系統110可以修改或更新增強型文件151的文件識別符以與從其接收狀態通知的文件提交系統160及/或增強型文件剖析系統130相關聯。 增強型文件剖析系統130可以包括一或多個通訊介面131(例如,WiFi通訊介面或LAN介面)、一或多個處理器132、記憶體133、以及儲存裝置134。記憶體133可以包括元資料提取邏輯135、解密邏輯136、驗證邏輯137、以及解碼邏輯138,處理器132可以運用它們來提供下述系統功能。 元資料提取邏輯135可以允許增強型文件剖析系統130提取嵌入在增強型文件151內的元資料。例如,增強型文件剖析系統130可以從增強型文件151中提取嵌入的元資料以獲得單個提取的位元組字串。在嵌入內容被加密的情況下,增強型文件剖析系統130可以將提取的位元組字串拆分成鹽和初始化向量以及加密內容。在元資料由一系列的數對ID-值組成的情況下,增強型文件剖析系統130可以首先按順序連接這些值(例如,基於ID)以形成單個提取的位元組字串。替代地,在增強型文件創建系統110作用為加密許可伺服器之實施例中,增強型文件剖析系統130可將位元組字串拆分成加密金鑰識別符與加密編碼的內容。 在輸出文件識別符被嵌入到增強型文件151中的情況下,元資料提取邏輯135可以聯繫增強型文件創建系統110以請求當將文件輸出時由文件創建系統110所初始儲存之編碼內容(亦即,與輸出文件識別符相關聯)。例如,增強型文件剖析系統130能夠透過調用對公眾的API並將輸出的文件識別符連同其他請求參數一起傳遞來查詢(query)增強型文件創建系統110。例如,該請求可以指示應該回傳編碼內容的期望格式及/或包括授權增強型文件剖析系統130的許可金鑰。在一些實施例中,增強型文件剖析系統130還可以指示被請求的內容的範圍,例如,指示增強型文件創建系統110是否應該回傳擴充內容、隱藏使用者內容或補充內容,如上所述。 增強型文件剖析系統130可以嘗試從接收到的文件中自動提取嵌入的元資料,假設它是增強型文件151,或者它可以首先例如,基於在文件的可見部分中提供的指示符(例如,關鍵字或短語、符號、圖形等)檢測接收到的文件是否是增強型文件151。在一些情況下,儘管指示符出現在文件的可見部分中,但仍可能被隱藏或混淆以防止人類審閱者的識別和檢查(例如,透過使用小字體尺寸及/或透明或低對比度顏色)。增強型文件剖析系統130還可以判定提取的位元組字串是編碼內容本身還是輸出的文件識別符,並且可以相應地處理提取的元資料。增強型文件剖析系統130也可判定編碼的內容是否為加密的並可相應處理該資料。 解密邏輯136可當增強型文件創建系統110提取或回傳內容時,允許增強型文件剖析系統130可以將該加密內容解密。例如,增強型文件剖析系統130可以使用從增強型文件創建系統110獲得的加密密碼以及從增強型文件151的元資料中提取的鹽和初始化向量來重新產生加密金鑰。或者,在增強型文件創建系統110作用為加密許可伺服器的實施例中,增強型文件剖析系統130可以向增強型文件創建系統110提交包括許可金鑰和從文件元資料特性中提取的加密識別符的請求,這可能會回傳請求的加密金鑰。增強型文件剖析系統130然後可以使用重新產生或回傳的加密金鑰來將加密的編碼內容解密。 驗證邏輯137可以允許增強型文件剖析系統130判定增強型文件151的可見內容自其創建以來是否已經被修改,在被修改之情況下,編碼內容可能不再準確。在這種情況下,增強型文件剖析系統130可以恢復到習知的剖析方法。例如,增強型文件剖析系統130可以將增強型文件151的可見內容中的所有文字字元以及編碼內容中每個元素中的所有文字字元提取成單獨的字串。文字字元可以按其確切的出現順序提取,並且可以包括空格。增強型文件剖析系統130然後可以計算每個字串的雜湊值(例如,使用MD5雜湊演算法),並且將兩個值一起比較以判定是否存在任何差異。 在輸出文件識別符被嵌入於增強型文件151中且從增強型文件創建系統110請求相關聯編碼內容之情況中,增強型文件剖析系統130可發送增強型文件151之雜湊值到增強型文件創建系統110作為其請求之一部分。如所述,增強型文件創建系統110可以計算儲存在文件資料庫116中相關聯編碼的內容之雜湊值,並將該接收到的雜湊值與計算出的雜湊值進行比較以判定增強型文件151自其輸出後是否有被更改。若雜湊值不匹配,則增強型文件創建系統110可以回應錯誤訊息,以及增強型文件剖析系統130可以恢復到習知剖析方法。 解碼邏輯138進而可以允許增強型文件剖析系統130對提取的和可選地解密的內容進行解碼,並且可以根據需要將所得結構化資料提供給文件提交系統160。在一些情況下,增強型文件剖析系統130可以處理提取的內容以將其設置在文件提交系統160所預期的形式中(例如,基於定義模式的一些或所有欄位和元素映射到另一個文件提交系統160使用的模式)。 圖7描繪增強文件創建系統110可以用來創建初始文件150的高階邏輯流程。該過程可開始例如基於透過文件創建平台180提供的使用者輸入來判定使用者101是否想要創建新文件或從現有文件開始工作(700)。如果使用者101決定創建新文件,則增強型文件創建系統110可以基於與使用者101相關聯的使用者設定檔中的一或多個使用者屬性來選擇文件模板,其可以從使用者資料庫117中所取得(710)。增強型文件創建系統110可以根據選擇的模板創建初始文件150,其可以根據定義的模式進行編碼並且作為結構化文件儲存在文件資料庫116中(711)。 或者,如果使用者101決定從現有文件工作,則使用者101可以透過文件創建平台180上傳非增強型文件(720)。增強型文件創建系統110可以使用文件剖析軟體來剖析文件以從非增強型文件中提取資訊(721)。增強型文件創建系統110可以分析提取的資訊以判定上傳的文件中一或多個部分的存在,並且可以創建具有等效部分的初始文件150(722)。初始文件150可以根據定義的模式編碼並作為結構化文件與獨特文件識別符相關聯地儲存在文件資料庫116中。增強型文件創建系統110還可以用使用剖析軟體提取的資訊填充初始文件150內的部分(723)。增強型文件創建系統110可以根據定義的模式對填充的部分進行編碼並且更新文件資料庫116中的結構化文件並且可以分配新的文件識別符。 增強型文件創建系統110然後可以透過文件創建平台180將初始文件150呈現給使用者101以供使用者101查看、輸出或進一步修改其(730)。例如,使用者101可能具以選擇初始文件150之一或多部分以編輯的能力,並且基於使用者對特定部分的選擇(740),增強型文件創建系統110可向使用者101呈現與該部分對應的表格供使用者101進行編輯(732)。使用者101可以透過呈現給使用者101的表格來編輯該部分的內容和格式(741)。一旦完成,增強型文件創建系統110可以對該部分進行編碼並相應地更新文件資料庫116中的結構化文件(732)。該過程可以繼續直到判定使用者101已完成了對文件的編輯(730)。 圖8描繪增強型文件創建系統110可以用來輸出增強型文件151的高階邏輯流程。該過程可以從經由由增強型文件創建系統110所提供的文件創建平台180創建初始文件150開始,該初始文件150可以根據定義的模式編碼並作為結構化文件與獨特文件識別符相關聯地儲存在文件資料庫116中(801)。回應輸出初始文件150的使用者請求(803),增強型文件創建系統110可以從文件資料庫117中取回結構化文件並透過移除任何敏感資訊(例如,SSN、照片等)來將文件去敏感(802)。增強型文件創建系統110然後可以將結構化文件轉譯成標準化模式(804)。增強型文件創建系統110可以使用此去敏感文件以將初始文件150渲染成特定檔案格式(例如,Microsoft Word的DOCX格式或Adobe Acrobat的PDF格式)(806),其在一些實施例,可以由使用者101指定(807)。可以根據可以從表面庫114a載入的特定表面定義(skin definition)來渲染初始文件150(808)。增強型文件創建系統110然後可以判定是否將結構化文件嵌入到渲染的文件中(在806創建)或者是否嵌入與結構化文件相關聯的文件識別符。(809)。如果要嵌入結構化文件,則增強型文件創建系統110可以進一步判定結構化文件是否要被加密(810)。如果是,則可以根據特定加密演算法(811)將結構化文件加密為加密的位元組字串,在一些實施例中,該演算法可以依賴於從加密密碼資料庫115中取回的加密密碼(812)。然後可以將輸出的文件識別符、結構化文件或加密的結構化文件作為位元組字串嵌入到渲染的文件(在806創建)中,形成增強型文件151(813)。 圖9提供了增強文件創建系統110可以用來渲染結構化文件的實施例的例示性邏輯流程。如圖所示,該過程可以從基於結構化文件產生中間檔案開始(901),其中文件內容的定位和樣式(例如,佈局、字體、行寬、間距、邊距等)可以由與從表面庫114a取回的文件相關聯的表面定義(902)。例如,增強型文件創建系統110可以產生包括具有指定CSS樣式的不同HTML元素以及鏈接的CSS樣式表以控制文件內容的位置和樣式(即,視覺外觀)的HTML檔案。增強型文件創建系統110可接著將中間檔案轉換成特定檔案格式,如Microsof Word之DOCX格式(903)或Adobe Acrobat之PDF格式(904),其可取決於使用者101所指定的檔案格式(905)。 圖10提供了增強文件創建系統110可以用來加密結構化文件的實施例的例示性邏輯流程。如圖所示,該過程可開始以增強型文件創建系統110使用諸如PBKDF2之類的加密金鑰產生演算法所產生的加密金鑰(1001),該演算法在產生加密金鑰時可以採用鹽、初始化向量和密碼中的一或多個作為參數。因此,產生加密金鑰可能還需產生隨機的128位元鹽(1002)、產生隨機的128位元初始化向量(1003)以及從加密密碼資料庫115中取回加密密碼(1004)。增強型文件創建系統110然後可以使用諸如AES之類的加密演算法對編碼的內容進行加密(1005),以創建結構化文件的加密的位元組字串。 圖11描繪增強型文件創建系統110可以用來將加密的內容嵌入渲染的文件中的實施例之例示性邏輯流程。如圖所示,該過程可開始以增強型文件創建系統110將隨機產生的鹽和初始化向量預先添加到加密的位元組字串(1101)。在增強型文件創建系統110作用為加密許可伺服器之實施例中,該過程可額外或替代地涉及預先添加加密金鑰識別符到加密的位元組字串中。增強型文件創建系統110然後可以基於轉換後的文件的檔案格式判定是否對元資料可以嵌入到轉換後的檔案格式中的形式設置了任何限制(1102)。例如,Microsoft Word DOCX檔案和Adobe Acrobat PDF檔案可能以數對ID-值的形式將元資料儲存為“自定特性”,而Microsoft Word DOCX檔案中的“自定特性”進一步限制為255個字元的字串長度,或更少。在Adobe Acrobat PDF檔案的情況下,增強型文件創建系統110可以將加密的位元組字串與預先添加的鹽和初始化向量一起寫入作為單一對的ID-值,從而形成增強型文件151(1104)。替代地,在Microsoft Word DOCX 檔案的情況下,增強型文件創建系統110可以將加密的位元組字串拆分到多字串中(1103),其可被寫入到轉換文件中作為一系列之數對ID-值,從而形成增強型文件151(1105)。雖然前面描述了加密內容的嵌入,但是應該理解的是,編碼內容不需要被加密並且可以嵌入作為未加密的位元組字串,或者輸出文件識別符可以嵌入作為位元組字串。 圖12描繪文件剖析系統可以遵循以將增強型文件剖析的高階邏輯流程。如圖所示,該過程可以從增強型文件151的提交開始,例如,透過文件提交系統160(1201)。文件提交系統160可以將增強型文件151傳遞到增強型文件剖析系統130以進行剖析,例如,透過調用公共或對外的服務。增強型文件剖析系統130可以從增強型文件151中提取嵌入的元資料以獲得單個提取的位元組字串(1202)。在元資料由一系列的數對ID-值組成的情況下,增強型文件剖析系統130可以首先按順序連接這些值(例如,基於ID)以形成單個提取的位元組字串。 增強型文件剖析系統130然後可以判定所提取的位元組字串是否代表輸出的文件識別符或結構化內容(1203),並且在後者的情況下可以進一步判定該結構化內容是否被加密(1204)。若提取位元組字串表示輸出的文件識別符,則增強型文件剖析系統130可從增強型文件創建系統110請求相關聯結構化文件(1205)。在提取的元資料被加密的情況下,增強型文件剖析系統130可以將位元組字串拆分成鹽和初始化向量以及加密內容(1206)。增強型文件剖析系統130可以獲得用以產生加密金鑰之加密密碼,該加密金鑰用以將內容加密(例如,透過向增強型文件創建系統110請求其)(1207),並且可使用加密密碼以及從增強型文件151之不可見元資料提取的鹽與初始化向量來重新產生加密金鑰(1208)。替代地,在增強型文件創建系統110作用為加密許可伺服器之實施例中,增強型文件剖析系統130可將位元組字串拆分成加密金鑰識別符與加密內容。增強型文件剖析系統130然後可以向增強型文件創建系統110提交對加密金鑰的請求,該請求包括用於增強型文件剖析系統130的許可金鑰和從嵌入在文件中的不可見元資料中提取的加密識別符。增強型文件剖析系統130可接著使用產生或回傳的加密金鑰來將從增強型文件151之元資料所提取的加密內容進行解密以獲得結構化文件(1209)。 一旦已經獲得結構化文件後,增強型文件剖析系統130可判定增強型文件151自從其首次創建後是否有被修改過(1210)。如果做出文件未被修改之判定,則增強型文件剖析系統130可以解碼該結構化文件並根據需要提取單獨的內容元素(1211)。替代地,若做出增強型文件151已經被修改之判定,則增強型文件剖析系統130可使用習知剖析技術以剖析增強型文件151之可見內容(1212)。 圖13描繪增強型文件剖析系統130可以用來判定是否將先前輸出的文件修改的例示性邏輯流程。該過程可以從增強型文件剖析系統130將增強型文件151的可見內容中的所有文字字元提取成單個字串開始(1301)。增強型文件剖析系統130也可將結構化文件之各元素中的所有文字字元(包括空白)提取成單一字串,其中該等元素以其在結構化文件中確切出現順序被進行處理(1302)。增強型文件剖析系統130然後可以使用MD5雜湊演算法計算每個字串的雜湊值(1303a、1303b),並且將該等值進行比較(1304)。如果計算出的雜湊值相同,則文件未被修改。相反地,如果雜湊值不同,則增強型文件151的可見內容已經以某種方式被改變。在輸出文件識別符被嵌入在增強型文件151中的實施例中,可採用相似處理。例如,增強型文件剖析系統130可以計算增強型文件151的可見內容的雜湊值(如在1301、1303a中)並將計算出的雜湊值作為對與輸出文件識別符相關的結構化文件的請求的一部分發送到增強型文件創建系統110中。增強型文件創建系統110然後可以計算與儲存在文件資料庫116中的輸出文件識別符相關聯的結構化文件的雜湊值(如在1302、1303b中),並且可以將從增強型文件剖析系統130接收的雜湊值與計算出的雜湊值進行比較以判定文件是否已被修改(如1304)。若雜湊值匹配,則增強型文件創建系統110可判定增強型文件151自從被輸出後沒有被修改,並且可回傳該結構化文件到增強型文件剖析系統130。 雖然上面已經描述了本發明的特定實施例,但是應當理解,可以不同於所描述的方式來實踐本發明。所描述的實施例以及說明書中對「一個實施例」、「一實施例」、「一個例示性實施例」、「一些實施例」等的引用表明所描述的實施例可以包括特定特徵、結構或特性,但每個實施例可能不一定包括該特定的特徵、結構或特性。此外,此類詞語不必然係在參照同一個實施例。此外,當特定特徵、結構、或特性係結合實施例而被描述時,無論有無明確描述,對結合其他實施例之此類特徵、結構、或特性做出改變係被理解為在該領域中具有通常知識者之知識內的。 以上提供的描述旨在說明性而非限制性。因此,對於本技術領域中具有通常知識者來說顯而易見的是,可以對本發明進行如所述的修改而不脫離下面闡述的申請專利範圍的範疇。舉例而言,雖然前面可能描述了加密內容的嵌入,但是應該理解的是,編碼內容不需要被加密並且可以嵌入作為未加密的位元組字串。此外,雖然以上描述是參考增強的簡歷文件的創建和剖析所提供的,但本發明不限於此,並且可以自然地擴展到其他上下文。例如,增強型文件創建和剖析系統可用於創建增強型報稅文件。 特定實施例之前述說明將能完整揭露本發明之一般本質,以使在該技術領域中具有通常知識者可易於修改及/或適應諸如特定實施例之各種應用,前提係沒有不當實驗且沒有背離本發明之一般概念。因此,基於本文所呈教示與指導,此類適應與修改目的在於在揭示實施例之等效物之範疇與意義中。應瞭解本文之用語或術語係用於說明而非限制之目的,因此本說明書之用語或術語應由本技術領域人員根據教示和指導來進行解釋。 本發明之廣度與範疇不應由上述例示性實施例之任意者所限制,而應僅根據所附申請專利範圍及其等效物所界定。
100:環境 101:使用者 102:使用者裝置 110:增強型文件創建系統 111:通訊介面 112:處理器 113:記憶體 114:儲存裝置 114a:表面庫 115:加密密碼資料庫 116:文件資料庫 117:使用者資料庫 120:文件創建平台邏輯 121:編碼邏輯 122:去敏感邏輯 123:渲染邏輯 124:加密邏輯 125:嵌入邏輯 126:許可伺服器邏輯 130:增強型文件剖析系統 131:通訊介面 132:處理器 133:記憶體 134:儲存裝置 135:元資料提取邏輯 136:解密邏輯 137:驗證邏輯 138:解碼邏輯 140:網際網路 150:初始文件 151:增強型文件 160:文件提交系統 180:承載文件創建平台 190:文件提交平台 210:圖形元素 220:結構化資料 310:圖形元素 311a:浮動塊控件 311b:浮動塊控件 311c:浮動塊控件 311d:浮動塊控件 320:結構化資料 321a:浮動塊控件 321b:浮動塊控件 321c:浮動塊控件 321d:浮動塊控件 322a:欄位 322b:欄位 322c:欄位 322d:欄位 401:列表之圖形元素 402:使用者技能 410:圖形元素 411:描述 420:結構化資料 451:增強型文件 510:圖形元素 520:結構化資料 700:流程 710:流程 711:流程 720:流程 721:流程 722:流程 723:流程 730:流程 731:流程 732:流程 740:流程 741:流程 801:流程 802:流程 803:流程 804:流程 806:流程 807:流程 808:流程 809:流程 810:流程 811:流程 812:流程 813:流程 901:流程 902:流程 903:流程 904:流程 905:流程 1001:流程 1002:流程 1003:流程 1004:流程 1005:流程 1101:流程 1102:流程 1103:流程 1104:流程 1105:流程 1201:流程 1202:流程 1203:流程 1204:流程 1205:流程 1206:流程 1207:流程 1208:流程 1209:流程 1210:流程 1211:流程 1212:流程 1301:流程 1302:流程 1303A:流程 1303B:流程 1304:流程
在本文併入且形成說明書的部分之隨附圖式說明本發明一或多態樣,且連同說明將進一步用以解釋本發明之原理及使在該相關技術領域中具有通常知識者得以建造及使用本發明。 [圖1]圖示其中可以使用本發明的文件創建和文件剖析技術的例示性環境。 [圖2]圖示根據定義的模式進行編碼的圖形元素的第一實例。 [圖3]圖示根據定義的模式進行編碼的圖形元素的第二實例。 [圖4]圖示根據定義的模式進行編碼的圖形元素的第三實例。 [圖5]圖示根據定義的模式進行編碼的圖形元素的第四實例。 [圖6]圖示增強型文件創建系統可以用來編碼初始文件的例示性模式的高階視圖。 [圖7]描繪增強型文件創建系統可以用來創建初始文件的高階邏輯流程。 [圖8]描繪增強型文件創建系統可以用來將初始文件輸出為增強型文件的高階邏輯流程。 [圖9]描繪增強型文件創建系統可以用來渲染結構化文件的例示性邏輯流程。 [圖10]描繪增強型文件創建系統可以用來將結構化文件加密的例示性邏輯流程。 [圖11]描繪增強型文件創建系統可以用來將加密的內容嵌入渲染的文件中的例示性邏輯流程。 [圖12]描繪增強型文件剖析系統可以遵循以將增強型文件剖析的高階邏輯流程。 [圖13]描繪增強型文件剖析系統可以用來判定是否將增強型文件修改的例示性邏輯流程。 當結合圖式時,讀者將可從下文所陳述之詳細說明趨向清楚地了解到所揭露實施例之特徵及優勢,在該等圖式中相似參考字元通篇代表對應元件。在附圖中,相似的附圖標記通常表示相同、功能相似及/或結構相似的元件。除非另有說明,本揭露中提供的附圖不必解釋為按比例繪製的附圖。
100:環境
101:使用者
102:使用者裝置
110:增強型文件創建系統
111:通訊介面
112:處理器
113:記憶體
114:儲存裝置
114a:表面庫
115:加密密碼資料庫
116:文件資料庫
117:使用者資料庫
120:文件創建平台邏輯
121:編碼邏輯
122:去敏感邏輯
123:渲染邏輯
124:加密邏輯
125:嵌入邏輯
126:許可伺服器邏輯
130:增強型文件剖析系統
131:通訊介面
132:處理器
133:記憶體
134:儲存裝置
135:元資料提取邏輯
136:解密邏輯
137:驗證邏輯
138:解碼邏輯
140:網際網路
150:初始文件
151:增強型文件
160:文件提交系統
180:承載文件創建平台
190:文件提交平台

Claims (75)

  1. 一種創建增強型文件的方法,該方法包含: 向使用者呈現文件創建平台; 使用該文件創建平台創建初始文件,其中該初始文件的內容是非結構化的; 基於該初始文件的該內容的已知語義,根據定義的文件模式對該初始文件進行編碼以形成結構化文件; 儲存與唯一文件識別符相關聯的該結構化文件; 以使用者指定的檔案格式渲染該結構化文件以創建渲染的文件;以及 將該唯一文件識別符嵌入該渲染的文件中作為不可見元資料以形成該增強型文件。
  2. 如請求項1所述之方法,更包含: 從文件剖析系統接收對該結構化文件的請求,該請求包含相關聯的該唯一文件識別符;以及 回應於該請求將該結構化文件發送到該文件剖析系統。
  3. 如請求項1所述之方法,更包含: 將該結構化文件轉譯成標準化文件模式,以形成轉譯的文件;以及 儲存與該唯一文件識別符相關聯的該轉譯的文件。
  4. 如請求項1所述之方法,其中,該使用者指定的檔案格式接受元資料作為數對的ID和值,以及其中該嵌入的元資料在該文件中為不可見。
  5. 如請求項1所述之方法,更包含:將該結構化文件去敏感,以在渲染該結構化文件之前將敏感的使用者資訊移除。
  6. 如請求項1所述之方法,其中根據從表面資料庫取回的表面渲染該初始文件。
  7. 如請求項1所述之方法,其中該初始文件包含圖形元素,以及其中將該圖形元素編碼包含將該圖形元素中的視覺指示符映射到該定義的文件模式中欄位的值。
  8. 如請求項1所述之方法,其中只有將該初始文件的一部分渲染以創建該渲染的文件。
  9. 如請求項1所述之方法,更包含: 透過文件提交系統接收關於該增強型文件的處理狀態的狀態通知;以及 向該使用者呈現指示該增強型文件的該處理狀態之儀表板。
  10. 一種文件創建系統,包含: 至少一處理器;及 與該處理器通訊的記憶體,該記憶體上儲存有複數個指令, 其中該處理器經組態以執行該指令以: 向使用者呈現文件創建平台; 使用該文件創建平台創建初始文件,其中該初始文件的內容是非結構化的; 基於該初始文件的該內容的已知語義,根據定義的文件模式對該初始文件進行編碼以形成結構化文件; 儲存與唯一文件識別符相關聯的該結構化文件; 以使用者指定的檔案格式渲染該結構化文件以創建渲染的文件;以及 將該唯一文件識別符嵌入該渲染的文件中作為不可見元資料以形成該增強型文件。
  11. 如請求項10所述之文件創建系統,其中該處理器更組態以執行該指令,用以: 從文件剖析系統接收對該結構化文件的請求,該請求包含相關聯的該唯一文件識別符;以及 回應於該請求將該結構化文件發送到該文件剖析系統。
  12. 如請求項10所述之文件創建系統,其中該處理器更組態以執行該指令,用以: 將該結構化文件轉譯成標準化文件模式,以形成轉譯的文件;以及 使用根據加密演算法產生的加密金鑰將該轉譯的文件加密為加密的位元組字串;以及 將該加密的位元組字串嵌入該渲染的文件中作為該元資料以形成該增強型文件。
  13. 如請求項10所述之文件創建系統,其中,該使用者指定的檔案格式接受元資料作為數對的ID和值,以及其中該嵌入的元資料在該文件中為不可見。
  14. 如請求項10所述之文件創建系統,其中該處理器更組態以執行該指令,用以: 將該結構化文件去敏感,以在渲染該結構化文件之前將敏感的使用者資訊移除。
  15. 如請求項10所述之文件創建系統,其中該處理器組態以執行該指令,用以: 根據從表面資料庫取回的表面渲染該初始文件。
  16. 如請求項10所述之文件創建系統,其中該初始文件包含圖形元素,以及其中執行該指令以將該圖形元素編碼之該處理器更組態以: 將該圖形元素中的視覺指示符映射到該定義的文件模式中欄位的值。
  17. 如請求項10所述之文件創建系統,其中執行該指令以渲染該初始文件之該處理器組態以: 只有將該初始文件的一部分渲染以創建該渲染的文件。
  18. 如請求項10所述之文件創建系統,其中該處理器組態以執行該指令,用以: 透過文件提交系統接收關於該增強型文件的該處理的狀態通知;以及 向該使用者呈現指示該增強型文件的該狀態之儀表板。
  19. 一種由文件剖析系統處理增強型文件的方法,該方法包含: 在該文件剖析系統接收增強型文件,該增強型文件具有嵌入其中的可見內容和不可見元資料; 提取該嵌入的元資料以取回與儲存在文件創建系統中的結構化文件相關聯的文件識別符; 向該文件創建系統發送對該結構化文件的請求; 回應於該請求從該文件創建系統接收該結構化文件;以及 將該結構化文件發送至文件提交平台。
  20. 如請求項19所述之方法,更包含: 在提取該嵌入的元資料之前驗證該增強型文件未被修改。
  21. 一種創建增強型文件的方法,該方法包含: 向使用者呈現文件創建平台; 使用該文件創建平台創建初始文件,其中該初始文件的內容是非結構化的; 基於該初始文件的該內容的已知語義,根據定義的文件模式對該初始文件進行編碼以形成結構化文件; 以使用者指定的檔案格式渲染該結構化文件以創建渲染的文件; 將該結構化文件嵌入該渲染的文件中作為元資料以形成該增強型文件。
  22. 如請求項21所述之方法,更包含: 使用根據加密演算法產生的加密金鑰將該結構化文件加密為加密的位元組字串;以及 將該加密的位元組字串嵌入該渲染的文件中作為該元資料以形成該增強型文件。
  23. 如請求項21所述之方法,更包含: 將該結構化文件轉譯成標準化文件模式,以形成轉譯的文件; 使用根據加密演算法產生的加密金鑰將該轉譯的文件加密為加密的位元組字串;以及 將該加密的位元組字串嵌入該渲染的文件中作為該元資料以形成該增強型文件。
  24. 如請求項21所述之方法,其中,該使用者指定的檔案格式接受元資料作為數對的ID和值,以及其中該嵌入的元資料在該文件中為不可見。
  25. 如請求項21所述之方法,更包含:將該結構化文件去敏感,以在渲染該結構化文件之前將敏感的使用者資訊移除。
  26. 如請求項21所述之方法,其中根據從表面資料庫取回的表面渲染該初始文件。
  27. 如請求項21所述之方法,其中該初始文件包含圖形元素,以及其中將該圖形元素編碼包含將該圖形元素中的視覺指示符映射到該定義的文件模式中欄位的值。
  28. 如請求項21所述之方法,其中只有將該初始文件的一部分渲染以創建該渲染的文件。
  29. 如請求項21所述之方法,更包含: 透過文件提交系統接收關於該增強型文件的該處理的狀態通知;以及 向該使用者呈現指示該增強型文件的該狀態之儀表板。
  30. 一種文件創建系統,包含: 至少一處理器;及 與該處理器通訊的記憶體,該記憶體上儲存有複數個指令, 其中該處理器經組態以執行該指令以: 向使用者呈現文件創建平台以創建初始文件,該初始文件包含具有對應示出內容的一或多個部分; 基於該一或多個的部分中的該文件內容的已知語義,根據定義的文件模式對該初始文件進行編碼以形成結構化文件; 以使用者指定的檔案格式渲染該結構化文件以創建渲染的文件;以及 將該結構化文件嵌入該渲染的文件中作為元資料以形成該增強型文件。
  31. 如請求項30所述之文件創建系統,其中該處理器更組態以執行該指令,用以: 使用根據加密演算法產生的加密金鑰將該結構化文件加密為加密的位元組字串;以及 將該加密的位元組字串嵌入該渲染的文件中作為該元資料以形成該增強型文件。
  32. 如請求項30所述之文件創建系統,其中該處理器更組態以執行該指令,用以: 將該結構化文件轉譯成標準化文件模式,以形成轉譯的文件;以及 使用根據加密演算法產生的加密金鑰將該轉譯的文件加密為加密的位元組字串;以及 將該加密的位元組字串嵌入該渲染的文件中作為該元資料以形成該增強型文件。
  33. 如請求項30所述之文件創建系統,其中,該使用者指定的檔案格式接受元資料作為數對的ID和值,以及其中該嵌入的元資料在該文件中為不可見。
  34. 如請求項30所述之文件創建系統,其中該處理器更組態以執行該指令,用以: 將該結構化文件去敏感,以在渲染該結構化文件之前將敏感的使用者資訊移除。
  35. 如請求項30所述之文件創建系統,其中該處理器組態以執行該指令,用以: 根據從表面資料庫取回的表面渲染該初始文件。
  36. 如請求項30所述之文件創建系統,其中該初始文件包含圖形元素,以及其中執行該指令以將該圖形元素編碼之該處理器更組態以: 將該圖形元素中的視覺指示符映射到該定義的文件模式中欄位的值。
  37. 如請求項30所述之文件創建系統,其中執行該指令以渲染該初始文件之該處理器組態以: 只有將該初始文件的一部分渲染以創建該渲染的文件。
  38. 如請求項30所述之文件創建系統,其中該處理器組態以執行該指令,用以: 透過文件提交系統接收關於該增強型文件的該處理的狀態通知;以及 向該使用者呈現指示該增強型文件的該狀態之儀表板。
  39. 一種非暫態電腦可讀媒體,包括複數個指令,該複數個指令可由處理器執行以: 向使用者呈現文件創建平台以創建初始文件,該初始文件包含具有對應文件內容的一或多個部分; 基於該一或多個的部分中的該文件內容的已知語義,根據定義的文件模式對該初始文件進行編碼以形成結構化文件; 以使用者指定的檔案格式渲染該結構化文件以創建渲染的文件;以及 將該結構化文件嵌入該渲染的文件中作為元資料以形成該增強型文件。
  40. 如請求項39所述之非暫態電腦可讀媒體,其中該指令可由該處理器進一步執行以: 使用根據加密演算法產生的加密金鑰將該結構化文件加密為加密的位元組字串;以及 將該加密的位元組字串嵌入該渲染的文件中作為該元資料以形成該增強型文件。
  41. 一種由文件剖析系統處理增強型文件的方法,該方法包含: 在該文件剖析系統接收增強型文件,該增強型文件具有嵌入其中的不可見元資料; 從嵌入在該增強型文件中的該元資料提取編碼的內容;以及 將該編碼的內容作為結構化文件發送至文件提交平台。
  42. 如請求項41所述之方法,更包含: 在提取該編碼的內容之前驗證該增強型文件未被修改。
  43. 如請求項41所述之方法,其中,將該元資料儲存作為數對的ID和值,以及其中提取該編碼的內容更包含: 存取該增強型文件的該嵌入的元資料中的一或多個位元組字串片段,該每個位元組字串片段具有相關聯的識別符;以及 將該一或多個位元組字串片段組裝成位元組字串以獲得根據定義的文件模式編碼的內容,該編碼的內容包含一或多個元素,具有一或多個欄位和對應的欄位值。
  44. 如請求項41所述之方法,其中,將該元資料儲存作為數對的ID和值,以及其中提取該編碼的內容更包含: 存取該增強型文件的該嵌入的元資料中的一或多個加密的位元組字串片段,每個加密的位元組字串片段具有相關聯的識別符; 將該一或多個加密的位元組字串片段組裝成加密的位元組字串; 選擇該加密的位元組字串的起始部分作為加密鹽和初始化向量,以及從該加密的位元組字串中截斷該起始部分;以及 從加密密碼資料庫中獲得加密密碼; 使用根據解密演算法利用該加密密碼、鹽以及初始化向量所產生的解密金鑰,將該截斷的加密的位元組字串解密,以獲得根據定義的文件模式編碼的內容,該編碼的內容包含一或多個元素,具有一或多個欄位和對應的欄位值。
  45. 如請求項41所述之方法,其中,將該元資料儲存作為數對的ID和值,以及其中提取該編碼的內容更包含: 存取該增強型文件的該嵌入的元資料中的一或多個加密的位元組字串片段,每個加密的位元組字串片段具有相關聯的識別符; 將該一或多個加密的位元組字串片段組裝成加密的位元組字串; 選擇該加密的位元組字串的起始部分作為加密金鑰識別符,以及從該加密的位元組字串中截斷該起始部分; 向許可伺服器發送對加密金鑰的請求,其中該請求包含與授權方相關聯的許可金鑰和該加密金鑰識別符; 在成功驗證該許可金鑰後接收解密金鑰以回應該請求;以及 使用該解密金鑰將該截斷的加密的位元組字串解密,以獲得根據定義的文件模式編碼的內容,該編碼的內容包含一或多個元素,具有一或多個欄位和對應的欄位值。
  46. 如請求項41所述之方法,更包含: 使用文件創建系統註冊該增強型文件; 當該增強型文件更新時接收到通知;以及 在接收到該通知後,請求更新版本的該增強型文件。
  47. 如請求項41所述之方法,更包含: 在成功提取該編碼的內容後向文件創建系統發送狀態通知。
  48. 一種文件剖析系統,包含: 至少一處理器;及 與該處理器通訊的記憶體,該記憶體上儲存有複數個指令, 其中該處理器經組態以執行該指令以: 在該文件剖析系統接收增強型文件,該增強型文件具有嵌入其中的不可見元資料; 從嵌入在該增強型文件中的該元資料提取編碼的內容;以及 將該編碼的內容作為結構化文件發送至文件提交平台。
  49. 如請求項48所述之文件剖析系統,其中該處理器更組態以執行該指令,用以: 在執行該指令以提取該編碼的內容之前驗證該增強型文件未被修改。
  50. 如請求項48所述之文件剖析系統,其中,將該元資料儲存作為數對的ID和值,以及其中提取該編碼的內容之該處理器更組態以執行該指令以: 存取該增強型文件的該嵌入的元資料中的一或多個位元組字串片段,該每個位元組字串片段具有相關聯的識別符;以及 將該一或多個位元組字串片段組裝成位元組字串以獲得根據定義的文件模式編碼的內容,該編碼的內容包含一或多個元素,具有一或多個欄位和對應的欄位值。
  51. 如請求項48所述之文件剖析系統,其中,將該元資料儲存作為數對的ID和值,以及其中提取該編碼的內容之該處理器更組態以執行該指令以: 存取該增強型文件的該嵌入的元資料中的一或多個加密的位元組字串片段,該每個加密的位元組字串片段具有相關聯的識別符; 將該一或多個加密的位元組字串片段組裝成加密的位元組字串; 選擇該加密的位元組字串的起始部分作為加密鹽和初始化向量,以及從該加密的位元組字串中截斷該起始部分; 從加密密碼資料庫中獲得加密密碼;以及 使用根據解密演算法利用該加密密碼、鹽以及初始化向量所產生的解密金鑰,將該截斷的加密的位元組字串解密,以獲得根據定義的文件模式編碼的內容,該編碼的內容包含一或多個元素,具有一或多個欄位和對應的欄位值。
  52. 如請求項48所述之文件剖析系統,其中,將該元資料儲存作為數對的ID和值,以及其中提取該編碼的內容之該處理器更組態以執行該指令以: 存取該增強型文件的該嵌入的元資料中的一或多個加密的位元組字串片段,該每個加密的位元組字串片段具有相關聯的識別符; 將該一或多個加密的位元組字串片段組裝成加密的位元組字串; 選擇該加密的位元組字串的起始部分作為加密金鑰識別符,以及從該加密的位元組字串中截斷該起始部分; 向許可伺服器發送對加密金鑰的請求,其中該請求包含與授權方相關聯的許可金鑰和該加密金鑰識別符; 在成功驗證該許可金鑰後接收解密金鑰以回應該請求;以及 使用該解密金鑰將該截斷的加密的位元組字串解密,以獲得根據定義的文件模式編碼的內容,該編碼的內容包含一或多個元素,具有一或多個欄位和對應的欄位值。
  53. 如請求項48所述之文件剖析系統,其中該處理器更組態以執行該指令,用以: 使用文件創建系統註冊該增強型文件; 當該增強型文件更新時接收到通知;以及 在接收到該通知後,請求更新版本的該增強型文件。
  54. 如請求項48所述之文件剖析系統,其中該處理器更組態以執行該指令,用以: 在成功提取該編碼的內容後向文件創建系統發送狀態通知。
  55. 一種非暫態電腦可讀媒體,包括複數個指令,該複數個指令可由處理器執行以: 在該文件剖析系統接收增強型文件,該增強型文件具有嵌入其中的不可見元資料; 從嵌入在該增強型文件中的該元資料提取編碼的內容;以及 將該編碼的內容作為結構化文件發送至文件提交平台。
  56. 如請求項55所述之非暫態電腦可讀媒體,其中該指令可進一步執行以: 在提取該編碼的內容之前驗證該增強型文件未被修改。
  57. 如請求項55所述之非暫態電腦可讀媒體,其中,將該元資料儲存作為數對的ID和值,以及其中用於提取該編碼的內容之該指令更可執行以: 存取該增強型文件的該嵌入的元資料中的一或多個位元組字串片段,該每個位元組字串片段具有相關聯的識別符;以及 將該一或多個位元組字串片段組裝成位元組字串以獲得根據定義的文件模式編碼的內容,該編碼的內容包含一或多個元素,具有一或多個欄位和對應的欄位值。
  58. 如請求項55所述之非暫態電腦可讀媒體,其中,將該元資料儲存作為數對的ID和值,以及其中用於提取該編碼的內容之該指令更可執行以: 存取該增強型文件的該嵌入的元資料中的一或多個加密的位元組字串片段,該每個加密的位元組字串片段具有相關聯的識別符; 將該一或多個加密的位元組字串片段組裝成加密的位元組字串; 選擇該加密的位元組字串的起始部分作為加密鹽和初始化向量,以及從該加密的位元組字串中截斷該起始部分; 從加密密碼資料庫中獲得加密密碼;以及 使用根據解密演算法利用該加密密碼、鹽以及初始化向量所產生的解密金鑰,將該截斷的加密的位元組字串解密,以獲得根據定義的文件模式編碼的內容,該編碼的內容包含一或多個元素,具有一或多個欄位和對應的欄位值。
  59. 如請求項55所述之非暫態電腦可讀媒體,其中,將該元資料儲存作為數對的ID和值,以及其中用於提取該編碼的內容之該指令更可執行以: 存取該增強型文件的該嵌入的元資料中的一或多個加密的位元組字串片段,該每個加密的位元組字串片段具有相關聯的識別符; 將該一或多個加密的位元組字串片段組裝成加密的位元組字串; 選擇該加密的位元組字串的起始部分作為加密金鑰識別符,以及從該加密的位元組字串中截斷該起始部分; 向許可伺服器發送對加密金鑰的請求,其中該請求包含與授權方相關聯的許可金鑰和該加密金鑰識別符; 在成功驗證該許可金鑰後接收解密金鑰以回應該請求;以及 使用該解密金鑰將該截斷的加密的位元組字串解密,以獲得根據定義的文件模式編碼的內容,該編碼的內容包含一或多個元素,具有一或多個欄位和對應的欄位值。
  60. 如請求項55所述之非暫態電腦可讀媒體,其中,將該元資料儲存作為數對的ID和值,以及其中用於提取該編碼的內容之該指令更可執行以: 使用文件創建系統註冊該增強型文件; 當該增強型文件更新時接收到通知;以及 在接收到該通知後,請求更新版本的該增強型文件。
  61. 一種由文件提交平台處理增強型文件的方法,該方法包含: 在該文件提交平台接收增強型文件,該增強型文件具有嵌入其中的不可見元資料; 將該增強型文件發送到文件剖析系統以提取該嵌入的元資料; 從該文件剖析系統接收到回應該發送的結構化文件,該結構化文件包含根據定義的文件模式編碼的內容,該編碼的內容包含一或多個元素,具有一或多個欄位和對應的欄位值; 將一或多個欄位值映射到透過該文件提交平台呈現的表格上的對應欄位。
  62. 如請求項61所述之方法,更包含: 使用文件創建系統註冊該增強型文件; 當該增強型文件更新時接收到通知;以及 在接收到該通知後,請求更新版本的該增強型文件。
  63. 如請求項61所述之方法,更包含: 在從該文件剖析系統接收到該結構化文件後,發送狀態通知到文件創建系統。
  64. 如請求項61所述之方法,更包含: 從文件創建系統接收與使用者相關聯的一列表的增強型文件; 透過該文件提交平台向該使用者呈現該列表的增強型文件;以及 回應於該使用者從該列表選擇的特定增強型文件,從文件創建平台接收該增強型文件。
  65. 如請求項64所述之方法,更包含: 在接收該列表的增強型文件之前,利用該文件創建系統認證該使用者;以及 在接收該增強型文件之前,利用該文件創建平台認證該文件提交平台。
  66. 一種文件提交系統,包含: 至少一處理器;及 與該處理器通訊的記憶體,該記憶體上儲存有複數個指令, 其中該處理器經組態以執行該指令以: 在該文件提交平台接收增強型文件,該增強型文件具有嵌入其中的不可見元資料; 將該增強型文件發送到文件剖析系統以提取該嵌入的元資料; 從該文件剖析系統接收到回應該發送的結構化文件,該結構化文件包含根據定義的文件模式編碼的內容,該編碼的內容包含一或多個元素,具有一或多個欄位和對應的欄位值;以及 將一或多個欄位值映射到透過該文件提交平台呈現的表格上的對應欄位。
  67. 如請求項66所述之文件提交系統,其中該處理器更組態以執行該指令,用以: 使用文件創建系統註冊該增強型文件; 當該增強型文件更新時接收到通知;以及 在接收到該通知後,請求更新版本的該增強型文件。
  68. 如請求項66所述之文件提交系統,其中該處理器更組態以執行該指令,用以: 在從該文件剖析系統接收到該結構化文件後,發送狀態通知到文件創建系統。
  69. 如請求項66所述之文件提交系統,其中該處理器更組態以執行該指令,用以: 從文件創建系統接收與使用者相關聯的一列表的增強型文件; 透過該文件提交平台向該使用者呈現該列表的增強型文件;以及 回應於該使用者從該列表選擇的特定增強型文件,從文件創建平台接收該增強型文件。
  70. 如請求項69所述之文件提交系統,其中該處理器更組態以執行該指令,用以: 在執行指令以接收該列表的增強型文件之前,利用該文件創建系統認證該使用者;以及 在執行指令以接收該增強型文件之前,利用該文件創建平台認證該文件提交平台。
  71. 一種非暫態電腦可讀媒體,包括複數個指令,該複數個指令可由處理器執行以: 在該文件提交平台接收增強型文件,該增強型文件具有嵌入其中的不可見元資料; 將該增強型文件發送到文件剖析系統以提取該嵌入的元資料; 從該文件剖析系統接收到回應該發送的結構化文件,該結構化文件包含根據定義的文件模式編碼的內容,該編碼的內容包含一或多個元素,具有一或多個欄位和對應的欄位值;以及 將一或多個欄位值映射到透過該文件提交平台呈現的表格上的對應欄位。
  72. 如請求項71所述之非暫態電腦可讀媒體,其中該指令可進一步執行以: 使用文件創建系統註冊該增強型文件; 當該增強型文件更新時接收到通知;以及 在接收到該通知後,請求更新版本的該增強型文件。
  73. 如請求項71所述之非暫態電腦可讀媒體,其中該指令可進一步執行以: 在從該文件剖析系統接收到該結構化文件後,發送狀態通知到文件創建系統。
  74. 如請求項71所述之非暫態電腦可讀媒體,其中該指令可進一步執行以: 從文件創建系統接收與使用者相關聯的一列表的增強型文件; 透過該文件提交平台向該使用者呈現該列表的增強型文件;以及 回應於該使用者從該列表選擇的特定增強型文件,從文件創建平台接收該增強型文件。
  75. 如請求項71所述之非暫態電腦可讀媒體,其中該指令可進一步執行以: 在執行指令以接收該列表的增強型文件之前,利用該文件創建系統認證該使用者;以及 在執行指令以接收該增強型文件之前,利用該文件創建平台認證該文件提交平台。
TW110116782A 2020-05-08 2021-05-10 建立用於完美自動化剖析的增強型文件的系統及方法 TW202201243A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202063021968P 2020-05-08 2020-05-08
US63/021,968 2020-05-08

Publications (1)

Publication Number Publication Date
TW202201243A true TW202201243A (zh) 2022-01-01

Family

ID=75497995

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110116782A TW202201243A (zh) 2020-05-08 2021-05-10 建立用於完美自動化剖析的增強型文件的系統及方法

Country Status (8)

Country Link
US (5) US11281783B2 (zh)
EP (4) EP3924863A1 (zh)
AU (4) AU2021267818B2 (zh)
BR (4) BR112022001256A2 (zh)
CA (4) CA3215912A1 (zh)
MX (1) MX2022002517A (zh)
TW (1) TW202201243A (zh)
WO (1) WO2021225687A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230067897A1 (en) * 2021-08-25 2023-03-02 Paypal, Inc. Automatic detection of proxy-based phishing sites
WO2023215211A1 (en) * 2022-05-03 2023-11-09 Bold Limited Systems and methods for improved user-reviewer interaction using enhanced electronic documents linked to online documents
WO2023215786A1 (en) * 2022-05-03 2023-11-09 Bold Limited Systems and methods for improved user-reviewer interaction using enhanced electronic documents linked to online documents
US11775754B1 (en) 2022-05-03 2023-10-03 Bold Limited Systems and methods for improved user-reviewer interaction using enhanced electronic documents linked to online documents
TWI822602B (zh) * 2023-02-24 2023-11-11 呂英璋 網頁編輯系統及其方法

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7228437B2 (en) 1998-08-13 2007-06-05 International Business Machines Corporation Method and system for securing local database file of local content stored on end-user system
US6959288B1 (en) 1998-08-13 2005-10-25 International Business Machines Corporation Digital content preparation system
US7110984B1 (en) 1998-08-13 2006-09-19 International Business Machines Corporation Updating usage conditions in lieu of download digital rights management protected content
US7624158B2 (en) 2003-01-14 2009-11-24 Eycast Inc. Method and apparatus for transmission and storage of digital medical data
US20050120290A1 (en) 2003-12-01 2005-06-02 Information Handling Services Inc. Page rendered electronic file processing
JP4716709B2 (ja) 2004-06-10 2011-07-06 インターナショナル・ビジネス・マシーンズ・コーポレーション 構造化文書処理装置、構造化文書処理方法、及びプログラム
US9201854B1 (en) 2006-10-25 2015-12-01 Hewlett-Packard Development Company, L.P. Methods and systems for creating, interacting with, and utilizing a superactive document
US20080163364A1 (en) 2006-12-27 2008-07-03 Andrew Rodney Ferlitsch Security method for controlled documents
US8195767B2 (en) 2008-12-22 2012-06-05 Sap Ag Method and software for reducing server requests by a browser
US8468345B2 (en) 2009-11-16 2013-06-18 Microsoft Corporation Containerless data for trustworthy computing and data services
US9537650B2 (en) 2009-12-15 2017-01-03 Microsoft Technology Licensing, Llc Verifiable trust for data through wrapper composition
US9489523B2 (en) 2010-04-08 2016-11-08 University Of Washington Through Its Center For Commercialization Systems and methods for file access auditing
US8452822B2 (en) 2010-06-30 2013-05-28 Verizon Patent And Licensing Inc. Universal file naming for personal media over content delivery networks
US20140317009A1 (en) 2013-04-22 2014-10-23 Pangea Connect, Inc Managing Online and Offline Interactions Between Recruiters and Job Seekers
US9213684B2 (en) 2013-09-13 2015-12-15 Box, Inc. System and method for rendering document in web browser or mobile device regardless of third-party plug-in software
US20150302218A1 (en) 2014-04-22 2015-10-22 Pacid Technologies, Llc Method and system for file hiding
US9934213B1 (en) * 2015-04-28 2018-04-03 Intuit Inc. System and method for detecting and mapping data fields for forms in a financial management system
US10733370B2 (en) 2015-08-18 2020-08-04 Change Healthcare Holdings, Llc Method, apparatus, and computer program product for generating a preview of an electronic document
US9507762B1 (en) * 2015-11-19 2016-11-29 International Business Machines Corporation Converting portions of documents between structured and unstructured data formats to improve computing efficiency and schema flexibility
DE112016005443T5 (de) * 2015-11-29 2018-08-16 Vatbox Ltd. System und Verfahren zur automatischen Validierung
CN105678189B (zh) * 2016-01-15 2018-10-23 上海海事大学 加密数据文件存储和检索系统及方法
US10650086B1 (en) * 2016-09-27 2020-05-12 Palantir Technologies Inc. Systems, methods, and framework for associating supporting data in word processing
WO2019071253A1 (en) 2017-10-07 2019-04-11 Arp-Ip Llc SYSTEM AND METHOD FOR RANDOMIZING HIDDEN MESSAGES IN DIGITAL FILES
US11036923B2 (en) 2017-10-10 2021-06-15 P3 Data Systems, Inc. Structured document creation and processing, dynamic data storage and reporting system
CA3079231A1 (en) * 2019-04-16 2020-10-16 Suresh Joshi Quick data structuring computing system and related methods
US20210049239A1 (en) 2019-08-16 2021-02-18 Microsoft Technology Licensing, Llc Multi-layer document structural info extraction framework
US11539709B2 (en) * 2019-12-23 2022-12-27 Citrix Systems, Inc. Restricted access to sensitive content
US11423042B2 (en) * 2020-02-07 2022-08-23 International Business Machines Corporation Extracting information from unstructured documents using natural language processing and conversion of unstructured documents into structured documents

Also Published As

Publication number Publication date
US20230401325A1 (en) 2023-12-14
EP3929799A1 (en) 2021-12-29
BR112022001256A2 (pt) 2022-03-15
MX2022002517A (es) 2022-03-25
CA3149615A1 (en) 2021-11-11
WO2021225687A1 (en) 2021-11-11
US20210350064A1 (en) 2021-11-11
AU2021267818A1 (en) 2022-02-24
AU2021267818B2 (en) 2024-02-15
US11281783B2 (en) 2022-03-22
BR122022003479A2 (pt) 2022-03-29
CA3215912A1 (en) 2021-11-11
US20240012913A1 (en) 2024-01-11
BR122022003477A2 (pt) 2022-03-29
AU2024201934A1 (en) 2024-04-11
EP3929798A1 (en) 2021-12-29
AU2024201936A1 (en) 2024-04-11
AU2024201935A1 (en) 2024-04-11
CA3215881A1 (en) 2021-11-11
BR122022003476A2 (pt) 2022-03-29
US20230401324A1 (en) 2023-12-14
EP3924863A1 (en) 2021-12-22
CA3215896A1 (en) 2021-11-11
CA3149615C (en) 2023-11-28
US20240086552A1 (en) 2024-03-14
EP3929797A1 (en) 2021-12-29

Similar Documents

Publication Publication Date Title
US11537727B2 (en) Systems and methods for creating enhanced documents for perfect automated parsing
AU2021267818B2 (en) Systems and methods for creating enhanced documents for perfect automated parsing
US20200252210A1 (en) Systems and methods for encryption and authentication
US9754120B2 (en) Document redaction with data retention
EP3130166B1 (en) Method for verifying authorized signer for mobile device based document escrow service
US8355923B2 (en) Systems and methods for de-identification of personal data
US20060005017A1 (en) Method and apparatus for recognition and real time encryption of sensitive terms in documents
US20100031140A1 (en) Verifying An Electronic Document
US10855868B1 (en) Systems, processes, and computer program products for detecting and verifying invisible information in documents
US20170010841A1 (en) Document output processing
US11157639B2 (en) Systems, processes, and computer program products for authentication of documents based on invisible information in documents
NZ785670A (en) Systems and Methods for Creating Enhanced Documents for Perfect Automated Parsing
NZ785673A (en) Systems and Methods for Creating Enhanced Documents for Perfect Automated Parsing
NZ785674A (en) Systems and Methods for Creating Enhanced Documents for Perfect Automated Parsing
WO2020077061A1 (en) Methods for securely managing a paper document
WO2020077043A1 (en) Method for securing a digital document
US10956590B2 (en) Methods for securely managing a paper document
CA2571092A1 (en) Document output processing using content data and form data