TWI409648B - 技術文獻擷取系統與方法及專利文獻擷取系統 - Google Patents
技術文獻擷取系統與方法及專利文獻擷取系統 Download PDFInfo
- Publication number
- TWI409648B TWI409648B TW98107461A TW98107461A TWI409648B TW I409648 B TWI409648 B TW I409648B TW 98107461 A TW98107461 A TW 98107461A TW 98107461 A TW98107461 A TW 98107461A TW I409648 B TWI409648 B TW I409648B
- Authority
- TW
- Taiwan
- Prior art keywords
- technical
- technical literature
- retrieval system
- patent document
- reading
- Prior art date
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本發明係關於一種技術文獻擷取及專利分析系統與方法。
美國專利號6,058.417揭露一種線上貿易環境裡,資訊呈現與管裡之方法與裝置(method and apparatus for information presentation and management in an trading environment),其中根據使用者提供的資訊,包括販賣項目的描述以及與此項目相關之影像可以擷取的位置,影像可以從多個網站來獲得。然後,對應此獲得的影像,建立一些略圖影像,並將其聚集後,放在一網頁上,以呈現在遠端的網站。類似地,當一使用者提出詢問時,滿足此使用者詢問的項目,其對應的略圖影像就會顯示出來,這些已建立之略圖影像的每一略圖影像係以一個由使用者指定的影像為基礎。
此專利文獻揭露了在線上貿易環境裡,一種備有已安排好之略圖影像的界面。此專利文獻沒有揭露針對技術文獻分析或閱讀管理界面,及其所對應的技術和內容。所以此專利文獻無法對技術文獻裡之圖示與內容的安排或影像的擷取技術提供足夠的指引。
美國專利號5,963.966揭露一種技術文獻之自動擷取技術,以供電子檢視和散佈(electronic review and distribution)。此擷取技術是利用光學字元辨識(optical character recognition,OCR),將技術文獻切分成圖檔(drawing file)和文字檔(text file),並歸檔至適當位置以便儲存或顯示。然而,使用此OCR技術是將整件技術文獻從頭到尾掃瞄,因此會耗費大量的系統資源,也會導致低的產出效率。
研發團隊在技術的發展初期,經常需要花費大量的人力與時間來檢索與閱讀資料。例如,台灣專利公開號200417882揭露之專利分析資料的生成方法中,利用外部資料庫的檢索,擷取數個專利或是分類號,並且藉由專利、分類號,以特徵表等資料,做專利的分析與其間的聯結關係。
第一圖所示之台灣專利號567432之專利資訊挖掘及分析系統及方法(System and Method for Mining and Statistical Analyzing Patent Information)中,用戶透過客戶端電腦之用戶界面,選擇分析類型及設置分析條件。此分析條件藉由應用軟體伺服器轉換成指定格式的查詢條件。根據此查詢條件搜索資料庫以獲取查詢結果,再將查詢結果透過應用軟體伺服器傳回至客戶端電腦,並顯示分析結果。
用於專利文獻資料的分析中,通常如第二圖的範例所示,係利用列表清單的條列式模式將技術資料的相關資訊以文字方式條列呈現,包含有例如文件標題、文件編號、申請日、公開日、發表日、公告日、作者(發明人)、所有權人等。閱讀者欲進一步獲得相關訊息須再進入該主題,透過讀取摘要或甚至須開啟附件閱讀內文和圖式的方式才能了解資訊內容是否與閱讀者所關心的主題相關,往往在做大量資料處理時,產生時間上的耗費,造成人員於大量進行技術(專利)文獻分析工作上的瓶頸。
因此,如何有效地整合多個技術資料庫的文件,快速且有效地分析技術資料的內容與趨勢,是目前最大的課題之一。
上述技術中,沒有揭露外部資料庫資料的關聯性運用,只揭露抓取外部資料庫資料回本地資料庫或伺服器來分析。也沒有提供閱讀者能快速獲得相關訊息的畫面,或是提供閱讀者所需的互動式報告評論平台,來分享前人閱讀技術資料的心得,進而增進閱讀技術資料的效率。
依本發明所揭露的實施範例中可提供一種針對技術文獻的管理系統與方法,可進行資訊分類、擷取、閱讀、評論、分享與意見交換。此實施範例將一組技術文獻的資料透過前處理,將一組技術文獻資料中的關聯圖式選取出,並與擷取的重要資訊整合於一畫面,提供給閱讀者以圖形化的畫面來閱讀技術文獻的資料,而減少重覆操作浪費資源(resource-consuming)的圖形化的格式檔案(如PDF或TIFF),並可進行技術分類、管理、匯出/匯入等處理。閱讀者可進一步透過資訊分享平台,將技術資料閱讀後的心得評論記載於此資訊分享平台。
在一實施範例中,所揭露者是關於一種技術文獻擷取系統。此擷取系統包含此擷取系統包含一驗證篩選單元、一擷取選定模組、以及一資料擷取模組。驗證篩選單元將一技術文獻資料的關聯性作為判斷依據,來設定此技術文獻資料之擷取參數。擷取選定模組透過此驗證篩選單元設定的擷取參數,選取此技術文獻資料中的關聯性資訊。資料擷取模組將選定的重要資訊擷取出,並與擷取選定模組選取的關聯性資訊一同提供在一畫面上,來提供給閱讀者閱讀。
在另一實施範例中,所揭露者是關於一種技術文獻之閱讀系統。此閱讀系統至少包含一圖形化的畫面、一分類模組、一管理模組、以及一匯出/匯入模組。透過圖形化的畫面,分類模組提供閱讀者將一組圖形化的技術文獻資料,作技術分類或產品分類,並建置於一系統中。管理模組提供閱讀者於完成技術資料的判斷後,依技術資料的屬性來歸檔於此系統中,或是從此系統中刪除所選定的技術資料。匯出/匯入模組提供閱讀者將所選定的資料匯出/匯入於此系統中。
此閱讀系統除了進行分類、歸檔、刪除、匯出/匯入等處理外,可以再提供一超連結模組,來連結此系統中的資料庫,以取得此資料庫中相對應的文獻資料。
在另一實施範例中,所揭露者是關於一種技術文獻之評論系統。此評論系統至少包含一評論主題單元、一閱讀評論單元,以及一附加單元。評論主題單元提供閱讀者輸入評論主題,並且顯示不同的評論主題。閱讀評論單元提供閱讀者記載技術文獻閱讀後的評論,與顯示不同閱讀者的評論,附加單元附加或產生閱讀者在分析閱讀過程中所收集或產生的其他資料。
在另一實施範例中,所揭露者是關於一種技術文獻擷取方法。此擷取方法包含:將一技術文獻資料的關聯性作為判斷依據,來設定此組技術文獻資料之擷取參數;透過設定的擷取參數,選取此技術文獻資料中的關聯性資訊;以及擷取出選定的重要資訊,並與所選取的關聯性資訊,以適當的排列方式,一同提供在一畫面上,方便使用者以相較於前案較佳之視覺效果閱讀技術文獻,提升技術文獻分析的效率。
在另一實施範例中,所揭露者是關於一種技術文獻之閱讀方法。此閱讀方法包含:擷取一組技術文獻資料的重要資訊與關聯性資訊,並提供在一畫面上,來提供給閱讀者閱讀;以及透過此畫面,進行此組技術文獻資料的分類、歸檔、刪除、匯出/匯入,之前述功能的其中任一組合。
在另一實施範例中,所揭露者是關於一種技術文獻之閱讀暨評論方法。此閱讀暨評論方法包含:前述實施範例之閱讀方法中再包括提供一資訊分享平台的步驟,此資訊分享平台讓閱讀者記載技術文獻閱讀後的評論,以及附加其在分析閱讀過程中所收集或產生的其他資料,或是顯示不同閔讀者的評論。
上述實施範例中,技術文獻之擷取系統與閱讀系統可整合成一種技術文獻之擷取與閱讀系統。技術文獻之閱讀系統與評論系統也可整合而成一種技術文獻之閱讀暨評論系統,或是整合擷取系統、閱讀系統以及評論系統而戌為一種技術文獻之擷取與閱讀暨評論的系統。
茲配合下列圖示、實施範例之詳細說明及申請專利範圍,將上述及本發明之其他目的與優點詳述於後。
本揭露之實施範例可運用多個來源資料庫,例如技術文獻等資料庫,將一組原始技術文獻資料經由系統分析後,重新組成具有關聯性對應的資料群組,來建立內部資料庫。此組技術文獻,例如專利文獻或論文等相關文獻,之關聯性資訊被擷取出後,可以提供給閱讀者以圖形化的畫面來閱讀此組技術文獻的資料,並可以讓閱讀者進行分類、歸檔、刪除、匯出/匯入等處理。也可以讓閱讀者記載技術文獻閱讀後的心得評論,或顯示不同閱讀者的評論。還可以附加或產生在分析閱讀過程中所收集或產生的其他資料。依此,客戶端的使用者可以快速且有效地分析技術資料的內容與趨勢。
第三A圖是一種技術文獻擷取系統的一個範例示意圖,與本發明所揭露的某些實施範例一致。如第三A圖所示,一技術文獻資料310,例如專利文獻或論文,透过此擷取系統300可擷取出此技術文獻之關聯性資訊320,此擷取出的關聯性資訊320可包括圖像(Image)或文(Text)。並可提供圖形化的畫面,通常以規則化排列方式給閱讀者閱讀此關聯性資訊。關聯性資訊係透過至少一內部資料庫或技術文件進行關聯性運算與分析而產生的結果。
關聯性係指技術文件或是內部資料庫中資料(包含文字與圖示)間的相對關係,例如申請號與申請日的相對關係,期刊標題與發明人的相對關係等。
關聯性運算係指技術文件或是內部資料庫中資料之間的各式運算、比對或篩選等,例如布林邏輯、權重加成等。以專利文件為例,資料高相關性運算的篩選,可以選取相同專利之專利號、申請日期、發明人、所有權人等資訊。若是低資料相關性運算的篩選,則可以選取依專利號之發明人等資訊,也可以選取其他專利號之發明人等資訊。
在第三A圖之擷取系統300的範例中,此擷取系統300包含一驗證篩選單元301、以及一擷取選定模組302。驗證篩選單元301將一技術文獻資料310的關聯性作為判斷依據,來設定此技術文獻資料310之擷取參數。擷取選定模組302透過此驗證篩選單元301最後設定的擷取參數301a,來擷取出此技術文獻資料中的關聯性資訊320,例如是此技術文獻資料之關聯圖式。每一關聯圖式是一篇技術文獻之主要圖式,主要圖式意指首頁圖式或是代表技術特徵的圖式。
擷取系統300可再包括一資料擷取模組303,來選定重要資訊,例如是專利文獻的標題、所有權人、發明人、文獻編號、或是特定標示等,並與擷取選定模組302擷取出的關聯性資訊320,提供在一畫面330上給閱讀者閱讀,畫面330的範例示意圖如第三B圖之圖形化的畫面330a所示。
圖形化的畫面330a的範例示意圖是一技術文獻資料之8筆關聯性資訊和其相對應的重要資訊。如果此8筆關聯性資訊是8篇美國專利之首頁主圖,及/或其相對應的重要資訊,例如是其相對應的美國專利號與專利名稱。圖形化的畫面330a也可以將關聯性資訊和其相對應的重要資訊以規則化方式來排列,也可以採用連續型態靠網頁的方式來供閱讀者以捲軸瀏覽方式閱讀。或是採用非連續型態以換頁方式顯示,可依閱讀者的習慣來設定每頁一定數量的圖像。圖形化的畫面也可提供一超連結模組,例如標號350所示,來連結系統資料庫以取得進階的相關資料,例如專利文獻的全文(Full Text)。且當閱讀者以游標靠近其中之一的關聯性訊息,會主動彈出一視窗以顯示該關聯性訊息所對應之技術文獻的摘要、名稱、作者(發明人)、所有人(所有權人)、公開(公告)日、或是上述之任意組合。
任意區塊的相關(包含關聯性)資訊及/或相對應的重要資訊可以定義為一個文件單位(document unit)。文件單位內的相關資訊可以是一篇專利之首頁裡的主要圖式(main figure)或是特徵圖式(characteristic figure),而相對應的重要資訊可以是名稱、文件(專利)號碼、作者(發明人)、所有人(所有權人)、申請序號、申請日/公開日/公告日、摘要、或是上述之任意組合。多個文件單位被排列成m×n之影像表法,其中m與n皆為大於1的整數。m的較佳範圍是3至7,而n的較佳範圍是3至1000。使視覺感受更好的n較佳值是介於8與30之間。
例如,對於顯示100篇專利文獻的一網頁,則此網頁的版面設計(layout)可以是4×25的文件單位、5×20的文件單位、或是其他任意的規則排列。如果專利文獻的數目不能安排成m×n,例如97,則5×20的排列會留下3個空位(vacancy)。然而,此排列仍在m×n格式的範疇中。相對應的重要資訊可以置於靠近相關資訊的地方,例如在相關(關聯性)資訊的上方、下方、右方或左方。另一種設計是當游標停留在文件單元或其相關(包含關聯性)資訊的位置時,會出現一視窗,將一部份的相對應的重要資訊顯示在此視窗中。例如,在第3B圖中,顯示出的相對應的重要資訊含有名稱、公告號和公告日。當游標停留在相關資訊的位置時,砰出的視窗中顯示出名稱、摘要、優先權日/申請日/公開日/公告日、專利家族、作者(發明人)、所有權人、或是上述之任意組合。
值得一提的是,也可以在文件單位上執行放大(zoom in)/縮小(zoom out)的操作。有三種方式來實現推近/拉遠的操作。第一種方式是,當游標停留在文件單位時,可以顯示此文件單位的較大影像。第二種方式是,系統根據m及/或n的值,來決定此文件單位之的影像的顯示比率(display ratio)。第三種方式是,使用一種變焦模組(zoom module),讓使用者自行調整文件單位之的影像的顯示大小(display size),請參第五圖的細節說明。
技術文獻資料310若以專利文獻為例,則擷取系統300可以採用如專利的時間、申請狀態、資格或專利內容等,作為判斷依據,來進行專利資訊擷取與分析。依此,驗證篩選單元301可以是一種判斷邏輯,將此組專利文獻之資格、申請狀態、時間、專利內容等作為判斷依據,來進行此專利文獻之擷取參數的設定。再則,驗證篩選單元301,如第四A圖所示,可以再包括一時間選定模組410、一資格選定模組420、一申請狀態選定模組430,或前述模組的其中任一組合。第四A圖進一步說明驗證篩選單元301內包含這些選定模組的一個範例示意圖,與本發明所揭露的某些實施範例一致。
當技術文獻資料310以專利文獻為範例時,第四A圖之驗證篩選單元301的範例中,時間選定模組410可以根據專利文獻中與時間日期有關的部份,例如申請日、公開日、公告日、優先權日等日期,作為判斷的依據,依照不同時期來進行一組專利文獻之擷取參數的設定。設定出的擷取參數例如是技術文獻資料310的擷取起始點、擷取範圍、以及相對位移(Related Offset)等。第四B圖以一技術文獻為例來說明這些擷取參數,與本發明所揭露的某些實施範例一致。
參考第四B圖,擷取起始點與擷取範圍可以是機定值(Default Value),例如可以設定為一技術文獻之原始影像的兩邊界交點,如標號424,或是此技術文獻之幾何中心為擷取起始點或座標軸原點(0,0)。擷取範圍例如可以預定為長度為X而寬度為Y所形成的矩形421,;或是長軸為A而短軸為B的任何一種幾何圖形所形成之區域422。
參考第四B圖,此技術文獻例如是一篇專利文獻,若以此專利文獻之申請日作為判斷依據的範例,取專利文獻之原始影像的兩邊界交點為原點,擷取範圍的預定值例如是300×400(像素)之矩形。當申請日是2006年時,例如可以設定其擷取的起始點為距離座標軸原點420相對位移Δd(+10mil),且其擷取範圍例如是X-軸向的△X為+10像素而Y-軸向的△Y為+20像素,也就是說擷取範圍調整為長度是X+△X而寬度為Y+△Y所形成的矩形423。若僅以某申請日為判斷依據,則擷取起始點例如是距離專利文獻之原始影像的兩邊界交點+5mil處,且其擷取範圍為310×420像素之矩形。△X,△Y可以為正數或負數。1mil等於1/1000英吋(inch)
類似地,資格選定模組420可以是一種專利文獻之資格驗證模組,可以根據專利文獻中與人員、屬地、分類或是資格有關的部份,例如發明人(Inventor)、所有權人(Assignee)、代理人(Agent)、國際分類(IPC)、美國分類(USC)、歐洲分類(ELCA)、日本分類(FI/F-Term)、國際工業設計分類(Locarno Classification)等技術/領域分類或是審查委員(Examiner)等或其數量,作為判斷的依據,來進行專利文獻之擷取參數的設定。此設定出的擷取參數如前述之擷取起始點、擷取範圍、以及相對位移。以所有權人作為判斷依據為例,例如所有權人為工研院,則其設定擷取的相對位移△d可以是座標軸原點+20mil,且其擷取範圍之△X例如是+50像素,而△Y例如是+60像素。△X,△Y可以為正數或負數。
類似地,申請狀態選定模組430則可以根據專利文獻的申請狀態(例如公開、核准通知、分割案數、或延續案數等)或參考前案提呈(Information Disclosure Statement,IDS)或家族(Family)數目或摘要字數或申請國別作為判斷依據,來進行專利文獻之擷取參數的設定/調整。
時間選定模組410、資格選定模組420、申請狀態選定模組430,或是前述模組的其中任一種組合的擷取參數設定之後,也可以對每一選定模組的擷取參數運用不同的比例權重再調整或是搭配擷取區域之布林邏輯關係(例如交集(AND)、聯集(OR)等),來進行專利文獻之最後擷取參數的設定。以前述之申請日為2006年,所有權人為工研院為例,其擷取之相對位移△d的總和等於申請日是2006年時擷取之相對位移乘以申請日權重W1,與所有權人是工研院時擷取之相對位移乘以所有權人權重W2,此兩者的總和,其中W1+W2=100%。當W1=W2=50%時,則相對位移△d的總和等於15mil。
同理,可得申請日為2006年之擷取範圍的權重W3與所有權人為工研院之擷取範圍的權重W4。當W3=40%、W4=60%時,其擷取範圍之△X的總和等於34,而△Y的總和等於28。因此,若2006年工研院申請之專利文獻,則擷取起始點為距離專利文獻之原始影像的兩邊界交點+15mil處,且其擷取範圍為334×328像素之矩形。依此,可以得知專利文獻的擷取起始點與擷取範圍的大小。
除了前述之擷取方法之外,由使用者自行指定或由系統直接設定特定頁碼或特定狀況之下的圖示(以美國專利文獻為例,如前圖標示為PRIOR ART時,則未被標示PRIOR ART的第一張圖),做為關聯性資訊的來源,亦為各種可行的方式。
根據本發明,閱讀者閱讀圖形化的畫面或是透過如超連結模組350後,可再進行資料的分類、歸檔、刪除、匯出/匯入等處理。第五圖是技術文獻之閱讀系統的一個範例示意圖,與本發明所揭露的某些實施範例一致。
參考第五圖的實施範例,此技術文獻之閱讀系統500可包含一個備有m×n個文件單位(document unit)之圖形化的畫面520,m與n為正整數。通常,m與n皆大於1技術文獻之閱讀系統500也可再包括分類模組501、管理模組502、匯出/匯入模組503、變焦模組504,之前述模組之其中任一組合。圖形化的畫面520可透過擷取系統300擷取出來。透過圖形化的畫面520,分類模組501提供閱讀者,將一組圖形化的技術文獻資料作技術分類或是產品分類,並建置於一系統中。管理模組502提供閱讀者於完成技術資料的判斷後,依技術資料的屬性來歸檔於此系統中,或是從此系統中刪除所選定的技術資料。匯出/匯入模組503將所選定的資料匯出/匯入。變焦模組504將文件單位放大或縮小,如此,可以將文件單位之不同大小的影像顯示出來。此閱讀系統500中,實現各模組有多種方式。
在閱讀系統500中,閱讀者可依技術資料的屬性歸類於細部的分類項次中,來完成技術資料的分類。第六圖說明透過分類模組501,將技術資料分類的一個範例示意圖,與本發明所揭露的某些實施範例一致。第六圖中的範例中,是將技術資料分為A、B、C三類,可視需要再進行更細部的分類,例如A類再細分為A-1、A-2、A-3三類,C類再細分為C-1、C-2兩類。
閱讀者完成技術資料的判斷後,透過管理模組502,也可以依技術資料的特徵(feature)將資料歸檔於系統中的子資料庫中,第七圖說明技術資料被歸檔於系統中的兩個子資料庫A與B,與本發明所揭露的某些實施範例一致。
根據本發明,閱讀者可以記載技術文獻閱讀後的心得評論,或是顯示不同閱讀者的評論。依此,本揭露之另一實施範例提供一種技術文獻之評論系統。此評論系統是一種閱讀報告之資訊分享平台。可以提供閱讀者記載技術文獻閱讀後的心得評論,也可以顯示不同閱讀者的評論,還可以附加或產生在分析閱讀過程中所收集或產生的其他資料,例如專利文獻的審批歷史(File Wrapper)、新聞事件、交易資訊、訴訟(lawsuit)資訊等。
依此,如第八圖所示,本揭露的實施範例中,此評論系統800至少包含一評論主題單元801、一閱讀評論單元802、一附加單元803,且/或一律師稽查單元(attomey audit unit)804。透過評論主題單元801,可讓閱讀者輸入評論主題,並且也可顯示不同的評論主題於評論主題單元801上。透過閱讀評論單元802,閱讀者可記載技術文獻閱讀後的評論,並且也可以顯示不同閱讀者的評論於閱讀評論單元802上。透過附加單元803,可附加閱讀者在分析閱讀過程中所收集或產生的其他資料。律師稽查單元804提供給律師一個界面來執行評論工作,例如在評論主題單元801或閱讀評論單元802上評論,如此,可將分析表或資料用於尋求法律意見或採取法律行動時。此界面可設計成被授權者或律師以特定帳號進入此界面來檢查資料或評論,以及執行確認、溝通或是互動,特別在訴訟時,可在律師-當事人特權(Attorney-Client Privilege)的保護之下,保護相關的內容,使當事人的法律權益獲得完整的保障。
此評論系統中,實現各單元有多種方式。例如,第九圖的範例,於閱讀評論單元802上,評論系統800可對一主題A自動產生日期、閱讀者的姓名或代號。於閱讀評論單元802上,閱讀者可在一評論編輯區902a記載技術文獻閱讀後的評論心得,例如閱讀文獻的摘要、閱讀文獻的評論內容等。不同閱讀者的評論也可以顯示在閱讀評論單元802上,例如主題A列表中,有三份閱讀者的評論,每一份閱讀者的評論可包括如評論的基本資訊與評論內容,可採用如部落格的型態來顯示。於評論主題單元801上,閱讀者可輸入主題,並且列表不同的輸入主題A、B、C等。在分析閱讀過程中,閱讀者收集或產生的其他資料也可以採用附加檔案或超連結的方式,當成附件產生於附加單元803上,附件列表中,附件1例如是專利文獻的審批歷史、附件2例如是新聞事件、或交易資訊等。
根據本發明,上述之技術文獻擷取系統300與閱讀系統500也可整合成一種技術文獻之擷取與閱讀系統1000,如第十圖所示。類似地,上述之技術文獻之閱讀系統500與評論系統800也可整合成一種技術文獻之閱讀暨評論系統1100,如第十一圖所示。在某一特殊實施範例中,閱讀暨評論系統1100可包括兩個評論系統800,其中一個評論系統800是提供給所有的系統使用者來分享所有的資訊,而另一個評論系統800是有授權控制的,並且僅提供給特定的系統使用者來分享資訊。擷取系統300、閱讀系統500以及評論系統800也可以整合成一種技術文獻之擷取與閱讀暨評論的系統1200,如第十二圖所示。各系統可依實際需求與應用來整合。
承第三A圖及上述之描述,本發明也揭露了一種技術文獻之擷取方法,如第十三圖之範例流程。參考第十三圖,首先,將一技術文獻資料的關聯性作為判斷依據,來設定此技術文獻資料之擷取參數,如步驟1310所示。之後,透過設定的擷取參數,選取此技術文獻資料中的關聯性資訊,如步驟1320所示。再擷取出選定的重要資訊,並與所選取的關聯性資訊一同提供在一畫面上,如步驟1330所示。
如前述所提及,設定出的擷取參數至少包括此組技術文獻資料擷取起始點、擷取範圍、以及相對位移。此畫面也可提供超連結功能,來連結系統資料庫以取得進階的相關資料,或是此技術文獻(或專利)的全部文件或全文字資料。
承第五A圖及上述之描述,本發明也揭露了一種技術文獻之閱讀方法,如第十四圖之範例流程。參考第十四圖,首先,擷取一組技術文獻資料的重要資訊與關聯性資訊,並提供在一畫面上,來提供給閱讀者閱讀,如步驟1410所示。然後,透過此畫面,可進行該組技術文獻資料的分類、歸檔、刪除、匯出/匯入,或前述功能的其中任一組合,如步驟1420所示。
繼第十四圖之步驟1420之後,本發明可再包括提供一資訊分享平台的步驟,此資訊分享平台可讓閱讀者記載技術文獻閱讀後的評論以及附加其在分析閱讀過程中所收集或產生的其他貲料,或是顯示不同閱讀者的評論,如第十五圖之範例流程中步驟1510,依此,本發明也揭露了一種技術文獻之閱讀暨評論方法。
所以,本發明提供了一個技術文獻之系統平台,組成技術資料文件網,有效累積與分享團隊知識能量,快速完戌技術文獻資料的檢索與分析。並且,由於本發明將專利文件轉譯成不同的狀態,因此本發明可大幅降低因重復或多個使用者同時企圖打開圖形化格式檔所引起之系統的負荷。
另外,本發明亦可應用至新式樣專利(design patent)的分析。例如,從一群多篇專利文獻裡,顯示其主要特徵圖(main figure),本發明可以讓使用者在初始檢索階段時,加速專利地圖(patent map)製作前的相關與否之初步篩選,如此可降低使用者對浪費資源之圖形化格式檔案的需求,進而改善系統資源的利用。
本發明所揭露之實施範例可實現於一個具有程式碼裝置的電腦程式產品(computer program product),此程式碼裝置係用來執行上述產生專利文件的方法。此程式碼可執行於一電腦系統中。此程式碼可存於一儲存裝置,例如一記憶體裝置,並且此電腦系統透過此儲存裝置可以存取此程式碼。
惟,以上所述者僅為本發明之實施範例,當不能依此限定本發明欲主張之範圍。即大凡根據本發明申請專利範圍所作之細微變化與修改,皆應仍屬本發明專利涵蓋之均等範圍。
300...擷取系統
301...驗證篩選單元
301a...設定的擷取參數
302...擷取選定模組
303...資料擷取模組
310...技術文獻資料
320...關聯圖式
330...畫面
330a...圖形化的畫面
350...超連結模組
3201、3202、3203...相對位置
410...時間選定模組
420...資格選定模組
430...申請狀態選定模組
500...閱講系統
501...分類模組
502...管理模組
503...匯出/匯入模組
504...變焦模組
520...圖形化的畫面
800...評論系統
801...評論主題單元
802...閱讀評論單元
803...附加單元
804...律師稽查單元
901a...不同的輸入主題
902a...日期
902b...閱讀者的姓名或代號
902c...閱讀文獻的摘要
902d...閱讀文獻的評論內容
950...部落格的型態顯示
1000...技術文獻之擷取與閱讀系統
1100...技術文獻之閱讀暨評論系統
1200...技術文獻之擷取與閱讀暨評論的系統
1310...將一技術文獻資料的關聯性作為判斷依據,來設定此技術文獻資料之擷取參數
1320...透過設定的擷取參數,選取此技術文獻資料中的關聯性資訊
1330...擷取出選定的重要資訊,並與所選取的關聯性資訊一同提供在一畫面上
1410...擷取一組技術文獻資料的重要資訊與關聯性資訊,並提供在一畫面上,來提供給閱讀者閱讀
1420...透過此畫面,進行該組技術文獻資料的分類,歸檔,刪除、匯出/匯入,之前述功能的其中任一組合
1510...提供一資訊分享平台,讓閱讀者記載技術文獻閱讀後的評論以及附加其在分析閱讀過程中所收集或產生的其他資料,或是顯示不同閱讀者的評論
第一圖是一範例流程圖,說明一種專利分析資料的生成方法的運作。
第二圖是一範例流程圖,說明一種專利資訊挖掘及分析系統及方法的運作。
第三A圖是一種技術文獻擷取系統的一個範例示意圖,與本發明所揭露的某些實施範例一致。
第三B圖是圖形化的畫面的一個範例示意圖,與本發明所揭露的某些實施範例一致。
第四A圖進一步說明驗證篩選單內包含的選定模組的一個範例示意圖,與本發明所揭露的某些實施範例一致。
第四B圖以專利文獻為例來說明擷取參數,與本發明所揭露的某些實施範例一致。
第五圖是技術文獻之閱讀系統的一個範例示意圖,與本發明所揭露的某些實施範例一致。
第六圖說明說明透過分類模組,將技術資料分類的一個範例示意圖,與本發明所揭露的某些實施範例一致。
第七圖說明透過管理模組,將技術資料歸檔於系統中的兩個子資料庫的一個範例示意圖,與本發明所揭露的某些實施範例一致。
第八圖是技術文獻之評論系統的一個範例架構圖,與本發明所揭露的某些實施範例一致。
第九圖是評論系統之各單元實現的一範例示意圖,與本發明所揭露的某些實施範例一致。
第十圖是技術文獻之擷取與閱讀系統的一個範例示意圖,與本發明所揭露的某些實施範例一致。
第十一圖是技術文獻之閱讀暨評論系統的一個範例示意圖,與本發明所揭露的某些實施範例一致。
第十二圖是技術文獻之擷取與閱讀暨評論的系統的一個範例示意圖,與本發明所揭露的某些實施範例一致。
第十三圖是技術文獻之擷取方法的一個範例流程圖,與本發明所揭露的某些實施範例一致。
第十四圖是技術文獻之閱讀方法的一個範例流程圖,與本發明所揭露的某些實施範例一致。
第十五圖是技術文獻之閱讀暨評論方法的一個範例流程圖,與本發明所揭露的某些實施範例一致。
300...擷取系統
301...驗證篩選單元
301a...設定的擷取參數
302...擷取選定模組
303...資料擷取模組
310...技術文獻資料
Claims (47)
- 一種技術文獻擷取系統,該擷取系統至少包含:一驗證篩選單元,將一技術文獻資料的關聯性作為判斷依據,來設定該技術文獻資料之擷取參數;以及一擷取選定模組,透過該驗證篩選單元設定的擷取參數,選取該技術文獻資料中的關聯性資訊;其中該關聯性係指該技術文獻資料或是至少一內部資料庫間的相對應關係,並且該至少一內部資料庫係將一組原始技術文獻資料經由系統分析後,重新組成具有關聯性對應的資料群組而建立的。
- 如申請專利範圍第1項所述之技術文獻擷取系統,其中該設定出的擷取參數至少包括該技術文獻資料擷取起始點、擷取範圍、以及相對位移。
- 如申請專利範圍第1或2項所述之擷取技術文獻之系統,其中該驗證篩選單元係選自時間選定模組、資格選定模組、申請狀態選定模組,之前述三模組的其中任一組合,並且前述三模組之每一模組分別進行該技術文獻資料之擷取參數的設定。
- 如申請專利範圍第1項所述之技術文獻擷取系統,該擷取系統更包括一資料擷取模組,擷取出選定的重要資訊,並與該擷取選定模組選取的關聯性資訊一同提供在一畫面上。
- 如申請專利範圍第1、2、或4項所述之技術文獻擷取系統,其中該技術文獻資料為專利文件。
- 如申請專利範圍第3項所述之技術文獻擷取系統,其中 該技術文獻資料為專利文件。
- 如申請專利範圍第1或4項所述之技術文獻擷取系統,其中該關聯性資訊為該技術文獻資料之關聯圖式,每一關聯圖式是一技術文獻資料之主要圖式。
- 如申請專利範圍第3項所述之技術文獻擷取系統,其中該時間選定模組依照不同時期來進行該組技術文獻資料之擷取參數的設定。
- 如申請專利範圍第3項所述之技術文獻擷取系統,其中該資格選定模組根據該技術文獻資料中與人員、屬地、分類或是資格有關的部份,作為判斷的依據,來進行該技術文獻資料之擷取參數的設定。
- 如申請專利範圍第3項所述之技術文獻擷取系統,其中該申請狀態選定模組根據該技術文獻資料之目前的申請狀態或參考前案提呈或家族數目作為判斷依據,進行該技術文獻資料之擷取參數的設定。
- 如申請專利範圍第4項所述之技術文獻擷取系統,其中該重要資訊係選自該技術文獻資料之標題、所有權人、發明人、文獻編號、申請序號、申請日、公開日、公告日及摘要,或前述資訊的其中任一組合。
- 如申請專利範圍第3項所述之技術文獻擷取系統,該擷取系統對該時間選定模組、該資格選定模組、該申請狀態選定模組中的每一選定模組的擷取參數運用不同的比例權重再調整或是搭配擷取區域之布林邏輯關係,來進行該組技術文獻資料之最後擷取參數的設定。
- 如申請專利範圍第4項所述之技術文獻擷取系統,其 中該畫面係一種規則化排列之圖形化的畫面,並且包括有m×n個之文件單位之影像表法,而m與n皆為正整數。
- 如申請專利範圍第13項所述之技術文獻擷取系統,其中該m與n皆為大於1的整數。
- 如申請專利範圍第4、11、13或14項所述之技術文獻擷取系統,該系統還包括一變焦模組,將顯示在該畫面裡的影像放大或縮小,並且當游標停留在相關資訊的位置時,變焦模組會出現一視窗來顯示對應該相關資訊之該技術文獻的重要資訊。
- 一種專利文獻擷取系統,該專利文獻擷取系統包含:一驗證篩選單元,利用專利文獻資料的關聯性,至少包括該專利文獻資料的主要圖式,作為判斷依據,來設定該專利文獻之多個擷取參數;以及一擷取選定模組,根據該多個擷取參數,選取該專利文獻的該主要圖式;其中該關聯性係指該專利文獻資料或是至少一內部資料庫間的相對應關係,並且該至少一內部資料庫係將一組原始專利文獻資料經由系統分析後,重新組成具有關聯性對應的資料群組而建立的。
- 如申請專利範圍第16項所述之專利文獻擷取系統,還包括一閱讀系統,其中該閱讀系統至少包含一圖形化的畫面,提供閱讀者一組技術文獻資料的重要資訊及/或相關資訊,該圖形化的畫面包括多個文件單位,該多個文件單位係以規則化方式來排列。
- 如申請專利範圍第17項所述之專利文獻擷取系統,其中該多個文件單位被排列成m×n之影像表法,而m與n皆為大於1的整數。
- 如申請專利範圍第18項所述之專利文獻擷取系統,其中m的範圍是從3到7。
- 如申請專利範圍第18項所述之專利文獻擷取系統,其中n的範圍是從3到1000。
- 如申請專利範圍第18項所述之專利文獻擷取系統,其中n值介於8-30。
- 如申請專利範圍第19項所述之專利文獻擷取系統,其中n值介於8-30。
- 如申請專利範圍第17、18、19、20、21或22項所述之專利文獻擷取系統,其中當游標停留在該文件單位時,會出現一視窗來顯示對應該相關資訊之該技術文獻的重要資訊。
- 如申請專利範圍第17、18、19、20、21或22項所述之專利文獻擷取系統,其中該圖形化的畫面或至少一文件單位提供一超連結模組,來連結至少一系統資料庫以從中取得相對應的資料。
- 如申請專利範圍第17、18、19、20、21或22項所述之專利文獻擷取系統,其中該閱讀系統還包括一分類模組,提供閱讀者依該組技術文獻資料的屬性歸類於細部的分類項次中,來完成該組技術文獻資料的分類。
- 如申請專利範圍第17、18、19、20、21或22項所 述之專利文獻擷取系統,其中該閱讀系統還包括一分類模組,提供閱讀者透過該圖形化的畫面,將該組技術文獻資料作技術分類或是產品分類。
- 如申請專利範圍第17、18、19、20、21或22項所述之專利文獻擷取系統,其中該閱讀系統還包括一管理模組,提供閱讀者於完成技術資料的判斷後,依技術資料的屬性來歸檔,或是刪除所選定的技術資料。
- 如申請專利範圍第17、18、19、20、21或22項所述之專利文獻擷取系統,其中該閱讀系統還包括一匯出/匯入模組,將閱讀者所選定的資料匯出/匯入。
- 如申請專利範圍第17、18、19、20、21或22項所述之專利文獻擷取系統,其中該閱讀系統提供閱讀者閱讀該圖形化的畫面或是透過一超連結模組後,再進行該組技術文獻資料的分類、歸檔、刪除、匯出/匯入,之前述功能的其中任一組合。
- 如申請專利範圍第17、18、19、20、21或22項所述之專利文獻擷取系統,其中該閱讀系統整合一擷取系統,來產生該圖形化的畫面。
- 如申請專利範圍第17、18、19、20、21或22項所述之專利文獻擷取系統,其中該閱讀系統還包括一律師稽查單元,使該閱讀系統具有律師-當事人特權保護。
- 如申請專利範圍第17、18、19、20、21或22項所述之專利文獻擷取系統,還包括一技術文獻之評論系統,該技術文獻之評論系統至少包含:一評論主題單元,提供閱讀者輸入評論主題; 一閱讀評論單元,提供閱讀者記載技術文獻閱讀後的評論;以及一附加單元,提供閱讀者附加所收集或產生的其他資料。
- 如申請專利範圍第17、18、19、20、21或22項所述之專利文獻擷取系統,其中該閱讀系統自動產生日期、閱讀者的姓名或代號、閱讀文獻的摘要、閱讀文獻的評論內容,之前述的其中任一組合的資訊。
- 如申請專利範圍第17、18、19、20、21或22項所述之專利文獻擷取系統,其中該閱讀系統顯示不同評論的主題。
- 如申請專利範圍第17、18、19、20、21或22項所述之專利文獻擷取系統,其中該閱讀評論單元顯示不同閱讀者的評論。
- 如申請專利範圍第17、18、19、20、21或22項所述之專利文獻擷取系統,其中該閱讀系統還至少包含一附加單元,提供閱讀者附加所收集或產生的其他資料,該其他資料產生於該附加單元的方式係採用附加檔案、超連結,之前述的任一組合方式。
- 一種技術文獻擷取方法,該擷取方法至少包含:將一技術文獻資料的關聯性作為判斷依據,來設定該技術文獻資料之擷取參數;透過該設定的擷取參數,選取該技術文獻資料中的關聯性資訊;以及擷取出選定的重要資訊,並與該選取的關聯性資訊一 同提供在一畫面上;其中該關聯性係指該技術文獻資料或是至少一內部資料庫間的相對應關係,並且該至少一內部資料庫係將一組原始技術文獻資料經由系統分析後,重新組成具有關聯性對應的資料群組而建立的。
- 如申請專利範圍第37項所述之技術文獻擷取方法,其中該關聯性資訊係透過至少一內部資料庫或技術文件,進行關聯性運算與分析而產生的結果。
- 如申請專利範圍第37項所述之技術文獻擷取方法,其中該設定出的擷取參數至少包括該技術文獻資料擷取起始點、擷取範圍、以及相對位移。
- 如申請專利範圍第37、38或39項所述之技術文獻擷取方法,其中該畫面為連續型態,並利用網頁捲軸瀏覽。
- 如申請專利範圍第37、38或39項所述之技術文獻擷取方法,其中該畫面為非連續型態,並以選頁方式瀏覽。
- 如申請專利範圍第37、38或39項所述之技術文獻擷取方法,其中該畫面提供超連結功能,來連結系統資料庫以取得進階的相關資料。
- 如申請專利範圍第40項所述之技術文獻擷取方法,其中該畫面提供超連結功能,來連結系統資料庫以取得進階的相關資料。
- 如申請專利範圍第41項所述之技術文獻擷取方法,其中該畫面提供超連結功能,來連結系統資料庫以取得進階的相關資料。
- 一種電腦可讀取儲存媒體,儲存一或多個電腦程式碼,用來執行根據申請專利範圍第37、38或39項中所有的步驟。
- 一種電腦可讀取儲存媒體,儲存一或多個電腦程式碼,用來執行根據申請專利範圍第43項中所有的步驟。
- 一種電腦可讀取儲存媒體,儲存一或多個電腦程式碼,用來執行根據申請專利範圍第44項中所有的步驟。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW98107461A TWI409648B (zh) | 2008-03-10 | 2009-03-06 | 技術文獻擷取系統與方法及專利文獻擷取系統 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW97108350 | 2008-03-10 | ||
TW98107461A TWI409648B (zh) | 2008-03-10 | 2009-03-06 | 技術文獻擷取系統與方法及專利文獻擷取系統 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200947244A TW200947244A (en) | 2009-11-16 |
TWI409648B true TWI409648B (zh) | 2013-09-21 |
Family
ID=44870269
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW98107461A TWI409648B (zh) | 2008-03-10 | 2009-03-06 | 技術文獻擷取系統與方法及專利文獻擷取系統 |
TW102100966A TWI595369B (zh) | 2008-03-10 | 2009-03-06 | 技術文獻之閱讀系統與產生專利文獻之專利資訊的方法以及電腦可讀取儲存媒體 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102100966A TWI595369B (zh) | 2008-03-10 | 2009-03-06 | 技術文獻之閱讀系統與產生專利文獻之專利資訊的方法以及電腦可讀取儲存媒體 |
Country Status (1)
Country | Link |
---|---|
TW (2) | TWI409648B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI573030B (zh) * | 2015-10-01 | 2017-03-01 | Integral Search Tech Ltd | 專利技術面分析的編縮歸納方法 |
TWI647577B (zh) * | 2017-09-30 | 2019-01-11 | 雲拓科技有限公司 | 提供歸納結論之專利分析裝置 |
TWI698794B (zh) * | 2018-10-23 | 2020-07-11 | 雲拓科技有限公司 | 專利文件的圖形資料之導覽內容的自動化得出顯示設備 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW567432B (en) * | 2002-05-24 | 2003-12-21 | Hon Hai Prec Ind Co Ltd | System and method for mining and statistical analyzing patent information |
WO2004015617A1 (en) * | 2002-07-31 | 2004-02-19 | Crimsonlogic Pte Ltd | Watermarking |
US6947953B2 (en) * | 1999-11-05 | 2005-09-20 | The Board Of Trustees Of The Leland Stanford Junior University | Internet-linked system for directory protocol based data storage, retrieval and analysis |
TW200712944A (en) * | 2005-09-26 | 2007-04-01 | Learningtech Corp | Method and computer readable article of assisting users to draft patent specification |
US20070208669A1 (en) * | 1993-11-19 | 2007-09-06 | Rivette Kevin G | System, method, and computer program product for managing and analyzing intellectual property (IP) related transactions |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI220484B (en) * | 2002-10-18 | 2004-08-21 | Ind Tech Res Inst | Computer aided patent data analysis method and system thereof |
TWI296380B (en) * | 2005-07-29 | 2008-05-01 | Yen Chieh Mao | Method and apparatus for electronic document collection |
-
2009
- 2009-03-06 TW TW98107461A patent/TWI409648B/zh active
- 2009-03-06 TW TW102100966A patent/TWI595369B/zh active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070208669A1 (en) * | 1993-11-19 | 2007-09-06 | Rivette Kevin G | System, method, and computer program product for managing and analyzing intellectual property (IP) related transactions |
US6947953B2 (en) * | 1999-11-05 | 2005-09-20 | The Board Of Trustees Of The Leland Stanford Junior University | Internet-linked system for directory protocol based data storage, retrieval and analysis |
TW567432B (en) * | 2002-05-24 | 2003-12-21 | Hon Hai Prec Ind Co Ltd | System and method for mining and statistical analyzing patent information |
WO2004015617A1 (en) * | 2002-07-31 | 2004-02-19 | Crimsonlogic Pte Ltd | Watermarking |
TW200712944A (en) * | 2005-09-26 | 2007-04-01 | Learningtech Corp | Method and computer readable article of assisting users to draft patent specification |
Also Published As
Publication number | Publication date |
---|---|
TW201316192A (zh) | 2013-04-16 |
TW200947244A (en) | 2009-11-16 |
TWI595369B (zh) | 2017-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8373880B2 (en) | Technical documents capturing and patents analysis system and method | |
CN102834832B (zh) | 取证系统及取证方法 | |
CN102959578B (zh) | 取证系统、取证方法及取证程序 | |
JP3942290B2 (ja) | ドキュメント画像のクライアント・ワークステーションへの送信方法 | |
JP4335335B2 (ja) | ドキュメント画像のソート方法 | |
US20140019466A1 (en) | Document management system having automatic notifications | |
US20100011282A1 (en) | Annotation system and method | |
US9043413B2 (en) | System and method for extracting, collecting, enriching and ranking of email objects | |
JP2013225319A (ja) | 視覚的な多次元の検索 | |
KR20130018641A (ko) | 포렌식 시스템과 포렌식 방법 및 포렌식 프로그램 | |
US20160210355A1 (en) | Searching and classifying unstructured documents based on visual navigation | |
TW201519071A (zh) | 技術文獻擷取及專利分析系統與方法 | |
TWI457775B (zh) | 網址分類管理方法及使用該方法之電子裝置 | |
TWI409648B (zh) | 技術文獻擷取系統與方法及專利文獻擷取系統 | |
US20170091886A1 (en) | Methods, systems, and computer readable media for optimized case management | |
CN113407678A (zh) | 知识图谱构建方法、装置和设备 | |
KR101575802B1 (ko) | 특허문서의 작업로그 시스템 및 그 방법 | |
US10713270B2 (en) | Emerging issue detection and analysis | |
CN114935996B (zh) | 在线处理文档的方法、计算机设备、存储介质 | |
US20120290573A1 (en) | Information capturing methods and components | |
CN116958987A (zh) | 作品识别方法、装置、设备、存储介质及程序产品 | |
CN117251526A (zh) | 一种会议档案数字化管理系统、方法及电子设备 | |
Barrus et al. | Image-based document management: aggregating collections of handwritten forms | |
JP2011008714A (ja) | 文書管理装置、文書管理方法、プログラム及び記憶媒体 | |
JP2003044485A (ja) | 知識分析システムおよび同システムにおける最上位クラスタの最大個数設定方法 |