TWI459313B - High resolution information management classification method and system - Google Patents

High resolution information management classification method and system Download PDF

Info

Publication number
TWI459313B
TWI459313B TW097122478A TW97122478A TWI459313B TW I459313 B TWI459313 B TW I459313B TW 097122478 A TW097122478 A TW 097122478A TW 97122478 A TW97122478 A TW 97122478A TW I459313 B TWI459313 B TW I459313B
Authority
TW
Taiwan
Prior art keywords
classification
information
label
classified
database
Prior art date
Application number
TW097122478A
Other languages
English (en)
Other versions
TW201001310A (en
Inventor
Kuo Jen Chao
Ching Chang Lee
Original Assignee
Univ Nat Kaohsiung Applied Sci
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Nat Kaohsiung Applied Sci filed Critical Univ Nat Kaohsiung Applied Sci
Priority to TW097122478A priority Critical patent/TWI459313B/zh
Publication of TW201001310A publication Critical patent/TW201001310A/zh
Application granted granted Critical
Publication of TWI459313B publication Critical patent/TWI459313B/zh

Links

Description

高分辨性之資訊管理分類方法及系統
本發明係關於一種資訊管理方法,尤指一種以自動分類、與分類標籤建立關聯、執行編輯確認等多重分類管理步驟,令完成管理後之各筆資訊皆具有高辨識性的方法。
由於網路挾其高度普及率與便利性,有相當多樣化的資訊存在於網際網路世界上,而且資訊的新增與更新速度更是與日俱增,若無適當的輔助介面,要在龐大筆數的資訊中檢選出所要的資料,命中機率可說明微乎其微。因此,為能夠在廣泛資訊中找出個人所需部分,各式各樣的搜尋引擎便漸漸發展出來,一般大眾可利用個人電腦透過搜尋引擎,輸入適當的關鍵字以檢索出相關資訊。
現有的搜尋引擎自有其獨特的資訊管理運作模式,能根據使用者所輸入的字詞快速尋找出相關聯的文章,並根據與關鍵字詞之關聯程度而決定文章的排列次序,關聯程度越高者即顯示在前,反之關聯程度較低者將排列在後。舉例而言,當使用者輸入一串關鍵字之後,依據所制定的資訊管理運作模式例如該關鍵字存在時的完整度、關鍵字出現頻率等,將具有完全吻合的關鍵字且其出現頻率最高者,在搜尋完成的結果中排列為第一筆,如此依序類推,存在於越後方的顯示結果可能是僅具有片斷而不完整的關鍵字。
雖然目前搜尋引擎之資訊管理運作模式已經能篩選出 較為符合的資料,但在實際運用上有大多數的使用者認為顯示出來的結果仍與自己原先期待的資料有一段差距,例如應該是較高關聯性的資料被排序於較後面,反而較低關聯性的資料是顯示在前,或是在顯示結果中具有完全不相關的資料。當前述情況發生時,使用者必須自己逐筆去瀏覽檢視完整的資料內容,才能從當中擷取出本身需要的資料。
鑑於現有之資訊管理分類方法即使經分類處理後,仍存在有較不吻合的結果資訊而無法滿足使用者原先所預期的內容,故本發明其中一目的係提供一種具有高分辨性之資訊管理分類方法,該方法之步驟包含有:收集資訊,係自一資料來源取得待分類管理的資訊並儲存於一原始資料庫中;執行自動分類,係利用一自動分類機制對前述收集而來的資訊加以自動分類並儲存;建立分類標籤,係設定並儲存複數個分類標籤於一標籤資料庫中,該複數個分類標籤依其性質劃分為不同類別;提供一分類關聯建立介面,其中該分類關聯建立介面可允許操作者自前述標籤資料庫取出所需的分類標籤,並將每筆資訊與至少一個分類標籤建立關聯;提供一編輯確認介面,其中該編輯確認介面係允許具較高作業權限的編輯者進行資料審核,對已與分類標籤建立關聯的資料核查是否適當無誤,而成為非依預設固定規 則完成分類之已分類資訊;儲存已編輯確認完成之資訊,係將已編輯確認完成之已分類資訊儲存於一分類完成資料庫。
藉由前述作業步驟,本發明除利用自動分類機制進行自動分類以外,更提供一分類關聯建立介面而允許操作者可選用適當的分類標籤與待分類資料建立正確關聯,爾後透過一編輯確認介面供編輯者再進一步的執行後段的審核確認,利用此逐層管理分類的技術,將可確保每一筆資訊都能被正確地歸類於適當的領域,使不同資訊之間的可辨識性有效提高。
本發明之高分辨性資訊管理分類方法,主要是對多筆搜集而來的原始資訊進行自動分類、對已自動分類完成之資料與分類標籤(tag)建立關聯、對已建立關聯之資料執行編輯確認等層層管理作業,如此一來使得每一筆資訊均被指定有一或多個分類標籤並得以正確地被歸屬到適當的領域之下。
以本發明的資訊管理分類方法為運作基礎,可進一步實際運用於網際網路上供資訊搜尋,當使用者利用適當的關鍵字進行檢索時,由於資料已完成正確的分類作業,故呈現出的檢索結果係具有更高的辨識性及準確率,於以下說明中將配合圖式詳細介紹本發明的具體實施技術。
請參閱第一圖所示,係用以實施本發明的系統方塊圖,該系統係提供有一原始資料庫(10)、一自動分類機制 (20)、一分類關聯建立介面(30)、一標籤資料庫(40)、一編輯確認介面(50)、一分類完成資料庫(60)以及一管理介面(70),以較佳實施例而言,前述系統可利用一伺服器(100)配合其它的硬體資源構成,而操作者或編輯者可透過個人電腦(PC)、週邊輸出/入裝置等設備與伺服器(100)建立連線。
該原始資料庫(10)內儲存多筆收集而來的待分類資訊,在收集過程中,可決定自資料來源中全面收集整體資訊或是自資料來源中選擇性地收集部分資訊,資訊的型態可為文章、圖檔、影像檔、聲音檔等形式,該些資訊的來源不限定自網際網路取得,亦可是原本已存在於儲存記錄媒體上的資訊。
該自動分類機制(20)之設置目的係為了將收集而來的資訊,依據資料內容加以自動歸類、整理,使原本龐雜的資料整理成較具有相似性的適當群組。
該分類關聯建立介面(30)係與標籤資料庫(40)搭配運作,其中標籤資料庫(40)內係可預先建立多個不同的分類標籤,該些分類標籤可根據其屬性而劃分為不同類別,每一類別可視需求再細分為多階層的次類別。該關聯立介面(30)係作為使用者操作的介面,允許使用者自標籤資料庫(40)內挑選出適當的分類標籤,並接受使用者輸入的編輯指令,將該分類標籤與經過自動分類的資料建立關聯,其中,每一筆資料並不限制只與單一個分類標籤建立關聯,可視實際情況與多數個分類標籤構成關聯,而且該分類標籤可 進一步設定有不同的權重比。
該編輯確認介面(50)係提供一編輯者進行資料編輯確認的作業環境,對於已完成標籤關聯建立的資料,具備編輯資格的操作者係擁有較高的作業權限,可透過該編輯確認介面(50)執行更進一步地檢視,核查該筆資料與分類標籤的關聯是否適當無誤,若發現瑕疵或錯誤可進一步地正確修正。
該分類完成資料庫(60)係儲存經過編輯確認介面(50)的資料,換言之,相較於原始資料庫(10)的內容,完成管理分類的資訊係更具有辨識性。
該管理介面(70)係與前述各資料庫(10)(40)(60)及各介面(30)(50)相連,作為控制中樞,例如當有操作者或編輯者欲執行資料管理分類作業時,即必須經由該管理介面(70)通過資格審核、登錄等手續驗證後,才准予繼續進行。又或者透過該管理介面(70)可設定該原始資料庫(10)應如何自動收集擷取資料、設定各操作人員之作業權限等管制作業。
請參考第二圖所示,基於前述實施架構,本發明高分辨性資訊管理分類方法包含有下列步驟:收集原始資訊(101),原始資訊可為文章、圖片檔、影像檔、聲音檔等,所收集之原始資訊可為整體或部分的資訊,可從一資料來源,例如經由網際網路向一WEB站台、RSS新聞訂閱、個人部落格、論壇討論區等收集所需資訊、或使用者自行建立、或自一儲存記錄媒體中擷取出來,並 未嚴格限制其來源管道;執行自動分類(102),係利用該自動分類機制(20)將收集而來的資訊,依據資料內容加以自動歸類、整理,以歸納分類為較具相似性的適當群組;建立分類標籤(103),係制定複數個分類標籤並加以儲存,該分類標籤依其性質可劃分為不同主類別,舉例而言例如人名、專業術語、地名等大類,再於各主類別之下視需求可再細分成多階層的次類別;提供一分類關聯建立介面(104),該分類關聯建立介面(20)可允許使用者自標籤資料庫(40)取出所需的分類標籤,並將每筆資訊與至少一個分類標籤建立關聯,所使用的分類標籤是根據該筆資訊的本質內容或其相關內容而決定,例如該筆資訊為文章時,可選擇存在於文章中的關鍵字、文章作者、出版資訊、文章屬性等類別的分類標籤;在建立關聯時,可針對每一個分類標籤設定其權重比值,使具有相同分類標籤名稱的不同筆資訊能再更進一步決定兩者之優先順序;提供一編輯確認介面(105),該編輯確認介面(50)係提供具較高作業權限的編輯者進行資料審核確認的作業環境,對已與分類標籤建立關聯的資料再更進一步地檢視,核查該筆資料與分類標籤的關聯是否適當無誤;儲存已分類完成之資訊(106),係將已經過編輯審核的資料儲存於該分類完成資料庫(60),其中,前述原始資料庫(10)與分類完成資料庫(60)可分別以兩獨立的儲存硬體構 成,或是建構於單一的儲存硬體內。
此外,伺服器(100)內部亦可增設一操作者/編輯者群組(80),當執行前述分類管理步驟時,管理介面(70)可驗證發出要求的操作人員是否屬於該操作者/編輯者群組(80)中之人員,可執行資訊與分類標籤的關聯維護作業。
綜上所述,本發明利用自動分類機制並提供一分類關聯建立介面而允許操作者可選用適當的分類標籤與待分類資料建立正確關聯,爾後透過一編輯確認介面供編輯者再進一步的執行後段的審核確認,利用此逐層管理分類的技術,可將收集而來的資訊進行正確的歸類處理,完成管理分類後的資料,係可進一步的被運用於資料搜尋,例如配合搜尋引擎來檢索,提供更具有辨識性的搜尋結果,以更貼近使用者之預期。
(10)‧‧‧原始資料庫
(20)‧‧‧自動分類機制
(30)‧‧‧分類關聯建立介面
(40)‧‧‧標籤資料庫
(50)‧‧‧編輯確認介面
(60)‧‧‧分類完成資料庫
(70)‧‧‧管理介面
(80)‧‧‧操作者/編輯者群組
(100)‧‧‧伺服器
第一圖:係實施本發明之系統方塊圖。
第二圖:係本發明高分辨性資訊管理分類方法之流程圖。

Claims (11)

  1. 一種高分辨性之資訊管理分類方法,包含:收集資訊,係自一資料來源取得待分類管理的資訊並儲存於一原始資料庫中;執行自動分類,係利用一自動分類機制對前述收集而來的資訊加以自動分類並儲存;建立分類標籤,係設定並儲存複數個分類標籤於一標籤資料庫中,該複數個分類標籤依其性質劃分為不同類別;提供一分類關聯建立介面,其中該分類關聯建立介面可允許操作者自前述標籤資料庫取出所需的分類標籤,並將每筆資訊與至少一個分類標籤建立關聯;提供一編輯確認介面,其中該編輯確認介面係允許具審核作業權限的編輯者進行資料審核及修正,對已與分類標籤建立關聯的資料核查所建立的關聯是否適當無誤並在關聯錯誤時進行修正,而成為非依預設固定規則完成分類之已分類資訊;儲存已編輯確認完成之已分類資訊,係將已編輯確認完成之已分類資訊儲存於一分類完成資料庫。
  2. 如申請專利範圍第1項所述高分辨性之資訊管理分類方法,於建立資訊與分類標籤之關聯時,係進一步設定分類標籤之權重值。
  3. 如申請專利範圍第1或2項所述高分辨性之資訊管理分類方法,該收集資訊之步驟係經由網際網路向一WEB站台、RSS新聞訂閱、個人部落格或論壇討論區收集 資訊。
  4. 如申請專利範圍第1或2項所述高分辨性之資訊管理分類方法,該收集資訊之步驟中係收集使用者自行建立之資訊。
  5. 如申請專利範圍第1或2項所述高分辨性之資訊管理分類方法,該收集資訊之步驟係向一儲存記錄媒體取出資訊。
  6. 如申請專利範圍第1或2項所述高分辨性之資訊管理分類方法,於收集資訊之步驟中係收集文章、圖檔、影像檔或聲音檔格式之資訊。
  7. 如申請專利範圍第1或2項所述高分辨性之資訊管理分類方法,前述原始資料庫、標籤資料庫及分類完成資料庫係由不同儲存裝置構成。
  8. 如申請專利範圍第1或2項所述高分辨性之資訊管理分類方法,前述原始資料庫、標籤資料庫及分類完成資料庫係由同一儲存裝置構成。
  9. 如申請專利範圍第1或2項所述高分辨性之資訊管理分類方法,該收集資訊之步驟中,係自該資料來源取得待分類管理的整體資訊。
  10. 如申請專利範圍第1或2項所述高分辨性之資訊管理分類方法,該收集資訊之步驟中,係自該資料來源取得待分類管理的部分資訊。
  11. 一種高分辨性之資訊管理分類系統,包含:一原始資料庫,係儲存多筆收集而來的待分類資訊; 一自動分類機制,係對前述收集而來的待分類資訊進行自動分類並儲存;一標籤資料庫,於其內部係設定並儲存複數個分類標籤,該複數個分類標籤依其性質劃分為不同類別且分別設定有不同權重;一分類關聯建立介面,係供操作者自前述標籤資料庫取出所需的分類標籤,並透過該分類關聯建立介面將每筆資訊與至少一個分類標籤建立關聯;一編輯確認介面,係供具審核作業權限的編輯者進行資料審核,對已與分類標籤建立關聯的資料核查是否適當無誤,而成為非依預設固定規則完成分類之已分類資訊;一分類完成資料庫,係儲存已編輯確認完成之已分類資訊;一管理介面,係與前述原始資料庫、標籤資料庫、分類完成資料庫、關聯建立介面及編輯確認介面相連,作為一控制中樞以提供資格審核、登錄手續驗證、設定該原始資料庫之自動收集擷取資料方式、設定不同使用者之作業權限。
TW097122478A 2008-06-17 2008-06-17 High resolution information management classification method and system TWI459313B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW097122478A TWI459313B (zh) 2008-06-17 2008-06-17 High resolution information management classification method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW097122478A TWI459313B (zh) 2008-06-17 2008-06-17 High resolution information management classification method and system

Publications (2)

Publication Number Publication Date
TW201001310A TW201001310A (en) 2010-01-01
TWI459313B true TWI459313B (zh) 2014-11-01

Family

ID=44824823

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097122478A TWI459313B (zh) 2008-06-17 2008-06-17 High resolution information management classification method and system

Country Status (1)

Country Link
TW (1) TWI459313B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI573031B (zh) * 2015-12-04 2017-03-01 英業達股份有限公司 資料分類及搜尋方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI234720B (en) * 2004-04-16 2005-06-21 Via Tech Inc Related document linking managing system, method and recording medium
US20070094389A1 (en) * 2005-10-23 2007-04-26 Bill Nussey Provision of rss feeds based on classification of content

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI234720B (en) * 2004-04-16 2005-06-21 Via Tech Inc Related document linking managing system, method and recording medium
US20070094389A1 (en) * 2005-10-23 2007-04-26 Bill Nussey Provision of rss feeds based on classification of content

Also Published As

Publication number Publication date
TW201001310A (en) 2010-01-01

Similar Documents

Publication Publication Date Title
US11386510B2 (en) Method and system for integrating web-based systems with local document processing applications
US11729114B2 (en) Configurable views of context-relevant content
CN1694100A (zh) 改进文档检索的内容传播
US20100017388A1 (en) Systems and methods for performing a multi-step constrained search
CA2789010C (en) Propagating classification decisions
AU2009234120A1 (en) Search results ranking using editing distance and document information
JP5227333B2 (ja) ウェブページの分類とそのコンテンツの整理をするための方法
US9892209B2 (en) Linking business objects and documents
CN1848162A (zh) 成分信息的可靠性评价方法、系统及程序
CN1246796C (zh) 电子数据检索系统
CN112800755A (zh) 一种数据治理方法及系统
US20060277190A1 (en) Search authoring metrics and debugging
TWI556128B (zh) Forensic system, forensic method and evidence collection program
WO2020056976A1 (zh) 搜索结果优化排序方法、装置、程序及计算机可读存储介质
TWI459313B (zh) High resolution information management classification method and system
TW200807346A (en) Knowledge framework system and method for integrating a knowledge management system with an e-learning system
Albertsen The paradigma web harvesting environment
JP2007242005A (ja) 特許情報処理システム、特許情報処理方法、特許情報処理プログラム及び特許情報処理プログラムを記録した記録媒体。
JP5098476B2 (ja) データ分析支援装置
JP2003044486A (ja) 知識分析システム、クラスタ管理方法およびクラスタ管理プログラム
JP2003044490A (ja) 知識分析システムおよび同システムにおける知識重複登録設定方法
US20090313221A1 (en) Patent technology association classification method
RU2557473C2 (ru) Комплекс подготовки данных для информационно-аналитической системы
EP4009198A1 (en) Biometric information management system security
TW200846940A (en) Dynamic knowledge management method for supporting editing

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees