TWI240876B - Portable database search agent processing system - Google Patents

Portable database search agent processing system Download PDF

Info

Publication number
TWI240876B
TWI240876B TW93117505A TW93117505A TWI240876B TW I240876 B TWI240876 B TW I240876B TW 93117505 A TW93117505 A TW 93117505A TW 93117505 A TW93117505 A TW 93117505A TW I240876 B TWI240876 B TW I240876B
Authority
TW
Taiwan
Prior art keywords
search
database
agent
data
database search
Prior art date
Application number
TW93117505A
Other languages
English (en)
Other versions
TW200601086A (en
Inventor
Pei-Lin Chou
Original Assignee
Bridgewell Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bridgewell Inc filed Critical Bridgewell Inc
Priority to TW93117505A priority Critical patent/TWI240876B/zh
Application granted granted Critical
Publication of TWI240876B publication Critical patent/TWI240876B/zh
Publication of TW200601086A publication Critical patent/TW200601086A/zh

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

1240876 五、發明說明(1)
一、【發明所屬之技術領域 本發明是關於一種可攜 統’特別是關於一種培育、 器,並利用該資料庫搜尋代 統0 式資料庫搜尋代理器處理系 訓練可攜式資料庫搜尋代理 理器進行資料搜尋的處理系 二、【先前技術】 隨著電腦應用普及以及 際網路在各種大型資料庫系 每一個人日常生活及工作上 系統,不但已將各種有用的 網際網路更將這些大型資料 這個正在急速擴大的資料庫 如何在這個大型資料庫中搜 上重要的課題。 網際網路的大量應用,透過網 j中搜尋有用的資料,已成為 欠件重要的活動。現代的電腦 資訊’結合成巨大的資料庫, 庫連結成更大的資料庠。雖然 提供了大量的文件、資訊,但 尋有用的資料,成為一個技術 跟隨網 搜尋引擎( 常是以網站 要在網頁上 擎即自動在 章,呈現在 上述習 法。最常見 乃是依據使 搜尋的資料 不、、路的興起,各種在網際網路上搜尋文件# 二eaKh engine)應運而生。這種搜通 的型式存在。使用者進入這種搜尋網站弓;擎二 打入所謂的「關鐽玄 所連紝的久士 / 」(Η0 S),搜尋弓 的各大網站中搜尋符合搜尋條件的文 躀者所指定的網頁上。 什的又 知技術中,對;^ 的作法乃是所袖i的搜尋,有兩種主要的作 用者打入的關Am這種搜尋技術 庫中,找尋具有鈐 牡所有可能 有輪入之關鍵字之文章,加以顯 者 三 器 本發明夕 ,可記錄i目的也在提供一種可攜帶式資料庫搜尋个 料庠中進二次用者之搜尋參數而自動在網際網路等大3 本發2貝料搜尋,得到與本人搜尋相同之結果。 器,該代理=目的也在提供一種可攜帶式資料庫搜尋手 裔可記錄使用者資料檢索之行為模式,而+ 1240876 五、發明說明(2) ---- 示,另„乃是令使用者輪入文章所可能包含的詞, -m ^^ JL μ /在认哥條件中’也可能對所輸入的搜 寻,、、性參數(attributes)。運算單元依攄豆 輸入搜尋用,,在或不存在某篇文章中,以:: 「OR」等運异早疋,計算每一篇文章之相 值(_lean Value),依序排列,作為搜尋結果稱為布林 訊,路等大型資料庫系統,搜尋文件等資 及中小企業! 的工作,大多數的公司、政府機關,以 作上重要的Ii經常能正確搜尋到有用的結果。已成為工 力,除靠先夭ϋ由公司(僱主)的角度言,正確搜尋能 然而,這插拉、-秉賦之外,尚需長期的練習與經驗累積。 公司職員更鉍驗之累積,並無法加以傳承或傳播。尤其在 的時間,才ί時,新任職員必須重行訓練,花費幾乎相同 者。 能造就出具有相同搜尋資料經驗與能力的後繼 、【發明内容】 t發明之目i π 士 ,該代理时的在提供一種可攜式資料庫搜尋代理 行拽尋。裔可代替使用者在網際網路等大型資料庫中進 器
!24〇876 、發明說~ ~ --一一^~一~ — 4吏用去 jb 尋大旦大型 > 料庫中進行搜尋,並可提供於他人用來擔 八K的資料。 议 器,^ ^明之目的也在提供一種可攜帶式資料庫搜尋代理 目的° ^時對其搜尋參數加以修正’以符合使用者檢索之 的,^發明之目的也在提供一種依據使用者檢索資料之目 ^正可攜帶式資料庫搜尋代理器之處理系統。 記錄—::fL示一種可攜式資料庫搜尋代理器,該代理器 量的資;::搜:ί數,以提供資料庫檢索系統據以在大 理器於置人Iπ ί㈣s之資料°該可攜式資料庫搜尋代 後,攜式資料庫搜尋代理器處理系統 記錄之資料掬::J據使用者之指不’修正該代理器中所 尋之結果ΐ::ί ’而使利用修正後代理器進行資料搜 理器之修正勺Γσ以使用者之搜尋目#。該處理器對該代 裔之修正包括下列步驟·· 料搜ΐ ί:個Iί Ϊ資料庫搜尋代理器中所記錄之-組資 之權值Υ <哥參數包括至少一搜尋指標及其相對應 料伊Ϊ!7?與該組資料搜尋參數相關之資料^該群資 田=,夕數經標示為與該可攜式資料庫搜尋代理器之搜 庫搜U符」之資料檔及多數經標示為與該可攜式資料 庫搜=器之搜尋目的「不符」之資料權; 尋H =組資料搜尋參數在特定之資料庫中進行搜 于到夕數符合或接近搜尋條件的資料檔;
第7頁 1240876 五、發明說明(4) 在所得之資料檔中選取特定數量之資料檔,提供使用 者閱讀; 接受使用者對所提供之資料檔之評價,並將評價結果 加以記錄;該評價包括代表是否符合搜尋目的之評價; 將經使用者評價之資料檔及其標示加入該群資料檔 中; 分析該群資料檔,產生一修正用資料庫搜尋代理器; 該修正用資料庫搜尋代理器記錄一組資料搜尋參數;各搜 尋參數包括至少一搜尋指標及其相對應之權值; 以該修正用資料庫搜尋代理器在該群資料檔中進行比 對,判斷預定數量之資料檔分別為符合搜尋目的或不符搜 尋目的; 計算以該修正用資料庫搜尋代理器所比對結果與該預 定數量資料檔所標示相符之比例,作為正確率; 以該正確率調整該修正用資料庫搜尋代理器之參數權 值; 合併該可攜式資料庫搜尋代理器與該調整後修正用資 料庫搜尋代理器;及 獲得修正之可攜式資料庫搜尋代理器。 在本發明之實施例中,並可包括重複該正確率計算及 4 依據該正確率修正資料庫搜尋代理器,直到正確率達到所 需之步驟。在本發明之實例中,另包括刪除該群資料檔中 資料稽之步驟。 四、【實施方法】
1240876 五、發明說明(5) 本發明揭示一種可攜式資料庫搜尋代理器,該代理器 記錄一組資料搜尋參數,以提供資料庫檢索系統據以在大 量的資料庫中,搜尋所需之資料。該可攜式資料庫搜尋代 理器於置入本發明之可攜式資料庫搜尋代理器處理系統 後,該處理系統可依據使用者之指示,修正該代理器中所 記錄之資料搜尋參數,而使利用修正後代理器進行資料搜 尋之結果,更符合該使用者之搜尋目的。 第1圖表示本發明可攜式資料庫搜尋代理器處理系統 之系統圖。如圖所示,本發明之可攜式資料庫搜尋代理器 處理系統包括: 一個搜尋代理器記憶體(11),用以儲存多數之資料 庫搜尋代理器(1 1 a- 1 1 η);其中,任一資料庫搜尋代理 器均記錄一組搜尋參數,各搜尋參數包括至少一個搜尋指 標及其相對應之權值;該搜尋參數可表以: A = (½, Wil ),0i2,),…(¾,);
第9頁 1240876 五、發明說明(6) 容,顯示提供於使用者,並接受使用者對各近似資料檔 評價;其中,該評價係包括任一近似資料檔是否符合搜 目的之評價;該訓練模組(1 5)龙可依據經使用者評價 資料檔内容及其相對應之評價,產生一修正用資料庫搜 代理器,該搜尋代理器包括一組搜尋參數,任一參數均 括一搜尋指標及其權值; 一修正模組(1 6),可依據該修正用資料庫搜尋代 器之内容,修正該搜尋代理器記憶體(i丨)中之資料 尋代理器之内容;及 ' 一使用者介面(1 7),用以供使用者操作至 (⑴、該搜尋引擎(12)、該訓練; (15)及该修正模組(16)。 不供 利用上述系、统,使用者可以在該搜 (1 1)中置入一外來資料庫搜尋代理 η η己憶 尋代理器在該搜尋引擎(1 2)對該資料庙,U該資料 尋依據搜尋結果修正該資料庫搜H:3)進行 使用者所需。 代理态,以更 在本發明中’資料庫搜尋代理 其中,x表搜尋用指標,如 則X可為-關鍵字詞,如為影像;之檔案為文” 音,則可為-段波形或其他1 ^ -特徵,如為 值。該權值代“對應之指表其相對應之本 寻目的之關係 之 尋 之 尋 包 理 搜 尋 搜 合 1240876 五、發明說明(7) 其值可為正或負。 該資料庫搜尋代理器可以利用任何已知技術產生。例 如,中華民國專利申請案第9 2 1 2 3 8 7 6號,即揭示一種以手 〜 動方式,將一搜尋用關鍵字,轉化成一串搜尋用指標之技 術。 又例如中華民國專利申請案9 3 1 0 5 8 7 4號’則揭示一種 對一個或數個資料檐内容進行分析,自動產生一串搜尋用 指標之技術。 茲以該9 3 1 0 5 8 7 4號專利申請案新揭示之技術為例,說 明該資料庫搜尋代理器之產生方法。以下之說明,係以對 一文字檔(文章)進行分析,產生描述該文章特性之策尋擊 代理器為實例。 第2圖即表示一種自一文字檔產生一個資料庫搜尋代 理器之方法流程圖。如圖所示,於(2 0 1)取得一資料 檔,該資料檔為一文字檔;於(2 0 2)將該文字檔轉換成 文字資料格式,以供處理。於(20 3)對該文字檔進行字 詞分割處理,而將該文字檔轉換成一串以「詞」(word) 為單位之連續資料。接著,於(204)計算各「詞」在該 文字檔中出現的次數,得到一串由「詞」與「詞頻」所組 合之指標集合,稱為「指標資料串」。其次,於(20 5) φ ^該指標資料串進!!正規化處理(normalizati〇n)。正 親化處理町消除文字檔長短對指標及其權值所造成的影 在實際應用士丄可以設定一文字檔標準長度。將所有 待處理文章與該設疋值比較,而將其詞頻值以該比較值作
第11頁 J240876 玉、發明說明(8) 炎規化處理。 再次,於(2 0 6)對於詞頻極高,但並無指標意義之 詞,進行調整。在進行調整時,可對某些在大多數 都會出現的詞,降低其權值。 進行調整時,乃是將前步驟所得之詞頻值,乘以一 整值。使得當一個詞所出現的文章數量越大 時,其權值即趨近於0。 列题同) 經過上述處理步驟後,於(20 7)得到所有气之 值,分別加以記錄,成為一資料庫搜尋代理器/ 中,如果是利用多數文字檔,並包括「符合」 及:T符」該搜尋目的之文字稽,則所得之資料庫搜尋: 该器可包括權值為正之指標及權值為負之指標。 經過上述步驟之後,將在步驟中曾經分^過之文字 襠,加以挑選,取得預訂數量之代表性文字檔,較好包括 經列斷為「符合」該搜尋目的及「不符」該搜尋目的之文 字襠:連同其「符合」該搜尋目的及「不符」該搜尋目的 之楳示,加以存檔備用。在選擇具代表性文字檔時,可挑 遂近似度〈詳下述〉之絕對值較高之文字檔。 ,上述方法外,其他可以建立類似結構之資料庫搜尋 代理器之方法,也可應用在本發明。 该搜尋引擎(1丨)可在該資料庫(13)中,取得資料 檔(A) ’並與該資料庫搜尋代理器所含之指標比對,標 示出在該資料庫中所存在之指標,計算近似度 Similarity:
第12頁 1240876 五、發明說明(9)
Simiianty = ^ x^Wj € (^4); 其中,A代表所檢索之資料檔,(A)表其内含資料之 集合;X鞟資料庫搜尋代理器所含之指標,w為其權值。 ~ 該搜尋引擎(1 2)將近似值計算結果與一臨界值比 . 較,挑選出近似值大於臨界值之資料檔,作為搜尋結果, 存在該資料檔暫存裝置(1 4)備用。 上述搜尋之目的,在測試該外來資料庫搜尋代理器所 搜尋之結果,是否與使用者之檢索目的相同。在本發明 中,該外來資料庫搜尋代理器為經過他人建立,訓練之代 理器,可以使該他人在資料庫中檢索出所需之資料檔,但· 所檢索之結果,未必符合另一人之需求。 為使外來之資料庫搜尋代理器能符合特定使用者之需 求,該訓練模組(1 5)乃將上述搜尋之結果顯示在該使用 者介面(1 7),供使用者進行評價。該使用者可閱讀其内 容,並進行評價。該評價通常包括是否符合搜尋目的之評 價。在實際應用上,可提供一按鈕,使用者僅需鍵入「相 符」及「不符」,即可完成評價。當然,其他評價方式, 例如令使用者給予評分,也屬可行。 經過使用者評價之資料檔,給予標記。當使用者已評 價過特定數量之資料檔,或者使用者指示停止評價後,該籲 訓練模組(1 5)即將經過評價之文字檔,加入該外來資料 庫搜尋代理器所附之該群代表性文字檔中,並對該群代表 性文字檔進行分析,得到一個修正用資料庫搜尋代理器,
第13頁 1240876 五、發明說明(10) 該代理器St仍以下式表示 X、W定義同前。 其中,對使用者評Λ「Τ ^ ^ 所產生之指標,其權值“mu,由該資料標 資料擋及該外來資料庫# β :、 、,不口使用者已評價之 標之内容,可ί二;;;=所附之該群代表性文字 利申請案所揭示之技術方;此5874號專 在實際操作上,該修正用 量與該外來資料庫搜尋代理;^ 庫技哥代理器s息括大 為-個外來資料庫搜尋尋用指標。這是因 練所得之結果。 戈里益乃疋經過他人長期使用,訓 該修正模組(16)以所俨夕啟 器,再度對該群加入新資^用資料庫搜尋代理 比對,測試各文字檔比對性資料槽資料檔進行 「不符」相同。其後Un;:標示之「符合」或 資料庫搜尋代理器之正確率(ac°c)。仃統计,計算該修正 其次,該修正模組(1 ^ ° 用資料庫搜尋代理器,並4正確率acc修正該修正 與該外來資料庫搜尋代理器用資料庫搜尋代理器St 尋代理器S s: ° ισ ’成為測試用資料庫搜 H%)) .1240876 _____________ 五、發明說明(11) 其中, = =沖认+⑵木冰汰V 7¾ = \
Xyfc = xi^3k = V ^ ^ {Xt) 'A = = % V ' 隹('}且
Are 況〇 接者’該修正模組(1 6 )再度對該群加入新文字檔之文 字檔進行比對,並將所得知正確率與一標準值比摞。如該 正確率已達標準值,則該測試用資料庫搜尋代理器即為合 格之資料庫搜尋代理器,所搜尋之結果足以符合使用者的 需求。 如該正確率未達該標準值,則修正模組(1 6)繼續對 該外來資料庫搜尋代理器進行修正。其修正方式可例如將鲁 該修正用資料庫搜尋代理器所含之權值,全部乘以該正確 率或歷次正確率之乘積,再與該外來資料庫搜尋代理器合 併。或以其他方法,修正該修正用資料庫搜尋代理器之^ 標或其權值。此外,也可分別修正該外來資料庫搜尋曰 器及該修正用資料庫搜尋代理器,再予合併,均無不β理 將修正後之測試用資料庫搜尋代理器,再度進行j ° 尋、評價,計算其正確率,直到其正確率超過該標$ 即可獲得符合所需之資料庫搜尋代理器。 / ° 綜合上述,本發明之可攜式資料庫搜尋代理器處王 統修正該外來資料庫搜尋代理器之流程,係如第3圖1 β系_ 攜式資料庫搜尋代理器修正流程圖所示,而句莊Τ η之可 G枯下列步 驟: 於(301)取得一個外來資料庫搜尋代理考 命甲所記絲
第15頁 1240876 五、發明說明(12) 之一組資料搜尋參數,邊參數包括至少一搜尋條件及其相 對應之權值; 於(3 0 2)取得一群與該組資料搜尋參數相關之資料 檔;該群資料檔包括多數經標示為與該可攜式資料庫搜尋 代理器之搜尋目的「相符」之資料檔及多數經標示為與該 可攜式資料庫搜尋代理器之搜尋目的「不符」之資料槽; 於(3 0 3)依據該一組資料搜尋參數在資料庫(13) 中進行搜尋,得到若干符合或接近搜尋條件的資料檔; 於(3 0 4)在所得之資料檔中選取特定數量之資料 檔,顯示於該使用者介面(1 7)供使用者閱讀;’ 於(3 0 5)接受使用者對所提供之資料檔之評價;該 評價包括代表是否符合搜尋目的之評價; 於(30 6)將經使用者評價之資料檔及其標 群資料檔中; 於(30 7)分析該群資料栲姦 ^ ^ τ貝可叶;f田,產生一修正用資料座滁 尋代理器;該修正用資料庫# i ^ μ ^ 、τ寸早役 參數;各搜尋參數包括至少一抽*社4Φ # 貝村搜寻 值; 夕搜哥指標及其相對應之權 於 於(30 9)計算以該修正 結果與該預定數量資料槽所样-貝; 哥代理器所比對 尋目的相符之比例,作^正^ ^之符合搜尋目的或不符搜
1240876 五、發明說明 於( 器之參數 於( 後修正用 器; 於( 修正結果 最後 無影響的 在本 功能,以 JL· 〇 如上 統,可對 結果符合 獨立之搜 達於成熟 驗,該他 需求。此 發明使得 以上 說明,習 精神進而< 精神,均, (13) 3 1 0)以該正碟率調整該修正用資料庫搜尋代理 權值; 3 1 1)合併該可攜式資料庫搜尋代理器與該調整 資料庫搜尋代理器,得到修正後資料庫搜尋代理 3 1 2)輸出該修正後之資料庫搜尋代理器,作為 〇 ,於(313)在該群資料檔中刪除對訓練效果較 資料檔,以防止資料檔所佔記憶空間過大。 發明中,該使用者介面也可提供一個隨時修正之 在使用者啟動後,進行資料庫搜尋代理器之修 本發明 資料庫 如此一 ,在不 庫搜尋 利用本 人他可 搜尋代 發明可 之人士 同的衍 於其申 之可攜式 搜尋代理 來,資料 同電腦系 代理器, 發明加以 隨時修正 理器達到 攜式資料 不難由上 伸與變化 請專利範 器進行 庫搜尋 統中使 可由他 修正, 其資料 完全可 庫搜尋 述之說 j 唯只 圍内。 议兮1乂 修正, 代理器用,且 人借用 而符合 庫搜尋 攜之目 代理器 明,明 要不超 使其搜尋^ 可以成為-可長期使月 ’傳承經 自己的搜| 代理器。4 4茈 和?。 處理系統$ 瞭本發明之 出本發明之
1240876 五、發明說明(14) 【元件符號表】 11 搜尋代理器記憶體 ~ 12 搜尋引擎 . 13 資料庫 14 資料檔暫存裝置 15 訓練模組 16 修正模組 1 7 使用者介面 it ϋΙΙ 第18頁 1240876 圖式簡單說明 第1圖表示本發明可攜式資料庫搜尋代理器處理系統 之系統圖。 第2圖即表示一種自一文字檔產生一個資料庫搜尋代 理器之方法流程圖。 第3圖表示本發明之可攜式資料庫搜尋代理器修正方 法流程圖。
第19頁

Claims (1)

1240876 六、申請專利範圍 ~~一' '--- h —/Λ攜式資料庫搜尋代理11處理系統,包括. :理器…,任-資料庫搜尋代“ΐΐΓ貝料 值;:_ Λ 括至少一個搜尋指標及其相對雍夕! 合」戋「不铪H代 均圯錄一群經標示以「符 」次不符」搜尋目的之代表性資料檔.丁以付 一個搜尋引擎,可依據該搜代’ :資:庫搜尋代理器中所含之搜尋參數;中所儲存 在一資料庫中尋找近似乍為拽尋條件, 擋; m口成-群近似資料 -資料檔暫存裝i,用以健存 似資料檔; 哥?丨擎所搜尋之近 一訓練模組,可將該搜尋所得之近似 示提供於使用者,並接受使用者對各近二枓檔内容,顯 其中,該評價係包括任一近似資料稽「 I料檔之評價; 搜尋目的之評價;該訓練模組並可^據^合」或「不符」 料檔内容及其相對應之評價,以及該代$使用者評價之資 資料檔内容及其相對應之評價產生」修性資料檔所含之 理器,該搜尋代理器包括一組搜尋參^正用資料庫搜尋代 一搜尋指標及其權值; 夕 ’ 一參數均包括 容 一修正?組’可依據該修正用資料庫 修正該資料庫搜尋代理器之内容·及哭守代理為之内 一使用者介面,用以供使用者操作 記憶體、該搜尋引擎、該訓練模組;5、兮#少該搜尋代理器 、、夂该修正模組。
1240876 六、申請專利範圍 2. 如申請專利範圍第1項所示之可攜式資料庫搜尋代理 器處理系統,其中之資料庫搜尋代理器包括: 公i = (½,),(¾,),…(¾,), 其中,S表第i搜尋代理器,X表其指標,W表權值。 , 3. 如申請專利範圍第2項所示之可攜式資料庫搜尋代理 器處理系統,其中,所搜尋之槽案為文字播,且X為一關 鍵字詞。 4. 如申請專利範圍第1項所示之可攜式資料庫搜尋代理 器處理系統,其中之搜尋引擎可在該資料庫中,取得資料 檔,並與該資料庫搜尋代理器所含之搜尋指標比對,標示 @ 出在該資料庫中所存在之搜尋指標,計算近似度 Similarity· Similarity = ^ e (.4); 其中,A代表所檢索之資料檔,(A)表其内含資料之 集合;X鋅資料庫搜尋代理器所含之指標,W為其權值; 且 該搜尋引擎將近似值計算結果與一臨界值比較,挑選 出近似值大於臨界值之資料檔,作為近似之資料檔搜尋結 果。 5. 如申請專利範圍第1項所示之可攜式資料庫搜尋代理❶ 器處理系統,其中經使用者評為不符合搜尋目的之資料 檔,即將由該資料檔所產生之指標所對應之權值標為負 值0
第21頁 1240876 --~~~— 六、申請專利範圍 口口 如申請專利範圍第旧所示之 益處理系統,#中該修正模 ^ _貝料庫搜尋代理 搜尋代理胃心队,、))…卜來資下=將該修正用資料庫 ^=^)} ”及卜來貝枓庫搜尋代理器 :併’成為修正後資料庫搜尋代理器s 其中, x5k = Xi^5kt = Wik = ^ \Α = 6,ν^Α = Μ^ν' ¢(¾) \a= ',祕认二 ¢(¾}且 • 表一指標,喊其權值,acc表該修正用資料庫 搜哥代理器搜尋該經使用者評價之資料檔以及該代表性資_ 料檔所含之資料檔之結果正確率。 7 ·如申請專利範圍第6項所示之可攜式資料庫搜尋代理 器處理系統,其中,該修正模組係可反覆根據該修正後資 料庫搜尋代理器搜尋該經使用者評價之資料檔以及該代表 性資料檔所含之資料檔之結果正確率,修正該資料庫搜尋 代理器,直到該正確率達於一定值。 8.如申請專利範圍第6項所示之可攜式資料庫搜尋代理 器處理系統,其中,該修正模組係分別修正該外來資料庫 搜尋代理器及該修正用資料庫搜尋代理器,再予合併。 $ 9 · 一種可攜式資料庫搜尋代理器修正方法,包括: 取得一個可攜式資料庫搜尋代理器中所記錄之一組資 料搜尋參數;各搜尋參數包括至少一搜尋指標及其相對應
第22頁 1240876 六、申請專利範圍 之權值; 取得一群與該可攜式資料庫搜尋代理器相關之資料 檔;該群資料檔包括多數經標示為與該可攜式資料庫搜尋 _ 代理器之搜尋目的「相符」之資料檔及多數經標示為與該 . 可攜式資料庫搜尋代理器之搜尋目的「不符」之資料檔; 依據該一組資料搜尋參數在特定之資料庫中進行搜 尋,得到多數符合或接近搜尋條件的資料檔; 在所得之資料檔中選取特定數量之資料檔,提供使用 者閱讀; 接受使用者對所提供之資料檔之評價,並將評價結果Φ 加以記錄;該評價包括代表「符合」或「不符」搜尋目的 之評價; 將經使用者評價之資料檔及其標示加入該群資料檔 中; 分析該群資料檔,產生一修正用資料庫搜尋代理器; 該修正用資料庫搜尋代理器記錄一組資料搜尋參數;各搜 尋參數包括至少一搜尋指標及其相對應之權值; 以該修正用資料庫搜尋代理器在該群資料檔中進行比 對,判斷預定數量之資料檔分別為符合搜尋目的或不符搜 尋目的; # 計算以該修正用資料庫搜尋代理器所比對結果與該預 定數量資料檔所標示相符之比例,作為正確率; 以該正確率調整該修正用資料庫搜尋代理器之參數權 值;
第23頁 1240876 六、申請專利範圍 料|^ ^可攜式資料庫搜尋代理器與該調整後修正用資 枓庫搜尋代理器;及 用貝 獲得修正之可攜式資料庫搜尋代理器。 理請專利範圍第9項所示之可攜式資料庫搜尋代 &正方法,其中該資料庫搜尋代理器S係包括·· & =(〜,),(〜%),···(‘>〇; 其中,X表一指標,w表其權值; 丄1 ·如申晴專利範圍第9項所示之可攜式資料庫搜 理器修正方法,盆中所满慕夕^^安 代 〜^ 具中所搜哥之檔案為文字檔,X為一關鍵 子列。 1。2如申請專利範圍第9項所示之可攜式資料庫搜尋代 理器修正方法,其中該搜尋結果係以近似度 (Similarity)值超出一臨界值之檔案,該近似度之計算 方式為: Similarity V^e^); 辈人? L 所檢索之資料樓,(a) *其内含資料之 集δ料庫搜尋代理器s所含之指標,,其權值。 y欠如申凊專利範圍第9項所示之可攜式資料庫搜尋代 理器6正方法L其中,經使用者評為不符搜尋目的之資料 檔,則將由該資料檔所產生之指標權值標為負值。 理i:::Ϊ專Ξ!圍第9項所示之可攜式資料庫搜尋代 理益修正方法,其中該合併一資料庫搜尋代理器 (^办心)))與另一資料庫搜尋代理器(
第24頁 1240876 六、申請專利範圍 成為修正用資料庫搜尋代理器s各方式包括: &=((〜〜)} 其中, x5k = = +acc^wtK V^ = ^ ^ = ¢{^} 7:认== 茫(¾}且 keN- 表一指標,w表其權值 搜尋代 料檔所 15. 理器修 器搜尋 之資料 該正確 16. 理器修 另一資 併0 理器搜尋 含之資料 如申請專 正方法, 該經使用 檔之結果 率達於一 如申請專 正方法, 料庫搜尋 該經使 檔之結 利範圍 另包括 者評價 正確率 定值之 利範圍 其中, 代理器 用者評價之 果正確率。 第1 4項所示 反覆根據該 之資料檔以 ,修正該資 步驟。 第1 4項所示 該一資料庫 ,均經調整 acc表該修正用資料庫 資料檔以及該代表性資 之可攜式資料庫搜尋代 修正後資料庫搜尋代理 及該代表性資料檔所含 料庫搜尋代理器,直到 之可攜式資料庫搜尋代 搜尋代理器(S)及該 所含參數值,再予合 ❶
第25頁
TW93117505A 2004-06-17 2004-06-17 Portable database search agent processing system TWI240876B (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW93117505A TWI240876B (en) 2004-06-17 2004-06-17 Portable database search agent processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW93117505A TWI240876B (en) 2004-06-17 2004-06-17 Portable database search agent processing system

Publications (2)

Publication Number Publication Date
TWI240876B true TWI240876B (en) 2005-10-01
TW200601086A TW200601086A (en) 2006-01-01

Family

ID=37012971

Family Applications (1)

Application Number Title Priority Date Filing Date
TW93117505A TWI240876B (en) 2004-06-17 2004-06-17 Portable database search agent processing system

Country Status (1)

Country Link
TW (1) TWI240876B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI454943B (zh) * 2006-12-15 2014-10-01 Google Inc 一電腦實施方法及一用於自動搜尋條件校正之系統
TWI490704B (zh) * 2013-03-07 2015-07-01 Univ Southern Taiwan Sci & Tec 相關詞彙產生系統及方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI406181B (zh) * 2009-05-11 2013-08-21 Nat Univ Tsing Hua 一種建構和搜尋三維影像資料庫之方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI454943B (zh) * 2006-12-15 2014-10-01 Google Inc 一電腦實施方法及一用於自動搜尋條件校正之系統
TWI490704B (zh) * 2013-03-07 2015-07-01 Univ Southern Taiwan Sci & Tec 相關詞彙產生系統及方法

Also Published As

Publication number Publication date
TW200601086A (en) 2006-01-01

Similar Documents

Publication Publication Date Title
US20200320086A1 (en) Method and system for content recommendation
US11264023B2 (en) Using multiple modality input to feedback context for natural language understanding
US20170091838A1 (en) Product recommendation using sentiment and semantic analysis
US20160179931A1 (en) System And Method For Supplementing Search Queries
US20060155687A1 (en) Portable database search agent processing system
CN111797214A (zh) 基于faq数据库的问题筛选方法、装置、计算机设备及介质
US20120203584A1 (en) System and method for identifying potential customers
KR20160149978A (ko) 검색 엔진 및 그의 구현 방법
Li et al. A holistic model of mining product aspects and associated sentiments from online reviews
JP6123143B1 (ja) 特許要件適否予測装置および特許要件適否予測プログラム
CN112559895B (zh) 一种数据处理方法、装置、电子设备及存储介质
JP2018200621A (ja) 特許要件適否予測装置および特許要件適否予測プログラム
US11861321B1 (en) Systems and methods for structure discovery and structure-based analysis in natural language processing models
CN111723256A (zh) 一种基于信息资源库的政务用户画像构建方法及其系统
CN115374781A (zh) 文本数据信息挖掘方法、装置、设备
Chen et al. Fine-grained product categorization in e-commerce
TWI396983B (zh) 名詞標記裝置、名詞標記方法及其電腦程式產品
TWI290687B (en) System and method for search information based on classifications of synonymous words
CN112597768B (zh) 文本审核方法、装置、电子设备、存储介质及程序产品
TWI240876B (en) Portable database search agent processing system
CN115062135B (zh) 一种专利筛选方法与电子设备
Imhof et al. Multimodal social book search
Fu et al. Enhancing Semantic Search of Crowdsourcing IT Services using Knowledge Graph.
CN115878761A (zh) 事件脉络生成方法、设备及介质
CN114691835A (zh) 基于文本挖掘的审计计划数据生成方法、装置和设备

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees