TW201214163A - Searching system and method thereof with generating extending keywords according to input keywords - Google Patents

Searching system and method thereof with generating extending keywords according to input keywords Download PDF

Info

Publication number
TW201214163A
TW201214163A TW099131998A TW99131998A TW201214163A TW 201214163 A TW201214163 A TW 201214163A TW 099131998 A TW099131998 A TW 099131998A TW 99131998 A TW99131998 A TW 99131998A TW 201214163 A TW201214163 A TW 201214163A
Authority
TW
Taiwan
Prior art keywords
keyword
data
keywords
algorithm
word
Prior art date
Application number
TW099131998A
Other languages
English (en)
Inventor
Chau-Cer Chiu
Hu-Chen Xu
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to TW099131998A priority Critical patent/TW201214163A/zh
Priority to US12/928,594 priority patent/US20120072443A1/en
Publication of TW201214163A publication Critical patent/TW201214163A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion

Description

201214163 六、發明說明: 【發明所屬之技術領域】 〜-種資料祕及其方法,特職旨—種根據輸人_鍵詞產 生衍生關鍵詞的資料檢索系統及其方法。 【先前技術】 . 資料齡是-雛收_顺,根據關_至#料庫中檢索 包含關鍵詞的資料項的技術’普遍應用於網頁搜尋引擎、電子或 線上詞典以及各種大型資料庫的資料搜尋上。以往的資料檢索, 0其是透過先接收使用者輸入的關鍵詞,接著比對資料項中是否具 有關鍵詞,若有則將包含關鍵詞的資料項擷取出來,藉此,使用、 者可以快速的從大量的資料項中過濾出部分資料項。 、然而,在雜進行資碰索的過財,雖可射出包含關鍵 ㈣資料項’但並無法根翻_衍生搜料其 料項。舉例來說,假設使用者欲搜尋具有花與花瓶的資料=貝 輸入關_ “花”及“花瓶”即可檢㈣具有其卜烟鍵詞或 •是兩個關鍵詞皆包含的資料項。但是,當使用者希望藉由“花” 及论瓶”的衍生關聯性搜尋出與“花盆,,相關的資料項時,必 須自行輸入“花盆”這個關鍵詞,才能搜尋出包含“花盆,,的資 料項,而無法根據“花”及“花瓶”的關聯性衍生“花盆,,這個 關鍵詞進行檢索。 & 雖然目前可以在使用者輸入關鍵詞時提示以往經常被拿來搜 ,的關鍵詞組,但這些作為提示的關鍵詞組通常是必須被經常搜 尋才肖b夠成為提示的關鍵詞組,當關鍵詞之間具有關聯性但卻非 經常被用來搜尋時,便無法檢索到與已輸入關鍵詞有關聯性但不 201214163 心已輸人關鍵詞的,貝料項,產生了無法全面性的將與已輸入關 賴相關的資料項完整賴取出來的問題,前述之例子而十, 即輸入“花,,* ‘‘花瓶” ’雖能擷取出包含“花,,及“花瓶,f作 為關鍵詞的資料項’但卻無法掏取出僅包含“花盆,,這個關鍵詞 的資料項。 綜上所述,可知先前技術中長期以來一直存 的資料完整性不佳關題,耻有必要提岐進的技術手Π 解決此一問題。 【發明内容】 有鑒於先前技術存在的問題,本發明遂揭露一種根據 衍生關聯性詞彙的詞庫檢索系統及其方法,其中: 本發明所揭露之根據關鍵詞衍生關聯性詞囊 統’其包含:資料庫’預先儲存有至少一筆資料項;詞== 儲存有至少,射各_詞麟财至少 模組,用以接收輸人之錢字串;輯擷取模組,用以於接 組接收到查詢字串後根據查詢字串至詞庫令比對出至少、 至:庫擷取各第一關鍵詞對應的至少-索引並進行比 卜其中.U少-第—_詞存在有至少 至詞庫掘取出具有相同索⑽至少-第二關_, 關制及所有第二騎觸取㈣庫之資料項;及當 一 =鍵5司不f在有網料時,根敎字襲性演算法取得至少一 二關鍵㈣’並以所有第_關鍵詞及所有第三二 之資料項;及顯示模組,用以顯示擷取之資料項。貝科庫 所述之根據_詞魅_性詞彙賴庫檢㈣統,其中所 201214163 纟引係為各關鍵詞之詞性及詞義分類。此外文车關絲 最:算法或文字合併演算法,二 方法本=:=:=衍·__ 預先建立射·* 先建立儲存有至少—筆資料項的資料庫; :子JL少-關鍵詞的詞庫,其中各關鍵詞 =引=輸入之查詢字串並根據查詢字串至詞庫比: >第1_;至詞賴取各第—_觸 :比對,其中··當至少-第-關鍵詞存在有至少-個相同= 詞庫擷取出具有相同索引的至少—第二關鍵詞,並以戶^ 一/鍵礙所有第二關鍵詞擷取該資料庫之資料項;及告至小 31鍵^在有__時,根據文字_性演算^取^ 資料庫及所有第,詞擷取 所述之根據輸人騎财生触隨觸轉檢索方法,且 中所述之至少—糾係為频_之詞性及詞義分類’。此外^ 關聯性演算法係為最長制賴字串演算法或文字 子 當為最長鋼連續字串演算法時,所述之方法更包細演=出之 最長共同連續字串結合至少—萬时元至詞庫練h少 =結==時他嫩〜㈣ 201214163 本發明所揭露之系統與方法如上,與先前技術之間的差異在 於本發明具有根據輸人之查詢字串至詞庫比對出至少___關鍵詞, 並根據至少-_生衍生關_,缸已輸人隨詞及衍生 關鍵詞同步檢索資料項之技術手段。 透過上述的技術手段’本發明可以達成提高資料檢索結果的 資料完整性之技術功效。 【實施方式】
以下將配合圖式及實蘭來詳細朗本發明之實施方式,藉 ,對本發明如何制麟手絲料技術醜並賴技術功效的 貫現過程能充分理解並據以實施。 首先,明先參考「第1圖」’為本發明根據輸入關鍵詞產生衍 生關鍵詞的資料檢索系統的方塊圖’其包含資料庫1〇卜詞庫1〇2、 接收模組103、比對擷取模、组104及顯示模組1〇5。 貝料庫1(U,預先儲存有至少一筆資料項。資料庫ι〇ι中儲 存的資料項可以是鮮引擎_If料項、電子詞典賴棄資料 、才田案系統的文件資料項或其他可以透過關鍵字擷取的資料 項,由於可儲存的資料項種類係依據應用領域有所差異,在此則 不針對資料庫101中資料項的形式加以限定。 網路” 幾何”…等與“連線,,的詞 轉102,預先儲存有至少一關鍵詞,其中各關鍵詞更對應 有至少一索引。在詞庫102當中儲存的每-關鍵詞,實際上相當 詞彙資料項,而各關鍵詞所對應的至少—索引係為各關鍵 ^雜及韻分類。舉例來說,假設有—關鍵詞為“連線”, I所預先建立的索引可以是“名詞,,或“動詞”等詞性以及 “通訊”、“拓蹼”、 201214163 義相關的詞義分類。然在此所舉之例子僅用以說明關鍵詞所建立 的索引疋用以關聯各個關鍵詞之間的關聯性,然實際上其詞性定 義方式和詞義分類方式則不以此為限。 接收模組103,負責接收輸入之查詢字串。 比對擷取模組104,負責於接收模組1〇3接收到使用者輸入 的查詢字串後,根據查詢字串至詞庫102比對出至少-第_關鍵
列。需要特別說明的是,第-關鍵詞是自使用者輸人的查詢字串 中擷取出來的,例如使用者輸入了 “陽光,空氣,水”的查詢字串, ,對擷取模組綱至詞庫1〇2當中比對,將可產生“陽光”、“空 氣 水等第一關鍵詞。接著,比對擷取模、组1〇4將根據第 一關鍵詞至詞庫102當中娜各第一關鍵詞對應的所有索引進行 =對。當各第-關鍵詞中具有至少一個相同的索引時,至詞庫搬 擷取出同樣具有該索引的關鍵詞作為第二關鍵詞,並以所有第 所有第二關鍵詞至資料庫則中榻取對應之』 =中舉織使權人了 _詞“親,,及“撥接”, 有索〜,,而關鍵詞“光纖,,具 詞,並以所有第一:=電及“光纖,,作為第二關鍵 鍵詞“益線電,,及“朵嫩” 及撥接”,以及所有第二關 詞及第二關鍵詞的資料ΐ 庫101當中擷取包含第-關鍵
時,職行P / 第—關鍵詞之間不具有相同索弓I 職订—文字_性演算法取得 有第一關鍵詞及所有第 弟一關鍵+並以所 需要特戰明^ 貝料庫1〇1當情取資料項。 说月的疋,文字_性演算法可以是最長共同連續 201214163 字串演算法或文字合併,、宫笪 將多侧_巾料法指的是 長相同部分V,的連續文字榻取出來^ :物,則可將最 串擷取出錢,比龍驗έΒ 1Λ 、最長_部分的連續字 串社入5小 _組104將根據最長相同部分的連續字 串結合至少-個萬用字元至詞庫1〇2當中操 貝子 鍵詞。同樣舉前述的例子來說,“_、纟=關 厂:再到詞庫⑽當中擷取出=,,、 p_ #作為第二繼詞。賴在此_字元是以 Γ實際上之制字元财任鱗殊符號或字 π來達成同樣效果,並砂所舉例之形式為限。 併纖,指嫩縣織合_多個關鍵詞 、、且&為至>、-舰合字,接著_庫⑽tt_是否存在鮮 合字,若存在則以該結合字作為第三_詞。舉例來說,假。 用者輸入岐“breakfast,,和‘Wh,,,馳 'Wast^ - W,· ^ -breaklunc, 少-個結合字,由於至詞庫1〇2中比對僅存在“bmnch,,這個關鍵 詞’此時則以“bnmch”這個結合字作為第三關鍵詞。然前述雖以 breakfastlunch”、“brunch”、“breaklunch” …說明結合出鈐 合字的方式,但僅用以說明舉例,實際上結合出結合字的方式則 不以此為限。 、 藉此’本發明之根據輸入關鍵詞產生衍生關鍵詞的資料檢索 系統可以透過使用者輸入的關鍵詞產生衍生關鍵詞,再根據已輪 入關鍵詞跟衍生關鍵詞檢索資料項,可以全面性的檢索出與已輪 201214163 關鍵詞的資料項,提高 入關鍵詞具有—定«性但不包含已輸入 檢索結果資料的完整性。 接下來叫參考第2圖」,為根據輸入關鍵詞產生衍 =的二料檢索方法的流程圖,將搭配—應用有本發明的英漢雙向 弘子3典的雜資料項檢索過程作為實_來說明本發明的詳細 實施方式。 ' 首先’請同時參考「第3圖」,系統起始運作前預先建立儲存 有至少一筆資料獅龍庫則(步驟2⑴)。於本實施例中,資料 庫301巾將預先儲存有至少一筆詞彙資料項,其中各詞囊資料項 當中至少包含詞彙解釋、詞彙例句、詞彙用法、同義詞、反義詞、 形似詞...等與詞彙相關的資料内容。接著,預先建立儲存有至少 一關鍵詞的詞庫302(步驟202)。與資料庫301不同的是,詞庫3〇2 當中存放_鍵詞是作為檢索詞彙資料項的依據,各關鍵詞對應 有至少一個索引,這些索引是依據關鍵詞的詞性及詞義分類建立 的。舉例來說’假設有一關鍵詞為“連線”,則其所預先建立的 索引可以是“名詞”或“動詞”等詞性,以及“網路”、“通 訊、“拓蹲”、“幾何”等與“連線,,的詞義相關的詞義分 類。藉由這些索引,可以建立各個關鍵詞之間的關聯性。 接著,接收輸入之查詢字串並根據查詢字串至詞庫比對出至 少一第一關鍵詞303(步驟203),假設比對出的第一關鍵詞是 “apple”、“banana”及“orange”,則系統將至詞庫擷取各第一 關鍵詞對應之至少一索引305並進行比對(步驟204)。比對時,首 先將比對至少一第一關鍵5¾是否存在至少一個相同索弓丨(步驟 205)。假設“apple”、“banana”及“orange”同樣具有相同索引 201214163 “1”,則此時系統將至詞庫#|取出具有相同索引“触,,的至 Γ關鍵詞3〇6,如:“—,,、“卿〜W,… 301 關鍵°司303及所有第二關鍵詞306擷取資料庫 301之-貝料項(步驟2〇6a)。 之門::二時「第4圖」’若使用者已輸入的第-關鍵詞401 =不,有相同索引,例如:第—關鍵字為“。咖,、“_” 則此:對至少一索引初後假設皆不具有相同索引時, == 聯性演算法取得至少—第三關鍵詞綱並以所 1及所有第三關鍵詞姻掏取資料庫之資料項(步 朗岐,文字_性演算法可以是最長制連續字串 :鍵二併演算法。最長共同連續字串演算法指的是將多 擷取出來,並配合一個萬用字元如“*,,形成“*tain”, 1至詞庫中擷取出“retain”、“_η” ..等、 關鍵詞404。 币一 =字關難演算法也可以是文字合併料法,即依據語言的 -口規驗乡侧賴組合為至少—個結 否存在該結合字,若存在則以該結合字作 舉例^說’假設制者輸人岐“breakfast”和“luneh”,則根 據文子合併演算法可結合出“breakfastlunch” 、》bmneh” 、 “breakhneh .·.等至少___個結合字,由於至纟轉巾比對僅存在 brunch這個關鍵詞,此時則以“bmnch”這個結合字作為 關鍵詞。 201214163 當系統根據第一關鍵詞及第二關鍵詞或是根據第一關鍵詞及 第三關鍵詞將資料确取出來後,再顯示#|取的資料項(步驟 207)。 綜上所述’可知本發明與先前技術之間的差異在於具有根據 輸入之查詢字串至詞庫崎出至少_關鍵詞,並根據至少一關鍵 5习產生衍生關鍵詞,並以已輸入關鍵詞及衍生關鍵詞同步檢索資 料項之技術手段’藉由此—麟手段可靖決先紐術所存在的 問題,進而達成提高資料檢纽果的資料完整性之技術功效。
雖然本發明所揭露之實施方式如上,惟所述之内容並非用以 直接限林發明之專梅護翻。任何本發明所屬技術領域中具 有通常知識者’在不麟本㈣賴露讀神和範圍的前提下, 可以在實施的形式上及細節上作些許之更動。本發明之專利保護 範圍,仍須以所附之申請專利範圍所界定者為準。 【圖式簡單說明】 詞產生衍生關鍵詞的資料檢索 第1圖為本發明根據輸入關鍵 糸統之方塊圖。 第2圖為本發_據輸人_詞產生触關_ 檢 方法之流程圖。 、 么第3圖為本發明實施例以具相同索引的關鍵詞檢索資料之示 ί 圖。 ’、 第4圖為本發明實施例不具相同索引時檢索資料之示意圖。 【主要元件符號說明】 ~ 1〇1 資料庫 102 詞庫 1〇3 接收模組 201214163 104 比對擷取模組 105 顯示模組 301 資料庫 302 詞庫 303 第一關鍵詞 304 關鍵詞與索引對應示音 305 索引 306 第二關鍵詞 401 第一關鍵詞
402 關鍵詞與索引對應示意 403 索引 404 第三關鍵詞 步驟201 予頁先建立儲存有至少-筆資料項的資料庫 步驟202 預先建立儲存有至少一關鍵詞的詞庫 步驟203 接收輸入之查詢字串並根據查詢字串至詞庫 比對出至少一第一關鍵詞 步驟204 至詞庫擷取各第一關鍵詞對應之至少一索引 並進行比對 步驟205 該至少一第一關鍵詞是否存在至少一個相同 索引 步驟206a至詞庫擷取出具有相同索引的至少一第二關鍵 列並以所有第一關鍵詞及所有第二關鍵詞擷取資料庫之資料項 '步驟2%b根據文字關聯性演算法取得至少一第三關鍵詞 並以所有第一關鍵詞及所有第三關鍵詞擷取資料庫之資料項 步驟2〇7 顯示擷取的資料項 12

Claims (1)

  1. 201214163 七、申請專利範圍: 1. -種根據輸人關鍵產生衍生_詞的資料檢索系統,其包 一資料庫,預先儲存有至少一筆資料項; 一詞庫,預先儲存有至少—_詞,其巾各該_詞 應有至少一索引; 一接收模組,用以接收輸入之一查詢字串; 一比對擷取池,用以於該接收模組接收到該查詢字串後 根據該查詢字串至該詞庫中比對出至少—第—關鍵詞,並至該 詞賴取各該第-關鍵詞對應的該至少一索引並進行比對,其 虽5亥至少一第一關鍵詞存在有至少一個相同的索引 時’至該詞軸取出具有該索引的至少-第二關鍵詞,並 以該至少一第一關鍵詞及該至少一第二關鍵詞擷取該資 料庫之資料項;及 • /该至少一第一關鍵詞不存在有相同索引時,根據一 2關聯性演算法取得至少―第三隨詞,並以該至少一 .胃鍵3及„彡至少—第三關鍵詞擷取該資料庫之資料 ^ 、用以顯示擷取之該些資料項。 1 =述之根據輸人關綱產生衍生關: 性及詞義分類。、、 至少—索5丨係為各該關鍵詞之: 3.如申請專利1_ 1項所叙根錄人I細產生衍生_ 13 201214163 3的資料檢索祕’其中該文字關聯性演算法係為_最長共 同連續字串演算法或一文字合併演算法。 4. =申料概目帛3顧述之娜輸人關綱纽衍生關鍵 -司的貝料檢索祕’其巾該當該文相聯性演算法係為最長 共同連續字串演算法時,該比對擁取模組更包含以演算出之 最長共同連續字串結合至少_萬用字元至該詞賴取出該至 少一第三關鍵詞。
    5. 如申:專利範圍第3項所述之根據輸入關鍵詞產生衍生關鍵 祠6^料檢索系統,其中當該文字關聯性演算法為該文字合 併演算法時,該比觸取触更包含以演算出龜少一结^ 字作為第三關鍵詞。 ''°σ 6· -種根據輸人關鍵詞產生衍生關鍵觸資料檢索方法,复勺 含下列步驟: 匕 預先建立儲存有至少一筆資料項的一資料庫,· 預先建立儲存有至少一關鍵詞的一詞庫,其中各 更對應有至少一索引; 接收輸人之-查解串並根據該錢字串至 出至少一第一關鍵詞; 車比對 至該詞庫她各邮-關_對朗駐少 比對,其中: 進仃 當該至少—第—關鍵詞存在有至少—個相同 時,至該詞庫掏取出具有該索引的至少一第二關鍵詞,、並 以該至少-第—_詞及該至少—第二關鍵觸取 料庫之資料項;及 貝 201214163 當該至少-第-關鍵詞不存在有相同索引時,根據— 文字關聯性法取得至少H鍵詞,並以該至少— 第一關鍵詞及該至少1三_满取該資料庫之資料 項;及 、 顯示操取之該些資料項。 利範圍第6項所述之根據輸 °刁的-貝料檢索方法,其中該至少一帝李 性及詞義分類。 纟引係為各_鍵同之詞 8. 9· ㈣6斯叙崎以隨職生衍生關鍵 的讀檢索方法,其中該文字關聯性演算法係為_最長共 同連績字串演算法或一文字合併演算法。 /、 =續子串縣法時’該方法更包含以演算出〜取焚 焉予串結合至少-萬用字元至該詞庫擷取出該至少一 鍵詞。 1〇·如申請專利範圍第8項所述之根據輸入關鍵詞產生衍生 ^資料齡方法,其中當該文字_性演算法為 、算法時,财法更包細轉出的 二 三關鍵詞。 〃…予作為第 ==圍第8項所述之根據輸入關鍵詞產生衍生關鍵 间法丄其+當奴字關性料法係為最長共 之最長共同連 第三關 關鍵
TW099131998A 2010-09-21 2010-09-21 Searching system and method thereof with generating extending keywords according to input keywords TW201214163A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW099131998A TW201214163A (en) 2010-09-21 2010-09-21 Searching system and method thereof with generating extending keywords according to input keywords
US12/928,594 US20120072443A1 (en) 2010-09-21 2010-12-14 Data searching system and method for generating derivative keywords according to input keywords

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW099131998A TW201214163A (en) 2010-09-21 2010-09-21 Searching system and method thereof with generating extending keywords according to input keywords

Publications (1)

Publication Number Publication Date
TW201214163A true TW201214163A (en) 2012-04-01

Family

ID=45818668

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099131998A TW201214163A (en) 2010-09-21 2010-09-21 Searching system and method thereof with generating extending keywords according to input keywords

Country Status (2)

Country Link
US (1) US20120072443A1 (zh)
TW (1) TW201214163A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI570578B (zh) * 2012-12-19 2017-02-11 英業達股份有限公司 中文詞句的詞彙查詢系統及其方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126588B (zh) * 2016-06-17 2019-09-20 广州视源电子科技股份有限公司 提供相关词的方法和装置
CN107885717B (zh) * 2016-09-30 2020-12-29 腾讯科技(深圳)有限公司 一种关键词提取方法及装置
CN107748784B (zh) * 2017-10-26 2021-05-25 江苏赛睿信息科技股份有限公司 一种通过自然语言实现结构化数据搜索的方法
CN111291171B (zh) * 2020-01-21 2023-05-16 南方电网能源发展研究院有限责任公司 一种危大工程风险数据搜索方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60159970A (ja) * 1984-01-30 1985-08-21 Hitachi Ltd 情報蓄積検索方式
US20030171926A1 (en) * 2002-03-07 2003-09-11 Narasimha Suresh System for information storage, retrieval and voice based content search and methods thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI570578B (zh) * 2012-12-19 2017-02-11 英業達股份有限公司 中文詞句的詞彙查詢系統及其方法

Also Published As

Publication number Publication date
US20120072443A1 (en) 2012-03-22

Similar Documents

Publication Publication Date Title
CN107993724B (zh) 一种医学智能问答数据处理的方法及装置
US9875309B2 (en) Topical search system
Sun et al. Table cell search for question answering
CN104484411B (zh) 一种基于词典的语义知识库的构建方法
US20130166303A1 (en) Accessing media data using metadata repository
TW201214163A (en) Searching system and method thereof with generating extending keywords according to input keywords
Chen et al. NeuralLog: Natural language inference with joint neural and logical reasoning
CN105551485B (zh) 语音文件检索方法及系统
JP2017509049A (ja) 検索結果におけるコヒーレントな質問回答
WO2011028636A4 (en) Systems and methods for visual messaging
CN106776564A (zh) 一种基于知识图谱的语义识别方法及系统
CN110083696A (zh) 基于元结构技术的全局引文推荐方法、推荐系统
WO2014040521A1 (zh) 搜索方法、系统及存储介质
Ramakrishna et al. A quantitative analysis of gender differences in movies using psycholinguistic normatives
Tiwari et al. Ensemble approach for twitter sentiment analysis
CN105069647A (zh) 一种改进的抽取中文商品评论中评价对象的方法
CN103336803B (zh) 一种嵌名春联的计算机生成方法
KR20120042562A (ko) 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치
Taneva et al. Gem-based entity-knowledge maintenance
CN106874294A (zh) 一种信息匹配方法及装置
Zhao et al. Exploiting structured reference data for unsupervised text segmentation with conditional random fields
Thangarasu et al. Design and development of stemmer for Tamil language: cluster analysis
Er et al. Set of t-uples expansion by example
TWI636370B (zh) Establishing chart indexing method and computer program product by text information
Zhang et al. ARL2: Aligning Retrievers for Black-box Large Language Models via Self-guided Adaptive Relevance Labeling