TWI728611B - 結合查詢關鍵字擴展技術之花語查詢系統 - Google Patents
結合查詢關鍵字擴展技術之花語查詢系統 Download PDFInfo
- Publication number
- TWI728611B TWI728611B TW108147056A TW108147056A TWI728611B TW I728611 B TWI728611 B TW I728611B TW 108147056 A TW108147056 A TW 108147056A TW 108147056 A TW108147056 A TW 108147056A TW I728611 B TWI728611 B TW I728611B
- Authority
- TW
- Taiwan
- Prior art keywords
- query
- words
- flower
- flower language
- language
- Prior art date
Links
Images
Abstract
一種結合查詢關鍵字擴展技術之花語查詢系統,將使用者要查詢之關鍵字或點選之查詢字眼,以關鍵字擴展技術進行字詞之擴展,以更正確地找到使用者想查詢之同義花語及該規避的反義花語。
Description
本發明是有關於一種查詢系統,特別是有關於一種結合查詢關鍵字擴展技術之花語查詢系統。
一般傳統花語查詢功能主要有固定選項查詢(如下拉式選單、選項點選或是分類連結)與關鍵字查詢(精確比對與模糊比對)兩種。然而,傳統固定選項讓使用者點選的方式,會侷限使用者的查詢方向或誤導使用者的查詢,而使查詢成效大打折扣。而且,傳統關鍵字查詢的方式,會因為使用者對於要查詢的標的花語該用什麼關鍵字往往也是相當模糊與不確定,致使查詢成效也是不甚良好。此外,在使用者查詢時,除了所點選項與所下關鍵字外之結果外,其它可能同義或共現的正向與負向結果,在傳統方式也較難達成。再者,相同花在不同情境、國家或文化下,可能所代表的花語意涵也會非常迥異,應該也要完整呈現給使用者,這也是在傳統方式上所缺乏的。
有鑑於此,本發明之一目的就是在提供一種結合查詢關鍵字擴展技術之花語查詢系統,以解決上述習知技藝之問題。
為達前述目的,本發明提出一種結合查詢關鍵字擴展技術之花語查詢系統至少包含原始查詢模組、字詞萃取模組、字詞分析模組及正反意涵花語建議模組。原始查詢模組具有多元需求查詢介面,用以經由輸入一個或多個花語關鍵字進行資訊檢索而產生依序排列之複數個初步查詢結果。字詞萃取模組係利用TF-IDF(Term Frequency-Inverse Document Frequency)公式分析該些初步查詢結果中的前複數個初步查詢結果,藉以擷取出複數個相關共現字詞。字詞分析模組係將該花語關鍵字、該些共現字詞以及該花語關鍵字與該些共現字詞之同義詞及反義詞,利用Word2Vec模型找出與其語意近似之複數個正向字詞及複數個反向字詞。正反意涵花語建議模組係以該些正向字詞及反向字詞中的複數個重新進行資訊檢索進而產生出推薦之花語與花以及需規避之花語與花。
其中,該原始查詢模組係分析該花語關鍵字與該些初步查詢結果之相似度,且依據該相似度進行排序。
其中,該字詞萃取模組係以TF-IDF(Term Frequency-Inverse Document Frequency)公式分析該些初步查詢結果,藉以擷取出該些相關共現字詞。
其中,該字詞分析模組進一步將該花語關鍵字、該些共現字詞以及該花語關鍵字與該些共現字詞之同義詞及反義詞分別存入一正向詞庫及一反向詞庫中。
其中,該字詞分析模組係進一步利用Word2Vec模型分析該些正向字詞及該些反向字詞之語意相關強度以排序。
其中,該多元需求查詢介面之多元需求係選自於對象、節日、國別、文化、情境及種族等所組成之族群。
其中,該多元需求查詢介面之該多元需求查詢欄位係以系統性映射方法(Systematic Mapping Method)獲得。
其中,該多元需求查詢介面係經由輸入式欄位或固定式選單以輸入該花語關鍵字。
其中,該正反意涵花語建議模組係以該些正向字詞庫及反向字詞庫中排序較前面的該些正向字詞及該些反向字詞分別重新進行資訊檢索進而分別整合出正向結果及反向結果,藉以產生該推薦之花語與花以及該需規避之花語與花。
其中,該推薦之花語係同義於該花語關鍵字,該需規避之花語與花係反義於該花語關鍵字。
綜上所述,本發明之結合查詢關鍵字擴展技術之花語查詢系統具有以下技術功效:
(1)藉由將使用者要查詢之關鍵字或點選之查詢字眼,以關鍵字擴展技術進行字詞之擴展,以更正確地找到使用者想查詢之同義花語及反義花語。
(2)需求不明確之查詢的輔助:透過字詞的擴展,讓原本查詢需求不明確的使用者,根據其所下關鍵字之花語查詢結果中的共現字詞來再次擴展其查詢詞庫,以更精煉其查詢結果。
(3)關鍵字相關同義之花語的擴展:透過關鍵字之同義詞,可以有效擴展相關花語之查詢,以增加花語查詢之正確性與多樣性。
(4)關鍵字相關反義之花語的規避:透過關鍵字及其同義詞之反義詞,可以有效規避跟使用者所要查詢結果之反向花語,以減少誤送之可能性。
(5)嶄新多元需求查詢:提供使用者多元需求資訊(情境、文化、種族、國別、贈送對象與節日等)之查詢介面,完整蒐尋在此需求下的各種花語意涵,以提供更符合需求的花語查詢結果。
茲為使鈞審對本發明的技術特徵及所能達到的技術功效有更進一步的瞭解與認識,謹佐以較佳的實施例及配合詳細的說明如後。
10:原始查詢模組
20:字詞萃取模組
30:原始查詢模組
40:正反意涵花語建議模組
圖1為本創作之結合查詢關鍵字擴展技術之花語查詢系統之示意圖。
為利瞭解本創作之技術特徵、內容與優點及其所能達成之功效,茲將本創作配合圖式,並以實施例之表達形式詳細說明如下,而其中所使用之圖式,其主旨僅為示意及輔助說明書之用,未必為本創作實施後之真實比例與精準配置,故不應就所附之圖式的比例與配置關係解讀、侷限本創作於實際實施上的權利範圍。此外,為使便於理解,下述實施例中的相同元件係以相同的符號標示來說明。
本創作之結合查詢關鍵字擴展技術之花語查詢系統,將使用者要查詢之關鍵字或點選之查詢字眼(關鍵字),以關鍵字擴展技術進行字詞之擴展,以更正確地找到使用者想查詢之同義花語及該規避的反義花語。
簡言之,本創作透過系統性映射方法(Systematic Mapping Method)整理出文獻中關鍵的花語查詢需求欄位,以便提供更多元且完整的查詢介面。本創作之花語查詢系統依據此多元且完整的需求資訊產生初步查詢結果,並擷取前K個高度相關之查詢結果作為後續共現字詞分析之基礎。然後,根據先前初步查詢結果之前K個相關結果之字詞以TF-IDF(Term Frequency-Inverse Document Frequency)公式加以分析,挑選出重要程度較高之相關字詞,K之數值可依據所需精確性而改變。之後,將使用者所輸入多元需求字詞、之前找到的相關共現字詞,以及根據詞典中這些字詞所定義之同義詞與反義詞,利用Word2Vec模型找出與其語意相似度高之字詞集,再分別存入正向詞庫與反向詞庫中。最後,利用前面K個正向字詞與反向字詞分別進行再次資訊檢索,並將高度相關知正向與反向結果各別整合,進而產生出推薦之花語與花,以及需規避之花語與花。
詳言之,請參閱圖1,圖1為本創作之結合查詢關鍵字擴展技術之花語查詢系統之示意圖。本創作之結合查詢關鍵字擴展技術之花語查詢系統至少包含原始查詢模組10、字詞萃取模組20、字詞分析模組30及正反意涵花語建議模組40。此結合查詢關鍵字擴展技術之花語查詢系統之構件及其運作方法如下所述。
本創作之原始查詢模組10例如為具有多元需求查詢介面。多元需求查詢介面係例如為具有輸入式欄位或固定式選單(如下拉式選單、選項點選或是分類連結),藉以供使用者輸入花語關鍵字。此花語關鍵字之數量可為一個或多個。詳言之,原始查詢模組10係以使用者所輸入之花語關鍵字進行資訊檢索而產生依序排列之複數個初步查詢結果。原始查詢模組10依據使用者所輸入的
原始查詢字詞,即花語關鍵字,計算其與查詢結果(文件)之相似度,並依照相似度高低排序,產生上述依序排列之初步查詢結果給使用者。上述之相似度計算係例如,但不限於,使用Word2Vec模型。其中,多元需求查詢介面12之多元需求係例如,但不限於,選自於對象、節日、國別、文化、情境及種族等所組成之族群。上述之資訊檢索係例如,但不限於,檢索GOOGLE網路或國家圖書館等文獻資料庫。本創作係透過系統性映射方法(Systematic Mapping Method)整理出文獻中關鍵的花語查詢需求欄位(即,多元需求查詢欄位),以便提供更多元且完整的查詢介面,藉由提供使用者多元需求資訊(情境、文化、種族、國別、贈送對象與節日等)之查詢介面,完整蒐尋在此需求下的各種花語意涵,以提供更符合需求的花語查詢結果。
本創作之字詞萃取模組20係用以分析上述所得的初步查詢結果中排序較前面的複數個初步查詢結果,藉以擷取出複數個相關共現字詞。換言之,本創作之字詞萃取模組20係分析前述幾篇相似度較高的初步查詢結果。其中,字詞萃取模組20所分析之初步查詢結果之數量可依據實際需求而訂定。舉例來說,原始查詢模組10經由輸入花語關鍵字所得之初步查詢結果例如為100篇,字詞萃取模組20所分析之初步查詢結果之數量約佔全部初步查詢結果的100%至10%之間,即例如100篇~10篇,惟上述數值僅為舉例,並非用以限定本創作之範圍。此外,字詞萃取模組20係例如以TF-IDF(Term Frequency-Inverse Document Frequency)公式分析上述初步查詢結果中的該些初步查詢結果,藉以擷取出上述之複數個相關共現字詞。
本創作之字詞分析模組30係用以將使用者輸入之花語關鍵字、字詞萃取模組20所擷取出的共現字詞以及上述花語關鍵字與共現字詞之同義詞及
反義詞,例如利用Word2Vec模型找出與其語意近似之複數個正向字詞及複數個反向字詞。此外,字詞分析模組30例如進一步將所找出的正向字詞及反向字詞存入正向詞庫及反向詞庫中。或者,本創作之字詞分析模組30亦可先將使用者輸入之花語關鍵字、字詞萃取模組20所擷取出的共現字詞以及上述花語關鍵字與共現字詞之同義詞及反義詞分別存入正向詞庫及反向詞庫中,然後再利用Word2Vec模型從正向詞庫及反向詞庫中找出與其語意近似之複數個正向字詞及複數個反向字詞。除此之外,字詞分析模組30可例如進一步以正規化google距離分析語意關係強度,藉以分析這些正向字詞及這些反向字詞與使用者輸入之花語關鍵字之間的語意相關強度(相似度)以排序,或者,字詞分析模組30可例如進一步分析這些正向字詞及這些反向字詞與使用者輸入之花語關鍵字及詞萃取模組20所擷取出的共現字詞之間的語意相關強度,藉以依據此相關強度進行正向字詞及反向字詞之排序,再存入正向詞庫及反向詞庫中。在另一實施態樣中,本創作還可例如僅將數個語意相關強度較強的正向字詞及反向字詞存入正向詞庫及反向詞庫。舉例來說,字詞分析模組30利用Word2Vec模型所找出之正向字詞及反向字詞例如分別為10個,則萃取模組20所存入正向詞庫及反向詞庫之正向字詞及反向字詞約佔全部正向字詞及反向字詞的100%~10%,即例如為10個~1個,惟上述數值僅為舉例,並非用以限定本創作之範圍。
本創作之正反意涵花語建議模組40係以正向詞庫及反向詞庫中的正向字詞及反向字詞重新進行資訊檢索進而產生出推薦之花語與花以及需規避之花語與花。舉例而言,正反意涵花語建議模組40係例如以正向詞庫及反向詞庫中排序較前面的正向字詞及反向字詞分別重新進行資訊檢索進而分別整合出正向結果及反向結果,藉由區分區分同義與反義兩種不同的查詢結果,以分
別產生上述推薦之花語與花以及需規避之花語與花。其中,推薦之花語係同義於使用者所輸入之花語關鍵字,需規避之花語與花係反義於使用者所輸入之花語關鍵字。
在又一實施態樣中,本創作之結合查詢關鍵字擴展技術之花語查詢系統可例如建置於電腦上,且此電腦例如,但不限於,具有電腦主機、電腦螢幕及輸入元件等。其中,此電腦可為桌上型或筆記型電腦。藉此,使用者可經由操作電腦以進行花語查詢。
綜上所述,本發明之結合查詢關鍵字擴展技術之花語查詢系統具有以下技術功效:
(1)藉由將使用者要查詢之關鍵字或點選之查詢字眼,以關鍵字擴展技術進行字詞之擴展,以更正確地找到使用者想查詢之同義花語及反義花語。
(2)需求不明確之查詢的輔助:透過字詞的擴展,讓原本查詢需求不明確的使用者,根據其所下關鍵字之花語查詢結果中的共現字詞來再次擴展其查詢詞庫,以更精煉其查詢結果。
(3)關鍵字相關同義之花語的擴展:透過關鍵字之同義詞,可以有效擴展相關花語之查詢,以增加花語查詢之正確性與多樣性。
(4)關鍵字相關反義之花語的規避:透過關鍵字及其同義詞之反義詞,可以有效規避跟使用者所要查詢結果之反向花語,以減少誤送之可能性。
(5)嶄新多元需求查詢:提供使用者多元需求資訊(情境、文化、種族、國別、贈送對象與節日等)之查詢介面,完整蒐尋在此需求下的各種花語意涵,以提供更符合需求的花語查詢結果。
以上所述僅為舉例性,而非為限制性者。任何未脫離本發明之精神與範疇,而對其進行之等效修改或變更,均應包含於後附之申請專利範圍中。
10:原始查詢模組
20:字詞萃取模組
30:字詞分析模組
40:正反意涵花語建議模組
Claims (8)
- 一種結合查詢關鍵字擴展技術之花語查詢系統,至少包含:一原始查詢模組,具有多元需求查詢介面,用以經由輸入一或複數個花語關鍵字進行資訊檢索而產生依序排列之複數個初步查詢結果,其中該多元需求查詢介面之多元需求係選自於對象、節日、國別、文化、情境及種族所組成之族群;一字詞萃取模組,分析該些初步查詢結果中的前複數個初步查詢結果,藉以擷取出相關於該花語關鍵字之複數個共現字詞;一字詞分析模組,將該花語關鍵字、該些共現字詞以及該花語關鍵字與該些共現字詞之同義詞及反義詞,利用Word2Vec模型找出與其語意近似之複數個正向字詞及複數個反向字詞,其中該字詞分析模組係進一步分析該些正向字詞及該些反向字詞之語意相關強度以排序;以及一正反意涵花語建議模組,以排序後之該些正向字詞及反向字詞中的複數個重新進行資訊檢索進而分別整合出正向結果及反向結果,藉以產生出推薦之花語與花以及需規避之花語與花。
- 如申請專利範圍第1項所述之結合查詢關鍵字擴展技術之花語查詢系統,其中該原始查詢模組係分析該花語關鍵字與該些初步查詢結果之相似度,且依據該相似度進行排序。
- 如申請專利範圍第1項所述之結合查詢關鍵字擴展技術之花語查詢系統,其中該字詞萃取模組係以TF-IDF(Term Frequency-Inverse Document Frequency)公式分析該些初步查詢結果中的該些初步查詢結果,藉以擷取出該些共現字詞。
- 如申請專利範圍第1項所述之結合查詢關鍵字擴展技術之花語查詢系統,其中該字詞分析模組進一步將該花語關鍵字、該些共現字詞以及該花語關鍵字與該些共現字詞之該些同義詞及該些反義詞分別存入一正向詞庫及一反向詞庫中。
- 如申請專利範圍第1項所述之結合查詢關鍵字擴展技術之花語查詢系統,其中該多元需求查詢介面之多元需求查詢欄位係以系統性映射方法(Systematic Mapping Method)獲得。
- 如申請專利範圍第1項所述之結合查詢關鍵字擴展技術之花語查詢系統,其中該多元需求查詢介面係經由輸入式欄位或固定式選單以輸入該花語關鍵字。
- 如申請專利範圍第4項所述之結合查詢關鍵字擴展技術之花語查詢系統,其中該正反意涵花語建議模組係以該些正向字詞庫及反向字詞庫中排序較前面的該些正向字詞及該些反向字詞分別重新進行資訊檢索進而分別整合出正向結果及反向結果,藉以產生該推薦之花語與花以及該需規避之花語與花。
- 一種結合查詢關鍵字擴展技術之花語查詢系統之運作方法,至少包含:利用一多元需求查詢介面經由輸入一花語關鍵字進行資訊檢索而產生依序排列之複數個初步查詢結果,其中該多元需求查詢介面之多元需求係選自於對象、節日、國別、文化、情境及種族所組成之族群;分析該些初步查詢結果中的前複數個初步查詢結果,藉以擷取出複數個共現字詞; 將該花語關鍵字、該些共現字詞以及該花語關鍵字與該些共現字詞之同義詞及反義詞,利用Word2Vec模型找出與其語意近似之複數個正向字詞及複數個反向字詞;分析該些正向字詞及該些反向字詞之語意相關強度以排序;以及以排序後之該些正向字詞及反向字詞中的複數個重新進行資訊檢索進而產生出推薦之花語與花以及需規避之花語與花。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108147056A TWI728611B (zh) | 2019-12-20 | 2019-12-20 | 結合查詢關鍵字擴展技術之花語查詢系統 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108147056A TWI728611B (zh) | 2019-12-20 | 2019-12-20 | 結合查詢關鍵字擴展技術之花語查詢系統 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI728611B true TWI728611B (zh) | 2021-05-21 |
TW202125308A TW202125308A (zh) | 2021-07-01 |
Family
ID=77036248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW108147056A TWI728611B (zh) | 2019-12-20 | 2019-12-20 | 結合查詢關鍵字擴展技術之花語查詢系統 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI728611B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103838735A (zh) * | 2012-11-21 | 2014-06-04 | 大连灵动科技发展有限公司 | 一种提高检索效率和质量的数据检索方法 |
CN107943919A (zh) * | 2017-11-21 | 2018-04-20 | 华中科技大学 | 一种面向会话式实体搜索的查询扩展方法 |
CN108712366A (zh) * | 2018-03-27 | 2018-10-26 | 西安电子科技大学 | 云环境中支持词形词义模糊检索的可搜索加密方法及系统 |
-
2019
- 2019-12-20 TW TW108147056A patent/TWI728611B/zh active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103838735A (zh) * | 2012-11-21 | 2014-06-04 | 大连灵动科技发展有限公司 | 一种提高检索效率和质量的数据检索方法 |
CN107943919A (zh) * | 2017-11-21 | 2018-04-20 | 华中科技大学 | 一种面向会话式实体搜索的查询扩展方法 |
CN108712366A (zh) * | 2018-03-27 | 2018-10-26 | 西安电子科技大学 | 云环境中支持词形词义模糊检索的可搜索加密方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
TW202125308A (zh) | 2021-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107993724B (zh) | 一种医学智能问答数据处理的方法及装置 | |
CN108763333B (zh) | 一种基于社会媒体的事件图谱构建方法 | |
US10140333B2 (en) | Trusted query system and method | |
Balakrishnan et al. | Applying webtables in practice | |
CN105493075B (zh) | 基于所标识的实体的属性值检索 | |
US20160041986A1 (en) | Smart Search Engine | |
US10552467B2 (en) | System and method for language sensitive contextual searching | |
US20080195601A1 (en) | Method For Information Retrieval | |
US20090327223A1 (en) | Query-driven web portals | |
WO2005096179A1 (en) | Information retrieval | |
Sharma et al. | Semantic approaches for query expansion | |
US8082240B2 (en) | System for retrieving information units | |
Bordawekar et al. | Enabling cognitive intelligence queries in relational databases using low-dimensional word embeddings | |
Farhan et al. | Survey of automatic query expansion for Arabic text retrieval | |
JP2001184358A (ja) | カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体 | |
TWI728611B (zh) | 結合查詢關鍵字擴展技術之花語查詢系統 | |
JP5269399B2 (ja) | 構造化文書検索装置、方法およびプログラム | |
TWI595371B (zh) | 法學資料搜尋系統、搜尋處理方法及電腦可讀取紀錄媒體 | |
Tian et al. | Hyponym extraction from the web by bootstrapping | |
Reddy et al. | Cross lingual information retrieval using search engine and data mining | |
Thannaing et al. | Improving information retrieval based on query classification algorithm | |
Deng et al. | An Introduction to Query Understanding | |
TWI221992B (en) | Information search method of patent literature | |
Dasari et al. | Single document text summarization by Knowledge-Corpus | |
CN113626643A (zh) | 基于本体的工程数据关键字检索方法 |