TWM604414U - 知識圖譜聯想搜尋伺服器與其系統 - Google Patents

知識圖譜聯想搜尋伺服器與其系統 Download PDF

Info

Publication number
TWM604414U
TWM604414U TW109203783U TW109203783U TWM604414U TW M604414 U TWM604414 U TW M604414U TW 109203783 U TW109203783 U TW 109203783U TW 109203783 U TW109203783 U TW 109203783U TW M604414 U TWM604414 U TW M604414U
Authority
TW
Taiwan
Prior art keywords
article
item
knowledge graph
database
search server
Prior art date
Application number
TW109203783U
Other languages
English (en)
Inventor
廖偉盛
黃嫈倫
黃鈺琪
許郁婷
Original Assignee
股感生活金融科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 股感生活金融科技股份有限公司 filed Critical 股感生活金融科技股份有限公司
Priority to TW109203783U priority Critical patent/TWM604414U/zh
Publication of TWM604414U publication Critical patent/TWM604414U/zh

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一種知識圖譜聯想搜尋系統,其包括知識圖譜聯想搜尋伺服器與用戶裝置。所述知識圖譜聯想搜尋伺服器用於:接收來自於使用者之用戶裝置的輸入資訊;獲取文章/關聯項目/分數資料庫,其中所述文章/關聯項目/分數資料庫記錄有文章資料庫之多篇文章的文章識別、關聯項目與項目名稱;於所述文章/關聯項目/分數資料庫中進行搜尋,以獲得對應於所述輸入資訊的至少一個文章識別之關聯項目與項目名稱;以及根據搜尋得到之對應於所述輸入資訊的至少一個文章識別之關聯項目與項目名稱產生知識圖譜,以作為搜尋結果的至少一部分。

Description

知識圖譜聯想搜尋伺服器與其系統
本新型是有關於一種可以根據輸入資訊產生搜尋結果的聯想搜尋伺服器與其系統,且特別是一種搜尋結果以知識圖譜呈現的知識圖譜聯想搜尋伺服器與其系統。
知識圖譜為一種以圖式表示的數據結構,其具有多個節點與連接線,其中節點之間透過連接線連接,且彼此連接之節點中的字詞會具有聯想關係。知識圖譜的拓樸可以為樹狀,第一層節點的字詞為根節點之字詞的聯想字詞,且第二層節點的字詞為第一層節點之字詞的聯想字詞,其他層節點的字詞關係,則依此類推。透過知識圖譜的呈現,使用者可以了解各字詞的聯想關係。
現有搜尋系統可以根據使用者輸入的關鍵字或圖片來搜尋相關的網頁、文件或多媒體檔案。然而,對於要學習知識的使用者來說,透過現有搜尋系統查找出來搜尋結果可能無法有效地幫助使用者進行學習,且對於沒有相關背景知識的使用者來說,因為不知道關鍵字對應的其他聯想字詞,故不易達到有效與快速學習的目的。舉例來說,對於沒有投資過股票的使用者來說,若單純地透過搜尋系統搜尋「股票」,則因為使用者不知「股票」的其他聯想字詞(例如,上市、上櫃、績優股與股利等字詞),故不易有效與快速地學習股票投資知識。
本新型實施例提供一種搜尋結果以知識圖譜呈現的聯想搜尋方法與系統。所述聯想搜尋方法與系統可以根據使用者的輸入資訊,例如關鍵字、會員識別(member identification)或主題名稱(但輸入資訊不以此為限制),繪出以輸入資訊為根節點之知識圖譜作為搜尋結果的至少其中一部分。透過知識圖譜,使用者可以知悉由其輸入資訊聯想到的字詞,並藉此閱讀聯想字詞的文章,以快速且有效地學習輸入資訊所對應之知識。
基於本新型要達到的目的與要解決的技術問題的其中一者,本新型實施例提供一種知識圖譜聯想搜尋伺服器,其包括:處理單元、電性連接所述處理單元的記憶體、電性連接所述處理單元的輸入輸出介面單元與電性連接所述處理單元的儲存單元,以使所述知識圖譜聯想搜尋伺服器接收來自於使用者之用戶裝置的輸入資訊,並獲取文章/關聯項目/分數資料庫,其中所述文章/關聯項目/分數資料庫記錄有文章資料庫之多篇文章的文章識別、關聯項目與項目名稱,所述知識圖譜聯想搜尋伺服器更於所述文章/關聯項目/分數資料庫中進行搜尋,以獲得對應於所述輸入資訊的至少一個文章識別之關聯項目與項目名稱,以及所述知識圖譜聯想搜尋伺服器根據搜尋得到之對應於所述輸入資訊的至少一個文章識別之關聯項目與項目名稱產生知識圖譜,以作為搜尋結果的至少一部分。
根據前述技術特徵,於所述文章/關聯項目/分數資料庫中進行搜尋,以獲得對應於所述輸入資訊的多個文章識別之關聯項目與項目名稱,合併多個對應於所述輸入資訊的多個文章識別之關聯項目與項目名稱,並根據合併的所述多個關聯項目與所述多個項目名稱產生所述知識圖譜,以作為所述搜尋結果的至少一部分。
根據前述技術特徵,所述輸入資訊為關鍵字,根據所述關鍵字搜尋所述文章/關聯項目/分數資料庫或非關係型文章資料庫,以獲得對應的至少一個文章識別,並根據對應於所述關鍵字的所述文章識別,於所述文章/關聯項目/分數資料庫中獲得對應於所述關鍵字的至少一個文章識別之關聯項目與項目名稱。
根據前述技術特徵,所述文章/關聯項目/分數資料庫更記錄有對應於每一個文章識別的主題名稱,所述輸入資訊為主題名稱,於所述文章/關聯項目/分數資料庫搜尋對應輸入資訊之主題名稱的至少一個文章識別,並根據對應於所述主題名稱的所述文章識別,於所述文章/關聯項目/分數資料庫中獲得對應於所主題名稱的至少一個文章識別之關聯項目與項目名稱。
根據前述技術特徵,所述輸入資訊為會員識別,根據所述會員識別於會員資料庫搜尋對應的至少一個文章識別,並根據對應於所述會員識別的所述文章識別,於所述文章/關聯項目/分數資料庫中獲得對應於所述會員識別的至少一個文章識別之關聯項目與項目名稱。
根據前述技術特徵,將所述文章資料庫轉換為非關係型文章資料庫,並根據詞庫或項目名稱/關聯項目資料庫對所述非關係型文章資料庫進行文章分析,以獲得所述文章/關聯項目/分數資料庫,其中所述項目名稱/關聯項目資料庫記錄有多個關聯項目與其對應的項目名稱,以及所述詞庫記錄有多個字詞及其對應的關聯項目。
根據前述技術特徵,所述知識圖譜的根節點用於呈現所述輸入資訊,所述根節點底下的第一階聯想字詞與第二階聯想字詞分別用於呈現對應於所述輸入資訊的文章識別之關聯項目與項目名稱。
根據前述技術特徵,所述搜尋結果為會員圖譜,所述會員圖譜呈現所述知識圖譜的根節點與第一階聯想字詞,所述知識圖譜的第二階聯想字詞以直方圖、長條圖、泡泡圖、分布圖、雷達圖或曲線圖呈現。
根據前述技術特徵,若所述關鍵字為特定關鍵字,則於所述文章/關聯項目/分數資料庫獲取對應所述關鍵字的至少一個文章識別,若所述關鍵字非為特定關鍵字,則於所述非關係型文章資料庫獲取對應所述關鍵字的至少一個文章識別。
基於本新型要達到的目的與要解決的技術問題的其中一者,本新型實施例提供一種知識圖譜聯想搜尋系統,其包括:前述知識圖譜聯想搜尋伺服器;以及前述至少一個使用者的用戶裝置。
簡單地說,透過本新型實施例提供之知識圖譜聯想搜尋系統,使用者即使不懂輸入資訊相應的其他聯想字詞,也能透過本新型得知相關聯的聯想字詞,並透過知識圖譜聯想搜尋系統提供的文章資料庫來學習相關知識。如此一來,有利於使用者快速且有效地學習相關知識。
1:知識圖譜聯想搜尋系統
11:知識圖譜聯想搜尋伺服器
12:用戶裝置
13:外部伺服器
2:知識圖譜聯想搜尋伺服器
21:處理單元
22:輸入輸出介面單元
23:儲存單元
231:資料庫單元
24:記憶體
S31~S33、S41~S43、S51~S54、S71~S73、S91~S94、S111~S118、S121~S124、S131~S134:步驟
圖1是本新型實施例的知識圖譜聯想搜尋系統的方塊圖。
圖2是本新型實施例的知識圖譜聯想搜尋伺服器的方塊圖。
圖3是本新型實施例的聯想搜尋方法的流程圖。
圖4是本新型實施例之獲取文章/關聯項目/分數資料庫的流程圖。
圖5是本新型實施例之根據關鍵字產生知識圖譜的流程圖。
圖6是本新型實施例之根據關鍵字產生的知識圖譜的搜尋結果之示意圖。
圖7是本新型實施例之根據主題名稱產生知識圖譜的流程圖。
圖8是本新型實施例之根據主題名稱產生的知識圖譜的搜尋結果之示意圖。
圖9是本新型實施例之根據會員識別產生知識圖譜的流程圖。
圖10是本新型實施例之根據會員識別產生的知識圖譜的搜尋結果之示意圖。
圖11是本新型另一實施例的聯想搜尋方法的流程圖。
圖12是本新型另一實施例之獲取文章/關聯項目/分數資料庫的流程圖。
圖13是本新型又一實施例之獲取文章/關聯項目/分數資料庫的流程圖。
為充分瞭解本新型之目的、特徵及功效,茲藉由下述具體之實施例,並配合所附之圖式,對本新型做一詳細說明,說明如後。
本新型實施例提供一種搜尋結果以知識圖譜呈現的知識圖譜聯想搜尋系統。所述知識圖譜聯想搜尋系統包括至少一個用戶裝置與知識圖譜聯想搜尋伺服器,其中用戶裝置與知識圖譜聯想搜尋伺服器彼此通訊連接,知識圖譜聯想搜尋伺服器可以由硬體電路與軟體來實現,或者全部由硬體電路來實現,用戶裝置可以是智能手機、筆記型電腦、桌上型電腦、平板電腦或上網本,且本新型不以此為限制。
使用者可以透過用戶裝置將輸入資訊送至知識圖譜聯想搜尋伺服器,以讓知識圖譜聯想搜尋伺服器根據輸入資訊繪製出以輸入資訊為根節點之知識圖譜,並將知識圖譜當作搜尋結果的至少一部分,其中輸入資訊可以是關鍵字、主題名稱或會員識別。進一步地說,本新型實施例的知識圖譜聯想搜 尋系統是基於文章/關聯項目/分數資料庫,根據輸入資訊繪製出以輸入資訊為根節點之知識圖譜,其中文章/關聯項目/分數資料庫記錄有對應於文章資料庫之文章的文章識別、關聯項目、項目名稱與項目分數,且較佳地更可以具有主題類型、主題名稱與主題分數。
由於輸入資訊關聯的第一階聯想字詞可能會非常的多,因此,設計上將第一階聯想字詞限定為基於文章/關聯項目/分數資料庫中的關聯項目,且相關知識對應的文章亦存在文章資料庫中,以讓使用者可以透過知識圖譜閱讀相關文章,達到快速且有效學習知識的目的。文章/關聯項目/分數資料庫中的關聯項目為採用知識圖譜聯想搜尋系統的營運業者所定義者,其通常與希望讓使用者學到的知識相關聯。舉例來說,若希望使用者透過其知識圖譜聯想搜尋系統學習相關投資知識,則關聯項目可以被預設為「書籍」、「大師名人」、「公司股票」、「產業產品」、「投資知識」與「商業策略」。再舉一例來說,若希望使用者透過其知識圖譜聯想搜尋系統學習相關防疫知識,則關聯項目可以被預設為「防疫用品」、「居家隔離」與「檢疫」。
第二階聯想字詞則是文章/關聯項目/分數資料庫中之關聯項目下項目名稱,項目名稱的部分則是透過文章分析方式來獲取,例如使用詞庫或項目名稱/關聯項目資料庫來對非關係型文章資料庫(如,Elastic Search(ES)文章資料庫)進行映射處理。再者,由於第一階聯想字詞對應的第二階聯想字詞(亦即,於文章/關聯項目/分數資料庫搜尋到的項目名稱)可能數量也會不少,因此文章/關聯項目/分數資料庫中的項目分數可以作為是否列入於知識圖譜中的評斷基準。舉例來說,基於輸入資訊對應的某一個第一階聯想字詞對應的第二階聯想字詞於文章/關聯項目/分數資料庫中共有15個,則可以統計此15個第二階聯想字詞的項目分數,並取統計之項目分數較高的5個第二階聯想字詞列入於 知識圖譜中。另外,基於上述的知識圖譜聯想搜尋系統,本新型實施例提供了對應的聯想搜尋方法。
於說明完本新型實施例之知識圖譜聯想搜尋系統與方法的新型概念後,接著,進一步地說明本新型實施例之知識圖譜聯想搜尋系統與方法的細節。首先,請參照圖1,圖1是本新型實施例的知識圖譜聯想搜尋系統的方塊圖。知識圖譜聯想搜尋系統1包括知識圖譜聯想搜尋伺服器11與至少一個用戶裝置12,其中知識圖譜聯想搜尋伺服器11通訊連接用戶裝置12,且更可以通訊連接外部伺服器13。知識圖譜聯想搜尋伺服器11可以由硬體電路與軟體來實現,或者全部由硬體電路來實現,用戶裝置12可以是智能手機、筆記型電腦、桌上型電腦、平板電腦或上網本,且本新型不以此為限制。
知識圖譜聯想搜尋伺服器11接收用戶裝置12的輸入資訊,並且根據輸入資訊產生查尋結果,其中搜尋結果包括以輸入資訊為根節點的知識圖譜,且知識圖譜可以包括至少兩階的聯想字詞,亦即,根節點之下第一階聯想字詞與第一階聯想字詞下的第二階聯想字詞。在其他實施例中,知識圖譜亦可以包括超過兩階的聯想字詞或僅有一階的聯想字詞。進一步地,上述輸入資訊可以是關鍵字、主題名稱或會員識別,且知識圖譜聯想搜尋伺服器11根據輸入資訊是關鍵字、主題名稱或會員識別,會有不同的搜尋方式,以便基於其文章/關聯項目/分數資料庫中產生知識圖譜。關於根據關鍵字、主題名稱或會員識別來產生知識圖譜的細節,將於後面的內容詳細介紹,此處先行省略。
接著,進一步地說明知識圖譜聯想搜尋伺服器11的實現方式,但本新型不以下述知識圖譜聯想搜尋伺服器11的實現方式為限制。請參照圖2,圖2是本新型實施例的知識圖譜聯想搜尋伺服器的方塊圖。於圖2中,知識圖譜聯想搜尋伺服器2包括處理單元21、輸入輸出介面單元22、儲存單元23與記憶體24,其中處理單元21電性連接輸入輸出介面單元22、儲存單元23與記憶體24。
於此實施例中,處理單元21用於執行軟體程式,以進行聯想搜尋。輸入輸出介面單元22則包括通訊模組,以使知識圖譜聯想搜尋伺服器2與用戶裝置進行通訊連接,並藉此接收用戶裝置的輸入資訊與傳送搜尋結果給用戶裝置。儲存單元23儲存有前述軟體程式,且還可以規劃有特定的資料庫單元231,以進行各類資料庫的儲存。記憶體24則做為處理單元21執行軟體程式時的數據儲存空間。附帶說明的是,在其他實施例中,儲存單元23可以不規劃有特定的部分來儲存各類資料庫,或者,各類資料庫可以是儲存於知識圖譜聯想搜尋伺服器2之外。總而言之,本新型不以各類資料庫的儲存方式為限制。
接著,請參照圖3,圖3是本新型實施例的聯想搜尋方法的流程圖。首先,在步驟S31中,知識圖譜聯想搜尋伺服器獲取文章/關聯項目/分數資料庫。然後,在步驟S32中,知識圖譜聯想搜尋伺服器接收使用者透過用戶裝置輸入的輸入資訊,例如關鍵字、主題名稱或會員識別。之後,在步驟S33中,知識圖譜聯想搜尋伺服器根據接收的輸入資訊,並基於文章/關聯項目/分數資料庫的內容,繪製知識圖譜。如此,知識圖譜聯想搜尋伺服器會將繪製的知識圖譜作為搜尋結果的一部分,並將搜尋結果傳送給用戶裝置,以讓使用者可以看到以輸入資訊根節點的知識圖譜。在此請注意,上述步驟S31與步驟S32的順序並非用於限制本新型,其順序可以互相調換。
接著,請參照圖4,圖4是本新型實施例之獲取文章/關聯項目/分數資料庫的流程圖。圖4繪示了圖3的步驟S32的其中一種實現方式,但需要說明的是,圖4的實現方式僅是本新型獲取文章/關聯項目/分數資料庫的其中一個實現方式,其並非用於限制本新型。於步驟S41中,知識圖譜聯想搜尋伺服器先獲取文章資料庫與項目名稱/關聯項目資料庫。文章資料庫記錄篩選後的多個文章,此多個文章係被知識圖譜聯想搜尋系統的經營業者透過手動或軟體程式自動篩選者,其目的在於讓使用者可以通過這些文章學習到經營業者希望使用者 學習到的知識。附帶一提的是,文章資料庫記錄的多個文章,可以是包括了文字、圖片、影音與/或關鍵字單詞的內容等,亦即,文章資料庫不局限於僅記錄僅有文字的內容而已,文章的本身甚至可以僅是圖片或影音。項目名稱/關聯項目資料庫則記錄著經營業者預設的多個關聯項目與項目名稱之間的關係,項目名稱/關聯項目資料庫的部分內容可以如表一所示。
Figure 109203783-A0305-02-0011-1
於步驟S42中,知識圖譜聯想搜尋伺服器基於項目名稱/關聯項目資料庫對文章資料庫的文章進行文章分析。然後,在S43中,知識圖譜聯想搜尋伺服器根據分析結果,產生文章/關聯項目/分數資料庫。文章/關聯項目/分數資料庫記錄有對應於文章資料庫之文章的文章識別、關聯項目、項目名稱與項目分數,且較佳地更可以具有主題類型、主題名稱與主題分數,其中文章/關聯項目/分數資料庫的部分內容可以如表二所示。
Figure 109203783-A0305-02-0011-2
Figure 109203783-A0305-02-0012-3
另外,進行文章分析的方式大致上說明如下。先使用項目名稱/關聯項目資料庫中的項目名稱搜尋文章資料庫的文章,根據文章與項目名稱相關度決定文章的主題名稱與主題分數。接著,再使用項目名稱/關聯項目資料庫中的關聯項目下的每一個項目名稱搜尋文章資料庫的文章,根據文章與關聯項目下之項目名稱的關聯度決定文章之關聯項目及其下的項目名稱及其項目分數。例如,可以使用非關係型搜尋(elastic search)評分系統,計算每一個項目名稱於每一文章中出現的頻率與全部文章出現的總頻率,來決定文章之關聯項目及其下的項目名稱及其項目分數,但本發明不以此為限制,亦可以透過其他搜尋評分系統來計算與決定文章之關聯項目及其下的項目名稱及其項目分數。如此,每一篇文章都有對應之主題名稱、主題分數、關聯項目、項目名稱與項目分數,從而形成如表二所示的文章/關聯項目/分數資料庫。舉例來說,針對文章識別為「30461」的文章,項目名稱「華倫.巴菲特」出現頻率最高(其中,前述主題分數關聯於此詞頻),因此,認定其文章的主題名稱為「華倫.巴菲特」,關聯項目中「書籍」的項目名稱「巴菲特的投資原則」的詞頻超過一特定值(其中前述項目分數關聯於此詞頻),故文章識別為「30461」的文章的關聯項目「書籍」下的項目名稱包括有「巴菲特的投資原則」。
附帶一提的是,雖然上述實施例以項目名稱/關聯項目資料庫來對文章資料庫的文章進行文章分析,但本新型不以此為限制。於其他實施例中,可以是使用詞庫來對對文章資料庫的文章進行文章分析。再者,上述文章分析的作法亦非用以限制本新型,其他能夠對文章進行文章分析以決定文章的項目名稱與關聯項目的作法亦可以用於本新型。
接著,請參照圖5,圖5是本新型實施例之根據關鍵字產生知識圖譜的流程圖。前述輸入資訊可以是關鍵字、主題名稱或會員識別,而圖5以輸入資訊為關鍵字的例子,說明本新型的聯想搜尋方法如何根據關鍵字產生知識圖譜。在步驟S51中,知識圖譜聯想搜尋伺服器根據關鍵字查尋文章資料庫,以獲取關聯度較高之前數篇文章(例如,100篇,但本新型不以此為限制)的文章識別。在步驟S52中,知識圖譜聯想搜尋伺服器於文章/關聯項目/分數資料庫搜尋,獲取相應於文章識別的關聯項目及其項目名稱,例如取得100個文章識別的關聯項目及其項目名稱。接著,在步驟S53中,知識圖譜聯想搜尋伺服器將步驟S52中獲取之所有文章的關聯項目及其項目名稱進行合併。之後,在步驟S54中,知識圖譜聯想搜尋伺服器根據合併之關聯項目及其項目名稱繪製對應之關鍵字的知識圖譜。另外,在步驟S52中,更可以取得相應於文章識別的項目名稱的項目分數,以作為所述項目名稱是否被合併的基準,例如,項目分數過低的項目名稱則被捨棄,故不會出現在繪製的知識圖譜中。
舉例來說,若根據關鍵字搜尋出來的文章具有關聯項目「大師名人」及其下的項目名稱「班傑明.葛拉漢」、關聯項目「書籍」及其下的項目名稱「巴菲特的投資原則」及關聯項目「公司股票」及其下的項目名稱「波克夏」,以及根據關鍵字搜尋出來的另一文章具有關聯項目「書籍」及其下的「智慧型投資人」,則進行合併後,關鍵字下的關聯項目「大師名人」之下的項目名稱包括「班傑明.葛拉漢」,關鍵字下的關聯項目「書籍」之下的項目名稱包括「巴菲特的投資原則」與「智慧型投資人」,以及關鍵字下的關聯項目「公司股票」的項目名稱包括「波克夏」。接著,根據上述合併結果繪製出的知識圖表則有上述關聯項目及其下的項目名稱。
接著,請參照圖6,圖6是本新型實施例之根據關鍵字產生的知識圖譜的搜尋結果之示意圖。於圖6中,關鍵字「蘋果」被作為輸入資訊,知識圖 譜聯想搜尋伺服器在搜尋文章/關聯項目/分數資料庫後,發現了數篇文章與蘋果相關,且相關的文章中之關聯項目「大師名人」下的項目名稱「庫克」、「艾維」、「華倫.巴菲特」與「賈伯斯」具有較高的項目分數,因此進行合併後,關鍵字「蘋果」之關聯項目「大師名人」下的項目名稱包括有「庫克」、「艾維」、「華倫.巴菲特」與「賈伯斯」,而且繪製出的知識圖譜便如同圖6所示。
接著,請參照圖7,圖7是本新型實施例之根據主題名稱產生知識圖譜的流程圖。前述輸入資訊可以是關鍵字、主題名稱或會員識別,而圖7以輸入資訊為主題名稱的例子,說明本新型的聯想搜尋方法如何根據主題名稱產生知識圖譜。在步驟S71中,知識圖譜聯想搜尋伺服器根據主題名稱搜尋文章/關聯項目/分數資料庫,獲取相應於文章識別的關聯項目及其項目名稱。接著,在步驟S72中,知識圖譜聯想搜尋伺服器將步驟S71中獲取之所有文章的關聯項目及其項目名稱進行合併。之後,在步驟S73中,知識圖譜聯想搜尋伺服器根據合併之關聯項目及其項目名稱繪製對應之關鍵字的知識圖譜。在步驟S71中,更可以取得相應於文章識別的項目名稱的項目分數,以作為所述項目名稱是否被合併的基準,例如,項目分數過低的項目名稱則被捨棄,故不會出現在繪製的知識圖譜中。
接著,請參照圖8,圖8是本新型實施例之根據主題名稱產生的知識圖譜的搜尋結果之示意圖。於圖8中,主題名稱「華倫.巴菲特」被作為輸入資訊,知識圖譜聯想搜尋伺服器在搜尋文章/關聯項目/分數資料庫後,發現了數篇主題名稱為「華倫.巴菲特」且主題分數較高的文章,且相關的文章中之關聯項目「書籍」下的項目名稱的項目平均分數較高者包括有「巴菲特的投資原則」、「智慧型投資人」與「巴菲特寫給股東的信」,以及相關的文章中之關聯項目「公司股票」下的項目名稱的項目平均分數較高者包括有「美國銀行」、「波克夏」與「蘋果」,因此進行合併後,如表三所示,主題名稱「華倫.巴菲特」 之關聯項目「書籍」下的項目名稱包括有「巴菲特的投資原則」、「智慧型投資人」與「巴菲特寫給股東的信」,以及主題名稱「華倫.巴菲特」之關聯項目「公司股票」下的項目名稱包括有「美國銀行」、「波克夏」與「蘋果」,而且繪製出的知識圖譜便如同圖8所示。
Figure 109203783-A0305-02-0015-4
接著,請參照圖9,圖9是本新型實施例之根據會員識別產生知識圖譜的流程圖。前述輸入資訊可以是關鍵字、主題名稱或會員識別,而圖9以輸入資訊為會員識別的例子,說明本新型的聯想搜尋方法如何根據會員識別產生知識圖譜。首先,在步驟S91中,知識圖譜聯想搜尋伺服器根據會員識別,搜尋會員已經讀過之文章,以獲得對應之文章識別。在步驟S92中,知識圖譜聯想搜尋伺服器於文章/關聯項目/分數資料庫搜尋,獲取相應於文章識別的關聯項目及其項目名稱。接著,在步驟S93中,知識圖譜聯想搜尋伺服器將步驟S92中獲取之所有文章的關聯項目及其項目名稱進行合併。之後,在步驟S94中,知識圖譜聯想搜尋伺服器根據合併之關聯項目及其項目名稱繪製對應之關鍵字的知識圖譜。在步驟S92中,更可以取得相應於文章識別的項目名稱的項目分數,以作為所述項目名稱是否被合併的基準,例如,項目分數過低的項目名稱則被捨棄,故不會出現在繪製的知識圖譜中。
根據會員識別產生的知識圖譜同樣地可以以至少兩階聯想字詞的方式呈現。然而,另一種作法則是將知識圖譜的內容轉換成以會員圖譜的方 式來呈現。請參照圖10,圖10是本新型實施例之根據會員識別產生的知識圖譜的搜尋結果之示意圖。前述圖9中步驟S93中的合併結果是對應到兩階聯想字詞的知識圖譜,然而,為了讓使用者可以看到更多細節,圖10的會員圖譜中的知識圖譜僅呈現了第一階聯想字詞,而第二階聯想字詞的部分則以其他圖譜(如,直方圖、長條圖、泡泡圖、分布圖、雷達圖或曲線圖,但不限制為上述圖表)的方式呈現。等效上來說,至少兩階的聯想字詞的知識圖譜仍然被呈現,僅是呈現方式不似圖6或圖8的方式。總而言之,圖10的會員圖譜仍可以視為至少兩階聯想字詞的知識圖譜。
接著,說明本新型另一實施例的聯想搜尋方法。請參照圖11,圖11是本新型另一實施例的聯想搜尋方法的流程圖。首先,在步驟S111中,知識圖譜聯想搜尋伺服器根據輸入資訊的類型判斷繪製選擇。如果輸入資訊為會員識別,則執行步驟S115~S118,以例如圖10的會員圖譜來呈現知識圖譜,如果輸入資訊為關鍵字或主題名稱,則執行步驟S112~S114與S116~S118,以例如圖6或圖8的方式來呈現知識圖譜。
於步驟S112中,知識圖譜聯想搜尋伺服器搜尋項目名稱/關聯項目資料庫,以在步驟S113中判斷關鍵字是否為項目名稱/關聯項目資料庫所記錄的項目名稱,或者主題名稱是否為項目名稱/關聯項目資料庫所記錄的主題名稱(即,判斷關鍵字是否為特定的關鍵字)。如果關鍵字是項目名稱/關聯項目資料庫所記錄的項目名稱或主題名稱是項目名稱/關聯項目資料庫所記錄的主題名稱,則在則步驟S113中,可以直接獲取對應的文章識別,且接著步驟S116被執行;否則,則接著執行步驟S114。
由於關鍵字不是項目名稱/關聯項目資料庫所記錄的項目名稱或主題名稱不是項目名稱/關聯項目資料庫所記錄的主題名稱,且須對文章內容進行搜尋,故在步驟S114中,將文章資料庫轉換為非關係型文章資料庫(如,Elastic Search(ES)文章資料庫),並根據關鍵字或主題名稱對非關係型文章資料庫進行搜尋,以獲得文章識別。另外,如果輸入資訊為會員識別,則在步驟S115中,知識圖譜聯想搜尋伺服器搜尋會員資料庫,以獲得文章識別。在步驟S116中,依據獲取的文章識別,搜尋文章/關聯項目/分數資料庫,以獲取關聯項目及其項目名稱。然後,在步驟S117中,合併獲取之關聯項目及其項目名稱,以及在步驟S118中,根據合併之關聯項目及其項目名稱繪製對應之關鍵字的知識圖譜。在步驟S118中,會員圖譜的呈現方式可以是以圖6、圖8或圖10的方式呈現,且本新型不以此為限制。附帶一提的是,前述多個實施例的於文章/關聯項目/分數資料庫中進行搜尋的作法與合併獲取的關聯項目及其項目名稱的方式僅是實現本發明的其中幾種方式,其並非用於限制本發明。
接著,請參照圖12,圖12是本新型另一實施例之獲取文章/關聯項目/分數資料庫的流程圖。首先,在步驟S121中,知識圖譜聯想搜尋伺服器獲取文章資料庫,並進行將其轉換為非關係型文章資料庫。然後,在步驟S122中,知識圖譜聯想搜尋伺服器獲取項目名稱/關聯項目資料庫。接著,在步驟S123中,知識圖譜聯想搜尋伺服器使用項目名稱/關聯項目資料庫的項目名稱檢索關聯度較高的文章,再使用項目名稱/關聯項目資料庫的關聯項目檢索關聯度較高的文章。接著,在步驟S124中,知識圖譜聯想搜尋伺服器產生文章/關聯項目/分數資料庫。
進一步地說,在步驟S123中,使用項目名稱/關聯項目資料庫中的項目名稱搜尋文章資料庫的文章時,可同時獲得文章與項目名稱相關度,故在步驟S124中,可以決定文章的主題名稱與主題分數。在步驟S123中,使用項目名稱/關聯項目資料庫中的關聯項目下的每一個項目名稱搜尋文章資料庫的文章時,可同時獲得文章與關聯項目下之項目名稱的關聯度,故在步驟S124中,可以決定文章之關聯項目及其下的項目名稱與項目分數。如此,每一篇文章都 有對應之主題名稱、關聯項目、項目名稱與項目分數,而每一篇文章的文章識別、主題名稱、關聯項目、項目名稱與項目分數等資料便形成文章/關聯項目/分數資料庫。
除了使用獲取的項目名稱/關聯項目資料庫來對文章資料庫進行文章分析,並產生文章/關聯項目/分數資料庫外,亦可以透過詞庫來對文章資料庫進行文章分析來產生文章/關聯項目/分數資料庫。接請參照圖13,圖13是本新型又一實施例之獲取文章/關聯項目/分數資料庫的流程圖。首先,在步驟S131中,知識圖譜聯想搜尋伺服器獲取文章資料庫,並進行將其轉換為非關係型文章資料庫。然後,在步驟S132中,知識圖譜聯想搜尋伺服器獲取詞庫,其中詞庫的部分內容可以如同表四所示,其記錄有多個中文字詞、對應中文字詞的英文字詞與關聯項目。接著,在步驟S133中,知識圖譜聯想搜尋伺服器使用詞庫的項目名稱檢索關聯度較高的文章。接著,在步驟S134中,知識圖譜聯想搜尋伺服器產生文章/關聯項目/分數資料庫。
Figure 109203783-A0305-02-0018-5
進一步地說,在步驟S133中,使用詞庫中的中文字詞搜尋文章資料庫的文章時,可同時獲得文章與中文字詞的相關度,故在步驟S134中,可以決定文章的主題名稱、主題分數、關聯項目、項目名稱與項目分數。如此,每一篇文章都有對應之主題名稱、關聯項目、項目名稱與項目分數,而每一篇文章的文章識別、主題名稱、關聯項目、項目名稱與項目分數等資料便形成文章/關聯項目/分數資料庫。
綜上所述,本新型實施例的知識圖譜聯想搜尋系統根據輸入資訊於文章/關聯項目/分數資料庫中搜尋,以獲得相應的文章識別,並得到相應的文章識別的文章的關聯項目與其下的項目名稱,並將得到的各關聯項目與其下的項目名稱進行合併,並根據合併的結果繪出以輸入諮詢為根節點的知識圖譜作為搜尋結果的一部分。使用者即使不懂輸入資訊相應的其他聯想字詞,也能透過本新型得知相關聯的聯想字詞,並透過知識圖譜聯想搜尋系統提供的文章資料庫來學習相關知識。如此一來,有利於使用者快速且有效地學習相關知識。
本新型在上文中已以較佳實施例揭露,然熟習本項技術者應理解的是,上述實施例僅用於描繪本新型,而不應解讀為限制本新型之範圍。應注意的是,舉凡與前述實施例等效之變化與置換,均應設為涵蓋於本新型之範疇內。因此,本新型之保護範圍當以申請專利範圍所界定者為準。
1:知識圖譜聯想搜尋系統
11:知識圖譜聯想搜尋伺服器
12:用戶裝置
13:外部伺服器

Claims (10)

  1. 一種知識圖譜聯想搜尋伺服器,包括: 處理單元、電性連接所述處理單元的記憶體、電性連接所述處理單元的輸入輸出介面單元與電性連接所述處理單元的儲存單元,以使所述知識圖譜聯想搜尋伺服器接收來自於使用者之用戶裝置的輸入資訊,並獲取文章/關聯項目/分數資料庫,其中所述文章/關聯項目/分數資料庫記錄有文章資料庫之多篇文章的文章識別、關聯項目與項目名稱,所述知識圖譜聯想搜尋伺服器更於所述文章/關聯項目/分數資料庫中進行搜尋,以獲得對應於所述輸入資訊的至少一個文章識別之關聯項目與項目名稱,以及所述知識圖譜聯想搜尋伺服器根據搜尋得到之對應於所述輸入資訊的至少一個文章識別之關聯項目與項目名稱產生知識圖譜,以作為搜尋結果的至少一部分。
  2. 如請求項1的知識圖譜聯想搜尋伺服器,其中於所述文章/關聯項目/分數資料庫中進行搜尋,以獲得對應於所述輸入資訊的多個文章識別之關聯項目與項目名稱,合併多個對應於所述輸入資訊的多個文章識別之關聯項目與項目名稱,並根據合併的所述多個關聯項目與所述多個項目名稱產生所述知識圖譜,以作為所述搜尋結果的至少一部分。
  3. 如請求項1的知識圖譜聯想搜尋伺服器,其中所述輸入資訊為關鍵字,根據所述關鍵字搜尋所述文章/關聯項目/分數資料庫或非關係型文章資料庫,以獲得對應的至少一個文章識別,並根據對應於所述關鍵字的所述文章識別,於所述文章/關聯項目/分數資料庫中獲得對應於所述關鍵字的至少一個文章識別之關聯項目與項目名稱。
  4. 如請求項1的知識圖譜聯想搜尋伺服器,其中所述文章/關聯項目/分數資料庫更記錄有對應於每一個文章識別的主題名稱,所述輸入資訊為主題名稱,於所述文章/關聯項目/分數資料庫搜尋對應輸入資訊之主題名稱的至少一個文章識別,並根據對應於所述主題名稱的所述文章識別,於所述文章/關聯項目/分數資料庫中獲得對應於所主題名稱的至少一個文章識別之關聯項目與項目名稱。
  5. 如請求項1的知識圖譜聯想搜尋伺服器,其中所述輸入資訊為會員識別,根據所述會員識別於會員資料庫搜尋對應的至少一個文章識別,並根據對應於所述會員識別的所述文章識別,於所述文章/關聯項目/分數資料庫中獲得對應於所述會員識別的至少一個文章識別之關聯項目與項目名稱。
  6. 如請求項1的知識圖譜聯想搜尋伺服器,其中將所述文章資料庫轉換為非關係型文章資料庫,並根據詞庫或項目名稱/關聯項目資料庫對所述非關係型文章資料庫進行文章分析,以獲得所述文章/關聯項目/分數資料庫,其中所述項目名稱/關聯項目資料庫記錄有多個關聯項目與其對應的項目名稱,以及所述詞庫記錄有多個字詞及其對應的關聯項目。
  7. 如請求項1的知識圖譜聯想搜尋伺服器,其中所述知識圖譜的根節點用於呈現所述輸入資訊,所述根節點底下的第一階聯想字詞與第二階聯想字詞分別用於呈現對應於所述輸入資訊的文章識別之關聯項目與項目名稱。
  8. 如請求項7的知識圖譜聯想搜尋伺服器,其中所述搜尋結果為會員圖譜,所述會員圖譜呈現所述知識圖譜的根節點與第一階聯想字詞,所述知識圖譜的第二階聯想字詞以直方圖、長條圖、泡泡圖、分布圖、雷達圖或曲線圖呈現。
  9. 如請求項3的知識圖譜聯想搜尋伺服器,其中若所述關鍵字為特定關鍵字,則於所述文章/關聯項目/分數資料庫獲取對應所述關鍵字的至少一個文章識別,若所述關鍵字非為特定關鍵字,則於所述非關係型文章資料庫獲取對應所述關鍵字的至少一個文章識別。
  10. 一種知識圖譜聯想搜尋系統,包括: 如請求項1-9其中一項所述之知識圖譜聯想搜尋伺服器;以及 至少一個所述使用者的用戶裝置。
TW109203783U 2020-03-31 2020-03-31 知識圖譜聯想搜尋伺服器與其系統 TWM604414U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW109203783U TWM604414U (zh) 2020-03-31 2020-03-31 知識圖譜聯想搜尋伺服器與其系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW109203783U TWM604414U (zh) 2020-03-31 2020-03-31 知識圖譜聯想搜尋伺服器與其系統

Publications (1)

Publication Number Publication Date
TWM604414U true TWM604414U (zh) 2020-11-21

Family

ID=74203811

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109203783U TWM604414U (zh) 2020-03-31 2020-03-31 知識圖譜聯想搜尋伺服器與其系統

Country Status (1)

Country Link
TW (1) TWM604414U (zh)

Similar Documents

Publication Publication Date Title
US9589208B2 (en) Retrieval of similar images to a query image
KR101231560B1 (ko) 데이터 클러스터와 유의어의 탐색과 수정에 대한 방법 및 시스템
US9280535B2 (en) Natural language querying with cascaded conditional random fields
US8341112B2 (en) Annotation by search
WO2018028443A1 (zh) 数据处理方法、设备及系统
WO2017096454A1 (en) Clustering documents based on textual content
US20110270815A1 (en) Extracting structured data from web queries
US8582872B1 (en) Place holder image detection via image clustering
JP2020500371A (ja) 意味的検索のための装置および方法
US20180341686A1 (en) System and method for data search based on top-to-bottom similarity analysis
JP2019212292A (ja) イベント発見方法、装置、機器及びプログラム
WO2019218527A1 (zh) 多系统相结合的自然语言处理方法及装置
WO2011097053A2 (en) Generating and presenting lateral concepts
WO2017113592A1 (zh) 模型生成方法、词语赋权方法、装置、设备及计算机存储介质
KR102150908B1 (ko) 자연어 질의해석 방법 및 시스템
CN110569289A (zh) 基于大数据的列数据处理方法、设备及介质
US20120130999A1 (en) Method and Apparatus for Searching Electronic Documents
JP4855080B2 (ja) スキーマ統合支援装置、スキーマ統合支援装置のスキーマ統合支援方法およびスキーマ統合支援プログラム
JP2003186888A (ja) 部品情報分類装置、部品情報検索装置および部品情報検索サーバ
JP4426041B2 (ja) カテゴリ因子による情報検索方法
JP6446987B2 (ja) 映像選択装置、映像選択方法、映像選択プログラム、特徴量生成装置、特徴量生成方法及び特徴量生成プログラム
CN110874366A (zh) 数据处理、查询方法和装置
CN111752922A (zh) 一种建立知识数据库、实现知识查询的方法及装置
TWI747220B (zh) 知識圖譜聯想搜尋方法與系統
CN116610810A (zh) 基于调控云知识图谱血缘关系的智能搜索方法及系统