TWI747220B - 知識圖譜聯想搜尋方法與系統 - Google Patents

知識圖譜聯想搜尋方法與系統 Download PDF

Info

Publication number
TWI747220B
TWI747220B TW109111064A TW109111064A TWI747220B TW I747220 B TWI747220 B TW I747220B TW 109111064 A TW109111064 A TW 109111064A TW 109111064 A TW109111064 A TW 109111064A TW I747220 B TWI747220 B TW I747220B
Authority
TW
Taiwan
Prior art keywords
article
item
knowledge graph
database
name
Prior art date
Application number
TW109111064A
Other languages
English (en)
Other versions
TW202139031A (zh
Inventor
廖偉盛
黃嫈倫
黃鈺琪
許郁婷
Original Assignee
股感生活金融科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 股感生活金融科技股份有限公司 filed Critical 股感生活金融科技股份有限公司
Priority to TW109111064A priority Critical patent/TWI747220B/zh
Publication of TW202139031A publication Critical patent/TW202139031A/zh
Application granted granted Critical
Publication of TWI747220B publication Critical patent/TWI747220B/zh

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一種知識圖譜聯想搜尋方法,其包括:接收來自於使用者之用戶裝置的輸入資訊;獲取文章/關聯項目/分數資料庫,其中所述文章/關聯項目/分數資料庫記錄有文章資料庫之多篇文章的文章識別、關聯項目與項目名稱;於所述文章/關聯項目/分數資料庫中進行搜尋,以獲得對應於所述輸入資訊的至少一個文章識別之關聯項目與項目名稱;以及根據搜尋得到之對應於所述輸入資訊的至少一個文章識別之關聯項目與項目名稱產生知識圖譜,以作為搜尋結果的至少一部分。

Description

知識圖譜聯想搜尋方法與系統
本發明是有關於一種可以根據輸入資訊產生搜尋結果的搜尋方法與系統,且特別是一種搜尋結果以知識圖譜呈現的知識圖譜聯想搜尋方法與系統。
知識圖譜為一種以圖式表示的數據結構,其具有多個節點與連接線,其中節點之間透過連接線連接,且彼此連接之節點中的字詞會具有聯想關係。知識圖譜的拓樸可以為樹狀,第一層節點的字詞為根節點之字詞的聯想字詞,且第二層節點的字詞為第一層節點之字詞的聯想字詞,其他層節點的字詞關係,則依此類推。透過知識圖譜的呈現,使用者可以了解各字詞的聯想關係。
現有搜尋系統可以根據使用者輸入的關鍵字或圖片來搜尋相關的網頁、文件或多媒體檔案。然而,對於要學習知識的使用者來說,透過現有搜尋系統查找出來搜尋結果可能無法有效地幫助使用者進行學習,且對於沒有相關背景知識的使用者來說,因為不知道關鍵字對應的其他聯想字詞,故不易達到有效與快速學習的目的。舉例來說,對於沒有投資過股票的使用者來說,若單純地透過搜尋系統搜尋「股票」,則因為使用者不知「股票」的其他聯想字詞(例如,上市、上櫃、績優股與股利等字詞),故不易有效與快速地學習股票投資知識。
本發明實施例提供一種搜尋結果以知識圖譜呈現的知識圖譜聯想搜尋方法與系統。所述知識圖譜聯想搜尋方法與系統可以根據使用者的輸入資訊,例如關鍵字、會員識別(member identification)或主題名稱(但輸入資訊不以此為限制),繪出以輸入資訊為根節點之知識圖譜作為搜尋結果的至少其中一部分。透過知識圖譜,使用者可以知悉由其輸入資訊聯想到的字詞,並藉此閱讀聯想字詞的文章,以快速且有效地學習輸入資訊所對應之知識。
基於本發明要達到的目的與要解決的技術問題的其中一者,本發明實施例提供一種知識圖譜聯想搜尋方法,係執行於知識圖譜聯想搜尋伺服器,其包括:接收來自於使用者之用戶裝置的輸入資訊;獲取文章/關聯項目/分數資料庫,其中所述文章/關聯項目/分數資料庫記錄有文章資料庫之多篇文章的文章識別、關聯項目與項目名稱;於所述文章/關聯項目/分數資料庫中進行搜尋,以獲得對應於所述輸入資訊的至少一個文章識別之關聯項目與項目名稱;以及根據搜尋得到之對應於所述輸入資訊的至少一個文章識別之關聯項目與項目名稱產生知識圖譜,以作為搜尋結果的至少一部分。
根據前述技術特徵,於所述文章/關聯項目/分數資料庫中進行搜尋,以獲得對應於所述輸入資訊的多個文章識別之關聯項目與項目名稱,合併多個對應於所述輸入資訊的多個文章識別之關聯項目與項目名稱,並根據合併的所述多個關聯項目與所述多個項目名稱產生所述知識圖譜,以作為所述搜尋結果的至少一部分。
根據前述技術特徵,所述輸入資訊為關鍵字,根據所述關鍵字搜尋所述文章/關聯項目/分數資料庫或非關係型文章資料庫,以獲得對應的至少一個文章識別,並根據對應於所述關鍵字的所述文章識別,於所述文章/關聯項目/ 分數資料庫中獲得對應於所述關鍵字的至少一個文章識別之關聯項目與項目名稱。
根據前述技術特徵,所述文章/關聯項目/分數資料庫更記錄有對應於每一個文章識別的主題名稱,所述輸入資訊為主題名稱,於所述文章/關聯項目/分數資料庫搜尋對應輸入資訊之主題名稱的至少一個文章識別,並根據對應於所述主題名稱的所述文章識別,於所述文章/關聯項目/分數資料庫中獲得對應於所主題名稱的至少一個文章識別之關聯項目與項目名稱。
根據前述技術特徵,所述輸入資訊為會員識別,根據所述會員識別於會員資料庫搜尋對應的至少一個文章識別,並根據對應於所述會員識別的所述文章識別,於所述文章/關聯項目/分數資料庫中獲得對應於所述會員識別的至少一個文章識別之關聯項目與項目名稱。
根據前述技術特徵,將所述文章資料庫轉換為非關係型文章資料庫,並根據詞庫或項目名稱/關聯項目資料庫對所述非關係型文章資料庫進行文章分析,以獲得所述文章/關聯項目/分數資料庫,其中所述項目名稱/關聯項目資料庫記錄有多個關聯項目與其對應的項目名稱,以及所述詞庫記錄有多個字詞及其對應的關聯項目。
根據前述技術特徵,所述知識圖譜的根節點用於呈現所述輸入資訊,所述根節點底下的第一階聯想字詞與第二階聯想字詞分別用於呈現對應於所述輸入資訊的文章識別之關聯項目與項目名稱。
根據前述技術特徵,所述搜尋結果為會員圖譜,所述會員圖譜呈現所述知識圖譜的根節點與第一階聯想字詞,所述知識圖譜的第二階聯想字詞以直方圖、長條圖、泡泡圖、分布圖、雷達圖或曲線圖呈現。
根據前述技術特徵,若所述關鍵字為特定關鍵字,則於所述文章/關聯項目/分數資料庫獲取對應所述關鍵字的至少一個文章識別,若所述關鍵字 非為特定關鍵字,則於所述非關係型文章資料庫獲取對應所述關鍵字的至少一個文章識別。
基於本發明要達到的目的與要解決的技術問題的其中一者,本發明實施例提供一種知識圖譜聯想搜尋系統,其包括:知識圖譜聯想搜尋伺服器;以及至少一個使用者的用戶裝置,其中所述知識圖譜聯想搜尋伺服器用於執行上述知識圖譜聯想搜尋方法。
簡單地說,透過本發明實施例提供之知識圖譜聯想搜尋方法與系統,使用者即使不懂輸入資訊相應的其他聯想字詞,也能透過本發明得知相關聯的聯想字詞,並透過知識圖譜聯想搜尋方法與系統提供的文章資料庫來學習相關知識。如此一來,有利於使用者快速且有效地學習相關知識。
1:知識圖譜聯想搜尋系統
11:知識圖譜聯想搜尋伺服器
12:用戶裝置
13:外部伺服器
2:知識圖譜聯想搜尋伺服器
21:處理單元
22:輸入輸出介面單元
23:儲存單元
231:資料庫單元
24:記憶體
S31~S33、S41~S43、S51~S54、S71~S73、S91~S94、S111~S118、S121~S124、S131~S134:步驟
圖1是本發明實施例的知識圖譜聯想搜尋系統的方塊圖。
圖2是本發明實施例的知識圖譜聯想搜尋伺服器的方塊圖。
圖3是本發明實施例的知識圖譜聯想搜尋方法的流程圖。
圖4是本發明實施例之獲取文章/關聯項目/分數資料庫的流程圖。
圖5是本發明實施例之根據關鍵字產生知識圖譜的流程圖。
圖6是本發明實施例之根據關鍵字產生的知識圖譜的搜尋結果之示意圖。
圖7是本發明實施例之根據主題名稱產生知識圖譜的流程圖。
圖8是本發明實施例之根據主題名稱產生的知識圖譜的搜尋結果之示意圖。
圖9是本發明實施例之根據會員識別產生知識圖譜的流程圖。
圖10是本發明實施例之根據會員識別產生的知識圖譜的搜尋結果之示意圖。
圖11是本發明另一實施例的知識圖譜聯想搜尋方法的流程圖。
圖12是本發明另一實施例之獲取文章/關聯項目/分數資料庫的流程圖。
圖13是本發明又一實施例之獲取文章/關聯項目/分數資料庫的流程圖。
為充分瞭解本發明之目的、特徵及功效,茲藉由下述具體之實施例,並配合所附之圖式,對本發明做一詳細說明,說明如後。
本發明實施例提供一種搜尋結果以知識圖譜呈現的知識圖譜聯想搜尋系統。所述知識圖譜聯想搜尋系統包括至少一個用戶裝置與知識圖譜聯想搜尋伺服器,其中用戶裝置與知識圖譜聯想搜尋伺服器彼此通訊連接,知識圖譜聯想搜尋伺服器可以由硬體電路與軟體來實現,或者全部由硬體電路來實現,用戶裝置可以是智慧型手機、筆記型電腦、桌上型電腦、平板電腦或上網本,且本發明不以此為限制。
使用者可以透過用戶裝置將輸入資訊送至知識圖譜聯想搜尋伺服器,以讓知識圖譜聯想搜尋伺服器根據輸入資訊繪製出以輸入資訊為根節點之知識圖譜,並將知識圖譜當作搜尋結果的至少一部分,其中輸入資訊可以是關鍵字、主題名稱或會員識別。進一步地說,本發明實施例的知識圖譜聯想搜尋系統是基於文章/關聯項目/分數資料庫,根據輸入資訊繪製出以輸入資訊為根節點之知識圖譜,其中文章/關聯項目/分數資料庫記錄有對應於文章資料庫之文 章的文章識別、關聯項目、項目名稱與項目分數,且較佳地更可以具有主題類型、主題名稱與主題分數。
由於輸入資訊關聯的第一階聯想字詞可能會非常的多,因此,設計上將第一階聯想字詞限定為基於文章/關聯項目/分數資料庫中的關聯項目,且相關知識對應的文章亦存在文章資料庫中,以讓使用者可以透過知識圖譜閱讀相關文章,達到快速且有效學習知識的目的。文章/關聯項目/分數資料庫中的關聯項目為採用知識圖譜聯想搜尋系統的營運業者所定義者,其通常與希望讓使用者學到的知識相關聯。舉例來說,若希望使用者透過其知識圖譜聯想搜尋系統學習相關投資知識,則關聯項目可以被預設為「書籍」、「大師名人」、「公司股票」、「產業產品」、「投資知識」與「商業策略」。再舉一例來說,若希望使用者透過其知識圖譜聯想搜尋系統學習相關防疫知識,則關聯項目可以被預設為「防疫用品」、「居家隔離」與「檢疫」。
第二階聯想字詞則是文章/關聯項目/分數資料庫中之關聯項目下項目名稱,項目名稱的部分則是透過文章分析方式來獲取,例如使用詞庫或項目名稱/關聯項目資料庫來對非關係型文章資料庫(如,Elastic Search(ES)文章資料庫)進行映射處理。再者,由於第一階聯想字詞對應的第二階聯想字詞(亦即,於文章/關聯項目/分數資料庫搜尋到的項目名稱)可能數量也會不少,因此文章/關聯項目/分數資料庫中的項目分數可以作為是否列入於知識圖譜中的評斷基準。舉例來說,基於輸入資訊對應的某一個第一階聯想字詞對應的第二階聯想字詞於文章/關聯項目/分數資料庫中共有15個,則可以統計此15個第二階聯想字詞的項目分數,並取統計之項目分數較高的5個第二階聯想字詞列入於知識圖譜中。另外,基於上述的知識圖譜聯想搜尋系統,本發明實施例提供了對應的知識圖譜聯想搜尋方法。
於說明完本發明實施例之知識圖譜聯想搜尋系統與方法的發明概念後,接著,進一步地說明本發明實施例之知識圖譜聯想搜尋系統與方法的細節。首先,請參照圖1,圖1是本發明實施例的知識圖譜聯想搜尋系統的方塊圖。知識圖譜聯想搜尋系統1包括知識圖譜聯想搜尋伺服器11與至少一個用戶裝置12,其中知識圖譜聯想搜尋伺服器11通訊連接用戶裝置12,且更可以通訊連接外部伺服器13。知識圖譜聯想搜尋伺服器11可以由硬體電路與軟體來實現,或者全部由硬體電路來實現,用戶裝置12可以是智慧型手機、筆記型電腦、桌上型電腦、平板電腦或上網本,且本發明不以此為限制。
知識圖譜聯想搜尋伺服器11接收用戶裝置12的輸入資訊,並且根據輸入資訊產生搜尋結果,其中搜尋結果包括以輸入資訊為根節點的知識圖譜,且知識圖譜可以包括至少兩階的聯想字詞,亦即,根節點之下第一階聯想字詞與第一階聯想字詞下的第二階聯想字詞。在其他實施例中,知識圖譜亦可以包括超過兩階的聯想字詞或僅有一階的聯想字詞。進一步地,上述輸入資訊可以是關鍵字、主題名稱或會員識別,且知識圖譜聯想搜尋伺服器11根據輸入資訊是關鍵字、主題名稱或會員識別,會有不同的搜尋方式,以便基於其文章/關聯項目/分數資料庫中產生知識圖譜。關於根據關鍵字、主題名稱或會員識別來產生知識圖譜的細節,將於後面的內容詳細介紹,此處先行省略。
接著,進一步地說明知識圖譜聯想搜尋伺服器11的實現方式,但本發明不以下述知識圖譜聯想搜尋伺服器11的實現方式為限制。請參照圖2,圖2是本發明實施例的知識圖譜聯想搜尋伺服器的方塊圖。於圖2中,知識圖譜聯想搜尋伺服器11包括處理單元21、輸入輸出介面單元22、儲存單元23與記憶體24,其中處理單元21電性連接輸入輸出介面單元22、儲存單元23與記憶體24。
於此實施例中,處理單元21用於執行軟體程式,以進行知識圖譜聯想搜尋。輸入輸出介面單元22則包括通訊模組,以使知識圖譜聯想搜尋伺服 器11與用戶裝置進行通訊連接,並藉此接收用戶裝置的輸入資訊與傳送搜尋結果給用戶裝置。儲存單元23儲存有前述軟體程式,且還可以規劃有特定的資料庫單元231,以進行各類資料庫的儲存。記憶體24則做為處理單元21執行軟體程式時的數據儲存空間。附帶說明的是,在其他實施例中,儲存單元23可以不規劃有特定的部分來儲存各類資料庫,或者,各類資料庫可以是儲存於知識圖譜聯想搜尋伺服器11之外。總而言之,本發明不以各類資料庫的儲存方式為限制。
接著,請參照圖3,圖3是本發明實施例的知識圖譜聯想搜尋方法的流程圖。首先,在步驟S31中,知識圖譜聯想搜尋伺服器獲取文章/關聯項目/分數資料庫。然後,在步驟S32中,知識圖譜聯想搜尋伺服器接收使用者透過用戶裝置輸入的輸入資訊,例如關鍵字、主題名稱或會員識別。之後,在步驟S33中,知識圖譜聯想搜尋伺服器根據接收的輸入資訊,並基於文章/關聯項目/分數資料庫的內容,繪製知識圖譜。如此,知識圖譜聯想搜尋伺服器會將繪製的知識圖譜作為搜尋結果的一部分,並將搜尋結果傳送給用戶裝置,以讓使用者可以看到以輸入資訊根節點的知識圖譜。在此請注意,上述步驟S31與步驟S32的順序並非用於限制本發明,其順序可以互相調換。
接著,請參照圖4,圖4是本發明實施例之獲取文章/關聯項目/分數資料庫的流程圖。圖4繪示了圖3的步驟S31的其中一種實現方式,但需要說明的是,圖4的實現方式僅是本發明獲取文章/關聯項目/分數資料庫的其中一個實現方式,其並非用於限制本發明。於步驟S41中,知識圖譜聯想搜尋伺服器先獲取文章資料庫與項目名稱/關聯項目資料庫。文章資料庫記錄篩選後的多個文章,此多個文章係被知識圖譜聯想搜尋系統的經營業者透過手動或軟體程式自動篩選者,其目的在於讓使用者可以通過這些文章學習到經營業者希望使用者學習到的知識。附帶一提的是,文章資料庫記錄的多個文章,可以是包括了文字、圖片、影音與/或關鍵字單詞的內容等,亦即,文章資料庫不局限於僅記錄 僅有文字的內容而已,文章的本身甚至可以僅是圖片或影音。項目名稱/關聯項目資料庫則記錄著經營業者預設的多個關聯項目與項目名稱之間的關係,項目名稱/關聯項目資料庫的部分內容可以如表一所示。
Figure 109111064-A0305-02-0011-1
於步驟S42中,知識圖譜聯想搜尋伺服器基於項目名稱/關聯項目資料庫對文章資料庫的文章進行文章分析。然後,在S43中,知識圖譜聯想搜尋伺服器根據分析結果,產生文章/關聯項目/分數資料庫。文章/關聯項目/分數資料庫記錄有對應於文章資料庫之文章的文章識別、關聯項目、項目名稱與項目分數,且較佳地更可以具有主題類型、主題名稱與主題分數,其中文章/關聯項目/分數資料庫的部分內容可以如表二所示。
Figure 109111064-A0305-02-0011-2
Figure 109111064-A0305-02-0012-3
另外,進行文章分析的方式大致上說明如下。先使用項目名稱/關聯項目資料庫中的項目名稱搜尋文章資料庫的文章,根據文章與項目名稱相關度決定文章的主題名稱與主題分數。接著,再使用項目名稱/關聯項目資料庫中的關聯項目下的每一個項目名稱搜尋文章資料庫的文章,根據文章與關聯項目下之項目名稱的關聯度決定文章之關聯項目及其下的項目名稱及其項目分數。例如,可以使用非關係型搜尋(elastic search)評分系統,計算每一個項目名稱於每一文章中出現的頻率與全部文章出現的總頻率,來決定文章之關聯項目及其下的項目名稱及其項目分數,但本發明不以此為限制,亦可以透過其他搜尋評分系統來計算與決定文章之關聯項目及其下的項目名稱及其項目分數。如此,每一篇文章都有對應之主題名稱、主題分數、關聯項目、項目名稱與項目分數,從而形成如表二所示的文章/關聯項目/分數資料庫。舉例來說,針對文章識別為「30461」的文章,項目名稱「華倫.巴菲特」出現頻率最高(其中,前述主題分數關聯於此詞頻),因此,認定其文章的主題名稱為「華倫.巴菲特」,關聯項目中「書籍」的項目名稱「巴菲特的投資原則」的詞頻超過一特定值(其中前述項目分數關聯於此詞頻),故文章識別為「30461」的文章的關聯項目「書籍」下的項目名稱包括有「巴菲特的投資原則」。
附帶一提的是,雖然上述實施例以項目名稱/關聯項目資料庫來對文章資料庫的文章進行文章分析,但本發明不以此為限制。於其他實施例中,可以是使用詞庫來對對文章資料庫的文章進行文章分析。再者,上述文章分析的做法亦非用以限制本發明,其他能夠對文章進行文章分析以決定文章的項目名稱與關聯項目的做法亦可以用於本發明。
接著,請參照圖5,圖5是本發明實施例之根據關鍵字產生知識圖譜的流程圖。前述輸入資訊可以是關鍵字、主題名稱或會員識別,而圖5以輸入 資訊為關鍵字的例子,說明本發明的知識圖譜聯想搜尋方法如何根據關鍵字產生知識圖譜。在步驟S51中,知識圖譜聯想搜尋伺服器根據關鍵字查尋文章資料庫,以獲取關聯度較高之前數篇文章(例如,100篇,但本發明不以此為限制)的文章識別。在步驟S52中,知識圖譜聯想搜尋伺服器於文章/關聯項目/分數資料庫搜尋,獲取相應於文章識別的關聯項目及其項目名稱,例如取得100個文章識別的關聯項目及其項目名稱。接著,在步驟S53中,知識圖譜聯想搜尋伺服器將步驟S52中獲取之所有文章的關聯項目及其項目名稱進行合併。之後,在步驟S54中,知識圖譜聯想搜尋伺服器根據合併之關聯項目及其項目名稱繪製對應之關鍵字的知識圖譜。另外,在步驟S52中,更可以取得相應於文章識別的項目名稱的項目分數,以作為所述項目名稱是否被合併的基準,例如,項目分數過低的項目名稱則被捨棄,故不會出現在繪製的知識圖譜中。
舉例來說,若根據關鍵字搜尋出來的文章具有關聯項目「大師名人」及其下的項目名稱「班傑明.葛拉漢」、關聯項目「書籍」及其下的項目名稱「巴菲特的投資原則」及關聯項目「公司股票」及其下的項目名稱「波克夏」,以及根據關鍵字搜尋出來的另一文章具有關聯項目「書籍」及其下的「智慧型投資人」,則進行合併後,關鍵字下的關聯項目「大師名人」之下的項目名稱包括「班傑明.葛拉漢」,關鍵字下的關聯項目「書籍」之下的項目名稱包括「巴菲特的投資原則」與「智慧型投資人」,以及關鍵字下的關聯項目「公司股票」的項目名稱包括「波克夏」。接著,根據上述合併結果繪製出的知識圖表則有上述關聯項目及其下的項目名稱。
接著,請參照圖6,圖6是本發明實施例之根據關鍵字產生的知識圖譜的搜尋結果之示意圖。於圖6中,關鍵字「蘋果」被作為輸入資訊,知識圖譜聯想搜尋伺服器在搜尋文章/關聯項目/分數資料庫後,發現了數篇文章與蘋果相關,且相關的文章中之關聯項目「大師名人」下的項目名稱「庫克」、「艾 維」、「華倫.巴菲特」與「賈伯斯」具有較高的項目分數,因此進行合併後,關鍵字「蘋果」之關聯項目「大師名人」下的項目名稱包括有「庫克」、「艾維」、「華倫.巴菲特」與「賈伯斯」,而且繪製出的知識圖譜便如同圖6所示。
接著,請參照圖7,圖7是本發明實施例之根據主題名稱產生知識圖譜的流程圖。前述輸入資訊可以是關鍵字、主題名稱或會員識別,而圖7以輸入資訊為主題名稱的例子,說明本發明的知識圖譜聯想搜尋方法如何根據主題名稱產生知識圖譜。在步驟S71中,知識圖譜聯想搜尋伺服器根據主題名稱搜尋文章/關聯項目/分數資料庫,獲取相應於文章識別的關聯項目及其項目名稱。接著,在步驟S72中,知識圖譜聯想搜尋伺服器將步驟S71中獲取之所有文章的關聯項目及其項目名稱進行合併。之後,在步驟S73中,知識圖譜聯想搜尋伺服器根據合併之關聯項目及其項目名稱繪製對應之關鍵字的知識圖譜。在步驟S71中,更可以取得相應於文章識別的項目名稱的項目分數,以作為所述項目名稱是否被合併的基準,例如,項目分數過低的項目名稱則被捨棄,故不會出現在繪製的知識圖譜中。
接著,請參照圖8,圖8是本發明實施例之根據主題名稱產生的知識圖譜的搜尋結果之示意圖。於圖8中,主題名稱「華倫.巴菲特」被作為輸入資訊,知識圖譜聯想搜尋伺服器在搜尋文章/關聯項目/分數資料庫後,發現了數篇主題名稱為「華倫.巴菲特」且主題分數較高的文章,且相關的文章中之關聯項目「書籍」下的項目名稱的項目平均分數較高者包括有「巴菲特的投資原則」、「智慧型投資人」與「巴菲特寫給股東的信」,以及相關的文章中之關聯項目「公司股票」下的項目名稱的項目平均分數較高者包括有「美國銀行」、「波克夏」與「蘋果」,因此進行合併後,如表三所示,主題名稱「華倫.巴菲特」之關聯項目「書籍」下的項目名稱包括有「巴菲特的投資原則」、「智慧型投資人」與「巴菲特寫給股東的信」,以及主題名稱「華倫.巴菲特」之關聯項目 「公司股票」下的項目名稱包括有「美國銀行」、「波克夏」與「蘋果」,而且繪製出的知識圖譜便如同圖8所示。
Figure 109111064-A0305-02-0015-4
接著,請參照圖9,圖9是本發明實施例之根據會員識別產生知識圖譜的流程圖。前述輸入資訊可以是關鍵字、主題名稱或會員識別,而圖9以輸入資訊為會員識別的例子,說明本發明的知識圖譜聯想搜尋方法如何根據會員識別產生知識圖譜。首先,在步驟S91中,知識圖譜聯想搜尋伺服器根據會員識別,搜尋會員已經讀過之文章,以獲得對應之文章識別。在步驟S92中,知識圖譜聯想搜尋伺服器於文章/關聯項目/分數資料庫搜尋,獲取相應於文章識別的關聯項目及其項目名稱。接著,在步驟S93中,知識圖譜聯想搜尋伺服器將步驟S92中獲取之所有文章的關聯項目及其項目名稱進行合併。之後,在步驟S94中,知識圖譜聯想搜尋伺服器根據合併之關聯項目及其項目名稱繪製對應之關鍵字的知識圖譜。在步驟S92中,更可以取得相應於文章識別的項目名稱的項目分數,以作為所述項目名稱是否被合併的基準,例如,項目分數過低的項目名稱則被捨棄,故不會出現在繪製的知識圖譜中。
根據會員識別產生的知識圖譜同樣地可以以至少兩階聯想字詞的方式呈現。然而,另一種做法則是將知識圖譜的內容轉換成以會員圖譜的方式來呈現。請參照圖10,圖10是本發明實施例之根據會員識別產生的知識圖譜的搜尋結果之示意圖。前述圖9中步驟S93中的合併結果是對應到兩階聯想字詞 的知識圖譜,然而,為了讓使用者可以看到更多細節,圖10的會員圖譜中的知識圖譜僅呈現了第一階聯想字詞,而第二階聯想字詞的部分則以其他圖譜(如,直方圖、長條圖、泡泡圖、分布圖、雷達圖或曲線圖,但不限制為上述圖表)的方式呈現。等效上來說,至少兩階的聯想字詞的知識圖譜仍然被呈現,僅是呈現方式不似圖6或圖8的方式。總而言之,圖10的會員圖譜仍可以視為至少兩階聯想字詞的知識圖譜。
接著,說明本發明另一實施例的知識圖譜聯想搜尋方法。請參照圖11,圖11是本發明另一實施例的知識圖譜聯想搜尋方法的流程圖。首先,在步驟S111中,知識圖譜聯想搜尋伺服器根據輸入資訊的類型判斷繪製選擇。如果輸入資訊為會員識別,則執行步驟S115~S118,以例如圖10的會員圖譜來呈現知識圖譜,如果輸入資訊為關鍵字或主題名稱,則執行步驟S112~S114與S116~S118,以例如圖6或圖8的方式來呈現知識圖譜。
於步驟S112中,知識圖譜聯想搜尋伺服器搜尋項目名稱/關聯項目資料庫,以在步驟S113中判斷關鍵字是否為項目名稱/關聯項目資料庫所記錄的項目名稱,或者主題名稱是否為項目名稱/關聯項目資料庫所記錄的主題名稱(即,判斷關鍵字是否為特定的關鍵字)。如果關鍵字是項目名稱/關聯項目資料庫所記錄的項目名稱或主題名稱是項目名稱/關聯項目資料庫所記錄的主題名稱,則在則步驟S113中,可以直接獲取對應的文章識別,且接著步驟S116被執行;否則,則接著執行步驟S114。
由於關鍵字不是項目名稱/關聯項目資料庫所記錄的項目名稱或主題名稱不是項目名稱/關聯項目資料庫所記錄的主題名稱,且須對文章內容進行搜尋,故在步驟S114中,將文章資料庫轉換為非關係型文章資料庫(如,Elastic Search(ES)文章資料庫),並根據關鍵字或主題名稱對非關係型文章資料庫進行搜尋,以獲得文章識別。另外,如果輸入資訊為會員識別,則在步驟S115 中,知識圖譜聯想搜尋伺服器搜尋會員資料庫,以獲得文章識別。在步驟S116中,依據獲取的文章識別,搜尋文章/關聯項目/分數資料庫,以獲取關聯項目及其項目名稱。然後,在步驟S117中,合併獲取之關聯項目及其項目名稱,以及在步驟S118中,根據合併之關聯項目及其項目名稱繪製對應之關鍵字的知識圖譜。在步驟S118中,會員圖譜的呈現方式可以是以圖6、圖8或圖10的方式呈現,且本發明不以此為限制。附帶一提的是,前述多個實施例的於文章/關聯項目/分數資料庫中進行搜尋的做法與合併獲取的關聯項目及其項目名稱的方式僅是實現本發明的其中幾種方式,其並非用於限制本發明。
接著,請參照圖12,圖12是本發明另一實施例之獲取文章/關聯項目/分數資料庫的流程圖。首先,在步驟S121中,知識圖譜聯想搜尋伺服器獲取文章資料庫,並進行將其轉換為非關係型文章資料庫。然後,在步驟S122中,知識圖譜聯想搜尋伺服器獲取項目名稱/關聯項目資料庫。接著,在步驟S123中,知識圖譜聯想搜尋伺服器使用項目名稱/關聯項目資料庫的項目名稱檢索關聯度較高的文章,再使用項目名稱/關聯項目資料庫的關聯項目檢索關聯度較高的文章。接著,在步驟S124中,知識圖譜聯想搜尋伺服器產生文章/關聯項目/分數資料庫。
進一步地說,在步驟S123中,使用項目名稱/關聯項目資料庫中的項目名稱搜尋文章資料庫的文章時,可同時獲得文章與項目名稱相關度,故在步驟S124中,可以決定文章的主題名稱與主題分數。在步驟S123中,使用項目名稱/關聯項目資料庫中的關聯項目下的每一個項目名稱搜尋文章資料庫的文章時,可同時獲得文章與關聯項目下之項目名稱的關聯度,故在步驟S124中,可以決定文章之關聯項目及其下的項目名稱與項目分數。如此,每一篇文章都有對應之主題名稱、關聯項目、項目名稱與項目分數,而每一篇文章的文章識 別、主題名稱、關聯項目、項目名稱與項目分數等資料便形成文章/關聯項目/分數資料庫。
除了使用獲取的項目名稱/關聯項目資料庫來對文章資料庫進行文章分析,並產生文章/關聯項目/分數資料庫外,亦可以透過詞庫來對文章資料庫進行文章分析來產生文章/關聯項目/分數資料庫。接著,請參照圖13,圖13是本發明又一實施例之獲取文章/關聯項目/分數資料庫的流程圖。首先,在步驟S131中,知識圖譜聯想搜尋伺服器獲取文章資料庫,並進行將其轉換為非關係型文章資料庫。然後,在步驟S132中,知識圖譜聯想搜尋伺服器獲取詞庫,其中詞庫的部分內容可以如同表四所示,其記錄有多個中文字詞、對應中文字詞的英文字詞與關聯項目。接著,在步驟S133中,知識圖譜聯想搜尋伺服器使用詞庫的項目名稱檢索關聯度較高的文章。接著,在步驟S134中,知識圖譜聯想搜尋伺服器產生文章/關聯項目/分數資料庫。
Figure 109111064-A0305-02-0018-5
進一步地說,在步驟S133中,使用詞庫中的中文字詞搜尋文章資料庫的文章時,可同時獲得文章與中文字詞的相關度,故在步驟S134中,可以決定文章的主題名稱、主題分數、關聯項目、項目名稱與項目分數。如此,每一篇文章都有對應之主題名稱、關聯項目、項目名稱與項目分數,而每一篇文章的文章識別、主題名稱、關聯項目、項目名稱與項目分數等資料便形成文章/關聯項目/分數資料庫。
綜上所述,本發明實施例的知識圖譜聯想搜尋系統與方法是根據輸入資訊於文章/關聯項目/分數資料庫中搜尋,以獲得相應的文章識別,並得到 相應的文章識別的文章的關聯項目與其下的項目名稱,並將得到的各關聯項目與其下的項目名稱進行合併,並根據合併的結果繪出以輸入資訊為根節點的知識圖譜作為搜尋結果的一部分。使用者即使不懂輸入資訊相應的其他聯想字詞,也能透過本發明得知相關聯的聯想字詞,並透過知識圖譜聯想搜尋系統提供的文章資料庫來學習相關知識。如此一來,有利於使用者快速且有效地學習相關知識。
本發明在上文中已以較佳實施例揭露,然熟習本項技術者應理解的是,上述實施例僅用於描繪本發明,而不應解讀為限制本發明之範圍。應注意的是,舉凡與前述實施例等效之變化與置換,均應視為涵蓋於本發明之範疇內。因此,本發明之保護範圍當以申請專利範圍所界定者為準。
S31~S33:步驟

Claims (10)

  1. 一種知識圖譜聯想搜尋方法,係執行於知識圖譜聯想搜尋伺服器,包括:接收來自於使用者之用戶裝置的輸入資訊;獲取文章/關聯項目/分數資料庫,其中所述文章/關聯項目/分數資料庫記錄有文章資料庫之多篇文章的文章識別、主題名稱、主題分數、關聯項目與項目名稱及其項目分數;於所述文章/關聯項目/分數資料庫中進行搜尋,以獲得對應於所述輸入資訊的至少一個文章識別之關聯項目與項目名稱;以及根據搜尋得到之對應於所述輸入資訊的至少一個文章識別之關聯項目與項目名稱產生知識圖譜,以作為搜尋結果的至少一部分。
  2. 如請求項1的知識圖譜聯想搜尋方法,其中於所述文章/關聯項目/分數資料庫中進行搜尋,以獲得對應於所述輸入資訊的多個文章識別之關聯項目與項目名稱,合併多個對應於所述輸入資訊的多個文章識別之關聯項目與項目名稱,並根據合併的所述多個關聯項目與所述多個項目名稱產生所述知識圖譜,以作為所述搜尋結果的至少一部分。
  3. 如請求項1的知識圖譜聯想搜尋方法,其中所述輸入資訊為關鍵字,根據所述關鍵字搜尋所述文章/關聯項目/分數資料庫或非關係型文章資料庫,以獲得對應的至少一個文章識別,並根據對應於所述關鍵字的所述文章識別,於所述文章/關聯項目/分數資料 庫中獲得對應於所述關鍵字的至少一個文章識別之關聯項目與項目名稱。
  4. 如請求項1的知識圖譜聯想搜尋方法,其中所述輸入資訊為主題名稱,於所述文章/關聯項目/分數資料庫搜尋對應輸入資訊之主題名稱的至少一個文章識別,並根據對應於所述主題名稱的所述文章識別,於所述文章/關聯項目/分數資料庫中獲得對應於所述主題名稱的至少一個文章識別之關聯項目與項目名稱。
  5. 如請求項1的知識圖譜聯想搜尋方法,其中所述輸入資訊為會員識別,根據所述會員識別於會員資料庫搜尋對應的至少一個文章識別,並根據對應於所述會員識別的所述文章識別,於所述文章/關聯項目/分數資料庫中獲得對應於所述會員識別的至少一個文章識別之關聯項目與項目名稱。
  6. 如請求項1的知識圖譜聯想搜尋方法,其中將所述文章資料庫轉換為非關係型文章資料庫,並根據詞庫或項目名稱/關聯項目資料庫對所述非關係型文章資料庫進行文章分析,以獲得所述文章/關聯項目/分數資料庫,其中所述項目名稱/關聯項目資料庫記錄有多個關聯項目與其對應的項目名稱,以及所述詞庫記錄有多個字詞及其對應的關聯項目。
  7. 如請求項1的知識圖譜聯想搜尋方法,其中所述知識圖譜的根節點用於呈現所述輸入資訊,所述根節點底下的第一階聯想字詞與第二階聯想字詞分別用於呈現對應於所述輸入資訊的文章識別之關聯項目與項目名稱。
  8. 如請求項7的知識圖譜聯想搜尋方法,其中所述搜尋結果為會員圖譜,所述會員圖譜呈現所述知識圖譜的根節點與第一階聯想字詞,所述知識圖譜的第二階聯想字詞以直方圖、長條圖、泡泡圖、分布圖、雷達圖或曲線圖呈現。
  9. 如請求項3的知識圖譜聯想搜尋方法,其中若所述關鍵字為特定關鍵字,則於所述文章/關聯項目/分數資料庫獲取對應所述關鍵字的至少一個文章識別,若所述關鍵字非為特定關鍵字,則於所述非關係型文章資料庫獲取對應所述關鍵字的至少一個文章識別。
  10. 一種知識圖譜聯想搜尋系統,包括:知識圖譜聯想搜尋伺服器;以及至少一個使用者的用戶裝置;其中所述知識圖譜聯想搜尋伺服器接收來自於使用者之用戶裝置的輸入資訊,並獲取文章/關聯項目/分數資料庫,其中所述文章/關聯項目/分數資料庫記錄有文章資料庫之多篇文章的文章識別、主題名稱、主題分數、關聯項目與項目名稱及其項目分數,所述知識圖譜聯想搜尋伺服器更於所述文章/關聯項目/分數資料庫中進行搜尋,以獲得對應於所述輸入資訊的至少一個文章識別之關聯項目與項目名稱,以及所述知識圖譜聯想搜尋伺服器根據搜尋得到之對應於所述輸入資訊的至少一個文章識別之關聯項目與項目名稱產生知識圖譜,以作為搜尋結果的至少一部分。
TW109111064A 2020-03-31 2020-03-31 知識圖譜聯想搜尋方法與系統 TWI747220B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW109111064A TWI747220B (zh) 2020-03-31 2020-03-31 知識圖譜聯想搜尋方法與系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW109111064A TWI747220B (zh) 2020-03-31 2020-03-31 知識圖譜聯想搜尋方法與系統

Publications (2)

Publication Number Publication Date
TW202139031A TW202139031A (zh) 2021-10-16
TWI747220B true TWI747220B (zh) 2021-11-21

Family

ID=79601176

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109111064A TWI747220B (zh) 2020-03-31 2020-03-31 知識圖譜聯想搜尋方法與系統

Country Status (1)

Country Link
TW (1) TWI747220B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488724A (zh) * 2013-09-16 2014-01-01 复旦大学 一种面向图书的阅读领域知识图谱构建方法
CN108920716A (zh) * 2018-07-27 2018-11-30 中国电子科技集团公司第二十八研究所 基于知识图谱的数据检索与可视化系统及方法
CN109064318A (zh) * 2018-08-24 2018-12-21 苏宁消费金融有限公司 一种基于知识图谱的互联网金融风险监测系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488724A (zh) * 2013-09-16 2014-01-01 复旦大学 一种面向图书的阅读领域知识图谱构建方法
CN108920716A (zh) * 2018-07-27 2018-11-30 中国电子科技集团公司第二十八研究所 基于知识图谱的数据检索与可视化系统及方法
CN109064318A (zh) * 2018-08-24 2018-12-21 苏宁消费金融有限公司 一种基于知识图谱的互联网金融风险监测系统

Also Published As

Publication number Publication date
TW202139031A (zh) 2021-10-16

Similar Documents

Publication Publication Date Title
KR101231560B1 (ko) 데이터 클러스터와 유의어의 탐색과 수정에 대한 방법 및 시스템
US8611651B1 (en) Scoring items
WO2018028443A1 (zh) 数据处理方法、设备及系统
WO2017096454A1 (en) Clustering documents based on textual content
US20120254143A1 (en) Natural language querying with cascaded conditional random fields
JP2019212292A (ja) イベント発見方法、装置、機器及びプログラム
US8582872B1 (en) Place holder image detection via image clustering
US8510312B1 (en) Automatic metadata identification
US20100306204A1 (en) Detecting duplicate documents using classification
US20180341686A1 (en) System and method for data search based on top-to-bottom similarity analysis
WO2019218527A1 (zh) 多系统相结合的自然语言处理方法及装置
WO2017113592A1 (zh) 模型生成方法、词语赋权方法、装置、设备及计算机存储介质
WO2020248379A1 (zh) 一种相似网络页面的搜索方法及设备
CN108228612B (zh) 一种提取网络事件关键词以及情绪倾向的方法及装置
Leung et al. Benchmarking for content-based visual information search
Savva et al. On being the right scale: Sizing large collections of 3D models
CN110019474B (zh) 异构数据库中的同义数据自动关联方法、装置及电子设备
JP4855080B2 (ja) スキーマ統合支援装置、スキーマ統合支援装置のスキーマ統合支援方法およびスキーマ統合支援プログラム
JP4426041B2 (ja) カテゴリ因子による情報検索方法
JPWO2007088576A1 (ja) ファイル検索プログラム、方法及び装置
CN110874366A (zh) 数据处理、查询方法和装置
TWI747220B (zh) 知識圖譜聯想搜尋方法與系統
CN116610810A (zh) 基于调控云知识图谱血缘关系的智能搜索方法及系统
TWM604414U (zh) 知識圖譜聯想搜尋伺服器與其系統
JP5310196B2 (ja) 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法