TWI687823B - 內容推薦方法及裝置 - Google Patents
內容推薦方法及裝置 Download PDFInfo
- Publication number
- TWI687823B TWI687823B TW107143560A TW107143560A TWI687823B TW I687823 B TWI687823 B TW I687823B TW 107143560 A TW107143560 A TW 107143560A TW 107143560 A TW107143560 A TW 107143560A TW I687823 B TWI687823 B TW I687823B
- Authority
- TW
- Taiwan
- Prior art keywords
- information
- keyword
- domain
- content information
- content
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24573—Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24522—Translation of natural language queries to structured queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/282—Hierarchical databases, e.g. IMS, LDAP data stores or Lotus Notes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
Abstract
本說明書披露的實施例提供一種內容推薦方法,該方法包括:首先,獲取內容資訊庫中的內容資訊,並確定與該內容資訊相關的關鍵詞資訊。以及,確定與該內容資訊對應的特定領域,並獲取與該特定領域對應的領域知識資訊。接著,根據該領域知識資訊從關鍵詞資訊中確定內容資訊的特徵標籤。然後,根據該特徵標籤和用戶的屬性標籤,從內容資訊庫中確定向用戶推薦的內容推薦信。
Description
本說明書披露的多個實施例涉及網際網路技術領域,尤其涉及一種內容推薦方法及裝置。
隨著網際網路技術的發展,人們越來越頻繁地瀏覽網路平台提供的內容資訊。例如,在網路購物平台中瀏覽商品資訊,或者在新聞平台瀏覽焦點資訊,或者在理財平台瀏覽理財資訊,或者在支付平台瀏覽支付服務資訊等。
不同用戶在使用同一網路平台時,對其提供的內容資訊的需求有著或多或少的差異。另一方面,網路平台中資訊的巨量增長也常常讓用戶難以選擇。目前,向用戶推薦的內容資訊由於存在不夠精準等不足,難以滿足用戶的個性化需求。因此,需要提供一種合理的方法,以滿足用戶瀏覽網路平台中提供的內容資訊的多種需求。
本說明書描述了一種內容推薦方法及裝置,透過確定與內容資訊對應的特定領域以及與特徵領域對應的領域知識資訊,進而確定內容資訊的特徵標籤,並結合用戶的屬性標籤向用戶推薦更加精準的內容資訊。
第一方面,提供了一種內容推薦方法。該方法包括:
獲取內容資訊庫中的內容資訊,並確定所述內容資訊的關鍵詞資訊;
確定與所述內容資訊對應的特定領域;
獲取與所述特定領域對應的領域知識資訊;
根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤;
根據用戶的屬性標籤和所述特徵標籤,從所述內容資訊庫中確定向所述用戶推薦的內容推薦資訊。
在一種可能的實施方式中,所述領域知識資訊包括領域層級知識,所述領域層級知識包括領域名稱,與所述領域名稱對應的類別名稱,以及與所述類別名稱對應的特徵單詞。
在一種可能的實施方式中,所述特徵單詞基於內容語料庫中的內容語料訓練而獲得。
在一種可能的實施方式中,所述根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤包括:
確定與所述內容資訊對應的特定類別;
在所述領域層級知識中,確定與所述特定類別對應的特定類別名稱,以及與所述特定類別名稱對應的特徵單詞;
根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述內容資訊包括類別標籤,所述確定與所述內容資訊對應的特定類別,包括:
根據所述類別標籤確定與所述內容資訊對應的特定類別。
在一種可能的實施方式中,所述根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括:
將所述關鍵詞資訊中與所述特徵單詞匹配的關鍵詞資訊作為所述特徵標籤。
在一種可能的實施方式中,所述關鍵詞資訊包括多個關鍵詞和各個關鍵詞的排序資訊,所述根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括:
根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵單詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序;
將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述領域知識資訊包括領域知識圖譜,所述領域知識圖譜在其第一層包括與領域對應的實體詞,在其第二層包括與所述實體詞對應的關聯詞,所述實體詞和所述關聯詞組合構成特徵組合詞。
在一種可能的實施方式中,所述根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤包括:
確定與所述特定領域對應的領域知識圖譜中包括的特徵組合詞;
根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括:
將所述關鍵詞資訊中與所述特徵組合詞匹配的關鍵詞資訊作為所述特徵標籤。
在一種可能的實施方式中,所述關鍵詞資訊包括多個關鍵詞和各個關鍵詞的排序資訊,所述根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括:
根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵組合詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序;
將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述屬性標籤基於所述用戶的歷史瀏覽內容確定。
在一種可能的實施方式中,所述從內容資訊庫中確定向所述用戶推薦的內容推薦資訊,包括:
將與所述屬性標籤匹配的特徵標籤所對應的內容資訊,作為向所述用戶推薦的候選內容資訊;
根據預設規則對所述候選內容資訊中的各個內容資訊進行排名,並將名次在預設範圍內的內容資訊作為所述內容推薦資訊。
第二方面,提供了一種內容推薦裝置。該裝置包括:
第一獲取模組,用於獲取內容資訊庫中的內容資訊;
第一確定模組,用於確定所述內容資訊的關鍵詞資訊;
第二確定模組,用於確定與所述內容資訊對應的特定領域;
第二獲取模組,用於獲取與所述特定領域對應的領域知識資訊;
第三確定模組,用於根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤;
處理模組,用於根據用戶的屬性標籤和所述特徵標籤,從所述內容資訊庫中確定向所述用戶推薦的內容推薦資訊。
在一種可能的實施方式中,所述第二獲取模組獲取的領域知識資訊包括領域層級知識,所述領域層級知識包括領域名稱,與所述領域名稱對應的類別名稱,以及與所述類別名稱對應的特徵單詞。
在一種可能的實施方式中,所述第二獲取模組獲取的所述特徵單詞基於內容語料庫中的內容語料訓練而獲得。
在一種可能的實施方式中,所述第三確定模組具體包括:
第一確定子模組,用於確定與所述內容資訊對應的特定類別;
第二確定子模組,用於在所述領域層級知識中,確定與所述特定類別對應的特定類別名稱,以及與所述特定類別名稱對應的特徵單詞;
第三確定子模組,根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述第一獲取模組獲取的內容資訊包括類別標籤,所述第一確定子模組具體用於:
根據所述類別標籤確定與所述內容資訊對應的特定類別。
在一種可能的實施方式中,所述第三確定子模組具體用於:
將所述關鍵詞資訊中與所述特徵單詞匹配的關鍵詞資訊作為所述特徵標籤。
在一種可能的實施方式中,所述第一確定模組確定的關鍵詞資訊中包括多個關鍵詞和各個關鍵詞的排序資訊,所述第三確定子模組具體用於:
根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵單詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序;
將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述第二獲取模組獲取的領域知識資訊包括領域知識圖譜,所述領域知識圖譜在其第一層包括與領域對應的實體詞,在其第二層包括與所述實體詞對應的關聯詞,所述實體詞和所述關聯詞組合構成特徵組合詞。
在一種可能的實施方式中,所述第三確定模組具體包括:
第二確定子模組,用於確定與所述特定領域對應的領域知識圖譜中包括的特徵組合詞;
第三確定子模組,用於根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述第三確定子模組具體用於:
將所述關鍵詞資訊中與所述特徵組合詞匹配的關鍵詞資訊作為所述特徵標籤。
在一種可能的實施方式中,所述第一確定模組確定的關鍵詞資訊中包括多個關鍵詞和各個關鍵詞的排序資訊,所述第三確定子模組具體用於:
根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵組合詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序;
將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述處理模組中包括的屬性標籤基於所述用戶的歷史瀏覽內容確定。
在一種可能的實施方式中,所述處理模組具體用於:
將與所述屬性標籤匹配的特徵標籤所對應的內容資訊,作為向所述用戶推薦的候選內容資訊;
根據預設規則對所述候選內容資訊中的各個內容資訊進行排名,並將名次在預設範圍內的內容資訊作為所述內容推薦資訊。
第三方面,提供了一種電腦可讀儲存媒體,其上儲存有電腦程式。當所述電腦程式在電腦中執行時,令電腦執行上述第一方面中任一種實施方式提供的方法。
第四方面,提供了一種計算設備,包括記憶體和處理器。所述記憶體中儲存有可執行碼,所述處理器執行所述可執行碼時,實現上述第一方面中任一種實施方式提供的方法。
本說明書提供的一種內容推薦方法及裝置,首先,獲取內容資訊庫中的內容資訊,並確定與該內容資訊相關的關鍵詞資訊。以及,確定與該內容資訊對應的特定領域,並獲取與該特定領域對應的領域知識資訊。接著,根據該領域知識資訊從關鍵詞資訊中確定內容資訊的特徵標籤。然後,根據該特徵標籤和用戶的屬性標籤,從內容資訊庫中確定向用戶推薦的內容推薦信。透過採用這種方式,實現向用戶推薦更加精準的內容資訊。
下面結合附圖,對本說明書披露的多個實施例進行描述。
圖1為本說明書披露的一個實施例提供的一種內容推薦方法的流程圖。所述方法的執行主體可以為具有處理能力的設備:伺服器或者系統或者裝置。如圖1所示,所述方法具體包括:
步驟S110,獲取內容資訊庫中的內容資訊,並確定該內容資訊的關鍵詞資訊。
具體地,內容資訊庫中可以包括在有效期內的內容資訊。其中,有效期可以根據內容資訊所對應業務的業務屬性(如,對時效性的要求)設定。例如,可以將新聞業務所對應的內容資訊的有效期設置為1天。又例如,可以將科普知識業務所對應的內容資訊的有效期設置為1個月。
內容資訊可以包括圖文資訊(如,圖片、文章等)或音視訊資訊(如,音訊、視訊廣告等)。
確定內容資訊的關鍵詞資訊,可以包括:確定內容資訊的文本資訊,並根據文本資訊確定關鍵詞資訊。
在一個實施例中,內容資訊包括視訊廣告,此時,可以從視訊中提取文字資訊以及將其中的音訊資訊轉化為文字資訊,並根據其中的文字資訊確定視訊廣告的關鍵詞資訊;或者,內容資訊包括視訊廣告和該視訊廣告的文本介紹資訊,則可以根據文本介紹資訊確定視訊廣告的關鍵詞資訊。
在另一個實施例中,內容資訊包括文章,此時,可以直接確定該文章中的文本資訊。
進一步地,根據文本資訊確定關鍵詞資訊,可以包括:對文本資訊進行結構化分析、分詞處理、去停用詞處理、詞性標注和命名實體識別中的至少一種預處理。以及採用關鍵詞提取演算法,從經過預處理後的文本資訊中確定關鍵詞資訊。
其中,結構化分析可以包括對文本資訊中段落結構的分析,例如,判斷出文本資訊中的標題和正文,以及正文中的段落結構;分詞處理可以包括一元分詞(unigram)、二元分詞(bigram)、三元分詞(trigram)等;去停用詞可以包括根據預設的停用詞表去除文本資訊中的停用詞(如,無實際意義的功能詞:這、那、的);詞性標注可以包括對文本資訊中的詞語的詞性(如,名詞、副詞、形容詞等)進行標注;命名實體識別(Named Entity Recognition,簡稱NER)可以包括識別文本資訊中具有特定意義的實體(如,人名、地名、機構名、專有名詞等);關鍵詞提取演算法可以包括TextRank演算法和TF-IDF(Term Frequency-inverse Document Frequency)演算法等。
在一個例子中,經過預處理後的文本資訊中包括多個詞語,以及各個詞語在文本資訊中的位置(如,位於標題中或位於正文中)、標注的詞性等。相應地,可以採用關鍵詞提取演算法,從經過預處理後的文本資訊中加權識別出關鍵詞資訊。
步驟S120,確定與內容資訊對應的特定領域。
在一個實施例中,內容資訊中可以包括領域標籤。相應地,確定與內容資訊對應的特定領域,可以包括:根據領域標籤確定與內容資訊對應的特定領域。其中,領域標籤可以由內容資訊的創建者為該內容資訊便於用戶搜索而定義產生。
在一個例子中,內容資訊中包括的領域標籤為“出行服務”,相應地可以確定出與該內容資訊對應的特定領域為出行服務。
在另一個實施例中,可以根據步驟S110中確定出的關鍵詞資訊,進一步確定與內容資訊對應的特定領域。在一個例子中,關鍵詞資訊中包括領域資訊,相應地,可以根據領域資訊確定出與內容資訊對應的特定領域。
在步驟S120中確定與內容資訊對應的特定領域後,接著,在步驟S130,獲取與特定領域對應的領域知識資訊。
具體地,伺服器中可以儲存有預先設定的領域知識資訊,該領域知識資訊可以包括領域層級知識和領域知識圖譜中的至少一種。其中,領域層級知識可以包括領域名稱,與該領域名稱對應的類別名稱,以及與該類別名稱對應的特徵單詞;領域知識圖譜可以在其第一層包括與領域對應的實體詞,在其第二層包括與實體詞對應的關聯詞,且實體詞和與之對應的關聯詞可以組合構成特徵組合詞。
需要說明的是,領域層級知識中包括的領域名稱和類別名稱可以基於目前通用的知識體系(如,知識體系中可以包括領域和學科的劃分)進行設定。此外,領域層級知識中包括的特徵單詞,可以基於內容語料庫中的大量內容語料進行訓練而獲得。
領域知識圖譜可以基於內容語料庫中的大量內容語料處理而獲得。更具體地,首先,可以透過NER識別與領域對應的實體詞(如,專有名詞等),例如,可以識別出與領域“出行服務”對應的專有名詞“駕照”等。然後,可以透過模板提取、詞間相關性和互資訊熵等方式確定與實體詞對應的關聯詞。其中,模板提取方式可以包括設定一個模板(如,駕照XX的發照),然後利用模板從內容語料中提取關聯詞(如,新規定);詞間相關性方式可以包括利用長度為預定字符數(如,5個字符)的滑動窗口,提取出在滑動窗口中與實體詞同時出現的詞語,並將這些詞語中出現頻率達到預定次數(如,10次)的詞語作為關聯詞;互資訊熵方式可以包括確定內容語料包括的詞語中與實體詞之間的相似度,並將相似度高於預設值(如,0.6)的詞語作為關聯詞。
在一個實施例中,可以獲取與步驟S120中確定的特定領域對應的領域層級知識和/領域知識圖譜。
在一個實施例中,獲取的與特定領域對應的領域層級知識中,可以包括與該特定領域對應的多個類別名稱,以及與多個類別名稱中各個類別名稱對應的多個特徵單詞。
在一個例子中,在步驟S120中確定的特定領域為出行服務,據此可以獲取與出行服務對應的如圖2所示的領域層級知識。圖2中,領域名稱為出行服務,與出行服務對應的類別名稱包括:汽車、飛機、火車和地鐵等。與汽車對應特徵單詞包括:保養、加油、洗車等,與飛機對應的特徵單詞包括:里程、經濟艙、頭等艙等(圖2中未示出與地鐵、火車等其他類別對應的特徵單詞)。
在一個實施例中,單個領域中可以包括多個實體詞,相應地,與該領域對應的領域知識圖譜可以有多個。各個領域知識圖譜在其第一層可以包括實體詞,在第二層可以包括與該實體詞對應的多個關聯詞。
在一個例子中,在步驟S120中確定的特定領域為出行服務,據此可以獲取與出行服務對應的多個領域知識圖譜。例如,獲取的多個領域知識圖譜中可以包括如圖4所示的領域知識圖譜。圖4中,實體詞是駕照,與實體詞對應的關聯詞包括扣分、新規定、查詢違規、換照、年審等。
在步驟S110中確定出內容資訊的關鍵詞資訊,以及在步驟S130中獲取到與特定領域對應的領域知識資訊後,在步驟S140中,根據領域知識資訊從關鍵詞資訊中確定內容資訊的特徵標籤。
具體地,將關鍵詞資訊中與領域知識資訊相匹配的關鍵詞資訊作為內容資訊的特徵標籤。或者,根據領域知識資訊對關鍵詞資訊進行排名,並將排名在預設範圍內的關鍵詞資訊作為內容資訊的特徵標籤。
在一個實施例中,在步驟S130中獲取的領域知識資訊可以至少包括領域層級知識,根據該領域層級知識從關鍵詞資訊中確定內容資訊的特徵標籤,可以包括:確定與內容資訊對應的特定類別;在領域層級知識中,確定與特定類別對應的特定類別名稱,以及與特定類別名稱對應的特徵單詞;根據特徵單詞確定內容資訊的特徵標籤。
在一個例子中,內容資訊可以包括類別標籤。相應地,確定與內容資訊對應的特定類別,可以包括:根據類別標籤確定與內容資訊對應的特定類別。其中,類別標籤可以由內容資訊的創建者為該內容資訊便於用於搜索而定義產生。例如,內容資訊中包括的類別標籤為“汽車”,相應地可以確定出與該內容資訊對應的特定類別為汽車。
在另一個例子中,可以根據步驟S110中確定出的關鍵詞資訊,進一步確定與內容資訊對應的特定類別。在一個例子中,關鍵詞資訊中包括類別資訊,相應地,可以根據類別資訊確定出與內容資訊對應的特定類別。
在一個例子中,確定的與內容資訊對應的特定類別為汽車,在步驟S130中獲取的領域層級知識如圖2所示。據此,可以在領域層級知識中,確定與特定類別(汽車)對應的特定類別名稱為汽車,以及與類別名稱(汽車)對應的特徵單詞包括:保養、加油和洗車等。
在一個例子中,根據特徵單詞確定內容資訊的特徵標籤,可以包括:將關鍵詞資訊中與特徵單詞匹配的關鍵詞資訊作為特徵標籤。例如,確定的特徵單詞包括:保養、加油、洗車等,據此可以從關鍵詞資訊(如,包括:保養、洗車等)確定出包括保養、洗車的特徵標籤。
在另一例子中,關鍵詞資訊中可以包括多個關鍵詞以及各個關鍵詞的權重資訊。相應地,根據特徵單詞確定內容資訊的特徵標籤,可以包括:根據各個關鍵詞與特徵單詞的匹配情況,更新所述多個關鍵詞的權重;將更新後的權重大於預設閾值的關鍵詞作為內容資訊的特徵標籤。比如說,當關鍵詞(如,洗車)與某個特徵單詞(洗車)完全匹配時,可以將該關鍵詞的權重值增加第一預設值(如,0.1);當關鍵詞(如,自動洗車)與某個特徵單詞(洗車)部分匹配時,可以將該關鍵詞的權重值增加第二預設值(如,0.05);當關鍵詞與所有特徵單詞均不匹配時,可以保持該關鍵詞原有的權重值。如此,可以更新各個關鍵詞的權重值。對於更新了權重的關鍵詞,判斷其最終權重是否大於預設閾值(如0.5),將權重值大於預設閾值的關鍵詞作為特徵標籤。
進一步地,在另一個例子中,關鍵詞資訊中還可以包括多個關鍵詞以及各個關鍵詞對應的排序資訊(如,可以根據權重進行排序)。相應地,根據特徵單詞確定內容資訊的特徵標籤,可以包括:根據各個關鍵詞與特徵單詞的匹配情況以及原有的排序資訊,對多個關鍵詞進行重新排序;將經過重新排序後的位於預定順序範圍內的關鍵詞資訊作為內容資訊的特徵標籤。其中,預定順序範圍可以提前設定或即時修改。
例如,排序資訊可包括各個關鍵詞的權重值,可以根據各個關鍵詞與特徵單詞的匹配情況(如,是否匹配)更新該關鍵詞的權重值。更新權重值的方式可以如之前例子所述。然後,根據更新後的權重值對多個關鍵詞進行排序,並將位於預定順序範圍(如,前十位)內的關鍵詞資訊作為特徵標籤。
在另一個實施例中,在步驟S130中獲取的領域知識資訊可以至少包括領域知識圖譜,根據該領域知識圖譜從關鍵詞資訊中確定內容資訊的特徵標籤,可以包括:確定該領域知識圖譜中包括的特徵組合詞;根據特徵組合詞從關鍵詞資訊中確定內容資訊的特徵標籤。在一個例子中,在步驟S130中可以獲取包括如圖4所示的領域知識圖譜。圖4中的實體詞為駕照,與駕照對應的關聯詞包括:扣分、新規定、查詢違規、換照和年審等。相應地,可以確定出其中的特徵組合詞包括:“駕照-扣分”、“駕照-新規定”、“駕照-查詢違規”、“駕照-換照”和“駕照-年審”等。
在一個例子中,根據特徵組合詞確定內容資訊的特徵標籤,可以包括:將關鍵詞資訊中與特徵組合詞匹配的關鍵詞資訊作為特徵標籤。例如,確定的特徵組合詞包括:駕照-扣分、駕照-新規定、駕照-查詢違規、駕照-換照和駕照-年審等,據此可以從關鍵詞資訊(如,包括:駕照、扣分、新規定、駕照年審等)確定出包括駕照-扣分、駕照-新規定、駕照-年審的特徵標籤。
在另一例子中,關鍵詞資訊中可以包括多個關鍵詞以及各個關鍵詞的權重資訊。相應地,根據特徵組合詞確定內容資訊的特徵標籤,可以包括:根據各個關鍵詞與特徵組合詞的匹配情況,更新所述多個關鍵詞的權重;將更新後的權重大於預設閾值的關鍵詞作為內容資訊的特徵標籤。
在另一個例子中,關鍵詞資訊中可以包括多個關鍵詞以及各個關鍵詞對應的排序資訊(如,可以根據權重進行排序)。相應地,根據特徵組合詞確定內容資訊的特徵標籤,可以包括:根據各個關鍵詞與特徵組合詞的匹配情況以及原有的排序資訊,對多個關鍵詞進行重新排序;將經過重新排序後的位於預定順序範圍內的關鍵詞資訊作為內容資訊的特徵標籤。
例如,排序資訊可包括各個關鍵詞的權重值,可以根據各個關鍵詞與特徵組合詞的匹配情況(如,是否匹配)更新該關鍵詞的權重值。比如說,當關鍵詞(如,駕照-扣分)與某個特徵組合詞(駕照-扣分)完全匹配時,可以將該關鍵詞的權重值增加第一預設值(如,0.1);當關鍵詞(如,駕照)與某個特徵組合詞(駕照-扣分)部分匹配時,可以將該關鍵詞的權重值增加第二預設值(如,0.05);當關鍵詞與所有特徵組合詞均不匹配時,可以保持該關鍵詞原有的權重值。然後,根據更新後的權重值對多個關鍵詞進行排序,並將位於預定順序範圍(如,前五位)內的關鍵詞資訊作為特徵標籤。
在步驟S140中確定內容資訊的特徵標籤後,接著,在步驟S150,根據用戶的屬性標籤和特徵標籤,從內容資訊庫中確定向用戶推薦的內容推薦資訊。
具體地,用戶的屬性標籤可以基於用戶的歷史瀏覽內容確定。在一個實施例中,可以根據用戶的歷史瀏覽內容的特徵標籤,確定用戶的屬性標籤。其中特徵標籤可以透過執行上述步驟S110-步驟S140而獲得,區別在於步驟S110中不是獲取內容資訊庫中的內容資訊,而是獲取用戶的歷史瀏覽內容。
在一個實施例中,從內容資訊庫中確定向用戶推薦的內容推薦資訊,可以包括:將與屬性標籤匹配的特徵標籤所對應的內容資訊,作為內容推薦資訊。
在另一實施例中,從特徵標籤與屬性標籤相匹配的內容資訊中,按照預設規則進行進一步篩選,來確定最終的內容推薦資訊。具體而言,在一個例子中,從內容資訊庫中確定向用戶推薦的內容推薦資訊包括,將與屬性標籤匹配的特徵標籤所對應的內容資訊,作為向用戶推薦的候選內容資訊;以及根據預設規則對候選內容資訊中的各個內容資訊進行排名,並將名次在預設範圍內的內容資訊作為內容推薦資訊。
在一個例子中,預設規則可以包括特徵標籤的權重值,根據預設規則對候選內容資訊中的各個內容資訊進行排名,可以包括:根據候選內容資訊中各個內容資訊所對應的特徵標籤以及特徵標籤的權重值,透過加權求和的方式確定該內容資訊的評分,並根據評分對各個內容資訊進行排名。
在一個例子中,預設範圍可以根據與內容資訊相關的業務規則進行設定,例如,內容資訊屬於科技資訊,其業務規則可以包括向用戶推薦名次排在前五位的內容資訊。又例如,內容資訊屬於音樂欄目,其業務規則可以包括向用戶推薦名次排在前十位的內容資訊。
需要說明的是,可以在根據步驟S110-S140確定出用戶的屬性標籤後,直接從內容資訊庫中確定向用戶推薦的內容推薦資訊。具體地,可以根據包括第一用戶在內的多個用戶的屬性標籤確定多個用戶之間的相似度,並從多個用戶中確定與第一用戶的相似度在預設閾值範圍內的多個第二用戶。然後,根據多個第二用戶對內容資訊庫中內容資訊的瀏覽記錄,從內容資訊庫中確定向第一用戶推薦的內容推薦資訊。
另外,單個內容資訊可以與多個領域相關。相應地,在步驟S120中,可以確定與該內容資訊對應的多個特定領域,再在步驟S130中可以獲取與各個特定領域對應的領域知識資訊(如,領域層級知識和/或領域知識圖譜)。
在一個實施例中,在步驟S130中可以獲取與各個特定領域對應的領域層級知識,進而在步驟S140中確定內容資訊在各個特定領域中所對應的特定類別,以及與各個特定類別對應的特徵單詞,以及根據該特徵單詞確定內容資訊的特徵標籤。
在另一個實施例中,在步驟S130中可以獲取與各個特定領域對應的領域知識圖譜,進而在步驟S140中確定各個領域知識圖譜中包括的特徵組合詞,以及根據該特徵組合詞確定內容資訊的特徵標籤。
此外,領域知識資訊中包括的領域層級知識和領域知識圖譜的主要區別在於:第一,領域層級知識中的特徵單詞包括單個的詞語,領域知識圖譜中的特徵組合詞包括由至少兩個單詞組合的詞語。第二,領域層級知識中的特徵單詞主要是與類別强相關(也就是能夠根據該詞語明確推測出其所屬的一個或幾個類別)的詞語(如,特徵單詞“洗車”通常屬於汽車類別),而對於某些在所有類別都存在、但是在不同類別下具有不同語義的詞語(如,新規定)可能不會被設定為特徵單詞。而基於領域知識圖譜可以透過提取組合詞(如,駕照-新規定)的方式確定出在領域中具有明確語義的特徵資訊。顯然,在上述方法中,既可以單獨使用領域層級知識或領域知識圖譜,也可以將領域層級知識和領域知識圖譜結合起來使用,以確定內容資訊的特徵標籤,進而確定向用戶推薦的內容推薦資訊。
由上可知,在本說明書披露的多個實施例提供的內容推薦方法中,首先,獲取內容資訊庫中的內容資訊,並確定與該內容資訊相關的關鍵詞資訊。以及,確定與該內容資訊對應的特定領域,並獲取與該特定領域對應的領域知識資訊。接著,根據該領域知識資訊從關鍵詞資訊中確定內容資訊的特徵標籤。然後,根據該特徵標籤和用戶的屬性標籤,從內容資訊庫中確定向用戶推薦的內容推薦信。透過採用這種方法,實現向用戶推薦更加精準的內容資訊。
與內容推薦方法對應地,本說明書披露的多個實施例還提供一種內容推薦裝置,如圖4所示,該裝置400包括:
第一獲取模組410,用於獲取內容資訊庫中的內容資訊;
第一確定模組420,用於確定內容資訊的關鍵詞資訊;
第二確定模組430,用於確定與內容資訊對應的特定領域;
第二獲取模組440,用於獲取與特定領域對應的領域知識資訊;
第三確定模組450,用於根據領域知識資訊從關鍵詞資訊中確定內容資訊的特徵標籤;
處理模組460,用於根據用戶的屬性標籤和特徵標籤,從內容資訊庫中確定向用戶推薦的內容推薦資訊。
在一種可能的實施方式中,確定子模組中的關鍵詞提取演算法包括TF-IDF演算法和TextRank演算法中的至少一種。
在一種可能的實施方式中,第一獲取模組410獲取的內容資訊包括領域標籤,第二確定模組430具體用於:
根據領域標籤確定與內容資訊對應的特定領域。
在一種可能的實施方式中,第二獲取模組440獲取的領域知識資訊包括領域層級知識,領域層級知識包括領域名稱,與領域名稱對應的類別名稱,以及與類別名稱對應的特徵單詞。
在一種可能的實施方式中,第二獲取模組440獲取的特徵單詞基於內容語料庫中的內容語料訓練而獲得。
在一種可能的實施方式中,第三確定模組450具體包括:
第一確定子模組451,用於確定與內容資訊對應的特定類別;
第二確定子模組452,用於在領域層級知識中,確定與特定類別對應的特定類別名稱,以及與特定類別名稱對應的特徵單詞;
第三確定子模組453,根據特徵單詞從關鍵詞資訊中確定內容資訊的特徵標籤。
在一種可能的實施方式中,第一獲取模組410獲取的內容資訊包括類別標籤,第一確定子模組451具體用於:
根據類別標籤確定與內容資訊對應的特定類別。
在一種可能的實施方式中,第三確定子模組453具體用於:
將關鍵詞資訊中與特徵單詞匹配的關鍵詞資訊作為特徵標籤。
在一種可能的實施方式中,第一確定模組420確定的關鍵詞資訊中包括多個關鍵詞和各個關鍵詞的排序資訊,第三確定子模組453具體用於:
根據關鍵詞資訊中各個關鍵詞與特徵單詞的匹配情況,以及排序資訊,對多個關鍵詞重新排序;
將經過重新排序後的位於預定順序範圍內的關鍵詞資訊作為內容資訊的特徵標籤。
在一種可能的實施方式中,第二獲取模組440獲取的領域知識資訊包括領域知識圖譜,領域知識圖譜在其第一層包括與領域對應的實體詞,在其第二層包括與實體詞對應的關聯詞,實體詞和關聯詞組合構成特徵組合詞。
在一種可能的實施方式中,第三確定模組450具體包括:
第二確定子模組452,用於確定與特定領域對應的領域知識圖譜中包括的特徵組合詞;
第三確定子模組453,用於根據特徵組合詞從關鍵詞資訊中確定內容資訊的特徵標籤。
在一種可能的實施方式中,第三確定子模組453具體用於:
將關鍵詞資訊中與特徵組合詞匹配的關鍵詞資訊作為特徵標籤。
在一種可能的實施方式中,第一確定模組420確定的關鍵詞資訊中包括多個關鍵詞和各個關鍵詞的排序資訊,第三確定子模組453具體用於:
根據關鍵詞資訊中各個關鍵詞與特徵組合詞的匹配情況,以及排序資訊,對多個關鍵詞重新排序;
將經過重新排序後的位於預定順序範圍內的關鍵詞資訊作為內容資訊的特徵標籤。
在一種可能的實施方式中,處理模組460中包括的屬性標籤基於用戶的歷史瀏覽內容確定。
在一種可能的實施方式中,處理模組460具體用於:
將與屬性標籤匹配的特徵標籤所對應的內容資訊,作為向用戶推薦的候選內容資訊;
根據預設規則對候選內容資訊中的各個內容資訊進行排名,並將名次在預設範圍內的內容資訊作為內容推薦資訊。
由上可知,在本說明書披露的多個實施例提供的內容推薦裝置中,首先,第一獲取模組410獲取內容資訊庫中的內容資訊,第一確定模組420確定與該內容資訊相關的關鍵詞資訊,第二確定模組430確定與該內容資訊對應的特定領域,第二獲取模組440獲取與該特定領域對應的領域知識資訊。接著,第三確定模組450根據該領域知識資訊從關鍵詞資訊中確定內容資訊的特徵標籤。然後,處理模組460根據該特徵標籤和用戶的屬性標籤,從內容資訊庫中確定向用戶推薦的內容推薦信。透過採用這種裝置,實現向用戶推薦更加精準的內容資訊。
本領域技術人員應該可以意識到,在上述一個或多個示例中,本說明書披露的多個實施例所描述的功能可以用硬體、軟體、韌體或它們的任意組合來實現。當使用軟體實現時,可以將這些功能儲存在電腦可讀媒體中或者作為電腦可讀媒體上的一個或多個指令或碼進行傳輸。
以上所述的具體實施方式,對本說明書披露的多個實施例的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本說明書披露的多個實施例的具體實施方式而已,並不用於限定本說明書披露的多個實施例的保護範圍,凡在本說明書披露的多個實施例的技術方案的基礎之上,所做的任何修改、等同替換、改進等,均應包括在本說明書披露的多個實施例的保護範圍之內。
400‧‧‧內容推薦裝置
410‧‧‧第一獲取模組
420‧‧‧第一確定模組
430‧‧‧第二確定模組
440‧‧‧第二獲取模組
450‧‧‧第三確定模組
451‧‧‧第一確定子模組
452‧‧‧第二確定子模組
453‧‧‧第三確定子模組
460‧‧‧處理模組
為了更清楚地說明本說明書披露的多個實施例的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本說明書披露的多個實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其它的附圖。
圖1為本說明書披露的一個實施例提供的一種內容推薦方法的流程圖;
圖2為本說明書披露的一個實施例提供的領域層級知識的示意圖;
圖3為本說明書披露的一個實施例提供的領域知識圖譜的示意圖;
圖4為本說明書披露的一個實施例提供的一種內容推薦裝置的結構圖。
Claims (18)
- 一種內容推薦方法,其特徵在於,包括:獲取內容資訊庫中的內容資訊,並確定所述內容資訊的關鍵詞資訊;確定與所述內容資訊對應的特定領域;獲取與所述特定領域對應的領域知識資訊;根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤;根據用戶的屬性標籤和所述特徵標籤,從所述內容資訊庫中確定向所述用戶推薦的內容推薦資訊,其中,所述領域知識資訊包括領域知識圖譜,所述領域知識圖譜在其第一層包括與領域對應的實體詞,在其第二層包括與所述實體詞對應的關聯詞,所述實體詞和所述關聯詞組合構成特徵組合詞。
- 根據申請專利範圍第1項所述的方法,其中,所述領域知識資訊包括領域層級知識,所述領域層級知識包括領域名稱,與所述領域名稱對應的類別名稱,以及與所述類別名稱對應的特徵單詞。
- 根據申請專利範圍第2項所述的方法,其中,所述根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤包括: 確定與所述內容資訊對應的特定類別;在所述領域層級知識中,確定與所述特定類別對應的特定類別名稱,以及與所述特定類別名稱對應的特徵單詞;根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
- 根據申請專利範圍第3項所述的方法,其中,所述內容資訊包括類別標籤,所述確定與所述內容資訊對應的特定類別,包括:根據所述類別標籤確定與所述內容資訊對應的特定類別。
- 根據申請專利範圍第3項所述的方法,其中,所述根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括:將所述關鍵詞資訊中與所述特徵單詞匹配的關鍵詞資訊作為所述特徵標籤。
- 根據申請專利範圍第3項所述的方法,其中,所述關鍵詞資訊包括多個關鍵詞和各個關鍵詞的排序資訊,所述根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括:根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵單 詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序;將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
- 根據申請專利範圍第1項所述的方法,其中,所述根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤包括:確定與所述特定領域對應的領域知識圖譜中包括的特徵組合詞;根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
- 根據申請專利範圍第7項所述的方法,其中,所述根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括:將所述關鍵詞資訊中與所述特徵組合詞匹配的關鍵詞資訊作為所述特徵標籤。
- 根據申請專利範圍第7項所述的方法,其中,所述關鍵詞資訊包括多個關鍵詞和各個關鍵詞的排序資訊,所述根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括:根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵組 合詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序;將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
- 一種內容推薦裝置,其特徵在於,包括:第一獲取模組,用於獲取內容資訊庫中的內容資訊;第一確定模組,用於確定所述內容資訊的關鍵詞資訊;第二確定模組,用於確定與所述內容資訊對應的特定領域;第二獲取模組,用於獲取與所述特定領域對應的領域知識資訊;第三確定模組,用於根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤;處理模組,用於根據用戶的屬性標籤和所述特徵標籤,從所述內容資訊庫中確定向所述用戶推薦的內容推薦資訊,其中,所述第二獲取模組獲取的領域知識資訊包括領域知識圖譜,所述領域知識圖譜在其第一層包括與領域對應的實體詞,在其第二層包括與所述實體詞對應的關聯詞,所述實體詞和所述關聯詞組合構成特徵組合詞。
- 根據申請專利範圍第10項所述的裝置,其中,所述第 二獲取模組獲取的領域知識資訊包括領域層級知識,所述領域層級知識包括領域名稱,與所述領域名稱對應的類別名稱,以及與所述類別名稱對應的特徵單詞。
- 根據申請專利範圍第11項所述的裝置,其中,所述第三確定模組具體包括:第一確定子模組,用於確定與所述內容資訊對應的特定類別;第二確定子模組,用於在所述領域層級知識中,確定與所述特定類別對應的特定類別名稱,以及與所述特定類別名稱對應的特徵單詞;第三確定子模組,根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
- 根據申請專利範圍第12項所述的裝置,其中,所述第一獲取模組獲取的內容資訊包括類別標籤,所述第一確定子模組具體用於:根據所述類別標籤確定與所述內容資訊對應的特定類別。
- 根據申請專利範圍第12項所述的裝置,其中,所述第三確定子模組具體用於:將所述關鍵詞資訊中與所述特徵單詞匹配的關鍵詞資訊作為所述特徵標籤。
- 根據申請專利範圍第12項所述的裝置,其中,所述第一確定模組確定的關鍵詞資訊中包括多個關鍵詞和各個關鍵詞的排序資訊,所述第三確定子模組具體用於:根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵單詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序;將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
- 根據申請專利範圍第10項所述的裝置,其中,所述第三確定模組具體包括:第二確定子模組,用於確定與所述特定領域對應的領域知識圖譜中包括的特徵組合詞;第三確定子模組,用於根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
- 根據申請專利範圍第16項所述的裝置,其中,所述第三確定子模組具體用於:將所述關鍵詞資訊中與所述特徵組合詞匹配的關鍵詞資訊作為所述特徵標籤。
- 根據申請專利範圍第16項所述的裝置,其中,所述第一確定模組確定的關鍵詞資訊中包括多個關鍵詞和各個關 鍵詞的排序資訊,所述第三確定子模組具體用於:根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵組合詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序;將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
??201810015028.0 | 2018-01-08 | ||
CN201810015028.0A CN108268619B (zh) | 2018-01-08 | 2018-01-08 | 内容推荐方法及装置 |
CN201810015028.0 | 2018-01-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201931170A TW201931170A (zh) | 2019-08-01 |
TWI687823B true TWI687823B (zh) | 2020-03-11 |
Family
ID=62773196
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107143560A TWI687823B (zh) | 2018-01-08 | 2018-12-05 | 內容推薦方法及裝置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11720572B2 (zh) |
CN (1) | CN108268619B (zh) |
SG (1) | SG11202006532QA (zh) |
TW (1) | TWI687823B (zh) |
WO (1) | WO2019134554A1 (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108268619B (zh) * | 2018-01-08 | 2020-06-30 | 阿里巴巴集团控股有限公司 | 内容推荐方法及装置 |
CN110570316A (zh) | 2018-08-31 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 训练损伤识别模型的方法及装置 |
EP3871116A4 (en) * | 2019-01-04 | 2021-11-24 | Samsung Electronics Co., Ltd. | METHOD AND APPARATUS FOR RECOVERING INTELLIGENT INFORMATION FROM AN ELECTRONIC DEVICE |
CN110516030B (zh) * | 2019-08-26 | 2022-11-01 | 北京百度网讯科技有限公司 | 意图词的确定方法、装置、设备及计算机可读存储介质 |
CN110706021A (zh) * | 2019-09-12 | 2020-01-17 | 微梦创科网络科技(中国)有限公司 | 一种广告投放方法及系统 |
US10943072B1 (en) * | 2019-11-27 | 2021-03-09 | ConverSight.ai, Inc. | Contextual and intent based natural language processing system and method |
CN111159420B (zh) * | 2019-12-12 | 2023-04-28 | 西安交通大学 | 一种基于属性计算与知识模板的实体优化方法 |
US11386463B2 (en) * | 2019-12-17 | 2022-07-12 | At&T Intellectual Property I, L.P. | Method and apparatus for labeling data |
CN111259659B (zh) * | 2020-01-14 | 2023-07-04 | 北京百度网讯科技有限公司 | 信息处理方法和装置 |
TWI800743B (zh) * | 2020-07-17 | 2023-05-01 | 開曼群島商粉迷科技股份有限公司 | 個人化內容推薦方法、圖形使用者介面及其系統 |
CN112417202B (zh) * | 2020-09-04 | 2023-06-30 | 上海哔哩哔哩科技有限公司 | 内容筛选方法及装置 |
CN112328832B (zh) * | 2020-10-27 | 2022-08-09 | 内蒙古大学 | 一种融合标签和知识图谱的电影推荐方法 |
CN112348638B (zh) * | 2020-11-09 | 2024-02-20 | 上海秒针网络科技有限公司 | 一种活动文案推荐方法、装置、电子设备和存储介质 |
CN112380339A (zh) * | 2020-11-23 | 2021-02-19 | 北京达佳互联信息技术有限公司 | 热点事件挖掘方法、装置及服务器 |
CN112686043B (zh) * | 2021-01-12 | 2024-02-06 | 武汉大学 | 一种基于词向量的企业所属新兴产业分类方法 |
CN112685645A (zh) * | 2021-01-13 | 2021-04-20 | 敖客星云(北京)科技发展有限公司 | 基于知识图谱的智能教育推荐方法、系统、设备和介质 |
CN113157857B (zh) * | 2021-03-13 | 2023-06-02 | 中国科学院新疆理化技术研究所 | 面向新闻的热点话题检测方法、装置及设备 |
CN113032671B (zh) * | 2021-03-17 | 2024-02-23 | 北京百度网讯科技有限公司 | 内容处理方法、装置、电子设备和存储介质 |
CN113076428A (zh) * | 2021-03-19 | 2021-07-06 | 北京沃东天骏信息技术有限公司 | 一种书单生成方法和装置 |
CN113177170B (zh) * | 2021-04-12 | 2023-05-23 | 维沃移动通信有限公司 | 评论展示方法、装置及电子设备 |
CN115248890B (zh) * | 2021-04-27 | 2024-04-05 | 百度国际科技(深圳)有限公司 | 用户兴趣画像的生成方法、装置、电子设备以及存储介质 |
CN112988979B (zh) * | 2021-04-29 | 2021-10-08 | 腾讯科技(深圳)有限公司 | 实体识别方法、装置、计算机可读介质及电子设备 |
CN113704614A (zh) * | 2021-08-30 | 2021-11-26 | 康键信息技术(深圳)有限公司 | 基于用户画像的页面生成方法、装置、设备及介质 |
CN113806561A (zh) * | 2021-10-11 | 2021-12-17 | 中国人民解放军国防科技大学 | 一种基于实体属性的知识图谱事实补全方法 |
TWI800982B (zh) * | 2021-11-16 | 2023-05-01 | 宏碁股份有限公司 | 文章標記資料的產生裝置及其產生方法 |
CN113936765A (zh) * | 2021-12-17 | 2022-01-14 | 北京因数健康科技有限公司 | 周期行为报告的生成方法及装置、存储介质、电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103442001A (zh) * | 2013-08-22 | 2013-12-11 | 百度在线网络技术(北京)有限公司 | 信息推荐方法、装置和服务器 |
US20160205427A1 (en) * | 2015-01-14 | 2016-07-14 | Samsung Electronics Co., Ltd. | User terminal apparatus, system, and control method thereof |
TWI556123B (zh) * | 2015-08-06 | 2016-11-01 | News tracking and recommendation method | |
CN106156204A (zh) * | 2015-04-23 | 2016-11-23 | 深圳市腾讯计算机系统有限公司 | 文本标签的提取方法和装置 |
CN106897273A (zh) * | 2017-04-12 | 2017-06-27 | 福州大学 | 一种基于知识图谱的网络安全动态预警方法 |
Family Cites Families (77)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7031901B2 (en) | 1998-05-13 | 2006-04-18 | Abu El Ata Nabil A | System and method for improving predictive modeling of an information system |
US6397334B1 (en) | 1998-12-17 | 2002-05-28 | International Business Machines Corporation | Method and system for authenticating objects and object data |
US6644973B2 (en) | 2000-05-16 | 2003-11-11 | William Oster | System for improving reading and speaking |
US6925452B1 (en) | 2000-05-22 | 2005-08-02 | International Business Machines Corporation | Method and system for recognizing end-user transactions |
US7093129B1 (en) | 2000-06-19 | 2006-08-15 | International Business Machines Corporation | Secured encrypted communications in a voice browser |
JP3846851B2 (ja) | 2001-02-01 | 2006-11-15 | 松下電器産業株式会社 | 画像のマッチング処理方法及びその装置 |
US7565537B2 (en) | 2002-06-10 | 2009-07-21 | Microsoft Corporation | Secure key exchange with mutual authentication |
US20040196363A1 (en) | 2003-04-01 | 2004-10-07 | Gary Diamond | Video identification verification system |
US7466824B2 (en) | 2003-10-09 | 2008-12-16 | Nortel Networks Limited | Method and system for encryption of streamed data |
US7401012B1 (en) | 2005-04-20 | 2008-07-15 | Sun Microsystems, Inc. | Method and apparatus for characterizing computer system workloads |
US8448226B2 (en) | 2005-05-13 | 2013-05-21 | Sarangan Narasimhan | Coordinate based computer authentication system and methods |
US7536304B2 (en) | 2005-05-27 | 2009-05-19 | Porticus, Inc. | Method and system for bio-metric voice print authentication |
KR101426870B1 (ko) | 2007-03-06 | 2014-09-19 | 스미토모덴키고교가부시키가이샤 | 화상 가공 방법, 컴퓨터 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체, 및 화상 검사 방법 |
US7872584B2 (en) | 2007-04-09 | 2011-01-18 | Honeywell International Inc. | Analyzing smoke or other emissions with pattern recognition |
US8280106B2 (en) | 2007-09-29 | 2012-10-02 | Samsung Electronics Co., Ltd. | Shadow and highlight detection system and method of the same in surveillance camera and recording medium thereof |
US9298979B2 (en) | 2008-01-18 | 2016-03-29 | Mitek Systems, Inc. | Systems and methods for mobile image capture and content processing of driver's licenses |
US8180629B2 (en) | 2008-07-10 | 2012-05-15 | Trigent Softward Ltd. | Automatic pattern generation in natural language processing |
DE102008046254A1 (de) | 2008-09-08 | 2010-03-11 | Giesecke & Devrient Gmbh | Wertdokumentbearbeitungsvorrichtung und ein Verfahren zur Reduktion von Staub in der Wertdokumentbearbeitungsvorrichtung |
KR101556654B1 (ko) | 2008-11-28 | 2015-10-02 | 삼성전자주식회사 | 영상 통화 수행 방법 및 장치 |
US8121400B2 (en) | 2009-09-24 | 2012-02-21 | Huper Laboratories Co., Ltd. | Method of comparing similarity of 3D visual objects |
US9253167B2 (en) | 2011-04-19 | 2016-02-02 | Apriva, Llc | Device and system for facilitating communication and networking within a secure mobile environment |
US9082235B2 (en) | 2011-07-12 | 2015-07-14 | Microsoft Technology Licensing, Llc | Using facial data for device authentication or subject identification |
US8966613B2 (en) | 2011-09-30 | 2015-02-24 | Microsoft Technology Licensing, Llc | Multi-frame depth image information identification |
US9514357B2 (en) | 2012-01-12 | 2016-12-06 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US9066125B2 (en) | 2012-02-10 | 2015-06-23 | Advanced Biometric Controls, Llc | Secure display |
JP6052657B2 (ja) | 2012-03-13 | 2016-12-27 | パナソニックIpマネジメント株式会社 | 対象物検証装置、対象物検証プログラム、及び対象物検証方法 |
US20140309930A1 (en) | 2013-04-15 | 2014-10-16 | Flextronics Ap, Llc | Automatic camera image retrieval based on route traffic and conditions |
US8705836B2 (en) | 2012-08-06 | 2014-04-22 | A2iA S.A. | Systems and methods for recognizing information in objects using a mobile device |
US9582843B2 (en) | 2012-08-20 | 2017-02-28 | Tautachrome, Inc. | Authentication and validation of smartphone imagery |
US9036943B1 (en) | 2013-03-14 | 2015-05-19 | Amazon Technologies, Inc. | Cloud-based image improvement |
US9147127B2 (en) | 2013-03-15 | 2015-09-29 | Facebook, Inc. | Verification of user photo IDs |
US10475014B1 (en) | 2013-03-15 | 2019-11-12 | Amazon Technologies, Inc. | Payment device security |
US9723251B2 (en) | 2013-04-23 | 2017-08-01 | Jaacob I. SLOTKY | Technique for image acquisition and management |
CN104142940B (zh) * | 2013-05-08 | 2017-11-17 | 华为技术有限公司 | 信息推荐处理方法及装置 |
US9268823B2 (en) * | 2013-05-10 | 2016-02-23 | International Business Machines Corporation | Partial match derivation using text analysis |
US10319035B2 (en) | 2013-10-11 | 2019-06-11 | Ccc Information Services | Image capturing and automatic labeling system |
US9202119B2 (en) | 2013-10-18 | 2015-12-01 | Daon Holdings Limited | Methods and systems for determining user liveness |
JP6287047B2 (ja) | 2013-10-22 | 2018-03-07 | 富士通株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
US9607138B1 (en) | 2013-12-18 | 2017-03-28 | Amazon Technologies, Inc. | User authentication and verification through video analysis |
US10320807B2 (en) | 2014-02-25 | 2019-06-11 | Sal Khan | Systems and methods relating to the authenticity and verification of photographic identity documents |
US20150293982A1 (en) * | 2014-04-14 | 2015-10-15 | International Business Machines Corporation | Displaying a representative item for a collection of items |
US9646227B2 (en) | 2014-07-29 | 2017-05-09 | Microsoft Technology Licensing, Llc | Computerized machine learning of interesting video sections |
US9258303B1 (en) | 2014-08-08 | 2016-02-09 | Cellcrypt Group Limited | Method of providing real-time secure communication between end points in a network |
CA2902093C (en) | 2014-08-28 | 2023-03-07 | Kevin Alan Tussy | Facial recognition authentication system including path parameters |
CN106033415B (zh) * | 2015-03-09 | 2020-07-03 | 深圳市腾讯计算机系统有限公司 | 文本内容推荐方法及装置 |
US9619696B2 (en) | 2015-04-15 | 2017-04-11 | Cisco Technology, Inc. | Duplicate reduction for face detection |
US9794260B2 (en) | 2015-08-10 | 2017-10-17 | Yoti Ltd | Liveness detection |
US20170060867A1 (en) | 2015-08-31 | 2017-03-02 | Adfamilies Publicidade, SA | Video and image match searching |
US10065441B2 (en) | 2015-09-01 | 2018-09-04 | Digimarc Corporation | Counterfeiting detection using machine readable indicia |
WO2017043314A1 (ja) | 2015-09-09 | 2017-03-16 | 日本電気株式会社 | ガイダンス取得装置、ガイダンス取得方法及びプログラム |
US11868354B2 (en) * | 2015-09-23 | 2024-01-09 | Motorola Solutions, Inc. | Apparatus, system, and method for responding to a user-initiated query with a context-based response |
GB201517462D0 (en) | 2015-10-02 | 2015-11-18 | Tractable Ltd | Semi-automatic labelling of datasets |
WO2017059576A1 (en) | 2015-10-09 | 2017-04-13 | Beijing Sensetime Technology Development Co., Ltd | Apparatus and method for pedestrian detection |
US20170148101A1 (en) | 2015-11-23 | 2017-05-25 | CSI Holdings I LLC | Damage assessment and repair based on objective surface data |
CN105719188B (zh) | 2016-01-22 | 2017-12-26 | 平安科技(深圳)有限公司 | 基于多张图片一致性实现保险理赔反欺诈的方法及服务器 |
US10242048B2 (en) * | 2016-01-26 | 2019-03-26 | International Business Machines Corporation | Dynamic question formulation to query data sources |
US20170293620A1 (en) * | 2016-04-06 | 2017-10-12 | International Business Machines Corporation | Natural language processing based on textual polarity |
US10692050B2 (en) | 2016-04-06 | 2020-06-23 | American International Group, Inc. | Automatic assessment of damage and repair costs in vehicles |
US11144889B2 (en) | 2016-04-06 | 2021-10-12 | American International Group, Inc. | Automatic assessment of damage and repair costs in vehicles |
US10789545B2 (en) | 2016-04-14 | 2020-09-29 | Oath Inc. | Method and system for distributed machine learning |
JP6235082B1 (ja) | 2016-07-13 | 2017-11-22 | ヤフー株式会社 | データ分類装置、データ分類方法、およびプログラム |
US10055882B2 (en) | 2016-08-15 | 2018-08-21 | Aquifi, Inc. | System and method for three-dimensional scanning and for capturing a bidirectional reflectance distribution function |
GB2554361B8 (en) | 2016-09-21 | 2022-07-06 | Emergent Network Intelligence Ltd | Automatic image based object damage assessment |
US20200005151A1 (en) | 2016-12-30 | 2020-01-02 | Nokia Technologies Oy | Artificial neural network |
CA3056498A1 (en) | 2017-03-14 | 2018-09-20 | University Of Manitoba | Structure defect detection using machine learning algorithms |
CN107015963A (zh) * | 2017-03-22 | 2017-08-04 | 重庆邮电大学 | 基于深度神经网络的自然语言语义分析系统及方法 |
KR102334575B1 (ko) | 2017-07-31 | 2021-12-03 | 삼성디스플레이 주식회사 | 무라 검출 장치 및 무라 검출 장치의 검출 방법 |
US11087292B2 (en) | 2017-09-01 | 2021-08-10 | Allstate Insurance Company | Analyzing images and videos of damaged vehicles to determine damaged vehicle parts and vehicle asymmetries |
US11586875B2 (en) | 2017-11-22 | 2023-02-21 | Massachusetts Institute Of Technology | Systems and methods for optimization of a data model network architecture for target deployment |
CN109919308B (zh) | 2017-12-13 | 2022-11-11 | 腾讯科技(深圳)有限公司 | 一种神经网络模型部署方法、预测方法及相关设备 |
CN108268619B (zh) | 2018-01-08 | 2020-06-30 | 阿里巴巴集团控股有限公司 | 内容推荐方法及装置 |
US10942767B2 (en) | 2018-02-27 | 2021-03-09 | Microsoft Technology Licensing, Llc | Deep neural network workload scheduling |
US10554738B1 (en) | 2018-03-02 | 2020-02-04 | Syncsort Incorporated | Methods and apparatus for load balance optimization based on machine learning |
US10997413B2 (en) | 2018-03-23 | 2021-05-04 | NthGen Software Inc. | Method and system for obtaining vehicle target views from a video stream |
GB2573809B (en) | 2018-05-18 | 2020-11-04 | Emotech Ltd | Speaker Recognition |
US10832065B1 (en) | 2018-06-15 | 2020-11-10 | State Farm Mutual Automobile Insurance Company | Methods and systems for automatically predicting the repair costs of a damaged vehicle from images |
US11030735B2 (en) | 2018-08-09 | 2021-06-08 | Exxonmobil Upstream Research Company | Subterranean drill bit management system |
-
2018
- 2018-01-08 CN CN201810015028.0A patent/CN108268619B/zh active Active
- 2018-12-05 TW TW107143560A patent/TWI687823B/zh active
- 2018-12-25 SG SG11202006532QA patent/SG11202006532QA/en unknown
- 2018-12-25 WO PCT/CN2018/123283 patent/WO2019134554A1/zh active Application Filing
-
2020
- 2020-06-24 US US16/911,000 patent/US11720572B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103442001A (zh) * | 2013-08-22 | 2013-12-11 | 百度在线网络技术(北京)有限公司 | 信息推荐方法、装置和服务器 |
US20160205427A1 (en) * | 2015-01-14 | 2016-07-14 | Samsung Electronics Co., Ltd. | User terminal apparatus, system, and control method thereof |
CN106156204A (zh) * | 2015-04-23 | 2016-11-23 | 深圳市腾讯计算机系统有限公司 | 文本标签的提取方法和装置 |
TWI556123B (zh) * | 2015-08-06 | 2016-11-01 | News tracking and recommendation method | |
CN106897273A (zh) * | 2017-04-12 | 2017-06-27 | 福州大学 | 一种基于知识图谱的网络安全动态预警方法 |
Also Published As
Publication number | Publication date |
---|---|
US20200320086A1 (en) | 2020-10-08 |
SG11202006532QA (en) | 2020-08-28 |
TW201931170A (zh) | 2019-08-01 |
WO2019134554A1 (zh) | 2019-07-11 |
CN108268619A (zh) | 2018-07-10 |
US11720572B2 (en) | 2023-08-08 |
CN108268619B (zh) | 2020-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI687823B (zh) | 內容推薦方法及裝置 | |
US11354356B1 (en) | Video segments for a video related to a task | |
US9552394B2 (en) | Generation of multi-faceted search results in response to query | |
US9679001B2 (en) | Consensus search device and method | |
CN106663117B (zh) | 构造支持提供探索性建议的图 | |
US9483460B2 (en) | Automated formation of specialized dictionaries | |
CN102831128B (zh) | 一种对互联网上的同名人物信息进行分类的方法及装置 | |
US20130060769A1 (en) | System and method for identifying social media interactions | |
CN111221968B (zh) | 基于学科树聚类的作者消歧方法及装置 | |
JP6409071B2 (ja) | 文の並び替え方法および計算機 | |
Pavlick et al. | Identifying 1950s american jazz musicians: Fine-grained isa extraction via modifier composition | |
KR101265467B1 (ko) | 블로그 문서에서의 경험 문장 추출 방법 및 동사 분류 방법 | |
CN115129864A (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
Charnine et al. | Association-Based Identification of Internet Users Interest | |
CN113468206A (zh) | 数据维护方法、装置、服务器、介质及产品 | |
Yang et al. | A new ontology-supported and hybrid recommending information system for scholars | |
JP2002183195A (ja) | 概念検索方式 | |
Lu et al. | Improving web search relevance with semantic features | |
CN110851560A (zh) | 信息检索方法、装置及设备 | |
JP7037778B2 (ja) | 検索装置および方法 | |
KR102625347B1 (ko) | 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템 | |
CN110008307B (zh) | 一种基于规则和统计学习的变形实体识别方法和装置 | |
Komninos et al. | Entity ranking as a search engine front-end | |
CN114860985A (zh) | 音乐推荐方法、系统、电子设备及存储介质 | |
Domke | Query Expansion Techniques for Enterprise Search |