TW201931170A - 內容推薦方法及裝置 - Google Patents

內容推薦方法及裝置 Download PDF

Info

Publication number
TW201931170A
TW201931170A TW107143560A TW107143560A TW201931170A TW 201931170 A TW201931170 A TW 201931170A TW 107143560 A TW107143560 A TW 107143560A TW 107143560 A TW107143560 A TW 107143560A TW 201931170 A TW201931170 A TW 201931170A
Authority
TW
Taiwan
Prior art keywords
information
feature
keyword
domain
content information
Prior art date
Application number
TW107143560A
Other languages
English (en)
Other versions
TWI687823B (zh
Inventor
劉陽陽
Original Assignee
香港商阿里巴巴集團服務有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 香港商阿里巴巴集團服務有限公司 filed Critical 香港商阿里巴巴集團服務有限公司
Publication of TW201931170A publication Critical patent/TW201931170A/zh
Application granted granted Critical
Publication of TWI687823B publication Critical patent/TWI687823B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/282Hierarchical databases, e.g. IMS, LDAP data stores or Lotus Notes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Library & Information Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本說明書披露的實施例提供一種內容推薦方法,該方法包括:首先,獲取內容資訊庫中的內容資訊,並確定與該內容資訊相關的關鍵詞資訊。以及,確定與該內容資訊對應的特定領域,並獲取與該特定領域對應的領域知識資訊。接著,根據該領域知識資訊從關鍵詞資訊中確定內容資訊的特徵標籤。然後,根據該特徵標籤和用戶的屬性標籤,從內容資訊庫中確定向用戶推薦的內容推薦信。

Description

內容推薦方法及裝置
本說明書披露的多個實施例涉及網際網路技術領域,尤其涉及一種內容推薦方法及裝置。
隨著網際網路技術的發展,人們越來越頻繁地瀏覽網路平台提供的內容資訊。例如,在網路購物平台中瀏覽商品資訊,或者在新聞平台瀏覽焦點資訊,或者在理財平台瀏覽理財資訊,或者在支付平台瀏覽支付服務資訊等。
不同用戶在使用同一網路平台時,對其提供的內容資訊的需求有著或多或少的差異。另一方面,網路平台中資訊的巨量增長也常常讓用戶難以選擇。目前,向用戶推薦的內容資訊由於存在不夠精準等不足,難以滿足用戶的個性化需求。因此,需要提供一種合理的方法,以滿足用戶瀏覽網路平台中提供的內容資訊的多種需求。
本說明書描述了一種內容推薦方法及裝置,透過確定與內容資訊對應的特定領域以及與特徵領域對應的領域知識資訊,進而確定內容資訊的特徵標籤,並結合用戶的屬性標籤向用戶推薦更加精準的內容資訊。
第一方面,提供了一種內容推薦方法。該方法包括:
獲取內容資訊庫中的內容資訊,並確定所述內容資訊的關鍵詞資訊;
確定與所述內容資訊對應的特定領域;
獲取與所述特定領域對應的領域知識資訊;
根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤;
根據用戶的屬性標籤和所述特徵標籤,從所述內容資訊庫中確定向所述用戶推薦的內容推薦資訊。
在一種可能的實施方式中,所述領域知識資訊包括領域層級知識,所述領域層級知識包括領域名稱,與所述領域名稱對應的類別名稱,以及與所述類別名稱對應的特徵單詞。
在一種可能的實施方式中,所述特徵單詞基於內容語料庫中的內容語料訓練而獲得。
在一種可能的實施方式中,所述根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤包括:
確定與所述內容資訊對應的特定類別;
在所述領域層級知識中,確定與所述特定類別對應的特定類別名稱,以及與所述特定類別名稱對應的特徵單詞;
根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述內容資訊包括類別標籤,所述確定與所述內容資訊對應的特定類別,包括:
根據所述類別標籤確定與所述內容資訊對應的特定類別。
在一種可能的實施方式中,所述根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括:
將所述關鍵詞資訊中與所述特徵單詞匹配的關鍵詞資訊作為所述特徵標籤。
在一種可能的實施方式中,所述關鍵詞資訊包括多個關鍵詞和各個關鍵詞的排序資訊,所述根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括:
根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵單詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序;
將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述領域知識資訊包括領域知識圖譜,所述領域知識圖譜在其第一層包括與領域對應的實體詞,在其第二層包括與所述實體詞對應的關聯詞,所述實體詞和所述關聯詞組合構成特徵組合詞。
在一種可能的實施方式中,所述根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤包括:
確定與所述特定領域對應的領域知識圖譜中包括的特徵組合詞;
根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括:
將所述關鍵詞資訊中與所述特徵組合詞匹配的關鍵詞資訊作為所述特徵標籤。
在一種可能的實施方式中,所述關鍵詞資訊包括多個關鍵詞和各個關鍵詞的排序資訊,所述根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括:
根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵組合詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序;
將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述屬性標籤基於所述用戶的歷史瀏覽內容確定。
在一種可能的實施方式中,所述從內容資訊庫中確定向所述用戶推薦的內容推薦資訊,包括:
將與所述屬性標籤匹配的特徵標籤所對應的內容資訊,作為向所述用戶推薦的候選內容資訊;
根據預設規則對所述候選內容資訊中的各個內容資訊進行排名,並將名次在預設範圍內的內容資訊作為所述內容推薦資訊。
第二方面,提供了一種內容推薦裝置。該裝置包括:
第一獲取模組,用於獲取內容資訊庫中的內容資訊;
第一確定模組,用於確定所述內容資訊的關鍵詞資訊;
第二確定模組,用於確定與所述內容資訊對應的特定領域;
第二獲取模組,用於獲取與所述特定領域對應的領域知識資訊;
第三確定模組,用於根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤;
處理模組,用於根據用戶的屬性標籤和所述特徵標籤,從所述內容資訊庫中確定向所述用戶推薦的內容推薦資訊。
在一種可能的實施方式中,所述第二獲取模組獲取的領域知識資訊包括領域層級知識,所述領域層級知識包括領域名稱,與所述領域名稱對應的類別名稱,以及與所述類別名稱對應的特徵單詞。
在一種可能的實施方式中,所述第二獲取模組獲取的所述特徵單詞基於內容語料庫中的內容語料訓練而獲得。
在一種可能的實施方式中,所述第三確定模組具體包括:
第一確定子模組,用於確定與所述內容資訊對應的特定類別;
第二確定子模組,用於在所述領域層級知識中,確定與所述特定類別對應的特定類別名稱,以及與所述特定類別名稱對應的特徵單詞;
第三確定子模組,根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述第一獲取模組獲取的內容資訊包括類別標籤,所述第一確定子模組具體用於:
根據所述類別標籤確定與所述內容資訊對應的特定類別。
在一種可能的實施方式中,所述第三確定子模組具體用於:
將所述關鍵詞資訊中與所述特徵單詞匹配的關鍵詞資訊作為所述特徵標籤。
在一種可能的實施方式中,所述第一確定模組確定的關鍵詞資訊中包括多個關鍵詞和各個關鍵詞的排序資訊,所述第三確定子模組具體用於:
根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵單詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序;
將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述第二獲取模組獲取的領域知識資訊包括領域知識圖譜,所述領域知識圖譜在其第一層包括與領域對應的實體詞,在其第二層包括與所述實體詞對應的關聯詞,所述實體詞和所述關聯詞組合構成特徵組合詞。
在一種可能的實施方式中,所述第三確定模組具體包括:
第二確定子模組,用於確定與所述特定領域對應的領域知識圖譜中包括的特徵組合詞;
第三確定子模組,用於根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述第三確定子模組具體用於:
將所述關鍵詞資訊中與所述特徵組合詞匹配的關鍵詞資訊作為所述特徵標籤。
在一種可能的實施方式中,所述第一確定模組確定的關鍵詞資訊中包括多個關鍵詞和各個關鍵詞的排序資訊,所述第三確定子模組具體用於:
根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵組合詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序;
將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
在一種可能的實施方式中,所述處理模組中包括的屬性標籤基於所述用戶的歷史瀏覽內容確定。
在一種可能的實施方式中,所述處理模組具體用於:
將與所述屬性標籤匹配的特徵標籤所對應的內容資訊,作為向所述用戶推薦的候選內容資訊;
根據預設規則對所述候選內容資訊中的各個內容資訊進行排名,並將名次在預設範圍內的內容資訊作為所述內容推薦資訊。
第三方面,提供了一種電腦可讀儲存媒體,其上儲存有電腦程式。當所述電腦程式在電腦中執行時,令電腦執行上述第一方面中任一種實施方式提供的方法。
第四方面,提供了一種計算設備,包括記憶體和處理器。所述記憶體中儲存有可執行碼,所述處理器執行所述可執行碼時,實現上述第一方面中任一種實施方式提供的方法。
本說明書提供的一種內容推薦方法及裝置,首先,獲取內容資訊庫中的內容資訊,並確定與該內容資訊相關的關鍵詞資訊。以及,確定與該內容資訊對應的特定領域,並獲取與該特定領域對應的領域知識資訊。接著,根據該領域知識資訊從關鍵詞資訊中確定內容資訊的特徵標籤。然後,根據該特徵標籤和用戶的屬性標籤,從內容資訊庫中確定向用戶推薦的內容推薦信。透過採用這種方式,實現向用戶推薦更加精準的內容資訊。
下面結合附圖,對本說明書披露的多個實施例進行描述。
圖1為本說明書披露的一個實施例提供的一種內容推薦方法的流程圖。所述方法的執行主體可以為具有處理能力的設備:伺服器或者系統或者裝置。如圖1所示,所述方法具體包括:
步驟S110,獲取內容資訊庫中的內容資訊,並確定該內容資訊的關鍵詞資訊。
具體地,內容資訊庫中可以包括在有效期內的內容資訊。其中,有效期可以根據內容資訊所對應業務的業務屬性(如,對時效性的要求)設定。例如,可以將新聞業務所對應的內容資訊的有效期設置為1天。又例如,可以將科普知識業務所對應的內容資訊的有效期設置為1個月。
內容資訊可以包括圖文資訊(如,圖片、文章等)或音視訊資訊(如,音訊、視訊廣告等)。
確定內容資訊的關鍵詞資訊,可以包括:確定內容資訊的文本資訊,並根據文本資訊確定關鍵詞資訊。
在一個實施例中,內容資訊包括視訊廣告,此時,可以從視訊中提取文字資訊以及將其中的音訊資訊轉化為文字資訊,並根據其中的文字資訊確定視訊廣告的關鍵詞資訊;或者,內容資訊包括視訊廣告和該視訊廣告的文本介紹資訊,則可以根據文本介紹資訊確定視訊廣告的關鍵詞資訊。
在另一個實施例中,內容資訊包括文章,此時,可以直接確定該文章中的文本資訊。
進一步地,根據文本資訊確定關鍵詞資訊,可以包括:對文本資訊進行結構化分析、分詞處理、去停用詞處理、詞性標注和命名實體識別中的至少一種預處理。以及採用關鍵詞提取演算法,從經過預處理後的文本資訊中確定關鍵詞資訊。
其中,結構化分析可以包括對文本資訊中段落結構的分析,例如,判斷出文本資訊中的標題和正文,以及正文中的段落結構;分詞處理可以包括一元分詞(unigram)、二元分詞(bigram)、三元分詞(trigram)等;去停用詞可以包括根據預設的停用詞表去除文本資訊中的停用詞(如,無實際意義的功能詞:這、那、的);詞性標注可以包括對文本資訊中的詞語的詞性(如,名詞、副詞、形容詞等)進行標注;命名實體識別(Named Entity Recognition,簡稱NER)可以包括識別文本資訊中具有特定意義的實體(如,人名、地名、機構名、專有名詞等);關鍵詞提取演算法可以包括TextRank演算法和TF-IDF(Term Frequency-inverse Document Frequency)演算法等。
在一個例子中,經過預處理後的文本資訊中包括多個詞語,以及各個詞語在文本資訊中的位置(如,位於標題中或位於正文中)、標注的詞性等。相應地,可以採用關鍵詞提取演算法,從經過預處理後的文本資訊中加權識別出關鍵詞資訊。
步驟S120,確定與內容資訊對應的特定領域。
在一個實施例中,內容資訊中可以包括領域標籤。相應地,確定與內容資訊對應的特定領域,可以包括:根據領域標籤確定與內容資訊對應的特定領域。其中,領域標籤可以由內容資訊的創建者為該內容資訊便於用戶搜索而定義產生。
在一個例子中,內容資訊中包括的領域標籤為“出行服務”,相應地可以確定出與該內容資訊對應的特定領域為出行服務。
在另一個實施例中,可以根據步驟S110中確定出的關鍵詞資訊,進一步確定與內容資訊對應的特定領域。在一個例子中,關鍵詞資訊中包括領域資訊,相應地,可以根據領域資訊確定出與內容資訊對應的特定領域。
在步驟S120中確定與內容資訊對應的特定領域後,接著,在步驟S130,獲取與特定領域對應的領域知識資訊。
具體地,伺服器中可以儲存有預先設定的領域知識資訊,該領域知識資訊可以包括領域層級知識和領域知識圖譜中的至少一種。其中,領域層級知識可以包括領域名稱,與該領域名稱對應的類別名稱,以及與該類別名稱對應的特徵單詞;領域知識圖譜可以在其第一層包括與領域對應的實體詞,在其第二層包括與實體詞對應的關聯詞,且實體詞和與之對應的關聯詞可以組合構成特徵組合詞。
需要說明的是,領域層級知識中包括的領域名稱和類別名稱可以基於目前通用的知識體系(如,知識體系中可以包括領域和學科的劃分)進行設定。此外,領域層級知識中包括的特徵單詞,可以基於內容語料庫中的大量內容語料進行訓練而獲得。
領域知識圖譜可以基於內容語料庫中的大量內容語料處理而獲得。更具體地,首先,可以透過NER識別與領域對應的實體詞(如,專有名詞等),例如,可以識別出與領域“出行服務”對應的專有名詞“駕照”等。然後,可以透過模板提取、詞間相關性和互資訊熵等方式確定與實體詞對應的關聯詞。其中,模板提取方式可以包括設定一個模板(如,駕照XX的發照),然後利用模板從內容語料中提取關聯詞(如,新規定);詞間相關性方式可以包括利用長度為預定字符數(如,5個字符)的滑動窗口,提取出在滑動窗口中與實體詞同時出現的詞語,並將這些詞語中出現頻率達到預定次數(如,10次)的詞語作為關聯詞;互資訊熵方式可以包括確定內容語料包括的詞語中與實體詞之間的相似度,並將相似度高於預設值(如,0.6)的詞語作為關聯詞。
在一個實施例中,可以獲取與步驟S120中確定的特定領域對應的領域層級知識和/領域知識圖譜。
在一個實施例中,獲取的與特定領域對應的領域層級知識中,可以包括與該特定領域對應的多個類別名稱,以及與多個類別名稱中各個類別名稱對應的多個特徵單詞。
在一個例子中,在步驟S120中確定的特定領域為出行服務,據此可以獲取與出行服務對應的如圖2所示的領域層級知識。圖2中,領域名稱為出行服務,與出行服務對應的類別名稱包括:汽車、飛機、火車和地鐵等。與汽車對應特徵單詞包括:保養、加油、洗車等,與飛機對應的特徵單詞包括:里程、經濟艙、頭等艙等(圖2中未示出與地鐵、火車等其他類別對應的特徵單詞)。
在一個實施例中,單個領域中可以包括多個實體詞,相應地,與該領域對應的領域知識圖譜可以有多個。各個領域知識圖譜在其第一層可以包括實體詞,在第二層可以包括與該實體詞對應的多個關聯詞。
在一個例子中,在步驟S120中確定的特定領域為出行服務,據此可以獲取與出行服務對應的多個領域知識圖譜。例如,獲取的多個領域知識圖譜中可以包括如圖4所示的領域知識圖譜。圖4中,實體詞是駕照,與實體詞對應的關聯詞包括扣分、新規定、查詢違規、換照、年審等。
在步驟S110中確定出內容資訊的關鍵詞資訊,以及在步驟S130中獲取到與特定領域對應的領域知識資訊後,在步驟S140中,根據領域知識資訊從關鍵詞資訊中確定內容資訊的特徵標籤。
具體地,將關鍵詞資訊中與領域知識資訊相匹配的關鍵詞資訊作為內容資訊的特徵標籤。或者,根據領域知識資訊對關鍵詞資訊進行排名,並將排名在預設範圍內的關鍵詞資訊作為內容資訊的特徵標籤。
在一個實施例中,在步驟S130中獲取的領域知識資訊可以至少包括領域層級知識,根據該領域層級知識從關鍵詞資訊中確定內容資訊的特徵標籤,可以包括:確定與內容資訊對應的特定類別;在領域層級知識中,確定與特定類別對應的特定類別名稱,以及與特定類別名稱對應的特徵單詞;根據特徵單詞確定內容資訊的特徵標籤。
在一個例子中,內容資訊可以包括類別標籤。相應地,確定與內容資訊對應的特定類別,可以包括:根據類別標籤確定與內容資訊對應的特定類別。其中,類別標籤可以由內容資訊的創建者為該內容資訊便於用於搜索而定義產生。例如,內容資訊中包括的類別標籤為“汽車”,相應地可以確定出與該內容資訊對應的特定類別為汽車。
在另一個例子中,可以根據步驟S110中確定出的關鍵詞資訊,進一步確定與內容資訊對應的特定類別。在一個例子中,關鍵詞資訊中包括類別資訊,相應地,可以根據類別資訊確定出與內容資訊對應的特定類別。
在一個例子中,確定的與內容資訊對應的特定類別為汽車,在步驟S130中獲取的領域層級知識如圖2所示。據此,可以在領域層級知識中,確定與特定類別(汽車)對應的特定類別名稱為汽車,以及與類別名稱(汽車)對應的特徵單詞包括:保養、加油和洗車等。
在一個例子中,根據特徵單詞確定內容資訊的特徵標籤,可以包括:將關鍵詞資訊中與特徵單詞匹配的關鍵詞資訊作為特徵標籤。例如,確定的特徵單詞包括:保養、加油、洗車等,據此可以從關鍵詞資訊(如,包括:保養、洗車等)確定出包括保養、洗車的特徵標籤。
在另一例子中,關鍵詞資訊中可以包括多個關鍵詞以及各個關鍵詞的權重資訊。相應地,根據特徵單詞確定內容資訊的特徵標籤,可以包括:根據各個關鍵詞與特徵單詞的匹配情況,更新所述多個關鍵詞的權重;將更新後的權重大於預設閾值的關鍵詞作為內容資訊的特徵標籤。比如說,當關鍵詞(如,洗車)與某個特徵單詞(洗車)完全匹配時,可以將該關鍵詞的權重值增加第一預設值(如,0.1);當關鍵詞(如,自動洗車)與某個特徵單詞(洗車)部分匹配時,可以將該關鍵詞的權重值增加第二預設值(如,0.05);當關鍵詞與所有特徵單詞均不匹配時,可以保持該關鍵詞原有的權重值。如此,可以更新各個關鍵詞的權重值。對於更新了權重的關鍵詞,判斷其最終權重是否大於預設閾值(如0.5),將權重值大於預設閾值的關鍵詞作為特徵標籤。
進一步地,在另一個例子中,關鍵詞資訊中還可以包括多個關鍵詞以及各個關鍵詞對應的排序資訊(如,可以根據權重進行排序)。相應地,根據特徵單詞確定內容資訊的特徵標籤,可以包括:根據各個關鍵詞與特徵單詞的匹配情況以及原有的排序資訊,對多個關鍵詞進行重新排序;將經過重新排序後的位於預定順序範圍內的關鍵詞資訊作為內容資訊的特徵標籤。其中,預定順序範圍可以提前設定或即時修改。
例如,排序資訊可包括各個關鍵詞的權重值,可以根據各個關鍵詞與特徵單詞的匹配情況(如,是否匹配)更新該關鍵詞的權重值。更新權重值的方式可以如之前例子所述。然後,根據更新後的權重值對多個關鍵詞進行排序,並將位於預定順序範圍(如,前十位)內的關鍵詞資訊作為特徵標籤。
在另一個實施例中,在步驟S130中獲取的領域知識資訊可以至少包括領域知識圖譜,根據該領域知識圖譜從關鍵詞資訊中確定內容資訊的特徵標籤,可以包括:確定該領域知識圖譜中包括的特徵組合詞;根據特徵組合詞從關鍵詞資訊中確定內容資訊的特徵標籤。在一個例子中,在步驟S130中可以獲取包括如圖4所示的領域知識圖譜。圖4中的實體詞為駕照,與駕照對應的關聯詞包括:扣分、新規定、查詢違規、換照和年審等。相應地,可以確定出其中的特徵組合詞包括:“駕照-扣分”、“駕照-新規定”、“駕照-查詢違規”、“駕照-換照”和“駕照-年審”等。
在一個例子中,根據特徵組合詞確定內容資訊的特徵標籤,可以包括:將關鍵詞資訊中與特徵組合詞匹配的關鍵詞資訊作為特徵標籤。例如,確定的特徵組合詞包括:駕照-扣分、駕照-新規定、駕照-查詢違規、駕照-換照和駕照-年審等,據此可以從關鍵詞資訊(如,包括:駕照、扣分、新規定、駕照年審等)確定出包括駕照-扣分、駕照-新規定、駕照-年審的特徵標籤。
在另一例子中,關鍵詞資訊中可以包括多個關鍵詞以及各個關鍵詞的權重資訊。相應地,根據特徵組合詞確定內容資訊的特徵標籤,可以包括:根據各個關鍵詞與特徵組合詞的匹配情況,更新所述多個關鍵詞的權重;將更新後的權重大於預設閾值的關鍵詞作為內容資訊的特徵標籤。
在另一個例子中,關鍵詞資訊中可以包括多個關鍵詞以及各個關鍵詞對應的排序資訊(如,可以根據權重進行排序)。相應地,根據特徵組合詞確定內容資訊的特徵標籤,可以包括:根據各個關鍵詞與特徵組合詞的匹配情況以及原有的排序資訊,對多個關鍵詞進行重新排序;將經過重新排序後的位於預定順序範圍內的關鍵詞資訊作為內容資訊的特徵標籤。
例如,排序資訊可包括各個關鍵詞的權重值,可以根據各個關鍵詞與特徵組合詞的匹配情況(如,是否匹配)更新該關鍵詞的權重值。比如說,當關鍵詞(如,駕照-扣分)與某個特徵組合詞(駕照-扣分)完全匹配時,可以將該關鍵詞的權重值增加第一預設值(如,0.1);當關鍵詞(如,駕照)與某個特徵組合詞(駕照-扣分)部分匹配時,可以將該關鍵詞的權重值增加第二預設值(如,0.05);當關鍵詞與所有特徵組合詞均不匹配時,可以保持該關鍵詞原有的權重值。然後,根據更新後的權重值對多個關鍵詞進行排序,並將位於預定順序範圍(如,前五位)內的關鍵詞資訊作為特徵標籤。
在步驟S140中確定內容資訊的特徵標籤後,接著,在步驟S150,根據用戶的屬性標籤和特徵標籤,從內容資訊庫中確定向用戶推薦的內容推薦資訊。
具體地,用戶的屬性標籤可以基於用戶的歷史瀏覽內容確定。在一個實施例中,可以根據用戶的歷史瀏覽內容的特徵標籤,確定用戶的屬性標籤。其中特徵標籤可以透過執行上述步驟S110-步驟S140而獲得,區別在於步驟S110中不是獲取內容資訊庫中的內容資訊,而是獲取用戶的歷史瀏覽內容。
在一個實施例中,從內容資訊庫中確定向用戶推薦的內容推薦資訊,可以包括:將與屬性標籤匹配的特徵標籤所對應的內容資訊,作為內容推薦資訊。
在另一實施例中,從特徵標籤與屬性標籤相匹配的內容資訊中,按照預設規則進行進一步篩選,來確定最終的內容推薦資訊。具體而言,在一個例子中,從內容資訊庫中確定向用戶推薦的內容推薦資訊包括,將與屬性標籤匹配的特徵標籤所對應的內容資訊,作為向用戶推薦的候選內容資訊;以及根據預設規則對候選內容資訊中的各個內容資訊進行排名,並將名次在預設範圍內的內容資訊作為內容推薦資訊。
在一個例子中,預設規則可以包括特徵標籤的權重值,根據預設規則對候選內容資訊中的各個內容資訊進行排名,可以包括:根據候選內容資訊中各個內容資訊所對應的特徵標籤以及特徵標籤的權重值,透過加權求和的方式確定該內容資訊的評分,並根據評分對各個內容資訊進行排名。
在一個例子中,預設範圍可以根據與內容資訊相關的業務規則進行設定,例如,內容資訊屬於科技資訊,其業務規則可以包括向用戶推薦名次排在前五位的內容資訊。又例如,內容資訊屬於音樂欄目,其業務規則可以包括向用戶推薦名次排在前十位的內容資訊。
需要說明的是,可以在根據步驟S110-S140確定出用戶的屬性標籤後,直接從內容資訊庫中確定向用戶推薦的內容推薦資訊。具體地,可以根據包括第一用戶在內的多個用戶的屬性標籤確定多個用戶之間的相似度,並從多個用戶中確定與第一用戶的相似度在預設閾值範圍內的多個第二用戶。然後,根據多個第二用戶對內容資訊庫中內容資訊的瀏覽記錄,從內容資訊庫中確定向第一用戶推薦的內容推薦資訊。
另外,單個內容資訊可以與多個領域相關。相應地,在步驟S120中,可以確定與該內容資訊對應的多個特定領域,再在步驟S130中可以獲取與各個特定領域對應的領域知識資訊(如,領域層級知識和/或領域知識圖譜)。
在一個實施例中,在步驟S130中可以獲取與各個特定領域對應的領域層級知識,進而在步驟S140中確定內容資訊在各個特定領域中所對應的特定類別,以及與各個特定類別對應的特徵單詞,以及根據該特徵單詞確定內容資訊的特徵標籤。
在另一個實施例中,在步驟S130中可以獲取與各個特定領域對應的領域知識圖譜,進而在步驟S140中確定各個領域知識圖譜中包括的特徵組合詞,以及根據該特徵組合詞確定內容資訊的特徵標籤。
此外,領域知識資訊中包括的領域層級知識和領域知識圖譜的主要區別在於:第一,領域層級知識中的特徵單詞包括單個的詞語,領域知識圖譜中的特徵組合詞包括由至少兩個單詞組合的詞語。第二,領域層級知識中的特徵單詞主要是與類別强相關(也就是能夠根據該詞語明確推測出其所屬的一個或幾個類別)的詞語(如,特徵單詞“洗車”通常屬於汽車類別),而對於某些在所有類別都存在、但是在不同類別下具有不同語義的詞語(如,新規定)可能不會被設定為特徵單詞。而基於領域知識圖譜可以透過提取組合詞(如,駕照-新規定)的方式確定出在領域中具有明確語義的特徵資訊。顯然,在上述方法中,既可以單獨使用領域層級知識或領域知識圖譜,也可以將領域層級知識和領域知識圖譜結合起來使用,以確定內容資訊的特徵標籤,進而確定向用戶推薦的內容推薦資訊。
由上可知,在本說明書披露的多個實施例提供的內容推薦方法中,首先,獲取內容資訊庫中的內容資訊,並確定與該內容資訊相關的關鍵詞資訊。以及,確定與該內容資訊對應的特定領域,並獲取與該特定領域對應的領域知識資訊。接著,根據該領域知識資訊從關鍵詞資訊中確定內容資訊的特徵標籤。然後,根據該特徵標籤和用戶的屬性標籤,從內容資訊庫中確定向用戶推薦的內容推薦信。透過採用這種方法,實現向用戶推薦更加精準的內容資訊。
與內容推薦方法對應地,本說明書披露的多個實施例還提供一種內容推薦裝置,如圖4所示,該裝置400包括:
第一獲取模組410,用於獲取內容資訊庫中的內容資訊;
第一確定模組420,用於確定內容資訊的關鍵詞資訊;
第二確定模組430,用於確定與內容資訊對應的特定領域;
第二獲取模組440,用於獲取與特定領域對應的領域知識資訊;
第三確定模組450,用於根據領域知識資訊從關鍵詞資訊中確定內容資訊的特徵標籤;
處理模組460,用於根據用戶的屬性標籤和特徵標籤,從內容資訊庫中確定向用戶推薦的內容推薦資訊。
在一種可能的實施方式中,確定子模組中的關鍵詞提取演算法包括TF-IDF演算法和TextRank演算法中的至少一種。
在一種可能的實施方式中,第一獲取模組410獲取的內容資訊包括領域標籤,第二確定模組430具體用於:
根據領域標籤確定與內容資訊對應的特定領域。
在一種可能的實施方式中,第二獲取模組440獲取的領域知識資訊包括領域層級知識,領域層級知識包括領域名稱,與領域名稱對應的類別名稱,以及與類別名稱對應的特徵單詞。
在一種可能的實施方式中,第二獲取模組440獲取的特徵單詞基於內容語料庫中的內容語料訓練而獲得。
在一種可能的實施方式中,第三確定模組450具體包括:
第一確定子模組451,用於確定與內容資訊對應的特定類別;
第二確定子模組452,用於在領域層級知識中,確定與特定類別對應的特定類別名稱,以及與特定類別名稱對應的特徵單詞;
第三確定子模組453,根據特徵單詞從關鍵詞資訊中確定內容資訊的特徵標籤。
在一種可能的實施方式中,第一獲取模組410獲取的內容資訊包括類別標籤,第一確定子模組451具體用於:
根據類別標籤確定與內容資訊對應的特定類別。
在一種可能的實施方式中,第三確定子模組453具體用於:
將關鍵詞資訊中與特徵單詞匹配的關鍵詞資訊作為特徵標籤。
在一種可能的實施方式中,第一確定模組420確定的關鍵詞資訊中包括多個關鍵詞和各個關鍵詞的排序資訊,第三確定子模組453具體用於:
根據關鍵詞資訊中各個關鍵詞與特徵單詞的匹配情況,以及排序資訊,對多個關鍵詞重新排序;
將經過重新排序後的位於預定順序範圍內的關鍵詞資訊作為內容資訊的特徵標籤。
在一種可能的實施方式中,第二獲取模組440獲取的領域知識資訊包括領域知識圖譜,領域知識圖譜在其第一層包括與領域對應的實體詞,在其第二層包括與實體詞對應的關聯詞,實體詞和關聯詞組合構成特徵組合詞。
在一種可能的實施方式中,第三確定模組450具體包括:
第二確定子模組452,用於確定與特定領域對應的領域知識圖譜中包括的特徵組合詞;
第三確定子模組453,用於根據特徵組合詞從關鍵詞資訊中確定內容資訊的特徵標籤。
在一種可能的實施方式中,第三確定子模組453具體用於:
將關鍵詞資訊中與特徵組合詞匹配的關鍵詞資訊作為特徵標籤。
在一種可能的實施方式中,第一確定模組420確定的關鍵詞資訊中包括多個關鍵詞和各個關鍵詞的排序資訊,第三確定子模組453具體用於:
根據關鍵詞資訊中各個關鍵詞與特徵組合詞的匹配情況,以及排序資訊,對多個關鍵詞重新排序;
將經過重新排序後的位於預定順序範圍內的關鍵詞資訊作為內容資訊的特徵標籤。
在一種可能的實施方式中,處理模組460中包括的屬性標籤基於用戶的歷史瀏覽內容確定。
在一種可能的實施方式中,處理模組460具體用於:
將與屬性標籤匹配的特徵標籤所對應的內容資訊,作為向用戶推薦的候選內容資訊;
根據預設規則對候選內容資訊中的各個內容資訊進行排名,並將名次在預設範圍內的內容資訊作為內容推薦資訊。
由上可知,在本說明書披露的多個實施例提供的內容推薦裝置中,首先,第一獲取模組410獲取內容資訊庫中的內容資訊,第一確定模組420確定與該內容資訊相關的關鍵詞資訊,第二確定模組430確定與該內容資訊對應的特定領域,第二獲取模組440獲取與該特定領域對應的領域知識資訊。接著,第三確定模組450根據該領域知識資訊從關鍵詞資訊中確定內容資訊的特徵標籤。然後,處理模組460根據該特徵標籤和用戶的屬性標籤,從內容資訊庫中確定向用戶推薦的內容推薦信。透過採用這種裝置,實現向用戶推薦更加精準的內容資訊。
本領域技術人員應該可以意識到,在上述一個或多個示例中,本說明書披露的多個實施例所描述的功能可以用硬體、軟體、韌體或它們的任意組合來實現。當使用軟體實現時,可以將這些功能儲存在電腦可讀媒體中或者作為電腦可讀媒體上的一個或多個指令或碼進行傳輸。
以上所述的具體實施方式,對本說明書披露的多個實施例的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本說明書披露的多個實施例的具體實施方式而已,並不用於限定本說明書披露的多個實施例的保護範圍,凡在本說明書披露的多個實施例的技術方案的基礎之上,所做的任何修改、等同替換、改進等,均應包括在本說明書披露的多個實施例的保護範圍之內。
400‧‧‧內容推薦裝置
410‧‧‧第一獲取模組
420‧‧‧第一確定模組
430‧‧‧第二確定模組
440‧‧‧第二獲取模組
450‧‧‧第三確定模組
451‧‧‧第一確定子模組
452‧‧‧第二確定子模組
453‧‧‧第三確定子模組
460‧‧‧處理模組
為了更清楚地說明本說明書披露的多個實施例的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本說明書披露的多個實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其它的附圖。
圖1為本說明書披露的一個實施例提供的一種內容推薦方法的流程圖;
圖2為本說明書披露的一個實施例提供的領域層級知識的示意圖;
圖3為本說明書披露的一個實施例提供的領域知識圖譜的示意圖;
圖4為本說明書披露的一個實施例提供的一種內容推薦裝置的結構圖。

Claims (20)

  1. 一種內容推薦方法,其特徵在於,包括: 獲取內容資訊庫中的內容資訊,並確定所述內容資訊的關鍵詞資訊; 確定與所述內容資訊對應的特定領域; 獲取與所述特定領域對應的領域知識資訊; 根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤; 根據用戶的屬性標籤和所述特徵標籤,從所述內容資訊庫中確定向所述用戶推薦的內容推薦資訊。
  2. 根據申請專利範圍第1項所述的方法,其中,所述領域知識資訊包括領域層級知識,所述領域層級知識包括領域名稱,與所述領域名稱對應的類別名稱,以及與所述類別名稱對應的特徵單詞。
  3. 根據申請專利範圍第2項所述的方法,其中,所述根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤包括: 確定與所述內容資訊對應的特定類別; 在所述領域層級知識中,確定與所述特定類別對應的特定類別名稱,以及與所述特定類別名稱對應的特徵單詞; 根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
  4. 根據申請專利範圍第3項所述的方法,其中,所述內容資訊包括類別標籤,所述確定與所述內容資訊對應的特定類別,包括: 根據所述類別標籤確定與所述內容資訊對應的特定類別。
  5. 根據申請專利範圍第3項所述的方法,其中,所述根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括: 將所述關鍵詞資訊中與所述特徵單詞匹配的關鍵詞資訊作為所述特徵標籤。
  6. 根據申請專利範圍第3項所述的方法,其中,所述關鍵詞資訊包括多個關鍵詞和各個關鍵詞的排序資訊,所述根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括: 根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵單詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序; 將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
  7. 根據申請專利範圍第1項所述的方法,其中,所述領域知識資訊包括領域知識圖譜,所述領域知識圖譜在其第一層包括與領域對應的實體詞,在其第二層包括與所述實體詞對應的關聯詞,所述實體詞和所述關聯詞組合構成特徵組合詞。
  8. 根據申請專利範圍第7項所述的方法,其中,所述根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤包括: 確定與所述特定領域對應的領域知識圖譜中包括的特徵組合詞; 根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
  9. 根據申請專利範圍第8項所述的方法,其中,所述根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括: 將所述關鍵詞資訊中與所述特徵組合詞匹配的關鍵詞資訊作為所述特徵標籤。
  10. 根據申請專利範圍第8項所述的方法,其中,所述關鍵詞資訊包括多個關鍵詞和各個關鍵詞的排序資訊,所述根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤,包括: 根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵組合詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序; 將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
  11. 一種內容推薦裝置,其特徵在於,包括: 第一獲取模組,用於獲取內容資訊庫中的內容資訊; 第一確定模組,用於確定所述內容資訊的關鍵詞資訊; 第二確定模組,用於確定與所述內容資訊對應的特定領域; 第二獲取模組,用於獲取與所述特定領域對應的領域知識資訊; 第三確定模組,用於根據所述領域知識資訊從所述關鍵詞資訊中確定所述內容資訊的特徵標籤; 處理模組,用於根據用戶的屬性標籤和所述特徵標籤,從所述內容資訊庫中確定向所述用戶推薦的內容推薦資訊。
  12. 根據申請專利範圍第11項所述的裝置,其中,所述第二獲取模組獲取的領域知識資訊包括領域層級知識,所述領域層級知識包括領域名稱,與所述領域名稱對應的類別名稱,以及與所述類別名稱對應的特徵單詞。
  13. 根據申請專利範圍第12項所述的裝置,其中,所述第三確定模組具體包括: 第一確定子模組,用於確定與所述內容資訊對應的特定類別; 第二確定子模組,用於在所述領域層級知識中,確定與所述特定類別對應的特定類別名稱,以及與所述特定類別名稱對應的特徵單詞; 第三確定子模組,根據所述特徵單詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
  14. 根據申請專利範圍第13項所述的裝置,其中,所述第一獲取模組獲取的內容資訊包括類別標籤,所述第一確定子模組具體用於: 根據所述類別標籤確定與所述內容資訊對應的特定類別。
  15. 根據申請專利範圍第13項所述的裝置,其中,所述第三確定子模組具體用於: 將所述關鍵詞資訊中與所述特徵單詞匹配的關鍵詞資訊作為所述特徵標籤。
  16. 根據申請專利範圍第13項所述的裝置,其中,所述第一確定模組確定的關鍵詞資訊中包括多個關鍵詞和各個關鍵詞的排序資訊,所述第三確定子模組具體用於: 根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵單詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序; 將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
  17. 根據申請專利範圍第11項所述的裝置,其中,所述第二獲取模組獲取的領域知識資訊包括領域知識圖譜,所述領域知識圖譜在其第一層包括與領域對應的實體詞,在其第二層包括與所述實體詞對應的關聯詞,所述實體詞和所述關聯詞組合構成特徵組合詞。
  18. 根據申請專利範圍第11項所述的裝置,其中,所述第三確定模組具體包括: 第二確定子模組,用於確定與所述特定領域對應的領域知識圖譜中包括的特徵組合詞; 第三確定子模組,用於根據所述特徵組合詞從所述關鍵詞資訊中確定所述內容資訊的特徵標籤。
  19. 根據申請專利範圍第18項所述的裝置,其中,所述第三確定子模組具體用於: 將所述關鍵詞資訊中與所述特徵組合詞匹配的關鍵詞資訊作為所述特徵標籤。
  20. 根據申請專利範圍第18項所述的裝置,其中,所述第一確定模組確定的關鍵詞資訊中包括多個關鍵詞和各個關鍵詞的排序資訊,所述第三確定子模組具體用於: 根據所述關鍵詞資訊中所述各個關鍵詞與所述特徵組合詞的匹配情況,以及所述排序資訊,對所述多個關鍵詞重新排序; 將經過所述重新排序後的位於預定順序範圍內的關鍵詞資訊作為所述內容資訊的特徵標籤。
TW107143560A 2018-01-08 2018-12-05 內容推薦方法及裝置 TWI687823B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
??201810015028.0 2018-01-08
CN201810015028.0A CN108268619B (zh) 2018-01-08 2018-01-08 内容推荐方法及装置
CN201810015028.0 2018-01-08

Publications (2)

Publication Number Publication Date
TW201931170A true TW201931170A (zh) 2019-08-01
TWI687823B TWI687823B (zh) 2020-03-11

Family

ID=62773196

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107143560A TWI687823B (zh) 2018-01-08 2018-12-05 內容推薦方法及裝置

Country Status (5)

Country Link
US (1) US11720572B2 (zh)
CN (1) CN108268619B (zh)
SG (1) SG11202006532QA (zh)
TW (1) TWI687823B (zh)
WO (1) WO2019134554A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI800982B (zh) * 2021-11-16 2023-05-01 宏碁股份有限公司 文章標記資料的產生裝置及其產生方法
TWI800743B (zh) * 2020-07-17 2023-05-01 開曼群島商粉迷科技股份有限公司 個人化內容推薦方法、圖形使用者介面及其系統

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108268619B (zh) * 2018-01-08 2020-06-30 阿里巴巴集团控股有限公司 内容推荐方法及装置
CN110570316A (zh) 2018-08-31 2019-12-13 阿里巴巴集团控股有限公司 训练损伤识别模型的方法及装置
EP3871116A4 (en) * 2019-01-04 2021-11-24 Samsung Electronics Co., Ltd. METHOD AND APPARATUS FOR RECOVERING INTELLIGENT INFORMATION FROM AN ELECTRONIC DEVICE
CN110516030B (zh) * 2019-08-26 2022-11-01 北京百度网讯科技有限公司 意图词的确定方法、装置、设备及计算机可读存储介质
CN110706021A (zh) * 2019-09-12 2020-01-17 微梦创科网络科技(中国)有限公司 一种广告投放方法及系统
WO2021108679A1 (en) * 2019-11-27 2021-06-03 ConverSight.ai, Inc. Contextual and intent based natural language processing system and method
CN111159420B (zh) * 2019-12-12 2023-04-28 西安交通大学 一种基于属性计算与知识模板的实体优化方法
US11386463B2 (en) * 2019-12-17 2022-07-12 At&T Intellectual Property I, L.P. Method and apparatus for labeling data
CN111259659B (zh) * 2020-01-14 2023-07-04 北京百度网讯科技有限公司 信息处理方法和装置
CN112417202B (zh) * 2020-09-04 2023-06-30 上海哔哩哔哩科技有限公司 内容筛选方法及装置
CN112328832B (zh) * 2020-10-27 2022-08-09 内蒙古大学 一种融合标签和知识图谱的电影推荐方法
CN112348638B (zh) * 2020-11-09 2024-02-20 上海秒针网络科技有限公司 一种活动文案推荐方法、装置、电子设备和存储介质
CN112380339A (zh) * 2020-11-23 2021-02-19 北京达佳互联信息技术有限公司 热点事件挖掘方法、装置及服务器
CN112686043B (zh) * 2021-01-12 2024-02-06 武汉大学 一种基于词向量的企业所属新兴产业分类方法
CN112685645A (zh) * 2021-01-13 2021-04-20 敖客星云(北京)科技发展有限公司 基于知识图谱的智能教育推荐方法、系统、设备和介质
CN113157857B (zh) * 2021-03-13 2023-06-02 中国科学院新疆理化技术研究所 面向新闻的热点话题检测方法、装置及设备
CN113032671B (zh) * 2021-03-17 2024-02-23 北京百度网讯科技有限公司 内容处理方法、装置、电子设备和存储介质
CN113076428A (zh) * 2021-03-19 2021-07-06 北京沃东天骏信息技术有限公司 一种书单生成方法和装置
CN113177170B (zh) * 2021-04-12 2023-05-23 维沃移动通信有限公司 评论展示方法、装置及电子设备
CN115248890B (zh) * 2021-04-27 2024-04-05 百度国际科技(深圳)有限公司 用户兴趣画像的生成方法、装置、电子设备以及存储介质
CN112988979B (zh) * 2021-04-29 2021-10-08 腾讯科技(深圳)有限公司 实体识别方法、装置、计算机可读介质及电子设备
CN113704614A (zh) * 2021-08-30 2021-11-26 康键信息技术(深圳)有限公司 基于用户画像的页面生成方法、装置、设备及介质
CN113806561A (zh) * 2021-10-11 2021-12-17 中国人民解放军国防科技大学 一种基于实体属性的知识图谱事实补全方法
CN113936765A (zh) * 2021-12-17 2022-01-14 北京因数健康科技有限公司 周期行为报告的生成方法及装置、存储介质、电子设备

Family Cites Families (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7031901B2 (en) 1998-05-13 2006-04-18 Abu El Ata Nabil A System and method for improving predictive modeling of an information system
US6397334B1 (en) 1998-12-17 2002-05-28 International Business Machines Corporation Method and system for authenticating objects and object data
US6644973B2 (en) 2000-05-16 2003-11-11 William Oster System for improving reading and speaking
US6925452B1 (en) 2000-05-22 2005-08-02 International Business Machines Corporation Method and system for recognizing end-user transactions
US7093129B1 (en) 2000-06-19 2006-08-15 International Business Machines Corporation Secured encrypted communications in a voice browser
JP3846851B2 (ja) 2001-02-01 2006-11-15 松下電器産業株式会社 画像のマッチング処理方法及びその装置
US7565537B2 (en) 2002-06-10 2009-07-21 Microsoft Corporation Secure key exchange with mutual authentication
US20040196363A1 (en) 2003-04-01 2004-10-07 Gary Diamond Video identification verification system
US7466824B2 (en) 2003-10-09 2008-12-16 Nortel Networks Limited Method and system for encryption of streamed data
US7401012B1 (en) 2005-04-20 2008-07-15 Sun Microsystems, Inc. Method and apparatus for characterizing computer system workloads
US8448226B2 (en) 2005-05-13 2013-05-21 Sarangan Narasimhan Coordinate based computer authentication system and methods
US7536304B2 (en) 2005-05-27 2009-05-19 Porticus, Inc. Method and system for bio-metric voice print authentication
KR101426870B1 (ko) 2007-03-06 2014-09-19 스미토모덴키고교가부시키가이샤 화상 가공 방법, 컴퓨터 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체, 및 화상 검사 방법
US7872584B2 (en) 2007-04-09 2011-01-18 Honeywell International Inc. Analyzing smoke or other emissions with pattern recognition
US8280106B2 (en) 2007-09-29 2012-10-02 Samsung Electronics Co., Ltd. Shadow and highlight detection system and method of the same in surveillance camera and recording medium thereof
US9298979B2 (en) 2008-01-18 2016-03-29 Mitek Systems, Inc. Systems and methods for mobile image capture and content processing of driver's licenses
US8180629B2 (en) 2008-07-10 2012-05-15 Trigent Softward Ltd. Automatic pattern generation in natural language processing
DE102008046254A1 (de) 2008-09-08 2010-03-11 Giesecke & Devrient Gmbh Wertdokumentbearbeitungsvorrichtung und ein Verfahren zur Reduktion von Staub in der Wertdokumentbearbeitungsvorrichtung
KR101556654B1 (ko) 2008-11-28 2015-10-02 삼성전자주식회사 영상 통화 수행 방법 및 장치
US8121400B2 (en) 2009-09-24 2012-02-21 Huper Laboratories Co., Ltd. Method of comparing similarity of 3D visual objects
US9253167B2 (en) 2011-04-19 2016-02-02 Apriva, Llc Device and system for facilitating communication and networking within a secure mobile environment
US9082235B2 (en) 2011-07-12 2015-07-14 Microsoft Technology Licensing, Llc Using facial data for device authentication or subject identification
US8966613B2 (en) 2011-09-30 2015-02-24 Microsoft Technology Licensing, Llc Multi-frame depth image information identification
US8989515B2 (en) 2012-01-12 2015-03-24 Kofax, Inc. Systems and methods for mobile image capture and processing
US9066125B2 (en) 2012-02-10 2015-06-23 Advanced Biometric Controls, Llc Secure display
JP6052657B2 (ja) 2012-03-13 2016-12-27 パナソニックIpマネジメント株式会社 対象物検証装置、対象物検証プログラム、及び対象物検証方法
US8705836B2 (en) 2012-08-06 2014-04-22 A2iA S.A. Systems and methods for recognizing information in objects using a mobile device
US9582843B2 (en) 2012-08-20 2017-02-28 Tautachrome, Inc. Authentication and validation of smartphone imagery
US9036943B1 (en) 2013-03-14 2015-05-19 Amazon Technologies, Inc. Cloud-based image improvement
US10475014B1 (en) 2013-03-15 2019-11-12 Amazon Technologies, Inc. Payment device security
US9147127B2 (en) 2013-03-15 2015-09-29 Facebook, Inc. Verification of user photo IDs
US20140310277A1 (en) 2013-04-15 2014-10-16 Flextronics Ap, Llc Suspending user profile modification based on user context
US9723251B2 (en) 2013-04-23 2017-08-01 Jaacob I. SLOTKY Technique for image acquisition and management
CN104142940B (zh) * 2013-05-08 2017-11-17 华为技术有限公司 信息推荐处理方法及装置
US9268823B2 (en) * 2013-05-10 2016-02-23 International Business Machines Corporation Partial match derivation using text analysis
CN103442001B (zh) * 2013-08-22 2019-05-17 百度在线网络技术(北京)有限公司 信息推荐方法、装置和服务器
US10319035B2 (en) 2013-10-11 2019-06-11 Ccc Information Services Image capturing and automatic labeling system
US9202119B2 (en) 2013-10-18 2015-12-01 Daon Holdings Limited Methods and systems for determining user liveness
JP6287047B2 (ja) 2013-10-22 2018-03-07 富士通株式会社 画像処理装置、画像処理方法および画像処理プログラム
US9607138B1 (en) 2013-12-18 2017-03-28 Amazon Technologies, Inc. User authentication and verification through video analysis
US10320807B2 (en) 2014-02-25 2019-06-11 Sal Khan Systems and methods relating to the authenticity and verification of photographic identity documents
US20150293982A1 (en) * 2014-04-14 2015-10-15 International Business Machines Corporation Displaying a representative item for a collection of items
US9646227B2 (en) 2014-07-29 2017-05-09 Microsoft Technology Licensing, Llc Computerized machine learning of interesting video sections
US9258303B1 (en) 2014-08-08 2016-02-09 Cellcrypt Group Limited Method of providing real-time secure communication between end points in a network
CA2902093C (en) 2014-08-28 2023-03-07 Kevin Alan Tussy Facial recognition authentication system including path parameters
KR20160087649A (ko) * 2015-01-14 2016-07-22 삼성전자주식회사 사용자 단말 장치, 시스템 및 그 제어 방법
CN106033415B (zh) * 2015-03-09 2020-07-03 深圳市腾讯计算机系统有限公司 文本内容推荐方法及装置
US9619696B2 (en) 2015-04-15 2017-04-11 Cisco Technology, Inc. Duplicate reduction for face detection
CN106156204B (zh) * 2015-04-23 2020-05-29 深圳市腾讯计算机系统有限公司 文本标签的提取方法和装置
TWI556123B (zh) * 2015-08-06 2016-11-01 News tracking and recommendation method
US9794260B2 (en) 2015-08-10 2017-10-17 Yoti Ltd Liveness detection
US20170060867A1 (en) 2015-08-31 2017-03-02 Adfamilies Publicidade, SA Video and image match searching
US10065441B2 (en) 2015-09-01 2018-09-04 Digimarc Corporation Counterfeiting detection using machine readable indicia
WO2017043314A1 (ja) 2015-09-09 2017-03-16 日本電気株式会社 ガイダンス取得装置、ガイダンス取得方法及びプログラム
US11868354B2 (en) * 2015-09-23 2024-01-09 Motorola Solutions, Inc. Apparatus, system, and method for responding to a user-initiated query with a context-based response
GB201517462D0 (en) 2015-10-02 2015-11-18 Tractable Ltd Semi-automatic labelling of datasets
WO2017059576A1 (en) 2015-10-09 2017-04-13 Beijing Sensetime Technology Development Co., Ltd Apparatus and method for pedestrian detection
US20170148102A1 (en) 2015-11-23 2017-05-25 CSI Holdings I LLC Damage assessment and repair based on objective surface data
CN105719188B (zh) 2016-01-22 2017-12-26 平安科技(深圳)有限公司 基于多张图片一致性实现保险理赔反欺诈的方法及服务器
US10242048B2 (en) * 2016-01-26 2019-03-26 International Business Machines Corporation Dynamic question formulation to query data sources
US11144889B2 (en) 2016-04-06 2021-10-12 American International Group, Inc. Automatic assessment of damage and repair costs in vehicles
US10692050B2 (en) 2016-04-06 2020-06-23 American International Group, Inc. Automatic assessment of damage and repair costs in vehicles
US20170293620A1 (en) * 2016-04-06 2017-10-12 International Business Machines Corporation Natural language processing based on textual polarity
US10789545B2 (en) 2016-04-14 2020-09-29 Oath Inc. Method and system for distributed machine learning
JP6235082B1 (ja) 2016-07-13 2017-11-22 ヤフー株式会社 データ分類装置、データ分類方法、およびプログラム
US10055882B2 (en) 2016-08-15 2018-08-21 Aquifi, Inc. System and method for three-dimensional scanning and for capturing a bidirectional reflectance distribution function
GB2554361B8 (en) 2016-09-21 2022-07-06 Emergent Network Intelligence Ltd Automatic image based object damage assessment
WO2018120013A1 (en) 2016-12-30 2018-07-05 Nokia Technologies Oy Artificial neural network
WO2018165753A1 (en) 2017-03-14 2018-09-20 University Of Manitoba Structure defect detection using machine learning algorithms
CN107015963A (zh) * 2017-03-22 2017-08-04 重庆邮电大学 基于深度神经网络的自然语言语义分析系统及方法
CN106897273B (zh) * 2017-04-12 2018-02-06 福州大学 一种基于知识图谱的网络安全动态预警方法
KR102334575B1 (ko) 2017-07-31 2021-12-03 삼성디스플레이 주식회사 무라 검출 장치 및 무라 검출 장치의 검출 방법
US11087292B2 (en) 2017-09-01 2021-08-10 Allstate Insurance Company Analyzing images and videos of damaged vehicles to determine damaged vehicle parts and vehicle asymmetries
US11586875B2 (en) 2017-11-22 2023-02-21 Massachusetts Institute Of Technology Systems and methods for optimization of a data model network architecture for target deployment
CN109919308B (zh) 2017-12-13 2022-11-11 腾讯科技(深圳)有限公司 一种神经网络模型部署方法、预测方法及相关设备
CN108268619B (zh) 2018-01-08 2020-06-30 阿里巴巴集团控股有限公司 内容推荐方法及装置
US10942767B2 (en) 2018-02-27 2021-03-09 Microsoft Technology Licensing, Llc Deep neural network workload scheduling
US10554738B1 (en) 2018-03-02 2020-02-04 Syncsort Incorporated Methods and apparatus for load balance optimization based on machine learning
US10997413B2 (en) 2018-03-23 2021-05-04 NthGen Software Inc. Method and system for obtaining vehicle target views from a video stream
GB2573809B (en) 2018-05-18 2020-11-04 Emotech Ltd Speaker Recognition
US10832065B1 (en) 2018-06-15 2020-11-10 State Farm Mutual Automobile Insurance Company Methods and systems for automatically predicting the repair costs of a damaged vehicle from images
WO2020033111A1 (en) 2018-08-09 2020-02-13 Exxonmobil Upstream Research Company ( Subterranean drill bit management system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI800743B (zh) * 2020-07-17 2023-05-01 開曼群島商粉迷科技股份有限公司 個人化內容推薦方法、圖形使用者介面及其系統
TWI800982B (zh) * 2021-11-16 2023-05-01 宏碁股份有限公司 文章標記資料的產生裝置及其產生方法
US11954441B2 (en) 2021-11-16 2024-04-09 Acer Incorporated Device and method for generating article markup information

Also Published As

Publication number Publication date
CN108268619A (zh) 2018-07-10
TWI687823B (zh) 2020-03-11
CN108268619B (zh) 2020-06-30
US20200320086A1 (en) 2020-10-08
SG11202006532QA (en) 2020-08-28
US11720572B2 (en) 2023-08-08
WO2019134554A1 (zh) 2019-07-11

Similar Documents

Publication Publication Date Title
TWI687823B (zh) 內容推薦方法及裝置
US9552394B2 (en) Generation of multi-faceted search results in response to query
US10296640B1 (en) Video segments for a video related to a task
US9679001B2 (en) Consensus search device and method
US8868558B2 (en) Quote-based search
US20070299824A1 (en) Hybrid approach for query recommendation in conversation systems
KR101661198B1 (ko) 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템
US20130060769A1 (en) System and method for identifying social media interactions
CN111221968B (zh) 基于学科树聚类的作者消歧方法及装置
US20220107980A1 (en) Providing an object-based response to a natural language query
An et al. Semantic deep web: automatic attribute extraction from the deep web data sources
KR20100023630A (ko) 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체
JP6409071B2 (ja) 文の並び替え方法および計算機
CN112417174A (zh) 一种数据处理的方法和装置
CN111737607A (zh) 数据处理方法、装置、电子设备以及存储介质
KR101602342B1 (ko) 의미 태깅된 자연어 질의의 의도에 부합하는 정보 추출 및 제공 방법 및 시스템
CN113254623B (zh) 数据处理方法、装置、服务器、介质及产品
Charnine et al. Association-Based Identification of Internet Users Interest
CN110851560B (zh) 信息检索方法、装置及设备
JP2002183195A (ja) 概念検索方式
Harris et al. Applying human computation mechanisms to information retrieval
JPH11195041A (ja) 文書検索装置、方法及び記録媒体
JP7037778B2 (ja) 検索装置および方法
KR102625347B1 (ko) 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템
Christianson et al. Reverse-Transliteration of Hebrew script for Entity Disambiguation