CN107330023A - 基于关注点的文本内容推荐方法和装置 - Google Patents

基于关注点的文本内容推荐方法和装置 Download PDF

Info

Publication number
CN107330023A
CN107330023A CN201710475690.XA CN201710475690A CN107330023A CN 107330023 A CN107330023 A CN 107330023A CN 201710475690 A CN201710475690 A CN 201710475690A CN 107330023 A CN107330023 A CN 107330023A
Authority
CN
China
Prior art keywords
point
text content
user
candidate
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710475690.XA
Other languages
English (en)
Other versions
CN107330023B (zh
Inventor
刘呈祥
肖欣延
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710475690.XA priority Critical patent/CN107330023B/zh
Publication of CN107330023A publication Critical patent/CN107330023A/zh
Priority to US15/859,800 priority patent/US10671656B2/en
Application granted granted Critical
Publication of CN107330023B publication Critical patent/CN107330023B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种基于关注点的文本内容推荐方法和装置,其中,方法包括:获取用户输入的搜索词,以及获取从所述搜素词的搜索结果中,所述用户所选定的参考文本内容;根据所述参考文本内容中与所述搜索词相关的词语,生成所述搜索词的词向量;根据所述搜索词的词向量与多个参考关注点的词向量之间的相似度,从所述多个参考关注点中确定出用户关注点;向所述用户推荐与所述用户关注点匹配的文本内容。通过本方法,能够自动识别用户关注点,实现快速、高效、精准的个性化资讯推荐,解决现有技术中个性化资讯推荐准确度不高的技术问题。

Description

基于关注点的文本内容推荐方法和装置
技术领域
本发明涉及信息技术领域,尤其涉及一种基于关注点的文本内容推荐方法和装置。
背景技术
随着信息技术的不断成熟,基于用户关注点的个性化资讯推荐服务逐渐成为资讯消费的主流形式。
在现有技术中,为了实现个性化资讯推荐,需要用户主动订阅,由用户在应用程序提供的候选关注点中进行检索,通过手工订阅的方式获取推荐的资讯信息。
然而,用户主动订阅的方式需要用户主动提供所需推荐的内容,一方面用户操作较为复杂,另一方面,用户提供的所需推荐的内容可能存在不准确的问题,从而导致现有技术中的个性化资讯推荐准确度不高。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于关注点的文本内容推荐方法,以自动识别用户关注点,简化用户操作,解决现有技术中个性化资讯推荐准确度不高的技术问题。
本发明的第二个目的在于提出一种基于关注点的文本内容推荐装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种基于关注点的文本内容推荐方法,包括:
获取用户输入的搜索词,以及获取从所述搜素词的搜索结果中,所述用户所选定的参考文本内容;
根据所述参考文本内容中与所述搜索词相关的词语,生成所述搜索词的词向量;
根据所述搜索词的词向量与多个参考关注点的词向量之间的相似度,从所述多个参考关注点中确定出用户关注点;
向所述用户推荐与所述用户关注点匹配的文本内容。
本发明实施例的基于关注点的文本内容推荐方法,通过获取用户输入的搜索词以及获取从搜索词的搜索结果中用户所选定的参考文本内容,根据参考文本内容中与搜索词相关的词语,生成搜索词的词向量,根据搜索词的词向量与多个参考关注点的词向量之间的相似度,从多个参考关注点中确定出用户关注点,向用户推荐与用户关注点匹配的文本内容。由此,能够自动识别用户关注点,实现快速、高效、精准的个性化资讯推荐,提高关注点识别的准确度,进而提高内容推荐的准确度。
为达上述目的,本发明第二方面实施例提出了一种基于关注点的文本内容推荐装置,包括:
获取模块,用于获取用户输入的搜索词,以及获取从所述搜索词的搜素结果中,所述用户所选定的参考文本内容;
生成模块,用于根据所述参考文本内容中与所述搜索词相关的词语,生成所述搜索词的词向量;
确定模块,用于根据所述搜索词的词向量与多个参考关注点的词向量之间的相似度,从所述多个参考关注点中确定出用户关注点;
推荐模块,用于向所述用户推荐与所述用户关注点匹配的文本内容。
本发明实施例的基于关注点的文本内容推荐装置,通过获取用户输入的搜索词以及获取从搜索词的搜索结果中用户所选定的参考文本内容,根据参考文本内容中与搜索词相关的词语,生成搜索词的词向量,根据搜索词的词向量与多个参考关注点的词向量之间的相似度,从多个参考关注点中确定出用户关注点,向用户推荐与用户关注点匹配的文本内容。由此,能够自动识别用户关注点,实现快速、高效、精准的个性化资讯推荐,提高关注点识别的准确度,进而提高内容推荐的准确度。
为达上述目的,本发明第三方面实施例提出了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如第一方面实施例所述的基于关注点的文本内容推荐方法。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例所述的基于关注点的文本内容推荐方法。
为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如第一方面实施例所述的基于关注点的文本内容推荐方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明一实施例提出的基于关注点的文本内容推荐方法的流程示意图;
图2为本发明另一实施例提出的基于关注点的文本内容推荐方法的流程示意图;
图3为本发明又一实施例提出的基于关注点的文本内容推荐方法的流程示意图;
图4为针对每一个候选文本内容识别文本关注点的流程示意图;
图5(a)为识别文本关注点的具体实现示意图;
图5(b)为计算显示语义相似度和隐式语义相似度的具体实现示意图;
图6为本发明一实施例提出的基于关注点的文本内容推荐装置的结构示意图;
图7为本发明另一实施例提出的基于关注点的文本内容推荐装置的结构示意图;以及
图8为本发明一实施例提出的计算机设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的基于关注点的文本内容推荐方法和装置。
现有实现个性化资讯推荐的方式有用户主动订阅和相关资讯推荐两种。用户主动订阅的方式存在用户成本高、难以实现关注点较多时的个性化资讯订阅的问题。相关资讯推荐的方式存在前期推荐准确率低,实现准确资讯推荐耗时长的问题,从而容易导致用户流失。
针对上述问题,本发明实施例提出了一种基于关注点的文本内容推荐方法,以自动识别用户关注点,实现快速、高效、精准的个性化资讯推荐。
图1为本发明一实施例提出的基于关注点的文本内容推荐方法的流程示意图。
如图1所示,该基于关注点的文本内容推荐方法包括以下步骤:
S11,获取用户输入的搜索词,以及获取从搜素词的搜索结果中,用户所选定的参考文本内容。
当用户想要了解某一信息时,可以在搜索引擎或者具有搜索功能的应用程序的搜索框中输入搜索词。此时,搜索引擎或应用程序的搜索功能被触发,搜索引擎或应用程序可以获取用户输入的搜索词,并从服务器中获取与搜索词相关的搜索结果展示给用户。用户可以从搜索结果中选择较匹配的内容进行查看。
本实施例中,为了对用户的喜好进行分析,识别出用户的关注点,可以从搜索引擎或者应用程序的浏览日志中获取用户输入的搜索词,并获取用户在与搜索词对应的搜索结果中所选定的结果,作为参考文本内容。
S12,根据参考文本内容中与搜索词相关的词语,生成搜索词的词向量。
具体地,在获取了参考文本内容之后,可以进一步对参考文本内容中出现的词语进行统计,挖掘出与搜索词相关的词语,进而根据参考文本内容中与搜索词相关的词语,生成搜索词的词向量,词向量中每一个分量对应了参考文本内容中一个与搜索词相关的词语。
需要说明的是,可以采用现有的相关技术生成词向量,为避免赘余,本发明不作详细说明。
S13,根据搜索词的词向量与多个参考关注点的词向量之间的相似度,从多个参考关注点中确定出用户关注点。
作为一种可能的实现形式,在预测关注点之前,需要预先确定出作为候选的关注点,也就是本实施例中提及的参考关注点。具体来说,为了挖掘出多个参考关注点,可以对全部用户的搜索行为进行分析,将全部用户进行信息搜索时所输入的搜索词作为参考关注点,并获取全部用户从与参考关注点对应的搜索结果中所选中的搜索结果。进而从全部用户选中的搜索结果中提取出与相应的参考关注点语义相似的词语,根据所提取的词语,利用相关技术生成参考关注点的词向量。
进而,可以根据搜索词的词向量与多个参考关注点的词向量之间的相似程度,从多个参考关注点中确定出用户关注点。
举例而言,可以计算搜索词的词向量与各个参考关注点的词向量之间的余弦相似度。具体地,首先根据坐标值将搜索词的词向量与各个参考关注点的词向量绘制在向量空间中,并计算搜索词的词向量与各个参考关注点的词向量之间的夹角,通过夹角对应的余弦值表征搜索词的词向量与各个关注点的词向量之间的相似程度。夹角越小,余弦值越接近于1,表示搜索词的词向量与参考关注点的词向量的相似程度越高,将相似程度最高的参考关注点确定为用户关注点。
S14,向用户推荐与用户关注点匹配的文本内容。
本实施例中,确定了用户关注点之后,即可获取与用户关注点匹配的文本内容,并推荐给用户。
由于本发明的基于关注点的文本内容推荐方法中,用户关注点的识别是在后台自动完成的,当用户启动搜索引擎或应用程序(比如,手机百度)时,用户可以在第一时间获取到推荐的个性化资讯,快速、高效。
本实施例的基于关注点的文本内容推荐方法,通过获取用户输入的搜索词以及获取从搜索词的搜索结果中用户所选定的参考文本内容,根据参考文本内容中与搜索词相关的词语,生成搜索词的词向量,根据搜索词的词向量与多个参考关注点的词向量之间的相似度,从多个参考关注点中确定出用户关注点,向用户推荐与用户关注点匹配的文本内容。由此,能够自动识别用户关注点,实现快速、高效、精准的个性化资讯推荐,提高关注点识别的准确度,进而提高内容推荐的准确度。
为了进一步提高用户关注点的识别准确度,在本发明实施例一种可能的实现方式中,可以预先设置一相似度阈值,进而将如图1所示的实施例中,根据搜索词的词向量与多个参考关注点的词向量计算所得的相似度中最高的相似度同相似度阈值进行比较,并在最高的相似度不小于相似度阈值时,将最高的相似度对应的参考关注点作为用户关注点,否则,进一步基于语义相似确定用户关注点。从而,如图2所示,该基于关注点的文本内容推荐方法可以包括以下步骤:
S21,获取用户输入的搜索词,以及获取从搜素词的搜索结果中,用户所选定的参考文本内容。
S22,根据参考文本内容中与搜索词相关的词语,生成搜索词的词向量。
需要说明的是,本发明对步骤S21-S22的描述,可参照上述对步骤S11-S12的描述,其实现原理类似,此处不再赘述。
S23,计算搜索词的词向量与多个参考关注点的词向量之间的相似度。
作为一种可能的实现形式,在预测关注点之前,需要预先确定出作为候选的关注点,也就是本实施例中提及的参考关注点。具体来说,为了挖掘出多个参考关注点,可以对全部用户的搜索行为进行分析,将全部用户进行信息搜索时所输入的搜索词作为参考关注点,并获取全部用户从与参考关注点对应的搜索结果中所选中的搜索结果。进而从全部用户选中的搜索结果中提取出与相应的参考关注点语义相似的词语,根据所提取的词语,利用相关技术生成参考关注点的词向量。
进而,本实施例中,可以计算搜索词的词向量与多个参考关注点的词向量之间的相似度(比如,余弦相似度),并从所得结果中确定出最高相似度。
S24,判断计算出的相似度中最高相似度是否小于相似度阈值。
其中,相似度阈值为预先设置的,可以根据经验或期望的识别准确度自行设置,本发明不作具体限定。
本实施例中,计算出搜索词的词向量与参考关注点的词向量之间的相似度之后,即可确定计算结果中的最高相似度,进而将最高相似度同相似度阈值进行比较,判断最高相似度是否小于相似度阈值。若最高相似度不小于相似度阈值,则执行步骤S25;若最高相似度小于相似度阈值,则执行步骤S26。
S25,将最高相似度对应的参考关注点作为用户关注点。
本实施例中,当计算所得的相似度中的最高相似度不小于相似度阈值时,表明最高相似度对应的参考关注点的词向量与搜索词的词向量具有较高的吻合度,因而可以将最高相似度对应的参考关注点作为用户关注点。
S26,将多个参考关注点中,与搜索词之间的语义相似的参考关注点作为用户关注点;和/或,将涉及热门对象的参考关注点作为用户关注点。
本实施例中,当计算所得的相似度中的最高相似度小于相似度阈值时,可以计算搜索词与多个参考关注点之间的语义相似度,比如采用广义回归神经网络(GeneralRegression Neural Network,GRNN)计算语义相似度,将多个参考关注点中与搜索词之间的语义相似即计算的语义相似度最高的参考关注点作为用户关注点;和/或,将涉及热门对象的参考关注点作为用户关注点,其中,可以利用命名实体(比如人名、机构名、地名等以名称为标识的实体)的状况保证热门对象的识别,将参考关注点中涉及热门对象的关注点作为用户关注点。
S27,向用户推荐与用户关注点匹配的文本内容。
本实施例中,确定了用户关注点之后,即可根据用户关注点向用户推荐与用户关注点相匹配的文本内容。
比如,当用户输入的搜索词为“魔兽票房多少了”、“魔兽世界票房统计”、“魔兽票房数据”等时,通过本发明提供的方法可以确定用户关注点为“魔兽票房”,进而将有关魔兽票房的文本内容推荐给用户。
本实施例的基于关注点的文本内容推荐方法,通过设置相似度阈值,并将计算所得的最高相似度与相似度阈值进行比较,当最高相似度不小于相似度阈值时,将最高相似度对应的参考关注点作为用户关注点,当最高相似度小于相似度阈值时,进一步通过将多个参考关注点中,与搜索词之间的语义相似的参考关注点作为用户关注点;和/或,将涉及热门对象的参考关注点作为用户关注点,最终向用户推荐与用户关注点匹配的文本内容,能够进一步提高用户关注点识别的准确度,进而提高文本内容推荐的准确度。
为了更加清楚地说明向用户推荐与用户关注点匹配的文本内容的实现过程,本发明提出了另一种基于关注点的文本内容推荐方法,图3为本发明又一实施例提出的基于关注点的文本内容推荐方法的流程示意图。
如图3所示,在前述实施例的基础上,向用户推荐与用户关注点匹配的文本内容,具体可以包括以下步骤:
S31,针对每一个候选文本内容,识别文本关注点。
本实施例中,确定了用户关注点之后,即可根据用户关注点获取相关的文本内容,并作为候选文本内容,以从中识别出文本关注点。
具体地,如图4所示,针对每一个候选文本内容,识别文本关注点可以包括以下步骤:
S311,对多个参考关注点进行主成分分析,得到每一个参考关注点的主成分和非主成分。
其中,主成分的语义重要程度高于非主成分的语义重要程度。
本实施例中,可以采用相关分析方法对多个参考关注点即所有用户的搜索词进行主成分分析,获得每一个参考关注点的主成分和非主成分,以解决关注点较长时匹配难度大的问题。
S312,采用主成分对应的匹配规则,将候选文本内容与各参考关注点的主成分匹配,以及采用非主成分对应的匹配规则,将候选文本内容与各参考关注点的非主成分匹配,得到匹配中的候选关注点。
其中,主成分对应的匹配规则和非主成分对应的匹配规则是预先设置的,可以根据经验和/或实际需求进行设定,本发明对此不作具体限定。比如,可以将主成分对应的匹配规则设置为主成分在文本内容中至少出现五次,将非主成分对应的匹配规则设置为非主成分在文本内容中出现一次。本实施例中,通过针对参考关注点进行主成分划分,将主成分作为主要体现关注点的部分进行关注点匹配,在一定程度上避免了由于非主成分不匹配导致的关注点识别错误,提高了关注点识别的准确性。本实施例中,可以采用预设的主成分对应的匹配规则以及非主成分对应的匹配规则,将候选文本内容与各参考关注点的主成分和非主成分进行匹配,以获得匹配中的候选关注点。通过依据划分后得到的主成分和非主成分采用相应的匹配规则,一方面将主成分作为主要体现关注点的部分,进行较为严格的匹配;另一方面,将非主成分作为辅助体现关注点的部分,进行辅助匹配,从而进一步提高了匹配的准确性。
优选地,可以将各参考关注点中主成分和非主成分均与候选文本内容匹配的参考关注点作为候选关注点。
次优选地,在各参考关注点中不存在主成分和非主成分均与候选文本内容匹配的参考关注点的情况下,将各参考关注点中主成分与候选文本内容匹配的参考关注点作为候选关注点。
S313,计算各候选关注点与候选文本内容的显式语义相似度。
具体地,可以根据候选文本内容的词向量以及候选关注点的词向量计算各候选关注点与候选文本内容的显式语义相似度。
其中,计算候选文本内容的词向量时,可以先采用相关分词方法对候选文本内容进行分词,统计分词后所得的各个词条在对应的候选文本中出现的次数,获取出现次数较高的高频词,进而根据高频词生成候选文本内容的词向量。由于前述实施例中已生成参考关注点的词向量,而候选关注点是从参考关注点中选定的,因而可以直接获取候选关注点的词向量。
本实施例中,获得候选文本内容的词向量和候选关注点的词向量之后,即可根据候选文本内容的词向量以及候选关注点的词向量计算各候选关注点与候选文本内容的显式语义相似度。比如。可以通过计算候选文本内容的词向量与候选关注点的词向量之间的距离确定显式语义相似度,距离越小,显式语义相似度越高,距离越大,显式语义相似度越低。
S314,计算各候选关注点与候选文本内容的隐式语义相似度。
具体地,计算各候选关注点与候选文本内容的隐式语义相似度时,可以将候选文本内容输入预先训练的隐式语义预测模型中,得到候选文本内容与各候选关注点之间的相关性程度,即隐式语义相似度。
其中,隐式语义预测模型是采用已标注关注点的训练文本进行隐式语义训练得到的。在训练时,可以将训练文本对应的关注点以及显式语义下的预测结果作为正例,将随机的关注点以及未被选中的显式语义下的结果作为负例,利用深度神经网络(Deep NeuralNetworks,DNN)或机器学习模型SimNet进行模型训练,获得隐式语义预测模型。
S315,根据显式语义相似度和隐式语义相似度,计算得到各候选关注点的总相似度。
简单地,可以采用线性加权的方式,根据显式语义相似度和隐式语义相似度计算获得各候选关注点的总相似度。
S316,根据总相似度,从各候选关注点中,确定出候选文本内容的文本关注点。
本实施例中,计算获得各候选关注点的总相似度之后,即可根据总相似度从各候选关注点中确定出候选文本内容的文本关注点。比如,可以将总相似度最高的候选关注点作为文本关注点。
图5(a)为识别文本关注点的具体实现示意图。
如图5(a)所示,识别文本关注点的过程主要分为如下三层:
L0:召回,主要负责候选关注点的召回,包括:主成分分析和关联扩展。其中,
主成分分析,用于解决参考关注点较长时,由于紧密度低造成的匹配难度大的问题。通过主成分分析,分析出候选文本内容中不同片段相对于参考关注点的重要程度,并制定主成分对应的匹配规则,以及非主成分对应的匹配规则。
关联扩展,基于参考关注点之间的关联关系进行扩展,其中,关联关系主要指层级关系,比如“自动驾驶”属于“人工智能”。
L1:排序,该层主要计算显式语义相似度和隐式语义相似度。图5(b)为计算显示语义相似度和隐式语义相似度的具体实现示意图。
如图5(b)所示,在计算显式语义相似度时,可以基于参考关注点对应的点击日志进行共现统计,比如,可以采用词频-反文档频率(Term Frequency–Inverse DocumentFrequency,TF-IDF)进行共现统计,完成候选文本内容与候选关注点的特征表示,即词向量表示,进而计算显式语义相似度。从图5(b)中可以看出,当候选关注点为“魔兽票房”时,候选文本内容中出现的“魔兽”与“魔兽票房”的显式语义相似度为0.056,“魔兽电影”与“魔兽票房”的显式语义相似度为0.031,“魔兽世界”与“魔兽票房”的显式语义相似度为0.020,“魔兽世界电影”与“魔兽票房”的显式语义相似度为0.014,“票房”与“魔兽票房”的显式语义相似度为0.012等。
隐式语义相较于显式语义具有更好的泛化能力。如图5(b)所示,在计算隐式语义相似度之前,可以预先基于参考关注点的点击日志对DNN模型或SimNet模型进行训练,获得隐式语义预测模型,内部建立参考关注点与点击日志的关联关系。通过将候选文本内容输入至隐式语义预测模型中,可以获得相关性得分,即隐式语义相似度。
L2:融合,基于规则和线性加权的方式将显式语义相似度和隐式语义相似度进行融合,获得各候选关注点的总相似度。其中,规则的主要作用是排除明显错误的结果,线性加权的目的是保证候选关注点排序的合理性。
本实施例中,通过对多个参考关注点进行主成分分析,根据主成分对应的匹配规则和非主成分对应的匹配规则匹配得到候选关注点,计算各候选关注点与候选文本内容的显式语义相似度和隐式语义相似度,并计算总相似度,进而根据总相似度确定出候选文本内容的文本关注点,能够优化关注点的排序,提高文本关注点的识别准确度,使文本关注点更具有代表性。
S32,若多个候选文本内容中存在文本关注点与用户关注点匹配的目标文本内容,向用户推荐目标文本内容。
本实施例中,可以将确定的文本关注点与用户关注点进行匹配,若多个候选文本内容中存在文本关注点与用户关注点匹配,则将对应的候选文本内容作为目标文本内容推荐给用户。
本实施例的基于关注点的文本内容推荐方法,通过识别每一个候选文本内容的文本关注点,当多个候选文本内容中存在文本关注点与用户关注点匹配的目标文本内容时,向用户推荐目标文本内容,能够进一步提高内容推荐的准确度。
为了实现上述实施例,本发明还提出一种基于关注点的文本内容推荐装置。
图6为本发明一实施例提出的基于关注点的文本内容推荐装置的结构示意图。
如图6所示,该基于关注点的文本内容推荐装置60包括:获取模块610、生成模块620、确定模块630,以及推荐模块640。其中,
获取模块610,用于获取用户输入的搜索词,以及获取从搜索词的搜素结果中,用户所选定的参考文本内容。
生成模块620,用于根据参考文本内容中与搜索词相关的词语,生成搜索词的词向量。
确定模块630,用于根据搜索词的词向量与多个参考关注点的词向量之间的相似度,从多个参考关注点中确定出用户关注点。
推荐模块640,用于向用户推荐与用户关注点匹配的文本内容。
进一步地,在本发明实施例一种可能的实现方式中,如图7所示,该基于关注点的文本内容推荐装置60还包括:
处理模块650,用于将多个参考关注点中,与搜索词之间的语义相似的参考关注点作为用户关注点;和/或,将涉及热门对象的参考关注点作为用户关注点。
推荐模块640还包括:
识别单元641,用于针对每一个候选文本内容,识别文本关注点。
具体地,识别单元641用于对多个参考关注点进行主成分分析,得到每一个参考关注点的主成分和非主成分,其中,主成分的语义重要程度高于非主成分的语义重要程度;采用主成分对应的匹配规则,将候选文本内容与各参考关注点的主成分匹配,以及采用非主成分对应的匹配规则,将候选文本内容与各参考关注点的非主成分匹配,得到匹配中的候选关注点;计算各候选关注点与候选文本内容的显式语义相似度;计算各候选关注点与候选文本内容的隐式语义相似度;根据显式语义相似度和隐式语义相似度,计算得到各候选关注点的总相似度;根据总相似度,从各候选关注点中,确定出候选文本内容的文本关注点。
推荐单元642,用于多个候选文本内容中存在文本关注点与用户关注点匹配的目标文本内容时,向用户推荐目标文本内容。
需要说明的是,前述对基于关注点的文本内容推荐方法实施例的解释说明也适用于本实施例的基于关注点的文本内容推荐装置,其实现原理类似,此处不再赘述。
本实施例的基于关注点的文本内容推荐装置,通过获取用户输入的搜索词以及获取从搜索词的搜索结果中用户所选定的参考文本内容,根据参考文本内容中与搜索词相关的词语,生成搜索词的词向量,根据搜索词的词向量与多个参考关注点的词向量之间的相似度,从多个参考关注点中确定出用户关注点,向用户推荐与用户关注点匹配的文本内容。由此,能够自动识别用户关注点,实现快速、高效、精准的个性化资讯推荐,提高关注点识别的准确度,进而提高内容推荐的准确度。
为了实现上述实施例,本发明还提出一种计算机设备。
图8为本发明一实施例提出的计算机设备的结构示意图,该计算机设备可以包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,当处理器执行该计算机程序时,实现如前述实施例所述的基于关注点的文本内容推荐方法。
上述计算机设备可以为服务器,也可以为个人计算机(Personal Computer,PC)、平板电脑(Pad)或手机等智能终端设备,本实施例对上述计算机设备的具体形式不作限定。
图8示出了适于用来实现本发明实施方式的示例性计算机设备80的框图。图8显示的计算机设备80仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算机设备80以通用计算设备的形式表现。计算机设备80的组件可以包括但不限于:一个或者多个处理器或者处理单元806,系统存储器810,连接不同系统组件(包括系统存储器810和处理单元806)的总线808。
总线808表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线、微通道体系结构(Micro Channel Architecture,MAC)总线、增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnection,PCI)总线。
计算机设备80典型地包括多种计算机系统可读介质,这些介质可以是任何能够被计算机设备80访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器810可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)811和/或高速缓存存储器812。计算机设备80可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统813可以用于读写不可移动的、非易失性磁介质(图8未显示,通常称为“硬盘驱动器”)。尽管图8中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory,CD-ROM)、数字多功能只读光盘(Digital Video Disc Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线808相连。系统存储器810可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块8140的程序/实用工具814,可以存储在例如系统存储器810中,这样的程序模块8140包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块8140通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备80也可以与一个或多个外部设备90(例如键盘、指向设备、显示器70等)通信,还可与一个或者多个使得用户能与该计算机设备80交互的设备通信,和/或与使得该计算机设备80能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口802进行。并且,计算机设备80还可以通过网络适配器800与一个或者多个网络(例如局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图8所示,网络适配器800通过总线808与计算机设备80的其它模块通信。应当明白,尽管图8中未示出,可以结合计算机设备80使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、独立磁盘冗余阵列(Redundant Array of Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理单元806通过运行存储在系统存储器810中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例所述的基于关注点的文本内容推荐方法。
本实施例的计算机设备,通过获取用户输入的搜索词以及获取从搜索词的搜索结果中用户所选定的参考文本内容,根据参考文本内容中与搜索词相关的词语,生成搜索词的词向量,根据搜索词的词向量与多个参考关注点的词向量之间的相似度,从多个参考关注点中确定出用户关注点,向用户推荐与用户关注点匹配的文本内容。由此,能够自动识别用户关注点,实现快速、高效、精准的个性化资讯推荐,提高关注点识别的准确度,进而提高内容推荐的准确度。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述实施例所述的基于关注点的文本内容推荐方法。
为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行前述实施例所述的基于关注点的文本内容推荐方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (13)

1.一种基于关注点的文本内容推荐方法,其特征在于,包括以下步骤:
获取用户输入的搜索词,以及获取从所述搜素词的搜索结果中,所述用户所选定的参考文本内容;
根据所述参考文本内容中与所述搜索词相关的词语,生成所述搜索词的词向量;
根据所述搜索词的词向量与多个参考关注点的词向量之间的相似度,从所述多个参考关注点中确定出用户关注点;
向所述用户推荐与所述用户关注点匹配的文本内容。
2.根据权利要求1所述的基于关注点的文本内容推荐方法,其特征在于,所述向所述用户推荐与所述用户关注点匹配的文本内容,包括:
针对每一个候选文本内容,识别文本关注点;
若多个候选文本内容中存在文本关注点与所述用户关注点匹配的目标文本内容,向所述用户推荐所述目标文本内容。
3.根据权利要求2所述的基于关注点的文本内容推荐方法,其特征在于,所述针对每一个候选文本内容,识别文本关注点,包括:
对多个参考关注点进行主成分分析,得到每一个参考关注点的主成分和非主成分;所述主成分的语义重要程度高于所述非主成分的语义重要程度;
采用主成分对应的匹配规则,将所述候选文本内容与各参考关注点的主成分匹配,以及采用非主成分对应的匹配规则,将所述候选文本内容与各参考关注点的非主成分匹配,得到匹配中的候选关注点;
计算各候选关注点与所述候选文本内容的显式语义相似度;
计算各候选关注点与所述候选文本内容的隐式语义相似度;
根据所述显式语义相似度和所述隐式语义相似度,计算得到各候选关注点的总相似度;
根据所述总相似度,从各候选关注点中,确定出所述候选文本内容的文本关注点。
4.根据权利要求3所述的基于关注点的文本内容推荐方法,其特征在于,所述计算各候选关注点与所述候选文本内容的显式语义相似度,包括:
根据所述候选文本内容的词向量以及所述候选关注点的词向量,计算所述显式语义相似度。
5.根据权利要求3所述的基于关注点的文本内容推荐方法,其特征在于,所述计算各候选关注点与所述候选文本内容的隐式语义相似度,包括:
将所述候选文本内容输入预先训练的隐式语义预测模型中,得到所述候选文本内容与各候选关注点之间的相关性程度;其中,所述隐式语义预测模型是采用已标注关注点的训练文本进行隐式语义训练得到的。
6.根据权利要求1所述的基于关注点的文本内容推荐方法,其特征在于,所述根据所述搜索词的词向量与多个参考关注点的词向量之间的相似度,从所述多个参考关注点中确定出用户关注点之后,还包括:
将所述多个参考关注点中,与所述搜索词之间的语义相似的参考关注点作为所述用户关注点;
和/或,将涉及热门对象的参考关注点作为所述用户关注点。
7.一种基于关注点的文本内容推荐装置,其特征在于,包括:
获取模块,用于获取用户输入的搜索词,以及获取从所述搜索词的搜素结果中,所述用户所选定的参考文本内容;
生成模块,用于根据所述参考文本内容中与所述搜索词相关的词语,生成所述搜索词的词向量;
确定模块,用于根据所述搜索词的词向量与多个参考关注点的词向量之间的相似度,从所述多个参考关注点中确定出用户关注点;
推荐模块,用于向所述用户推荐与所述用户关注点匹配的文本内容。
8.根据权利要求7所述的基于关注点的文本内容推荐装置,其特征在于,所述推荐模块,包括:
识别单元,用于针对每一个候选文本内容,识别文本关注点;
推荐单元,用于多个候选文本内容中存在文本关注点与所述用户关注点匹配的目标文本内容时,向所述用户推荐所述目标文本内容。
9.根据权利要求8所述的基于关注点的文本内容推荐装置,其特征在于,所述识别单元,具体用于:
对多个参考关注点进行主成分分析,得到每一个参考关注点的主成分和非主成分;所述主成分的语义重要程度高于所述非主成分的语义重要程度;
采用主成分对应的匹配规则,将所述候选文本内容与各参考关注点的主成分匹配,以及采用非主成分对应的匹配规则,将所述候选文本内容与各参考关注点的非主成分匹配,得到匹配中的候选关注点;
计算各候选关注点与所述候选文本内容的显式语义相似度;
计算各候选关注点与所述候选文本内容的隐式语义相似度;
根据所述显式语义相似度和所述隐式语义相似度,计算得到各候选关注点的总相似度;
根据所述总相似度,从各候选关注点中,确定出所述候选文本内容的文本关注点。
10.根据权利要求7所述的基于关注点的文本内容推荐装置,其特征在于,所述装置,还包括:
处理模块,用于将所述多个参考关注点中,与所述搜索词之间的语义相似的参考关注点作为所述用户关注点;和/或,将涉及热门对象的参考关注点作为所述用户关注点。
11.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时,实现如权利要求1-6中任一项所述的基于关注点的文本内容推荐方法。
12.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一项所述的基于关注点的文本内容推荐方法。
13.一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如权利要求1-6中任一项所述的基于关注点的文本内容推荐方法。
CN201710475690.XA 2017-06-21 2017-06-21 基于关注点的文本内容推荐方法和装置 Active CN107330023B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710475690.XA CN107330023B (zh) 2017-06-21 2017-06-21 基于关注点的文本内容推荐方法和装置
US15/859,800 US10671656B2 (en) 2017-06-21 2018-01-02 Method for recommending text content based on concern, and computer device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710475690.XA CN107330023B (zh) 2017-06-21 2017-06-21 基于关注点的文本内容推荐方法和装置

Publications (2)

Publication Number Publication Date
CN107330023A true CN107330023A (zh) 2017-11-07
CN107330023B CN107330023B (zh) 2021-02-12

Family

ID=60195514

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710475690.XA Active CN107330023B (zh) 2017-06-21 2017-06-21 基于关注点的文本内容推荐方法和装置

Country Status (2)

Country Link
US (1) US10671656B2 (zh)
CN (1) CN107330023B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108280221A (zh) * 2018-02-08 2018-07-13 北京百度网讯科技有限公司 关注点的层次化构建方法、装置和计算机设备
CN108563482A (zh) * 2018-04-11 2018-09-21 百度在线网络技术(北京)有限公司 邀请框的处理方法及装置
CN109032375A (zh) * 2018-06-29 2018-12-18 北京百度网讯科技有限公司 候选文本排序方法、装置、设备及存储介质
CN109214417A (zh) * 2018-07-25 2019-01-15 百度在线网络技术(北京)有限公司 用户意图的挖掘方法及装置、计算机设备及可读介质
CN109376309A (zh) * 2018-12-28 2019-02-22 北京百度网讯科技有限公司 基于语义标签的文档推荐方法和装置
CN109461037A (zh) * 2018-12-17 2019-03-12 北京百度网讯科技有限公司 评论观点聚类方法、装置和终端
CN109840321A (zh) * 2017-11-29 2019-06-04 腾讯科技(深圳)有限公司 文本推荐方法、装置及电子设备
CN109948140A (zh) * 2017-12-20 2019-06-28 普天信息技术有限公司 一种词向量嵌入方法及装置
CN110704739A (zh) * 2019-09-30 2020-01-17 汉海信息技术(上海)有限公司 资源推荐方法、装置及计算机存储介质
CN110750715A (zh) * 2019-09-25 2020-02-04 平安科技(深圳)有限公司 内容推荐方法、装置、设备及可读存储介质
CN110909153A (zh) * 2019-10-22 2020-03-24 中国船舶重工集团公司第七0九研究所 一种基于语义关注度模型的知识图谱可视化方法
WO2020147145A1 (en) * 2019-01-19 2020-07-23 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for online to offline services
CN113297511A (zh) * 2021-05-24 2021-08-24 北京三快在线科技有限公司 商户排序模型的构建方法、装置、服务器及存储介质
CN113343091A (zh) * 2021-06-22 2021-09-03 力合科创集团有限公司 面向产业和企业的科技服务推荐计算方法、介质及程序
CN113377972A (zh) * 2020-03-09 2021-09-10 北京达佳互联信息技术有限公司 多媒体内容推荐方法、装置、计算设备和存储介质
CN114048383A (zh) * 2021-11-18 2022-02-15 百度在线网络技术(北京)有限公司 信息推荐方法及装置、电子设备和介质

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11461551B1 (en) * 2018-10-23 2022-10-04 Private AI Inc. Secure word search
CN111475409B (zh) * 2020-03-30 2023-06-30 深圳追一科技有限公司 系统测试方法、装置、电子设备以及存储介质
CN113779974A (zh) * 2020-06-11 2021-12-10 北京沃东天骏信息技术有限公司 一种目标文本生成方法和装置
CN111767461B (zh) * 2020-06-24 2024-02-06 北京奇艺世纪科技有限公司 数据处理方法及装置
CN112650857A (zh) * 2020-12-28 2021-04-13 上海卓繁信息技术股份有限公司 一种新型咨询方法、装置和电子设备
CN112660046B (zh) * 2020-12-30 2024-04-09 爱驰汽车有限公司 设备控制方法、装置、计算机设备、存储介质及车辆
CN112784046B (zh) * 2021-01-20 2024-05-28 北京百度网讯科技有限公司 文本聚簇的方法、装置、设备及存储介质
CN113239181B (zh) * 2021-05-14 2023-04-18 电子科技大学 基于深度学习的科技文献引文推荐方法
CN113743802A (zh) * 2021-09-08 2021-12-03 平安信托有限责任公司 工单智能匹配方法、装置、电子设备及可读存储介质
CN115545122B (zh) * 2022-11-28 2023-04-07 中国银联股份有限公司 对象匹配方法、装置、设备、系统、介质及程序产品

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1489089A (zh) * 2002-08-19 2004-04-14 松下电器产业株式会社 文件检索系统和问题回答系统
CN102930022A (zh) * 2012-10-31 2013-02-13 中国运载火箭技术研究院 面向用户的信息搜索引擎系统及方法
CN103473291A (zh) * 2013-09-02 2013-12-25 中国科学院软件研究所 一种基于隐语义概率模型的个性化服务推荐系统及方法
US20150134652A1 (en) * 2013-11-11 2015-05-14 Lg Cns Co., Ltd. Method of extracting an important keyword and server performing the same
CN105468657A (zh) * 2014-09-26 2016-04-06 北大方正集团有限公司 一种获取领域重要知识点的方法和系统
CN105631009A (zh) * 2015-12-25 2016-06-01 广州视源电子科技股份有限公司 基于词向量相似度的检索方法和系统
US20160246875A1 (en) * 2010-09-28 2016-08-25 International Business Machines Corporation Providing answers to questions using logical synthesis of candidate answers
CN105956161A (zh) * 2016-05-17 2016-09-21 北京奇虎科技有限公司 一种信息推荐方法和装置
CN106326386A (zh) * 2016-08-16 2017-01-11 百度在线网络技术(北京)有限公司 搜索结果的展示方法和装置
CN106528889A (zh) * 2016-12-21 2017-03-22 维沃移动通信有限公司 一种信息搜索方法及终端
CN106708887A (zh) * 2015-11-17 2017-05-24 镇江诺尼基智能技术有限公司 一种意图驱动的产品搜索系统和方法
CN106874492A (zh) * 2017-02-23 2017-06-20 北京京东尚科信息技术有限公司 搜索方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8037051B2 (en) * 2006-11-08 2011-10-11 Intertrust Technologies Corporation Matching and recommending relevant videos and media to individual search engine results
EP2176730A4 (en) * 2007-08-08 2011-04-20 Baynote Inc METHOD AND APPARATUS FOR CONTENT RECOMMENDATION BASED ON CONTEXT
US9880999B2 (en) * 2015-07-03 2018-01-30 The University Of North Carolina At Charlotte Natural language relatedness tool using mined semantic analysis
RU2657173C2 (ru) * 2016-07-28 2018-06-08 Общество с ограниченной ответственностью "Аби Продакшн" Сентиментный анализ на уровне аспектов с использованием методов машинного обучения

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1489089A (zh) * 2002-08-19 2004-04-14 松下电器产业株式会社 文件检索系统和问题回答系统
US20160246875A1 (en) * 2010-09-28 2016-08-25 International Business Machines Corporation Providing answers to questions using logical synthesis of candidate answers
CN102930022A (zh) * 2012-10-31 2013-02-13 中国运载火箭技术研究院 面向用户的信息搜索引擎系统及方法
CN103473291A (zh) * 2013-09-02 2013-12-25 中国科学院软件研究所 一种基于隐语义概率模型的个性化服务推荐系统及方法
US20150134652A1 (en) * 2013-11-11 2015-05-14 Lg Cns Co., Ltd. Method of extracting an important keyword and server performing the same
CN105468657A (zh) * 2014-09-26 2016-04-06 北大方正集团有限公司 一种获取领域重要知识点的方法和系统
CN106708887A (zh) * 2015-11-17 2017-05-24 镇江诺尼基智能技术有限公司 一种意图驱动的产品搜索系统和方法
CN105631009A (zh) * 2015-12-25 2016-06-01 广州视源电子科技股份有限公司 基于词向量相似度的检索方法和系统
CN105956161A (zh) * 2016-05-17 2016-09-21 北京奇虎科技有限公司 一种信息推荐方法和装置
CN106326386A (zh) * 2016-08-16 2017-01-11 百度在线网络技术(北京)有限公司 搜索结果的展示方法和装置
CN106528889A (zh) * 2016-12-21 2017-03-22 维沃移动通信有限公司 一种信息搜索方法及终端
CN106874492A (zh) * 2017-02-23 2017-06-20 北京京东尚科信息技术有限公司 搜索方法和装置

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109840321B (zh) * 2017-11-29 2022-02-01 腾讯科技(深圳)有限公司 文本推荐方法、装置及电子设备
US11182564B2 (en) 2017-11-29 2021-11-23 Tencent Technology (Shenzhen) Company Limited Text recommendation method and apparatus, and electronic device
CN109840321A (zh) * 2017-11-29 2019-06-04 腾讯科技(深圳)有限公司 文本推荐方法、装置及电子设备
CN109948140A (zh) * 2017-12-20 2019-06-28 普天信息技术有限公司 一种词向量嵌入方法及装置
CN109948140B (zh) * 2017-12-20 2023-06-23 普天信息技术有限公司 一种词向量嵌入方法及装置
CN108280221B (zh) * 2018-02-08 2022-04-15 北京百度网讯科技有限公司 关注点的层次化构建方法、装置和计算机设备
CN108280221A (zh) * 2018-02-08 2018-07-13 北京百度网讯科技有限公司 关注点的层次化构建方法、装置和计算机设备
CN108563482A (zh) * 2018-04-11 2018-09-21 百度在线网络技术(北京)有限公司 邀请框的处理方法及装置
CN108563482B (zh) * 2018-04-11 2021-10-29 百度在线网络技术(北京)有限公司 邀请框的处理方法及装置
CN109032375B (zh) * 2018-06-29 2022-07-19 北京百度网讯科技有限公司 候选文本排序方法、装置、设备及存储介质
CN109032375A (zh) * 2018-06-29 2018-12-18 北京百度网讯科技有限公司 候选文本排序方法、装置、设备及存储介质
CN109214417A (zh) * 2018-07-25 2019-01-15 百度在线网络技术(北京)有限公司 用户意图的挖掘方法及装置、计算机设备及可读介质
CN109461037A (zh) * 2018-12-17 2019-03-12 北京百度网讯科技有限公司 评论观点聚类方法、装置和终端
CN109376309A (zh) * 2018-12-28 2019-02-22 北京百度网讯科技有限公司 基于语义标签的文档推荐方法和装置
CN109376309B (zh) * 2018-12-28 2022-05-17 北京百度网讯科技有限公司 基于语义标签的文档推荐方法和装置
US11216504B2 (en) 2018-12-28 2022-01-04 Beijing Baidu Netcom Science And Technology Co., Ltd. Document recommendation method and device based on semantic tag
WO2020147145A1 (en) * 2019-01-19 2020-07-23 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for online to offline services
CN110750715A (zh) * 2019-09-25 2020-02-04 平安科技(深圳)有限公司 内容推荐方法、装置、设备及可读存储介质
CN110704739A (zh) * 2019-09-30 2020-01-17 汉海信息技术(上海)有限公司 资源推荐方法、装置及计算机存储介质
CN110909153A (zh) * 2019-10-22 2020-03-24 中国船舶重工集团公司第七0九研究所 一种基于语义关注度模型的知识图谱可视化方法
CN113377972A (zh) * 2020-03-09 2021-09-10 北京达佳互联信息技术有限公司 多媒体内容推荐方法、装置、计算设备和存储介质
CN113297511A (zh) * 2021-05-24 2021-08-24 北京三快在线科技有限公司 商户排序模型的构建方法、装置、服务器及存储介质
CN113343091A (zh) * 2021-06-22 2021-09-03 力合科创集团有限公司 面向产业和企业的科技服务推荐计算方法、介质及程序
CN114048383A (zh) * 2021-11-18 2022-02-15 百度在线网络技术(北京)有限公司 信息推荐方法及装置、电子设备和介质

Also Published As

Publication number Publication date
US10671656B2 (en) 2020-06-02
US20180373787A1 (en) 2018-12-27
CN107330023B (zh) 2021-02-12

Similar Documents

Publication Publication Date Title
CN107330023B (zh) 基于关注点的文本内容推荐方法和装置
CN108491433B (zh) 聊天应答方法、电子装置及存储介质
CN111858859B (zh) 自动问答处理方法、装置、计算机设备及存储介质
CN108829893B (zh) 确定视频标签的方法、装置、存储介质和终端设备
CN108319723B (zh) 一种图片分享方法和装置、终端、存储介质
AU2016225947B2 (en) System and method for multimedia document summarization
CN109034203B (zh) 表情推荐模型的训练、表情推荐方法、装置、设备及介质
US20200210468A1 (en) Document recommendation method and device based on semantic tag
CN110543592B (zh) 信息搜索方法、装置以及计算机设备
US10762150B2 (en) Searching method and searching apparatus based on neural network and search engine
US11436282B2 (en) Methods, devices and media for providing search suggestions
CN108491540B (zh) 文本信息推送方法、装置及智能终端
CN109241319B (zh) 一种图片检索方法、装置、服务器和存储介质
CN109508391B (zh) 基于知识图谱的输入预测方法、装置和电子设备
CN116917887A (zh) 使用基于注意力的排名系统的查询处理
CN111738009B (zh) 实体词标签生成方法、装置、计算机设备和可读存储介质
CN113672758B (zh) 歌单生成方法、装置、介质和计算设备
CN117056575B (zh) 一种基于智能图书推荐系统数据采集的方法
CN109508390B (zh) 基于知识图谱的输入预测方法、装置和电子设备
CN112883218A (zh) 一种图文联合表征的搜索方法、系统、服务器和存储介质
CN116187341A (zh) 语义识别方法及其装置
CN106570116B (zh) 基于人工智能的搜索结果的聚合方法及装置
CN116090450A (zh) 一种文本处理方法及计算设备
CN114068028A (zh) 医疗问诊数据处理方法及装置、可读存储介质及电子设备
CN113204705A (zh) 文章推荐方法、装置、电子设备和计算机介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant