CN109684474B - 用于提供写作话题的方法、装置、设备和存储介质 - Google Patents

用于提供写作话题的方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN109684474B
CN109684474B CN201811378207.7A CN201811378207A CN109684474B CN 109684474 B CN109684474 B CN 109684474B CN 201811378207 A CN201811378207 A CN 201811378207A CN 109684474 B CN109684474 B CN 109684474B
Authority
CN
China
Prior art keywords
search
topic
categories
current page
refinement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811378207.7A
Other languages
English (en)
Other versions
CN109684474A (zh
Inventor
薛成韵
郑烨翰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811378207.7A priority Critical patent/CN109684474B/zh
Publication of CN109684474A publication Critical patent/CN109684474A/zh
Application granted granted Critical
Publication of CN109684474B publication Critical patent/CN109684474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及用于提供写作话题的方法、装置、设备和存储介质。根据一个示例性实现方式,提供了一种用于提供写作话题的方法。在该方法中,获取指定写作话题所属于的类别的话题类别。基于话题类别和搜索引擎,搜索与话题类别相关联的一组结果页面。基于一组结果页面提取一组细化类别。基于一组细化类别,提供写作话题以用于提示作者从中选择话题类别的潜在写作话题。根据本公开内容的示例性实现方式,还提供了用于提供写作话题的装置、设备和计算机存储介质。

Description

用于提供写作话题的方法、装置、设备和存储介质
技术领域
本公开内容的实现方式概括地涉及内容提供,并且更具体地,涉及用于在媒体平台中向作者提供写作话题的方法、装置、设备和计算机存储介质。
背景技术
目前出现了越来越多的多媒体环境(例如,网站、或者应用等),作者可以从多媒体环境提供的话题库中选择话题类别,并且自行寻找写作话题。此时,作者需要大量搜索和漫长的思考过程才能确定话题。然而,各个作者以这种方式确定的话题经常出现重复,并且大量作者可能会针对相同或者相似的话题发表大量文章。这导致大量文章的话题重复并且内容千篇一律。另外,还可能会出现无人撰写用户关心的某些话题的情况。因而,期望能够提供一种以更为方便并且有效的方式来提供写作话题的技术方案。
发明内容
根据本公开内容的示例实现方式,提供了一种用于提供写作话题的方案。
在本公开内容的第一方面中,提供了一种提供写作话题的方法。在该方法中,获取指定写作话题所属于的类别的话题类别。基于话题类别和搜索引擎,搜索与话题类别相关联的一组结果页面。基于一组结果页面提取一组细化类别。基于一组细化类别,提供写作话题以用于提示作者从中选择话题类别的潜在写作话题。
在本公开内容的第二方面中,提供了一种用于提供写作话题的装置。该装置包括:该装置包括:获取模块,配置用于获取指定写作话题所属于的类别的话题类别;搜索模块,配置用于基于话题类别和搜索引擎,搜索与话题类别相关联的一组结果页面;提取模块,配置用于基于一组结果页面提取一组细化类别;以及提供模块,配置用于基于一组细化类别,提供写作话题以用于提示作者从中选择话题类别的潜在写作话题。
在本公开内容的第三方面中,提供了一种设备。该设备包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开内容的第一方面的方法。
在本公开内容的第四方面中,提供了一种其上存储有计算机程序的计算机可读介质,该程序在被处理器执行时实现根据本公开内容的第一方面的方法。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开内容的实现方式的关键或重要特征,亦非用于限制本公开内容的范围。本公开内容的其他特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开内容的各实现方式的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
图1示意性示出了其中可以采用根据本公开内容的示例性实现方式的技术方案的多媒体环境的图示;
图2示意性示出了根据本公开内容的示例性实现方式的技术方案的框图;
图3示意性示出了根据本公开内容的示例性实现方式的用于提供写作话题的方法的流程图;
图4示意性示出了根据本公开内容的示例性实现方式的基于搜索引擎来执行搜索的搜索结果的框图;
图5示意性示出了根据本公开内容的示例性实现方式的基于搜索引擎来获取细化类别的框图;
图6示意性示出了根据本公开内容的示例性实现方式的基于搜索引擎来执行的历史搜索的历史搜索结果的框图;
图7示意性示出了根据本公开内容的示例性实现方式的针对一组细化类别执行过滤的方法的流程图;
图8示意性示出了根据本公开内容的示例性实现方式的用于提供写作话题的装置的框图;以及
图9示出了能够实施本公开内容的多个实现方式的计算设备的框图。
具体实施方式
下面将参照附图更详细地描述本公开内容的实现方式。虽然附图中显示了本公开内容的某些实现方式,然而应当理解的是,本公开内容可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实现方式,相反提供这些实现方式是为了更加透彻和完整地理解本公开内容。应当理解的是,本公开内容的附图及实现方式仅用于示例性作用,并非用于限制本公开内容的保护范围。
在本公开内容的实现方式的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实现方式”或“该实现方式”应当理解为“至少一个实现方式”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
为了便于描述,首先参见图1描述本公开的实现方式的应用环境。具体地,图1示意性示出了其中可以采用根据本公开内容的示例性实现方式的技术方案的多媒体环境100的图示。如图1所示,在此的多媒体环境100例如可以是网站或者还可以是用于在诸如移动设备等电子设备上安装的应用。多媒体环境100可以通过用户界面110来向用户提供显示。例如,该用户界面110可以包括多个分类,例如,体育112、音乐114、……、以及财经116等。在下文中,将仅以音乐114为具体示例进行描述。
该音乐114分类可以进一步包括更多的细分类别:男歌手120、女歌手122、以及组合124。进一步,女歌手122可以包括多个女歌手,例如Alice 130、Barbra 132等。假设多媒体环境100的提供者希望进一步添加有关歌手Alice 130(以阴影示出)的更多信息,则可以向多个作者提供写作话题“Alice”,并且期望多个作者可以分别按照自己的构思来撰写有关Alice的文章。
此时,各个作者可以自行寻找写作角度。例如,作者可能需要大量搜索和漫长的思考过程才能确定话题的细节。然而,可能会存在如下情况:大量作者可能都会关注于Alice的成名曲、个人介绍、曾经发行了哪些专辑等概要信息,并且针对这些相同或者相似的话题发表大量文章。这导致大量文章的话题重复并且内容千篇一律。还可能会出现这样的情况,没有任何一个作者注意到Alice将要举办巡回演唱会,并且无人撰写有关Alice的演唱会的文章。因而,期望可以开发出以更为有效的方式来提供潜在的写作话题的技术方案。进一步,期望提供的潜在写作话题可以覆盖与话题类别相关联的多方面的内容。
为了至少部分地解决上述技术方案中的不足,根据本公开的示例性实现,提供了一种用于提供写作话题的技术方案。在下文中,将参见图2概括描述本公开的示例性实现。图2示意性示出了根据本公开内容的示例性实现方式的技术方案200的框图。如图2所示,可以首先获取指定写作话题所属于的类别的话题类别210。将会理解,在此的话题类别210例如可以是图1示例中的女歌手“Alice”或“Barbra”。该话题类别210可以表示,希望作者可以撰写有关女歌手“Alice”或“Barbra”的文章。根据本公开的示例性实现方式,对于如图1所示的分类“体育112”而言,话题类别210例如可以是“世界杯”、“欧洲杯”、“足球规则”等指定期望作者撰写有关文章的话题。
继而,可以将话题类别210作为关键字来在搜索引擎220中执行搜索操作,以便获取一组结果页面230。将会理解,在此的一组结果页面230可以包括在搜索结果中返回的URL(统一资源定位符)所指向的页面。根据本公开的示例性实现方式,可以指定一组结果页面230中包括的结果页面的上限。例如,假设搜索引擎220按照与话题类别210的相关度从高到低的顺序来排列各个结果页面,则可以仅从搜索结果中选择排名在前50(或者其他数值)的结果页面。在以“Alice”作为话题类别210的情况下,一组结果页面230可以包括与“Alice”相关联的多方面的搜索结果。例如,一个结果页面可以包括女歌手Alice的成名曲、一个结果页面可以包括Alice的概要介绍、一个结果页面可以包括Alice曾经发行的专辑,等等。
接着,可以从一组结果页面230中提取一组细化类别240。在此的细化类别240是指与话题类别210相关联的并且指定更多细节的话题。例如,基于上文的一组结果页面230中的内容确定的一组细化类别240可以包括:Alice的成名曲、Alice的概要介绍、Alice的专辑,等等。继而,可以基于一组细化类别240,提供写作话题250以用于提示作者从中选择话题类别的潜在写作话题。将会理解,在此可以基于多种方式来基于一组细化类别240提供写作话题250。例如,可以直接从一组细化类别240中随机选择写作话题250,可以按照一组结果页面230中的顺序来选择写作话题250,可以按照其他顺序选择写作话题250,或者还可以对一组细化类别240进行其他的处理来用于确定写作话题250。
根据本公开的示例性实现方式,提出了一种基于话题类别210来执行搜索,进而找到潜在的写作话题250的技术方案。基于上述技术方案,可以基于话题类别210来自动获得多个写作话题250以供作者参考,从而避免作者或者多媒体环境100的工作人员的大量人工思考和搜索劳动。
在下文中,将参见图3描述有关提供写作话题250的更多细节。图3示意性示出了根据本公开内容的示例性实现方式的用于提供写作话题250的方法300的流程图。在框310处,获取指定写作话题所属于的类别的话题类别210。在此的话题类别210是用于触发执行搜索的“种子话题”,并且可以基于多种方式来获取话题类别210。例如,可以由多媒体环境100的管理员来指定话题类别210,可以由多媒体环境100的读者来推荐话题类别210,或者还可以基于历史事件、热点新闻或者其他舆论焦点来获取话题类别210。
在框320处,可以基于话题类别210和搜索引擎220,获取与话题类别210相关联的一组结果页面230。根据本公开的示例性实现方式,可以采用多种方式来获取一组结果页面230。例如,可以直接在搜索引擎220中执行搜索操作,以便获取与话题类别210相关联的一组结果页面230。又例如,还可以基于搜索引擎220的搜索历史,来获取一组结果页面230。
在下文中,将首先参见图4描述如何基于直接搜索操作来获取一组结果页面230的更多细节。图4示意性示出了根据本公开内容的示例性实现方式的基于搜索引擎220来执行搜索的搜索结果的框图400。如图4所示,可以在页面410中显示搜索结果。此时,用于搜索的关键字“Alice”即为话题类别210,并且在页面410的下部示出了搜索结果。将会理解,尽管在图4中仅示意性示出了3个搜索结果,在其他的实现方式中,还可以包括更多或者更少的搜索结果。
如图4所示,页面410包括3个URL,其中URL 1指向文章《Alice北京演唱会2108…》所在的页面,URL 2指向文章《Alice演唱会2108…》所在的页面,并且URL 3指向文章《Alice北京工人体育馆…》所在的页面。此时,一组结果页面230可以包括分别由URL 1、URL 2、以及URL 3等指向的页面。
返回图3的框330处,可以基于一组结果页面230提取一组细化类别240。根据本公开的示例性实现方式,可以从一组结果页面230(例如,分别由URL 1、URL 2和URL 3所指向的页面)中的标题提取一组细化类别240。换言之,可以分别从标题《Alice北京演唱会2108…》、《Alice演唱会2108…》和《Alice北京工人体育馆…》中提取细化类别240。
根据本公开的示例性实现方式,由于在结果页面的标题中通常包括与搜索关键字密切相关的内容,因而可以从标题中提取细化类别,在此的细化类别是与话题类别210密切相关的直接相关话题。此时,细化类别可以包括标题中的关键字。继续上文的示例,所提取的一组细化类别240可以包括:Alice北京演唱会、Alice演唱会、Alice北京工人体育馆,等等。将会理解,在此并不限定细化类别中所包括关键字的格式,而是细化类别可以包括一个或多个关键字。例如,细化类别的一个示例可以包括“Alice北京演唱会”,此时仅包括一个关键字。又例如,细化类别的另一示例可以包括“Alice北京演唱会”,此时包括以空格分开的两个关键字。
根据本公开的示例性实现方式,可以从一组结果页面230中的正文提取一组细化类别240。例如,在URL 1所指向的页面的正文中可能会包括有关2018年歌手Alice在北京举办的演唱会的更多细节。例如,可以包括演唱会的具体日期、时间、地点等多方面的信息。因而,还可以从正文中提取上述信息作为细化类别。将会理解,由于一组结果页面230中的正文部分通常包括与话题类别210直接或者间接相关联的更多方面的信息。通过从正文中提取一组细化类别240,可以进一步丰富细化类别的内容。由此,可以基于大量的细化类别来确定更为丰富的写作话题250,以便为作者提供更多的选择空间。
将会理解,尽管在上文中描述分别从标题和正文中提取一组细化类别240的情况。根据本公开的示例性实现方式,还可以同时从标题和正文中提取一组细化类别240。
将会理解,尽管在上文中仅描述了基于话题类别210作为关键字在搜索引擎220中执行一次搜索操作以便获取一组细化类别240的实现方式。根据本公开的示例性实现方式,还可以执行多个轮次的搜索。根据本公开的示例性实现方式,可以按照上文描述的方法从标题提取的关键字作为直接相关话题,并且将该直接相关话题作为进一步的搜索关键字来执行下一轮次的搜索。利用上述示例性实现,可以找到更加丰富的结果页面。继而,可以将搜索找到的结果页面加入到一组结果页面230中。继而,可以基于更新的一组结果页面230中的各个页面,来获得一组细化类别240。
将会理解,尽管在上文中示意性示出了利用直接相关话题来执行一次进一步的搜索的实现方式。根据本公开的示例性实现方式,还可以从进一步的搜索结果来提取其他的直接相关话题,并且再次执行搜索。以此方式,可以执行多个轮次的搜索以便找到更多的相关写作话题。
利用上述示例性实现,通过将该直接相关的话题作为进一步的搜索关键字进行搜索,可以进一步找到与话题类别210密切相关联的其他话题。以此方式,可以以更为方便并且快速的方式扩展话题类别210,进而挖掘更多的潜在写作话题250来供作者参考。
将会理解,在本公开的上下文中并不限定以何种搜索引擎220来执行搜索操作。根据本公开的示例性实现方式,可以采用百度搜索引擎来执行搜索。备选地,还可以采用其他目前已知或者将在未来开发的搜索引擎220来执行搜索。将会理解,在执行多个轮次的搜索的情况下,可以采用相同或者不同的搜索引擎220来执行各个轮次的搜索。
图5示意性示出了根据本公开内容的示例性实现方式的基于搜索引擎220来获取一组细化类别240的框图500。如图5所示,可以利用话题类别210来作为关键字,在搜索引擎220中执行搜索以便获取一组结果页面230。在此的一组结果页面230可以包括涉及多方面内容的页面。例如,一组结果页面230可以包括有关Alice的实时新闻510、历史事件512、以及论坛内容514等的内容。通常而言,对于给定的话题类别210“Alice”而言,广大读者可能最关心与歌手Alice有关的实时新闻,并且还可能会关心与Alice相关联的各种历史事件(例如,曾经发行的专辑、单曲等),进一步还可能会关心论坛(例如,歌友会论坛)讨论的内容。
尽管图5仅示意性示出了上述三方面的内容,根据本公开的示例性实现方式,一组结果页面230还可以涉及更多方面的内容。进一步,在一组细化类别240中,还可以将来自页面的标题的关键字520或来自页面正文的关键字522作为进一步的搜索关键字来输入搜索引擎220,以便找到更多的结果页面。以此方式,通过执行多个轮次的搜索,可以获取更多的结果页面,进而为作者提供更多的潜在写作话题。
在上文中已经描述了如何将话题类别210作为关键字在搜索引擎220中执行搜索,以便获得一组细化类别240的技术方案。根据本公开的示例性实现方式,还可以基于与搜索引擎220相关联的搜索历史(例如,其他用户的搜索历史)来获取一组细化类别240。将会理解,搜索历史可以指示读者期望了解的内容。利用上述示例性实现,可以基于多媒体环境100的读者的关注点,来自动提供相应的写作话题250。以此方式,可以确保按照本公开的实现方式所提供的写作话题250可以真正回答读者期望了解的问题。
根据本公开的示例性实现方式,可以基于与搜索引擎220相关联的搜索历史,获取包括多个搜索用户基于话题类别210执行历史搜索的结果页面的一组历史页面。在此,可以将找到一组历史页面作为一组结果页面。将会理解,在此的搜索历史可以包括与过去曾经使用搜索引擎220执行搜索的多方面的信息,例如,可以包括搜索用户的信息、搜索关键字、搜索时间、返回的搜索结果、搜索用户浏览了哪些结果页面、以及用户浏览页面的时间长度,等等。
利用上述示例性实现,可以基于在过去的一段时间内各个搜索用户的搜索历史来获得写作话题250。将会理解,由于搜索历史可以准确地反应广大读者在近期的关注热点。基于广大读者的关注热点来向作者提供写作话题,使得作者有针对性地撰写广大读者真正感兴趣的文章。一方面可以解决作者千方百计寻找用户关注热点的问题,另一方面,还可以促使作者有针对性地回答广大读者真正关心的热点问题。
在下文中,将参见图6描述如何基于搜索历史来获得写作话题250的更多细节。图6示意性示出了根据本公开内容的示例性实现方式的基于搜索引擎220来执行的历史搜索的历史搜索结果的框图600。图6示意性示出了3个历史搜索结果610、620和630。在历史搜索结果610中,使用了关键字“Alice北京”;在历史搜索结果620中,使用了关键字“Alice演唱会”;在历史搜索结果630中,使用了关键字“Alice2018”。此时,一组结果页面230可以包括如图6所示的3个历史搜索结果610、620和630中的各个URL所指向的页面。将会理解,尽管图6仅示意性示出了3个历史搜索结果610、620和630。在搜索历史中可以包括数百万甚至更多的历史搜索结果。
返回图4,该图示出了基于搜索引擎220获取的与话题类别210相关联的搜索结果。换言之,该搜索结果是使用关键字Alice执行搜索的结果,其中URL 1指向文章《Alice北京演唱会2018…》。在此实现中,可以将URL 1指向的页面作为当前页面。通过比较图4和图6的搜索结果可知,尽管使用了不同的关键字,图4中的搜索结果以及图6中的3个历史搜索结果610、620和630都包括指向当前页面(即,文章《Alice北京演唱会2018…》所在的页面)。换言之,图4的搜索结果中的URL 1与历史搜索结果610、620和630中的第一个URL指向相同的文章。
根据本公开的示例性实现方式,可以基于搜索历史获取与一组结果页面230相关联的至少一个备选关键字,在此的至少一个备选关键字曾经被用于在历史搜索中获得了当前页面。在图4和图6所示的示例中,由于使用“Alice北京”、“Alice演唱会”以及“Alice2018”均获得了与使用话题类别210执行搜索的相同搜索结果(即,找到了文章《Alice北京演唱会2018…》),则可以将“Alice北京”、“Alice演唱会”以及“Alice2018”作为备选关键字。此时,可以基于备选关键字来确定一组细化类别240。
根据本公开的示例性实现方式,可以直接将备选关键字来作为细化类别。在如图4和6所示的示例中,一组细化类别240可以包括“Alice北京”、“Alice演唱会”以及“Alice2018”。相对于仅向作者提供“Alice”作为写作话题250而言,通过向作者提供“Alice北京”、“Alice演唱会”以及“Alice2018”,可以使得作者从多个方面构思文章。例如,作者可以撰写有关歌手Alice在北京的各项活动的文章、歌手Alice在世界各地的演唱会的文章、歌手Alice在2018年的各种新闻(例如新专辑、新单曲等)文章。
将会理解,尽管在上文中仅描述了将图4所示的搜索结果中的第一个URL所指向的页面作为当前页面的示例,在其他实现方式中,还可以针对图4的搜索结果中的每个URL所指向的页面执行上文描述的确定备选关键字的处理。根据本公开的示例性实现方式,还可以基于以下中的任一项,来首先将图4所示的搜索结果中的各个URL所指向的页面进行排序:页面的排序、页面的浏览量、页面的用户满意度,等等。
根据本公开的示例性实现方式,页面的排序是指特定页面在搜索结果中所处的位置。例如,假设搜索结果返回了20个搜索页面,并且特定页面处于第一位,则此时页面的排序为1。页面的浏览量是指特定页面在过去的预定时间段内被浏览的次数,次数越高则浏览量越高。假设URL 1所指向的页面曾经被浏览了一万次,则相应的浏览量可以表示为10000。页面的用户满意度是指执行搜索的搜索用户对于特定页面满意的程度。
将会理解,页面的排序、页面的浏览量、页面的用户满意度可以采用不同的单位来衡量。为了更方便地比较各个页面的多方面的属性,还可以将上述内容归一化到相同的度量。例如,可以分别将页面的排序、浏览量和用户满意度归一化到[0,1]的数值范围,以方便比较。例如,可以基于页面的位置在与页面总数的比值来确定排序(例如,可以将位于第一位的页面的排序设置为1,而将位于最后一位的页面的排序设置为0,并且可以基于比例关系来确定在其他位置处的页面的排序)。例如,可以基于页面的浏览次数与最高浏览次数的比值来确定浏览量。进一步,用户满意度可以采用多方面因素来衡量,例如,可以基于以下中的至少任一项来确定页面的用户满意度:页面是否被打开;页面被浏览的时间长度;在显示页面的搜索结果中,页面被打开的顺序;在浏览当前页面后,搜索用户是否打开了其他网页;以及在浏览当前页面后,搜索用户是否执行了其他搜索。在下文中,将进行详细描述。
根据本公开的示例性实现方式,可以基于页面是否被打开来确定用户满意度。通常而言,如果搜索用户对于页面内容感兴趣,则该搜索用户将会打开页面并详细阅读页面中的具体内容。如果搜索用户对于页面内容并不感兴趣,则该搜索用户即使看到了搜索结果中的标题,也不会打开页面。因而,可以基于搜索用户是否打开了页面来确定用户满意度。如果搜索用户打开了页面,则可以为该页面赋予较高的满意度;如果搜索用户并未打开页面,则可以为该页面赋予较低的满意度。
根据本公开的示例性实现方式,可以基于给定页面被浏览的时间长度来确定用户满意度。通常而言,如果搜索用户对于页面内容感兴趣,则该搜索用户将会花费较长的时间来阅读页面中的具体内容。如果搜索用户对于页面内容并不感兴趣,则该搜索用户可能在打开页面后会立刻关闭页面,或者在简单浏览页面内容之后即关闭页面。因而,可以基于搜索用户浏览页面的时间长度来确定用户满意度。如果搜索用户的浏览时间较长,则可以为该页面赋予较高的满意度;如果搜索用户的浏览时间较短,则可以为该页面赋予较低的满意度。
根据本公开的示例性实现方式,可以基于给定页面被打开的顺序来确定用户满意度。在搜索结果中通常可以包括多个页面。通常而言,搜索用户将会首先打开最能解决自己问题的页面。因而,搜索用户打开页面的顺序将在一定程度上反应用户对该页面满意的程度。假设在搜索结果中包括10个页面,并且以[0,1]的范围来表示用户满意度。此时,可以将用户首先打开的页面的满意度标记为1,并将第二个打开的页面的满意度标记为0.9,以此类推。
根据本公开的示例性实现方式,可以基于搜索用户在浏览给定页面后是否打开了其他网页来确定用户满意度。通常而言,如果用户在浏览了给定页面的内容之后没有打开其他的页面,则可以认为浏览的给定页面已经解答了搜索用户的问题,因而可以为该给定页面赋予较高的满意度。如果用户在浏览了给定页面的内容之后进一步打开了其他的页面,则可以认为浏览的给定页面没有解答搜索用户的问题,因而可以为该给定页面赋予较低的满意度。
根据本公开的示例性实现方式,可以基于搜索用户在浏览给定页面后是否执行了其他搜索操作来确定用户满意度。通常而言,如果用户在浏览了给定页面的内容之后没有执行其他搜索操作,则可以认为浏览的给定页面已经解答了搜索用户的问题,因而可以为该给定页面赋予较高的满意度。如果用户在浏览了给定页面的内容之后进一步执行了其他搜索操作,则可以认为浏览的给定页面没有解答搜索用户的问题,因而可以为该给定页面赋予较低的满意度。
将会理解,在上文中仅示意性示出了可以确定用户满意度的多个示例性实现方式。根据本公开的示例性实现方式,还可以采用其他方式来确定用户满意度。进一步,可以将用于确定用户满意度的多个方面进行归一化处理,以便于比较各个页面的用户满意度。
在上文中已经详细描述了如何确定备选关键字的具体过程。将会理解,由于图4所示的搜索结果中可能会包括大量结果页面,并且搜索历史中可以包括数百万甚至更多的搜索历史页面,因而采用上文描述的方法可能会获得数百上千甚至数万个备选关键字。此时,基于如此大量的备选关键字来生成细化类别,将会导致可能会产生过多的细化类别。进一步,可能会导致生成太多的写作话题250并造成作者选择困难。
根据本公开的示例性实现方式,可以将众多的备选关键字进行排序,并且基于排序来选择重要的备选关键字以用于确定一组细化类别240。根据本公开的示例性实现方式,可以按照利用至少一个备选关键字执行搜索的搜索用户对当前页面的满意度,将至少一个备选关键字进行排序。返回图6,可以基于上文描述的用于确定用户满意度的方法,来分别确定执行搜索的搜索用户对于历史搜索结果610、620和630中的第一个URL所指向的页面的用户满意度。假设针对3个URL的满意度分别为1、0.2、0.9,则按照用户满意度从高到低的顺序的排序为:历史搜索结果610中的第一个URL、630中的第一个URL和620中的第一个URL。
假设期望选择排名最高的2个页面相对应的备选关键字,则此时可以仅选择与历史搜索结果610和630相关联的备选关键字“Alice北京”和“Alice2018”。利用上述示例性实现,可以优先地从一组历史页面中选择重要的历史页面。以此方式,可以以更为方便并且快捷的方式,找到广大读者的潜在关注热点。进一步,可以基于潜在关注热点来指导作者撰写哪些方面的文章。一方面可以增强作者与读者的互动,另一方面,还可以丰富多媒体环境100的内容并促进多媒体环境100吸引更多读者。
在上文中以及示意性示出了如何确定一组细化类别的多种方式。将会理解,采用上文描述的各个操作或者各个操作的组合,可以获得大量的细化类别。例如,可能会获得数百上千甚至更多的细化类别。在下文中,将返回图3的框340来描述如何基于一组细化类别240来提供写作话题250。
返回图3中的框340处,可以基于一组细化类别240,提供写作话题250以用于提示作者从中选择话题类别的潜在写作话题。基于框340所示的操作,可以从包括大量数据的一组细化类别240中选择与话题类别210密切相关联的或者读者真正关心的写作话题。根据本公开的示例性实现方式,还可以进一步针对一组细化类别240执行过滤操作,进而基于过滤后的内容来确定期望的写作话题250。在下文中,将参见图7描述有关过滤操作的更多细节。
图7示意性示出了根据本公开内容的示例性实现方式的针对一组细化类别240执行过滤的方法700的流程图。将会理解,尽管在图7中以串行方式示意性示出了过滤操作中可能涉及的多个处理。这些处理可以按照不同于图7所示的顺序来执行。备选地,还可以仅执行方法700中的一个或者多个处理。
根据本公开的示例性实现方式,在框710处,可以基于一组细化类别240中的各个细化类别的搜索热度来执行过滤操作。将会理解,搜索热度可以在一定程度上反应广大读者对于关键字相关问题的关注程度,搜索热度(例如,可以以搜索次数表示)越高则表示关注该相关问题的读者越多。此时,可以从搜索历史中获取采用各个细化类别作为关键字来执行搜索的次数,并且可以优先选择与较高搜索次数相关联的细化类别。利用上述示例性实现,可以优先地选择广大读者更为关注的内容作为细化类别。
根据本公开的示例性实现方式,在框720处,可以基于一组细化类别240中的各个细化类别的搜索结果的浏览量来执行过滤操作。将会理解,浏览量可以在一定程度上反应广大读者对各个问题的关注程度,浏览量(可以以浏览次数表示)越高则表示关注的读者越多。此时,可以从搜索历史中获取采用各个细化类别作为关键字来执行搜索的搜索结果的浏览次数,并且可以优先选择与较高浏览次数相关联的细化类别。利用上述示例性实现,可以优先地选择广大读者更为关注的内容作为细化类别。
根据本公开的示例性实现方式,在框730处,可以基于一组细化类别240中的各个细化类别中的关键字的重复程度来执行过滤操作。将会理解,细化类别是来自于上文描述的多种方式来确定的,因而在各个细化类别之间可能会存在重复。例如,可能分别从不同文章的标题中都确定了细化类别“Alice2018”,并且在一组细化类别240中可能会包括多个重复。此时,可以从一组细化类别中删除重复的内容。
根据本公开的示例性实现方式,在框740处,可以基于一组细化类别中的各个细化类别中的关键字的相似程度来执行过滤操作。将会理解,在各个细化类别之间可能会存在相似内容。例如,可能分别从不同文章的标题中分别确定了细化类别“Alice2018”和“爱丽丝2018”。尽管两个细化类别的内容并不相同,然而Alice和爱丽丝都表示歌手Alice,这导致在一组细化类别240中可能会包括多个相似内容。此时,可以从一组细化类别中删除相似的内容。
根据本公开的示例性实现方式,还将在框710至740处所示的各种过滤处理进行组合,或者还可以重复执行某个或者某几个过滤处理。例如,可以首先执行如图7所示的过滤方法。在已经执行了去除重复内容和相似内容之后,还可以再次针对当前的一组细化类别240执行排序。进一步,可以选择排序最高的预订数量的细化类别作为写作话题250。
根据本公开的示例性实现方式,还可以将一组细化类别240中的关键字进行组合,以便获取包括更多细节的写作话题250。例如,一组细化类别240可以包括“Alice北京”、“Alice演唱会”以及“Alice2018”,等等。通过组合操作,可以提供例如“Alice 2018北京演唱会”作为写作话题250。利用上述示例性实现,可以向广大作者提供更多的潜在写作话题250。
在上文中已经详细描述了如何提供写作话题250的方法的多个实现方式。根据本公开的示例性实现方式,还提供了用于提供写作话题250的装置。在下文中,将参见图8详细描述。
图8示意性示出了根据本公开内容的示例性实现方式的用于提供写作话题的装置800的框图。该装置800包括:获取模块810,配置用于获取指定写作话题所属于的类别的话题类别;搜索模块820,配置用于基于话题类别和搜索引擎,搜索与话题类别相关联的一组结果页面;提取模块830,配置用于基于一组结果页面提取一组细化类别;以及提供模块840,配置用于基于一组细化类别,提供写作话题以用于提示作者从中选择话题类别的潜在写作话题。
根据本公开的示例性实现方式,提取模块830包括:标题处理模块,配置用于从一组结果页面中的标题提取一组细化类别;以及装置800进一步包括:关键字扩展模块,配置用于将一组细化类别中的给定细化类别作为直接相关话题;以及扩展搜索模块,配置用于基于直接相关话题和搜索引擎,以将搜索到的结果页面加入一组结果页面。
根据本公开的示例性实现方式,提取模块830包括:正文处理模块,配置用于从一组结果页面中的正文提取一组细化类别。
根据本公开的示例性实现方式,搜索模块820包括:历史搜索模块,配置用于基于与搜索引擎相关联的搜索历史,获取包括多个搜索用户执行历史搜索的结果页面的一组历史页面,以作为一组结果页面。
根据本公开的示例性实现方式,提取模块830进一步包括:当前页面获取模块,配置用于基于搜索引擎获取与话题类别相关联的当前页面;备选关键字获取模块,配置用于基于搜索历史获取与一组结果页面相关联的至少一个备选关键字,至少一个备选关键字被用于在历史搜索中获得了当前页面;以及细化类别确定模块,配置用于基于至少一个备选关键字确定一组细化类别。
根据本公开的示例性实现方式,当前页面获取模块进一步配置用于基于以下中的至少任一项来获取当前页面:当前页面的排序;当前页面的浏览量;以及当前页面的用户满意度。
根据本公开的示例性实现方式,当前页面获取模块进一步包括满意度确定模块,配置用于基于以下中的至少任一项来确定当前页面的用户满意度:当前页面是否被打开;当前页面被浏览的时间长度;在显示当前页面的搜索结果中,当前页面被打开的顺序;在浏览当前页面后,搜索用户是否打开了其他网页;以及在浏览当前页面后,搜索用户是否执行了其他搜索。
根据本公开的示例性实现方式,细化类别确定模块包括:排序模块,配置用于按照利用至少一个备选关键字执行搜索的搜索用户对当前页面的满意度,将至少一个备选关键字进行排序;以及细化类别获取模块,配置用于基于排序的至少一个备选关键字来确定一组细化类别。
根据本公开的示例性实现方式,提供模块840包括:过滤模块,配置用于过滤一组细化类别以形成一组过滤话题;以及话题提供模块,配置用于基于一组过滤话题来提供写作话题。
根据本公开的示例性实现方式,过滤模块进一步配置用于基于以下中的至少任一项来执行过滤:一组细化类别中的各个细化类别的搜索热度;一组细化类别中的各个细化类别的搜索结果的浏览量;一组细化类别中的各个细化类别中的关键字的重复程度;以及一组细化类别中的各个细化类别中的关键字的相似程度。
图9示出了能够实施本公开内容的多个实现方式的计算设备900的框图。设备900可以用于实现图3和图7描述的方法。如图所示,设备900包括中央处理单元CPU 901,其可以根据存储在只读存储器ROM 902中的计算机程序指令或者从存储单元908加载到随机访问存储器RAM 903中的计算机程序指令,来执行各种适当的动作和处理。在RAM 903中,还可存储设备900操作所需的各种程序和数据。CPU 901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出I/O接口905也连接至总线904。
设备900中的多个部件连接至I/O接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
CPU 901执行上文所描述的各个方法和处理,例如方法300和700。例如,在一些实现方式中,方法300和700可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实现方式中,计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由CPU 901执行时,可以执行上文描述的过程的一个或多个步骤。备选地,在其他实现方式中,CPU 901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法300和700。
根据本公开内容的示例性实现方式,提供了一种其上存储有计算机程序的计算机可读存储介质。程序被处理器执行时实现本公开所描述的方法。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)等等。
用于实施本公开内容的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开内容的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开内容的范围的限制。在单独的实现方式的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (22)

1.一种用于提供写作话题的方法,包括:
获取话题类别,所述写作话题所属于所述话题类别;
基于所述话题类别和搜索引擎,搜索与所述话题类别相关联的一组结果页面;
基于所述一组结果页面提取一组细化类别;以及
基于所述一组细化类别,提供所述写作话题以用于提示作者从中选择所述话题类别的潜在写作话题。
2.根据权利要求1所述的方法,其中基于所述一组结果页面提取一组细化类别包括:从所述一组结果页面中的标题提取所述一组细化类别;以及所述方法进一步包括:
将所述一组细化类别中的给定细化类别作为直接相关话题;以及
基于所述直接相关话题和所述搜索引擎,将搜索到的结果页面加入所述一组结果页面,所述结果页面是在所述搜索引擎中利用所述直接相关话题进行搜索而获得的。
3.根据权利要求1所述的方法,其中基于所述一组结果页面提取一组细化类别包括:
从所述一组结果页面中的正文提取所述一组细化类别。
4.根据权利要求1所述的方法,其中搜索与所述话题类别相关联的一组结果页面包括:
基于与所述搜索引擎相关联的搜索历史,获取包括多个搜索用户执行历史搜索的结果页面的一组历史页面,以作为所述一组结果页面。
5.根据权利要求4所述的方法,其中基于所述一组结果页面提取一组细化类别包括:
基于所述搜索引擎获取与所述话题类别相关联的当前页面;
基于所述搜索历史获取与所述一组结果页面相关联的至少一个备选关键字,所述至少一个备选关键字被用于在历史搜索中获得了所述当前页面;以及
基于所述至少一个备选关键字确定所述一组细化类别。
6.根据权利要求5所述的方法,其中获取与所述话题类别相关联的当前页面包括:基于以下中的至少任一项来获取所述当前页面,
所述当前页面的排序;
所述当前页面的浏览量;以及
所述当前页面的用户满意度。
7.根据权利要求6所述的方法,进一步包括:基于以下中的至少任一项来确定所述当前页面的用户满意度:
所述当前页面是否被打开;
所述当前页面被浏览的时间长度;
在显示所述当前页面的搜索结果中,所述当前页面被打开的顺序;
在浏览所述当前页面后,搜索用户是否打开了其他网页;以及
在浏览所述当前页面后,搜索用户是否执行了其他搜索。
8.根据权利要求5所述的方法,其中基于所述至少一个备选关键字确定所述一组细化类别包括:
按照利用所述至少一个备选关键字执行搜索的搜索用户对所述当前页面的满意度,将所述至少一个备选关键字进行排序;以及
基于排序的所述至少一个备选关键字来确定所述一组细化类别。
9.根据权利要求1所述的方法,其中基于所述一组细化类别提供所述写作话题包括:
过滤所述一组细化类别以形成一组过滤话题;以及
基于所述一组过滤话题来提供所述写作话题。
10.根据权利要求9所述的方法,其中过滤所述一组细化类别包括基于以下中的至少任一项来执行过滤:
所述一组细化类别中的各个细化类别的搜索热度;
所述一组细化类别中的各个细化类别的搜索结果的浏览量;
所述一组细化类别中的各个细化类别中的关键字的重复程度;以及
所述一组细化类别中的各个细化类别中的关键字的相似程度。
11.一种用于提供写作话题的装置,包括:
获取模块,配置用于获取话题类别,所述写作话题所属于所述话题类别;
搜索模块,配置用于基于所述话题类别和搜索引擎,搜索与所述话题类别相关联的一组结果页面;
提取模块,配置用于基于所述一组结果页面提取一组细化类别;以及
提供模块,配置用于基于所述一组细化类别,提供所述写作话题以用于提示作者从中选择所述话题类别的潜在写作话题。
12.根据权利要求11所述的装置,其中所述提取模块包括:标题处理模块,配置用于从所述一组结果页面中的标题提取所述一组细化类别;以及所述装置进一步包括:
关键字扩展模块,配置用于将所述一组细化类别中的给定细化类别作为直接相关话题;以及
扩展搜索模块,配置用于基于所述直接相关话题和所述搜索引擎,将搜索到的结果页面加入所述一组结果页面,所述结果页面是在所述搜索引擎中利用所述直接相关话题进行搜索而获得的。
13.根据权利要求11所述的装置,其中所述提取模块包括:
正文处理模块,配置用于从所述一组结果页面中的正文提取所述一组细化类别。
14.根据权利要求11所述的装置,其中所述搜索模块包括:
历史搜索模块,配置用于基于与所述搜索引擎相关联的搜索历史,获取包括多个搜索用户执行历史搜索的结果页面的一组历史页面,以作为所述一组结果页面。
15.根据权利要求14所述的装置,其中所述提取模块包括:
当前页面获取模块,配置用于基于所述搜索引擎获取与所述话题类别相关联的当前页面;
备选关键字获取模块,配置用于基于所述搜索历史获取与所述一组结果页面相关联的至少一个备选关键字,所述至少一个备选关键字被用于在历史搜索中获得了所述当前页面;以及
细化类别确定模块,配置用于基于所述至少一个备选关键字确定所述一组细化类别。
16.根据权利要求15所述的装置,其中所述当前页面获取模块进一步配置用于基于以下中的至少任一项来获取所述当前页面:
所述当前页面的排序;
所述当前页面的浏览量;以及
所述当前页面的用户满意度。
17.根据权利要求16所述的装置,其中所述当前页面获取模块进一步包括满意度确定模块,配置用于基于以下中的至少任一项来确定所述当前页面的用户满意度:
所述当前页面是否被打开;
所述当前页面被浏览的时间长度;
在显示所述当前页面的搜索结果中,所述当前页面被打开的顺序;
在浏览所述当前页面后,搜索用户是否打开了其他网页;以及
在浏览所述当前页面后,搜索用户是否执行了其他搜索。
18.根据权利要求15所述的装置,其中所述细化类别确定模块包括:
排序模块,配置用于按照利用所述至少一个备选关键字执行搜索的搜索用户对所述当前页面的满意度,将所述至少一个备选关键字进行排序;以及
细化类别获取模块,配置用于基于排序的所述至少一个备选关键字来确定所述一组细化类别。
19.根据权利要求11所述的装置,其中所述提供模块包括:
过滤模块,配置用于过滤所述一组细化类别以形成一组过滤话题;以及
话题提供模块,配置用于基于所述一组过滤话题来提供所述写作话题。
20.根据权利要求19所述的装置,其中所述过滤模块进一步配置用于基于以下中的至少任一项来执行过滤:
所述一组细化类别中的各个细化类别的搜索热度;
所述一组细化类别中的各个细化类别的搜索结果的浏览量;
所述一组细化类别中的各个细化类别中的关键字的重复程度;以及
所述一组细化类别中的各个细化类别中的关键字的相似程度。
21.一种电子设备,所述设备包括:
一个或多个处理器;以及
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现根据权利要求1-10中任一项所述的方法。
22.一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现根据权利要求1-10中任一项所述的方法。
CN201811378207.7A 2018-11-19 2018-11-19 用于提供写作话题的方法、装置、设备和存储介质 Active CN109684474B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811378207.7A CN109684474B (zh) 2018-11-19 2018-11-19 用于提供写作话题的方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811378207.7A CN109684474B (zh) 2018-11-19 2018-11-19 用于提供写作话题的方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN109684474A CN109684474A (zh) 2019-04-26
CN109684474B true CN109684474B (zh) 2021-01-01

Family

ID=66185392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811378207.7A Active CN109684474B (zh) 2018-11-19 2018-11-19 用于提供写作话题的方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN109684474B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870474A (zh) * 2012-12-11 2014-06-18 北京百度网讯科技有限公司 一种新闻话题组织方法及装置
CN106650943A (zh) * 2016-10-28 2017-05-10 北京百度网讯科技有限公司 基于人工智能的辅助写作方法和装置
CN107423337A (zh) * 2017-04-27 2017-12-01 天津大学 基于lda融合模型和多层聚类的新闻话题检测方法
CN108121736A (zh) * 2016-11-30 2018-06-05 北京搜狗科技发展有限公司 一种主题词确定模型的建立方法、装置及电子设备
CN108509517A (zh) * 2018-03-09 2018-09-07 东南大学 一种面向实时新闻内容的流式话题演化跟踪方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7502783B2 (en) * 2004-09-10 2009-03-10 Suggestica, Inc. User interface for conducting a search directed by a hierarchy-free set of topics
US10467254B2 (en) * 2015-03-10 2019-11-05 Microsoft Technology Licensing, Llc Methods of searching through indirect cluster connections

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870474A (zh) * 2012-12-11 2014-06-18 北京百度网讯科技有限公司 一种新闻话题组织方法及装置
CN106650943A (zh) * 2016-10-28 2017-05-10 北京百度网讯科技有限公司 基于人工智能的辅助写作方法和装置
CN108121736A (zh) * 2016-11-30 2018-06-05 北京搜狗科技发展有限公司 一种主题词确定模型的建立方法、装置及电子设备
CN107423337A (zh) * 2017-04-27 2017-12-01 天津大学 基于lda融合模型和多层聚类的新闻话题检测方法
CN108509517A (zh) * 2018-03-09 2018-09-07 东南大学 一种面向实时新闻内容的流式话题演化跟踪方法

Also Published As

Publication number Publication date
CN109684474A (zh) 2019-04-26

Similar Documents

Publication Publication Date Title
US12001490B2 (en) Systems for and methods of finding relevant documents by analyzing tags
US8661031B2 (en) Method and apparatus for determining the significance and relevance of a web page, or a portion thereof
US20180004850A1 (en) Method for inputting and processing feature word of file content
CN104111941B (zh) 信息展示的方法及设备
CN109918555B (zh) 用于提供搜索建议的方法、装置、设备和介质
Zangerle et al. Using tag recommendations to homogenize folksonomies in microblogging environments
CN102622417A (zh) 对信息记录进行排序的方法和装置
CN103186550A (zh) 一种视频的相关视频列表的生成方法及系统
CN111061954A (zh) 搜索结果排序方法、装置及存储介质
US20140081982A1 (en) Method and Computer for Indexing and Searching Structures
CN103577534A (zh) 搜索方法和搜索引擎
KR101088710B1 (ko) 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법, 장치 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체
CN112749328A (zh) 搜索方法、装置和计算机设备
Foley et al. A web-based infrastructure for the assisted annotation of heritage collections
CN101763424B (zh) 根据文件内容确定特征词并用于检索的方法
CN105630950A (zh) 一种引导式搜索方法和系统
CN103425767B (zh) 一种提示数据的确定方法和系统
Lazarinis Exploring the effectiveness of information searching tools on Greek museum websites
Luo et al. Query ambiguity identification based on user behavior information
CN106372123B (zh) 一种基于标签的相关内容推荐方法和系统
CN113127736A (zh) 一种基于搜索历史记录的分类推荐方法及装置
JP2009015589A (ja) 関連文書提示システム及びプログラム
Zeleník et al. News recommending based on text similarity and user behaviour
CN108509571B (zh) 一种网页信息数据挖掘通用方法
JP2009205588A (ja) ページ検索システム及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant