CN104102739B - 一种扩充实体库的方法及装置 - Google Patents

一种扩充实体库的方法及装置 Download PDF

Info

Publication number
CN104102739B
CN104102739B CN201410364038.7A CN201410364038A CN104102739B CN 104102739 B CN104102739 B CN 104102739B CN 201410364038 A CN201410364038 A CN 201410364038A CN 104102739 B CN104102739 B CN 104102739B
Authority
CN
China
Prior art keywords
entity
word
user
content
storehouse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410364038.7A
Other languages
English (en)
Other versions
CN104102739A (zh
Inventor
梁爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410364038.7A priority Critical patent/CN104102739B/zh
Publication of CN104102739A publication Critical patent/CN104102739A/zh
Application granted granted Critical
Publication of CN104102739B publication Critical patent/CN104102739B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种扩充实体库的方法及装置,该方法包括:从用户的操作行为日志中获取用户的操作对象内容;从所述操作对象内容中识别实体词;对所述实体词按照预设规则进行筛选;如果筛选出的实体词未出现在实体库中,则将所述实体词添加到所述实体库中,以扩充所述实体库。本发明实施例的技术方案能提高扩充实体库中实体词的准确性。

Description

一种扩充实体库的方法及装置
技术领域
本发明涉及互联网信息处理技术领域,具体涉及一种扩充实体库的方法及装置。
背景技术
随着信息和网络技术的不断发展,人们越来越多地通过互联网进行各种知识和信息的搜索。内容提供商在互联网提供内容使所有用户均能平等地浏览、创造、完善内容平台。
例如百度百科、维基百科、互动百科等,能够让互联网用户通过百科网站即能找到自己想要的全面、准确、客观的定义性信息,可供其他用户进行类似主题的查询和浏览,以便提供相应的知识或者借鉴。例如,词条是百科网站所含内容的基础分割单位,一个词条具有一个或多个单一的主题,用于阐述一件事物、一个人物、或者具备特定主题的组合等知识内容。在百科网站中包括极大数量的词条,这些百科词条可以大大地提高检索的准确性和检索的覆盖率,并且有利于从网页中提取结构化数据,可以进行垂直搜索,得到更为精确的信息。
随着信息的广泛传播以及人们交流内容的不断扩展,新词条层出不穷。极大地发现有价值的词条,扩充百科网站的实体库是百科产品的重要目标。常见的实现方案都是从已有的数据中,利用文本切分来分析文本中可能存在的实体词,判断哪些实体词是百科实体库中存在的,哪些是百科实体库中不存在的,将不存在的实体词增加到百科实体库中。但是这种方案存在文本切分和属性识别不准确的问题。
发明内容
有鉴于此,本发明实施例提供一种扩充实体库的方法及装置,以克服现有的百科实体库扩充存在文本切分和属性识别不准确的问题。
第一方面,本发明实施例提供了一种扩充实体库的方法,包括:
从用户的操作行为日志中获取用户的操作对象内容;
从所述操作对象内容中识别实体词;
对所述实体词按照预设规则进行筛选;
如果筛选出的实体词未出现在实体库中,则将所述实体词添加到所述实体库中,以扩充所述实体库。
第二方面,本发明实施例还提供了一种扩充实体库的装置,包括:
操作对象内容获取单元,用于从用户的操作行为日志中获取用户的操作对象内容;
实体词识别单元,用于从所述操作对象内容中识别实体词;
实体词筛选单元,用于对所述实体词按照预设规则进行筛选;
实体词添加单元,用于如果筛选出的实体词未出现在实体库中,则将所述实体词添加到所述实体库中,以扩充所述实体库。
本发明实施例的技术方案通过从用户的操作行为日志中获取用户的操作对象内容,从操作对象内容中识别实体词,进行筛选后,将未出现在实体库中的实体词添加到实体库中,以扩充所述实体库。由于用户行为能反馈用户的需求,从用户行为挖掘实体词更有针对性,而且用户行为通常与实体词有关联,因此扩充实体词的准确性更高。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本发明实施例的内容和这些附图获得其他的附图。
图1是本发明实施例一所述的扩充实体库的方法流程图;
图2是本发明实施例二所述的扩充实体库的方法流程图;
图3是本发明实施例二所述的示例网页内容中用户的操作对象内容示意图;
图4是本发明实施例三所述的扩充实体库的装置的结构框图。
具体实施方式
为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本发明实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
实施例一
图1是本发明实施例一提供的扩充实体库的方法流程图,本实施例可适用于基于操作行为日志中用户的操作对象内容进行实体库扩充的情况,本实施例所称的实体词泛指名词与代词,也可进一步指满足预设条件的名词与代词。实体库则是用于存储各实体词的相关信息的数据库,能过为用户提供对实体词相关数据的获取。例如,在百科中实体词指词条的主题名称,词条是百科网站所含内容的基础分割单位,词条包括实体词、对该实体词的解释、以及与该实体词的相关信息。此外,其他类别的实体库,如音乐实体库、商品实体库等,也可以用音乐名称、商品名称等作为实体词,在实体库中存储各实体词的相关细节数据,如音乐背景介绍、商品产地等。
本实施例的方法可以由配置在服务器中的扩充实体库的装置来执行,如图1所示,本实施例所述的扩充实体库的方法包括:
S101、从用户的操作行为日志中获取用户的操作对象内容。
用户的操作行为日志是记录用户操作流的文件,包括用户点击、输入、选中、复制等操作及操作时间等信息。例如包括对用户在搜索引擎中进行搜索时输入的检索式的记录、对用户对网页内容进行加内链操作的记录、对用户选取网页内容中的文字、以及包括对用户进一步地对选取的文字进行复制、粘贴等操作的记录等。
通过对用户的操作行为日志进行分析,从中获取用户的操作对象内容。例如,从用户的操作行为日志中获取用户在搜索引擎中进行搜索时输入的检索式,获取用户在网页内容中加内链的行为时加内链不成功的文字内容,以及获取用户在网页内容中执行文字内容操作(例如选中、复制、粘贴等操作)时所操作的文字内容。内链,即在实体库内部,如果存在某个实体词的相关数据,则此实体词出现在其他实体词的相关数据中时,会为此实体词建立内部链接,以便用户方便地找到该实体词自己的相关数据。用户也可以自己为网页内容中的实体词加入内部链接。
需要说明的是,由于用户的操作行为中某些与需要扩充的实体词关联度较低,而某些操作行为获取实体词的概率更高,为了提高扩充实体库的效率,可预先指定用户的操作行为的类型,从用户的操作行为日志中仅筛选出该预先指定的操作行为,来获取用户的操作对象内容。
由于本实施例的目的是扩充实体库,所述用户的操作行为日志优选是用户对该实体库的操作行为日志,例如,若用于扩充百科实体库,则可以优选用户对百科实体库的搜索引擎的操作行为日志、用户对百科实体库的百科词条的网页内容的操作行为日志等。
S102、从所述操作对象内容中识别实体词。
对获取的操作对象内容进行识别获取实体词。由于用户的操作对象内容比较有针对性,大多操作对象内容可以直接作为实体词,若某些操作对象内容不能直接识别出实体词,可对该操作对象内容行切分后再执行实体词识别操作即可。
S103、对所述实体词按照预设规则进行筛选。
所述预设规则可根据实体库的扩充目标来设置,例如,将所述实体词中字数大于预设阈值的实体词过滤掉、将属于黑名单的实体词过滤掉、和/或将属于预设类型的实体词过滤掉(例如包含序号、时间、特殊符号)。
S104、如果筛选出的实体词未出现在实体库中,则将所述实体词添加到所述实体库中,以扩充所述实体库。
为了避免重复设置实体词,操作S103获取实体词后,还需判断实体词是否已经出现在实体库的实体词中,将未出现在实体库的实体词添加到实体库中。
本实施例的技术方案通过从用户的操作行为日志中获取用户的操作对象内容,从操作对象内容中识别实体词,进行筛选后,将未出现在实体库的实体词添加到实体库中,以扩充所述实体库。由于用户行为能反馈用户的需求,从用户行为挖掘实体词更有针对性,而且用户行为通常与实体词有关联,因此扩充实体词的准确性更高。
实施例二
图2是本发明实施例二所述的扩充实体库的方法流程图,本实施例以通过用户对百科实体库的操作行为日志扩充百科实体库为例公开一种扩充实体库的方法,如图2所示,本实施例所述的扩充实体库的方法包括:
S201、获取用户对百科实体库的操作行为日志。
用户行为能反馈用户的需求,从用户行为挖掘实体词更有针对性,由于本实施例的目的是扩充百科实体库,因此,所述用户的操作行为日志优选是用户对百科实体库的操作行为日志,包括用户对百科实体库的搜索引擎的操作行为日志、用户对百科实体库的百科词条的网页内容的操作行为日志等。
S202、获取预指定的操作行为的操作对象内容。
用户的操作行为中某些与需要扩充的实体词关联度较低,而某些操作行为获取实体词的概率更高,为了提高扩充百科实体库的效率,本实施例优选为预先指定至少一种用户的操作行为的类型,从用户的操作行为日志中仅筛选出该预先指定的操作行为,来获取用户的操作对象内容。
例如预先指定用户的操作行为的类型可为用户在搜索引擎中进行搜索时输入的检索式,用户在网页内容中加内链,以及用户在网页内容中执行文字选中、复制或粘贴内容操作。则从用户的操作行为日志中获取用户在搜索引擎中进行搜索时输入的检索式,将所述检索式作为所述操作对象内容;从用户的操作行为日志中获取用户在网页内容中加内链的行为,将加内链不成功的文字内容作为所述操作对象内容;以及从用户的操作行为日志中获取用户在网页内容中执行文字内容操作,将所操作的文字内容作为所述操作对象内容。作为优选,所述文字内容操作包括下述至少一项:执行文字内容选取、执行文字内容复制、和执行文字内容粘贴。
例如图3是百科实体库的百科词条“王文元”的词条内容片段,用户先后对该词条内容片段中的“郾城县立中学”、“汉口市立第一中学”、以及“黄陂县乾顺油厂”的文字内容进行了加内链操作,结果因加内链失败,则将这些加内链不成功的文字内容“郾城县立中学”、“汉口市立第一中学”、以及“黄陂县乾顺油厂”作为操作对象内容。
S203、从所述操作对象内容中识别实体词。
若某些操作对象内容不能直接识别出实体词,可对该操作对象内容行切分后再执行实体词识别操作即可。
S204、对所述实体词按照预设规则进行筛选。
例如,将符合下述至少一项的实体词过滤掉:所述实体词中字数大于预设阈值的实体词、属于黑名单的实体词、包含预设符号的实体词、和属于预设类型的实体词。
S205、对所述实体词进行去重处理。
需要说明的是,本操作可在筛选之后进行,也可在筛选之前进行。通过对所识别的实体词进行去重处理,能进一步减小操作206中的实体词的数目,同时能避免重复添加。
S206、如果所述实体词未出现在百科的实体词中,将所述实体词添加到百科实体库中。
从用户针对百科实体库的操作行为日志中获取用户的操作对象内容。
本实施例以通过用户对百科实体库的操作行为日志扩充百科实体库为例的技术方案在实施例一的基础之上,优选为获取用户对百科实体库的操作行为日志,并优选为获取预指定的操作行为的操作对象内容,以及增加了对实体词进行去重处理的操作,能进一步提高扩充实体库的效率。
实施例三
图4是本发明实施例三所述的扩充实体库的装置的结构框图,如图4所示,本实施例所述的扩充实体库的装置包括:
操作对象内容获取单元401,用于从用户的操作行为日志中获取用户的操作对象内容;
实体词识别单元402,用于从所述操作对象内容中识别实体词;
实体词筛选单元403,用于对所述实体词按照预设规则进行筛选;
实体词添加单元404,用于如果筛选出的实体词未出现在实体库中,则将所述实体词添加到所述实体库中,以扩充所述实体库。
进一步地,所述操作对象内容获取单元401具体用于:从用户针对百科实体库的操作行为日志中获取用户的操作对象内容。
进一步地,所述操作对象内容获取单元401包括检索式获取子单元、内链行为获取子单元、和/或文字内容操作获取子单元:
所述检索式获取子单元,用于从用户的操作行为日志中获取用户在搜索引擎中进行搜索时输入的检索式,将所述检索式作为所述操作对象内容;
所述内链行为获取子单元,用于从用户的操作行为日志中获取用户在网页内容中加内链的行为,将加内链不成功的文字内容作为所述操作对象内容;
所述文字内容操作获取子单元,用于从用户的操作行为日志中获取用户在网页内容中执行文字内容操作,将所操作的文字内容作为所述操作对象内容
进一步地,所述文字内容操作获取子单元中所述的文字内容操作包括下述至少一项:执行文字内容选取、执行文字内容复制、和执行文字内容粘贴。
进一步地,所述搜索引擎为百科实体库的搜索引擎。
进一步地,所述网页内容为百科实体库的百科词条内容。
进一步地,所述实体词筛选单元403具体用于将符合下述至少一项的实体词过滤掉:所述实体词中字数大于预设阈值的实体词、属于黑名单的实体词、包含预设符号的实体词、和属于预设类型的实体词。
进一步地403,所述实体词筛选单元还用于:在将所述实体词添加到所述实体库中的操作之前,对所述实体词进行去重处理。
本实施例提供的扩充实体库的装置可执行本发明实施例一和实施例二所提供的扩充实体库的方法,具备执行方法相应的功能模块和有益效果。
以上实施例提供的技术方案中的全部或部分内容可以通过软件编程实现,其软件程序存储在可读取的存储介质中,存储介质例如:计算机中的硬盘、光盘或软盘。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (12)

1.一种扩充实体库的方法,其特征在于,包括:
从用户的操作行为日志中获取用户在搜索引擎中进行搜索时输入的检索式,将所述检索式作为操作对象内容;和/或,
从用户的操作行为日志中获取用户在网页内容中加内链的行为,将加内链不成功的文字内容作为操作对象内容;和/或,
从用户的操作行为日志中获取用户在网页内容中执行文字内容操作,将所操作的文字内容作为操作对象内容;
从所述操作对象内容中识别实体词;
对所述实体词按照预设规则进行筛选;
如果筛选出的实体词未出现在实体库中,则将所述实体词添加到所述实体库中,以扩充所述实体库。
2.根据权利要求1所述的方法,其特征在于,从用户的操作行为日志中获取用户的操作对象内容的操作具体包括:从用户针对百科实体库的操作行为日志中获取用户的操作对象内容。
3.根据权利要求1所述的方法,其特征在于,所述文字内容操作包括下述至少一项:执行文字内容选取、执行文字内容复制、和执行文字内容粘贴。
4.根据权利要求1或3所述的方法,其特征在于:
所述搜索引擎为百科实体库的搜索引擎;和/或,
所述网页内容为百科实体库的百科词条内容。
5.根据权利要求1所述的方法,其特征在于,对所述实体词按照预设规则进行筛选的操作具体包括:
将符合下述至少一项的实体词过滤掉:所述实体词中字数大于预设阈值的实体词、属于黑名单的实体词、包含预设符号的实体词、和属于预设类型的实体词。
6.根据权利要求1所述的方法,其特征在于,在将所述实体词添加到所述实体库中的操作之前,还包括:对所述实体词进行去重处理。
7.一种扩充实体库的装置,其特征在于,包括:
操作对象内容获取单元,用于从用户的操作行为日志中获取用户的操作对象内容;
实体词识别单元,用于从所述操作对象内容中识别实体词;
实体词筛选单元,用于对所述实体词按照预设规则进行筛选;
实体词添加单元,用于如果筛选出的实体词未出现在实体库中,则将所述实体词添加到所述实体库中,以扩充所述实体库;
所述操作对象内容获取单元包括检索式获取子单元、内链行为获取子单元、和/或文字内容操作获取子单元:
所述检索式获取子单元,用于从用户的操作行为日志中获取用户在搜索引擎中进行搜索时输入的检索式,将所述检索式作为操作对象内容;
所述内链行为获取子单元,用于从用户的操作行为日志中获取用户在网页内容中加内链的行为,将加内链不成功的文字内容作为操作对象内容;
所述文字内容操作获取子单元,用于从用户的操作行为日志中获取用户在网页内容中执行文字内容操作,将所操作的文字内容作为操作对象内容。
8.根据权利要求7所述的装置,其特征在于,所述操作对象内容获取单元具体用于:从用户针对百科实体库的操作行为日志中获取用户的操作对象内容。
9.根据权利要求7所述的装置,其特征在于,所述文字内容操作获取子单元中所述的文字内容操作包括下述至少一项:执行文字内容选取、执行文字内容复制、和执行文字内容粘贴。
10.根据权利要求7或9所述的装置,其特征在于:
所述搜索引擎为百科实体库的搜索引擎;和/或,
所述网页内容为百科实体库的百科词条内容。
11.根据权利要求7所述的装置,其特征在于,所述实体词筛选单元具体用于:
将符合下述至少一项的实体词过滤掉:所述实体词中字数大于预设阈值的实体词、属于黑名单的实体词、包含预设符号的实体词、和属于预设类型的实体词。
12.根据权利要求7所述的装置,其特征在于,所述实体词筛选单元还用于:在将所述实体词添加到所述实体库中的操作之前,对所述实体词进行去重处理。
CN201410364038.7A 2014-07-28 2014-07-28 一种扩充实体库的方法及装置 Active CN104102739B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410364038.7A CN104102739B (zh) 2014-07-28 2014-07-28 一种扩充实体库的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410364038.7A CN104102739B (zh) 2014-07-28 2014-07-28 一种扩充实体库的方法及装置

Publications (2)

Publication Number Publication Date
CN104102739A CN104102739A (zh) 2014-10-15
CN104102739B true CN104102739B (zh) 2018-03-06

Family

ID=51670892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410364038.7A Active CN104102739B (zh) 2014-07-28 2014-07-28 一种扩充实体库的方法及装置

Country Status (1)

Country Link
CN (1) CN104102739B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112560459B (zh) * 2020-12-04 2023-10-20 北京百度网讯科技有限公司 用于模型训练的样本筛选方法、装置、设备及存储介质
CN114297207A (zh) * 2021-12-07 2022-04-08 腾讯数码(天津)有限公司 实体库更新方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101876981A (zh) * 2009-04-29 2010-11-03 阿里巴巴集团控股有限公司 一种构建知识库的方法及装置
CN102426591A (zh) * 2011-10-31 2012-04-25 北京百度网讯科技有限公司 一种操作用于内容输入的语料库的方法和设备
CN102521263A (zh) * 2011-11-21 2012-06-27 北京百度网讯科技有限公司 主题词条获取方法及其装置
CN103455524A (zh) * 2012-06-05 2013-12-18 北京搜狗信息服务有限公司 展现和获取词条信息的方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090259998A1 (en) * 2008-04-11 2009-10-15 International Business Machines Corporation Method, system and computer program for identifying and reusing component aggregates
CN103617239A (zh) * 2013-11-26 2014-03-05 百度在线网络技术(北京)有限公司 命名实体的识别方法、装置及分类模型的创建方法、装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101876981A (zh) * 2009-04-29 2010-11-03 阿里巴巴集团控股有限公司 一种构建知识库的方法及装置
CN102426591A (zh) * 2011-10-31 2012-04-25 北京百度网讯科技有限公司 一种操作用于内容输入的语料库的方法和设备
CN102521263A (zh) * 2011-11-21 2012-06-27 北京百度网讯科技有限公司 主题词条获取方法及其装置
CN103455524A (zh) * 2012-06-05 2013-12-18 北京搜狗信息服务有限公司 展现和获取词条信息的方法和装置

Also Published As

Publication number Publication date
CN104102739A (zh) 2014-10-15

Similar Documents

Publication Publication Date Title
Hassan et al. Twitter sentiment analysis: A bootstrap ensemble framework
CN103123624B (zh) 确定中心词的方法及装置、搜索方法及装置
CN108268580A (zh) 基于知识图谱的问答方法及装置
US20060161531A1 (en) Method and system for information extraction
CN101609459A (zh) 一种情感特征词提取系统
CN105844424A (zh) 基于网络评论的产品质量问题发现及风险评估方法
CN103823893A (zh) 一种基于用户评论的产品检索方法及产品检索系统
CN103377249A (zh) 关键词投放方法及系统
CN107463548A (zh) 短语挖掘方法及装置
CN105095222B (zh) 单元词替换方法、搜索方法及装置
CN107748745B (zh) 一种企业名称关键字提取方法
CN104978314A (zh) 媒体内容推荐方法及装置
CN104298683B (zh) 主题挖掘方法和设备、以及查询扩展方法和设备
CN103177036A (zh) 一种标签自动提取方法和系统
CN105069077A (zh) 搜索方法及装置
CN105550253B (zh) 一种类型关系的获取方法及装置
CN110222194A (zh) 基于自然语言处理的数据图表生成方法和相关装置
CN104239552A (zh) 生成关联关键词、提供关联关键词的方法及系统
Leonandya et al. A semi-supervised algorithm for Indonesian named entity recognition
CN105468649A (zh) 一种待展示对象匹配的判断方法及其装置
CN104915426A (zh) 信息排序方法、用于生成信息排序模型的方法及装置
CN103226601A (zh) 一种图片搜索的方法和装置
CN105511869A (zh) 一种基于用户反馈的需求跟踪系统及方法
CN104102739B (zh) 一种扩充实体库的方法及装置
CN106021413B (zh) 基于主题模型的自展式特征选择方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant