CN104504037B - 实体词热度计算方法及装置 - Google Patents

实体词热度计算方法及装置 Download PDF

Info

Publication number
CN104504037B
CN104504037B CN201410778155.8A CN201410778155A CN104504037B CN 104504037 B CN104504037 B CN 104504037B CN 201410778155 A CN201410778155 A CN 201410778155A CN 104504037 B CN104504037 B CN 104504037B
Authority
CN
China
Prior art keywords
entity word
current
under
class
intensity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410778155.8A
Other languages
English (en)
Other versions
CN104504037A (zh
Inventor
赵艳青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Easou World Polytron Technologies Inc
Original Assignee
Shenzhen Yisou Science & Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yisou Science & Technology Development Co Ltd filed Critical Shenzhen Yisou Science & Technology Development Co Ltd
Priority to CN201410778155.8A priority Critical patent/CN104504037B/zh
Publication of CN104504037A publication Critical patent/CN104504037A/zh
Application granted granted Critical
Publication of CN104504037B publication Critical patent/CN104504037B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种实体词热度计算方法及装置,上述方法包括:将实体词作为query,在搜索引擎中抓取搜索结果;解析抓取到的前10条搜索结果的title,过滤其中不包含上述实体词的title;对剩余title逐条进行分词并在各实体词类别下进行打分;根据得到的分数计算上述实体词在各实体词类别下的热度;上述装置包括抓取模块、挖掘模块及热度计算模块。本发明提高了实体词热度计算的速度和准确性。

Description

实体词热度计算方法及装置
技术领域
本发明涉及计算机信息检索领域,尤其涉及一种实体词热度计算方法及装置。
背景技术
现在成熟的商业搜索引擎很多,这些搜索引擎通过长期的用户经验积累,为我们提供了丰富的信息,合理的利用商业搜索引擎提供的结果数据进行分析处理,可以得到很多有用的信息。
实体词热度是指实体词在不同实体词类别下在当前阶段的受欢迎程度。在搜索引擎处理中,实体词热度非常重要,直接影响query中词语下发检索工作。
现在搜索引擎中实体词热度都是利用相关资源站所给到的得分计算得到的,由于不同类型的资源类别打分体系相互独立,很难得到一个统一的标准来得到实体词在不同类别下的热度。传统的实体词热度问题很大程度上依靠人的主观意志来判定,因而带来了浪费人力、速度慢且人为因素影响太严重等问题。
发明内容
本发明的目的是,提供一种实体词热度计算方法及装置,以提高实体词热度的计算速度及准确性。
本发明公开了一种实体词热度计算方法,上述方法包括:
步骤A:将实体词作为query,在搜索引擎中抓取搜索结果;
步骤B:解析抓取到的前10条搜索结果的title,过滤其中不包含上述实体词的title;
步骤C:对剩余title逐条进行分词并在各实体词类别下进行打分;
步骤D:根据得到的分数计算上述实体词在各实体词类别下的热度。
优选地,上述步骤C通过如下方法对每个title在各实体词类别下进行打分:
确定当前title中是否包含当前实体词类别的特征词,若是,则当前title在当前实体词类别下的得分为11-m,其中,m为当前title的序号;否则,当前title在当前实体词类别下的得分为0。
优选地,上述步骤D具体包括:
步骤D1:取每个实体词类别下的最高分为上述实体词在该实体词类别下的分数;
步骤D2:判断上述分数的大小,若上述分数为0,则上述实体词在上述实体词类别下的热度为0;若上述分数为1、2、3或4,则上述实体词在上述实体词类别下的热度为1;若上述分数为5或6,则上述实体词在上述实体词类别下的热度为2;若上述分数为7或8,则上述实体词在上述实体词类别下的热度为3;若上述分数为9或10,则上述实体词在上述实体词类别下的热度为4。
优选地,上述实体词类别的特征词通过如下步骤预先确定:
步骤一:计算当前词在每个实体词类别下的卡方值;上述实体词类别包括:视频类、音乐类、小说类、app类;
步骤二:判断上述卡方值是否大于预设参数;若是,则将上述当前词作为相应实体词类别的候选特征词;
步骤三:计算每个候选特征词在相应实体词类别下模糊强度为低、中、高强度时的隶属度;
步骤四:根据最大隶属度原则,选出高强度时的隶属度为三个隶属度中的最大值的候选特征词,上述候选特征词即为相应实体词类别的特征词。
优选地,上述步骤一通过如下公式计算当前词在每个实体词类别下的卡方值:
其中,w为当前词;c为当前实体词类别;N为统计语料集中句子的总数;n1为N中属于当前类别c下并且包含w的句子的总数;n2为N中不属于当前类别c并且包含w的句子总数;n3为N中属于当前类别c并且不包含w的句子总数;n4为N中不属于当前类别c并且不包含w的句子总数。
优选地,上述步骤三具体包括以下步骤:
步骤a:根据如下模糊强度为低强度的隶属度函数,计算当前候选特征词与相应实体词类别在低强度下的隶属度;
步骤b:根据如下模糊强度为中强度的隶属度函数,计算当前候选特征词与相应实体词类别在中强度下的隶属度;
步骤c:根据如下模糊强度为高强度的隶属度函数,计算当前候选特征词与相应实体词类别在高强度下的隶属度;
其中,x为当前候选特征词在相应实体词类别下的卡方值;m1为常数,表示模糊强度为低强度时的聚类中心;m2为常数,表示模糊强度为中强度时的聚类中心;m3为常数,表示模糊强度为高强度时的聚类中心。
本发明进一步公开了一种实体词热度计算装置,上述装置包括:
抓取模块,用于将实体词作为query,在搜索引擎中抓取搜索结果;
挖掘模块,用于解析抓取模块抓取到的前10条搜索结果的title,过滤其中不包含上述实体词的title;
热度计算模块,用于对挖掘模块挖掘出的title进行分词并在各实体词类别下进行打分;以及根据得到的分数计算上述实体词在各实体词类别下的热度。
优选地,上述装置还包括特征词模块,用于计算当前词在每个实体词类别下的卡方值;判断上述卡方值是否大于预设参数;并在上述卡方值大于预设参数时,将上述当前词作为相应实体词类别的候选特征词;以及计算每个候选特征词在每个实体词类别下模糊强度为低、中、高强度时的隶属度;并根据最大隶属度原则,选出高强度时的隶属度为三个隶属度中的最大值的候选特征词,将上述候选特征词作为相应实体词类别的特征词并保存。
本发明通过将实体词作为query到搜索引擎去抓取检索结果,然后对抓取的检索结果进行title解析,再利用特征词计算实体词的热度;本发明可自动挖掘站点中实体词的搜索结果信息,提高了实体词热度计算的速度和准确性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明所述实体词热度计算方法优选实施例流程图;
图2是本发明所述实体词热度计算装置优选实施例原理框图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,是本发明所述实体词热度计算方法优选实施例流程图;包括以下步骤:
步骤S001:将实体词作为query,在搜索引擎中抓取搜索结果;
步骤S002:解析抓取到的前10条搜索结果的title,过滤其中不包含上述实体词的title;
步骤S003:对剩余的title逐条进行分词并在各实体词类别下进行打分;打分方法具体为,若当前title中包含当前实体词类别的特征词,则当前title在当前实体词类别下的得分为11-m,其中,m为当前title的序号;若当前title中不包含当前实体词类别的特征词,则当前title在当前实体词类别下的得分为0;
分词是指将一个汉字序列切分成一个一个单独的词比如,汉字序列为“斗破苍穹小说下载”,分词后得到“斗破、苍穹、小说、下载”四个词。
本步骤中,实体词类别的特征词通过如下步骤预先确定:
步骤031:计算当前词在每个实体词类别下的卡方值x;上述实体词类别包括:视频类、音乐类、小说类、app类;
本步骤通过如下公式计算当前词在每个实体词类别下的卡方值x:
其中,w为当前词;c为当前实体词类别;N为统计语料集中句子的总数;n1为N中属于当前类别c下并且包含w的句子的总数;n2为N中不属于当前类别c并且包含w的句子总数;n3为N中属于当前类别c并且不包含w的句子总数;n4为N中不属于当前类别c并且不包含w的句子总数。
步骤032:判断上述卡方值x是否大于预设参数K;若是,则将上述当前词作为相应实体词类别的候选特征词;
步骤033:计算每个候选特征词在相应实体词类别下的模糊强度为低、中、高强度时的隶属度;本步骤具体包括:
步骤a:根据如下模糊强度为低强度的隶属度函数,计算当前候选特征词与相应实体词类别在低强度下的隶属度;
步骤b:根据如下模糊强度为中强度的隶属度函数,计算当前候选特征词与相应实体词类别在中强度下的隶属度;
步骤c:根据如下模糊强度为高强度的隶属度函数,计算当前候选特征词与相应实体词类别在高强度下的隶属度;
其中,x为当前候选特征词在相应实体词类别下的卡方值;m1为常数,表示模糊强度为低强度时的聚类中心;m2为常数,表示模糊强度为中强度时的聚类中心;m3为常数,表示模糊强度为高强度时的聚类中心。
步骤034:根据最大隶属度原则,选出高强度时的隶属度为三个隶属度中的最大值的候选特征词,上述候选特征词即为相应实体词类别的特征词。
例如,假设候选特征词为:百度音乐,其在音乐类别下的低强度的隶属度为0,中强度的隶属度为0.0907,高强度的隶属度为0.903,由于0.903>0.0907>0,也就是说,其候选特征词“百度音乐”与音乐类在高强度时的隶属度为三个隶属度中的最大值,故“百度音乐”为音乐类的特征词。
步骤S004:取每个实体词类别下的最高分为上述实体词在该实体词类别下的分数;
步骤S005:判断上述分数的大小,若上述分数为0,则执行步骤S006;若上述分数为1、2、3或4,则执行步骤S007;若上述分数为5或6,则执行步骤S008;若上述分数为7或8,则执行步骤S009;若上述分数为9或10,则执行步骤S010;
步骤S006:令上述实体词在上述实体词类别下的热度为0,当前实体词热度计算结束;
步骤S007:令上述实体词在上述实体词类别下的热度为1,当前实体词热度计算结束;
步骤S008:令上述实体词在上述实体词类别下的热度为2,当前实体词热度计算结束;
步骤S009:令上述实体词在上述实体词类别下的热度为3,当前实体词热度计算结束;
步骤S010:令上述实体词在上述实体词类别下的热度为4,当前实体词热度计算结束。
如图2所示,是本发明所述实体词热度计算装置优选实施例原理框图,本实施例包括:
抓取模块10,用于将实体词作为query,在搜索引擎中抓取搜索结果;
挖掘模块20,用于解析抓取模块10抓取到的前10条搜索结果的title,过滤其中不包含上述实体词的title;
特征词模块30,用于计算当前词在每个实体词类别下的卡方值;判断上述卡方值是否大于预设参数;并在上述卡方值大于预设参数时,将上述当前词作为相应实体词类别的候选特征词;以及计算每个候选特征词在相应实体词类别下模糊强度为低、中、高强度时的隶属度;并根据最大隶属度原则,选出高强度时的隶属度为三个隶属度中的最大值的候选特征词,将上述候选特征词作为相应实体词类别的特征词并保存;
热度计算模块40,用于对挖掘模块20挖掘出的title进行分词并在各实体词类别下进行打分,具体为:若当前title中包含当前实体词类别的特征词,则当前title在当前实体词类别下的得分为11-m,其中,m为当前title的序号;若当前title中不包含当前实体词类别的特征词,则当前title在当前实体词类别下的得分为0;以及根据得到的分数计算上述实体词在各实体词类别下的热度,具体为:若上述分数为0,则上述实体词在上述实体词类别下的热度为0;若上述分数为1、2、3或4,则上述实体词在上述实体词类别下的热度为1;若上述分数为5或6,则上述实体词在上述实体词类别下的热度为2;若上述分数为7或8,则上述实体词在上述实体词类别下的热度为3;若上述分数为9或10,则上述实体词在上述实体词类别下的热度为4。
上述说明示出并描述了本发明的优选实施例,但如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (4)

1.一种实体词热度计算方法,其特征在于,所述方法包括:
步骤A:将实体词作为query,在搜索引擎中抓取搜索结果;
步骤B:解析抓取到的前10条搜索结果的title,过滤其中不包含所述实体词的title;
步骤C:对剩余title逐条进行分词并在各实体词类别下按照以下方式进行打分:确定当前title中是否包含当前实体词类别的特征词,若是,则当前title在当前实体词类别下的得分为11-m,其中,m为当前title的序号;否则,当前title在当前实体词类别下的得分为0;其中,所述实体词类别的特征词通过如下步骤预先确定:
步骤一:计算当前词在每个实体词类别下的卡方值;
步骤二:判断所述卡方值是否大于预设参数;若是,则将所述当前词作为相应实体词类别的候选特征词;
步骤三:计算每个候选特征词在相应实体词类别下模糊强度为低、中、高强度时的隶属度;具体包括以下步骤:
步骤a:根据如下模糊强度为低强度的隶属度函数,计算当前候选特征词与相应实体词类别在低强度下的隶属度;
步骤b:根据如下模糊强度为中强度的隶属度函数,计算当前候选特征词与相应实体词类别在中强度下的隶属度;
步骤c:根据如下模糊强度为高强度的隶属度函数,计算当前候选特征词与相应实体词类别在高强度下的隶属度;
其中,x为当前候选特征词在相应实体词类别下的卡方值;m1为常数,表示模糊强度为低强度时的聚类中心;m2为常数,表示模糊强度为中强度时的聚类中心;m3为常数,表示模糊强度为高强度时的聚类中心;
步骤四:根据最大隶属度原则,选出高强度时的隶属度为三个隶属度中的最大值的候选特征词,所述候选特征词即为相应实体词类别的特征词;
步骤D:根据得到的分数计算所述实体词在各实体词类别下的热度。
2.如权利要求1所述的实体词热度计算方法,其特征在于,所述步骤D具体包括:
步骤D1:取每个实体词类别下的最高分为所述实体词在该实体词类别下的分数;
步骤D2:判断所述分数的大小,若所述分数为0,则所述实体词在所述实体词类别下的热度为0;若所述分数为1、2、3或4,则所述实体词在所述实体词类别下的热度为1;若所述分数为5或6,则所述实体词在所述实体词类别下的热度为2;若所述分数为7或8,则所述实体词在所述实体词类别下的热度为3;若所述分数为9或10,则所述实体词在所述实体词类别下的热度为4。
3.如权利要求1所述的实体词热度计算方法,其特征在于,所述步骤一通过如下公式计算当前词在每个实体词类别下的卡方值:
其中,w为当前词;c为当前实体词类别;N为统计语料集中句子的总数;n1为N中属于当前类别c下并且包含w的句子的总数;n2为N中不属于当前类别c并且包含w的句子总数;n3为N中属于当前类别c并且不包含w的句子总数;n4为N中不属于当前类别c并且不包含w的句子总数。
4.一种实体词热度计算装置,其特征在于,所述装置包括:
抓取模块,用于将实体词作为query,在搜索引擎中抓取搜索结果;
挖掘模块,用于解析抓取模块抓取到的前10条搜索结果的title,过滤其中不包含所述实体词的title;
热度计算模块,用于对挖掘模块挖掘出的title进行分词并在各实体词类别下进行打分;以及根据得到的分数计算所述实体词在各实体词类别下的热度;其中:按照以下方式进行打分:确定当前title中是否包含当前实体词类别的特征词,若是,则当前title在当前实体词类别下的得分为11-m,其中,m为当前title的序号;否则,当前title在当前实体词类别下的得分为0;
特征词模块,用于计算当前词在每个实体词类别下的卡方值;判断所述卡方值是否大于预设参数;并在所述卡方值大于预设参数时,将所述当前词作为相应实体词类别的候选特征词;以及计算每个候选特征词在相应实体词类别下模糊强度为低、中、高强度时的隶属度;并根据最大隶属度原则,选出高强度时的隶属度为三个隶属度中的最大值的候选特征词,将所述候选特征词作为相应实体词类别的特征词并保存;其中,计算每个候选特征词在相应实体词类别下模糊强度为低、中、高强度时的隶属度的具体计算程如下:
根据如下模糊强度为低强度的隶属度函数,计算当前候选特征词与相应实体词类别在低强度下的隶属度;
根据如下模糊强度为中强度的隶属度函数,计算当前候选特征词与相应实体词类别在中强度下的隶属度;
根据如下模糊强度为高强度的隶属度函数,计算当前候选特征词与相应实体词类别在高强度下的隶属度;
其中,x为当前候选特征词在相应实体词类别下的卡方值;m1为常数,表示模糊强度为低强度时的聚类中心;m2为常数,表示模糊强度为中强度时的聚类中心;m3为常数,表示模糊强度为高强度时的聚类中心。
CN201410778155.8A 2014-12-15 2014-12-15 实体词热度计算方法及装置 Active CN104504037B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410778155.8A CN104504037B (zh) 2014-12-15 2014-12-15 实体词热度计算方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410778155.8A CN104504037B (zh) 2014-12-15 2014-12-15 实体词热度计算方法及装置

Publications (2)

Publication Number Publication Date
CN104504037A CN104504037A (zh) 2015-04-08
CN104504037B true CN104504037B (zh) 2018-07-06

Family

ID=52945435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410778155.8A Active CN104504037B (zh) 2014-12-15 2014-12-15 实体词热度计算方法及装置

Country Status (1)

Country Link
CN (1) CN104504037B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110569441B (zh) * 2019-09-16 2022-05-17 腾讯科技(深圳)有限公司 一种搜索字符串纠错方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101609472A (zh) * 2009-08-13 2009-12-23 腾讯科技(深圳)有限公司 一种基于问答平台的关键词评价方法和装置
CN101794311A (zh) * 2010-03-05 2010-08-04 南京邮电大学 基于模糊数据挖掘的中文网页自动分类方法
CN102081601A (zh) * 2009-11-27 2011-06-01 北京金山软件有限公司 一种领域词识别方法和装置
CN102929873A (zh) * 2011-08-08 2013-02-13 腾讯科技(深圳)有限公司 一种基于情境搜索提取搜索价值词的方法及装置
CN103473323A (zh) * 2013-09-13 2013-12-25 北京鹏宇成软件技术有限公司 一种基于卡方算法进行角色特征提取的方法
CN104102681A (zh) * 2013-04-15 2014-10-15 腾讯科技(深圳)有限公司 一种微博关键事件获取方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009039392A1 (en) * 2007-09-21 2009-03-26 The Board Of Trustees Of The University Of Illinois A system for entity search and a method for entity scoring in a linked document database

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101609472A (zh) * 2009-08-13 2009-12-23 腾讯科技(深圳)有限公司 一种基于问答平台的关键词评价方法和装置
CN102081601A (zh) * 2009-11-27 2011-06-01 北京金山软件有限公司 一种领域词识别方法和装置
CN101794311A (zh) * 2010-03-05 2010-08-04 南京邮电大学 基于模糊数据挖掘的中文网页自动分类方法
CN102929873A (zh) * 2011-08-08 2013-02-13 腾讯科技(深圳)有限公司 一种基于情境搜索提取搜索价值词的方法及装置
CN104102681A (zh) * 2013-04-15 2014-10-15 腾讯科技(深圳)有限公司 一种微博关键事件获取方法和装置
CN103473323A (zh) * 2013-09-13 2013-12-25 北京鹏宇成软件技术有限公司 一种基于卡方算法进行角色特征提取的方法

Also Published As

Publication number Publication date
CN104504037A (zh) 2015-04-08

Similar Documents

Publication Publication Date Title
CN107391760B (zh) 用户兴趣识别方法、装置及计算机可读存储介质
CN107704495B (zh) 主题分类器的训练方法、装置及计算机可读存储介质
CN104572958B (zh) 一种基于事件抽取的敏感信息监控方法
CN103956169B (zh) 一种语音输入方法、装置和系统
CN107463658B (zh) 文本分类方法及装置
CN106886567B (zh) 基于语义扩展的微博突发事件检测方法及装置
CN104933113A (zh) 一种基于语义理解的表情输入方法和装置
CN110175851B (zh) 一种作弊行为检测方法及装置
CN105488023B (zh) 一种文本相似度评估方法及装置
CN104573711B (zh) 基于文本‑物体‑场景关系的物体和场景的图像理解方法
CN108090216B (zh) 一种标签预测方法、装置及存储介质
CN103336766A (zh) 短文本垃圾识别以及建模方法和装置
CN110222328B (zh) 基于神经网络的分词和词类标注方法、装置、设备及存储介质
CN108959474B (zh) 实体关系提取方法
CN110197389A (zh) 一种用户识别方法及装置
CN106537387B (zh) 检索/存储与事件相关联的图像
CN109299277A (zh) 舆情分析方法、服务器及计算机可读存储介质
CN109918648B (zh) 一种基于动态滑动窗口特征评分的谣言深度检测方法
CN103955450A (zh) 一种新词自动提取方法
CN104657466B (zh) 一种基于论坛帖子特征的用户兴趣识别方法及装置
CN110134934A (zh) 文本情感分析方法和装置
CN106776555A (zh) 一种基于字模型的评论文本实体识别方法及装置
Sitorus et al. Sensing trending topics in twitter for greater Jakarta area
CN109753646B (zh) 一种文章属性识别方法以及电子设备
CN104504037B (zh) 实体词热度计算方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 518057 5 C block 403-409 of Nanshan District software industrial base, Shenzhen, Guangdong.

Patentee after: Shenzhen easou world Polytron Technologies Inc.

Address before: 518026 A5501-A, A tower, joint Plaza, Binhe Road and colored field road, Futian District, Shenzhen, Guangdong

Patentee before: Shenzhen EASOU Technology Co.,Ltd.

CP03 Change of name, title or address
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Calculation method and device of entity word heat

Effective date of registration: 20220606

Granted publication date: 20180706

Pledgee: Shenzhen hi tech investment small loan Co.,Ltd.

Pledgor: Shenzhen easou world Polytron Technologies Inc.

Registration number: Y2022980007153

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20230629

Granted publication date: 20180706

Pledgee: Shenzhen hi tech investment small loan Co.,Ltd.

Pledgor: Shenzhen easou world Polytron Technologies Inc.

Registration number: Y2022980007153

PC01 Cancellation of the registration of the contract for pledge of patent right