CN105260360B - 命名实体的识别方法及装置 - Google Patents

命名实体的识别方法及装置 Download PDF

Info

Publication number
CN105260360B
CN105260360B CN201510708580.4A CN201510708580A CN105260360B CN 105260360 B CN105260360 B CN 105260360B CN 201510708580 A CN201510708580 A CN 201510708580A CN 105260360 B CN105260360 B CN 105260360B
Authority
CN
China
Prior art keywords
name entity
probability
determined
entity
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510708580.4A
Other languages
English (en)
Other versions
CN105260360A (zh
Inventor
汪平仄
张涛
陈志军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201510708580.4A priority Critical patent/CN105260360B/zh
Publication of CN105260360A publication Critical patent/CN105260360A/zh
Application granted granted Critical
Publication of CN105260360B publication Critical patent/CN105260360B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Character Discrimination (AREA)

Abstract

本公开是关于一种命名实体的识别方法及装置,其中,命名实体的识别方法包括:记录用户在输入信息时输入的词序列;根据条件随机场CRF识别出信息中的候选命名实体;根据记录的词序列对候选命名实体进行校正,以识别出信息中的命名实体。本公开实施例,根据记录的词序列对候选命名实体进行校正,不仅能够从信息中自动识别出命名实体,而且识别的准确率高、消耗的资源少。

Description

命名实体的识别方法及装置
技术领域
本公开涉及自然语言技术领域,尤其涉及一种命名实体的识别方法及装置。
背景技术
随着移动终端技术的快速发展,各种移动终端例如手机已非常普及,并且为人们提供了便利,例如,用户可以利用手机短信进行事件提醒,也可以利用手机进行导航。
自然语言处理和机器学习是人工智能的一个重要方向,而命名实体识别(NameEntity Recognition,NER)是这些研究中重要且不可缺少的一步。在语言文本中,命名实体是信息的主要载体,用来表达文本的主要内容。命名实体识别可以用于辅助进行事件提取,以进行事件提醒,也可以用于导航,因此,如何进行命名实体识别是一个急需解决的技术问题。
目前,可以对实体识别模型进行训练,以学习出实体识别模型的参数,然后利用具有该参数的实体识别模型识别出自然语言文本中的命名实体。但是,这种识别方法资源消耗大,无法对手机短信上的命名实体进行识别。
发明内容
为克服相关技术中存在的问题,本公开提供一种命名实体的识别方法及装置。
根据本公开实施例的第一方面,提供一种命名实体的识别方法,包括:
记录用户在输入信息时输入的词序列;
根据条件随机场CRF识别出所述信息中的候选命名实体;
根据记录的所述词序列对所述候选命名实体进行校正,以识别出所述信息中的命名实体。
在一实施例中,所述方法还包括:
在所述识别出所述信息中的命名实体之后,采用预设的实体标签对所述信息中的命名实体进行标注;
发送标注后的信息,以便接收端对所述标注后的信息进行还原;所述信息包括短信息。
在一实施例中,所述方法还包括:
在所述识别出所述信息中的命名实体之后,根据所述命名实体生成提醒记录或进行预设的业务操作,所述预设的业务操作包括导航操作。
在一实施例中,所述根据记录的所述词序列对所述候选命名实体进行校正,以识别出所述信息中的命名实体,包括:
根据所述词序列确定每个候选命名实体的左边界和右边界;
根据所述每个候选命名实体的左边界和右边界确定所述信息中的命名实体。
在一实施例中,所述根据所述词序列确定每个候选命名实体的左边界和右边界,包括:
判断当前候选命名实体的第一个字符是否为对应词序列的第一个字符,若为对应词序列的第一个字符,则确定所述当前候选命名实体的第一个字符为左边界;
判断当前候选命名实体的最后一个字符是否为所述对应词序列的最后一个字符,若为所述对应词序列的最后一个字符,则确定所述当前候选命名实体的最后一个字符为右边界。
在一实施例中,所述方法还包括:
若当前候选命名实体的第一个字符不是对应词序列的第一个字符,则将对应词序列中所述当前候选命名实体的第一个字符之前的词确定为第一对象,将所述第一对象之前的词确定为第二对象;
计算所述第一对象之后出现命名实体的概率,并将计算结果确定为第一概率;
计算所述第二对象之后出现命名实体的概率,并将计算结果确定为第二概率;
若所述第一概率大于所述第二概率,则确定所述当前候选命名实体的第一个字符为左边界,若所述第一概率小于所述第二概率,则确定所述第一对象的第一个字符为左边界。
在一实施例中,所述方法还包括:
若当前候选命名实体的最后一个字符不是所述对应词序列的最后一个字符,则将对应词序列中所述当前候选命名实体的最后一个字符之后的词确定为第三对象,将所述对应词序列的最后一个字符之后的词符确定为第四对象;
计算命名实体之后出现所述第三对象的概率,并将计算结果确定为第三概率;
计算命名实体之后出现所述第四对象的概率,并将计算结果确定为第四概率;
若所述第三概率大于所述第四概率,则将当前候选命名实体的最后一个字符确定为右边界,若所述第三概率小于所述第四概率,则将所述对应词序列的最后一个字符确定为右边界。
根据本公开实施例的第二方面,提供一种命名实体的识别装置,包括:
记录模块,被配置为记录用户在输入信息时输入的词序列;
识别模块,被配置为根据条件随机场CRF识别出所述信息中的候选命名实体;
校正模块,被配置为根据所述记录模块记录的所述词序列对所述识别模块识别出的所述候选命名实体进行校正,以识别出所述信息中的命名实体。
在一实施例中,所述装置还包括:
标注模块,被配置为在所述校正模块识别出所述信息中的命名实体之后,采用预设的实体标签对所述信息中的命名实体进行标注;
发送模块,被配置为发送所述标注模块标注后的信息,以便接收端对所述标注后的信息进行还原;所述信息包括短信息。
在一实施例中,所述装置还包括:
生成操作模块,被配置为在所述校正模块识别出所述信息中的命名实体之后,根据所述命名实体生成提醒记录或进行预设的业务操作,所述预设的业务操作包括导航操作。
在一实施例中,所述校正模块,包括:
第一确定子模块,被配置为根据所述词序列确定每个候选命名实体的左边界和右边界;
第二确定子模块,被配置为根据所述每个候选命名实体的左边界和右边界确定所述信息中的命名实体。
在一实施例中,所述第一确定子模块包括:
第一判断确定单元,被配置为判断当前候选命名实体的第一个字符是否为对应词序列的第一个字符,若为对应词序列的第一个字符,则确定所述当前候选命名实体的第一个字符为左边界;
第二判断确定单元,被配置为判断当前候选命名实体的最后一个字符是否为所述对应词序列的最后一个字符,若为所述对应词序列的最后一个字符,则确定所述当前候选命名实体的最后一个字符为右边界。
在一实施例中,所述第一确定子模块还包括:
第一对象确定单元,被配置为若所述第一判断确定单元确定当前候选命名实体的第一个字符不是对应词序列的第一个字符,则将对应词序列中所述当前候选命名实体的第一个字符之前的词确定为第一对象,将所述第一对象之前的词确定为第二对象;
第一计算单元,被配置为计算所述第一对象确定单元确定出的所述第一对象之后出现命名实体的概率,并将计算结果确定为第一概率;
第二计算单元,被配置为计算所述第一对象确定单元确定出的所述第二对象之后出现命名实体的概率,并将计算结果确定为第二概率;
左边界确定单元,被配置为若所述第一计算单元计算出的所述第一概率大于所述第二计算单元计算出的所述第二概率,则确定所述当前候选命名实体的第一个字符为左边界,若所述第一概率小于所述第二概率,则确定所述第一对象的第一个字符为左边界。
在一实施例中,所述第一确定子模块还包括:
第二对象确定单元,被配置为若所述第二判断确定单元确定当前候选命名实体的最后一个字符不是所述对应词序列的最后一个字符,则将对应词序列中所述当前候选命名实体的最后一个字符之后的词确定为第三对象,将所述对应词序列的最后一个字符之后的词符确定为第四对象;
第三计算单元,被配置为计算命名实体之后出现所述第二对象确定单元确定的所述第三对象的概率,并将计算结果确定为第三概率;
第四计算单元,被配置为计算命名实体之后出现所述第二对象确定单元确定的所述第四对象的概率,并将计算结果确定为第四概率;
右边界确定单元,被配置为若所述第三计算单元计算出的所述第三概率大于所述第四计算单元计算出的所述第四概率,则将当前候选命名实体的最后一个字符确定为右边界,若所述第三概率小于所述第四概率,则将所述对应词序列的最后一个字符确定为右边界。
根据本公开实施例的第三方面,提供一种命名实体的识别装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器被配置为:
记录用户在输入信息时输入的词序列;
根据条件随机场CRF识别出所述信息中的候选命名实体;
根据记录的所述词序列对所述候选命名实体进行校正,以识别出所述信息中的命名实体。
本公开的实施例提供的技术方案可以包括以下有益效果:根据记录的词序列对候选命名实体进行校正,不仅能够从信息中自动识别出命名实体,而且识别的准确率高、消耗的资源少。
采用一种融合实体标签标注的短信发送格式,大大降低了短信中命名实体识别时的资源消耗。
可以根据命名实体生成提醒记录或进行预设的业务操作,为用户提供了便利。
通过提供一种根据输入的词序列确定当前候选命名实体的左边界和右边界的方式,为从信息中识别出命名实体提供了条件。
通过提供另一种根据输入的词序列确定当前候选命名实体的左边界的方式,从而为从信息中识别出命名实体提供了条件。
通过提供另一种根据输入的词序列确定当前候选命名实体的右边界的方式,从而为从信息中识别出命名实体提供了条件。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种命名实体的识别方法的流程图。
图2A是根据一示例性实施例示出的另一种命名实体的识别方法的流程图。
图2B是根据一示例性实施例示出的一种命名实体的识别方法的场景图。
图3是根据一示例性实施例示出的另一种命名实体的识别方法的流程图。
图4是根据一示例性实施例示出的一种根据词序列确定候选命名实体的左边界和右边界的方法流程图。
图5是根据一示例性实施例示出的一种命名实体的识别装置的框图。
图6是根据一示例性实施例示出的另一种命名实体的识别装置的框图。
图7是根据一示例性实施例示出的另一种命名实体的识别装置的框图。
图8是根据一示例性实施例示出的另一种命名实体的识别装置的框图。
图9是根据一示例性实施例示出的另一种命名实体的识别装置的框图。
图10是根据一示例性实施例示出的另一种命名实体的识别装置的框图。
图11是根据一示例性实施例示出的一种适用于命名实体的识别装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种命名实体的识别方法的流程图,如图1所示,该命名实体的识别方法可应用于移动终端上,该移动终端可以包括但不局限于手机、平板电脑(PAD)等,该方法包括以下步骤S101-S 103:
在步骤S101中,记录用户在输入信息时输入的词序列。
在该实施例中,用户在使用输入法输入信息例如短信时,记录用户输入的词序列。
例如,用户在输入短信“张梅,晚上在南苑饭店西餐厅碰面。”时,记录的词序列可以为:“张梅”、“,”、“晚上”、“在”、“南苑饭店西餐厅”、“碰面”、“。”;也可以为“张梅”、“,”、“晚上”、“在南苑饭店西餐厅”、“碰面”、“。”
需要说明的是,记录的词序列与用户使用输入法的习惯有关,即不同用户输入相同信息时,记录的词序列有可能不同。
在步骤S102中,根据条件随机场识别出信息中的候选命名实体。
在该实施例中,可以根据条件随机场(CRF)识别出上述信息中的候选命名实体,由于CRF可以采用不同的模型,因此,识别出的候选命名实体可以为“张梅”和“南苑饭店西餐厅”,也可以为“张梅”、“南苑饭店”和“西餐厅”。
在步骤S103中,根据记录的词序列对候选命名实体进行校正,以识别出信息中的命名实体。
在该实施例中,由于识别出的候选命名实体可能不准确,因此,需要进行校正,例如,可以根据记录的词序列对候选命名实体进行校正,从而识别出命名实体。
在该实施例中,对候选命名实体进行校正,以识别出信息中的命名实体的过程可以包括:根据词序列确定每个候选命名实体的左边界和右边界,然后根据每个候选命名实体的左边界和右边界确定信息中的命名实体。
假设,根据词序列“张梅”确定出候选命名实体“张梅”的左边界为“张”,右边界为“梅”,则可以确定“张梅”为信息中的命名实体。
上述命名实体的识别方法实施例,根据记录的词序列对候选命名实体进行校正,不仅能够从信息中自动识别出命名实体,而且识别的准确率高、消耗的资源少。
图2A是根据一示例性实施例示出的另一种命名实体的识别方法的流程图,如图2A所示,在步骤S103之后,该方法还可以包括:
在步骤S104中,采用预设的实体标签对信息中的命名实体进行标注。
为了降低对资源的消耗,该实施例中,可以采用预设的实体标签对信息中的命名实体进行标注,其中,预设的实体标签可以包括:
<NAME>…</NAME>,用于对人名进行标注;
<LOC>…</LOC>,用于对地名进行标注;
<ORG>…</ORG>,用于对组织机构名进行标注。
例如,短信A为:“张梅,晚上在南苑饭店西餐厅碰面。”。
采用预设的实体标签对短信A进行标记后,得到A’:
“<NAME>张梅</NAME>,晚上在<ORG>南苑饭店西餐厅</ORG>碰面。”
在步骤S105中,发送标注后的信息,以便接收端对标注后的信息进行还原。
在采用预设的实体标签对信息中的命名实体进行标注之后,可以发送标记后的信息例如标记后的短信A’。
接收端在接收到短信A’后,可以读出其中的命名实体,并去掉标签,将短信还原成原始短信,即将短信A’还原成短信A。
在该实施例中,接收端可以为目标用户的移动终端例如手机。
例如,如图2B所示,用户1的手机21在识别出当前短信A中的命名实体后,对短信A进行标记,假设标记后的短信为短信A’,然后向目标用户例如用户2的手机22发送短信A’,手机22在接收到短信A’后,读出其中的命名实体,去掉标签,然后将短信A’还原成短信A。
上述命名实体的识别方法实施例,采用一种融合实体标签标注的短信发送格式,大大降低了短信中命名实体识别时的资源消耗。
图3是根据一示例性实施例示出的另一种命名实体的识别方法的流程图,如图3所示,在步骤S103之后,该方法还可以包括:
在步骤S106中,根据命名实体生成提醒记录或进行预设的业务操作。
在该实施例中,在从信息(例如短信)中识别出命名实体后,可以辅助进行事件抽取,然后基于抽取的事件生成提醒记录。也可以用于地图查找地址或是导航等业务操作。
上述命名实体的识别方法实施例,可以根据命名实体生成提醒记录或进行预设的业务操作,为用户提供了便利。
图4是根据一示例性实施例示出的一种根据词序列确定候选命名实体的左边界和右边界的方法流程图,如图4所示,该方法可以包括以下步骤:
在步骤S401中,判断当前候选命名实体的第一个字符是否为对应词序列的第一个字符,若为对应词序列的第一个字符,则执行步骤S402,否则,执行步骤S403-S406。
在该实施例中,假设短信A=A1A2…Aw,其中AiAi+1…Aj为当前候选命名实体,则使用输入的词序列进行校正的过程包括:根据词序列判定Ai是否是左边界,判定的方法为:在用户输入的词序列中,判断Ai是否为对应词序列的第一个字符。
在步骤S402中,确定当前候选命名实体的第一个字符为左边界,转向执行步骤S407。
如果Ai是对应词序列的第一个字符,则Ai是当前候选命名实体的左边界。
假设,当前候选命名实体为“南苑饭店西餐厅”,对应的词序列为“南苑饭店西餐厅”,由于Ai即“南”是对应词序列的第一个字符,因此,“南”是当前候选命名实体“南苑饭店西餐厅”的左边界。
在步骤S403中,将对应词序列中当前候选命名实体的第一个字符之前的词确定为第一对象,将第一对象之前的词确定为第二对象。
如果Ai不是对应词序列的第一个字符,则从Ai和At中选择一个作为左边界。其中,At…Ai…Ax为输入的词序列中独立的词,AaAa+1…Ai-1为在Ai之前的一个词,AbAb+1…At-1为在At之前的一个词。
在该实施例中,将AaAa+1…Ai-1确定为第一对象,将AbAb+1…At-1确定为第二对象。
假设,当前候选命名实体为“南苑饭店西餐厅”,对应的词序列为“在南苑饭店西餐厅”,由于Ai即“南”不是对应词序列的第一个字符,因此,需要从“晚上”和“在”中选择一个作为左边界。
在步骤S404中,计算第一对象之后出现命名实体的概率,并将计算结果确定为第一概率。
计算第一概率p(NEq/AaAa+1…Ai-1),其中,p(NEq/AaAa+1…Ai-1)表示AaAa+1…Ai-1的后面出现命名实体NEq的概率,其中,NEq的取值可以包括:NAME,ORG,LOC等。
在步骤S405中,计算第二对象之后出现命名实体的概率,并将计算结果确定为第二概率。
计算第二概率p(NEq/AbAb+1…At-1),其中,AbAb+1…At-1为在At之前的一个词。p(NEq/AbAb+1…At-1)表示在AbAb+1…At-1的后面出现命名实体NEq的概率。
在步骤S406中,若第一概率大于第二概率,则确定当前候选命名实体的第一个字符为左边界,若第一概率小于第二概率,则确定第一对象的第一个字符为左边界。
若p(NEq/AaAa+1…Ai-1)>p(NEq/AbAb+1…At-1),则Ai是当前候选命名实体的左边界,反之,At是当前候选命名实体的左边界。
继续上例进行描述,假设“在”之后出现命名实体的概率大于“晚上”之后出现命名实体的概率,则确定“南”是当前候选命名实体“南苑饭店西餐厅”的左边界。
在步骤S407中,判断当前候选命名实体的最后一个字符是否为对应词序列的最后一个字符,若为对应词序列的最后一个字符,则执行步骤S408,否则执行步骤S409-S412。
在该实施例中,在确定好当前候选命名实体的左边界之后,继续确定当前候选命名实体的右边界。
在该实施例中,根据输入的词序列判定Aj是否是合适的右边界的方法为:在用户输入的词序列中,判断Aj是否为词序列的最后一个字符。
在步骤S408中,确定当前候选命名实体的最后一个字符为右边界,操作结束。
在该实施例中,如果Aj是对应词序列的最后一个字符,则Aj为当前候选命名实体右边界。
假设,当前候选命名实体为“南苑饭店西餐厅”,对应的词序列为“南苑饭店西餐厅”,由于Aj即“厅”是对应词序列的最后一个字符,因此,“厅”是当前候选命名实体“南苑饭店西餐厅”的右边界。
在步骤S409中,将对应词序列中当前候选命名实体的最后一个字符之后的词确定为第三对象,将对应词序列的最后一个字符之后的词确定为第四对象。
如果Aj不是对应词序列的最后一个字符,则从Aj和Ak中选择一个作为右边界。其中,Ay…Aj…Ak在输入的词序列中为一个独立的词。Aj+1Aj+2…Am为在Aj之后的一个词,Ak+ 1Ak+2…An为在Ak之后的一个词。
假设,当前候选命名实体为“南苑饭店”,对应的词序列为“南苑饭店西餐厅”,由于Aj即“店”不是对应词序列的最后一个字符,因此,需要从“店”和“厅”中选择一个作为右边界。其中,Aj+1Aj+2…Am为“西餐厅”,Ak+1Ak+2…An为“碰面”。
在步骤S410中,计算命名实体之后出现第三对象的概率,并将计算结果确定为第三概率。
计算第三概率p(Aj+1Aj+2…Am/NEq),其中,p(Aj+1Aj+2…Am/NEq)表示命名实体NEq的后面出现Aj+1Aj+2…Am的概率。
在步骤S411中,计算命名实体之后出现第四对象的概率,并将计算结果确定为第四概率。
计算第四概率p(Ak+1Ak+2…An/NEq),其中,p(Ak+1Ak+2…An/NEq)表示命名实体NEq的后面出现Ak+1Ak+2…An的概率。
在步骤S412中,若第三概率大于第四概率,则将当前候选命名实体的最后一个字符确定为右边界,若第三概率小于第四概率,则将对应词序列的最后一个字符确定为右边界。
若p(Aj+1Aj+2…Am/NEq)>p(Ak+1Ak+2…An/NEq),则确定Aj为右边界,反之,确定Ak为右边界。
假设在该实施例中,命名实体NEq的后面出现“西餐厅”的概率小于命名实体NEq的后面出现“碰面”的概率,则确定“厅”是当前候选命名实体“南苑饭店西餐厅”的右边界。
在该实施例中,在确定好当前候选命名实体的左边界和右边界之后,即可根据左边界和右边界确定出命名实体。
上述实施例,根据输入的词序列确定出当前候选命名实体的左边界和右边界,从而为从信息中识别出命名实体提供了条件。
与前述命名实体的识别方法实施例相对应,本公开还提供了命名实体的识别装置实施例。
图5是根据一示例性实施例示出的一种命名实体的识别装置的框图,如图5所示,该命名实体的识别装置包括:记录模块51、识别模块52和校正模块53。
记录模块51,被配置为记录用户在输入信息时输入的词序列。
在该实施例中,用户在使用输入法输入信息例如短信时,记录用户输入的词序列。
例如,用户在输入短信“张梅,晚上在南苑饭店西餐厅碰面。”时,记录的词序列可以为:“张梅”、“,”、“晚上”、“在”、“南苑饭店西餐厅”、“碰面”、“。”;也可以为“张梅”、“,”、“晚上”、“在南苑饭店西餐厅”、“碰面”、“。”
需要说明的是,记录的词序列与用户使用输入法的习惯有关,即不同用户输入相同信息时,记录的词序列有可能不同。
识别模块52,被配置为根据条件随机场CRF识别出信息中的候选命名实体。
在该实施例中,可以根据条件随机场(CRF)识别出上述信息中的候选命名实体,由于CRF可以采用不同的模型,因此,识别出的候选命名实体可以为“张梅”和“南苑饭店西餐厅”,也可以为“张梅”、“南苑饭店”和“西餐厅”。
校正模块53,被配置为根据记录模块51记录的词序列对识别模块52识别出的候选命名实体进行校正,以识别出信息中的命名实体。
在该实施例中,由于识别出的候选命名实体可能不准确,因此,需要进行校正,例如,可以根据记录的词序列对候选命名实体进行校正,从而识别出命名实体。
在该实施例中,校正模块53可以包括:第一确定子模块531和第二确定子模块532。
第一确定子模块531被配置为根据词序列确定每个候选命名实体的左边界和右边界。
第二确定子模块532被配置为根据每个候选命名实体的左边界和右边界确定信息中的命名实体。
假设,根据词序列“张梅”确定出候选命名实体“张梅”的左边界为“张”,右边界为“梅”,则可以确定“张梅”为信息中的命名实体。
如图5所示的装置用于实现上述如图1所示的方法流程,涉及到的相关内容描述相同,此处不赘述。
上述命名实体的识别装置实施例,通过校正模块根据记录的词序列对候选命名实体进行校正,不仅能够从信息中自动识别出命名实体,而且识别的准确率高、消耗的资源少。
图6是根据一示例性实施例示出的另一种命名实体的识别装置的框图,如图6所示,在上述图5所示实施例的基础上,该装置还可包括:标注模块54和发送模块55。
标注模块54,被配置为在校正模块53识别出信息中的命名实体之后,采用预设的实体标签对信息中的命名实体进行标注。
为了降低对资源的消耗,该实施例中,可以采用预设的实体标签对信息中的命名实体进行标注,其中,预设的实体标签可以包括:
<NAME>…</NAME>,用于对人名进行标注;
<LOC>…</LOC>,用于对地名进行标注;
<ORG>…</ORG>,用于对组织机构名进行标注。
例如,短信A为:“张梅,晚上在南苑饭店西餐厅碰面。”。
采用预设的实体标签对短信A进行标记后,得到A’:
“<NAME>张梅</NAME>,晚上在<ORG>南苑饭店西餐厅</ORG>碰面。”
发送模块55,被配置为发送标注模块54标注后的信息,以便接收端对标注后的信息进行还原。
其中,信息可以包括短信息。
在采用预设的实体标签对信息中的命名实体进行标注之后,可以发送标记后的信息例如标记后的短信A’。
接收端在接收到短信A’后,可以读出其中的命名实体,并去掉标签,将短信还原成原始短信,即将短信A’还原成短信A。
如图6所示的装置用于实现上述如图2A所示的方法流程,涉及到的相关内容描述相同,此处不赘述。
上述命名实体的识别装置实施例,采用一种融合实体标签标注的短信发送格式,大大降低了短信中命名实体识别时的资源消耗。
图7是根据一示例性实施例示出的另一种命名实体的识别装置的框图,如图7所示,在上述图5所示实施例的基础上,该装置还可包括:
生成操作模块56,被配置为在校正模块53识别出信息中的命名实体之后,根据命名实体生成提醒记录或进行预设的业务操作,预设的业务操作包括导航操作。
在该实施例中,在从信息例如短信中识别出命名实体后,可以辅助进行事件抽取,然后基于抽取的事件生成提醒记录。也可以用于地图查找地址或是导航等业务操作。
如图7所示的装置用于实现上述如图3所示的方法流程,涉及到的相关内容描述相同,此处不赘述。
上述命名实体的识别装置实施例,可以根据命名实体生成提醒记录或进行预设的业务操作,为用户提供了便利。
图8是根据一示例性实施例示出的另一种命名实体的识别装置的框图,如图8所示,在上述图5所示实施例的基础上,第一确定子模块531可以包括:第一判断确定单元5311和第二判断确定单元5312。
第一判断确定单元5311被配置为判断当前候选命名实体的第一个字符是否为对应词序列的第一个字符,若为对应词序列的第一个字符,则确定当前候选命名实体的第一个字符为左边界。
在该实施例中,假设短信A=A1A2…Aw,其中AiAi+1…Aj为当前候选命名实体,则使用输入的词序列进行校正的过程包括:根据词序列判定Ai是否是左边界,判定的方法为:在用户输入的词序列中,判断Ai是否为对应词序列的第一个字符。
如果Ai是对应词序列的第一个字符,则Ai是当前候选命名实体的左边界。
假设,当前候选命名实体为“南苑饭店西餐厅”,对应的词序列为“南苑饭店西餐厅”,由于Ai即“南”是对应词序列的第一个字符,因此,“南”是当前候选命名实体“南苑饭店西餐厅”的左边界。
第二判断确定单元5312被配置为判断当前候选命名实体的最后一个字符是否为对应词序列的最后一个字符,若为对应词序列的最后一个字符,则确定当前候选命名实体的最后一个字符为右边界。
在该实施例中,在确定好当前候选命名实体的左边界之后,继续确定当前候选命名实体的右边界。
在该实施例中,根据输入的词序列判定Aj是否是合适的右边界的方法为:在用户输入的词序列中,判断Aj是否为词序列的最后一个字符。
在该实施例中,如果Aj是对应词序列的最后一个字符,则Aj为当前候选命名实体右边界。
假设,当前候选命名实体为“南苑饭店西餐厅”,对应的词序列为“南苑饭店西餐厅”,由于Aj即“厅”是对应词序列的最后一个字符,因此,“厅”是当前候选命名实体“南苑饭店西餐厅”的右边界。
如图8所示的装置用于实现上述如图4所示的方法流程,涉及到的相关内容描述相同,此处不赘述。
上述命名实体的识别装置实施例,通过提供一种根据输入的词序列确定当前候选命名实体的左边界和右边界的方式,为从信息中识别出命名实体提供了条件。
图9是根据一示例性实施例示出的另一种命名实体的识别装置的框图,如图9所示,在上述图8所示实施例的基础上,该第一确定子模块531还可包括:第一对象确定单元5313、第一计算单元5314、第二计算单元5315和左边界确定单元5316。
第一对象确定单元5313被配置为若第一判断确定单元5311确定当前候选命名实体的第一个字符不是对应词序列的第一个字符,则将对应词序列中当前候选命名实体的第一个字符之前的词确定为第一对象,将第一对象之前的词确定为第二对象。
如果Ai不是对应词序列的第一个字符,则从Ai和At中选择一个作为左边界。其中,At…Ai…Ax为输入的词序列中独立的词,AaAa+1…Ai-1为在Ai之前的一个词,AbAb+1…At-1为在At之前的一个词。
在该实施例中,将AaAa+1…Ai-1确定为第一对象,将AbAb+1…At-1确定为第二对象。
假设,当前候选命名实体为“南苑饭店西餐厅”,对应的词序列为“在南苑饭店西餐厅”,由于Ai即“南”不是对应词序列的第一个字符,因此,需要从“晚上”和“在”中选择一个作为左边界。
第一计算单元5314被配置为计算第一对象确定单元5313确定出的第一对象之后出现命名实体的概率,并将计算结果确定为第一概率。
计算第一概率p(NEq/AaAa+1…Ai-1),其中,p(NEq/AaAa+1…Ai-1)表示AaAa+1…Ai-1的后面出现命名实体NEq的概率,其中,NEq的取值可以包括:NAME,ORG,LOC等。
第二计算单元5315被配置为计算第一对象确定单元5313确定出的第二对象之后出现命名实体的概率,并将计算结果确定为第二概率。
计算第二概率p(NEq/AbAb+1…At-1),其中,AbAb+1…At-1为在At之前的一个词。p(NEq/AbAb+1…At-1)表示在AbAb+1…At-1的后面出现命名实体NEq的概率。
左边界确定单元5316被配置为若第一计算单元5314计算出的第一概率大于第二计算单元5315计算出的第二概率,则确定当前候选命名实体的第一个字符为左边界,若第一概率小于第二概率,则确定第一对象的第一个字符为左边界。
若p(NEq/AaAa+1…Ai-1)>p(NEq/AbAb+1…At-1),则Ai是当前候选命名实体的左边界,反之,At是当前候选命名实体的左边界。
继续上例进行描述,假设“在”之后出现命名实体的概率大于“晚上”之后出现命名实体的概率,则确定“南”是当前候选命名实体“南苑饭店西餐厅”的左边界。
如图9所示的装置用于实现上述如图4所示的方法流程,涉及到的相关内容描述相同,此处不赘述。
上述命名实体的识别装置实施例,通过提供另一种根据输入的词序列确定当前候选命名实体的左边界的方式,从而为从信息中识别出命名实体提供了条件。
图10是根据一示例性实施例示出的另一种命名实体的识别装置的框图,如图10所示,在上述图8所示实施例的基础上,该第一确定子模块531还可包括:第二对象确定单元5317、第三计算单元5318、第四计算单元5319和右边界确定单元5310。
第二对象确定单元5317被配置为若第二判断确定单元5312确定当前候选命名实体的最后一个字符不是对应词序列的最后一个字符,则将对应词序列中当前候选命名实体的最后一个字符之后的词确定为第三对象,将对应词序列的最后一个字符之后的词符确定为第四对象。
在该实施例中,如果Aj不是对应词序列的最后一个字符,则从Aj和Ak中选择一个作为右边界。其中,Ay…Aj…Ak在输入的词序列中为一个独立的词。Aj+1Aj+2…Am为在Aj之后的一个词,Ak+1Ak+2…An为在Ak之后的一个词。
假设,当前候选命名实体为“南苑饭店”,对应的词序列为“南苑饭店西餐厅”,由于Aj即“店”不是对应词序列的最后一个字符,因此,需要从“店”和“厅”中选择一个作为右边界。其中,Aj+1Aj+2…Am为“西餐厅”,Ak+1Ak+2…An为“碰面”。
第三计算单元5318被配置为计算命名实体之后出现第二对象确定单元5317确定的第三对象的概率,并将计算结果确定为第三概率。
计算第三概率p(Aj+1Aj+2…Am/NEq),其中,p(Aj+1Aj+2…Am/NEq)表示命名实体NEq的后面出现Aj+1Aj+2…Am的概率。
第四计算单元5319被配置为计算命名实体之后出现第二对象确定单元5317确定的第四对象的概率,并将计算结果确定为第四概率。
计算第四概率p(Ak+1Ak+2…An/NEq),其中,p(Ak+1Ak+2…An/NEq)表示命名实体NEq的后面出现Ak+1Ak+2…An的概率。
右边界确定单元5310被配置为若第三计算单元5318计算出的第三概率大于第四计算单元5319计算出的第四概率,则将当前候选命名实体的最后一个字符确定为右边界,若第三概率小于第四概率,则将对应词序列的最后一个字符确定为右边界。
若p(Aj+1Aj+2…Am/NEq)>p(Ak+1Ak+2…An/NEq),则确定Aj为右边界,反之,确定Ak为右边界。
假设在该实施例中,命名实体NEq的后面出现“西餐厅”的概率小于命名实体NEq的后面出现“碰面”的概率,则确定“厅”是当前候选命名实体“南苑饭店西餐厅”的右边界。
如图10所示的装置用于实现上述如图4所示的方法流程,涉及到的相关内容描述相同,此处不赘述。
上述命名实体的识别装置实施例,通过提供另一种根据输入的词序列确定当前候选命名实体的右边界的方式,从而为从信息中识别出命名实体提供了条件。
关于上述实施例中的装置,其中各个模块、子模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图11是根据一示例性实施例示出的一种适用于命名实体的识别装置的框图。例如,装置1100可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图11,装置1100可以包括以下一个或多个组件:处理组件1102,存储器1104,电源组件1106,多媒体组件1108,音频组件1110,输入/输出(I/O)的接口1112,传感器组件1114,以及通信组件1116。
处理组件1102通常控制装置1100的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件1102可以包括一个或多个处理器1120来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1102可以包括一个或多个模块,便于处理组件1102和其他组件之间的交互。例如,处理部件1102可以包括多媒体模块,以方便多媒体组件1108和处理组件1102之间的交互。
存储器1104被配置为存储各种类型的数据以支持在设备1100的操作。这些数据的示例包括用于在装置1100上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1104可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件1106为装置1100的各种组件提供电力。电力组件1106可以包括电源管理系统,一个或多个电源,及其他与为装置1100生成、管理和分配电力相关联的组件。
多媒体组件1108包括在所述装置1100和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1108包括一个前置摄像头和/或后置摄像头。当设备1100处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1110被配置为输出和/或输入音频信号。例如,音频组件1110包括一个麦克风(MIC),当装置1100处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1104或经由通信组件1116发送。在一些实施例中,音频组件1110还包括一个扬声器,用于输出音频信号。
I/O接口1112为处理组件1102和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1114包括一个或多个传感器,用于为装置1100提供各个方面的状态评估。例如,传感器组件1114可以检测到设备1100的打开/关闭状态,组件的相对定位,例如所述组件为装置1100的显示器和小键盘,传感器组件1114还可以检测装置1100或装置1100一个组件的位置改变,用户与装置1100接触的存在或不存在,装置1100方位或加速/减速和装置1100的温度变化。传感器组件1114可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1114还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1114还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1116被配置为便于装置1100和其他设备之间有线或无线方式的通信。装置1100可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件1116经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件1116还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置1100可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1104,上述指令可由装置1100的处理器1120执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (8)

1.一种命名实体的识别方法,其特征在于,所述方法包括:
记录用户在输入信息时输入的词序列;
根据条件随机场CRF识别出所述信息中的候选命名实体;
根据记录的所述词序列对所述候选命名实体进行校正,以识别出所述信息中的命名实体;
采用预设的实体标签对所述信息中的命名实体进行标注;
发送标注后的信息,以便接收端对所述标注后的信息进行还原;所述信息包括短信息;
其中,所述根据记录的所述词序列对所述候选命名实体进行校正,以识别出所述信息中的命名实体,包括:
根据所述词序列确定每个候选命名实体的左边界和右边界;
根据所述每个候选命名实体的左边界和右边界确定所述信息中的命名实体;
其中,所述根据所述词序列确定每个候选命名实体的左边界和右边界,包括:
判断当前候选命名实体的第一个字符是否为对应词序列的第一个字符;
若当前候选命名实体的第一个字符不是对应词序列的第一个字符,则将对应词序列中所述当前候选命名实体的第一个字符之前的词确定为第一对象,将所述第一对象之前的词确定为第二对象;
计算所述第一对象之后出现命名实体的概率,并将计算结果确定为第一概率;
计算所述第二对象之后出现命名实体的概率,并将计算结果确定为第二概率;
若所述第一概率大于所述第二概率,则确定所述当前候选命名实体的第一个字符为左边界,若所述第一概率小于所述第二概率,则确定所述第一对象的第一个字符为左边界。
2.根据权利要求1所述的命名实体的识别方法,其特征在于,所述方法还包括:
在所述识别出所述信息中的命名实体之后,根据所述命名实体生成提醒记录或进行预设的业务操作,所述预设的业务操作包括导航操作。
3.根据权利要求1所述的命名实体的识别方法,其特征在于,所述根据所述词序列确定每个候选命名实体的左边界和右边界,还包括:
若当前候选命名实体的第一个字符为对应词序列的第一个字符,则确定所述当前候选命名实体的第一个字符为左边界;
判断当前候选命名实体的最后一个字符是否为所述对应词序列的最后一个字符,若为所述对应词序列的最后一个字符,则确定所述当前候选命名实体的最后一个字符为右边界。
4.根据权利要求3所述的命名实体的识别方法,其特征在于,所述方法还包括:
若当前候选命名实体的最后一个字符不是所述对应词序列的最后一个字符,则将对应词序列中所述当前候选命名实体的最后一个字符之后的词确定为第三对象,将所述对应词序列的最后一个字符之后的词符确定为第四对象;
计算命名实体之后出现所述第三对象的概率,并将计算结果确定为第三概率;
计算命名实体之后出现所述第四对象的概率,并将计算结果确定为第四概率;
若所述第三概率大于所述第四概率,则将当前候选命名实体的最后一个字符确定为右边界,若所述第三概率小于所述第四概率,则将所述对应词序列的最后一个字符确定为右边界。
5.一种命名实体的识别装置,其特征在于,所述装置包括:
记录模块,被配置为记录用户在输入信息时输入的词序列;
识别模块,被配置为根据条件随机场CRF识别出所述信息中的候选命名实体;
校正模块,被配置为根据所述记录模块记录的所述词序列对所述识别模块识别出的所述候选命名实体进行校正,以识别出所述信息中的命名实体;
标注模块,被配置为在所述校正模块识别出所述信息中的命名实体之后,采用预设的实体标签对所述信息中的命名实体进行标注;
发送模块,被配置为发送所述标注模块标注后的信息,以便接收端对所述标注后的信息进行还原;所述信息包括短信息;
其中,所述校正模块,包括:
第一确定子模块,被配置为根据所述词序列确定每个候选命名实体的左边界和右边界;
第二确定子模块,被配置为根据所述每个候选命名实体的左边界和右边界确定所述信息中的命名实体;
其中,所述第一确定子模块包括:
第一判断单元,被配置为判断当前候选命名实体的第一个字符是否为对应词序列的第一个字符;
第一对象确定单元,被配置为若所述第一判断单元确定当前候选命名实体的第一个字符不是对应词序列的第一个字符,则将对应词序列中所述当前候选命名实体的第一个字符之前的词确定为第一对象,将所述第一对象之前的词确定为第二对象;
第一计算单元,被配置为计算所述第一对象确定单元确定出的所述第一对象之后出现命名实体的概率,并将计算结果确定为第一概率;
第二计算单元,被配置为计算所述第一对象确定单元确定出的所述第二对象之后出现命名实体的概率,并将计算结果确定为第二概率;
左边界确定单元,被配置为若所述第一计算单元计算出的所述第一概率大于所述第二计算单元计算出的所述第二概率,则确定所述当前候选命名实体的第一个字符为左边界,若所述第一概率小于所述第二概率,则确定所述第一对象的第一个字符为左边界。
6.根据权利要求5所述的命名实体的识别装置,其特征在于,所述装置还包括:
生成操作模块,被配置为在所述校正模块识别出所述信息中的命名实体之后,根据所述命名实体生成提醒记录或进行预设的业务操作,所述预设的业务操作包括导航操作。
7.根据权利要求5所述的命名实体的识别装置,其特征在于,所述第一确定子模块还包括:
第一确定单元,被配置为若所述第一判断单元判断当前候选命名实体的第一个字符为对应词序列的第一个字符,则确定所述当前候选命名实体的第一个字符为左边界;
第二判断确定单元,被配置为判断当前候选命名实体的最后一个字符是否为所述对应词序列的最后一个字符,若为所述对应词序列的最后一个字符,则确定所述当前候选命名实体的最后一个字符为右边界。
8.根据权利要求7所述的命名实体的识别装置,其特征在于,所述第一确定子模块还包括:
第二对象确定单元,被配置为若所述第二判断确定单元确定当前候选命名实体的最后一个字符不是所述对应词序列的最后一个字符,则将对应词序列中所述当前候选命名实体的最后一个字符之后的词确定为第三对象,将所述对应词序列的最后一个字符之后的词符确定为第四对象;
第三计算单元,被配置为计算命名实体之后出现所述第二对象确定单元确定的所述第三对象的概率,并将计算结果确定为第三概率;
第四计算单元,被配置为计算命名实体之后出现所述第二对象确定单元确定的所述第四对象的概率,并将计算结果确定为第四概率;
右边界确定单元,被配置为若所述第三计算单元计算出的所述第三概率大于所述第四计算单元计算出的所述第四概率,则将当前候选命名实体的最后一个字符确定为右边界,若所述第三概率小于所述第四概率,则将所述对应词序列的最后一个字符确定为右边界。
CN201510708580.4A 2015-10-27 2015-10-27 命名实体的识别方法及装置 Active CN105260360B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510708580.4A CN105260360B (zh) 2015-10-27 2015-10-27 命名实体的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510708580.4A CN105260360B (zh) 2015-10-27 2015-10-27 命名实体的识别方法及装置

Publications (2)

Publication Number Publication Date
CN105260360A CN105260360A (zh) 2016-01-20
CN105260360B true CN105260360B (zh) 2018-12-18

Family

ID=55100056

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510708580.4A Active CN105260360B (zh) 2015-10-27 2015-10-27 命名实体的识别方法及装置

Country Status (1)

Country Link
CN (1) CN105260360B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106569998A (zh) * 2016-10-27 2017-04-19 浙江大学 一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法
CN106767876A (zh) * 2017-02-02 2017-05-31 王恒升 一种机器人导航自然语言指令的语义理解模型
CN107038157B (zh) 2017-05-05 2020-09-29 百度在线网络技术(北京)有限公司 基于人工智能的识别错误发现方法、装置及存储介质
CN110019711A (zh) * 2017-11-27 2019-07-16 吴谨准 一种对医学文本数据结构化处理的控制方法及装置
CN108388559B (zh) * 2018-02-26 2021-11-19 中译语通科技股份有限公司 地理空间应用下的命名实体识别方法及系统、计算机程序
CN109859813B (zh) * 2019-01-30 2020-11-10 新华三大数据技术有限公司 一种实体修饰词识别方法及装置
CN111597813A (zh) * 2020-05-21 2020-08-28 上海创蓝文化传播有限公司 一种基于命名实体识别提取短信文本摘要的方法及装置
CN112487826A (zh) * 2020-11-30 2021-03-12 北京百度网讯科技有限公司 信息抽取方法、抽取模型训练方法、装置以及电子设备
CN112765985B (zh) * 2021-01-13 2023-10-27 中国科学技术信息研究所 一种面向特定领域专利实施例的命名实体识别方法
TWI803093B (zh) * 2021-12-09 2023-05-21 中華電信股份有限公司 處理豐富文字之語意理解系統、方法及其電腦可讀媒介

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719122A (zh) * 2009-12-04 2010-06-02 中国人民解放军信息工程大学 一种从文本数据中提取中文命名实体的方法
CN104182423A (zh) * 2013-05-27 2014-12-03 华东师范大学 一种基于条件随机场的中文人名自动识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719122A (zh) * 2009-12-04 2010-06-02 中国人民解放军信息工程大学 一种从文本数据中提取中文命名实体的方法
CN104182423A (zh) * 2013-05-27 2014-12-03 华东师范大学 一种基于条件随机场的中文人名自动识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
生物医学文本中命名实体识别的智能化方法;王浩畅 等;《北京邮电大学学报》;20061130;第29卷;第56-57页 *
生物医学文本挖掘技术的研究与进展;王浩畅 等;《中文信息学报》;20080531;第22卷(第3期);第89-98页 *
边界模板和局部统计相结合的中国人名识别;李中国 等;《中文信息学报》;20061231;第20卷(第5期);第44-50页 *

Also Published As

Publication number Publication date
CN105260360A (zh) 2016-01-20

Similar Documents

Publication Publication Date Title
CN105260360B (zh) 命名实体的识别方法及装置
CN107832036B (zh) 语音控制方法、装置及计算机可读存储介质
TW202113680A (zh) 人臉和人手關聯檢測方法及裝置、電子設備和電腦可讀儲存媒體
US20160210034A1 (en) Method and apparatus for switching display mode
RU2638154C2 (ru) Способы и устройства для присваивания метки номеру
EP3958110B1 (en) Speech control method and apparatus, terminal device, and storage medium
CN104123093A (zh) 信息处理方法及装置
CN109543066A (zh) 视频推荐方法、装置和计算机可读存储介质
EP2921969A1 (en) Method and apparatus for centering and zooming webpage and electronic device
US11335348B2 (en) Input method, device, apparatus, and storage medium
CN107202574A (zh) 运动轨迹信息修正方法及装置
CN109961791A (zh) 一种语音信息处理方法、装置及电子设备
CN105100193A (zh) 云名片推荐方法及装置
CN108803972B (zh) 信息显示方法、装置、移动终端以及存储介质
CN104573642A (zh) 人脸识别方法及装置
CN106775210A (zh) 壁纸更换的方法和装置
US20160349947A1 (en) Method and device for sending message
CN109543008A (zh) 一种即时通信的通知方法、装置、电子设备及存储介质
CN105487774A (zh) 图像分组方法及装置
CN105677215A (zh) 应用控制方法及装置
CN105701245B (zh) 图片推荐方法及装置
US20170034347A1 (en) Method and device for state notification and computer-readable storage medium
CN106936986A (zh) 应用处理方法及装置
EP3173949A1 (en) Method and device for pushing user information
CN105512231A (zh) 联系人搜索方法、装置和终端设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant