CN111950288B

CN111950288B - 一种命名实体识别中的实体标注方法及智能设备

Info

Publication number: CN111950288B
Application number: CN202010864555.6A
Authority: CN
Inventors: 张桐桐; 殷腾龙
Original assignee: Hisense Visual Technology Co Ltd
Current assignee: Hisense Visual Technology Co Ltd
Priority date: 2020-08-25
Filing date: 2020-08-25
Publication date: 2024-02-23
Anticipated expiration: 2040-08-25
Also published as: CN111950288A

Abstract

本发明公开一种命名实体识别中的实体标注方法及智能设备，在识别文本中的目标实体后，将所述目标实体输入至联合模型；所述联合模型包括用于相似度查询的语义索引模型以及词义分类模型；根据约束函数，对所述联合模型输出的词义类别和知识图谱的实体链接进行约束后，最终输出所述目标实体的高频词义类别。本发明能够解决实体标注结果不可控的问题，降低实体标注结果的偏差，进而提高命名实体识别的准确性。

Description

一种命名实体识别中的实体标注方法及智能设备

技术领域

本发明涉及自然语言处理技术领域，尤其涉及一种命名实体识别中的实体标注方法及智能设备。

背景技术

命名实体识别(Named Entities Recognition，NER)是自然语言处理(NaturalLanguage Processing，NLP)中的一个基础环节，目的在于识别文本语料中的人名、地名和组织机构等命名实体，是信息提取、问答系统、句法分析、机器翻译等众多NLP任务的重要基础工具。目前主要通过两方面评估NER：一方面是实体边界识别的准确性，另一方面是实体标注的准确性，实体标注主要标注实体的词义类别。由于命名实体数量的无穷性、构词的灵活性和语义的歧义性等因素，导致实体标注成为本领域的技术难题之一。

目前命名实体识别主要包括基于字典和规则的方法、基于传统机器学习方法以及基于深度学习方法。其中，基于字典和规则的方法主要依赖于词典和人工规则，人工规则构建消耗大量人工，且泛化性差，基于词典也无法处理未登录词的问题；基于传统机器学习的方法虽克服了基于字典和规则的局限性，但同时也存在过度依赖特征构建的问题；主流的基于深度学习的方法，优化了机器学习过度依赖特征构建的问题，但也有自身的局限性，比如需要大量标注数据、需要频繁的适应新领域等。上述的三种方法，在命名实体识别上各有优势，但具体到实体标注时都存在标注结果不可控的缺点，一个命名实体的标注可能正确，也可能存在较大偏差，因此都无法真正保证实体标注的准确性。

发明内容

为解决上述技术问题，本发明提供一种命名实体识别中的实体标注方法及智能设备。

第一方面提供一种命名实体识别中的实体标注方法，包括：

在识别文本中的目标实体后，将所述目标实体输入至联合模型；所述联合模型包括用于相似度查询的语义索引模型以及词义分类模型；

根据约束函数，对所述联合模型输出的词义类别和知识图谱的实体链接进行约束后，确定所述目标实体的高频词义类别并进行标注。

第二方面提供一种智能设备，包括：

文本接口，用于获取待命名实体识别的文本；

控制器，被配置为执行：

本申请的关键在于识别出文本中包括的目标实体之后，如何提高目标实体的语义类别(即实体标注)的准确性，主要采用基于知识图谱的命名实体识别方式，涉及到联合模型和标注结果的约束。联合模型包括语义索引模型和词义分类模型，用于对目标实体进行语义相似度查询以及词义分类的联合处理，然后根据知识图谱中与识别的目标实体对应的实体链接，结合联合模型输出的词义类别，通过预先定义的约束函数，来限制约束实体标注的结果，利用筛选出的目标实体的高频词义类别进行标注，从而解决实体标注结果不可控的问题，降低实体标注结果的偏差，进而提高命名实体识别的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要访问的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1中示例性示出了显示设备200与控制装置100之间操作场景的示意图；

图2中示例性示出了图1中显示设备200的硬件配置框图；

图3中示例性示出了图1中控制装置100的硬件配置框图；

图4中示例性示出了图1中显示设备200中软件配置示意图；

图5中示例性示出了显示设备200中应用程序的图标控件界面显示示意图；

图6中示例性示出了实体标注方法的流程图；

图7中示例性示出了词义分类模型的架构和训练示意图；

图8中示例性示出了语义索引模型的构建示意图；

图9中示例性示出了实体标注的处理逻辑示意图。

具体实施方式

为使本申请的目的、实施方式和优点更加清楚，下面将结合本申请示例性实施例中的附图，对本申请示例性实施方式进行清楚、完整地描述，显然，所描述的示例性实施例仅是本申请一部分实施例，而不是全部的实施例。

基于本申请描述的示例性实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请所附权利要求保护的范围。此外，虽然本申请中公开内容按照示范性一个或几个实例来介绍，但应理解，可以就这些公开内容的各个方面也可以单独构成一个完整实施方式。

需要说明的是，本申请中对于术语的简要说明，仅是为了方便理解接下来描述的实施方式，而不是意图限定本申请的实施方式。除非另有说明，这些术语应当按照其普通和通常的含义理解。

本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似或同类的对象或实体，而不必然意味着限定特定的顺序或先后次序，除非另外注明(Unless otherwise indicated)。应该理解这样访问的用语在适当情况下可以互换，例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。

此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖但不排他的包含，例如，包含了一系列组件的产品或设备不必限于清楚地列出的那些组件，而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。

本申请主要针对命名实体识别中的实体标注环节，命名实体识别可用于信息提取、问答系统、语音助手、句法分析、机器翻译等众多涉及NLP任务的应用场景中，这些应用场景中通常由智能设备端执行相应的NLP和NER任务，智能设备包括但不限于智能电视、移动终端、智能家居、智能客服、智能音响和智能机器人等设备。下面提供一种显示设备(智能电视)的实施例。

本申请中访问的术语“模块”，是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合，能够执行与该元件相关的功能。

本申请中访问的术语“遥控器”，是指电子设备(如本申请中公开的显示设备)的一个组件，通常可在较短的距离范围内无线控制电子设备。一般访问红外线和/或射频(RF)信号和/或蓝牙与电子设备连接，也可以包括WiFi、无线USB、蓝牙、动作传感器等功能模块。例如：手持式触摸遥控器，是以触摸屏中用户界面取代一般遥控装置中的大部分物理内置硬键。

本申请中访问的术语“手势”，是指用户通过一种手型的变化或手部运动等动作，用于表达预期想法、动作、目的/或结果的用户行为。

图1中示例性示出了根据实施例中显示设备与控制装置之间操作场景的示意图。如图1中示出，用户可通过移动终端300和控制装置100操作显示设备200。

在一些实施例中，控制装置100可以是遥控器，遥控器和显示设备的通信包括红外协议通信或蓝牙协议通信，及其他短距离通信方式等，通过无线或其他有线方式来控制显示设备200。用户可以通过遥控器上按键，语音输入、控制面板输入等输入用户指令，来控制显示设备200。如：用户可以通过遥控器上音量加减键、频道控制键、上/下/左/右的移动按键、语音输入按键、菜单键、开关机按键等输入相应控制指令，来实现控制显示设备200的功能。

在一些实施例中，也可以访问移动终端、平板电脑、计算机、笔记本电脑、和其他智能设备以控制显示设备200。例如，访问在智能设备上运行的应用程序控制显示设备200。该应用程序通过配置可以在与智能设备关联的屏幕上，在直观的用户界面(UI)中为用户提供各种控制。

在一些实施例中，移动终端300可与显示设备200安装软件应用，通过网络通信协议实现连接通信，实现一对一控制操作的和数据通信的目的。如：可以实现用移动终端300与显示设备200建立控制指令协议，将遥控控制键盘同步到移动终端300上，通过控制移动终端300上用户界面，实现控制显示设备200的功能。也可以将移动终端300上显示音视频内容传输到显示设备200上，实现同步显示功能。

如图1中还示出，显示设备200还与服务器400通过多种通信方式进行数据通信。可允许显示设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器400可以向显示设备200提供各种内容和互动。示例的，显示设备200通过发送和接收信息，以及电子节目指南(EPG)互动，接收软件程序更新，或访问远程储存的数字媒体库。服务器400可以是一个集群，也可以是多个集群，可以包括一类或多类服务器。通过服务器400提供视频点播和广告服务等其他网络服务内容。

显示设备200，可以液晶显示器、OLED显示器、投影显示设备。具体显示设备类型，尺寸大小和分辨率等不作限定，本领技术人员可以理解的是，显示设备200可以根据需要做性能和配置上一些改变。

显示设备200除了提供广播接收电视功能之外，还可以附加提供计算机支持功能的智能网络电视功能，包括但不限于，网络电视、智能电视、互联网协议电视(IPTV)等。

图2中示例性示出了根据示例性实施例中显示设备200的硬件配置框图。

在一些实施例中，显示设备200中包括控制器250、调谐解调器210、通信器220、检测器230、输入/输出接口255、显示器275，音频输出接口285、存储器260、供电电源290、用户接口265、外部装置接口240中的至少一种。

在一些实施例中，显示器275，用于接收源自第一处理器输出的图像信号，进行显示视频内容和图像以及菜单操控界面的组件。

在一些实施例中，显示器275，包括用于呈现画面的显示器组件，以及驱动图像显示的驱动组件。

在一些实施例中，显示视频内容，可以来自广播电视内容，也可以是说，可通过有线或无线通信协议接收的各种广播信号。或者，可显示来自网络通信协议接收来自网络服务器端发送的各种图像内容。

在一些实施例中，显示器275用于呈现显示设备200中产生且用于控制显示设备200的用户操控UI界面。

在一些实施例中，根据显示器275类型不同，还包括用于驱动显示的驱动组件。

在一些实施例中，显示器275为一种投影显示器，还可以包括一种投影装置和投影屏幕。

在一些实施例中，通信器220是用于根据各种通信协议类型与外部设备或外部服务器进行通信的组件。例如：通信器可以包括WIFI模块221，蓝牙模块222，有线以太网模块223等其他网络通信协议模块或近场通信协议模块，以及红外接收器中的至少一种，从而通信器220可根据控制器250的控制，接收控制装置100的控制信号，并将控制信号实现为WIFI信号、蓝牙信号、射频信号等信号类型。

在一些实施例中，显示设备200可以通过通信器220与外部控制装置100或内容提供设备之间建立控制信号和数据信号发送和接收。

在一些实施例中，用户接口265，可用于接收控制装置100(如：红外遥控器等)红外控制信号。

在一些实施例中，检测器230是显示设备200用于采集外部环境或与外部交互的信号。

在一些实施例中，检测器230包括光接收器，用于采集环境光线强度的传感器，可以通过采集环境光可以自适应性显示参数变化等。

在一些实施例中，检测器230还可以包括图像采集器，如相机、摄像头等，可以用于采集外部环境场景，以及用于采集用户的属性或与用户交互手势，可以自适应变化显示参数，也可以识别用户手势，以实现与用户之间互动的功能。

在一些实施例中，检测器230还可以包括温度传感器等，如通过感测环境温度。

在一些实施例中，显示设备200可自适应调整图像的显示色温。如当温度偏高的环境时，可调整显示设备200显示图像色温偏冷色调，或当温度偏低的环境时，可以调整显示设备200显示图像偏暖色调。

在一些实施例中，检测器230还可声音采集器等，如麦克风，可以用于接收用户的声音。示例性的，包括用户控制显示设备200的控制指令的语音信号，或采集环境声音，用于识别环境场景类型，使得显示设备200可以自适应适应环境噪声。

在一些实施例中，如图2所示，输入/输出接口255被配置为，可进行控制器250与外部其他设备或其他控制器250之间的数据传输。如接收外部设备的视频信号数据和音频信号数据、或命令指令数据等。

在一些实施例中，外部装置接口240可以包括，但不限于如下：可以高清多媒体接口HDMI接口、模拟或数据高清分量输入接口、复合视频输入接口、USB输入接口、RGB端口等任一个或多个接口。也可以是上述多个接口形成复合性的输入/输出接口。

在一些实施例中，如图2所示，调谐解调器210被配置为，通过有线或无线接收方式接收广播电视信号，可以进行放大、混频和谐振等调制解调处理，从多多个无线或有线广播电视信号中解调出音视频信号，该音视频信号可以包括用户所选择电视频道频率中所携带的电视音视频信号，以及EPG数据信号。

在一些实施例中，调谐解调器210解调的频点受到控制器250的控制，控制器250可根据用户选择发出控制信号，以使的调制解调器响应用户选择的电视信号频率以及调制解调该频率所携带的电视信号。

在一些实施例中，广播电视信号可根据电视信号广播制式不同区分为地面广播信号、有线广播信号、卫星广播信号或互联网广播信号等。或者根据调制类型不同可以区分为数字调制信号，模拟调制信号等。或者根据信号种类不同区分为数字信号、模拟信号等。

在一些实施例中，控制器250和调谐解调器210可以位于不同的分体设备中，即调谐解调器210也可在控制器250所在的主体设备的外置设备中，如外置机顶盒等。这样，机顶盒将接收到的广播电视信号调制解调后的电视音视频信号输出给主体设备，主体设备经过第一输入/输出接口接收音视频信号。

在一些实施例中，控制器250，通过存储在存储器上中各种软件控制程序，来控制显示设备的工作和响应用户的操作。控制器250可以控制显示设备200的整体操作。例如：响应于接收到用于选择在显示器275上显示UI对象的用户命令，控制器250便可以执行与由用户命令选择的对象有关的操作。

在一些实施例中，所述对象可以是可选对象中的任何一个，例如超链接或图标。与所选择的对象有关操作，例如：显示连接到超链接页面、文档、图像等操作，或者执行与所述图标相对应程序的操作。用于选择UI对象用户命令，可以是通过连接到显示设备200的各种输入装置(例如，鼠标、键盘、触摸板等)输入命令或者与由用户说出语音相对应的语音命令。

如图2所示，控制器250包括随机存取存储器251(Random Access Memory，RAM)、只读存储器252(Read-Only Memory,ROM)、视频处理器270、音频处理器280、其他处理器253(例如：图形处理器(Graphics Processing Unit，GPU)、中央处理器254(CentralProcessing Unit，CPU)、通信接口(Communication Interface)，以及通信总线256(Bus)中的至少一种。其中，通信总线连接各个部件。

在一些实施例中，RAM 251用于存储操作系统或其他正在运行中的程序的临时数据。

在一些实施例中，ROM 252用于存储各种系统启动的指令。

在一些实施例中，ROM 252用于存储一个基本输入输出系统，称为基本输入输出系统(Basic Input Output System，BIOS)。用于完成对系统的加电自检、系统中各功能模块的初始化、系统的基本输入/输出的驱动程序及引导操作系统。

在一些实施例中，在收到开机信号时，显示设备200电源开始启动，CPU运行ROM252中系统启动指令，将存储在存储器的操作系统的临时数据拷贝至RAM 251中，以便于启动或运行操作系统。当操作系统启动完成后，CPU再将存储器中各种应用程序的临时数据拷贝至RAM 251中,然后，以便于启动或运行各种应用程序。

在一些实施例中，处理器254，用于执行存储在存储器中操作系统和应用程序指令。以及根据接收外部输入的各种交互指令，来执行各种应用程序、数据和内容，以便最终显示和播放各种音视频内容。

在一些示例性实施例中，处理器254，可以包括多个处理器。多个处理器可包括一个主处理器以及一个或多个子处理器。主处理器，用于在预加电模式中执行显示设备200一些操作，和/或在正常模式下显示画面的操作。一个或多个子处理器，用于在待机模式等状态下一种操作。

在一些实施例中，图形处理器253，用于产生各种图形对象，如：图标、操作菜单、以及用户输入指令显示图形等。包括运算器，通过接收用户输入各种交互指令进行运算，根据显示属性显示各种对象。以及包括渲染器，对基于运算器得到的各种对象，进行渲染，上述渲染后的对象用于显示在显示器上。

在一些实施例中，视频处理器270被配置为将接收外部视频信号，根据输入信号的标准编解码协议，进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等等视频处理，可得到直接可显示设备200上显示或播放的信号。

在一些实施例中，视频处理器270，包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等。

其中，解复用模块，用于对输入音视频数据流进行解复用处理，如输入MPEG-2,则解复用模块进行解复用成视频信号和音频信号等。

视频解码模块，则用于对解复用后的视频信号进行处理，包括解码和缩放处理等。

图像合成模块，如图像合成器，其用于将图形生成器根据用户输入或自身生成的GUI信号，与缩放处理后视频图像进行叠加混合处理，以生成可供显示的图像信号。

帧率转换模块，用于对转换输入视频帧率，如将60Hz帧率转换为120Hz帧率或240Hz帧率，通常的格式采用如插帧方式实现。

显示格式化模块，则用于将接收帧率转换后视频输出信号，改变信号以符合显示格式的信号，如输出RGB数据信号。

在一些实施例中，图形处理器253可以和视频处理器可以集成设置，也可以分开设置，集成设置的时候可以执行输出给显示器的图形信号的处理，分离设置的时候可以分别执行不同的功能，例如GPU+FRC(Frame Rate Conversion))架构。

在一些实施例中，音频处理器280，用于接收外部的音频信号，根据输入信号的标准编解码协议，进行解压缩和解码，以及降噪、数模转换、和放大处理等处理，得到可以在扬声器中播放的声音信号。

在一些实施例中，视频处理器270可以包括一颗或多颗芯片组成。音频处理器，也可以包括一颗或多颗芯片组成。

在一些实施例中，视频处理器270和音频处理器280，可以单独的芯片，也可以于控制器一起集成在一颗或多颗芯片中。

在一些实施例中，音频输出，在控制器250的控制下接收音频处理器280输出的声音信号，如：扬声器286，以及除了显示设备200自身携带的扬声器之外，可以输出至外接设备的发生装置的外接音响输出端子，如：外接音响接口或耳机接口等，还可以包括通信接口中的近距离通信模块，例如：用于进行蓝牙扬声器声音输出的蓝牙模块。

供电电源290，在控制器250控制下，将外部电源输入的电力为显示设备200提供电源供电支持。供电电源290可以包括安装显示设备200内部的内置电源电路，也可以是安装在显示设备200外部电源，在显示设备200中提供外接电源的电源接口。

用户接口265，用于接收用户的输入信号，然后，将接收用户输入信号发送给控制器250。用户输入信号可以是通过红外接收器接收的遥控器信号，可以通过网络通信模块接收各种用户控制信号。

在一些实施例中，用户通过控制装置100或移动终端300输入用户命令，用户输入接口则根据用户的输入，显示设备200则通过控制器250响应用户的输入。

在一些实施例中，用户可在显示器275上显示的图形用户界面(GUI)输入用户命令，则用户输入接口通过图形用户界面(GUI)接收用户输入命令。或者，用户可通过输入特定的声音或手势进行输入用户命令，则用户输入接口通过传感器识别出声音或手势，来接收用户输入命令。

在一些实施例中，“用户界面”，是应用程序或操作系统与用户之间进行交互和信息交换的介质接口，它实现信息的内部形式与用户可以接受形式之间的转换。用户界面常用的表现形式是图形用户界面(Graphic User Interface，GUI)，是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示器中显示的一个图标、窗口、控件等界面元素，其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素。

存储器260，包括存储用于驱动显示设备200的各种软件模块。如：第一存储器中存储的各种软件模块，包括：基础模块、检测模块、通信模块、显示控制模块、浏览器模块、和各种服务模块等中的至少一种。

基础模块用于显示设备200中各个硬件之间信号通信、并向上层模块发送处理和控制信号的底层软件模块。检测模块用于从各种传感器或用户输入接口中收集各种信息，并进行数模转换以及分析管理的管理模块。

例如，语音识别模块中包括语音解析模块和语音指令数据库模块。显示控制模块用于控制显示器进行显示图像内容的模块，可以用于播放多媒体图像内容和UI界面等信息。通信模块，用于与外部设备之间进行控制和数据通信的模块。浏览器模块，用于执行浏览服务器之间数据通信的模块。服务模块，用于提供各种服务以及各类应用程序在内的模块。同时，存储器260还用存储接收外部数据和用户数据、各种用户界面中各个项目的图像以及焦点对象的视觉效果图等。

图3示例性示出了根据示例性实施例中控制装置100的配置框图。如图3所示，控制装置100包括控制器110、通信接口130、用户输入/输出接口、存储器、供电电源。

控制装置100被配置为控制显示设备200，以及可接收用户的输入操作指令，且将操作指令转换为显示设备200可识别和响应的指令，起用用户与显示设备200之间交互中介作用。如：用户通过操作控制装置100上频道加减键，显示设备200响应频道加减的操作。

在一些实施例中，控制装置100可是一种智能设备。如：控制装置100可根据用户需求安装控制显示设备200的各种应用。

在一些实施例中，如图1所示，移动终端300或其他智能电子设备，可在安装操控显示设备200的应用之后，可以起到控制装置100类似功能。如：用户可以通过安装应用，在移动终端300或其他智能电子设备上可提供的图形用户界面的各种功能键或虚拟按钮，以实现控制装置100实体按键的功能。

控制器110包括处理器112和RAM 113和ROM 114、通信接口130以及通信总线。控制器用于控制控制装置100的运行和操作，以及内部各部件之间通信协作以及外部和内部的数据处理功能。

通信接口130在控制器110的控制下，实现与显示设备200之间控制信号和数据信号的通信。如：将接收到的用户输入信号发送至显示设备200上。通信接口130可包括WiFi芯片131、蓝牙模块132、NFC模块133等其他近场通信模块中至少之一种。

用户输入/输出接口140，其中，输入接口包括麦克风141、触摸板142、传感器143、按键144等其他输入接口中至少一者。如：用户可以通过语音、触摸、手势、按压等动作实现用户指令输入功能，输入接口通过将接收的模拟信号转换为数字信号，以及数字信号转换为相应指令信号，发送至显示设备200。

输出接口包括将接收的用户指令发送至显示设备200的接口。在一些实施例中，可以红外接口，也可以是射频接口。如：红外信号接口时，需要将用户输入指令按照红外控制协议转化为红外控制信号，经红外发送模块进行发送至显示设备200。再如：射频信号接口时，需将用户输入指令转化为数字信号，然后按照射频控制信号调制协议进行调制后，由射频发送端子发送至显示设备200。

在一些实施例中，控制装置100包括通信接口130和输入输出接口140中至少一者。控制装置100中配置通信接口130，如：WiFi、蓝牙、NFC等模块，可将用户输入指令通过WiFi协议、或蓝牙协议、或NFC协议编码，发送至显示设备200。

存储器190，用于在控制器的控制下存储驱动和控制控制装置100的各种运行程序、数据和应用。存储器190，可以存储用户输入的各类控制信号指令。

供电电源180，用于在控制器的控制下为控制装置100各元件提供运行电力支持。可以电池及相关控制电路。

在一些实施例中，系统可以包括内核(Kernel)、命令解析器(shell)、文件系统和应用程序。内核、shell和文件系统一起组成了基本的操作系统结构，它们让用户可以管理文件、运行程序并访问系统。上电后，内核启动，激活内核空间，抽象硬件、初始化硬件参数等，运行并维护虚拟内存、调度器、信号及进程间通信(IPC)。内核启动后，再加载Shell和用户应用程序。应用程序在启动后被编译成机器码，形成一个进程。

参见图4，在一些实施例中，将系统分为四层，从上至下分别为应用程序(Applications)层(简称“应用层”)，应用程序框架(Application Framework)层(简称“框架层”)，安卓运行时(Android runtime)和系统库层(简称“系统运行库层”)，以及内核层。

在一些实施例中，应用程序层中运行有至少一个应用程序，这些应用程序可以是操作系统自带的窗口(Window)程序、系统设置程序、时钟程序、相机应用等；也可以是第三方开发者所开发的应用程序，比如嗨见程序、K歌程序、魔镜程序等。在具体实施时，应用程序层中的应用程序包不限于以上举例，实际还可以包括其它应用程序包，本申请实施例对此不做限制。

框架层为应用程序层的应用程序提供应用编程接口(Aplication PogrammingIterface，API)和编程框架。应用程序框架层包括一些预先定义的函数。应用程序框架层相当于一个处理中心，这个中心决定让应用层中的应用程序做出动作。应用程序通过API接口，可在执行中访问系统中的资源和取得系统的服务。

如图4所示，本申请实施例中应用程序框架层包括管理器(Managers)、内容提供者(Content Provider)和视图系统(View System)等，其中管理器包括以下模块中的至少一个：活动管理器(Activity Manager)用与和系统中正在运行的所有活动进行交互；位置管理器(Location Manager)用于给系统服务或应用提供了系统位置服务的访问；文件包管理器(Package Manager)用于检索当前安装在设备上的应用程序包相关的各种信息；通知管理器(Notification Manager)用于控制通知消息的显示和清除；窗口管理器(WindowManager)用于管理用户界面上的括图标、窗口、工具栏、壁纸和桌面部件。

在一些实施例中，活动管理器用于：管理各个应用程序的生命周期以及通常的导航回退功能，比如控制应用程序的退出(包括将显示窗口中当前显示的用户界面切换到系统桌面)、打开、后退(包括将显示窗口中当前显示的用户界面切换到当前显示的用户界面的上一级用户界面)等。

在一些实施例中，窗口管理器用于管理所有的窗口程序，比如获取显示器大小，判断是否有状态栏，锁定屏幕，截取屏幕，控制显示窗口变化(例如将显示窗口缩小显示、抖动显示、扭曲变形显示等)等。

在一些实施例中，系统运行库层为上层即框架层提供支撑，当框架层被访问时，安卓操作系统会运行系统运行库层中包含的C/C++库以实现框架层要实现的功能。

在一些实施例中，内核层是硬件和软件之间的层。如图4所示，内核层至少包含以下驱动中的至少一种：音频驱动、显示驱动、蓝牙驱动、摄像头驱动、WIFI驱动、USB驱动、HDMI驱动、传感器驱动(如指纹传感器，温度传感器，触摸传感器、压力传感器等)等。

在一些实施例中，内核层还包括用于进行电源管理的电源驱动模块。

在一些实施例中，图4中的软件架构对应的软件程序和/或模块存储在图2或图3所示的第一存储器或第二存储器中。

在一些实施例中，以魔镜应用(拍照应用)为例，当遥控接收装置接收到遥控器输入操作，相应的硬件中断被发给内核层。内核层将输入操作加工成原始输入事件(包括输入操作的值，输入操作的时间戳等信息)。原始输入事件被存储在内核层。应用程序框架层从内核层获取原始输入事件，根据焦点当前的位置识别该输入事件所对应的控件以及以该输入操作是确认操作，该确认操作所对应的控件为魔镜应用图标的控件，魔镜应用调用应用框架层的接口，启动魔镜应用，进而通过调用内核层启动摄像头驱动，实现通过摄像头捕获静态图像或视频。

在一些实施例中，对于具备触控功能的显示设备，以分屏操作为例，显示设备接收用户作用于显示器上的输入操作(如分屏操作)，内核层可以根据输入操作产生相应的输入事件，并向应用程序框架层上报该事件。由应用程序框架层的活动管理器设置与该输入操作对应的窗口模式(如多窗口模式)以及窗口位置和大小等。应用程序框架层的窗口管理根据活动管理器的设置绘制窗口，然后将绘制的窗口数据发送给内核层的显示驱动，由显示驱动在显示器的不同显示区域显示与之对应的应用界面。

在一些实施例中，如图5中所示，应用程序层包含至少一个应用程序可以在显示器中显示对应的图标控件，如：直播电视应用程序图标控件、视频点播(Video On Demand，VOD)应用程序图标控件、媒体中心应用程序图标控件、应用程序中心图标控件、游戏应用图标控件等。

在一些实施例中，直播电视应用程序，可以通过不同的信号源提供直播电视。例如，直播电视应用程可以访问来自有线电视、无线广播、卫星服务或其他类型的直播电视服务的输入提供电视信号。以及，直播电视应用程序可在显示设备200上显示直播电视信号的视频。

在一些实施例中，视频点播应用程序，可以提供来自不同存储源的视频。不同于直播电视应用程序，视频点播提供来自某些存储源的视频显示。例如，视频点播可以来自云存储的服务器端、来自包含已存视频节目的本地硬盘储存器。

在一些实施例中，媒体中心应用程序，可以提供各种多媒体内容播放的应用程序。例如，媒体中心，可以为不同于直播电视或视频点播，用户可通过媒体中心应用程序访问各种图像或音频所提供服务。

在一些实施例中，应用程序中心，可以提供储存各种应用程序。应用程序可以是一种游戏、应用程序，或某些和计算机系统或其他设备相关但可以在智能电视中运行的其他应用程序。应用程序中心可从不同来源获得这些应用程序，将它们储存在本地储存器中，然后在显示设备200上可运行。

以上实施例提供了智能电视的硬件/软件架构以及功能实现等内容，在一些实施例中，显示设备还应具有文本接口，文本接口用于获取需要进行NER的文本信息，并将本文信息发送给控制器250，由控制器250执行和控制NER的实体标注方法，比如对于开放域问答，文本接口可以具体为声音采集接口，采集用户语音提出的问题，这时文本信息为语音形式的语料信息，或者，文本接口可以是用户接口265，通过用户接口265接收用户手动输入的问题等。在一些实施例中，文本接口可以连接数据源或者数据库，从而获取数据源和数据库中记录的文本信息，文本接口的形式以及文本信息的来源不做限定，具体以适应于实际应用场景为准。对于其他类型的智能设备，至少包括文本接口、执行NER任务和本申请实际标注方法的控制器，智能设备中包括的其他硬件/软件结构不限定。

本申请的方案背景是基于知识图谱的深度学习，因此需要在智能设备中预先构建知识图谱，知识图谱中会记录有命名实体和实体类别等相关的实体数据，以便后续根据知识图谱构建语义索引模型、词义分类模型，以及结合知识图谱的实体链接进行的标注约束。知识图谱构建和文本中实体识别的方法可以参照相关现有技术，本申请不再赘述。

在一些实施例中，如图6所示，提供一种命名实体识别中的实体标注方法，所述方法是在实体边界识别之后，即识别出目标实体之后由控制器250执行的，因此控制器250为本方法的执行主体，所述方法包括：

步骤S10，在识别文本中的目标实体后，将所述目标实体输入至联合模型；所述联合模型包括用于相似度查询的语义索引模型以及词义分类模型。

步骤S10是实体标注的前处理过程，涉及到两方面，一方面是由语义索引模型进行词义相似度查询，另一方面是由词义分类模型对语义索引模型的查询结果进行计算处理，从而得到联合模型的最终输出结果。

在一些实施例中，图7示出了构建和训练词义分类模型的流程，以知识图谱中的实体数据作为训练样本的来源，词义分类模型的架构包括输入层(Input)、Embedding(嵌入)层、LSTM(Long Short-Term Memory，长短期记忆网络)层和基于Softmax的输出层(Output)。

输入层将从知识图谱中采集的实体数据作为训练样本，然后从训练样本中获取训练集，按照预设比例(比如是6:2:2)将训练样本拆分为训练集、验证集和测试集，然后将训练集传输到Embedding层；Embedding层是对训练集中的实体词进行嵌入处理，就是把X所属空间的实体词映射为Y空间的低维向量，该低维向量相当于嵌入到Y空间中，从而可以用一个低维向量来表达一个实体词，Embedding能够用低维向量对实体词进行编码且能保留其词义，因而非常适合深度学习；经过Embedding层处理后的数据进入LSTM层，对词义分类模型进行训练，之后通过Softmax输出结果，Softmax中可以计算每个词及其词义类别被取到的概率，并根据概率值进行排序，然后根据实际需求输出相应的结果，训练完成后保存词义分类模型即可。

影响LSTM神经网络性能的参数包括普通参数(比如权重和偏置等)，以及超参数(比如网络层数、每层神经网络的神经元个数和学习率等)，普通参数可以通过训练集进行训练，模型训练完成后，可以进一步通过验证集对模型的超参数进行验证和调优。测试集用于对训练完成的LSTM神经网络进行性能评价，测试集、验证集和训练集之间也是独立不重叠的，测试集不能提出对普通参数或者超参数的修改意见，只能作为评价网络性能的一个指标。Embedding、LSTM和Softmax的原理和具体实现等相关内容可以参照现有技术，本实施例不再赘述。

在一些实施例中，图8示出了语义索引模型的构建方式，根据知识图谱中的实体数据，并结合AI Lab词向量数据库，比如腾讯AI Lab词向量，然后利用Annoy算法构建语义索引模型，语义索引模型均有若干二叉树的数据结构，能够在较短时间内找到任何查询点附近若干数量的最近点，具有较高的查询效率。当识别出文本中的目标实体后，可以调用语义索引模型，将目标实体输入到语义索引模型中，由于语义索引模型是基于腾讯AI Lab词向量构建生成，因此查询到与目标实体具有不同词义相似度的多个相似词，并根据实际需求定义语义索引模型的输出，比如期望语义索引模型输出M个相似词，则可以根据词义相似度对检索到的相似词进行排序，然后输出词义相似度最高的M个目标词语，即word₁、word₂…word_M，以及M个目标词语分别对应的词义类别。Annoy算法的相关内容可参照现有技术，本实施例不再赘述。

在一些实施例中，图9示出了实体标注的处理逻辑，其中，联合模型被配置为：在语义索引模型中查询与目标实体的词义相似度最高的M个目标词语及其词义类别；将M个目标词语及其词义类别，以及所述目标实体输入至所述词义分类模型进行处理，并输出第一集合，所述第一集合包括所述词义分类模型的计算结果中概率排序最高的T个词语及其词义类别。

在利用知识图谱中的实体数据分别构建语义索引模型以及训练词义分类模型之后，即可利用联合模型进行实体标注的前处理过程，具体来说，先将识别出的目标实体输入到语义索引模型中，利用语义索引模型查询与目标实体具有不同词义相似度的多个相似词，并根据词义相似度对这些相似词进行排序，然后输出词义相似度最高的M个(即top M)目标词语及其词义类别，这一步是利用语义索引模型初步筛选出目标实体的top M个相似词及其词义类别。比如，语义索引模型如果按照词义相似度从大到小(递减)排序相似词，则是输出排序在前M位的相似词；如果是按照词义相似度从小到大(递增)排序，则是输出排序在后M位的相似词。

接下来，利用词义分类模型的LSTM对top M个相似词及其词义类别进一步筛选，通过联合模型的两次筛选，可以提高实体标注的准确性以及标注结果的可靠性。将top M个相似词及其词义类别与目标实体结合，一并输入到词义分类模型的输入层，然后经Embedding层处理后，进入LSTM层进行计算，LSTM层将计算结果输入到Softmax，由Softmax计算LSTM层的计算结果中每个词及其词义类别被取到的概率，并根据概率值进行排序，最终输出第一集合，第一集合包括概率排序最高的T个(即top T)词语及其词义类别。比如，Softmax中按照概率值从大到小(递减)排序，则第一集合包括排序在前T位的词语及其对应的词义类别；若Softmax中按照概率值从小到大(递增)排序，则第一集合包括排序在后T位的词语及其对应的词义类别。第一集合是有序的词语集合。

步骤S20，根据约束函数，对所述联合模型输出的词义类别和知识图谱的实体链接进行约束后，确定所述目标实体的高频词义类别并进行标注。

步骤S20是实体标注的后处理过程，通过约束函数，结合知识图谱的实体链接，实现对联合模型输出结果的限制约束，以精准确定目标实体的高频词义类别的范围，从而解决实体标注结果不可控的问题，降低实体标注结果的偏差，进而提高命名实体识别的准确性。

在一些实施例中，根据目标实体在知识图谱中进行实体链接(Entity Linking)，就是将一段文本中的命名实体映射到知识图谱中对应的实体上，比如对于文本“B公司研发了新型的AI音响”，则可将“B公司”和“AI音响”分别映射到知识图谱中各自对应的实体上。由于存在同名异实体和同实体异名的情况，因此在映射过程中需要进行消歧处理，比如对于文本“我正在读《哈利波特》”，显然“哈利波特”应当指的是同名书籍的实体，而不是《哈利波特》系列电影的实体。

实体链接一般包括指称识别和实体消歧两个环节，经这两个环节处理后，可生成候选实体集合，并按照实体被取得的概率，对候选实体集合中各实体进行排序，并将概率排序最高的J个(即top J)候选实体及其词义类别按序组成第二集合，即第二集合是有序的实体集合，并且第二集合是候选实体集合的子集。如果候选实体集合是按照概率值从大到小(递减)排序，则第二集合包括排序在前J位的候选实体及其词义类别；如果候选实体集合是按照概率值从小到大(递增)排序，则第二集合包括排序在后J位的候选实体及其词义类别。有关实体链接更具体的细节内容可以参照现有技术，本申请实施例不再赘述。

在获得第二集合后，根据约束函数、第一集合和第二集合，筛选出约束函数值满足阈值条件的F个高频词义类别，这种实体标注的约束方式，可以筛选出目标实体的高频词义类别，而过滤掉偏差较大的词义类别，从而降低实体标注的不可控性，提高实体标注和NER的准确性。

在一些实施例中，第二集合set(link)＝{a₁，a₂，…，a_i，…，a_J}，其中a_i表示第二集合中排序在第i位的候选实体的词义类别；第一集合set(model)＝{b₁，b₂，…，b_k，…，b_T}，其中b_k表示第一集合中排序在第j位的词语对应的词义类别。则所述约束函数可以表示为：

cost＝e^pα

其中，

上式中，cost表示约束函数；e为自然常数；α为约束项，i表示第二集合中各词义类别的排序序号，1≤i≤J；k表示第一集合中各词义类别的排序序号，1≤k≤T；p为惩罚项，p＝-|T+J|，J表示第二集合包括的词义类别的数量，T表示第一集合包括的词义类别的数量，J大于或等于T。

比如，词义类别C在第一集合和第二集合中同时存在，词义类别C在第一集合中的排序序号为2，词义类别C在第二集合中的排序序号为4，则词义类别C对应的约束函数值为e²；又比如，词义类别D在第二集合中存在，并且在第二集合中的排序序号为5，但是词义类别D不存在于第一集合中，则词义类别D对应的约束函数值为e⁵。

上述公式具有的规律是，实体链接和联合模型的有序集合差异越大，约束函数值越小，因此可以根据对实体标注可控性的具体要求，设定合适的阈值条件，从而根据阈值条件去筛选出目标实体的top F个高频词义类别，然后根据最终获得的top F个高频词义类别去标注目标实体的词义类别，从而完成实体标注，本申请方案能降低实体标注的偏差和不可控性。所述阈值条件不作具体限定。在实际应用过程中，可以设定专门的接口以供用户对阈值条件进行调整，从而适应不同的实体标注需求以及不同的应用场景。

本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。具体实现中，本发明还提供一种计算机存储介质，其中，该计算机存储介质可存储有程序，当计算机存储介质位于智能设备中时，该程序执行时可包括控制器被配置的实体标注方法中涉及的全部程序步骤。其中，计算机存储介质可为磁碟、光盘、只读存储记忆体(英文：read-only memory，简称：ROM)或随机存储记忆体(英文：random access memory，简称：RAM)等。

本说明书中显示设备实施例和方法实施例之间相同相似的部分互相参照即可，相关内容不再赘述。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，并不构成对本发明保护范围的限定。本发明的真正范围和精神由所附的权利要求指出。

Claims

1.一种命名实体识别中的实体标注方法，其特征在于，包括：

在识别文本中的目标实体后，将所述目标实体输入至联合模型；所述联合模型包括用于相似度查询的语义索引模型以及词义分类模型；所述联合模型被配置为：在所述语义索引模型中查询与所述目标实体的词义相似度最高的M个目标词语及其词义类别；将M个目标词语及其词义类别，以及所述目标实体输入至所述词义分类模型进行处理，并输出第一集合，所述第一集合包括所述词义分类模型的计算结果中概率排序最高的T个词语及其词义类别；

根据约束函数，对所述联合模型输出的词义类别和知识图谱的实体链接进行约束后，确定所述目标实体的高频词义类别并进行标注；

其中，所述对所述联合模型输出的词义类别和知识图谱的实体链接进行约束，包括：

根据所述目标实体在所述知识图谱中进行实体链接，得到候选实体集合；

接收所述实体链接反馈的第二集合，所述第二集合包括所述候选实体集合中概率排序最高的J个候选实体及其词义类别；

根据约束函数、所述第一集合和所述第二集合，筛选出约束函数值满足阈值条件的F个高频词义类别；

其中，所述约束函数表示为：

cost＝e^pα

其中，

式中，cost表示约束函数；e为自然常数；α为约束项，i表示第二集合中各词义类别的排序序号，1≤i≤J；k表示第一集合中各词义类别的排序序号，1≤k≤T；p为惩罚项，p＝-|T+J|，J表示所述第二集合包括的词义类别的数量，T表示所述第一集合包括的词义类别的数量。

2.根据权利要求1所述的方法，其特征在于，按照如下方式构建所述语义索引模型：

根据所述知识图谱中的实体数据以及AI Lab词向量数据库，利用Annoy算法构建并保存具有若干二叉树数据结构的语义索引模型。

3.根据权利要求1所述的方法，其特征在于，按照如下方式构建所述词义分类模型：

将从所述知识图谱中采集的实体数据作为训练样本；

从所述训练样本中获取训练集，将所述训练集输入到Embedding层处理，然后利用长短期记忆网络算法训练模型，并由Softmax输出结果后，得到训练后的词义分类模型。

4.一种智能设备，其特征在于，包括：

文本接口，用于获取待命名实体识别的文本；

控制器，被配置为执行：

其中，所述约束函数表示为：

cost＝e^pα

其中，

5.根据权利要求4所述的智能设备，其特征在于，所述控制器按照如下方式构建所述语义索引模型：

6.根据权利要求4所述的的智能设备，其特征在于，所述控制器按照如下方式构建所述词义分类模型：

将从所述知识图谱中采集的实体数据作为训练样本；