CN111062213B - 命名实体识别方法、装置、设备及介质 - Google Patents
命名实体识别方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN111062213B CN111062213B CN201911152088.8A CN201911152088A CN111062213B CN 111062213 B CN111062213 B CN 111062213B CN 201911152088 A CN201911152088 A CN 201911152088A CN 111062213 B CN111062213 B CN 111062213B
- Authority
- CN
- China
- Prior art keywords
- theme
- topic
- natural language
- phrase
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了命名实体识别方法、装置、设备及介质,识别方法包括采集一句自然语言数据;识别自然语言数据中的主题,若识别出主题,则将识别出的主题存储至主题库;对自然语言数据进行命名实体识别处理,若该句自然语言数据中的一个词组或单字被识别为多于一个的实体类别时,则依据主题库中至少一个主题确定该词组或单字的唯一实体类别。本发明其通过识别当前对话主题,来实现消除命名实体真歧义的问题。
Description
技术领域
本发明属于自然语言处理中的命名实体识别技术领域,尤其涉及一种命名实体识别方法、装置、设备及介质。
背景技术
命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。在对话系统中,用户的句子通常不会很长,所以在我们进行命名实体识别的时候,单从当前的句子中是无法对一些有真歧义的专有词识别其类型的,比如有一首歌曲叫天下无双,同时有一个电影也叫天下无双,所以当一个句子是:“天下无双”时,这里的“天下无双”是标注成音乐还是电影呢,如果从单句子看,标成哪一种类型都是对的,这个就是有真歧义的,目前是没有技术来解决的。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种命名实体识别方法、装置、设备及介质,通过识别当前对话主题,来实现消除命名实体真歧义的问题。
为解决上述技术问题,本发明第一方面公开了一种命名实体识别方法,包括以下步骤:
步骤一、采集一句自然语言数据;
步骤二、识别自然语言数据中的主题,若识别出主题,则将识别出的主题存储至主题库;
步骤三、对自然语言数据进行命名实体识别处理,若该句自然语言数据中的一个词组或单字被识别为多于一个的实体类别时,则依据主题库中至少一个主题确定该词组或单字的唯一实体类别。
进一步地,步骤二中识别自然语言数据中的主题存储至主题库包括以下步骤:
步骤201、将自然语言数据转换为文本数据;
步骤202、判断文本数据是否具有主题,若是,则输出主题存储至主题库。
进一步地,步骤202判断文本数据是否具有主题时,包括以下步骤:将文本数据输入主题识别器,主题识别器包括一个或多个Binary分类器,每个Binary分类器分别对应一个主题,Binary分类器对文本数据进行判断时,若Binary分类器输出为True,则输出Binary分类器对应的主题。
进一步地,依据主题库中至少一个主题确定该词组或单字的唯一实体类别时,包括以下步骤:
步骤301:提取主题库中最近存储的一个主题;
步骤302:依据提取的主题确定该词组或单字的唯一实体类别,若可以确定该词组或单字的唯一实体类别,则输出确定的唯一实体类别;若无法确定该词组或单字的唯一实体类别,则进入步骤303;
步骤303:判断主题库中是否有当前主题的上一个主题,若是,进入步骤304,若否,进入步骤305;
步骤304:提取主题库中当前主题的上一个主题,然后执行步骤302;
步骤305:任选当前词组或单字的一个实体类别作为唯一实体类别。
本发明第二方面公开了一种命名实体识别装置,包括:
自然语言数据采集模块,用于采集自然语言数据;
自然语言数据主题识别模块,配置为识别自然语言数据中的主题,若识别出主题,则将识别出的主题存储至主题库;
命名实体识别模块,配置为对自然语言数据进行命名实体识别处理,若该句自然语言数据中的一个词组或单字被识别为多于一个的实体类别时,则依据主题库中至少一个主题确定该词组或单字的唯一实体类别。
进一步地,自然语言数据主题识别模块包括:
数据转化单元,配置为将自然语言数据转换为文本数据;
主题识别器,配置为判断文本数据是否具有主题,若是,则输出主题存储至主题库。
进一步地,主题识别器包括一个或多个Binary分类器,每个Binary分类器分别对应一个主题,Binary分类器对文本数据进行判断时,若Binary分类器输出为True,则输出Binary分类器对应的主题。
进一步地,命名实体识别模块包括消歧判定器,所述消歧判定器被配置为在依据主题库中至少一个主题确定该词组或单字的唯一实体类别时,执行以下步骤:
步骤301:提取主题库中最近存储的一个主题;
步骤302:依据提取的主题确定该词组或单字的唯一实体类别,若可以确定该词组或单字的唯一实体类别,则输出确定的唯一实体类别;若无法确定该词组或单字的唯一实体类别,则进入步骤303;
步骤303:判断主题库中是否有当前主题的上一个主题,若是,进入步骤304,若否,进入步骤305;
步骤304:提取主题库中当前主题的上一个主题,然后执行步骤302;
步骤305:任选当前词组或单字的一个实体类别作为唯一实体类别。
本发明第三方面公开了一种命名实体识别设备,其中所述设备包括自然语言数据采集装置、处理器和存储器,所述存储器包含一组指令,所述一组指令在由所述处理器执行时使所述命名实体识别设备执行如第一方面公开的命名实体识别方法。
本发明第四方面公开了一种计算机可读存储介质,其上存储有计算机可读的指令,当利用计算机执行所述指令时执行如第一方面公开的命名实体识别方法。
本发明与现有技术相比具有以下优点:本发明通过识别当前对话主题,在遇到一个词组或单字被识别为多于一个的实体类别时,可以依据主题库中至少一个主题确定该词组或单字的唯一实体类别。相比现有技术中基于单句子的命名实体识别的方法,本发明实现了消除命名实体真歧义的问题。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为命名实体识别方法的步骤流程图。
图2为识别自然语言数据中的主题存储至主题库的步骤流程图。
图3为依据主题确定该词组或单字的唯一实体类别时的步骤流程图。
图4为命名实体识别装置的电路原理图。
具体实施方式
实施例1
如图1所示,一种命名实体识别方法,包括以下步骤:
步骤一、采集一句自然语言数据;自然语言数据应当理解为对话中产生的数据,其可以是一段语音数据,也可以是一段文本数据;
步骤二、识别自然语言数据中的主题,若识别出主题,则将识别出的主题存储至主题库;此处所述主题指谈话时的谈论对象,例如采集到一句“最近喜欢听什么音乐”的自然语言数据,该自然语言数据中的主题为“音乐”,并且此处识别的主题属于命名实体识别中的实体类别;
步骤三、对自然语言数据进行命名实体识别处理,若该句自然语言数据中的一个词组或单字被识别为多于一个的实体类别时,则依据主题库中至少一个主题确定该词组或单字的唯一实体类别;现有的命名实体识别技术中,当识别出一个词组或单字的实体类别多于一个时,会任选一个实体类别,例如在对一句“天下无双怎么样”的自然语言数据进行命名实体识别处理时,识别出“天下无双”该词组的实体类别包括音乐和电影,此时若无根据,直接选择音乐或电影作为实体类别,则极易出错;而本发明公开的命名实体识别方法在遇到如识别出“天下无双”该词组的实体类别包括音乐和电影时,自主题库中提取至少一个主题确定该词组的唯一实体类别,例如当提取出的主题为“音乐”时,则可将“音乐”作为“天下无双”该词组的唯一实体类别。
命名实体识别可以通过一组序列标柱模型完成,每个序列标柱模型负责识别一种或多种实体类型,当一个词被识别为多于一个的实体类别时,自主题库中提取至少一个主题确定该词组的唯一实体类别。
如图2所示,本实施例步骤二中,识别自然语言数据中的主题存储至主题库包括以下步骤:步骤201、将自然语言数据转换为文本数据;此处假设自然语言数据为语音数据,则采用语音识别技术将语音数据转换为文本数据;例如对一句“天下无双怎么样”的自然语言数据进行语音识别,识别出“天下无双怎么样”七个字的文本数据,语音识别技术为现有成熟技术,此处不在赘述其原理;若自然语言数据本身为文本数据则不需要转换。
步骤202、判断文本数据是否具有主题,若是,则输出主题存储至主题库。
本实施例步骤202判断文本数据是否具有主题时,包括以下步骤:将文本数据输入主题识别器,主题识别器包括一个或多个Binary分类器,每个Binary分类器分别对应一个主题,Binary分类器对文本数据进行判断时,若Binary分类器输出为True,则输出Binary分类器对应的主题。Binary分类器由监督的机器学习算法(如SVM、Naive Bayes、CNN等)模型实现。Binary分类器对应的主题均为预设的主题。
如图3所示,本实施例步骤三中,依据主题库中至少一个主题确定该词组或单字的唯一实体类别时,包括以下步骤:
步骤301:提取主题库中最近存储的一个主题;主题库中存储的多个主题按时间顺序存储,此处所述最近存储的一个主题为截止提取操作前主题库中最后存入的一个主题;
步骤302:依据提取的主题确定该词组或单字的唯一实体类别,若可以确定该词组或单字的唯一实体类别,则输出确定的唯一实体类别;若无法确定该词组或单字的唯一实体类别,则进入步骤303;
步骤303:判断主题库中是否有当前主题的上一个主题,若是,进入步骤304,若否,进入步骤305;
步骤304:提取主题库中当前主题的上一个主题,然后执行步骤302;
步骤305:任选当前词组或单字的一个实体类别作为唯一实体类别。
实施例2
如图4所示,命名实体识别装置,包括:
自然语言数据采集模块,用于采集自然语言数据;
自然语言数据主题识别模块,配置为识别自然语言数据中的主题,若识别出主题,则将识别出的主题存储至主题库;例如采集到一句“最近喜欢听什么音乐”的自然语言数据,该自然语言数据中的主题为“音乐”,并且此处识别的主题属于命名实体识别中的实体类别;
命名实体识别模块,配置为对自然语言数据进行命名实体识别处理,若该句自然语言数据中的一个词组或单字被识别为多于一个的实体类别时,则依据主题库中至少一个主题确定该词组或单字的唯一实体类别;现有的命名实体识别技术中,当识别出一个词组或单字的实体类别多于一个时,会任选一个实体类别,例如在对一句“天下无双怎么样”的自然语言数据进行命名实体识别处理时,识别出“天下无双”该词组的实体类别包括音乐和电影,此时若无根据选择音乐或电影作为实体类别,则极易出错;而本发明公开的命名实体识别方法在遇到如识别出“天下无双”该词组的实体类别包括音乐和电影时,自主题库中提取至少一个主题确定该词组的唯一实体类别,例如当提取出的主题为“音乐”时,则可将“音乐”作为“天下无双”该词组的唯一实体类别。
命名实体识别模块由一组序列标柱模型和一个消歧判定器组成,每个序列标柱模型负责识别一种或多种实体类型,当一个词被识别为多于一个的实体类别时,由消歧判定器根据主题来决定应该是哪个实体类别。
本实施例中,自然语言数据主题识别模块包括:
数据转化单元,配置为将自然语言数据转换为文本数据;自然语言数据可以是语音数据,也可以是文本数据,还可以为其他类型的数据,此处假设自然语言数据为语音数据,则采用语音识别技术,将语音数据转换为文本数据,例如对一句“天下无双怎么样”的自然语言数据进行语音识别,识别出“天下无双怎么样”七个字的文本数据,语音识别技术为现有成熟技术,此处不在赘述其原理;
主题识别器,配置为判断文本数据是否具有主题,若是,则输出主题存储至主题库。
本实施例中,主题识别器包括一个或多个Binary分类器,每个Binary分类器分别对应一个主题,Binary分类器对文本数据进行判断时,若Binary分类器输出为True,则输出Binary分类器对应的主题。Binary分类器有监督的机器学习算法(如SVM、Naive Bayes、CNN等)模型实现。Binary分类器对应的主题均为预设的主题。
本实施例中,所述消歧判定器被配置为在依据主题库中至少一个主题确定该词组或单字的唯一实体类别时,执行以下步骤:
步骤301:提取主题库中最近存储的一个主题;主题库中存储的多个主题按时间顺序存储,此处所述最近存储的一个主题为截止提取操作前主题库中最后存入的一个主题;
步骤302:依据提取的主题确定该词组或单字的唯一实体类别,若可以确定该词组或单字的唯一实体类别,则输出确定的唯一实体类别;若无法确定该词组或单字的唯一实体类别,则进入步骤303;
步骤303:判断主题库中是否有当前主题的上一个主题,若是,进入步骤304,若否,进入步骤305;
步骤304:提取主题库中当前主题的上一个主题,然后执行步骤302;
步骤305:任选当前词组或单字的一个实体类别作为唯一实体类别。
实施例3
一种命名实体识别设备,其中所述设备包括自然语言数据采集装置和一个或多个专用或通用的计算机处理系统模块或部件;一个或多个专用或通用的计算机处理系统模块或部件其可以包括至少一个处理器及存储器。所述存储器包含一组指令,所述一组指令在由所述处理器执行时使所述命名实体识别设备执行上述实施例1中所述的方法。
本实施例中,自然语言数据采集装置为语音采集装置,例如麦克风组件,其可包括麦克风、麦克风套管、安装杆、连接线等;其也可为无线麦克风或麦克风电路。一个或多个专用或通用的计算机处理系统模块或部件可以是例如个人电脑、笔记本电脑、平板电脑、手机、个人数码助理(personaldigital assistance,PDA)、智能眼镜、智能手表、智能指环、智能头盔及任何智能便携设备。
实施例4
一种计算机可读存储介质,其上存储有计算机可读的指令,当利用计算机执行所述指令时执行上述实施例1中所述的方法。
以上所述,仅是本发明的较佳实施例,并非对本发明作任何限制,凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效结构变化,均仍属于本发明技术方案的保护范围内。
Claims (8)
1.命名实体识别方法,其特征在于:包括以下步骤:
采集一句自然语言数据;
识别自然语言数据中的主题,若识别出主题,则将识别出的主题存储至主题库;
对自然语言数据进行命名实体识别处理,若该句自然语言数据中的一个词组或单字被识别为多于一个的实体类别时,则依据主题库中至少一个主题确定该词组或单字的唯一实体类别;
依据主题库中至少一个主题确定该词组或单字的唯一实体类别时,包括以下步骤:
步骤301:提取主题库中最近存储的一个主题;所述最近存储的一个主题为截止提取操作前主题库中最后存入的一个主题;
步骤302:依据提取的主题确定该词组或单字的唯一实体类别,若可以确定该词组或单字的唯一实体类别,则输出确定的唯一实体类别;若无法确定该词组或单字的唯一实体类别,则进入步骤303;
步骤303:判断主题库中是否有当前主题的上一个主题,若是,进入步骤304,若否,进入步骤305;
步骤304:提取主题库中当前主题的上一个主题,然后执行步骤302;
步骤305:任选当前词组或单字的一个实体类别作为唯一实体类别。
2.按照权利要求1所述的命名实体识别方法,其特征在于:识别自然语言数据中的主题存储至主题库包括以下步骤:
步骤201、将自然语言数据转换为文本数据;
步骤202、判断文本数据是否具有主题,若是,则输出主题存储至主题库。
3.按照权利要求2所述的命名实体识别方法,其特征在于:步骤202判断文本数据是否具有主题时,包括以下步骤:将文本数据输入主题识别器,主题识别器包括一个或多个Binary分类器,每个Binary分类器分别对应一个主题,Binary分类器对文本数据进行判断时,若Binary分类器输出为True,则输出Binary分类器对应的主题。
4.命名实体识别装置,包括:
自然语言数据采集模块,用于采集自然语言数据;
自然语言数据主题识别模块,配置为识别自然语言数据中的主题,若识别出主题,则将识别出的主题存储至主题库;
命名实体识别模块,配置为对自然语言数据进行命名实体识别处理,若自然语言数据中的一个词组或单字被识别为多于一个的实体类别时,则依据主题库中至少一个主题确定该词组或单字的唯一实体类别;
命名实体识别模块包括消歧判定器,所述消歧判定器被配置为在依据主题库中至少一个主题确定该词组或单字的唯一实体类别时,执行以下步骤:
步骤301:提取主题库中最近存储的一个主题;所述最近存储的一个主题为截止提取操作前主题库中最后存入的一个主题;
步骤302:依据提取的主题确定该词组或单字的唯一实体类别,若可以确定该词组或单字的唯一实体类别,则输出确定的唯一实体类别;若无法确定该词组或单字的唯一实体类别,则进入步骤303;
步骤303:判断主题库中是否有当前主题的上一个主题,若是,进入步骤304,若否,进入步骤305;
步骤304:提取主题库中当前主题的上一个主题,然后执行步骤302;
步骤305:任选当前词组或单字的一个实体类别作为唯一实体类别。
5.按照权利要求4所述的命名实体识别装置,其特征在于:自然语言数据主题识别模块包括:
数据转化单元,配置为将自然语言数据转换为文本数据;
主题识别器,配置为判断文本数据是否具有主题,若是,则输出主题存储至主题库。
6.按照权利要求5所述的命名实体识别装置,其特征在于:主题识别器包括一个或多个Binary分类器,每个Binary分类器分别对应一个主题,Binary分类器对文本数据进行判断时,若Binary分类器输出为True,则输出Binary分类器对应的主题。
7.一种命名实体识别设备,其中所述设备包括自然语言数据采集装置、处理器和存储器,所述存储器包含一组指令,所述一组指令在由所述处理器执行时使所述命名实体识别设备执行上述权利要求1-3中任意一项权利要求所述的方法。
8.一种计算机可读存储介质,其特征在于,其上存储有计算机可读的指令,当利用计算机执行所述指令时执行上述权利要求1-3中任意一项权利要求所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911152088.8A CN111062213B (zh) | 2019-11-19 | 2019-11-19 | 命名实体识别方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911152088.8A CN111062213B (zh) | 2019-11-19 | 2019-11-19 | 命名实体识别方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111062213A CN111062213A (zh) | 2020-04-24 |
CN111062213B true CN111062213B (zh) | 2024-01-12 |
Family
ID=70298140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911152088.8A Active CN111062213B (zh) | 2019-11-19 | 2019-11-19 | 命名实体识别方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111062213B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015080558A1 (en) * | 2013-11-27 | 2015-06-04 | Mimos Berhad | A method and system for automated entity recognition |
CN105138515A (zh) * | 2015-09-02 | 2015-12-09 | 百度在线网络技术(北京)有限公司 | 命名实体识别方法和装置 |
WO2016173326A1 (zh) * | 2015-04-30 | 2016-11-03 | 北京贝虎机器人技术有限公司 | 基于主题的交互系统及方法 |
CN106202050A (zh) * | 2016-07-18 | 2016-12-07 | 东软集团股份有限公司 | 主题信息获取方法、装置和电子设备 |
CN108875067A (zh) * | 2018-06-29 | 2018-11-23 | 北京百度网讯科技有限公司 | 文本数据分类方法、装置、设备及存储介质 |
CN108920445A (zh) * | 2018-04-23 | 2018-11-30 | 华中科技大学鄂州工业技术研究院 | 一种基于Bi-LSTM-CRF模型的命名实体识别方法和装置 |
CN108986797A (zh) * | 2018-08-06 | 2018-12-11 | 中国科学技术大学 | 一种语音主题识别方法及系统 |
CN109446336A (zh) * | 2018-09-18 | 2019-03-08 | 平安科技(深圳)有限公司 | 新闻筛选的方法、装置、计算机设备和存储介质 |
CN109902307A (zh) * | 2019-03-15 | 2019-06-18 | 北京金山数字娱乐科技有限公司 | 命名实体识别方法、命名实体识别模型的训练方法及装置 |
CN110414006A (zh) * | 2019-07-31 | 2019-11-05 | 京东方科技集团股份有限公司 | 文本的主题标注方法、装置、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9971763B2 (en) * | 2014-04-08 | 2018-05-15 | Microsoft Technology Licensing, Llc | Named entity recognition |
-
2019
- 2019-11-19 CN CN201911152088.8A patent/CN111062213B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015080558A1 (en) * | 2013-11-27 | 2015-06-04 | Mimos Berhad | A method and system for automated entity recognition |
WO2016173326A1 (zh) * | 2015-04-30 | 2016-11-03 | 北京贝虎机器人技术有限公司 | 基于主题的交互系统及方法 |
CN105138515A (zh) * | 2015-09-02 | 2015-12-09 | 百度在线网络技术(北京)有限公司 | 命名实体识别方法和装置 |
CN106202050A (zh) * | 2016-07-18 | 2016-12-07 | 东软集团股份有限公司 | 主题信息获取方法、装置和电子设备 |
CN108920445A (zh) * | 2018-04-23 | 2018-11-30 | 华中科技大学鄂州工业技术研究院 | 一种基于Bi-LSTM-CRF模型的命名实体识别方法和装置 |
CN108875067A (zh) * | 2018-06-29 | 2018-11-23 | 北京百度网讯科技有限公司 | 文本数据分类方法、装置、设备及存储介质 |
CN108986797A (zh) * | 2018-08-06 | 2018-12-11 | 中国科学技术大学 | 一种语音主题识别方法及系统 |
CN109446336A (zh) * | 2018-09-18 | 2019-03-08 | 平安科技(深圳)有限公司 | 新闻筛选的方法、装置、计算机设备和存储介质 |
CN109902307A (zh) * | 2019-03-15 | 2019-06-18 | 北京金山数字娱乐科技有限公司 | 命名实体识别方法、命名实体识别模型的训练方法及装置 |
CN110414006A (zh) * | 2019-07-31 | 2019-11-05 | 京东方科技集团股份有限公司 | 文本的主题标注方法、装置、电子设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
Shaikh Mostafa Al Masum ; Helmut Prendinger ; Mitsuru Ishizuka.Emotion Sensitive News Agent: An Approach Towards User Centric Emotion Sensing from the News.IEEE/WIC/ACM International Conference on Web Intelligence (WI'07).2008,全文. * |
基于CRF的互联网文本命名实体识别研究;郑秋生;刘守喜;;中原工学院学报(第01期);全文 * |
基于双词主题模型的半监督实体消歧方法研究;张雄;陈福才;黄瑞阳;;电子学报(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111062213A (zh) | 2020-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110444198B (zh) | 检索方法、装置、计算机设备和存储介质 | |
CN111046656B (zh) | 文本处理方法、装置、电子设备及可读存储介质 | |
US11308937B2 (en) | Method and apparatus for identifying key phrase in audio, device and medium | |
CN107491435B (zh) | 基于计算机自动识别用户情感的方法及装置 | |
CN112185348A (zh) | 多语种语音识别方法、装置及电子设备 | |
Tran et al. | A hierarchical neural model for learning sequences of dialogue acts | |
WO2021103712A1 (zh) | 一种基于神经网络的语音关键词检测方法、装置及系统 | |
CN107564528B (zh) | 一种语音识别文本与命令词文本匹配的方法及设备 | |
CN113178193A (zh) | 一种基于智能语音芯片的中文自定义唤醒与物联交互方法 | |
CN112818680B (zh) | 语料的处理方法、装置、电子设备及计算机可读存储介质 | |
CN105551485A (zh) | 语音文件检索方法及系统 | |
CN112669842A (zh) | 人机对话控制方法、装置、计算机设备及存储介质 | |
Tündik et al. | Joint word-and character-level embedding CNN-RNN models for punctuation restoration | |
CN113157852A (zh) | 语音处理的方法、系统、电子设备及存储介质 | |
CN111126084B (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN116306679A (zh) | 一种基于语义可配置的多模态智能客服对话的方法和系统 | |
Bigot et al. | Person name recognition in ASR outputs using continuous context models | |
CN113393841B (zh) | 语音识别模型的训练方法、装置、设备及存储介质 | |
JP2020086332A (ja) | キーワード抽出装置、キーワード抽出方法、およびプログラム | |
CN111062213B (zh) | 命名实体识别方法、装置、设备及介质 | |
CN115174285B (zh) | 会议记录生成方法、装置及电子设备 | |
CN103268316A (zh) | 一种图片识别语音翻译方法及其翻译设备 | |
CN115577712A (zh) | 一种文本纠错方法及装置 | |
CN115691503A (zh) | 语音识别方法、装置、电子设备和存储介质 | |
CN114974310A (zh) | 基于人工智能的情感识别方法、装置、计算机设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |