CN109062889A - 一种文本标注方法和装置、计算机可读存储介质 - Google Patents

一种文本标注方法和装置、计算机可读存储介质 Download PDF

Info

Publication number
CN109062889A
CN109062889A CN201810681056.6A CN201810681056A CN109062889A CN 109062889 A CN109062889 A CN 109062889A CN 201810681056 A CN201810681056 A CN 201810681056A CN 109062889 A CN109062889 A CN 109062889A
Authority
CN
China
Prior art keywords
entity
line
current mouse
chosen
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810681056.6A
Other languages
English (en)
Inventor
徐安华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Mininglamp Software System Co ltd
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN201810681056.6A priority Critical patent/CN109062889A/zh
Publication of CN109062889A publication Critical patent/CN109062889A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04812Interaction techniques based on cursor appearance or behaviour, e.g. being affected by the presence of displayed objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种文本标注方法和装置、计算机可读存储介质,所述方法包括:监听并接收用户的鼠标操作;当检测到鼠标选中一个实体并向后拖动时,将选中的实体至当前鼠标坐标范围内的实体显示为选中状态;如果当前鼠标坐标超过行尾位置后不换行继续向后拖动,则计算当前鼠标坐标超出行尾位置的长度,并将下一行行首至计算出的长度范围内的实体显示为选中状态。本申请通过在当前鼠标坐标超过行尾位置后不换行继续向后拖动时,选中下一行的文本,简化了跨行标注的过程,提高了文本标注的效率。

Description

一种文本标注方法和装置、计算机可读存储介质
技术领域
本发明涉及自然语言处理(Natural Language Processing,NLP)技术领域,尤其涉及一种文本标注方法和装置、计算机可读存储介质。
背景技术
随着大数据以及人工智能(Artificial Intelligence,AI)的普及,企业级应用中将越来越多使用自然语言处理相关的技术。当前,虽然很多大公司提供词性识别、实体识别、关系识别等模型的超文本传输协议(Hyper Text Transfer Protocol,HTTP)服务,但这些服务背后的自然语言处理模型绝大多数都是由互联网数据训练得到的。而互联网中的文字内容来源广泛:既有来自于专业媒体的内容,也有网民个人产生的内容。互联网文本跟企业内部文本内容相比,用词与写作风格存在较大差异。因此,自然语言处理技术想要在企业级应用中达到较好的效果,一般需要将企业内文本做标注之后,重新训练成适合于企业自身需要的自然语言处理模型。
对于NLP中比较重要任务:如词性识别、实体识别等都需要使用企业中的文本数据进行标注、然后训练模型。在实体识别中,一个实体会横跨多个词或字。因此当一个实体在文字行的末尾开始、在下一行的行首结束时,就会出现实体跨行显示问题。如图1所示,当使用鼠标来标注图1中的人名“爱丽〃萨特勒”,我们需要首先定位并选中到第四行末尾的“爱丽”,接着将鼠标下移到第五行,接着再将鼠标左移到第五行的行首,直到只选中第五行行首的“萨特勒”这三个字。大量标注文本过程中会频繁遇到跨行标注,这种情况会极大影响标注的效率,完成这种情况下的一次标注要花费几倍于普通文本标注的时间。
发明内容
为了解决上述技术问题,本发明提供了一种文本标注方法和装置、计算机可读存储介质,能够提高文本标注的效率。
为了解决上述技术问题,本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种文本标注方法,包括:
监听并接收用户的鼠标操作;
当检测到鼠标选中一个实体并向后拖动时,将选中的实体至当前鼠标坐标范围内的实体显示为选中状态;
如果当前鼠标坐标超过行尾位置后不换行继续向后拖动,则计算当前鼠标坐标超出行尾位置的长度,并将下一行行首至计算出的长度范围内的实体显示为选中状态。
进一步地,所述方法还包括:
当当前鼠标坐标超出屏幕右侧边缘位置停止不动时,下一行被选中的实体持续向后增长。
进一步地,所述方法还包括:
当检测到鼠标选中一个实体并向前拖动时,将当前鼠标坐标至选中的实体范围内的实体显示为选中状态;
如果当前鼠标坐标超过行首位置后不换行继续向前拖动,则计算当前鼠标坐标超出行首位置的长度,并将上一行行尾至计算出的长度范围内的实体显示为选中状态。
进一步地,所述方法还包括:
当当前鼠标坐标超出屏幕左侧边缘位置停止不动时,上一行被选中的实体持续向前增长。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如以上任一项所述的文本标注方法的步骤。
本发明实施例还提供了一种文本标注装置,包括处理器及存储器,其中:
所述处理器用于执行存储器中存储的文本标注程序,以实现如以上任一项所述的文本标注方法的步骤。
本发明实施例还提供了一种文本标注装置,包括检测模块和选中模块,其中:
检测模块,用于监听并接收用户的鼠标操作,当检测到鼠标选中一个实体并向后拖动时,通知选中模块;
选中模块,用于接收到检测模块的通知,将选中的实体至当前鼠标坐标范围内的实体显示为选中状态;如果当前鼠标坐标超过行尾位置后不换行继续向后拖动,则计算当前鼠标坐标超出行尾位置的长度,并将下一行行首至计算出的长度范围内的实体显示为选中状态。
进一步地,所述选中模块还用于,
当当前鼠标坐标超出屏幕右侧边缘位置停止不动时,下一行被选中的实体持续向后增长。
进一步地,所述检测模块还用于,当检测到鼠标选中一个实体并向前拖动时,发送第二通知至所述选中模块;
所述选中模块还用于,接收到所述检测模块的第二通知,将当前鼠标坐标至选中的实体范围内的实体显示为选中状态;如果当前鼠标坐标超过行首位置后不换行继续向前拖动,则计算当前鼠标坐标超出行首位置的长度,并将上一行行尾至计算出的长度范围内的实体显示为选中状态。
进一步地,所述选中模块还用于,当当前鼠标坐标超出屏幕左侧边缘位置停止不动时,上一行被选中的实体持续向前增长。
本发明的技术方案,具有如下有益效果:
本发明提供的文本标注方法和装置、计算机可读存储介质,通过在当前鼠标坐标超过行尾位置后不换行继续向后拖动时,选中下一行的文本,简化了跨行标注的过程,提高了文本标注的效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为相关技术中的一种文本标注过程中的文本结构示意图;
图2为本发明实施例的一种文本标注方法的流程示意图;
图3为本发明实施例的一种文本标注过程中的文本结构示意图;
图4为本发明实施例的一种文本标注装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
自然语言处理,是对语音、文本等数据进行处理、转换、抽取信息的一大类问题的总称。实体,这里重点指自然语言处理领域中的命名实体识别(Named EntityRecognition,NER),但不限于命名实体。关系,这里重点是指自然语言处理领域中的实体与实体之间的关系。实体识别,从输入文本中提取出具有一定语义信息的实体,如姓名、日期、地点、组织机构等。关系识别,从输入文本中提取具有一定语义信息的实体与实体之间的关系,如父母与子女、雇佣、任职、地缘关系等。训练,指机器学习领域中,机器根据训练数据以及损失函数来更新模型参数的过程。中文分词(Chinese Word Segmentation,CWS)指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。
参考图2,根据本发明实施例的一种文本标注方法,包括如下步骤:
步骤201:监听并接收用户的鼠标操作;
步骤202:当检测到鼠标选中一个实体并向后拖动时,将选中的实体至当前鼠标坐标范围内的实体显示为选中状态;
本实施例中,所述方法还包括:
当检测到鼠标选中一个实体并向前拖动时,将当前鼠标坐标至选中的实体范围内的实体显示为选中状态。
步骤203:如果当前鼠标坐标超过行尾位置后不换行继续向后拖动,则计算当前鼠标坐标超出行尾位置的长度,并将下一行行首至计算出的长度范围内的实体显示为选中状态。
本实施例中,所述方法还包括:
当当前鼠标坐标超出屏幕右侧边缘位置停止不动时,下一行被选中的实体持续向后增长。直到松开鼠标,下一行被选中的实体的个数停止增长。
本实施例中,当检测到鼠标选中一个实体并向前拖动时,所述方法还包括:
如果当前鼠标坐标超过行首位置后不换行继续向前拖动,则计算当前鼠标坐标超出行首位置的长度,并将上一行行尾至计算出的长度范围内的实体显示为选中状态。
本实施例中,所述方法还包括:
当当前鼠标坐标超出屏幕左侧边缘位置停止不动时,上一行被选中的实体持续向前增长。直到松开鼠标,上一行被选中的实体的个数停止增长。
需要注意的是,只要此时鼠标一直按着不松手,在本行一直右移鼠标,能继续标注至下一行;左移鼠标,能回退到当前行,如果在本行继续向前移动,能继续标注至上一行。
具体地,如图3所示,当我们要标注从第四行末尾开始到第五行前三个字结束的“爱丽〃萨特勒”时,标注方法为光标从“爱”字左侧开始点击左键,向右滑动,当超出第四行末尾时,鼠标继续在第四行向右移动;同时图3中被选中的文字内容将自动显示从第四行末尾跳转到第五行的开始。也就是说在图3中,鼠标I超过第四行文本区后,继续向右滑动距离L,与此同时第五行开始位置自动出现有长度达到L的字符串被标识为选中状态。通过这种机制,我们能够实现跨行标注。当当前鼠标坐标超出屏幕右侧边缘位置停止不动时,下一行被选中的实体持续向后增长,通过这种方式,能够在各行行尾至屏幕边缘的位置很短的情况下,也能实现下一行中较长的跨行实体标注。
同理,当我们从第五行的“勒”字右侧开始点击鼠标左键,向左滑动,当超出第五行行首时,鼠标继续在第五行向左移动,同时图3中被选中的文字内容将自动显示从第五行行首跳转到第四行的末尾。也就是说在图3中,鼠标I超过第五行文本区后,继续向左滑动距离L,与此同时第四行末尾位置自动出现有长度达到L的字符串被标识为选中状态。通过这种机制,我们也能够实现跨行标注。当当前鼠标坐标超出屏幕左侧边缘位置停止不动时,上一行被选中的实体持续向前增长,通过这种方式,能够在各行行首至屏幕边缘的位置很短的情况下,也能实现上一行中较长的跨行实体标注。本发明的文本标注方法包括但不限于上述的前端展示方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如以上任一项所述的文本标注方法的步骤。
本发明实施例还提供了一种文本标注装置,包括处理器及存储器,其中:
所述处理器用于执行存储器中存储的文本标注程序,以实现如以上任一项所述的文本标注方法的步骤。
如图4所示,根据本发明实施例的一种文本标注装置,包括检测模块401和选中模块402,其中:
检测模块401,用于监听并接收用户的鼠标操作,当检测到鼠标选中一个实体并向后拖动时,通知选中模块402;
选中模块402,用于接收到检测模块401的通知,将选中的实体至当前鼠标坐标范围内的实体显示为选中状态;如果当前鼠标坐标超过行尾位置后不换行继续向后拖动,则计算当前鼠标坐标超出行尾位置的长度,并将下一行行首至计算出的长度范围内的实体显示为选中状态。
本实施例中,所述选中模块402还用于,
当当前鼠标坐标超出屏幕右侧边缘位置停止不动时,下一行被选中的实体持续向后增长。直到松开鼠标,下一行被选中的实体的个数停止增长。
本实施例中,所述检测模块401还用于,当检测到鼠标选中一个实体并向前拖动时,发送第二通知至所述选中模块402;
所述选中模块402还用于,接收到所述检测模块401的第二通知,将当前鼠标坐标至选中的实体范围内的实体显示为选中状态;如果当前鼠标坐标超过行首位置后不换行继续向前拖动,则计算当前鼠标坐标超出行首位置的长度,并将上一行行尾至计算出的长度范围内的实体显示为选中状态。
本实施例中,所述选中模块402还用于,
当当前鼠标坐标超出屏幕左侧边缘位置停止不动时,上一行被选中的实体持续向前增长。直到松开鼠标,上一行被选中的实体的个数停止增长。
需要注意的是,只要此时鼠标一直按着不松手,在本行一直右移鼠标,能继续标注至下一行;左移鼠标,能回退到当前行,如果在本行继续向前移动,能继续标注至上一行。
具体地,如图3所示,当我们要标注从第四行末尾开始到第五行前三个字结束的“爱丽〃萨特勒”时,从“爱”字左侧开始点击鼠标左键,向右滑动,当超出第四行末尾时,鼠标继续在第四行向右移动;同时图3中被选中的文字内容将自动显示从第四行末尾跳转到第五行的开始。也就是说在图3中,鼠标I超过第四行文本区后,继续向右滑动距离L,与此同时第五行开始位置自动出现有长度达到L的字符串被标识为选中状态。通过这种机制,我们能够实现跨行标注。当当前鼠标坐标超出屏幕右侧边缘位置停止不动时,下一行被选中的实体持续向后增长,通过这种方式,能够在各行行尾至屏幕边缘的位置很短的情况下,也能实现下一行中较长的跨行实体标注。
同理,当我们从第五行的“勒”字右侧开始点击鼠标左键,向左滑动,当超出第五行行首时,鼠标继续在第五行向左移动,同时图3中被选中的文字内容将自动显示从第五行行首跳转到第四行的末尾。也就是说在图3中,鼠标I超过第五行文本区后,继续向左滑动距离L,与此同时第四行末尾位置自动出现有长度达到L的字符串被标识为选中状态。通过这种机制,我们也能够实现跨行标注。当当前鼠标坐标超出屏幕左侧边缘位置停止不动时,上一行被选中的实体持续向前增长,通过这种方式,能够在各行行首至屏幕边缘的位置很短的情况下,也能实现上一行中较长的跨行实体标注。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。
以上仅为本发明的优选实施例,当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (10)

1.一种文本标注方法,其特征在于,包括:
监听并接收用户的鼠标操作;
当检测到鼠标选中一个实体并向后拖动时,将选中的实体至当前鼠标坐标范围内的实体显示为选中状态;
如果当前鼠标坐标超过行尾位置后不换行继续向后拖动,则计算当前鼠标坐标超出行尾位置的长度,并将下一行行首至计算出的长度范围内的实体显示为选中状态。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述当前鼠标坐标超出屏幕右侧边缘位置停止不动时,所述下一行被选中的实体持续向后增长。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当检测到鼠标选中一个实体并向前拖动时,将所述当前鼠标坐标至选中的实体范围内的实体显示为选中状态;
如果所述当前鼠标坐标超过行首位置后不换行继续向前拖动,则计算所述当前鼠标坐标超出行首位置的长度,并将上一行行尾至计算出的长度范围内的实体显示为选中状态。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当所述当前鼠标坐标超出屏幕左侧边缘位置停止不动时,所述上一行被选中的实体持续向前增长。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至4中任一项所述的文本标注方法的步骤。
6.一种文本标注装置,其特征在于,包括处理器及存储器,其中:
所述处理器用于执行存储器中存储的文本标注程序,以实现如权利要求1至4中任一项所述的文本标注方法的步骤。
7.一种文本标注装置,其特征在于,包括检测模块和选中模块,其中:
检测模块,用于监听并接收用户的鼠标操作,当检测到鼠标选中一个实体并向后拖动时,通知选中模块;
选中模块,用于接收到检测模块的通知,将选中的实体至当前鼠标坐标范围内的实体显示为选中状态;如果当前鼠标坐标超过行尾位置后不换行继续向后拖动,则计算当前鼠标坐标超出行尾位置的长度,并将下一行行首至计算出的长度范围内的实体显示为选中状态。
8.根据权利要求7所述的装置,其特征在于,所述选中模块还用于,
当所述当前鼠标坐标超出屏幕右侧边缘位置停止不动时,所述下一行被选中的实体持续向后增长。
9.根据权利要求7所述的装置,其特征在于,
所述检测模块还用于,当检测到鼠标选中一个实体并向前拖动时,发送第二通知至所述选中模块;
所述选中模块还用于,接收到所述检测模块的第二通知,将所述当前鼠标坐标至选中的实体范围内的实体显示为选中状态;如果所述当前鼠标坐标超过行首位置后不换行继续向前拖动,则计算所述当前鼠标坐标超出行首位置的长度,并将上一行行尾至计算出的长度范围内的实体显示为选中状态。
10.根据权利要求9所述的装置,其特征在于,所述选中模块还用于,
当所述当前鼠标坐标超出屏幕左侧边缘位置停止不动时,所述上一行被选中的实体持续向前增长。
CN201810681056.6A 2018-06-27 2018-06-27 一种文本标注方法和装置、计算机可读存储介质 Pending CN109062889A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810681056.6A CN109062889A (zh) 2018-06-27 2018-06-27 一种文本标注方法和装置、计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810681056.6A CN109062889A (zh) 2018-06-27 2018-06-27 一种文本标注方法和装置、计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN109062889A true CN109062889A (zh) 2018-12-21

Family

ID=64817909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810681056.6A Pending CN109062889A (zh) 2018-06-27 2018-06-27 一种文本标注方法和装置、计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109062889A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109783810A (zh) * 2018-12-26 2019-05-21 北京明略软件系统有限公司 一种文本处理方法、装置及计算机可读存储介质
CN110472205A (zh) * 2019-08-22 2019-11-19 北京明略软件系统有限公司 文件差异化的比对方法及装置、存储介质和电子装置
CN113408290A (zh) * 2021-06-29 2021-09-17 山东亿云信息技术有限公司 一种针对中文文本的智能标注方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101539905A (zh) * 2009-04-27 2009-09-23 浙江大学 一种嵌入式多格式电子文档标注方法
CN101551800A (zh) * 2008-03-31 2009-10-07 富士通株式会社 标注信息生成装置、查询装置及共享系统
CN104932807A (zh) * 2014-03-19 2015-09-23 腾讯科技(深圳)有限公司 一种光标定位方法及触屏设备
CN106502506A (zh) * 2016-11-01 2017-03-15 上海爱数信息技术股份有限公司 网页中文档的标注方法、系统及电子设备
CN108196927A (zh) * 2017-12-29 2018-06-22 北京淳中科技股份有限公司 一种标注方法、装置和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101551800A (zh) * 2008-03-31 2009-10-07 富士通株式会社 标注信息生成装置、查询装置及共享系统
CN101539905A (zh) * 2009-04-27 2009-09-23 浙江大学 一种嵌入式多格式电子文档标注方法
CN104932807A (zh) * 2014-03-19 2015-09-23 腾讯科技(深圳)有限公司 一种光标定位方法及触屏设备
CN106502506A (zh) * 2016-11-01 2017-03-15 上海爱数信息技术股份有限公司 网页中文档的标注方法、系统及电子设备
CN108196927A (zh) * 2017-12-29 2018-06-22 北京淳中科技股份有限公司 一种标注方法、装置和系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109783810A (zh) * 2018-12-26 2019-05-21 北京明略软件系统有限公司 一种文本处理方法、装置及计算机可读存储介质
CN109783810B (zh) * 2018-12-26 2022-11-11 北京明略软件系统有限公司 一种文本处理方法、装置及计算机可读存储介质
CN110472205A (zh) * 2019-08-22 2019-11-19 北京明略软件系统有限公司 文件差异化的比对方法及装置、存储介质和电子装置
CN110472205B (zh) * 2019-08-22 2023-06-06 北京明略软件系统有限公司 文件差异化的比对方法及装置、存储介质和电子装置
CN113408290A (zh) * 2021-06-29 2021-09-17 山东亿云信息技术有限公司 一种针对中文文本的智能标注方法及系统

Similar Documents

Publication Publication Date Title
CN107977415B (zh) 自动问答方法及装置
CN108027873B (zh) 基于捕捉到的笔画信息来与助理组件交互
CN104268160B (zh) 一种基于领域词典和语义角色的评价对象抽取方法
CN109062889A (zh) 一种文本标注方法和装置、计算机可读存储介质
CN108804512A (zh) 文本分类模型的生成装置、方法及计算机可读存储介质
KR102218468B1 (ko) 텍스트의 내용 및 감정 분석에 기반한 답변 추천 시스템 및 방법
CN107329967A (zh) 基于深度学习的问答系统以及方法
CN108460015A (zh) 文本情感分类数据增强分析方法
CN108052490B (zh) 一种xml论文在线撰写方法和装置
CN105955617A (zh) 用于选择文本的手势
CN104008091A (zh) 一种基于情感值的网络文本情感分析方法
CN105320734B (zh) 一种网页核心内容提取方法
CN107832469A (zh) 一种企业logo图像的生成方法及装置
CN105868179A (zh) 一种智能问答方法及装置
CN106855851A (zh) 知识抽取方法及装置
CN108415972A (zh) 文本情感处理方法
CN106055667A (zh) 一种基于文本‑标签密度的网页核心内容提取方法
CN103150294A (zh) 基于语音识别结果的修正方法和系统
CN107357785A (zh) 主题特征词抽取方法及系统、情感极性判断方法及系统
CN109191158A (zh) 用户画像标签数据的处理方法及处理设备
CN106326210B (zh) 一种文本话题和情感的联合检测方法及装置
CN108829810A (zh) 面向健康舆情的文本分类方法
CN107656921A (zh) 一种基于深度学习的短文本依存分析方法
CN102981689B (zh) 一种实现默认焦点定位的方法、装置和系统
CN103942561B (zh) 一种基于主动学习的图像标注方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181221