CN111310421B - 一种文本批量标记方法、终端及计算机存储介质 - Google Patents
一种文本批量标记方法、终端及计算机存储介质 Download PDFInfo
- Publication number
- CN111310421B CN111310421B CN202010171972.2A CN202010171972A CN111310421B CN 111310421 B CN111310421 B CN 111310421B CN 202010171972 A CN202010171972 A CN 202010171972A CN 111310421 B CN111310421 B CN 111310421B
- Authority
- CN
- China
- Prior art keywords
- electronic document
- marking
- keyword
- keywords
- related words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种文本批量标记方法、终端及计算机存储介质,阅读终端载有第一电子文档,所述方法包括:响应开启指令以开启所述第一电子文档;接收标记所述第一电子文档中的关键词的指令;查找所述第一电子文档中与所述关键词有关的关联词;以及标记所述关联词。本发明的方案可以在任意标记位置进行手写内容的二次编辑,并且针对全文或其它电子文档同步修改,以达到快速及简化修改步骤的目的。
Description
技术领域
本发明涉及信息技术领域。更具体地,本发明涉及一种文本批量标记方法、终端及计算机可读存储介质。
背景技术
近几年电子纸的应用越趋广泛,目前最大的应用即是阅读终端,也就是电子阅读器。它方便收纳,便于携带,并且可以储存数千甚或数万本电子书的内容,这些特性使得阅读终端不仅利于携带且更为环保。
为了提供更佳的阅读体验,阅读终端通常具备有查找和标记注解的功能。目前阅读终端只能针对单一个词进行划线或小注,这些词包括人名、地名等实体词。用户在标记注解后,可能还会对书籍在后出现的该词进行重复标记。虽然可以通过查找功能搜索同样的词进行标记,但过程繁琐耗时,无形中增加了系统刷清次数,也加速电量的消耗。
发明内容
为了至少部分地解决背景技术中提到的技术问题,本发明的方案提供了一种文本批量标记方法、终端及计算机存储介质。
在一个方面中,本发明提供一种文本批量标记方法,阅读终端载有第一电子文档,所述方法包括:响应开启指令以开启所述第一电子文档;接收标记所述第一电子文档中的关键词的指令;查找所述第一电子文档中与所述关键词有关的关联词;以及标记所述关联词。
在另一方面中,本发明提供一种计算机可读存储介质,其上存储有用于设置批量标记的计算机程序代码,当所述计算机程序代码由处理器运行时,执行前项所述的方法。
在又一方面中,本发明提供一种终端,其包括:处理器、存储器、通信接口和通信总线。所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令及第一电子文档,所述可执行指令使所述处理器执行以下操作:响应开启指令以开启所述第一电子文档;接收标记所述第一电子文档中的关键词的指令;查找所述第一电子文档中与所述关键词有关的关联词;以及标记所述关联词。
本发明技术方案可以允许用户在对第一电子文档的关键词进行标记后,进一步对全文、特定章节、特定段落甚至是第二电子文档的关联词同步标记,进而将关键词与所有关联词整合成一个或多个关系图。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,并且相同或对应的标号表示相同或对应的部分其中:
图1是示出根据本发明实施例的文本批量标记方法流程图;
图2(a)是示出根据本发明实施例的手指或手写笔触控按压屏幕的示意图;
图2(b)是示出根据本发明实施例的手指或手写笔触控按压屏幕的示意图;
图2(c)是示出根据本发明另一实施例的手指或手写笔触控按压屏幕的显示示意图;
图3是示出根据本发明另一实施例的文本批量标记方法流程图;
图4是示出根据本发明实施例的电子文档的分类方法流程图;以及
图5是示出根据本发明实施例的一种终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,本发明的权利要求、说明书及附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。本发明的说明书和权利要求书中使用的术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的,而并不意在限定本发明。如在本发明说明书和权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本发明说明书和权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
本发明的技术方案在整体上提供一种文本批量标记解决方案。不同于在现有技术中,用户在对某个词进行划线或小注后,可能还需要对在后出现的同一词做重复标记。本发明主要提供手写批注的功能,识别手写内容(线条或文字均可),找出手写内容对应的关键词,进行关联词搜索,在全文或其他文本出现该关键词处添加相同手写内容,以达到同步标记的目的。
下面结合附图来详细描述本发明的具体实施方式。
图1是示出根据本发明实施例的文本批量标记方法100的流程图。本发明实施例的文本(下面将以电子文档作为示例)被载入阅读终端中,其中该阅读终端可以为手机、平板电脑、电子阅读器等用于显示电子书的移动终端,但并不限于此,还可以是其他终端。本发明的移动终端载有多个电子文档,其中电子文档为电子书或笔记。为清楚描述本发明的技术,以下将以多个电子文档中的第一电子文档、第二电子文档示例说明,此处第一电子文档、第二电子文档仅用来区别不同的电子文档,并非用来限制本发明的移动终端只能载有二个电子书。
如图1中所示,此实施例包括以下步骤:
在步骤101处,响应开启指令以开启所述第一电子文档。上述阅读终端载有第一电子文档,用户点选所述第一电子文档,阅读终端接收到开启指令,开启第一电子文档。
接着,在步骤102处,接收标记第一电子文档中的关键词的指令。当用户对特定词欲进行标记时,会以手指或手写笔触控按压屏幕一段时间,阅读终端预先设定了当同一区域被按压超过一定时间时,则视为标记指令。为避免用户可能无意识的触碰屏幕,因此此实施例以一段时间利用手指或手写笔触控按压同一个区域来作为标记启动的指令。
更详细来说,如果触控的持续时间是大于阈值,就会启动标记关键词。阈值可以为3秒或5秒。当触控的持续时间是大于阈值,代表是有意义的标记指令,阅读终端会根据按压的区域来启动选择关键词的机制。
本实施例中,用户可以对电子书中的任意文字进行标记,并通过本实施例方案实现对在后相同文字的批量标记。实际应用中,用户对例如介词、副词等无实际含义的文字进行标记的需求不大,且电子书中此类词性文字出现频率很高,对此类文字进行批量标注并无实际意义,且会导致阅读页面过于杂乱影响阅读。在本实施例的一种实现方式中,可以针对名词、形容词等特定词汇进行批量标记处理,其中,名词多涉及人名、机构名、地名以及其他所有以名称为标识的实体,甚至还可以包括数字、日期、货币、地址、事件等各类名词性的实体词。凡是名词性的、能够指代具体事物的词汇均可作为本实施例中的关键词。
在该实现方式中,可以增加对用户标记文字进行词性判断的步骤,仅将名词、形容词等预设词性的词汇确定为需要执行批量标记的关键词。
具体地,用户在选择阅读页面中所包含的关键词时,会经过手指或手写笔触控按压屏幕来决定关键词的组成字符,但现实情况往往会由于字体过小、行距过窄、手指过胖或按压位置不确实等因素,导致无法准确的锁定关键词。基于上述原因,本发明通过多种方式进一步从被选取的字符的前后文来确定关键词,例如:可以通过语义识别的方式识别被选取的字符是否为有意义的词组,还可以结合用户反馈的评论内容、标记信息等识别被选取字符所包含的关键词。此实施例不限定关键词的具体确定方式。
以下将配合图示说明此实施例如何确定关键词。图2(a)及(b)是示出根据本发明实施例的手指或手写笔触控按压屏幕的示意图。当用户按压屏幕欲选择关键词ABC时,如图2(a)所示,按压区域201仅涵盖BC,未能完整涵盖关键词ABC,或如图2(b)所示,按压区域202根本未触及ABC任一个字符。
此实施例启动选择关键词的机制为:将按压区域201、202内同一行前后特定数量的字符纳入分析范围,将该区域内上一行相对位置前后特定数量的字符纳入分析范围,将该区域内下一行相对位置前后特定数量的字符纳入分析范围,接着识别分析范围211或212内的多个词组。最后,选择所述多个词组中最接近按压区域201、202的词组为关键词。其中上述特定数量可以视按压涵盖区域或字符所包括的句子长短来决定,于此不作进一步限定。
示例性地,此实施例以被选取的字符为基点,取其同行与上下行的前后3个字符(即特定数量为3)作为分析范围,产生分析范围211及212。图2(a)中,分析范围211中有意义的词组仅有ABC,故此实施例认定用户选取的关键词为ABC。图2(b)中,分析范围212中有意义的词组为ABC及GHI,由于ABC的位置更接近按压区域212,故此实施例认定用户选取的关键词为ABC。
此实施例还可以利用其他方式来识别关键词,如图2(c)所示,基于按压区域203,在手写笔记图层中,系统会生成以按压区域203为中心的外接矩形213,在阅读页图层中,识别外接矩形213内的多个名词,并选择所述多个词组中最接近按压区域203的为关键词。更详细来说,外接矩形213为固定大小,当字符较小时,涵盖的字符数量也越多,相反地,当字符较大时,涵盖的字符数量就较少,但字大也比较容易准确按压到关键词,因此并不会因外接矩形213涵盖的字符数量少就无法确定关键词。
再返回图1,在步骤103处,查找所述第一电子文档中与所述关键词有关的关联词。关联词是指与关键词所表达的意义相同但不同的表述方式,也就是同义字,其可以根据分类、关系、出现频率、常用语来被设定。例如关键词为“电子纸屏”,其同义词“电子墨水屏”和“电子纸显示屏”等都会被视为是关联词。关联词也可以依用户习惯来输入设定。另外,当关键词被识别为文本的标题时,关联词为同级别的其他标题。在一种实现方式中,可以通过预设的关联词库查找关键词对应的关联词,也可以通过网络侧的模糊匹配机制查找相关关联词。
此实施例进一步可以基于触控时间确定查找的范围,查找范围是当前页面、章或全文任一,用户按压越久,查找的范围越大。
在步骤104处,标记关联词。此实施例将查找范围内的全部关联词进行标记,标记的方式可以是手写字符、划线、画圈、色笔涂抹等,举例来说,当某个小标题被使用马克笔涂鸦标记时,具体地对“1、XXXX”进行了标记,方法100可以自动对“2、XXXX”及“3、XXXX”等同级标题进行批量涂鸦。
关键词和关联词的标记不一定要相同。举例来说,对于人物的标记,如要进一步丰富其功能,可以在批量标记某人物时自动对于该人物有关的其他人物、事件、时间和地点,以不同的划线样式进行标记。最后,此实施例根据不同的划线样式建立与特定人物相关联的关系图。
此实施例主要是针对同一个电子文档的内容进行批量的标记,但本发明除了可以应用在单一文本外,还可以跨文本进行批量的标记。
图3是示出根据本发明另一实施例的文本批量标记方法300流程图。所述阅读终端载有第一电子文档和第二电子文档,其中第一电子文档及第二电子文档为电子书或笔记。
在步骤301处,响应开启指令以开启所述第一电子文档。
接着,在步骤302处,接收标记第一电子文档中的关键词的指令。当用户对特定词欲进行标记时,会以手指或手写笔触控按压屏幕一段时间,阅读终端预先设定了当同一区域被按压超过一定时间时,则视为标记指令。为避免用户可能无意识的触碰屏幕,因此此实施例以一段时间手指或手写笔触控按压同一个区域来作为标记启动的指令。
此实施例基于手指或手写笔触控按压屏幕提供判断关键词的方式,同图2(a)(b)(c)说明,不再赘述。
在步骤303处,查找第二电子文档中的关联词。其中关联词是指与关键词所表达的意义相同但不同的表述方式,也就是同义字,其可以根据分类、关系、出现频率、常用语来被设定。关联词也可以依用户习惯来设定。
在步骤304处,标记第二电子文档中的关联词。方法300截取标记在第一电子文档的关键词所对应的手写图形,并且将手写图形显示在第二电子文档中的关联词处。标记的方式可以是书写字符、划线、画圈、色笔涂抹等,而且关键词和关联词的标记不一定要一样。举例来说,对于人物的标记,如要进一步丰富其功能,可以在批量标记某人物时自动对于该人物有关的其他人物、事件、时间和地点,以不同的划线样式进行标记。最后,根据不同的划线样式还能建立与特定人物相关联的关系图。基于此,如果查找的电子文档越多,关系图的网络越密集,内容也会更加丰富。
通过前述实施例的说明可知,本发明的批量标记方法可以针对同一件电子文档和不同电子文档进行批量标记,但查找的电子文档越多、范围越大需要花费的系统资源越多,因此本发明通过先将关键词进行分类以有条件的限缩查找范围,可以更有效率的执行批量标记,适用于多个电子文档时操作。具体分类的作法如下面所描述。
图4是示出根据本发明实施例的电子文档的分类方法400流程图。如图4所示,在步骤401处,将第一电子文档及第二电子文档中的词组进行分类。具体地,方法400分析第一电子文档及第二电子文档中属于名词的词组,并且根据字的组成对词组进行分类。例如:X山多属于地名,O月O日O时O分多属于时间。这里的描述仅仅是示例性的而非限制性的,并且也不用于限制本发明的保护范围。
接着,在步骤402处,确定关键词的类别。通过如步骤102或步骤302确定关键词后,进一步的查找关键字的类别。
在步骤403处,在类别中查找关联词。此实施例只针对关键词所在类别中去查找对应的关联词,不仅可以高效的找到关联词,进一步还能链接到关联的地名或事件。例如:当对某人名划线标记后,可在人名类标签下的相对应段落进行检索,不用进行全文检索;或者,当对地点类内容划线时,此实施例可以建议用户是否要对与该地点关联的人物类、事件类内容进行二次标记。
图5示出了根据本发明另一实施例的一种终端的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图5所示,该终端可以包括:处理器502、通信接口504、存储器506、以及通信总线508。
其中:处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。通信接口504,用于与其它设备比如客户端或其它服务器等进行通信。处理器502用于执行程序510,具体可以执行前述方法实施例中的相关步骤。
具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。处理器502可能是中央处理器CPU,或者是特定集成电路ASIC,或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器506用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行以下操作:
响应开启指令以开启所述第一电子文档;
接收标记所述第一电子文档中的关键词的指令;
查找所述第一电子文档中与所述关键词有关的关联词;以及
标记所述关联词。
在一种可选的实现方式中,其中所述关键词的标记包括对所述关键词进行划线、圈选、涂色、粗体或文字等标示。
在一种可选的实现方式中,其中当所述关键词是以圈选进行标记时,所述可执行指令进一步使所述处理器执行以下操作:
截取标记所述关键词的手写图形;以及
显示所述手写图形在所述关联词处。
在一种可选的实现方式中,其中所述接收步骤包括:
判断触控时间是否大于阈值;以及
如是,启动选择所述关键词。
在一种可选的实现方式中,其中所述触控时间为屏幕同一区域被按压的持续时间。
在一种可选的实现方式中,所述可执行指令进一步使所述处理器执行以下操作:
将该区域内同一行前后特定数量的字符纳入分析范围;
将该区域内上一行相对位置前后特定数量的字符纳入所述分析范围;
将该区域内下一行相对位置前后特定数量的字符纳入所述分析范围;
识别所述分析范围内的多个词组;以及
选择所述多个词组中最接近该区域的词组为所述关键词。
在一种可选的实现方式中,所述可执行指令进一步使所述处理器执行以下操作:
根据所述触控时间,确定搜索范围,所述搜索范围是当前页面、章或全文任一。
在一种可选的实现方式中,其中所述终端还载有第二电子文档,所述可执行指令进一步使所述处理器执行以下操作:
查找所述第二电子文档中的所述关联词;以及
标记所述第二电子文档中的所述关联词。
在一种可选的实现方式中,所述可执行指令进一步使所述处理器执行以下操作:
截取标记所述关键词的手写图形;以及
显示所述手写图形在所述第二电子文档中的所述关联词处。
在一种可选的实现方式中,其中所述第一电子文档及第二电子文档为电子书或笔记。
在一种可选的实现方式中,所述可执行指令进一步使所述处理器执行以下操作:
将所述第一电子文档及所述第二电子文档中的词组进行分类;
其中,所述查找所述第二电子文档中的所述关联词的步骤包括:
确定所述关键词的类别;以及
在所述类别中查找所述关联词。
在一种可选的实现方式中,其中所述类别为人名、地名、时间、事件其中之一。
在一种可选的实现方式中,其中所述用户以手写笔进行标记,所述可执行指令进一步使所述处理器执行以下操作:
在手写笔记图层中,确定所述标记的外接矩形;
在阅读页图层中,识别所述外接矩形内的多个词组;以及
选择所述多个词组中任一个为所述关键词。
在一种可选的实现方式中,其中当所述关键词为标题时,所述关联词为同级别的标题。
另外,本发明也公开了一种计算机可读存储介质,其包括用于通过数据服务系统执行设置批量标记的计算机程序,当所述计算机程序由处理器运行时,执行根据结合图1-图4所述的方法及其多个实施例。
还应当理解,本文示例的执行指令的任何模块、单元、组件、服务器、计算机、终端或设备可以包括或以其他方式访问计算机可读介质,诸如存储介质、计算机存储介质或数据存储设备(可移除的和/或不可移动的)例如磁盘、光盘或磁带。计算机存储介质可以包括以用于存储信息的任何方法或技术实现的易失性和非易失性,可移动和不可移动介质,例如计算机可读指令、数据结构、程序模块或其他数据。
计算机存储介质的示例包括RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字通用盘(DVD)或其他光学存储器、磁带盒、磁带、磁盘存储器或其他磁存储设备,或者可以用于存储所需信息并且可以由应用程序、模块或两者访问的任何其他介质。任何这样的计算机存储介质可以是设备的一部分或可访问或可连接到设备。本文描述的任何应用或模块可以使用由这样的计算机可读介质存储或以其他方式保持的计算机可读/可执行指令来实现。
本发明技术方案在第一电子文档的关键词进行标记后,可以对全文、特定章节、特定段落甚至是第二电子文档的关联词同步增加标记。进一步来说,经标记的关联词还可以被整合成一个或多个关系图,以更方便理解所有关联词间的关系,也可以为文档管理作更有效的运用。最后,本发明更提供了针对关键词的词性进行分类,方便查找对应的关联词,达到省时并且提高查找效率的目的。
虽然本发明的实施方式如上,但所述内容只是为便于理解本发明而采用的实施例,并非用以限定本发明的范围和应用场景。任何本发明所述技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (20)
1.一种文本批量标记方法,阅读终端载有第一电子文档,所述方法包括:
响应开启指令以开启所述第一电子文档;
接收标记所述第一电子文档中的关键词的指令;
查找所述第一电子文档中与所述关键词有关的关联词;以及
标记所述关联词;其中,所述关联词是指与所述关键词所表达的意义相同但不同的表述方式,根据分类、关系、出现频率、常用语来设定,
且所述关键词和所述关联词的标记不一定相同;
其中,所述阅读终端还载有第二电子文档,所述方法还包括:
查找所述第二电子文档中的所述关联词;以及
标记所述第二电子文档中的所述关联词;
根据所述标记将所述关键词与所有关联词整合成一个或多个关系图;
其中所述接收步骤包括:根据触控时间,确定搜索范围,所述搜索范围是当前页面、章或全文任一;
其中所述方法还包括:将所述第一电子文档及所述第二电子文档中的词组进行分类;
其中,所述查找所述第二电子文档中的所述关联词的步骤包括:
确定所述关键词的类别;以及在所述类别中查找所述关联词,其中所述类别为人名、地名、时间、事件其中之一。
2.根据权利要求1所述的批量标记方法,其中所述关键词的标记包括对所述关键词进行划线、圈选、涂色、粗体或文字标示。
3.根据权利要求2所述的批量标记方法,其中当所述关键词是以圈选进行标记时,所述标记步骤包括:
截取标记所述关键词的手写图形;以及
显示所述手写图形在所述关联词处。
4.根据权利要求1所述的批量标记方法,其中所述接收步骤包括:
判断触控时间是否大于阈值;以及
如是,启动选择所述关键词。
5.根据权利要求4所述的批量标记方法,其中所述触控时间为屏幕同一区域被按压的持续时间。
6.根据权利要求5所述的批量标记方法,其中所述启动步骤包括:
将该区域内同一行前后特定数量的字符纳入分析范围;
将该区域内上一行相对位置前后特定数量的字符纳入所述分析范围;
将该区域内下一行相对位置前后特定数量的字符纳入所述分析范围;
识别所述分析范围内的多个词组;以及
选择所述多个词组中最接近该区域的词组为所述关键词。
7.根据权利要求1所述的批量标记方法,其中所述标记所述第二电子文档中的所述关联词的步骤包括:
截取标记所述关键词的手写图形;以及
显示所述手写图形在所述第二电子文档中的所述关联词处;其中所述第一电子文档为电子书或笔记,所述第二电子文档为电子书或笔记。
8.根据权利要求1所述的批量标记方法,其中用户以手写笔进行标记,所述接收步骤包括:
在手写笔记图层中,确定所述标记的外接矩形;
在阅读页图层中,识别所述外接矩形内的多个词组;以及
选择所述多个词组中任一个为所述关键词。
9.根据权利要求1所述的批量标记方法,其中当所述关键词为标题时,所述关联词为同级别的标题。
10.一种计算机可读存储介质,其上存储有用于设置批量标记的计算机程序代码,当所述计算机程序代码由处理器运行时,执行根据权利要求1至9任一项所述的方法。
11.一种终端,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令及第一电子文档,所述可执行指令使所述处理器执行以下操作:
响应开启指令以开启所述第一电子文档;
接收标记所述第一电子文档中的关键词的指令;
查找所述第一电子文档中与所述关键词有关的关联词;以及
标记所述关联词;其中,所述关联词是指与所述关键词所表达的意义相同但不同的表述方式,根据分类、关系、出现频率、常用语来设定,
且所述关键词和所述关联词的标记不一定相同;
其中,所述终端还载有第二电子文档,所述可执行指令进一步使所述处理器执行以下操作:
查找所述第二电子文档中的所述关联词;以及
标记所述第二电子文档中的所述关联词;
根据所述标记将所述关键词与所有关联词整合成一个或多个关系图;
其中所述可执行指令进一步使所述处理器执行以下操作:根据触控时间,确定搜索范围,所述搜索范围是当前页面、章或全文任一;
其中所述可执行指令还使所述处理器执行以下操作:将所述第一电子文档及所述第二电子文档中的词组进行分类;
其中,所述可执行指令进一步使所述处理器执行以下操作:
确定所述关键词的类别;以及在所述类别中查找所述关联词,其中所述类别为人名、地名、时间、事件其中之一。
12.根据权利要求11所述的终端,其中所述关键词的标记包括对所述关键词进行划线、圈选、涂色、粗体或文字标示。
13.根据权利要求12所述的终端,其中当所述关键词是以圈选进行标记时,所述可执行指令进一步使所述处理器执行以下操作:
截取标记所述关键词的手写图形;以及
显示所述手写图形在所述关联词处。
14.根据权利要求11所述的终端,其中所述接收步骤包括:
判断触控时间是否大于阈值;以及
如是,启动选择所述关键词。
15.根据权利要求14所述的终端,其中所述触控时间为屏幕同一区域被按压的持续时间。
16.根据权利要求15所述的终端,所述可执行指令进一步使所述处理器执行以下操作:
将该区域内同一行前后特定数量的字符纳入分析范围;
将该区域内上一行相对位置前后特定数量的字符纳入所述分析范围;
将该区域内下一行相对位置前后特定数量的字符纳入所述分析范围;
识别所述分析范围内的多个词组;以及
选择所述多个词组中最接近该区域的词组为所述关键词。
17.根据权利要求11所述的终端,所述可执行指令进一步使所述处理器执行以下操作:
截取标记所述关键词的手写图形;以及
显示所述手写图形在所述第二电子文档中的所述关联词处。
18.根据权利要求11所述的终端,其中所述第一电子文档及第二电子文档为电子书或笔记。
19.根据权利要求11所述的终端,其中用户以手写笔进行标记,所述可执行指令进一步使所述处理器执行以下操作:
在手写笔记图层中,确定所述标记的外接矩形;
在阅读页图层中,识别所述外接矩形内的多个词组;以及
选择所述多个词组中任一个为所述关键词。
20.根据权利要求11所述的终端,其中当所述关键词为标题时,所述关联词为同级别的标题。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010171972.2A CN111310421B (zh) | 2020-03-12 | 2020-03-12 | 一种文本批量标记方法、终端及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010171972.2A CN111310421B (zh) | 2020-03-12 | 2020-03-12 | 一种文本批量标记方法、终端及计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111310421A CN111310421A (zh) | 2020-06-19 |
CN111310421B true CN111310421B (zh) | 2023-08-01 |
Family
ID=71162315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010171972.2A Active CN111310421B (zh) | 2020-03-12 | 2020-03-12 | 一种文本批量标记方法、终端及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111310421B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114995691B (zh) * | 2021-03-01 | 2024-03-08 | 北京字跳网络技术有限公司 | 一种文档处理方法、装置、设备和介质 |
CN114995689A (zh) * | 2021-03-01 | 2022-09-02 | 北京字跳网络技术有限公司 | 电子文档的处理方法、装置、终端和存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10198691A (ja) * | 1997-01-10 | 1998-07-31 | Nec Corp | 類似文書検索方法および類似文書検索装置 |
US6738767B1 (en) * | 2000-03-20 | 2004-05-18 | International Business Machines Corporation | System and method for discovering schematic structure in hypertext documents |
JP2004302773A (ja) * | 2003-03-31 | 2004-10-28 | Fujitsu Ltd | 文書検索語句抽出方法 |
WO2010071997A1 (en) * | 2008-12-27 | 2010-07-01 | Kibboko, Inc. | Method and system for hybrid text classification |
CN103473217A (zh) * | 2012-06-08 | 2013-12-25 | 华为技术有限公司 | 从文本中抽取关键词的方法和装置 |
CN103678281A (zh) * | 2013-12-31 | 2014-03-26 | 北京百度网讯科技有限公司 | 对文本进行自动标注的方法和装置 |
CN105095320A (zh) * | 2014-05-23 | 2015-11-25 | 邓寅生 | 基于关系叠加组合的文档的标识、关联、搜索及展现的系统 |
CN109460541A (zh) * | 2018-09-27 | 2019-03-12 | 广州大学 | 词汇关系标注方法、装置、计算机设备和存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8271870B2 (en) * | 2007-11-27 | 2012-09-18 | Accenture Global Services Limited | Document analysis, commenting, and reporting system |
CN101533393A (zh) * | 2008-03-11 | 2009-09-16 | 深圳市乐天科技有限公司 | 用电子装置对文章句子快速进行的分类及检索方法 |
US8533203B2 (en) * | 2009-06-04 | 2013-09-10 | Microsoft Corporation | Identifying synonyms of entities using a document collection |
US20110184946A1 (en) * | 2010-01-28 | 2011-07-28 | International Business Machines Corporation | Applying synonyms to unify text search with faceted browsing classification |
CN102902688B (zh) * | 2011-07-27 | 2016-08-10 | 汉王科技股份有限公司 | 关键词查找结果显示方法和装置 |
US20130275451A1 (en) * | 2011-10-31 | 2013-10-17 | Christopher Scott Lewis | Systems And Methods For Contract Assurance |
CN104077011B (zh) * | 2013-03-26 | 2017-08-11 | 北京三星通信技术研究有限公司 | 一种同类型文档间的关联方法和终端设备 |
CN110188178A (zh) * | 2019-05-30 | 2019-08-30 | 深圳龙图腾创新设计有限公司 | 一种跨文档信息查找方法、装置、计算机设备和存储介质 |
CN110286820A (zh) * | 2019-06-25 | 2019-09-27 | 掌阅科技股份有限公司 | 电子书内容的关联标记方法、电子设备、存储介质 |
-
2020
- 2020-03-12 CN CN202010171972.2A patent/CN111310421B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10198691A (ja) * | 1997-01-10 | 1998-07-31 | Nec Corp | 類似文書検索方法および類似文書検索装置 |
US6738767B1 (en) * | 2000-03-20 | 2004-05-18 | International Business Machines Corporation | System and method for discovering schematic structure in hypertext documents |
JP2004302773A (ja) * | 2003-03-31 | 2004-10-28 | Fujitsu Ltd | 文書検索語句抽出方法 |
WO2010071997A1 (en) * | 2008-12-27 | 2010-07-01 | Kibboko, Inc. | Method and system for hybrid text classification |
CN103473217A (zh) * | 2012-06-08 | 2013-12-25 | 华为技术有限公司 | 从文本中抽取关键词的方法和装置 |
CN103678281A (zh) * | 2013-12-31 | 2014-03-26 | 北京百度网讯科技有限公司 | 对文本进行自动标注的方法和装置 |
CN105095320A (zh) * | 2014-05-23 | 2015-11-25 | 邓寅生 | 基于关系叠加组合的文档的标识、关联、搜索及展现的系统 |
CN109460541A (zh) * | 2018-09-27 | 2019-03-12 | 广州大学 | 词汇关系标注方法、装置、计算机设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
基于伴随文本信息的Web图像批量标注方法;郭蕾蕾;俞璐;段国仑;陶性留;;信息技术与网络安全(第09期);全文 * |
挖掘专利知识实现关键词自动抽取;陈忆群;周如旗;朱蔚恒;李梦婷;印鉴;;计算机研究与发展(第08期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111310421A (zh) | 2020-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7555705B2 (en) | Annotation management in a pen-based computing system | |
EP2570974B1 (en) | Automatic crowd sourcing for machine learning in information extraction | |
Yi et al. | Sentiment analyzer: Extracting sentiments about a given topic using natural language processing techniques | |
JP4746136B2 (ja) | ランク・グラフ | |
US7379928B2 (en) | Method and system for searching within annotated computer documents | |
US9684741B2 (en) | Presenting search results according to query domains | |
US6389435B1 (en) | Method and system for copying a freeform digital ink mark on an object to a related object | |
US20040015775A1 (en) | Systems and methods for improved accuracy of extracted digital content | |
JP5751253B2 (ja) | 情報抽出システム、方法及びプログラム | |
US20130124515A1 (en) | Method for document search and analysis | |
WO2021068932A1 (zh) | 基于电子书的实体关联信息的展示方法及电子设备 | |
CN111310421B (zh) | 一种文本批量标记方法、终端及计算机存储介质 | |
CN109634436B (zh) | 输入法的联想方法、装置、设备及可读存储介质 | |
US20150149428A1 (en) | Search Inquiry Method Using Contextual Annotation | |
CN103853797A (zh) | 一种基于n元图片索引结构的图片检索方法与系统 | |
CN114297143A (zh) | 一种搜索文件的方法、显示文件的方法、装置及移动终端 | |
CN111814481B (zh) | 购物意图识别方法、装置、终端设备及存储介质 | |
CN112069296B (zh) | 一种对pdf文件的合同要素的识别方法 | |
Liu et al. | Japanese named entity recognition for question answering system | |
JP2007323238A (ja) | 強調表示装置及びプログラム | |
US7590936B1 (en) | Method for extracting information associated with a search term | |
Lopresti et al. | Approximate matching of hand-drawn pictograms | |
CN109635075B (zh) | 一种文本内容划词标识的方法及装置 | |
CN113157964A (zh) | 一种语音搜索数据集的方法、装置及电子设备 | |
US20150095314A1 (en) | Document search apparatus and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |