CN109977423A - 一种生词处理方法、装置、电子设备和可读存储介质 - Google Patents

一种生词处理方法、装置、电子设备和可读存储介质 Download PDF

Info

Publication number
CN109977423A
CN109977423A CN201711444969.8A CN201711444969A CN109977423A CN 109977423 A CN109977423 A CN 109977423A CN 201711444969 A CN201711444969 A CN 201711444969A CN 109977423 A CN109977423 A CN 109977423A
Authority
CN
China
Prior art keywords
new word
document
word
client
translation result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711444969.8A
Other languages
English (en)
Other versions
CN109977423B (zh
Inventor
冷志峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Jinshan Mobile Technology Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Jinshan Mobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd, Guangzhou Jinshan Mobile Technology Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201711444969.8A priority Critical patent/CN109977423B/zh
Publication of CN109977423A publication Critical patent/CN109977423A/zh
Application granted granted Critical
Publication of CN109977423B publication Critical patent/CN109977423B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/49Data-driven translation using very large corpora, e.g. the web
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明实施例提供了一种生词处理方法、装置、电子设备和可读存储介质。方法应用于文档阅读客户端,该方法包括:将文档阅读客户端所显示的文档中的、满足预设条件的词,确定为文档的生词;调用预设翻译软件对生词进行翻译,得到生词翻译结果;在文档阅读客户端显示的两个窗口中,一个窗口显示文档,另一个窗口显示生词和生词翻译结果;查找记录有文档阅读客户端的当前登录账号和文档的文档内容标识值的生词记录文件;将生词和生词翻译结果对应存储至查找到的生词记录文件中。应用本发明实施例提供的方案处理生词,能够快速地获得文档中生词的翻译,并能够快速地对该生词及该翻译进行记录和显示,提高了生词处理效率。

Description

一种生词处理方法、装置、电子设备和可读存储介质
技术领域
本发明涉及文档处理技术领域,特别是涉及一种生词处理方法、装置、电子设备和可读存储介质。
背景技术
目前,用户常常通过文档阅读客户端来阅读文档,并且,在阅读文档的过程中常常会遇到生词。例如,用户在阅读一篇英文文档时,常常会遇到不认识的英文单词。
面对该种情况,用户会对生词进行复制,然后将该生词粘贴到浏览器中,进而通过浏览器搜索得到该生词的翻译,即获得该生词的生词翻译结果。并且,为了便于后续能够顺畅阅读该文档或记忆该生词的翻译,用户需要手动将该生词及该翻译添加到该用户新建的、该文档对应的生词记录文档中。当后续需要阅读该文档以及该文档中的生词时,需要分别打开该文档以及该生词记录文档进行对照查看。可见,该种对生词的处理方式的费时费力,且不利于对该文档以及该文档中的生词及生词翻译结果进行同时查看。
发明内容
本发明实施例的目的在于提供一种生词处理方法、装置、电子设备和可读存储介质,以能够快速地获得文档中生词的翻译,并能够快速地对该生词及该翻译进行记录和显示,从而提高生词处理效率。具体技术方案如下:
第一方面,本发明实施例提供了一种生词处理方法,应用于文档阅读客户端,该方法可以包括:
将文档阅读客户端所显示的文档中的、满足预设条件的词,确定为文档的生词;
调用预设翻译软件对生词进行翻译,得到生词翻译结果;
在文档阅读客户端显示的两个窗口中,一个窗口显示文档,另一个窗口显示生词和生词翻译结果;
查找记录有文档阅读客户端的当前登录账号和文档的文档内容标识值的生词记录文件;其中,文档内容标识值用于唯一标识文档;
将生词和生词翻译结果对应存储至查找到的生词记录文件中。
第二方面,本发明实施例提供了一种生词处理装置,应用于文档阅读客户端,该装置可以包括:
生词确定单元,用于将文档阅读客户端所显示的文档中的、满足预设条件的词,确定为文档的生词;
第一翻译单元,用于调用预设翻译软件对生词进行翻译,得到生词翻译结果;
显示单元,用于在文档阅读客户端显示的两个窗口中,一个窗口显示文档,另一个窗口显示生词和生词翻译结果;
查找单元,用于查找记录有文档阅读客户端的当前登录账号和文档的文档内容标识值的生词记录文件;其中,文档内容标识值用于唯一标识文档;
存储单元,用于将生词和生词翻译结果对应存储至查找到的生词记录文件中。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;电子设备上安装有文档阅读客户端;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现本发明提供的任一项生词处理方法实施例提供的方法步骤。
第四方面,本发明实施例提供了一种可读存储介质,该可读存储介质为电子设备上的可读存储介质,电子设备上安装有文档阅读客户端,该可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现本发明提供的任一项生词处理方法实施例提供的方法步骤。
在本发明实施例中,文档阅读客户端可以对文档进行显示,并且,可以将文档中满足预设条件的词确定为生词。在确定生词后,可以调用预设翻译软件对该生词进行翻译,这样,可以快速地得到该生词对应的生词翻译结果。并且,还可以在文档阅读客户端显示的两个窗口中,一个窗口显示该文档,另一个窗口显示该生词和生词翻译结果。这样,可以便于用户对照阅读该文档、该文档的生成和生词翻译结果,提高了用户的阅读体验。
另外,还可以根据该文档阅读客户端的当前登录账号,以及用于唯一标识该文档的文档内容标识值来查找:记录有该当前登录账号和该文档内容标识值的生词记录文件。进而,可以将该生词和该生词翻译结果存储至该生词记录文件中。这样,可以快速地将生词和生词翻译结果记录至:与该文档相关联的生词记录文件中,降低了存储生词和生词翻译结果的繁琐度,提高了存储生词和生词翻译结果的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种生词处理方法的流程图;
图2为本发明实施例提供的一种生词处理装置的结构示意图;
图3为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有技术中存在的问题,本发明实施例提供了一种生词处理方法、装置、电子设备和可读存储介质。
下面首先对本发明实施例提供的生词处理方法进行说明。
参见图1,本发明实施例提供的生词处理方法应用于文档阅读客户端,该方法可以包括如下步骤:
S101:将文档阅读客户端所显示的文档中的、满足预设条件的词,确定为文档的生词;
S102:调用预设翻译软件对该生词进行翻译,得到生词翻译结果;
S103:在该文档阅读客户端显示的两个窗口中,一个窗口显示该文档,另一个窗口显示该生词和生词翻译结果;
S104:查找记录有该文档阅读客户端的当前登录账号和文档的文档内容标识值的生词记录文件;其中,文档内容标识值用于唯一标识文档;
S105:将该生词和生词翻译结果对应存储至查找到的生词记录文件中。
在本发明实施例中,文档阅读客户端可以对文档进行显示,并且,可以将文档中满足预设条件的词确定为生词。在确定生词后,可以调用预设翻译软件对该生词进行翻译,这样,可以快速地得到该生词对应的生词翻译结果。并且,还可以在文档阅读客户端显示的两个窗口中,一个窗口显示该文档,另一个窗口显示该生词和生词翻译结果。这样,可以便于用户对照阅读该文档、该文档的生成和生词翻译结果,提高了用户的阅读体验。
另外,还可以根据该文档阅读客户端的当前登录账号,以及用于唯一标识该文档的文档内容标识值来查找:记录有该当前登录账号和该文档内容标识值的生词记录文件。进而,可以将该生词和该生词翻译结果存储至该生词记录文件中。这样,可以快速地将生词和生词翻译结果记录至:与该文档相关联的生词记录文件中,降低了存储生词和生词翻译结果的繁琐度,提高了存储生词和生词翻译结果的效率。
其中,本发明实施例中的文档包括但并不局限于:PDF(Portable DocumentFormat,便携式文档格式)文档、word文档、PPT(PowerPoint,演示文稿)文档和和WPS(WPSsoftware,WPS软件)文档。相应地,文档阅读客户端为:PDF文档阅读客户端、word文档阅读客户端、PPT文档阅读客户端和WPS文档阅读客户端。
可以理解的是,文档阅读客户端是安装在电子设备中的。该电子设备包括但并不局限于电脑和手机。
另外,本发明实施例中的生词记录文件可以为word文档和TXT文本文档等文档文件,也可以为数据库文件,例如.DAT文件,当然并不局限于此。
下面结合具体示例对本发明实施例提供的生词处理方法进行说明。
假设文档阅读客户端为PDF文档阅读客户端,并且,用户通过登录账号uer1(即当前登录账号)登录至该文档阅读客户端后,通过该文档阅读客户端打开PDF文档:文档A。也就是,登录账号uer1登录的文档阅读客户端中显示有文档A。
在显示文档A后,该文档阅读客户端可以判断文档A中是否存在满足预设条件的词。若存在,将文档A中满足预设条件的词,确定为文档A的生词。
其中,满足预设条件的词可以为:被选中时长超于预设时长的词、鼠标所在位置对应的词和预设选取动作所选中的词中的一项或者多项。
当然,满足预设条件的词也可以为:当PDF文档阅读客户端处于生词选取模式下时,被选中时长超于预设时长的词、鼠标所在位置对应的词和预设选取动作所选中的词中的一项或者多项。这都是合理的。
举例而言,当用户通过文档阅读客户端来阅读文档A,并在阅读过程中点击:该文档阅读客户端提供的生词选取选项时,该文档阅读客户端进入生词选取模式。在该模式下,该文档阅读客户端可以确定通过鼠标划词或者触屏划词选中的超过预设时长(例如2秒)的词作为生词。还可以确定鼠标所在位置,并可以确定该位置对应的词,例如该位置对应的词为Translation。那么,Translation则为满足预设条件的词。此时,可以将Translation确定为文档A的生词。
另外,预设选取动作包括但并不局限于:添加下划线操作、设置高亮操作、双击选中操作和绘制预设的触摸轨迹。相应地,则将位于下划线上的词、被设置高亮的词、被双击选中的词和绘制的触摸轨迹所选中的词,确定为文档A的生词。
而且,可以理解的是,一个生词可以是一个英文单词,也可以是一个汉字或多个汉字的组合。其中,该多个汉字的组合可以预先设置为不大于4个汉字的组合,这是合理的。文档A可以为英文文档,也可以为中文文档,当然并不局限于此。预设时长可以由本领域技术人员根据实际情况进行设定,例如设置为2秒。
以上,可以确定得到文档A的生词。
在确定文档A的生词后,可以调用预设翻译软件对该生词进行翻译,从而可以快速地获得该生词对应的生词翻译结果。其中,该预设翻译软件可以由本领域技术人员根据实际情况进行设定,在此不做详述。
为了使用户能够顺畅阅读文档A,并方便用户阅读或记忆文档A中的生词及生词翻译结果,从而提高用户的办公效率或学习效率。文档阅读客户端还可以执行如下操作:
在一种实施例中,在获得生词对应的生词翻译结果之后,还可以在文档阅读客户端显示两个窗口C1和C2。其中,一个窗口(例如窗口C1)显示文档A,另一个窗口(例如窗口C2)显示生词和该生词的生词翻译结果。这样,使得用户能够在文档阅读客户端对照查看文档A、文档A中的生词和查生词翻译结果,提高了用户的办公效率或学习效率。
其中,该文档阅读客户端在利用两个窗口分别对文档A和生词、该生词的生词翻译结果进行显示之前,可以将该文档阅读客户端的显示界面划分为两个窗口。其中,划分得到的两个窗口可以是左右分布的,也可以上下分布的,这两个窗口的大小可以相同也可以不相同,这都是合理的。
优选地,用于显示文档A的窗口大于用于显示生词和生词翻译结果的窗口。
另外,为了使用户能够更好地理解或记忆文档A的生词及生词翻译结果,在另一种实施例中,在通过另一个窗口C2显示生词和该生词的生词翻译结果之前,还可以确定该生词所在的语句,并调用预设翻译软件对该语句进行翻译,得到语句翻译结果。在该种情况下,还可以通过窗口C2显示生词、该生词的生词翻译结果、该生词所在的语句和该语句的语句翻译结果。
这样,使得用户还能够在文档阅读客户端查看到该生词的所在的语句和该语句的语句翻译结果,进一步提高了用户的办公效率或学习效率。
其中,可以确定距离该生词最近的标点符号的位置,并通过该位置来确定该生词所在的语句,当然并不局限于此。
另外,在确定文档A的生词后,或者,在得到生词的生词翻译结果后,还可以确定该文档阅读客户端的当前登录账号:uer1,并获得用于唯一标识文档A的文档内容标识值。
其中,当该确定得到的生词为:文档阅读客户端打开文档A后第一个确定的生词时,可以利用MD5(Message-Digest Algorithm 5,信息摘要算法5)来计算该文档的内容的MD5值,并将该MD5值作为文档A的文档内容标识值。这样,可以通过该MD5值来唯一标识文档A的内容。
当然,也可以利用SHA(Secure Hash Algorithm,安全散列算法),或,RIPEMD(RACEIntegrity Primitives Evaluation Message Digest,RACE原始完整性校验消息摘要)等算法来计算该文档的内容的摘要值,并将计算得到的摘要值作为文档A的文档内容标识值。
其中,计算得到的文档内容标识值可以是基于该文档的全部内容计算得到的,也可以是基于该文档的部分内容计算得到的,这都是合理的。
另外,当该确定得到的生词为:文档阅读客户端打开文档A后非第一个确定的生词时,可以直接获取上述计算得到的文档内容标识值。这样,可以避免对该文档的文档内容标识值进行重复计算,提高了获得该文档内容标识值的速度。
鉴于此,可以获得生词对应的生词翻译结果,文档阅读客户端的当前登录账号以及文档A的文档内容标识值。
在获得文档阅读客户端的当前登录账号uer1和文档A的文档内容标识值后,还可以基于得到的当前登录账号uer1和文档内容标识值来查找:记录有当前登录账号uer1和文档内容标识值的生词记录文件中。并且,可以将确定得到的生词和该生词的生词翻译结果对应存储至该生词记录文件中。
其中,该生词记录文件可以包括:文档阅读客户端所在的电子设备中存储的本地生词记录文件,和/或,文档阅读客户端对应的云服务器中存储的云端生词记录文件。也就是说,生词记录文件可以存储在该文档阅读客户端所在的电子设备中,和/或,存储在该文档阅读客户端对应的云服务器中。文档阅读客户端对应的云服务器是指:为该文档阅读客户端提供服务的服务器。
下面首先对生词记录文件为:文档阅读客户端所在的电子设备中存储的本地生词记录文件的情况进行说明。
假设该生词记录文件为:文档阅读客户端所在的电子设备K1中存储的本地生词记录文件,那么,该文档阅读客户端可以根据当前登录账号uer1和文档内容标识值,来查找电子设备K1中存储的本地生词记录文件。
若能查找到该本地生词记录文件,则将生词和该生词的生词翻译结果对应存储至该本地生词记录文件中。若不能查找到该本地生词记录文件,则新建与当前登录账号uer1和文档内容标识值具有关联关系的本地生词记录文件。进而,可以将生词和该生词的生词翻译结果对应存储至:该新建的本地生词记录文件中。从而,实现对文档A的生词及生词翻译结果的快速存储,避免了用户对文档A的生词及生词翻译结果进行手动存储,省时省力。
下面对生词记录文件为:文档阅读客户端对应的云服务器中存储的云端生词记录文件的情况进行说明。
假设该生词记录文件为:文档阅读客户端对应的云服务器中存储的云端生词记录文件。在该种情况下,该文档阅读客户端可以将获得的当前登录账号uer1、文档A的文档内容标识值、文档A的生词和该生词的生词翻译结果发送至云服务器,以使云服务器可以根据该当前登录账号uer1和文档内容标识值来查找该云端生词记录文件。
若能查找到,云服务器可以将该生词和生词翻译结果写入查找到的云端生词记录文件中。若不能查找到,该云服务器则新建记录有该当前登录账号和文档内容标识值的云端生词记录文件,进而,可以将生词和该生词的生词翻译结果对应存储至云端生词记录文件中。从而使得该文档阅读客户端间接地将生词和生词翻译结果对应写入云端生词记录文件中,实现对文档A的生词及生词翻译结果的快速存储。
其中,当将获得的生词和该生词的生词翻译结果既存入本地生词记录文件,又存入云端生词记录文件时,可以实现该生词和该生词的生词翻译结果的云端备份,避免在本地生词记录文件被误删或被损坏时,该生词和该生词的生词翻译结果丢失。
鉴于此,可以将文档A中确定得到的生词及该生词的生词翻译结果,快速地存储至:记录有当前登录账号和文档A的文档内容标识值的生词记录文件中,避免了用户进行手动存储,省时省力。
此外,为了进一步提高用户阅读文档A中生词和生词翻译结果的阅读体验,本发明实施例中的文档阅读客户端还可以执行如下操作:
在确定文档A中的生词后,还可以确定该生词所在的章节。并计算用于唯一标识该章节的章节内容标识值。其中,可以利用消息摘要算法MD5对该章节的内容进行计算得到的MD5值,从而将该章节对应的MD5值作为章节内容标识值,当然并不局限于此。其他计算章节内容标识值的方式可以参见:计算文档内容标识值部分的计算方式,在此不做赘述。
然后,可以基于当前登录账号和文档内容标识值,将生词、生词翻译结果和该章节的章节内容标识值对应存储至:记录有当前登录账号和文档内容标识值的生词记录文件中。
并且,文档阅读客户端还可以在显示文档的过程中,实时确定当前显示界面中窗口C1显示的章节,并获得显示章节的章节内容标识值。然后,文档阅读客户端可以利用该章节的章节内容标识,获得生词记录文件中的、与章节内容标识对应存储的生词和生词翻译结果,并利用获得的生词和生词翻译结果对窗口C2中显示的内容进行更新。
当然,如果文档阅读客户端还获取了生词所在的语句和语句的语句翻译结果,该文档阅读客户端也可以将生词、该生词的生词翻译结果、该生词所在的语句、该语句的语句翻译结果和生词所在章节的章节内容标识值对应存储至生词记录文件中,这都是合理的。这样,文档阅读客户端在显示文档A的过程中,可以在检测当前界面中窗口C1显示的章节,并对检测到的章节对应的生词、该生词的生词翻译结果、该生词所在的语句和该语句的语句翻译结果在中窗口C2中进行显示。
当然,文档阅读客户端在显示文档A后,若判断文档A中不存在满足预设条件的词。该文档阅读客户端也可以确定当前登录账号uer1,并计算文档A的文档内容标识值。然后,查找是否存在记录有该当前登录账号uer1和文档内容标识值的生词记录文档。若能查找到,对该生词记录文件中的内容进行显示。
若在后续判断文档A中存在满足预设条件的词(即生词),那么在获得该生词及生词翻译结果后,再将获得的生词及生词翻译结果存储至生词记录文件中。并对更新后的生词记录文件中的内容进行显示。
另外,当该生词记录文件是存储在云服务器中的云端生词记录文件时,即使用户利用当前登录账号uer1登录电子设备K2上的文档阅读客户端,并通过该文档阅读客户端来显示文档A。该文档阅读客户端也可以通过当前登录账号uer1和文档A的文档内容标识值,来获得云服务器中云端生词记录文件中存储的文档A的生词和生词翻译结果。实现了文档A的生词和生词翻译结果的跨电子设备显示。
值得说明的是,上述仅以PDF文档作为示例,当然也可以通过上述生词处理方式对word文档和PPT文档等其他格式的文档进行处理,在此不做赘述。
综上,应用本发明实施例提供的生词处理方法,能够快速地获得文档中生词的翻译,并能够快速地对该生词及该翻译进行记录和显示,提高了生词处理效率。
相应于上述方法实施例,本发明实施例还提供了一种生词处理装置,应用于文档阅读客户端,参见图2,该装置可以包括:
生词确定单元201,用于将文档阅读客户端所显示的文档中的、满足预设条件的词,确定为文档的生词;
第一翻译单元202,用于调用预设翻译软件对生词进行翻译,得到生词翻译结果;
显示单元203,用于在文档阅读客户端显示的两个窗口中,一个窗口显示文档,另一个窗口显示生词和生词翻译结果;
查找单元204,用于查找记录有文档阅读客户端的当前登录账号和文档的文档内容标识值的生词记录文件;其中,文档内容标识值用于唯一标识文档;
存储单元205,用于将生词和生词翻译结果对应存储至查找到的生词记录文件中。
应用本发明实施例提供的装置,文档阅读客户端可以对文档进行显示,并且,可以将文档中满足预设条件的词确定为生词。在确定生词后,可以调用预设翻译软件对该生词进行翻译,这样,可以快速地得到该生词对应的生词翻译结果。并且,还可以在文档阅读客户端显示的两个窗口中,一个窗口显示该文档,另一个窗口显示该生词和生词翻译结果。这样,可以便于用户对照阅读该文档、该文档的生成和生词翻译结果,提高了用户的阅读体验。
另外,还可以根据该文档阅读客户端的当前登录账号,以及用于唯一标识该文档的文档内容标识值来查找:记录有该当前登录账号和该文档内容标识值的生词记录文件。进而,可以将该生词和该生词翻译结果存储至该生词记录文件中。这样,可以快速地将生词和生词翻译结果记录至:与该文档相关联的生词记录文件中,降低了存储生词和生词翻译结果的繁琐度,提高了存储生词和生词翻译结果的效率。
可选地,文档内容标识值为:利用消息摘要算法MD5对文档的内容进行计算得到的MD5值。
可选地,在本发明实施例中,该装置还可以包括:
语句确定单元,用于在将文档阅读客户端所显示的文档中的、满足预设条件的词,确定为文档的生词之后,确定生词所在的语句;
第二翻译单元,用于调用预设翻译软件对语句进行翻译,得到语句翻译结果;
相应地,存储单元205具体用于:将生词、生词翻译结果、语句和语句翻译结果对应存储至查找到的生词记录文件中。
可选地,在本发明实施例中,该装置还可以包括:
章节确定单元,用于在将文档阅读客户端所显示的文档中的、满足预设条件的词,确定为文档的生词之后,确定生词所在的章节;
章节内容标识值获得单元,用于获得用于唯一标识章节的章节内容标识值;
相应地,存储单元205具体用于:将生词、生词翻译结果和章节内容标识值对应存储至查找到的生词记录文件中。
可选地,在本发明实施例中,该装置还可以包括:
获得单元,用于在将生词、生词翻译结果和章节内容标识值对应存储至查找到的生词记录文件中之后,当检测到文档阅读客户端显示的一个窗口显示:文档中的章节的内容时,基于该章节的章节内容标识值,获得生词记录文件中的、与该章节内容标识值对应存储的生词和生词翻译结果;
更新单元,用于将另一个窗口显示的内容更新为:生词记录文件中的、与该章节内容标识值对应存储的生词和生词翻译结果。
可选地,生词记录文件存储在文档阅读客户端所在的电子设备中,和/或,存储在文档阅读客户端对应的云服务器中。
可选地,满足预设条件的词包括:被选中时长超过预设时长的词、鼠标所在位置对应的词和预设选取动作所选中的词中的至少一项。
相应于上述方法实施例,本发明实施例还提供了一种电子设备,参见图3,该电子设备包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信;电子设备上安装有文档阅读客户端;
存储器303,用于存放计算机程序;
处理器301,用于执行存储器上所存放的程序时,实现上述任一生词处理方法实施例提供的方法步骤。
本发实施例提供的电子设备中的文档阅读客户端可以对文档进行显示,并且,可以将文档中满足预设条件的词确定为生词。在确定生词后,可以调用预设翻译软件对该生词进行翻译,这样,可以快速地得到该生词对应的生词翻译结果。并且,还可以在文档阅读客户端显示的两个窗口中,一个窗口显示该文档,另一个窗口显示该生词和生词翻译结果。这样,可以便于用户对照阅读该文档、该文档的生成和生词翻译结果,提高了用户的阅读体验。
另外,还可以根据该文档阅读客户端的当前登录账号,以及用于唯一标识该文档的文档内容标识值来查找:记录有该当前登录账号和该文档内容标识值的生词记录文件。进而,可以将该生词和该生词翻译结果存储至该生词记录文件中。这样,可以快速地将生词和生词翻译结果记录至:与该文档相关联的生词记录文件中,降低了存储生词和生词翻译结果的繁琐度,提高了存储生词和生词翻译结果的效率。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
相应于上述方法实施例,本发明实施例还提供了一种可读存储介质,该可读存储介质为电子设备上的可读存储介质,电子设备上安装有文档阅读客户端,可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一生词处理方法实施例提供的方法步骤。
本发明实施例提供的可读存储介质中存储的计算机程序被电子设备的处理器执行后,电子设备中的文档阅读客户端可以对文档进行显示,并且,可以将文档中满足预设条件的词确定为生词。在确定生词后,可以调用预设翻译软件对该生词进行翻译,这样,可以快速地得到该生词对应的生词翻译结果。并且,还可以在文档阅读客户端显示的两个窗口中,一个窗口显示该文档,另一个窗口显示该生词和生词翻译结果。这样,可以便于用户对照阅读该文档、该文档的生成和生词翻译结果,提高了用户的阅读体验。
另外,还可以根据该文档阅读客户端的当前登录账号,以及用于唯一标识该文档的文档内容标识值来查找:记录有该当前登录账号和该文档内容标识值的生词记录文件。进而,可以将该生词和该生词翻译结果存储至该生词记录文件中。这样,可以快速地将生词和生词翻译结果记录至:与该文档相关联的生词记录文件中,降低了存储生词和生词翻译结果的繁琐度,提高了存储生词和生词翻译结果的效率。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备和可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (16)

1.一种生词处理方法,其特征在于,应用于文档阅读客户端,所述方法包括:
将所述文档阅读客户端所显示的文档中的、满足预设条件的词,确定为所述文档的生词;
调用预设翻译软件对所述生词进行翻译,得到生词翻译结果;
在所述文档阅读客户端显示的两个窗口中,一个窗口显示所述文档,另一个窗口显示所述生词和所述生词翻译结果;
查找记录有所述文档阅读客户端的当前登录账号和所述文档的文档内容标识值的生词记录文件;其中,所述文档内容标识值用于唯一标识所述文档;
将所述生词和所述生词翻译结果对应存储至查找到的生词记录文件中。
2.根据权利要求1所述的方法,其特征在于,所述文档内容标识值为:利用消息摘要算法MD5对所述文档的内容进行计算得到的MD5值。
3.根据权利要求1所述的方法,其特征在于,在所述将所述文档阅读客户端所显示的文档中的、满足预设条件的词,确定为所述文档的生词的步骤之后,所述方法还包括:
确定所述生词所在的语句;
调用所述预设翻译软件对所述语句进行翻译,得到语句翻译结果;
所述将所述生词和所述生词翻译结果对应存储至查找到的生词记录文件中的步骤,包括:
将所述生词、所述生词翻译结果、所述语句和所述语句翻译结果对应存储至查找到的生词记录文件中。
4.根据权利要求1所述的方法,其特征在于,在所述将所述文档阅读客户端所显示的文档中的、满足预设条件的词,确定为所述文档的生词的步骤之后,所述方法还包括:
确定所述生词所在的章节;
获得用于唯一标识所述章节的章节内容标识值;
所述将所述生词和所述生词翻译结果对应存储至查找到的生词记录文件中的步骤,包括:
将所述生词、所述生词翻译结果和所述章节内容标识值对应存储至查找到的生词记录文件中。
5.根据权利要求4所述的方法,其特征在于,在所述将所述生词、所述生词翻译结果和所述章节内容标识值对应存储至查找到的生词记录文件中的步骤之后,所述方法还包括:
当检测到所述文档阅读客户端显示的所述一个窗口显示:所述文档中的所述章节的内容时,基于所述章节的章节内容标识值,获得所述生词记录文件中的、与所述章节内容标识值对应存储的生词和生词翻译结果;
将所述另一个窗口显示的内容更新为:所述生词记录文件中的、与所述章节内容标识值对应存储的生词和生词翻译结果。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述生词记录文件存储在所述文档阅读客户端所在的电子设备中,和/或,存储在所述文档阅读客户端对应的云服务器中。
7.根据权利要求1-5中任一项所述的方法,其特征在于,满足所述预设条件的词包括:被选中时长超过预设时长的词、鼠标所在位置对应的词和预设选取动作所选中的词中的至少一项。
8.一种生词处理装置,其特征在于,应用于文档阅读客户端,所述装置包括:
生词确定单元,用于将所述文档阅读客户端所显示的文档中的、满足预设条件的词,确定为所述文档的生词;
第一翻译单元,用于调用预设翻译软件对所述生词进行翻译,得到生词翻译结果;
显示单元,用于在所述文档阅读客户端显示的两个窗口中,一个窗口显示所述文档,另一个窗口显示所述生词和所述生词翻译结果;
查找单元,用于查找记录有所述文档阅读客户端的当前登录账号和所述文档的文档内容标识值的生词记录文件;其中,所述文档内容标识值用于唯一标识所述文档;
存储单元,用于将所述生词和所述生词翻译结果对应存储至查找到的生词记录文件中。
9.根据权利要求8所述的装置,其特征在于,所述文档内容标识值为:利用消息摘要算法MD5对所述文档的内容进行计算得到的MD5值。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括:
语句确定单元,用于在将所述文档阅读客户端所显示的文档中的、满足预设条件的词,确定为所述文档的生词之后,确定所述生词所在的语句;
第二翻译单元,用于调用所述预设翻译软件对所述语句进行翻译,得到语句翻译结果;
所述存储单元具体用于:将所述生词、所述生词翻译结果、所述语句和所述语句翻译结果对应存储至查找到的生词记录文件中。
11.根据权利要求8所述的装置,其特征在于,所述装置还包括:
章节确定单元,用于在将所述文档阅读客户端所显示的文档中的、满足预设条件的词,确定为所述文档的生词之后,确定所述生词所在的章节;
章节内容标识值获得单元,用于获得用于唯一标识所述章节的章节内容标识值;
所述存储单元具体用于:将所述生词、所述生词翻译结果和所述章节内容标识值对应存储至查找到的生词记录文件中。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
获得单元,用于在将所述生词、所述生词翻译结果和所述章节内容标识值对应存储至查找到的生词记录文件中之后,当检测到所述文档阅读客户端显示的所述一个窗口显示:所述文档中的所述章节的内容时,基于所述章节的章节内容标识值,获得所述生词记录文件中的、与所述章节内容标识值对应存储的生词和生词翻译结果;
更新单元,用于将所述另一个窗口显示的内容更新为:所述生词记录文件中的、与所述章节内容标识值对应存储的生词和生词翻译结果。
13.根据权利要求8-12中任一项所述的装置,其特征在于,所述生词记录文件存储在所述文档阅读客户端所在的电子设备中,和/或,存储在所述文档阅读客户端对应的云服务器中。
14.根据权利要求8-12中任一项所述的装置,其特征在于,满足所述预设条件的词包括:被选中时长超过预设时长的词、鼠标所在位置对应的词和预设选取动作所选中的词中的至少一项。
15.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;所述电子设备上安装有文档阅读客户端;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7中任一项所述的方法步骤。
16.一种可读存储介质,其特征在于,所述可读存储介质为电子设备上的可读存储介质,所述电子设备上安装有文档阅读客户端,所述可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法步骤。
CN201711444969.8A 2017-12-27 2017-12-27 一种生词处理方法、装置、电子设备和可读存储介质 Active CN109977423B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711444969.8A CN109977423B (zh) 2017-12-27 2017-12-27 一种生词处理方法、装置、电子设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711444969.8A CN109977423B (zh) 2017-12-27 2017-12-27 一种生词处理方法、装置、电子设备和可读存储介质

Publications (2)

Publication Number Publication Date
CN109977423A true CN109977423A (zh) 2019-07-05
CN109977423B CN109977423B (zh) 2023-05-23

Family

ID=67071480

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711444969.8A Active CN109977423B (zh) 2017-12-27 2017-12-27 一种生词处理方法、装置、电子设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN109977423B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753556A (zh) * 2020-06-24 2020-10-09 掌阅科技股份有限公司 双语对照阅读的方法、终端及计算机存储介质
CN112037618A (zh) * 2020-08-31 2020-12-04 维沃移动通信有限公司 信息显示方法、装置和电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102193916A (zh) * 2011-06-17 2011-09-21 汉王科技股份有限公司 一种实现翻译词库切换的方法、装置及电子设备
CN102298578A (zh) * 2011-08-25 2011-12-28 盛乐信息技术(上海)有限公司 基于手持设备的翻译方法及系统
KR20140004841A (ko) * 2012-07-03 2014-01-14 주식회사 인프라웨어 스마트 단말장치에서 터치조작을 통한 전자문서 추가정보 삽입 방법 및 이를 위한 컴퓨터로 판독가능한 기록매체
CN103544144A (zh) * 2012-07-10 2014-01-29 腾讯科技(深圳)有限公司 移动客户端云翻译方法和移动客户端云翻译系统
CN105516315A (zh) * 2015-12-10 2016-04-20 北京金山安全管理系统技术有限公司 一种文件修复方法和装置
CN105786804A (zh) * 2016-02-26 2016-07-20 维沃移动通信有限公司 一种翻译方法及移动终端

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102193916A (zh) * 2011-06-17 2011-09-21 汉王科技股份有限公司 一种实现翻译词库切换的方法、装置及电子设备
CN102298578A (zh) * 2011-08-25 2011-12-28 盛乐信息技术(上海)有限公司 基于手持设备的翻译方法及系统
KR20140004841A (ko) * 2012-07-03 2014-01-14 주식회사 인프라웨어 스마트 단말장치에서 터치조작을 통한 전자문서 추가정보 삽입 방법 및 이를 위한 컴퓨터로 판독가능한 기록매체
CN103544144A (zh) * 2012-07-10 2014-01-29 腾讯科技(深圳)有限公司 移动客户端云翻译方法和移动客户端云翻译系统
CN105516315A (zh) * 2015-12-10 2016-04-20 北京金山安全管理系统技术有限公司 一种文件修复方法和装置
CN105786804A (zh) * 2016-02-26 2016-07-20 维沃移动通信有限公司 一种翻译方法及移动终端

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753556A (zh) * 2020-06-24 2020-10-09 掌阅科技股份有限公司 双语对照阅读的方法、终端及计算机存储介质
CN111753556B (zh) * 2020-06-24 2022-01-04 掌阅科技股份有限公司 双语对照阅读的方法、终端及计算机存储介质
CN112037618A (zh) * 2020-08-31 2020-12-04 维沃移动通信有限公司 信息显示方法、装置和电子设备

Also Published As

Publication number Publication date
CN109977423B (zh) 2023-05-23

Similar Documents

Publication Publication Date Title
TW201737072A (zh) 一種對應用程序進行項目評估的方法及系統
WO2020108063A1 (zh) 特征词的确定方法、装置和服务器
CN110569214B (zh) 用于日志文件的索引构建方法、装置及电子设备
WO2017036047A1 (zh) 信息提取方法和信息提取装置
US9813417B2 (en) Systems and methods for creating and displaying an electronic communication digest
TW201710993A (zh) 一種軟體推廣作弊的檢測方法、裝置及系統
CN107341399A (zh) 评估代码文件安全性的方法及装置
JP2014502753A (ja) ウェブページ情報の検出方法及びシステム
CN103324674B (zh) 网页内容选取方法及装置
CN105260469B (zh) 一种处理网站地图的方法、装置及设备
CN112532624B (zh) 一种黑链检测方法、装置、电子设备及可读存储介质
CN109933803B (zh) 一种成语信息展示方法、展示装置、电子设备及存储介质
US20150379112A1 (en) Creating an on-line job function ontology
US10354013B2 (en) Dynamic translation of idioms
US9336316B2 (en) Image URL-based junk detection
CN109902269A (zh) 一种文档显示方法、装置、电子设备和可读存储介质
US10042824B2 (en) Detection and elimination for inapplicable hyperlinks
CN109977423A (zh) 一种生词处理方法、装置、电子设备和可读存储介质
CN115099239A (zh) 一种资源识别方法、装置、设备以及存储介质
CN102750007A (zh) 用以建立个性字符库的方法及客户端
CN113360895A (zh) 站群检测方法、装置及电子设备
CN111930891A (zh) 基于知识图谱的检索文本扩展方法及相关装置
CN106055688A (zh) 搜索结果的展现方法、装置和移动终端
CN115470489A (zh) 检测模型训练方法、检测方法、设备以及计算机可读介质
US20170060998A1 (en) Method and apparatus for mining maximal repeated sequence

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant