CN107729327A

CN107729327A - 一种释义方法及一种释义装置

Info

Publication number: CN107729327A
Application number: CN201710918702.1A
Authority: CN
Inventors: 张守鹏
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2017-09-30
Filing date: 2017-09-30
Publication date: 2018-02-23

Abstract

本发明公开了一种释义方法及一种释义装置。一种释义方法，包括：识别出文本中特定的第一部分内容，其中，所述第一部分内容包含N个词汇，N为整数；针对所述第一部分内容，查询以所述N个词汇为整体所对应的释义的语义片段；展示查询结果所得到的所述语义片段，作为所述第一部分内容的释义结果。本发明实施例的一种释义方法及一种释义装置，通过识别文本中特定的第一部分内容，针对包含N个词汇的第一部分内容，查询以N个词汇为整体所对应的释义的语义片段，并展示查询结果所得到的语义片段，作为第一部分内容的释义结果，从而文本中的第一部分内容能够得到准确的释义，从而避免对第一部分内容的N个词汇分别进行直译以得到错误的翻译。

Description

一种释义方法及一种释义装置

技术领域

本发明涉及信息处理技术领域，特别涉及一种释义方法及一种释义装置。

背景技术

现在的翻译软件已经翻译的越来越好，也更加深入的走入用户的生活。但是，现有的翻译软件对语句进行翻译时，往往是直接对词语进行翻译，如果翻译软件的数据库中没有存储该词语，则翻译软件不能对该词语进行翻译而直接将该词语显示在翻译后的语句中，或者翻译软件根本不能识别出该词语，则翻译软件会将该词语分开来进行翻译。例如，有的外国人利用翻译软件来和中国人对话时，中国人喜欢用成语、俗语或典故等，当出现“你不要叶公好龙好么”时，现有的翻译软件会直接翻译成“You don’t yegonghaolonggood？”，而叶公好龙的准确意思“Lord ye who claimed to be fond of dragons wasscared out of his wits when a real one appeared”不能翻译出来。另外，虽然翻译软件的翻译能力极大的提升，但是并没有根据用户的个人差别，针对用户的生活经历、语言能力提供精准的翻译。背景技术能上位提炼一下吗

另外，部分人说话时，会伴有一定的口头禅，这些口头禅却并无实际意义，在翻译场景下，可有可无，并不会影响翻译的准确性。或者翻译软件的用户与一个有口吃的人进行对话时，有口吃的人的语言中会出现大量重复但并无意义的词汇，如果精准的对这些词汇进行翻译可能会造成语义的误差。

发明内容

本发明实施例的目的在于提供一种释义方法及一种释义装置，能够使释义结果更加精准。

为了解决上述技术问题，本发明的实施例采用了如下技术方案：一种释义方法，包括：

识别出文本中特定的第一部分内容，其中，所述第一部分内容包含N个词汇，N为整数；

针对所述第一部分内容，查询以所述N个词汇为整体所对应的释义的语义片段；

展示查询结果所得到的所述语义片段，作为所述第一部分内容的释义结果。

作为优选，还包括：

针对文本的第二部分内容进行逐个词汇对应地翻译，得到第二部分的翻译结果；

所述第二部分内容的翻译结果，以及所述第一部分内容的释义结果组合构成对所述文本第一部分内容以及第二部分内容的翻译结果。

作为优选，所述识别出所述文本中特定的第一部分内容，包括：

识别出所述文本中满足以下的一种或多种的组合作为特定的第一部分内容：术语、俚语、简语、缩写语、成语、诗词、特殊组合以表达特殊含义的用语。

根据以下的一种或多种因素的组合确定所述文本中用户可能存在理解困难的内容，作为特定的第一部分内容：

用户所使用的语言、文化程度、用户浏览或操作的信息、用户关注的领域、其他用户查询或操作的记录。

作为优选，所述展示查询结果所得到的所述语义片段，包括：

在第一部分内容附近，作为补充释义，展示与所述第一部分内容的涵义所对应的所述语义片段；或者

将所述语义片段作为第一部分内容的翻译结果予以单独展示。

作为优选，释义结果或翻译结果与所述文本为不同种语言，或者，

释义结果或翻译结果与所述文本为同种语言。

作为优选，所述查询以所述N个词汇为整体所对应的释义的语义片段，包括：

将包含有所述N个词汇的第一部分内容在网络上查询其所对应的释义的语义片段。

作为优选，所述文本，包括：文字文本，或者语音文本。

作为优选，还包括：确定所述文本中重复词汇，并且根据预设的判断规则判定所述重复词汇不具有明确含义的，去除所述重复词汇。

作为优选，所述根据预设的判断规则判定所述重复词汇不具有明确含义的，包括：

所述重复词汇属于语气词、或者助词、或者用户的口头禅词汇。

本发明还公开了一种释义装置，包括：

识别模块，其配置为，识别出文本中特定的第一部分内容，其中，所述第一部分内容包含N个词汇，N为整数；

查询模块，其配置为，针对所述第一部分内容，查询以所述N个词汇为整体所对应的释义的语义片段；

展示模块，其配置为，展示查询结果所得到的所述语义片段，作为所述第一部分的释义结果。

作为优选，所述识别模块，配置为，根据以下的一种或多种因素的组合确定所述文本中用户可能存在理解困难的内容，作为特定的第一部分内容：

作为优选，还包括：文字输入装置，其配置为输入文字文本；

或者语音输入装置，其配置为输入语音文字。

本发明实施例的有益效果在于：通过识别文本中特定的第一部分内容，针对包含N个词汇的第一部分内容，查询以N个词汇为整体所对应的释义的语义片段，并展示查询结果所得到的语义片段，作为第一部分内容的释义结果，从而文本中的第一部分内容能够得到准确的释义，从而避免对第一部分内容的N个词汇分别进行直译以得到错误的翻译。

附图说明

图1为本发明实施例的释义方法的流程示意图；

图2为本发明另一实施例的释义方法的流程示意图；

图3为本发明实施例的释义装置的结构框图；

图4为本发明另一实施例的释义装置的结构框图。

附图标记说明：1-识别模块；2-查询模块；3-展示模块；4-翻译模块；5-组合模块。

具体实施方式

此处参考附图描述本发明的各种方案以及特征。

应理解的是，可以对此处发明的实施例做出各种修改。因此，上述说明书不应该视为限制，而仅是作为实施例的范例。本领域的技术人员将想到在本发明的范围和精神内的其他修改。

包含在说明书中并构成说明书的一部分的附图示出了本发明的实施例，并且与上面给出的对本发明的大致描述以及下面给出的对实施例的详细描述一起用于解释本发明的原理。

通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述，本发明的这些和其它特性将会变得显而易见。

还应当理解，尽管已经参照一些具体实例对本发明进行了描述，但本领域技术人员能够确定地实现本发明的很多其它等效形式，它们具有如权利要求所述的特征并因此都位于借此所限定的保护范围内。

当结合附图时，鉴于以下详细说明，本发明的上述和其他方面、特征和优势将变得更为显而易见。

此后参照附图描述本发明的具体实施例；然而，应当理解，所发明的实施例仅仅是本发明的实例，其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本发明模糊不清。因此，本文所发明的具体的结构性和功能性细节并非意在限定，而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本发明。

本说明书可使用词组“在一种实施例中”、“在另一个实施例中”、“在又一实施例中”或“在其他实施例中”，其均可指代根据本发明的相同或不同实施例中的一个或多个。

如图1所示，本发明实施例的一种释义方法，包括：

S1，识别出文本中特定的第一部分内容，其中，第一部分内容包含N个词汇，N为整数。

其中，识别出文本中特定的一部分内容，例如可以包括：识别出文本中满足以下的一种或多种的组合作为特定的第一部分内容：术语、俚语、简语、缩写语、成语、诗词、特殊组合以表达特殊含义的用语。术语，例如是机械、化工等技术领域的专业名词或专有表达用语。俚语，例如是具有地方色彩的通俗易懂顺口的词语，可以是各国带有方言性的用语。简语，例如是国知局、商评委等简称。缩写语，指的是不同语言中一些用语的缩写，例如，CPU是central processing unit的缩写语。成语或诗词可以是不同语言中一部分定型的词组或短句。

S2，针对第一部分内容，查询以N个词汇为整体所对应的释义的语义片段。

其中，查询以N个词汇为整体所对应的释义的语义片段，可以包括：将包含有N个词汇的第一部分内容在网络上查询其所对应的释义的语义片段。例如，服务器中存储有与N个词汇为整体对应的释义的语义片段，将包含N个词汇的第一部分内容发送到服务器，服务器通过对该第一部分内容进行检索，并将获取的与N个词汇为整体所对应的释义的语义片段返回。

另外，N个词汇是作为整体来查询的，例如，成语“叶公好龙”是作为一个整体来查询，而不能将其进行分割而单独查询，从而，避免将有意义的词汇分割查询直译而得到错误的释义结果。

S3，展示查询结果所得到的语义片段，作为第一部分内容的释义结果。

其中，展示查询结果所得到的语义片段，包括：

在第一部分内容附近，作为补充释义，展示与第一部分内容的涵义所对应的语义片段；或者

将语义片段作为第一部分内容的翻译结果予以单独展示。

例如，在包括第一部分内容的文本的段尾处展示该语义片段，并以第一部分内容与该语义片段对应的方式展示。又例如，包含第一部分内容的文本为一整句汉语，将该第一部分内容对应的语义片段对应的翻译结果直接展示在文本的对应该第一部分内容的位置处。

例如，在阅读过程中，浏览器或电子书中的文本内容中，出现有生僻组合术语，可以通过查询该生僻组合术语，将与其对应的释义结果进行展示，将释义结果展示在该生僻组合术语的附近。

又例如，在阅读的文本中出现成语“叶公好龙”，通过对成语的整体的释义的查询，可以得到准确的英文的翻译结果(Lord ye who claimed to be fond of dragons wasscared out of his wits when a real one appeared)，从而避免直接翻译得到的直译结果(yegonghaolong)不准。

通过识别文本中特定的第一部分内容，针对包含N个词汇的第一部分内容，查询以N个词汇为整体所对应的释义的语义片段，并展示查询结果所得到的语义片段，作为第一部分内容的释义结果，从而文本中的第一部分内容能够得到准确的释义，从而避免对第一部分内容的N个词汇分别进行直译以得到错误的翻译。

在一个优选实施例中，S1中，识别出文本中特定的第一部分内容，还可以包括：

根据以下的一种或多种因素的组合确定文本中用户可能存在理解困难的内容，作为特定的第一部分内容：

其中，根据用户平时浏览的内容、搜索的内容或输入的内容等可以分析判断出用户所使用的语言、文化程度、用户浏览或操作的信息、用户关注的领域。

根据用户经常搜索的专业术语，判断用户的知识水平、职业、或学术水平等，例如，用户经常搜索熔焊、压焊或钎焊等，可以判断出用户对焊接领域比较熟悉或具有焊接领域的一定专业知识。判断出用户对焊接领域有一定了解，但是对其他领域不甚了解，当用户阅读例如时尚领域的文本时，对时尚文本中的专业术语进行释义，并在文本中的该专业术语处进行显示。

还可以根据用户输入的语言或浏览的语言内容，判断用户所使用的语言。根据用户的购买记录，判断用户的职业、年龄等，例如，根据购买的图书的类型，是专业书，还是育儿书，还是八卦小报等来判断。另外，还可以根据用户的地点位置或移动的轨迹判断并结合地图来判断，如果用户经常出入某某研究所或某某大学，那么可以初步判断其学识水平。

例如，判断出用户所使用的语言为汉语，其英文程度为大学四级水平，当阅读英文文档时，如果出现英文俚语或缩略语等特定的第一部分内容时，均需要对该第一部分内容的词汇作为整体对其进行查询，并将查询的释义结果展示在英文文档附近。

例如，判断出用户平时喜欢浏览植物相关的信息，可以将植物相关的拉丁语名字与汉语名字进行对应存储，当用户阅读植物专业书籍并出现植物的拉丁名字时，可以将拉丁语名字对应的汉语名字展示在拉丁语名字附近，以方便用户的阅读。又例如，服务器按照不同领域统计一预定时间的某领域的热点事件，服务器在按照搜索热点词汇，搜索相关的新闻、网页等，判定某个词汇的组合对应某一条新闻的部分，或者对应某些个涵义。并将热点事件中出现的词语与其解释进行对应存储，当用户浏览该领域的时事时，通过向服务器中查询词语对应的释义以得到释义结果。英国脱欧作为政治领域的热点事件，在该事件发生时，“脱欧”或“Brexit”都是临时自创的词汇，大量用户对该事件关注，造成该词汇的大量搜索，服务器可以存储与“脱欧”或“Brexit”对应的释义即“英国退出欧盟”或“Britainexiting from the EU”。如果中国用户阅读关于该事件的文本时，可以通过查询得到“脱欧”对应的释义“英国退出欧盟”，另外，如果英国用户阅读关于该事件的文本时，可以通过查询得到“Brexit”对应的释义“Britain exiting from the EU”。当然，中国用户阅读该事件的英文文本时，可以将“Brexit”对应的释义结果显示为“Britain exiting from theEU，英国退出欧盟”。

如图2所示，在另外一个实施例中的释义方法包括：

S1，识别出文本中特定的第一部分内容，其中，第一部分内容包含N个词汇，N为整数；

S2，针对第一部分内容，查询以N个词汇为整体所对应的释义的语义片段；

S3，展示查询结果所得到的语义片段，作为第一部分内容的释义结果；

S4，针对文本的第二部分内容进行逐个词汇对应地翻译，得到第二部分的翻译结果；

S5，第二部分内容的翻译结果，以及第一部分内容的释义结果组合构成对文本第一部分内容以及第二部分内容的翻译结果。

通过对包含N个词汇的第一部分内容查询以N个词汇为整体所对应的释义的语义片段，从而得到对文本中的第一部分内容进行意译结果，通过对文本中的第二部分内容进行逐个词汇对应的翻译，从而得到对文本中的第二部分内容进行直译，将第一部分内容的释义结果与第二部分内容的翻译结果组合构成最终展示的结果。

例如，对背景技术中提到的“你不要叶公好龙好么”，将“叶公好龙”整体进行释义得到“Lord ye who claimed to be fond of dragons was scared out of his witswhen a real one appeared”，并对除“叶公好龙”之外的其他部分进行对应翻译，最后将结果“Don’t act as Lord ye who claimed to be fond of dragons was scared out ofhis wits when a real one appeared,ok？”进行展示。

其中，实施例中的释义方法中提及的释义结果或翻译结果与文本可以为不同种语言，或者，释义结果或翻译结果与文本也可以为同种语言。

具体的，S1中的文本，可以包括：文字文本，或者语音文本。例如，对文字文本的特定第一部分内容进行释义，并将释义结果以文字文本进行显示。或者，对语音文本先识别为文字文本，在按照文字文本的释义过程进行释义，并将释义结果以文字文本进行显示。当然，对接收的语音文本进行处理时，可以对语音文本的特定第一部分内容进行释义，并将释义结果以语音文本的形式(以语音文本进行输出)展示。

另外，一个实施例中的释义方法还包括：

确定文本中重复词汇，并且根据预设的判断规则判定重复词汇不具有明确含义的，去除重复词汇。

其中，根据预设的判断规则判定重复词汇不具有明确含义的，包括：重复词汇属于语气词、或者助词、或者用户的口头禅词汇。

例如，收集用户平时使用的例如口头禅等的高频词，当用户输入的语音文本中包含该口头禅时，可以将口头禅去除，并对去除口头禅的语音文本进行上述的释义或翻译的过程。

又例如，用户有口吃的毛病，可以先对用户输入的语音文本进行重复词汇是否有明确含义的判断，将不具有明确含义的重复词汇去除，并对去除重复词汇的语音文本进行上述的释义或翻译的过程。

如图3所示，本发明还公开了一种释义装置，包括：

识别模块1，其配置为，识别出文本中特定的第一部分内容，其中，所述第一部分内容包含N个词汇，N为整数。

其中，识别模块1具体配置为：识别出文本中满足以下的一种或多种的组合作为特定的第一部分内容：术语、俚语、简语、缩写语、成语、诗词、特殊组合以表达特殊含义的用语。术语，例如是机械、化工等技术领域的专业名词或专有表达用语。俚语，例如是具有地方色彩的通俗易懂顺口的词语，可以是各国带有方言性的用语。简语，例如是国知局、商评委等简称。缩写语，指的是不同语言中一些用语的缩写，例如，CPU是central processingunit的缩写语。成语或诗词可以是不同语言中一部分定型的词组或短句。

查询模块2，其配置为，针对所述第一部分内容，查询以所述N个词汇为整体所对应的释义的语义片段。

其中，查询模块2配置为查询以N个词汇为整体所对应的释义的语义片段，可以包括：将包含有N个词汇的第一部分内容在网络上查询其所对应的释义的语义片段。例如，服务器中存储有与N个词汇为整体对应的释义的语义片段，将包含N个词汇的第一部分内容发送到服务器，服务器通过对该第一部分内容进行检索，并将获取的与N个词汇为整体所对应的释义的语义片段返回。

展示模块3，其配置为，展示查询结果所得到的所述语义片段，作为所述第一部分的释义结果。

其中，展示模块3配置为展示查询结果所得到的语义片段，包括：

将语义片段作为第一部分内容的翻译结果予以单独展示。

通过识别模块1识别文本中特定的第一部分内容，针对包含N个词汇的第一部分内容，查询模块2查询以N个词汇为整体所对应的释义的语义片段，展示模块3展示查询结果所得到的语义片段，作为第一部分内容的释义结果，从而文本中的第一部分内容能够得到准确的释义，从而避免对第一部分内容的N个词汇分别进行直译以得到错误的翻译。

在一个实施例中，识别模块1，配置为，根据以下的一种或多种因素的组合确定所述文本中用户可能存在理解困难的内容，作为特定的第一部分内容：

如图4所示，在一个实施例中，释义装置还包括：

翻译模块4，其配置为，针对文本的第二部分内容进行逐个词汇对应地翻译，得到第二部分的翻译结果；

组合模块5，其配置为，第二部分内容的翻译结果，以及第一部分内容的释义结果组合构成对文本第一部分内容以及第二部分内容的翻译结果。

其中，本文实施例中的释义装置中提及的释义结果或翻译结果与文本可以为不同种语言，或者，释义结果或翻译结果与文本也可以为同种语言

当释义结果或翻译结果与文本为不同种语言时，是由一种语言翻译为另一种语言，

当释义结果或翻译结果与文本为同种语言时，是对文本的释义、解释。

一种释义装置，还包括：

文字输入装置，其配置为输入文字文本；

或者语音输入装置，其配置为输入语音文字。

例如，对文字输入装置输入的文字文本的特定第一部分内容进行释义，并将释义结果以文字文本进行显示。或者，对语音输入装置输入的语音文本先识别为文字文本，在按照文字文本的释义过程进行释义，并将释义结果以文字文本进行显示。当然，对语音输入装置输入的的语音文本进行处理时，可以对语音文本的特定第一部分内容进行释义，并将释义结果以语音文本的形式(以语音文本进行输出)展示。

一个实施例中的释义装置还包括：

判断模块，其配置为，确定文本中重复词汇，并且根据预设的判断规则判定重复词汇不具有明确含义的，去除重复词汇。

其中，判断模块配置为根据预设的判断规则判定重复词汇不具有明确含义的，包括：重复词汇属于语气词、或者助词、或者用户的口头禅词汇。

以上实施例仅为本发明的示例性实施例，不用于限制本发明，本发明的保护范围由权利要求书限定。本领域技术人员可以在本发明的实质和保护范围内，对本发明做出各种修改或等同替换，这种修改或等同替换也应视为落在本发明的保护范围内。

Claims

1.一种释义方法，其特征在于，包括：

2.根据权利要求1所示的方法，其特征在于，还包括：

3.根据权利要求1所示的方法，其特征在于，所述识别出所述文本中特定的第一部分内容，包括：

4.根据权利要求1所示的方法，其特征在于，所述识别出所述文本中特定的第一部分内容，包括：

5.根据权利要求1所示的方法，其特征在于，所述展示查询结果所得到的所述语义片段，包括：

6.根据权利要求1-5中任一项所述的方法，其特征在于，

释义结果或翻译结果与所述文本为不同种语言，或者，

释义结果或翻译结果与所述文本为同种语言。

7.根据权利要求1所述的方法，其特征在于，所述查询以所述N个词汇为整体所对应的释义的语义片段，包括：

8.根据权利要求1所述的方法，其特征在于，所述文本，包括：文字文本，或者语音文本。

9.根据权利要求1-5中任一项所述的方法，其特征在于，还包括：

确定所述文本中重复词汇，并且根据预设的判断规则判定所述重复词汇不具有明确含义的，去除所述重复词汇。

10.根据权利要求9所述的方法，其特征在于，

所述根据预设的判断规则判定所述重复词汇不具有明确含义的，包括：

11.一种释义装置，其特征在于，包括：

12.根据权利要求11所述的装置，其特征在于，

所述识别模块，配置为，根据以下的一种或多种因素的组合确定所述文本中用户可能存在理解困难的内容，作为特定的第一部分内容：

13.根据权利要求1所述的装置，其特征在于，还包括：

文字输入装置，其配置为输入文字文本；

或者语音输入装置，其配置为输入语音文字。