CN108549643B - 翻译处理方法和装置 - Google Patents

翻译处理方法和装置 Download PDF

Info

Publication number
CN108549643B
CN108549643B CN201810305392.0A CN201810305392A CN108549643B CN 108549643 B CN108549643 B CN 108549643B CN 201810305392 A CN201810305392 A CN 201810305392A CN 108549643 B CN108549643 B CN 108549643B
Authority
CN
China
Prior art keywords
text
paragraph
translated
original text
shot image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810305392.0A
Other languages
English (en)
Other versions
CN108549643A (zh
Inventor
王晓辉
张蕾
奚佳芸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810305392.0A priority Critical patent/CN108549643B/zh
Publication of CN108549643A publication Critical patent/CN108549643A/zh
Application granted granted Critical
Publication of CN108549643B publication Critical patent/CN108549643B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

本发明提出一种翻译处理方法和装置,其中,方法包括:通过从客户端获取待翻译文本的拍摄图像,对所述拍摄图像进行识别,以确定所述待翻译文本中各段落的原文;再对各段落的原文进行翻译,得到各段落的译文,最终向客户端发送各段落的原文和相应译文,其中,所述各段落的原文和相应译文,用于所述客户端对照展示。本发明能够提供一种双语文字对照和智能分段的显示方法,实现智能分段对照翻译功能,解决现有技术中翻译软件功能单一的技术问题。

Description

翻译处理方法和装置
技术领域
本发明涉及人工智能技术领域,尤其涉及一种翻译处理方法和装置。
背景技术
在现有技术中,存在多种类型的语言翻译类软件,可以将用户输入文本形式的内容翻译为所需的语言。但在一些场景下,这种翻译方式用户操作较为繁琐,例如:用户需要对纸质书籍上的内容进行翻译时,需要手动输入,操作较为不便捷。
现有技术,为了避免用户手动输入,可以对图像进行字符识别。但现有技术中,是根据识别出的全部字符进行翻译,在文档较长时,需要用户自行查询文档不同部分的翻译结果,因此,现有技术中的翻译软件功能较为单一。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明提出了一种翻译处理方法,以实现智能分段对照翻译功能,解决现有技术中翻译软件功能单一的技术问题。
本发明第一方面实施例提出了一种翻译处理方法,包括:
从客户端获取待翻译文本的拍摄图像;
对所述拍摄图像进行识别,以确定所述待翻译文本中各段落的原文;
对各段落的原文进行翻译,得到各段落的译文;
向客户端发送各段落的原文和相应译文;其中,所述各段落的原文和相应译文,用于所述客户端对照展示。
本发明实施例的翻译处理方法,通过从客户端获取待翻译文本的拍摄图像,对所述拍摄图像进行识别,以确定所述待翻译文本中各段落的原文;再对各段落的原文进行翻译,得到各段落的译文,最终向客户端发送各段落的原文和相应译文,其中,所述各段落的原文和相应译文,用于所述客户端对照展示。该方法能够提供一种双语文字对照和智能分段的显示方法,实现客户端显示界面分段显示待翻译文本中各段落的原文,以及对各段落的原文进行翻译,得到各段落的译文,解决现有技术中翻译软件功能单一的技术问题。
为达上述目的,本发明第二方面实施例提出了另一种翻译处理方法,包括:
拍摄得到待翻译文本的拍摄图像;
向服务器发送所述拍摄图像,所述拍摄图像用于所述服务器进行识别,以确定所述待翻译文本中各段落的原文,以及对各段落的原文进行翻译,得到各段落的译文;
从所述服务器获取各段落的原文和相应译文;
根据各段落的原文和相应译文进行对照展示。
本发明实施例的翻译处理方法,通过拍摄得到待翻译文本的拍摄图像,然后向服务器发送所述拍摄图像,所述拍摄图像用于所述服务器进行识别,以确定所述待翻译文本中各段落的原文,以及对各段落的原文进行翻译,得到各段落的译文,再从所述服务器获取各段落的原文和相应译文,根据各段落的原文和相应译文进行对照展示。该方法能够提供一种双语文字对照和智能分段的显示方法,实现智能分段对照翻译功能,解决现有技术中翻译软件功能单一的技术问题。
为达上述目的,本发明第三方面实施例提出了一种翻译处理装置,包括:
获取模块,用于从客户端获取待翻译文本的拍摄图像;
识别模块,用于对所述拍摄图像进行识别,以确定所述待翻译文本中各段落的原文;
翻译模块,用于对各段落的原文进行翻译,得到各段落的译文;
发送模块,用于向客户端发送各段落的原文和相应译文;其中,所述各段落的原文和相应译文,用于所述客户端对照展示。
本发明实施例的翻译处理装置,通过从客户端获取待翻译文本的拍摄图像,对所述拍摄图像进行识别,以确定所述待翻译文本中各段落的原文;再对各段落的原文进行翻译,得到各段落的译文,最终向客户端发送各段落的原文和相应译文,其中,所述各段落的原文和相应译文,用于所述客户端对照展示。该方法能够提供一种双语文字对照和智能分段的显示方法,实现智能分段对照翻译功能,解决现有技术中翻译软件功能单一的技术问题。
为达上述目的,本发明第四方面实施例提出了另一种翻译处理装置,包括:
拍摄模块,用于拍摄得到待翻译文本的拍摄图像;
发送模块,用于向服务器发送所述拍摄图像,所述拍摄图像用于所述服务器进行识别,以确定所述待翻译文本中各段落的原文,以及对各段落的原文进行翻译,得到各段落的译文;
获取模块,用于从所述服务器获取各段落的原文和相应译文;
展示模块,用于根据各段落的原文和相应译文进行对照展示。
本发明实施例的另一种翻译处理装置,通过拍摄得到待翻译文本的拍摄图像,然后向服务器发送所述拍摄图像,所述拍摄图像用于所述服务器进行识别,以确定所述待翻译文本中各段落的原文,以及对各段落的原文进行翻译,得到各段落的译文,再从所述服务器获取各段落的原文和相应译文,根据各段落的原文和相应译文进行对照展示。该方法能够提供一种双语文字对照和智能分段的显示方法,实现智能分段对照翻译功能,解决现有技术中翻译软件功能单一的技术问题。
为了实现上述目的,本发明第五方面实施例提出了一种计算机设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行第一方面实施例所述的调度方法。
为了实现上述目的,本发明第六方面实施例提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,用于执行第一方面实施例所述的翻译处理方法。
为了实现上述目的,本发明第七方面实施例提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时实现如本发明第一方面实施例所述的翻译处理方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例所提供的一种翻译处理方法的流程示意图;
图2为本发明实施例所提供的拍照翻译功能用户界面首页示意图;
图3为本发明实施例所提供的图片翻译服务请求中的示意图;
图4为本发明实施例所提供的图片翻译结果示意图;
图5为本发明实施例所提供的纯文本对照翻译结果示意图;
图6为本发明实施例所提供的智能分段显示结果示意图;
图7为本发明实施例所提供的分段式双语对照翻译结果示意图;
图8为本发明实施例所提供的另一种翻译处理方法的流程示意图;
图9为本发明实施例所提供的编辑原文用户界面示意图;
图10为本发明实施例所提供的代详细释义的用户界面示意图;
图11为本发明实施例所提供的一种翻译处理装置的结构示意图;
图12为本发明实施例所提供的另一种翻译处理装置的结构示意图;
图13为本发明实施例所提供的又一种翻译处理装置的结构示意图;以及
图14示出了适于用来实现本申请实施方式的示例性计算机设备的框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的翻译处理方法和装置。
图1为本发明实施例所提供的一种翻译处理方法的流程示意图,如图1所示,该翻译处理方法,可以由服务器执行,该服务器与客户端通信连接,包括以下步骤:
步骤101,从客户端获取待翻译文本的拍摄图像。
其中,待翻译文本的拍摄图像包括从客户端上传的图片或者通过摄像头拍摄的图像。客户端显示界面显示拍照翻译或图片翻译的功能时,通过如图2所示按钮1选择设备中已有的图片或者通过图2所示按钮2直接对待翻译文本进行拍摄。
具体地,待翻译文本的拍摄图像是通过在客户端的显示界面显示所述待翻译文本的预览画面,以及在所述预览画面上方悬浮显示参考线后,拍摄得到的。其中,参考线包括相互垂直的横向参考线和纵向参考线,所述横向参考线和纵向参考线相互交叠,呈网格状排布。横向参考线和纵向参考线以九宫格的方式交互排布,对文本拍摄时,通过参考线调整拍照角度,保证拍摄质量,防止拍摄文本时出现变形的情况。
步骤102,对所述拍摄图像进行识别,以确定所述待翻译文本中各段落的原文。
具体地,拍摄图像沿与参考线方向相垂直的方向进行扫描,确定垂直方向上的图像灰度分布,再根据图像灰度分布,确定各段落在所述拍摄图像中的显示区域,通过横向参考线和纵向参考线对齐所述待翻译文本中一行文本对显示区域进行字符识别。如图3所示,服务器沿着图2所示的对齐参考线通过光学字符识别(Optical Character Recognition,OCR)扫描技术实现对原文的识别。如图4所示在区域1显示拍摄图像的翻译结果,可以通过界面下方的对照翻译按钮也即入口1,来查看基于图片翻译结果的双语文字对照及智能分段的翻译结果。
作为一种可能的实现方式,为了对拍摄图像中的原文进行分段,首先,根据所述图像灰度分布,识别在所述垂直方向上灰度高于阈值灰度的目标区域,灰度值大于阈值的像素分为一类,灰度值小于阈值的像素为另一类;再根据各目标区域之间的间隔,确定各段落在所述拍摄图像中的显示区域;其中,对应同一段落的显示区域中,包含的各目标区域间隔不大于平均间隔;所述平均间隔是对全部目标区域之间的间隔计算得到的。
步骤103,对各段落的原文进行翻译,得到各段落的译文。
具体地,对各段落原文的翻译是通过自然语言翻译实现的,是利用计算机把一种自然源语言转换成另一种自然目标语言。本实施例中,服务器通过自然语言翻译将待翻译的文本与数据库中海量的资源进行匹配得到各段落的译文,客户端显示对各段落的原文进行翻译的纯文本双语对照结果,如图5所示,以分段的方式对纯文本双语进行显示。各段落的译文根据拍摄图像的信息进行智能的段落划分显示,如图6所示,智能的将待翻译原文以及译文进行段落划分。
进一步地,为了获得更准确的译文,由于通过OCR得到原文时,在换行位置,往往识别为一句话结束,在该处设置换行符。因此,可以在翻译之前,根据标点,删除句子中间的换行符,以增加原文中句子完整性,提高翻译的准确程度。
步骤104,向客户端发送各段落的原文和相应译文。
其中,所述各段落的原文和相应译文,用于所述客户端对照展示。
具体地,服务器完成对待翻译文本的智能分段和译文后,会向客户端发送各段落的原文和相应译文,同时会在客户端显示界面对照显示出原文和相应译文,如图7所示。
本实施例中,通过从客户端获取待翻译文本的拍摄图像,对所述拍摄图像进行识别,以确定所述待翻译文本中各段落的原文;再对各段落的原文进行翻译,得到各段落的译文,最终向客户端发送各段落的原文和相应译文,其中,所述各段落的原文和相应译文,用于所述客户端对照展示。该方法能够提供一种双语文字对照和智能分段的显示方法,实现智能分段对照翻译功能,解决现有技术中翻译软件功能单一的技术问题。
为了清楚说明上一实施例,本实施例提供了另一种翻译处理方法,本实施例提供的方法可以由客户端执行,该客户端与执行前述实施例的服务器通信连接,图8为本发明实施例二所提供的另一种翻译处理方法的流程示意图,如图8所示,该翻译处理方法,包括以下步骤:
步骤201,拍摄得到待翻译文本的拍摄图像。
具体地,客户端对待翻译文本进行拍摄得到待翻译文本的拍摄图像。
作为一种可能的实现方式,客户端显示界面显示所述待翻译文本的预览画面以及在预览画面悬浮显示的参考线,其中,参考线包括相互垂直的横向参考线和纵向参考线,所述横向参考线和所述纵向参考线相互交叠,呈网格状排布。横向参考线和纵向参考线以九宫格的方式交互排布,对文本拍摄时,通过参考线调整拍照角度,保证拍摄质量,防止拍摄文本时出现变形的情况。当执行拍摄功能时,探测到拍摄操作时,进行拍摄得到待翻译文本的拍摄图像。
步骤202,向服务器发送所述拍摄图像,所述拍摄图像用于所述服务器进行识别,以确定所述待翻译文本中各段落的原文,以及对各段落的原文进行翻译,得到各段落的译文。
具体地,客户端将待翻译文本的拍摄图像发送到服务器后,服务器对拍摄的图像通过扫描技术进行识别,确定待翻译文本中各段落的原文并进行智能分段显示。对各段落原文进行翻译时,客户端向服务器发送翻译指令,服务器再通过将待翻译文本中各段落的原文与数据库中海量的资源进行匹配得到各段落的译文。
步骤203,从所述服务器获取各段落的原文和相应译文。
具体地,客户端将待翻译文本中各段落的原文发送至服务器后,还可以对原文进行编辑,包括添加、删除、修改文本,如图9所示,编辑完成后,点击界面右上角完成按钮,再将编辑后的原文发送至服务器进行翻译,获得相应译文。如图7,在客户端显示界面左侧,还可以点击发音按钮选择对原文或者译文进行语音播放。
步骤204,根据各段落的原文和相应译文进行对照展示。
本发明实施例中,服务器根据探测到的翻译指令,加载对应的显示模板,将各段落的原文和相应译文进行对照展示。客户端显示模板中对应位置显示待翻译原文、译文和单词释义中的至少两个,如图10所示,显示模块的对应位置显示了待翻译原文、译文和单词释义。
本发明实施例的翻译处理方法,通过从客户端获取待翻译文本的拍摄图像,对所述拍摄图像进行识别,以确定所述待翻译文本中各段落的原文;再对各段落的原文进行翻译,得到各段落的译文,最终向客户端发送各段落的原文和相应译文,其中,所述各段落的原文和相应译文,用于所述客户端对照展示。该方法能够提供一种双语文字对照和智能分段的显示方法,实现智能分段对照翻译功能,解决现有技术中翻译软件功能单一的技术问题。本实施例中,客户端显示界面分段显示待翻译文本中各段落的原文,以及对各段落的原文进行翻译,得到各段落的译文,并对识别并翻译的段落译文内容提供详细释义。用户也可对各段落的原文进行编辑,并对编辑后的原文进行翻译和语音播放。该方法能够提供一种双语文字对照和智能分段的显示方法,实现智能分段对照翻译功能,解决现有技术中翻译软件功能单一的技术问题。
需要说明的是,前述对翻译处理方法实施例的解释说明也适用于该实施例的翻译处理装置,此处不再赘述。
为了实现上述实施例,本发明还提出一种翻译处理装置,该装置可以设置于服务器。
图11为本发明实施例所提供的一种翻译处理装置的结构示意图。
如图11所示,该翻译处理装置包括:获取模块111、识别模块112、翻译模块113、发送模块114。
获取模块111,用于从客户端获取待翻译文本的拍摄图像。
其中,所述拍摄图像,是在所述客户端的显示界面显示所述待翻译文本的预览画面,以及在所述预览画面上方悬浮显示参考线后,拍摄得到的。作为一种可能的实现方式,参考线用于对齐所述待翻译文本中一行文本。所述参考线包括相互垂直的横向参考线和纵向参考线,所述横向参考线和所述纵向参考线相互交叠,呈网格状排布。
识别模块112,用于对所述拍摄图像进行识别,以确定所述待翻译文本中各段落的原文。
具体地,识别模块112具体用于对所述拍摄图像沿与所述参考线方向相垂直方向进行扫描,确定垂直方向上的图像灰度分布;根据所述图像灰度分布,确定各段落在所述拍摄图像中的显示区域;对所述显示区域进行字符识别,以确定相应段落的原文。
其中,识别模块112根据所述图像灰度分布,确定各段落在所述拍摄图像中的显示区域,包括:根据所述图像灰度分布,识别在所述垂直方向上灰度高于阈值灰度的目标区域;根据各目标区域之间的间隔,确定各段落在所述拍摄图像中的显示区域;其中,对应同一段落的显示区域中,包含的各目标区域符合间隔不大于平均间隔;所述平均间隔是对全部目标区域之间的间隔计算得到的。
翻译模块113,用于对各段落的原文进行翻译,得到各段落的译文。
发送模块114,用于向客户端发送各段落的原文和相应译文;其中,所述各段落的原文和相应译文,用于所述客户端对照展示。
需要说明的是,前述对调度方法实施例的解释说明也适用于该实施例的调度装置,此处不再赘述。
本发明实施例的翻译处理装置,通过从客户端获取待翻译文本的拍摄图像,对所述拍摄图像进行识别,以确定所述待翻译文本中各段落的原文;再对各段落的原文进行翻译,得到各段落的译文,最终向客户端发送各段落的原文和相应译文,其中,所述各段落的原文和相应译文,用于所述客户端对照展示。该方法能够提供一种双语文字对照和智能分段的显示方法,实现智能分段对照翻译功能,解决现有技术中翻译软件功能单一的技术问题。
在本发明实施例还提供了另一种翻译处理装置。该装置可以设置于客户端。图12为本发明实施例所提供的另一种翻译处理装置的结构示意图。
如图12所示,该翻译处理装置包括:拍摄模块121、发送模块122、获取模块123、展示模块124。
拍摄模块121,用于拍摄得到待翻译文本的拍摄图像。
具体地,拍摄模块121具体用于显示所述待翻译文本的预览画面,以及在所述预览画面上方悬浮显示参考线;当探测到拍摄操作时,进行拍摄。
可以选择设备中已有的图片或者直接对待翻译文本进行拍摄得到待翻译文本的拍摄图像。客户端显示界面显示带翻译文本的预览画面以及在预览画面悬浮显示的参考线,其中,参考线包括相互垂直的横向参考线和纵向参考线,所述横向参考线和所述纵向参考线相互交叠,呈网格状排布。通过参考线调整拍照角度,保证拍摄质量,防止拍摄文本时出现变形的情况。当执行拍摄功能时,客户端探测到拍摄操作,则进行拍摄得到待翻译文本的拍摄图像。
发送模块122,用于向服务器发送所述拍摄图像,所述拍摄图像用于所述服务器进行识别,以确定所述待翻译文本中各段落的原文,以及对各段落的原文进行翻译,得到各段落的译文。
具体地,客户端获得待翻译文本的拍摄图像后,向服务器发送拍摄图像,服务器通过扫描技术对拍摄图像进行识别,并智能的对待翻译文本进行分段。服务器接收到翻译指令后对各段落的原文进行翻译,得到各段落的译文。
获取模块123,用于从所述服务器获取各段落的原文和相应译文。
展示模块124,用于根据各段落的原文和相应译文进行对照展示。
具体地,展示模块124,具体用于根据探测到的翻译指令,加载对应的显示模板;在所述显示模板中对应位置显示所述原文、所述译文和单词释义中的至少两个。
进一步地,作为一种可能的实现方式,在图12的基础上,本发明实施例提供了又一种翻译处理装置,图13为本发明实施例所提供的又一种翻译处理装置的结构示意图,如图13所示,翻译处理装置还包括:处理模块125。
处理模块125,用于对所述原文进行编辑,并对编辑后的原文进行翻译;或者,根据所述原文或所述译文进行语音播放。
需要说明的是,前述对调度方法实施例的解释说明也适用于该实施例的调度装置,此处不再赘述。
本发明实施例的翻译处理装置,通过从客户端获取待翻译文本的拍摄图像,对所述拍摄图像进行识别,以确定所述待翻译文本中各段落的原文;再对各段落的原文进行翻译,得到各段落的译文,最终向客户端发送各段落的原文和相应译文,其中,所述各段落的原文和相应译文,用于所述客户端对照展示。本实施例中,客户端显示界面分段显示待翻译文本中各段落的原文,以及对各段落的原文进行翻译,得到各段落的译文,并对识别并翻译的段落译文内容提供详细释义。该方法能够提供一种双语文字对照和智能分段的显示方法,实现智能分段对照翻译功能,解决现有技术中翻译软件功能单一的技术问题。
为了实现上述实施例,本发明还提出另一种计算机设备,包括:处理器和用于存储所述处理器可执行指令的存储器。
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如本发明前述实施例提出的翻译处理方法。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本发明前述实施例提出的翻译处理方法。
为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时实现如本发明前述实施例提出的企业的行业类型识别方法。
为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,实现如本发明前述实施例提出的翻译处理方法。
图14示出了适于用来实现本申请实施方式的示例性计算机设备的框图。图14显示的计算机设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图14所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图14未显示,通常称为“硬盘驱动器”)。尽管图14中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local AreaNetwork;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种翻译处理方法,应用于服务器,其特征在于,包括以下步骤:
从客户端获取待翻译文本的拍摄图像;
对所述拍摄图像进行识别,以确定所述待翻译文本中各段落的原文;
对各段落的原文进行翻译,得到各段落的译文;
向客户端发送各段落的原文和相应译文;其中,所述各段落的原文和相应译文,用于所述客户端对照展示,其中,包括显示单词释义;
其中,所述向客户端发送各段落的原文和相应译文之后,所述客户端对所述原文进行编辑,所述服务器对编辑后的原文进行翻译;
其中,所述对所述拍摄图像进行识别,以确定所述待翻译文本中各段落的原文,包括:
对所述拍摄图像沿与参考线方向相垂直方向进行扫描,确定垂直方向上的图像灰度分布;
根据所述图像灰度分布,确定各段落在所述拍摄图像中的显示区域;
对所述显示区域进行字符识别,以确定相应段落的原文;
所述根据所述图像灰度分布,确定各段落在所述拍摄图像中的显示区域,包括:
根据所述图像灰度分布,识别在所述垂直方向上灰度高于阈值灰度的目标区域;
根据各目标区域之间的间隔,确定各段落在所述拍摄图像中的显示区域;其中,对应同一段落的显示区域中,包含的各目标区域符合间隔不大于平均间隔;所述平均间隔是对全部目标区域之间的间隔计算得到的;
所述拍摄图像,是在所述客户端的显示界面显示所述待翻译文本的预览画面,以及在所述预览画面上方悬浮显示参考线后,拍摄得到的;所述参考线用于对齐所述待翻译文本中一行文本。
2.根据权利要求1所述的翻译处理方法,其特征在于,所述参考线包括相互垂直的横向参考线和纵向参考线,所述横向参考线和所述纵向参考线相互交叠,呈网格状排布。
3.一种翻译处理方法,应用于客户端,其特征在于,所述方法包括:
拍摄得到待翻译文本的拍摄图像;
向服务器发送所述拍摄图像,所述拍摄图像用于所述服务器进行识别,以确定所述待翻译文本中各段落的原文,以及对各段落的原文进行翻译,得到各段落的译文;
从所述服务器获取各段落的原文和相应译文;
根据各段落的原文和相应译文进行对照展示,其中,包括显示单词释义;
其中,所述从所述服务器获取各段落的原文和相应译文之后,还包括:
多所述原文进行编辑,所述服务器对编辑后的原文进行翻译;
所述确定所述待翻译文本中各段落的原文,包括:
所述服务器对所述拍摄图像沿与参考线方向相垂直方向进行扫描,确定垂直方向上的图像灰度分布;
所述服务器根据所述图像灰度分布,确定各段落在所述拍摄图像中的显示区域;
所述服务器对所述显示区域进行字符识别,以确定相应段落的原文;
所述服务器根据所述图像灰度分布,确定各段落在所述拍摄图像中的显示区域,包括:
根据所述图像灰度分布,识别在所述垂直方向上灰度高于阈值灰度的目标区域;
根据各目标区域之间的间隔,确定各段落在所述拍摄图像中的显示区域;其中,对应同一段落的显示区域中,包含的各目标区域符合间隔不大于平均间隔;所述平均间隔是对全部目标区域之间的间隔计算得到的;
所述拍摄得到待翻译文本的拍摄图像,包括:
显示所述待翻译文本的预览画面,以及在所述预览画面上方悬浮显示参考线,所述参考线用于对齐所述待翻译文本中一行文本;
当探测到拍摄操作时,进行拍摄。
4.根据权利要求3所述的翻译处理方法,其特征在于,所述参考线包括相互垂直的横向参考线和纵向参考线,所述横向参考线和所述纵向参考线相互交叠,呈网格状排布。
5.根据权利要求3所述的翻译处理方法,其特征在于,所述根据各段落的原文和相应译文进行对照展示,包括:
根据探测到的翻译指令,加载对应的显示模板;
在所述显示模板中对应位置显示所述原文、所述译文和单词释义中的至少两个。
6.根据权利要求3-5任一项所述的翻译处理方法,其特征在于,所述从所述服务器获取各段落的原文和相应译文之后,还包括:
根据所述原文或所述译文进行语音播放。
7.一种翻译处理装置,其特征在于,所述装置包括:
获取模块,用于从客户端获取待翻译文本的拍摄图像;
识别模块,用于对所述拍摄图像进行识别,以确定所述待翻译文本中各段落的原文;
翻译模块,用于对各段落的原文进行翻译,得到各段落的译文;
发送模块,用于向客户端发送各段落的原文和相应译文;其中,所述各段落的原文和相应译文,用于所述客户端对照展示,其中,包括显示单词释义;
其中,所述向客户端发送各段落的原文和相应译文之后,所述客户端对所述原文进行编辑,所述装置对编辑后的原文进行翻译;
所述识别模块,具体用于对所述拍摄图像沿与参考线方向相垂直方向进行扫描,确定垂直方向上的图像灰度分布;根据所述图像灰度分布,确定各段落在所述拍摄图像中的显示区域;对所述显示区域进行字符识别,以确定相应段落的原文;
所述根据所述图像灰度分布,确定各段落在所述拍摄图像中的显示区域,包括:
根据所述图像灰度分布,识别在所述垂直方向上灰度高于阈值灰度的目标区域;
根据各目标区域之间的间隔,确定各段落在所述拍摄图像中的显示区域;其中,对应同一段落的显示区域中,包含的各目标区域符合间隔不大于平均间隔;所述平均间隔是对全部目标区域之间的间隔计算得到的;
所述拍摄图像,是在所述客户端的显示界面显示所述待翻译文本的预览画面,以及在所述预览画面上方悬浮显示参考线后,拍摄得到的;所述参考线用于对齐所述待翻译文本中一行文本。
8.一种翻译处理装置,其特征在于,所述装置包括:
拍摄模块,用于拍摄得到待翻译文本的拍摄图像;
发送模块,用于向服务器发送所述拍摄图像,所述拍摄图像用于所述服务器进行识别,以确定所述待翻译文本中各段落的原文,以及对各段落的原文进行翻译,得到各段落的译文;
获取模块,用于从所述服务器获取各段落的原文和相应译文;
展示模块,用于根据各段落的原文和相应译文进行对照展示,其中,包括显示单词释义;
其中,所述从所述服务器获取各段落的原文和相应译文之后,还包括:
对所述原文进行编辑,所述服务器对编辑后的原文进行翻译;
所述确定所述待翻译文本中各段落的原文,包括:
所述服务器对所述拍摄图像沿与参考线方向相垂直方向进行扫描,确定垂直方向上的图像灰度分布;
所述服务器根据所述图像灰度分布,确定各段落在所述拍摄图像中的显示区域;
所述服务器对所述显示区域进行字符识别,以确定相应段落的原文;
所述服务器根据所述图像灰度分布,确定各段落在所述拍摄图像中的显示区域,包括:
根据所述图像灰度分布,识别在所述垂直方向上灰度高于阈值灰度的目标区域;
根据各目标区域之间的间隔,确定各段落在所述拍摄图像中的显示区域;其中,对应同一段落的显示区域中,包含的各目标区域符合间隔不大于平均间隔;所述平均间隔是对全部目标区域之间的间隔计算得到的;
所述拍摄得到待翻译文本的拍摄图像,包括:
显示所述待翻译文本的预览画面,以及在所述预览画面上方悬浮显示参考线,所述参考线用于对齐所述待翻译文本中一行文本;
当探测到拍摄操作时,进行拍摄。
9.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-2中任一所述的翻译处理方法,或者,权利要求3-6任一项所述的翻译处理方法。
10.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-2中任一所述的翻译处理方法,或者,权利要求3-6任一项所述的翻译处理方法。
CN201810305392.0A 2018-04-08 2018-04-08 翻译处理方法和装置 Active CN108549643B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810305392.0A CN108549643B (zh) 2018-04-08 2018-04-08 翻译处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810305392.0A CN108549643B (zh) 2018-04-08 2018-04-08 翻译处理方法和装置

Publications (2)

Publication Number Publication Date
CN108549643A CN108549643A (zh) 2018-09-18
CN108549643B true CN108549643B (zh) 2022-08-05

Family

ID=63514139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810305392.0A Active CN108549643B (zh) 2018-04-08 2018-04-08 翻译处理方法和装置

Country Status (1)

Country Link
CN (1) CN108549643B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109766304A (zh) * 2018-12-11 2019-05-17 中新金桥数字科技(北京)有限公司 基于iPad的关于Epub图书双语言对照阅读的方法及其系统
CN110135429A (zh) * 2019-04-18 2019-08-16 深圳壹账通智能科技有限公司 扫描文字分段方法、装置、计算机设备和存储介质
CN111931522A (zh) * 2019-04-26 2020-11-13 安徽奇智科技有限公司 翻译学习方法及装置
CN110389807B (zh) * 2019-07-23 2022-10-25 北京字节跳动网络技术有限公司 一种界面翻译方法、装置、电子设备及存储介质
CN112764599B (zh) * 2019-11-01 2023-03-10 北京搜狗科技发展有限公司 一种数据处理方法、装置和介质
CN111178086B (zh) * 2019-12-19 2024-05-17 北京搜狗科技发展有限公司 数据处理方法、装置和介质
CN111240962B (zh) * 2019-12-31 2023-09-05 中移(杭州)信息技术有限公司 测试方法、装置、计算机设备及计算机存储介质
CN111339789B (zh) * 2020-02-20 2023-08-01 北京字节跳动网络技术有限公司 一种翻译模型训练方法、装置、电子设备及存储介质
CN113687883A (zh) * 2020-05-18 2021-11-23 阿里巴巴集团控股有限公司 数据展示方法、装置、电子设备及计算机可读存储介质
CN111753556B (zh) * 2020-06-24 2022-01-04 掌阅科技股份有限公司 双语对照阅读的方法、终端及计算机存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268372A (ja) * 2005-03-23 2006-10-05 Fuji Xerox Co Ltd 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム
CN101458770A (zh) * 2008-12-24 2009-06-17 北京文通科技有限公司 一种文字识别的方法和系统
CN103970723A (zh) * 2014-05-16 2014-08-06 山西大学 基于图像检测和切割的电子文档屏幕显示方法
US8965129B2 (en) * 2013-03-15 2015-02-24 Translate Abroad, Inc. Systems and methods for determining and displaying multi-line foreign language translations in real time on mobile devices
CN105761201A (zh) * 2016-02-02 2016-07-13 山东大学 一种翻译图片中文字的方法
CN106021238A (zh) * 2016-06-28 2016-10-12 广州华多网络科技有限公司 信息匹配方法、装置及终端
CN107291703A (zh) * 2017-05-17 2017-10-24 百度在线网络技术(北京)有限公司 翻译服务应用中的发音方法及装置
CN107656922A (zh) * 2017-09-25 2018-02-02 广东小天才科技有限公司 一种翻译方法、装置、终端及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9251144B2 (en) * 2011-10-19 2016-02-02 Microsoft Technology Licensing, Llc Translating language characters in media content
CN102567300B (zh) * 2011-12-29 2013-11-27 方正国际软件有限公司 图片文档的处理方法及装置
US9558158B2 (en) * 2015-03-06 2017-01-31 Translation Management Systems, Ltd Automated document translation
CN107301418A (zh) * 2017-06-28 2017-10-27 江南大学 光学字符识别中的版面分析
CN107609553A (zh) * 2017-09-12 2018-01-19 网易有道信息技术(北京)有限公司 图像处理方法、介质、装置和计算设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268372A (ja) * 2005-03-23 2006-10-05 Fuji Xerox Co Ltd 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム
CN101458770A (zh) * 2008-12-24 2009-06-17 北京文通科技有限公司 一种文字识别的方法和系统
US8965129B2 (en) * 2013-03-15 2015-02-24 Translate Abroad, Inc. Systems and methods for determining and displaying multi-line foreign language translations in real time on mobile devices
CN103970723A (zh) * 2014-05-16 2014-08-06 山西大学 基于图像检测和切割的电子文档屏幕显示方法
CN105761201A (zh) * 2016-02-02 2016-07-13 山东大学 一种翻译图片中文字的方法
CN106021238A (zh) * 2016-06-28 2016-10-12 广州华多网络科技有限公司 信息匹配方法、装置及终端
CN107291703A (zh) * 2017-05-17 2017-10-24 百度在线网络技术(北京)有限公司 翻译服务应用中的发音方法及装置
CN107656922A (zh) * 2017-09-25 2018-02-02 广东小天才科技有限公司 一种翻译方法、装置、终端及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于简化Mumford-Shah模型的文本行和段落分割算法;赵娜等;《信息技术与信息化》;20090531(第05期);第66-69页 *

Also Published As

Publication number Publication date
CN108549643A (zh) 2018-09-18

Similar Documents

Publication Publication Date Title
CN108549643B (zh) 翻译处理方法和装置
CN110458918B (zh) 用于输出信息的方法和装置
CN109766879B (zh) 字符检测模型的生成、字符检测方法、装置、设备及介质
CN108073910B (zh) 用于生成人脸特征的方法和装置
US6473523B1 (en) Portable text capturing method and device therefor
US8819545B2 (en) Digital comic editor, method and non-transitory computer-readable medium
CN111612696B (zh) 图像拼接方法、装置、介质及电子设备
CN108108342B (zh) 结构化文本的生成方法、检索方法及装置
EP3709212A1 (en) Image processing method and device for processing image, server and storage medium
CN111738041A (zh) 一种视频分割方法、装置、设备及介质
US20130104016A1 (en) Digital comic editor, method and non-transitory computer-readable medium
US10929684B2 (en) Intelligently generating digital note compilations from digital video
US9087272B2 (en) Optical match character classification
US20200294187A1 (en) Ground truth generation from scanned documents
CN110727816A (zh) 兴趣点类别确定方法和装置
CN113436222A (zh) 图像处理方法、图像处理装置、电子设备及存储介质
CN114359160B (zh) 一种屏幕的检测方法、装置、电子设备及存储介质
CN111832551A (zh) 文本图像处理方法、装置、电子扫描设备和存储介质
CN109034032B (zh) 图像处理方法、装置、设备及介质
CN111815748B (zh) 一种动画处理方法、装置、存储介质及电子设备
CN113780330A (zh) 图像校正方法及装置、计算机存储介质、电子设备
CN117351505A (zh) 信息码的识别方法、装置、设备及存储介质
CN109934185B (zh) 数据处理方法及装置、介质和计算设备
CN116860747A (zh) 训练样本的生成方法、装置、电子设备及存储介质
CN110941947A (zh) 一种文档编辑的方法、装置、计算机存储介质及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant