CN113343720A - 一种字幕翻译方法、装置和用于字幕翻译的装置 - Google Patents
一种字幕翻译方法、装置和用于字幕翻译的装置 Download PDFInfo
- Publication number
- CN113343720A CN113343720A CN202110742660.7A CN202110742660A CN113343720A CN 113343720 A CN113343720 A CN 113343720A CN 202110742660 A CN202110742660 A CN 202110742660A CN 113343720 A CN113343720 A CN 113343720A
- Authority
- CN
- China
- Prior art keywords
- source language
- language subtitle
- sentence
- line text
- subtitle line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000012549 training Methods 0.000 claims description 44
- 230000011218 segmentation Effects 0.000 claims description 34
- 238000012545 processing Methods 0.000 claims description 33
- 238000004458 analytical method Methods 0.000 claims description 26
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/258—Heading extraction; Automatic titling; Numbering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明实施例提供了一种字幕翻译方法、装置和用于字幕翻译的装置。所述方法包括:获取源语言字幕文件,所述源语言字幕文件包含至少两个源语言字幕行文本;对所述源语言字幕行文本进行合并处理,得到待翻译语句,所述待翻译语句包括完整的语义;对所述待翻译语句进行翻译处理,得到目标语句;对所述目标语句进行拆分处理,得到目标语言字幕行文本,所述目标语言字幕行文本与所述源语言字幕行文本一一对应。本发明实施例可以保证翻译结果的准确性和流畅度,有利于提升翻译性能;并且,本发明实施例能够保证在呈现字幕行时,输出的目标语言字幕行文本与源语言字幕行文本对齐,有利于用户理解字幕行对应的音视频内容。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种字幕翻译方法、装置和用于字幕翻译的装置。
背景技术
随着科技的迅速发展,人们接触国际化事物的机会越来越多,尤其是接触越来越多的国外电影、真人秀、脱口秀等多媒体内容。由于各国的语言种类不同,容易引起观看者的理解障碍,因此,针对多媒体内容的字幕翻译成为多媒体内容处理过程中的必要环节。
为了进一步提高字幕翻译的效率,随着机器翻译技术的进步,机器翻译技术逐渐被引入了字幕翻译领域。目前现有的字幕场景机器翻译系统都是根据源语言字幕行逐条进行翻译,由于字符数和时长等限制,会导致一条源语言字幕行不是一个完整的意群,进而影响机器翻译模型翻译结果的准确性和流畅度。
发明内容
本发明实施例提供一种字幕翻译方法、装置和用于字幕翻译的装置,可以保证翻译结果的准确性和流畅度,有利于提升翻译性能。
为了解决上述问题,本发明实施例公开了一种字幕翻译方法,所述方法包括:
获取源语言字幕文件,所述源语言字幕文件包含至少两个源语言字幕行文本;
对所述源语言字幕行文本进行合并处理,得到待翻译语句,所述待翻译语句包括完整的语义;
对所述待翻译语句进行翻译处理,得到目标语句;
对所述目标语句进行拆分处理,得到目标语言字幕行文本,所述目标语言字幕行文本与所述源语言字幕行文本一一对应。
可选地,所述对所述源语言字幕行文本进行合并处理,得到待翻译语句,包括:
对所述源语言字幕行文本逐条进行语义分析,判断当前源语言字幕行文本的语义是否完整;
若当前源语言字幕行文本的语义完整,则将所述当前源语言字幕行文本作为待翻译语句,并继续判断下一条源语言字幕行文本的语义是否完整;
若当前源语言字幕行文本的语义不完整,则对当前源语言字幕行文本与所述当前源语言字幕行文本语义关联的上下文字幕行文本进行合并处理,得到合并后的源语言字幕行文本,并继续判断合并后的源语言字幕行文本的语义是否完整;
直到最后一条源语言字幕行文本处理完成,得到所述源语言字幕文件对应的待翻译语句。
可选地,所述对当前源语言字幕行文本与所述当前源语言字幕行文本语义关联的上下文字幕行文本进行合并处理,得到合并后的源语言字幕行文本,包括:
确定与所述当前源语言字幕行文本语义关联的上下文字幕行文本;
确定所述当前源语言字幕行文本和所述上下文字幕行文本中各个分词对应的意群;
将当前源语言字幕行文本和所述上下文字幕行文本中属于同一个意群的连续分词进行合并处理,得到待翻译语句。
可选地,所述源语言字幕文件还包括所述源语言字幕行文本对应的起止时间,所述对所述源语言字幕行文本进行合并处理,得到待翻译语句,包括:
按照起止时间依次预测每个源语言字幕行文本对应的标点标签,得到所述每个源语言字幕行文本对应的标点序列,所述标点序列包括所述至少两个源语言字幕行文本中每个分词对应的标点标签;
基于所述标点标签对所述源语言字幕行文本进行合并处理,得到待翻译语句。
可选地,所述基于所述标点标签对所述源语言字幕行文本进行合并处理,得到待翻译语句,包括:
逐条遍历每个源语言字幕行文本对应的标点序列,判断当前源语言字幕行文本的末位分词的标点标签是否为句末标点;
若当前源语言字幕行文本的末位分词的标点标签为非句末标点,则将当前源语言字幕行文本与下一条源语言字幕行文本进行合并,得到合并后的源语言字幕文本,并继续判断合并后的源语言字幕文本的末位分词的标点标签是否为句末标点;
若当前源语言字幕行文本的末位分词的标点标签为句末标点,则终止合并,得到待翻译语句。
可选地,所述对所述目标语句进行拆分处理,得到目标语言字幕行文本,包括:
基于预先训练的断句模型确定所述目标语句中的断点标识;
根据所述断点标识,将所述目标语句切分成和所述源语言字幕行文本对齐的目标语言字幕行文本。
可选地,所述根据所述断点标识,将所述目标语句切分成和所述源语言字幕行文本对齐的目标语言字幕行文本,包括:
判断所述目标语句中是否存在与第一断点标识相对应的第二断点标识,所述第二断点标识位于所述第一断点标识之前;
若所述目标语句中存在与第一断点标识相对应的第二断点标识,则从所述目标语句中提取所述第一断点标识与所述第二断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到目标语言字幕行文本;
若所述目标语句中不存在与第一断点标识相对应的第二断点标识,则从所述目标语句中提取所述目标语句的第一个分词与所述第一断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到目标语言字幕行文本。
可选地,所述方法还包括:
获取断句训练样本集,所述断句训练样本集包括源语言字幕行文本、所述源语言字幕行文本对应的时间轴和目标语言字幕行文本;
基于所述断句训练样本集对断句模型进行迭代训练,直至满足迭代停止条件得到训练完成的断句模型。
另一方面,本发明实施例公开了一种字幕翻译装置,所述装置包括:
字幕行获取模块,用于获取源语言字幕文件,所述源语言字幕文件包含至少两个源语言字幕行文本;
合并模块,用于对所述源语言字幕行文本进行合并处理,得到待翻译语句,所述待翻译语句包括完整的语义;
翻译模块,用于对所述待翻译语句进行翻译处理,得到目标语句;
拆分模块,用于对所述目标语句进行拆分处理,得到目标语言字幕行文本,所述目标语言字幕行文本与所述源语言字幕行文本一一对应。
可选地,所述合并模块,包括:
语义分析子模块,用于对所述源语言字幕行文本逐条进行语义分析,判断当前源语言字幕行文本的语义是否完整;
第一语义判断子模块,用于若当前源语言字幕行文本的语义完整,则将所述当前源语言字幕行文本作为待翻译语句,并继续判断下一条源语言字幕行文本的语义是否完整;
第二语义判断子模块,用于若当前源语言字幕行文本的语义不完整,则对当前源语言字幕行文本与所述当前源语言字幕行文本语义关联的上下文字幕行文本进行合并处理,得到合并后的源语言字幕行文本,并继续判断合并后的源语言字幕行文本的语义是否完整;
文本处理子模块,用于直到最后一条源语言字幕行文本处理完成,得到所述源语言字幕文件对应的待翻译语句。
可选地,所述第二语义判断子模块,包括:
关联字幕行确定单元,用于确定与所述当前源语言字幕行文本语义关联的上下文字幕行文本;
意群确定单元,用于确定所述当前源语言字幕行文本和所述上下文字幕行文本中各个分词对应的意群;
第一合并单元,用于将当前源语言字幕行文本和所述上下文字幕行文本中属于同一个意群的连续分词进行合并处理,得到待翻译语句。
可选地,所述源语言字幕文件还包括所述源语言字幕行文本对应的起止时间,所述合并模块,包括:
标点预测子模块,用于按照起止时间依次预测每个源语言字幕行文本对应的标点标签,得到所述每个源语言字幕行文本对应的标点序列,所述标点序列包括所述至少两个源语言字幕行文本中每个分词对应的标点标签;
合并处理子模块,用于基于所述标点标签对所述源语言字幕行文本进行合并处理,得到待翻译语句。
可选地,所述合并处理子模块,包括:
标点序列遍历单元,用于逐条遍历每个源语言字幕行文本对应的标点序列,判断当前源语言字幕行文本的末位分词的标点标签是否为句末标点;
第二合并单元,用于若当前源语言字幕行文本的末位分词的标点标签为非句末标点,则将当前源语言字幕行文本与下一条源语言字幕行文本进行合并,得到合并后的源语言字幕文本,并继续判断合并后的源语言字幕文本的末位分词的标点标签是否为句末标点;
第三合并单元,用于若当前源语言字幕行文本的末位分词的标点标签为句末标点,则终止合并,得到待翻译语句。
可选地,所述拆分模块,包括:
断点标识确定子模块,用于基于预先训练的断句模型确定所述目标语句中的断点标识;
拆分子模块,用于根据所述断点标识,将所述目标语句切分成和所述源语言字幕行文本对齐的目标语言字幕行文本。
可选地,所述拆分子模块,包括:
断点判断单元,用于判断所述目标语句中是否存在与第一断点标识相对应的第二断点标识,所述第二断点标识位于所述第一断点标识之前;
第一拆分单元,用于若所述目标语句中存在与第一断点标识相对应的第二断点标识,则从所述目标语句中提取所述第一断点标识与所述第二断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到目标语言字幕行文本;
第二拆分单元,用于若所述目标语句中不存在与第一断点标识相对应的第二断点标识,则从所述目标语句中提取所述目标语句的第一个分词与所述第一断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到目标语言字幕行文本。
可选地,所述装置还包括:
样本获取模块,用于获取断句训练样本集,所述断句训练样本集包括源语言字幕行文本、所述源语言字幕行文本对应的时间轴和目标语言字幕行文本;
模型训练模块,用于基于所述断句训练样本集对断句模型进行迭代训练,直至满足迭代停止条件得到训练完成的断句模型。
再一方面,本发明实施例公开了一种用于字幕翻译的装置,所述装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如前述一个或多个所述的字幕翻译方法的指令。
又一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的字幕翻译方法。
本发明实施例包括以下优点:
本发明实施例在获取源语言字幕文件之后,对其中的源语言字幕行文本进行合并处理,得到待翻译语句,所述待翻译语句包括完整的语义,然后进一步对所述待翻译语句进行翻译处理,得到目标语句,并对所述目标语句进行拆分处理,得到目标语言字幕行文本,所述目标语言字幕行文本与所述源语言字幕行文本一一对应。本发明实施例通过对源语言字幕行文本进行合并后再翻译,使得合并后的待翻译语句包含完整的语义,可以保证翻译结果的准确性和流畅度,有利于提升翻译性能;并且,本发明实施例在对待翻译语句进行翻译处理得到目标语句之后,进一步可以将目标语句拆分为与源语言字幕行文本一一对应的目标语言字幕行文本,这样可以保证在呈现字幕行时,输出的目标语言字幕行文本与源语言字幕行文本对齐,有利于用户理解字幕行对应的音视频内容。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一种字幕翻译方法实施例的步骤流程图;
图2是本发明的一种字幕翻译装置实施例的结构框图;
图3是本发明的一种用于字幕翻译的装置800的框图;
图4是本发明的一些实施例中服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
方法实施例
参照图1,示出了本发明的一种字幕翻译方法实施例的步骤流程图,所述方法具体可以包括如下步骤:
步骤101、获取源语言字幕文件,所述源语言字幕文件包含至少两个源语言字幕行文本。
步骤102、对所述源语言字幕行文本进行合并处理,得到待翻译语句,所述待翻译语句包括完整的语义。
步骤103、对所述待翻译语句进行翻译处理,得到目标语句。
步骤104、对所述目标语句进行拆分处理,得到目标语言字幕行文本,所述目标语言字幕行文本与所述源语言字幕行文本一一对应。
本发明实施例提供的字幕翻译方法,可以应用于具有字幕翻译能力的音视频处理设备上,该音视频处理设备可以是终端设备,也可以是服务器。其中,终端设备例如可以是智能终端、计算机、个人数字助理(Personal Digital Assistant,PDA)、平板电脑、车载设备等。
需要说明的是,在本发明实施例中,源语言字幕文件可以包括电子设备或者终端上存储的音视频文件自带的字幕文件,也可以是互联网或服务器上与音视频文件相匹配的字幕文件。
如果源语言字幕文件为电子设备或者终端上存储的音视频文件自带的字幕文件,获取源语言字幕文件时,可以基于文字识别技术对音视频文件自带的字幕行文本进行识别,例如,可以采用ORC(Optical Character Recognition)识别算法,将视频文件的图像信息转换为文字信息,识别视频文件中的字幕行文本,从而得到视频文件对应的字幕文件。并且,为了避免对视频场景所包含的文字,例如视频画面中出现的广告牌文字进行识别提取,可以预先限定基于文字识别及时进行识别及文字内容提取的范围,该范围可具体为字幕区域,例如视频画面的顶端或底端等。基于ORC文字识别技术对当前视频帧预置字幕区域中的字幕行文本进行识别,得到当前视频帧中的字幕行文本。
字幕行文本通常是一定具有长度的短句,往往与其他字幕行文本之间存在语义上的关联关系。如果直接对源语言字幕行文本进行翻译,得到的翻译结果的准确度不高,且通过翻译得到的目标语言字幕行文本之间的连贯性不高,不利于用户理解音视频内容。因此,为了保证翻译结果的准确度和连贯性,本发明实施例在对源语言字幕行文本进行翻译处理之前,先对获取的源语言字幕行文本进行合并处理,得到待翻译语句,对待翻译语句进行翻译处理得到目标语句。其中,得到的待翻译语句为一个整句,包含完整的语义。
在本发明实施例中,可以基于预先训练的翻译模型对待翻译语句进行翻译处理,得到目标语句。其中,翻译模型用于将待翻译语句从一种语言翻译成另一种语言,可以基于神经网络,例如卷积神经网络或者循环神经网络等预先训练而成。需要说明的是,预先训练的翻译模型可以是源语言和目标语言固定的翻译模型,仅可用于将待翻译语句从该翻译模型预置的源语言翻译成预置的目标语言,可以通过预先训练多个源语言和目标语言固定的翻译模型实现音视频文件字幕行的多语言实时翻译。当然,预先训练的翻译模型也可以是多语言翻译模型。此外,在本发明实施例中,还可以根据用户发出的操作指令确定目标语种,然后根据用户选择的目标语种对待翻译语句进行翻译处理,得到目标语句,目标语句的语种为用户选择的目标语种。
生成的目标语句是多个源语言字幕行文本的翻译结果,为了便于呈现目标语种的字幕行,便于用户理解音视频内容,在本发明实施例中,对翻译得到的目标语句进一步进行拆分处理,得到与源语言字幕行文本对齐的目标语言字幕行文本。为了保证拆分的合理性,得到便于理解的目标语言字幕行文本,可以预先训练用于目标语句拆分的断句模型,将目标语句输入至断句模型中进行拆分处理,就可以得到目标语言字幕行文本。
其中,在基于预先训练的断句模型对目标语句进行拆分处理之前,可以先基于神经网络构建断句模型,然后采用大量的标注语料对构建的断句模型进行训练;也可以在语料不充足的情况下,在通用的序列标注模型的基础上使用字幕语料对序列标注模型进行迭代训练,调整模型参数直至得到满足收敛条件的序列标注模型,将满足收敛条件的序列标注模型作为本发明实施例中的断句模型。其中,序列标注模型可以选用BERT(Bidirectional Encoder Representations from Transformers,基于多层注意力机制的双向编码器)模型,或其他擅长进行序列标注的神经网络模型。
在本发明的一种可选实施例中,步骤102所述对所述源语言字幕行文本进行合并处理,得到待翻译语句,包括:
步骤S11、对所述源语言字幕行文本逐条进行语义分析,判断当前源语言字幕行文本的语义是否完整;
步骤S12、若当前源语言字幕行文本的语义完整,则将所述当前源语言字幕行文本作为待翻译语句,并继续判断下一条源语言字幕行文本的语义是否完整;
步骤S13、若当前源语言字幕行文本的语义不完整,则对当前源语言字幕行文本与所述当前源语言字幕行文本语义关联的上下文字幕行文本进行合并处理,得到合并后的源语言字幕行文本,并继续判断合并后的源语言字幕行文本的语义是否完整;
步骤S14、直到最后一条源语言字幕行文本处理完成,得到所述源语言字幕文件对应的待翻译语句。
在本发明实施例中,可以通过语义分析对源语言字幕行文本进行合并处理。具体的,对获取的源语言字幕文件中的源语言字幕行文本逐条进行语义分析,判断当前源语言字幕行文本的语义是否完整,然后根据判断结果确定是否要对当前源语言字幕行文本进行合并处理。如果当前源语言字幕行文本的语义完整,则无需对当前源语言字幕行进行合并处理,直接将当前源语言字幕行文本作为一条待翻译语句即可,并继续判断下一条源语言字幕行文本的语义是否完整;如果当前源语言字幕行文本的语义不完整,则需要对当前源语言字幕行文本进行合并处理,具体的,将当前源语言字幕行与下一条源语言字幕行文本进行合并,得到合并后的源语言字幕行文本,并继续判断合并后的当前源语言字幕行文本的语义是否完整。如此逐条进行分析,直至源语言字幕文件中的最后一条源语言字幕行文本处理完成,得到该源语言字幕文件对应的所有待翻译语句。
例如,假设获取到的源语言字幕文件中包含六条连续的源语言字幕行文本,分别为:
字幕行A1:他仅用四年时间
字幕行A2:就让顾氏集团成功转型为
字幕行A3:横跨出版、广告
字幕行A4:新媒体的新型传媒集团
字幕行A5:他还一手建立了
字幕行A6:在国内外屡获奖项的星云动漫
对于字幕行A1至字幕行A6逐条进行语义分析,确定字幕行A1的语义不完整,则将字幕行A1与字幕行A2进行合并,得到合并后的字幕行B1:“他仅用四年时间就让顾氏集团成功转型为”。继续对字幕行B1进行语义分析,发现字幕行B1的语义不完整,则继续将合并后的字幕行B1与字幕行A3进行合并,得到字幕行B2:“他仅用四年时间就让顾氏集团成功转型为横跨出版、广告”。继续对合并后的字幕行B2进行语义分析,发现字幕行B2的语义依然不完整,继续将字幕行B2与字幕行A4进行合并,得到合并后的字幕行B3:“他仅用四年时间就让顾氏集团成功转型为横跨出版、广告、新媒体的新型传媒集团”。对合并后的字幕行B3进行语义分析,确定字幕行B3的语义完整,则将字幕行B3作为一条待翻译语句。继续对字幕行A5进行语义分析,确定字幕行A5的语义不不完整,则将字幕行A5与字幕行A6进行合并,得到合并后的字幕行B4:“他还一手建立了在国内外屡获奖项的星云动漫”。继续对合并后的字幕行B4进行语义分析,确定字幕行B4的语义完整,则将字幕行B4作为一条待翻译语句。经过对上述字幕行A1至字幕行A6进行合并处理,共得到两条语义完整的待翻译语句。
其中,可以基于预先训练的语义分析模型对源语言字幕行文本进行语义分析,确定源语言字幕行的语义完整性。语义分析模型可以选用本领域擅长进行语义分析的神经网络模型,然后基于字幕语料对选用的语义分析模型进行训练,直至满足收敛条件得到训练完成的语义分析模型。
在本发明的一种可选实施例中,步骤S13所述对当前源语言字幕行文本与所述当前源语言字幕行文本语义关联的上下文字幕行文本进行合并处理,得到合并后的源语言字幕行文本,包括:
子步骤S131、确定与所述当前源语言字幕行文本语义关联的上下文字幕行文本;
子步骤S132、确定所述当前源语言字幕行文本和所述上下文字幕行文本中各个分词对应的意群;
子步骤S133、将当前源语言字幕行文本和所述上下文字幕行文本中属于同一个意群的连续分词进行合并处理,得到待翻译语句。
其中,意群指按照语义和文本结构划分的各个文本成分,每一个文本成分为一个意群。意群可以包括至少一个分词,同一个意群中的分词与分词之间关系紧密,不能随意拆分,否则容易导致语义错乱和/或文本结构的缺失。
需要说明的是,本发明实施例中的分词是词和短语的合称,包括词(含单词、合成词)和词组(又称短语),是组成语句文章的最小组词结构形式单元。若文本序列的语种为汉语,所述分词可以为字、词、词组等;若文本序列的语种为英语,所述分词可以为英文单词等。
字幕行文件中的字幕行文本之间存在先后顺序,连续的字幕行文本往往在语义上相关联,因此,在本发明实施例中,如果当前源语言字幕行文本的语义不完整,可以在源语言字幕文件中确定与当前源语言字幕行文本语义关联的上下文字幕行文本。例如,对于上述字幕行A1至A6,可以确定字幕行A1至字幕行A4语义关联,字幕行A5和字幕行A6语义关联。然后,根据源语言字幕行文本的语义和文本结构,确定源语言字幕行文本和上下文字幕行文本中各个分词所属的意群,然后将属于同一个意群的连续分词进行合并处理,得到待翻译语句。例如,对于源语言字幕行文本A7,包含分词M1、M2、M3,与其语义关联的上下文字幕行文本A8包含分词M4、M5。假设分词M2至M4属于同一个意群,则将分词M2至M4进行合并,得到待翻译语句。待翻译语句包含完整的语义和文本结构,可以保证翻译结果的准确性和流畅度,有利于提升翻译性能。
在本发明的一种可选实施例中,所述源语言字幕文件还包括所述源语言字幕行文本对应的起止时间,步骤102所述对所述源语言字幕行文本进行合并处理,得到待翻译语句,包括:
步骤S21、按照起止时间依次预测每个源语言字幕行文本对应的标点标签,得到所述每个源语言字幕行文本对应的标点序列,所述标点序列包括所述至少两个源语言字幕行文本中每个分词对应的标点标签;
步骤S22、基于所述标点标签对所述源语言字幕行文本进行合并处理,得到待翻译语句。
在本发明实施例中,除了可以通过对源语言字幕行文本进行语义分析,基于源语言字幕行文本的语义完整性对源语言字幕行文本进行合并处理,还可以对源语言字幕行文本进行标点预测,基于源语言字幕行文本中各个分词对应的标点标签对源语言字幕行文本进行合并处理。
需要说明的是,一个音视频文件往往对应多个字幕行,每个字幕行都有对应的起止时间,在音视频文本的播放过程中,按照字幕行的起止时间依次输出对应的字幕行以供用户查看。起止时间连续的字幕行在语义和文本结构上往往存在关联关系,因此,可以按照起止时间依次对源语言字幕行文本进行标点预测,得到源语言字幕文件中每个源语言字幕行文本对应的标点序列。
其中,标点标签可以包括句末标点和非句末标点。其中,句末标点可以是“。”、“?”、“!”等,非句末标点可以是“,”、“、”、“——”等。不同语种对应的标点标签可以不同。
基于标点标签对字幕行文本进行合并处理,就可以得到待翻译语句。具体的,按照起止时间将所述源语言字幕文件中的各个源语言字幕行文本进行合并处理,得到所述源语言字幕文件对应的文本序列,所述文本序列包含所述源语言字幕文件中的每个源语言字幕行文本;识别所述文本序列中标点标签为句末标点的目标分词;若所述目标分词之前存在其他目标分词,则将所述目标分词与上一个目标分词之间的各个分词进行合并,得到待翻译语句;若所述目标分词之前不存在其他目标分词,则将所述目标分词与所述文本序列的第一个分词之间的各个分词进行合并,得到待翻译语句。
或者,也可以仅对每个源语言字幕行文本的末位分词对应的标点标签是否为句末标点进行判断。在本发明的一种可选实施例中,步骤S22所述基于所述标点标签对所述源语言字幕行文本进行合并处理,得到待翻译语句,包括:
子步骤S221、逐条遍历每个源语言字幕行文本对应的标点序列,判断当前源语言字幕行文本的末位分词的标点标签是否为句末标点;
子步骤S222、若当前源语言字幕行文本的末位分词的标点标签为非句末标点,则将当前源语言字幕行文本与下一条源语言字幕行文本进行合并,得到合并后的源语言字幕文本,并继续判断合并后的源语言字幕文本的末位分词的标点标签是否为句末标点;
子步骤S223、若当前源语言字幕行文本的末位分词的标点标签为句末标点,则终止合并,得到待翻译语句。
在本发明实施例中,对获取的源语言字幕文件中的各个源语言字幕行文本对应的标点序列进行逐条遍历,依次判断当前源语言字幕行文本的末位分词的标点标签是否为句末标点。
如果当前源语言字幕行文本的末位分词的标点标签不是句末标点,则将当前源语言字幕行文本与下一条源语言字幕行文本进行合并,得到合并后的源语言字幕行文本,并继续判断合并后的源语言字幕行文本的末位分词的标点标签是否为句末标点。如果合并后的源语言字幕行文本的末位分词的标点标签不是句末标点,则继续将合并后的源语言字幕行文本与后续的源语言字幕行文本进行合并;如果合并后的源语言字幕行文本的末位分词的标点标签为句末标点,则将合并后的源语言字幕行文本作为待翻译语句,并继续对源语言字幕文件中的其他源语言字幕行文本进行遍历。
如果当前源语言字幕行文本的末位分词的标点标签为句末标点,则无需对当前源语言字幕行文本进行合并,直接将当前源语言字幕行文本作为待翻译语句,并继续判断下一条源语言字幕行文本的末位分词的标点标签是否为句末标点。
直至对源语言字幕文件中的最后一条源语言字幕行文本处理完成,得到源语言字幕文件对应的所有待翻译语句。
以上述字幕行A1至A6为例,依次预测字幕行A1至A6的文本序列对应的标点标签,得到字幕行A1至字幕行A6对应的标点序列。逐条遍历字幕行A1至字幕行A6对应的标点序列,其中,字幕行A1中的末位分词“时间”对应的标点标签为“,”,字幕行A2中的末位分词“为”对应的标点标签为空,字幕行A3中的末位分词“广告”对应的标点标签为“、”,字幕行A4中的末位分词“集团”对应的标点标签为“。”,字幕行A5中的末位分词“了”的标点标签为空,字幕行A6中的末位分词“动漫”的标点标签为“。”。
由于字幕行A1的末位分词的标点标签为非句末标点,因此,将字幕行A1与字幕行A2进行合并,得到合并后的字幕行B1:“他仅用四年时间就让顾氏集团成功转型为”。字幕行B1的末位分词的标点标签为非句末标点,继续将字幕行B1与字幕行A3进行合并,得到字幕行B2:“他仅用四年时间就让顾氏集团成功转型为横跨出版、广告”。字幕行B2的末位分词的标点标签仍为非句末标点,继续将字幕行B2与字幕行A4进行合并,得到合并后的字幕行B3:“他仅用四年时间就让顾氏集团成功转型为横跨出版、广告、新媒体的新型传媒集团”。字幕行B3的末位分词的标点标签为句末标点,则不再对字幕行B3进行合并处理,可以直接将字幕行B3作为一条待翻译语句。继续遍历,字幕行A5的末位分词的标点标签为非句末标点,则将字幕行A5与字幕行A6进行合并,得到合并后的字幕行B4:“他还一手建立了在国内外屡获奖项的星云动漫”。字幕行B4的末位分词的标点标签为句末标点,则不再对字幕行B4进行合并处理,可以直接将字幕行B4作为一条待翻译语句。
需要说明的是,在本发明实施例中,可以通过预先训练的标点预测模型预测各个源语言字幕行文本中各个分词对应的标点标签。标点预测模型的训练过程与前述断句模型的训练过程类似,本发明实施例在此不做赘述。
在本发明的一种可选实施例中,步骤104所述对所述目标语句进行拆分处理,得到目标语言字幕行文本,包括:
步骤S31、基于预先训练的断句模型确定所述目标语句中的断点标识;
步骤S32、根据所述断点标识,将所述目标语句切分成和所述源语言字幕行文本对齐的目标语言字幕行文本。
为了便于呈现目标语种的字幕行文本,便于用户理解,在本发明实施例中,对翻译得到的目标语句进一步进行拆分处理,得到与源语言字幕行文本对齐的目标语言字幕行文本。为了保证拆分的合理性,得到便于理解的目标语言字幕行文本,可以预先训练用于目标语句拆分的断句模型,将目标语句输入至断句模型中得到目标语句的断点标识,然后根据断点标识将目标语句切分成和源语言字幕行文本对应的目标语言字幕行文本。
其中,断点标识用于指示目标语句的切分点,每一个断点标识对应一个目标语言字幕行文本,断点标识对应的分词可以是目标语言字幕行文本的左边界,也可以是目标语言字幕行文本的右边界,可以预先指定断点标识为目标语言字幕行文本的左边界还是右边界,便于在对目标语句进行切分时,确定断点标识对应的分词所属的目标语言字幕行文本。例如,对于待翻译语句“他还一手建立了在国内外屡获奖项的星云动漫”,翻译后得到的目标语句为“He also built the internationally renowned Xinyun Animation.”,将该目标语句输入至预先训练的断句模型,得到分词“built”为断点标识指示的切分点,预先设定断点标识对应的分词为目标语言字幕行文本的右边界,则得到两个目标语言字幕行文本,分别为:“He also built”和“the internationally renowned Xinyun Animation”。
在本发明的一种可选实施例中,步骤S32所述根据所述断点标识,将所述目标语句切分成和所述源语言字幕行文本对齐的目标语言字幕行文本,包括:
子步骤S321、判断所述目标语句中是否存在与第一断点标识相对应的第二断点标识,所述第二断点标识位于所述第一断点标识之前;
子步骤S322、若所述目标语句中存在与第一断点标识相对应的第二断点标识,则从所述目标语句中提取所述第一断点标识与所述第二断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到目标语言字幕行文本;
子步骤S323、若所述目标语句中不存在与第一断点标识相对应的第二断点标识,则从所述目标语句中提取所述目标语句的第一个分词与所述第一断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到目标语言字幕行文本。
以断点标识对应的分词为目标语言字幕行文本的右边界为例,目标语句中包含两类断点标识:存在与之对应的第二断点标识、不存在与之对应的第二断点标识。假设断点标识A存在与之对应的第二断点标识,记为断点标识B,则从目标语句中将断点标识B与断点标识A之间的各个分词提取出来,然后按照各个分词在文本序列中的位置对提取的各个分词进行合并,就可以得到断点标识A对应的目标语言字幕行文本。其中,提取的分词包含断点标识A对应的分词但不包含断点标识B对应的分词,也即,每一个断点标识对应一个目标语言字幕行文本,断点标识A对应的字幕行文本中仅包含断点标识A对应的分词。
假设断点标识A不存在与之对应的第二断点标识,那么同样存在两种情况:1)目标语句中只有一个断点标识A,不存在其他断点标识;2)目标语句中存在至少两个断点标识,但断点标识A为目标语句中的第一个断点标识。对于目标语句中只有一个断点标识的情况,可以直接将该目标语句作为目标语言字幕行文本;对于目标语句中有至少两个断点标识的情况,从目标语句中提取目标语句的起始位分词与断点标识A之间的各个分词,并对提取的各个分词按照各个分词在文本序列中的位置进行合并处理,就可以得到断点标识A对应的目标语言字幕行文本。
如果确定的断点标识对应的分词为目标语言字幕行文本的左边界,同样判断目标语句中是否存在与第三断点标识相对应的第四断点标识,第四断点标识位于第三断点标识之后;若目标语句中存在与第三断点标识相对应的第四断点标识,则从目标语句中提取所述第三断点标识与所述第四断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到第三断点标识对应的目标语言字幕行文本;若目标语句中不存在与第三断点标识相对应的第四断点标识,则从目标语句中提取第三断点标识与所述目标语句的末位分词之间的各个分词,并对提取的各个分词进行合并处理,得到第三断点标识对应的目标语言字幕行文本。
在本发明实施例中,以断点标识作为目标语句的切分依据,由于断点标识是基于断句检测模型对目标语句进行断句分析确定的,断点标识指示的分词与源语言字幕行的字幕边界相对应,因此,基于断点标识将目标语句切分为目标语言字幕行文本,可以保证得到与源语言字幕行文本对齐的目标语言字幕行文本,有利于生成合理的译文字幕文件或双语字幕文件,便于用户理解字幕行对应的音视频内容。
在本发明的一种可选实施例中,所述方法还包括:
步骤S41、获取断句训练样本集,所述断句训练样本集包括源语言字幕行文本、所述源语言字幕行文本对应的时间轴和目标语言字幕行文本;
步骤S42、基于所述断句训练样本集对断句模型进行迭代训练,直至满足迭代停止条件得到训练完成的断句模型。
在本发明实施例中,为了提高断句模型的训练效率,可以基于获取的训练样本集对预设断句模型的模型参数进行调整,得到符合本发明实施例需求的断句模型。其中,预设断句模型可以选用BERT模型,或其他擅长进行序列标注的神经网络模型。具体实施时,可以先对预设断句模型的各个参数进行初始化,在每轮训练中,根据源语言文本的输出结果和训练样本集中源语言文本对应的时间轴和目标文本,计算断句模型的损失值,并基于损失值计算断句模型中节点的梯度,然后根据梯度调整断句模型中对应节点的模型参数。在参数调整后,进入下一轮训练,直到损失值满足收敛条件时得到训练完成的断句模型。
基于训练完成的断句模型确定目标语句的断点标识,更能够符合多元化的场景需求,有利于提升断点标识的确定效率,提高目标语言字幕行文本的生成效果。
综上,本发明实施例在获取源语言字幕文件之后,对其中的源语言字幕行文本进行合并处理,得到待翻译语句,所述待翻译语句包括完整的语义,然后进一步对所述待翻译语句进行翻译处理,得到目标语句,并对所述目标语句进行拆分处理,得到目标语言字幕行文本,所述目标语言字幕行文本与所述源语言字幕行文本一一对应。本发明实施例通过对源语言字幕行文本进行合并后再翻译,使得合并后的待翻译语句包含完整的语义,可以保证翻译结果的准确性和流畅度,有利于提升翻译性能;并且,本发明实施例在对待翻译语句进行翻译处理得到目标语句之后,进一步可以将目标语句拆分为与源语言字幕行文本一一对应的目标语言字幕行文本,这样可以保证在呈现字幕行时,输出的目标语言字幕行文本与源语言字幕行文本对齐,有利于用户理解字幕行对应的音视频内容。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
装置实施例
参照图2,示出了本发明的一种字幕翻译装置实施例的结构框图,所述装置可以包括:
字幕行获取模块201,用于获取源语言字幕文件,所述源语言字幕文件包含至少两个源语言字幕行文本;
合并模块202,用于对所述源语言字幕行文本进行合并处理,得到待翻译语句,所述待翻译语句包括完整的语义;
翻译模块203,用于对所述待翻译语句进行翻译处理,得到目标语句;
拆分模块204,用于对所述目标语句进行拆分处理,得到目标语言字幕行文本,所述目标语言字幕行文本与所述源语言字幕行文本一一对应。
可选地,所述合并模块,包括:
语义分析子模块,用于对所述源语言字幕行文本逐条进行语义分析,判断当前源语言字幕行文本的语义是否完整;
第一语义判断子模块,用于若当前源语言字幕行文本的语义完整,则将所述当前源语言字幕行文本作为待翻译语句,并继续判断下一条源语言字幕行文本的语义是否完整;
第二语义判断子模块,用于若当前源语言字幕行文本的语义不完整,则对当前源语言字幕行文本与所述当前源语言字幕行文本语义关联的上下文字幕行文本进行合并处理,得到合并后的源语言字幕行文本,并继续判断合并后的源语言字幕行文本的语义是否完整;
文本处理子模块,用于直到最后一条源语言字幕行文本处理完成,得到所述源语言字幕文件对应的待翻译语句。
可选地,所述第二语义判断子模块,包括:
关联字幕行确定单元,用于确定与所述当前源语言字幕行文本语义关联的上下文字幕行文本;
意群确定单元,用于确定所述当前源语言字幕行文本和所述上下文字幕行文本中各个分词对应的意群;
第一合并单元,用于将当前源语言字幕行文本和所述上下文字幕行文本中属于同一个意群的连续分词进行合并处理,得到待翻译语句。
可选地,所述源语言字幕文件还包括所述源语言字幕行文本对应的起止时间,所述合并模块,包括:
标点预测子模块,用于按照起止时间依次预测每个源语言字幕行文本对应的标点标签,得到所述每个源语言字幕行文本对应的标点序列,所述标点序列包括所述至少两个源语言字幕行文本中每个分词对应的标点标签;
合并处理子模块,用于基于所述标点标签对所述源语言字幕行文本进行合并处理,得到待翻译语句。
可选地,所述合并处理子模块,包括:
标点序列遍历单元,用于逐条遍历每个源语言字幕行文本对应的标点序列,判断当前源语言字幕行文本的末位分词的标点标签是否为句末标点;
第二合并单元,用于若当前源语言字幕行文本的末位分词的标点标签为非句末标点,则将当前源语言字幕行文本与下一条源语言字幕行文本进行合并,得到合并后的源语言字幕文本,并继续判断合并后的源语言字幕文本的末位分词的标点标签是否为句末标点;
第三合并单元,用于若当前源语言字幕行文本的末位分词的标点标签为句末标点,则终止合并,得到待翻译语句。
可选地,所述拆分模块,包括:
断点标识确定子模块,用于基于预先训练的断句模型确定所述目标语句中的断点标识;
拆分子模块,用于根据所述断点标识,将所述目标语句切分成和所述源语言字幕行文本对齐的目标语言字幕行文本。
可选地,所述拆分子模块,包括:
断点判断单元,用于判断所述目标语句中是否存在与第一断点标识相对应的第二断点标识,所述第二断点标识位于所述第一断点标识之前;
第一拆分单元,用于若所述目标语句中存在与第一断点标识相对应的第二断点标识,则从所述目标语句中提取所述第一断点标识与所述第二断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到目标语言字幕行文本;
第二拆分单元,用于若所述目标语句中不存在与第一断点标识相对应的第二断点标识,则从所述目标语句中提取所述目标语句的第一个分词与所述第一断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到目标语言字幕行文本。
可选地,所述装置还包括:
样本获取模块,用于获取断句训练样本集,所述断句训练样本集包括源语言字幕行文本、所述源语言字幕行文本对应的时间轴和目标语言字幕行文本;
模型训练模块,用于基于所述断句训练样本集对断句模型进行迭代训练,直至满足迭代停止条件得到训练完成的断句模型。
综上,本发明实施例通过对源语言字幕行文本进行合并后再翻译,合并后的待翻译语句包含完整的语义,可以保证翻译结果的准确性和流畅度,有利于提升翻译性能;并且,本发明实施例在对待翻译语句进行翻译处理得到目标语句之后,进一步可以将目标语句拆分为与源语言字幕行文本一一对应的目标语言字幕行文本,这样可以保证在呈现字幕行时,输出的目标语言字幕行文本与源语言字幕行文本对齐,有利于用户理解字幕行对应的音视频内容。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种用于字幕翻译的装置,所述装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
A11、获取源语言字幕文件,所述源语言字幕文件包含至少两个源语言字幕行文本;
A12、对所述源语言字幕行文本进行合并处理,得到待翻译语句,所述待翻译语句包括完整的语义;
A13、对所述待翻译语句进行翻译处理,得到目标语句;
A14、对所述目标语句进行拆分处理,得到目标语言字幕行文本,所述目标语言字幕行文本与所述源语言字幕行文本一一对应。
可选地,所述对所述源语言字幕行文本进行合并处理,得到待翻译语句,包括:
对所述源语言字幕行文本逐条进行语义分析,判断当前源语言字幕行文本的语义是否完整;
若当前源语言字幕行文本的语义完整,则将所述当前源语言字幕行文本作为待翻译语句,并继续判断下一条源语言字幕行文本的语义是否完整;
若当前源语言字幕行文本的语义不完整,则对当前源语言字幕行文本与所述当前源语言字幕行文本语义关联的上下文字幕行文本进行合并处理,得到合并后的源语言字幕行文本,并继续判断合并后的源语言字幕行文本的语义是否完整;
直到最后一条源语言字幕行文本处理完成,得到所述源语言字幕文件对应的待翻译语句。
可选地,所述对当前源语言字幕行文本与所述当前源语言字幕行文本语义关联的上下文字幕行文本进行合并处理,得到合并后的源语言字幕行文本,包括:
确定与所述当前源语言字幕行文本语义关联的上下文字幕行文本;
确定所述当前源语言字幕行文本和所述上下文字幕行文本中各个分词对应的意群;
将当前源语言字幕行文本和所述上下文字幕行文本中属于同一个意群的连续分词进行合并处理,得到待翻译语句。
可选地,所述源语言字幕文件还包括所述源语言字幕行文本对应的起止时间,所述对所述源语言字幕行文本进行合并处理,得到待翻译语句,包括:
按照起止时间依次预测每个源语言字幕行文本对应的标点标签,得到所述每个源语言字幕行文本对应的标点序列,所述标点序列包括所述至少两个源语言字幕行文本中每个分词对应的标点标签;
基于所述标点标签对所述源语言字幕行文本进行合并处理,得到待翻译语句。
可选地,所述基于所述标点标签对所述源语言字幕行文本进行合并处理,得到待翻译语句,包括:
逐条遍历每个源语言字幕行文本对应的标点序列,判断当前源语言字幕行文本的末位分词的标点标签是否为句末标点;
若当前源语言字幕行文本的末位分词的标点标签为非句末标点,则将当前源语言字幕行文本与下一条源语言字幕行文本进行合并,得到合并后的源语言字幕文本,并继续判断合并后的源语言字幕文本的末位分词的标点标签是否为句末标点;
若当前源语言字幕行文本的末位分词的标点标签为句末标点,则终止合并,得到待翻译语句。
可选地,所述对所述目标语句进行拆分处理,得到目标语言字幕行文本,包括:
基于预先训练的断句模型确定所述目标语句中的断点标识;
根据所述断点标识,将所述目标语句切分成和所述源语言字幕行文本对齐的目标语言字幕行文本。
可选地,所述根据所述断点标识,将所述目标语句切分成和所述源语言字幕行文本对齐的目标语言字幕行文本,包括:
判断所述目标语句中是否存在与第一断点标识相对应的第二断点标识,所述第二断点标识位于所述第一断点标识之前;
若所述目标语句中存在与第一断点标识相对应的第二断点标识,则从所述目标语句中提取所述第一断点标识与所述第二断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到目标语言字幕行文本;
若所述目标语句中不存在与第一断点标识相对应的第二断点标识,则从所述目标语句中提取所述目标语句的第一个分词与所述第一断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到目标语言字幕行文本。
可选地,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取断句训练样本集,所述断句训练样本集包括源语言字幕行文本、所述源语言字幕行文本对应的时间轴和目标语言字幕行文本;
基于所述断句训练样本集对断句模型进行迭代训练,直至满足迭代停止条件得到训练完成的断句模型。
图3是根据一示例性实施例示出的一种用于字幕翻译的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图3,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音信息处理模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以语音处理装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频信息处理(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图4是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行图1所示的字幕翻译方法。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行一种语音处理方法,所述方法包括:获取源语言字幕文件,所述源语言字幕文件包含至少两个源语言字幕行文本;对所述源语言字幕行文本进行合并处理,得到待翻译语句,所述待翻译语句包括完整的语义;对所述待翻译语句进行翻译处理,得到目标语句;对所述目标语句进行拆分处理,得到目标语言字幕行文本,所述目标语言字幕行文本与所述源语言字幕行文本一一对应。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种字幕翻译方法、一种字幕翻译装置和一种用于字幕翻译的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (15)
1.一种字幕翻译方法,其特征在于,所述方法包括:
获取源语言字幕文件,所述源语言字幕文件包含至少两个源语言字幕行文本;
对所述源语言字幕行文本进行合并处理,得到待翻译语句,所述待翻译语句包括完整的语义;
对所述待翻译语句进行翻译处理,得到目标语句;
对所述目标语句进行拆分处理,得到目标语言字幕行文本,所述目标语言字幕行文本与所述源语言字幕行文本一一对应。
2.根据权利要求1所述的方法,其特征在于,所述对所述源语言字幕行文本进行合并处理,得到待翻译语句,包括:
对所述源语言字幕行文本逐条进行语义分析,判断当前源语言字幕行文本的语义是否完整;
若当前源语言字幕行文本的语义完整,则将所述当前源语言字幕行文本作为待翻译语句,并继续判断下一条源语言字幕行文本的语义是否完整;
若当前源语言字幕行文本的语义不完整,则对当前源语言字幕行文本与所述当前源语言字幕行文本语义关联的上下文字幕行文本进行合并处理,得到合并后的源语言字幕行文本,并继续判断合并后的源语言字幕行文本的语义是否完整;
直到最后一条源语言字幕行文本处理完成,得到所述源语言字幕文件对应的待翻译语句。
3.根据权利要求2所述的方法,其特征在于,所述对当前源语言字幕行文本与所述当前源语言字幕行文本语义关联的上下文字幕行文本进行合并处理,得到合并后的源语言字幕行文本,包括:
确定与所述当前源语言字幕行文本语义关联的上下文字幕行文本;
确定所述当前源语言字幕行文本和所述上下文字幕行文本中各个分词对应的意群;
将当前源语言字幕行文本和所述上下文字幕行文本中属于同一个意群的连续分词进行合并处理,得到待翻译语句。
4.根据权利要求1所述的方法,其特征在于,所述源语言字幕文件还包括所述源语言字幕行文本对应的起止时间,所述对所述源语言字幕行文本进行合并处理,得到待翻译语句,包括:
按照起止时间依次预测每个源语言字幕行文本对应的标点标签,得到所述每个源语言字幕行文本对应的标点序列,所述标点序列包括所述至少两个源语言字幕行文本中每个分词对应的标点标签;
基于所述标点标签对所述源语言字幕行文本进行合并处理,得到待翻译语句。
5.根据权利要求4所述的方法,其特征在于,所述基于所述标点标签对所述源语言字幕行文本进行合并处理,得到待翻译语句,包括:
逐条遍历每个源语言字幕行文本对应的标点序列,判断当前源语言字幕行文本的末位分词的标点标签是否为句末标点;
若当前源语言字幕行文本的末位分词的标点标签为非句末标点,则将当前源语言字幕行文本与下一条源语言字幕行文本进行合并,得到合并后的源语言字幕文本,并继续判断合并后的源语言字幕文本的末位分词的标点标签是否为句末标点;
若当前源语言字幕行文本的末位分词的标点标签为句末标点,则终止合并,得到待翻译语句。
6.根据权利要求1所述的方法,其特征在于,所述对所述目标语句进行拆分处理,得到目标语言字幕行文本,包括:
基于预先训练的断句模型确定所述目标语句中的断点标识;
根据所述断点标识,将所述目标语句切分成和所述源语言字幕行文本对齐的目标语言字幕行文本。
7.根据权利要求6所述的方法,其特征在于,所述根据所述断点标识,将所述目标语句切分成和所述源语言字幕行文本对齐的目标语言字幕行文本,包括:
判断所述目标语句中是否存在与第一断点标识相对应的第二断点标识,所述第二断点标识位于所述第一断点标识之前;
若所述目标语句中存在与第一断点标识相对应的第二断点标识,则从所述目标语句中提取所述第一断点标识与所述第二断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到目标语言字幕行文本;
若所述目标语句中不存在与第一断点标识相对应的第二断点标识,则从所述目标语句中提取所述目标语句的第一个分词与所述第一断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到目标语言字幕行文本。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取断句训练样本集,所述断句训练样本集包括源语言字幕行文本、所述源语言字幕行文本对应的时间轴和目标语言字幕行文本;
基于所述断句训练样本集对断句模型进行迭代训练,直至满足迭代停止条件得到训练完成的断句模型。
9.一种字幕翻译装置,其特征在于,所述装置包括:
字幕行获取模块,用于获取源语言字幕文件,所述源语言字幕文件包含至少两个源语言字幕行文本;
合并模块,用于对所述源语言字幕行文本进行合并处理,得到待翻译语句,所述待翻译语句包括完整的语义;
翻译模块,用于对所述待翻译语句进行翻译处理,得到目标语句;
拆分模块,用于对所述目标语句进行拆分处理,得到目标语言字幕行文本,所述目标语言字幕行文本与所述源语言字幕行文本一一对应。
10.根据权利要求9所述的装置,其特征在于,所述合并模块,包括:
语义分析子模块,用于对所述源语言字幕行文本逐条进行语义分析,判断当前源语言字幕行文本的语义是否完整;
第一语义判断子模块,用于若当前源语言字幕行文本的语义完整,则将所述当前源语言字幕行文本作为待翻译语句,并继续判断下一条源语言字幕行文本的语义是否完整;
第二语义判断子模块,用于若当前源语言字幕行文本的语义不完整,则对当前源语言字幕行文本与所述当前源语言字幕行文本语义关联的上下文字幕行文本进行合并处理,得到合并后的源语言字幕行文本,并继续判断合并后的源语言字幕行文本的语义是否完整;
文本处理子模块,用于直到最后一条源语言字幕行文本处理完成,得到所述源语言字幕文件对应的待翻译语句。
11.根据权利要求10所述的装置,其特征在于,所述第二语义判断子模块,包括:
关联字幕行确定单元,用于确定与所述当前源语言字幕行文本语义关联的上下文字幕行文本;
意群确定单元,用于确定所述当前源语言字幕行文本和所述上下文字幕行文本中各个分词对应的意群;
第一合并单元,用于将当前源语言字幕行文本和所述上下文字幕行文本中属于同一个意群的连续分词进行合并处理,得到待翻译语句。
12.根据权利要求9所述的装置,其特征在于,所述源语言字幕文件还包括所述源语言字幕行文本对应的起止时间,所述合并模块,包括:
标点预测子模块,用于按照起止时间依次预测每个源语言字幕行文本对应的标点标签,得到所述每个源语言字幕行文本对应的标点序列,所述标点序列包括所述至少两个源语言字幕行文本中每个分词对应的标点标签;
合并处理子模块,用于基于所述标点标签对所述源语言字幕行文本进行合并处理,得到待翻译语句。
13.根据权利要求12所述的装置,其特征在于,所述合并处理子模块,包括:
标点序列遍历单元,用于逐条遍历每个源语言字幕行文本对应的标点序列,判断当前源语言字幕行文本的末位分词的标点标签是否为句末标点;
第二合并单元,用于若当前源语言字幕行文本的末位分词的标点标签为非句末标点,则将当前源语言字幕行文本与下一条源语言字幕行文本进行合并,得到合并后的源语言字幕文本,并继续判断合并后的源语言字幕文本的末位分词的标点标签是否为句末标点;
第三合并单元,用于若当前源语言字幕行文本的末位分词的标点标签为句末标点,则终止合并,得到待翻译语句。
14.一种用于字幕翻译的装置,其特征在于,所述装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如权利要求1至8中任一所述的字幕翻译方法的指令。
15.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至8中任一所述的字幕翻译方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110742660.7A CN113343720B (zh) | 2021-06-30 | 一种字幕翻译方法、装置和用于字幕翻译的装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110742660.7A CN113343720B (zh) | 2021-06-30 | 一种字幕翻译方法、装置和用于字幕翻译的装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113343720A true CN113343720A (zh) | 2021-09-03 |
CN113343720B CN113343720B (zh) | 2024-10-29 |
Family
ID=
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114420104A (zh) * | 2022-01-27 | 2022-04-29 | 网易有道信息技术(北京)有限公司 | 自动生成字幕的方法及其相关产品 |
CN114898368A (zh) * | 2022-03-30 | 2022-08-12 | 阿里巴巴(中国)有限公司 | 扫描翻译方法、设备和可读介质 |
WO2023103943A1 (zh) * | 2021-12-10 | 2023-06-15 | 维沃移动通信有限公司 | 图片处理方法、装置及电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101090461A (zh) * | 2006-06-13 | 2007-12-19 | 中国科学院计算技术研究所 | 一种数字视频字幕自动翻译方法 |
CN102937972A (zh) * | 2012-10-15 | 2013-02-20 | 上海外教社信息技术有限公司 | 一种视听字幕制作系统及方法 |
WO2017191397A1 (fr) * | 2016-05-03 | 2017-11-09 | Orange | Procédé et dispositif de synchronisation de sous-titres |
CN108259971A (zh) * | 2018-01-31 | 2018-07-06 | 百度在线网络技术(北京)有限公司 | 字幕添加方法、装置、服务器及存储介质 |
CN109614604A (zh) * | 2018-12-17 | 2019-04-12 | 北京百度网讯科技有限公司 | 字幕处理方法、装置及存储介质 |
CN110276349A (zh) * | 2019-06-24 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 视频处理方法、装置、电子设备及存储介质 |
CN111368562A (zh) * | 2020-02-28 | 2020-07-03 | 北京字节跳动网络技术有限公司 | 翻译图片中的文字的方法、装置、电子设备、及存储介质 |
US20200394271A1 (en) * | 2019-06-14 | 2020-12-17 | Netflix, Inc. | Machine-assisted translation for subtitle localization |
CN112464644A (zh) * | 2020-12-04 | 2021-03-09 | 北京中科凡语科技有限公司 | 自动断句模型建立方法及自动断句方法 |
CN112711954A (zh) * | 2020-12-31 | 2021-04-27 | 维沃软件技术有限公司 | 翻译方法、装置、电子设备和存储介质 |
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101090461A (zh) * | 2006-06-13 | 2007-12-19 | 中国科学院计算技术研究所 | 一种数字视频字幕自动翻译方法 |
CN102937972A (zh) * | 2012-10-15 | 2013-02-20 | 上海外教社信息技术有限公司 | 一种视听字幕制作系统及方法 |
WO2017191397A1 (fr) * | 2016-05-03 | 2017-11-09 | Orange | Procédé et dispositif de synchronisation de sous-titres |
CN108259971A (zh) * | 2018-01-31 | 2018-07-06 | 百度在线网络技术(北京)有限公司 | 字幕添加方法、装置、服务器及存储介质 |
CN109614604A (zh) * | 2018-12-17 | 2019-04-12 | 北京百度网讯科技有限公司 | 字幕处理方法、装置及存储介质 |
US20200394271A1 (en) * | 2019-06-14 | 2020-12-17 | Netflix, Inc. | Machine-assisted translation for subtitle localization |
CN110276349A (zh) * | 2019-06-24 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 视频处理方法、装置、电子设备及存储介质 |
CN111368562A (zh) * | 2020-02-28 | 2020-07-03 | 北京字节跳动网络技术有限公司 | 翻译图片中的文字的方法、装置、电子设备、及存储介质 |
CN112464644A (zh) * | 2020-12-04 | 2021-03-09 | 北京中科凡语科技有限公司 | 自动断句模型建立方法及自动断句方法 |
CN112711954A (zh) * | 2020-12-31 | 2021-04-27 | 维沃软件技术有限公司 | 翻译方法、装置、电子设备和存储介质 |
Non-Patent Citations (5)
Title |
---|
ZHANG JIACHENG 等: ""Neural Machine Translation With Explicit Phrase Alignment"", 《ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING》, no. 29, 16 April 2021 (2021-04-16), pages 1001 - 1010 * |
刘思丹: ""《穿越未知的亚洲》第九章至第十章翻译实践报告"", 《中国优秀硕士学位论文全文数据库 哲学与人文科学辑》, no. 2, 15 February 2017 (2017-02-15), pages 085 - 942 * |
孙田: "《外语学习理论与方法教程》", vol. 1, 31 January 2017, 安徽师范大学出版社, pages: 422 * |
蒋琴: ""《英国高等教育国际招生》(节选)英汉翻译实践报告"", 《中国优秀硕士学位论文全文数据库 哲学与人文科学辑》, no. 2, 15 February 2021 (2021-02-15), pages 085 - 416 * |
赵斌: ""外宣材料《天津临港经济区》、《天津临港经济区投资指南》的翻译实践报告"", 《中国优秀硕士学位论文全文数据库 哲学与人文科学辑》, no. 11, 15 November 2018 (2018-11-15), pages 085 - 171 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023103943A1 (zh) * | 2021-12-10 | 2023-06-15 | 维沃移动通信有限公司 | 图片处理方法、装置及电子设备 |
CN114420104A (zh) * | 2022-01-27 | 2022-04-29 | 网易有道信息技术(北京)有限公司 | 自动生成字幕的方法及其相关产品 |
CN114898368A (zh) * | 2022-03-30 | 2022-08-12 | 阿里巴巴(中国)有限公司 | 扫描翻译方法、设备和可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110210310B (zh) | 一种视频处理方法、装置和用于视频处理的装置 | |
CN111898388B (zh) | 视频字幕翻译编辑方法、装置、电子设备及存储介质 | |
CN108304412B (zh) | 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置 | |
CN113343675B (zh) | 一种字幕生成方法、装置和用于生成字幕的装置 | |
CN111368541A (zh) | 命名实体识别方法及装置 | |
CN109471919B (zh) | 零代词消解方法及装置 | |
CN107564526B (zh) | 处理方法、装置和机器可读介质 | |
CN108538284A (zh) | 同声翻译结果的展现方法及装置、同声翻译方法及装置 | |
CN111369978B (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN111860000A (zh) | 文本翻译编辑方法、装置、电子设备及存储介质 | |
CN112328793A (zh) | 评论文本数据的处理方法、装置及存储介质 | |
CN108255940A (zh) | 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置 | |
CN115269884A (zh) | 生成视频语料的方法、装置及相关设备 | |
CN107424612B (zh) | 处理方法、装置和机器可读介质 | |
CN111640452A (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN113920293A (zh) | 信息识别方法、装置、电子设备及存储介质 | |
CN111414766A (zh) | 一种翻译方法及装置 | |
CN113033163A (zh) | 一种数据处理方法、装置和电子设备 | |
CN111832297A (zh) | 词性标注方法、装置及计算机可读存储介质 | |
CN108095465A (zh) | 一种图像处理方法及装置 | |
CN116912478A (zh) | 目标检测模型构建、图像分类方法、电子设备 | |
CN109979435B (zh) | 数据处理方法和装置、用于数据处理的装置 | |
CN111324214A (zh) | 一种语句纠错方法和装置 | |
CN113343720B (zh) | 一种字幕翻译方法、装置和用于字幕翻译的装置 | |
CN113343720A (zh) | 一种字幕翻译方法、装置和用于字幕翻译的装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |