CN115098211A - 一种界面显示方法、装置、电子设备以及存储介质 - Google Patents
一种界面显示方法、装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN115098211A CN115098211A CN202210770953.0A CN202210770953A CN115098211A CN 115098211 A CN115098211 A CN 115098211A CN 202210770953 A CN202210770953 A CN 202210770953A CN 115098211 A CN115098211 A CN 115098211A
- Authority
- CN
- China
- Prior art keywords
- text information
- information
- sub
- target
- collation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000001915 proofreading effect Effects 0.000 claims abstract description 66
- 238000013519 translation Methods 0.000 claims abstract description 42
- 238000011156 evaluation Methods 0.000 claims abstract description 40
- 238000012986 modification Methods 0.000 claims abstract description 16
- 230000004048 modification Effects 0.000 claims abstract description 16
- 230000004044 response Effects 0.000 claims abstract description 6
- 238000004590 computer program Methods 0.000 claims description 12
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 238000012795 verification Methods 0.000 abstract 3
- 238000010586 diagram Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 206010071299 Slow speech Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/47—Machine-assisted translation, e.g. using translation memory
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本公开涉及一种界面显示方法、装置、电子设备以及存储介质,该方法包括:展示音视频译文校对界面,所述译文校对界面包括第一文本信息、第二文本信息以及校对目标信息;所述第一文本信息的语种与所述第二文本信息的语种不同,所述校对目标信息是基于评价标准对所述第二文本信息的评价结果,所述评价标准基于所述第一文本信息得到;响应于对所述第二文本信息的修改指令,对所述第二文本信息进行修改。通过展示在音视频译文校对界面中的校对目标信息,有利于根据校对目标信息对第二文本信息进行修改,使得校对后的第二文本信息合理,且与第一文本信息更加匹配,进而使得配音后的音视频易于理解,降低用户对音视频内容的理解难度。
Description
技术领域
本公开涉及配音技术领域,尤其涉及一种界面显示方法、装置、电子设备以及存储介质。
背景技术
随着信息技术的不断发展,用户可以在终端上观看多媒体信息,例如直播的音视频信息。
当前,一些视频可能是其他语种的视频,用户可能听不懂视频中的音频内容。针对这种情况,可以使用用户能理解的语种对该视频进行重新配音。但是在实际中,经常出现因对原音视频中内容翻译不合理,导致最后得到的配音音频不容易被听懂,增大了视频内容的理解难度。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种界面显示方法、装置、电子设备以及存储介质。
第一方面,本公开提供了一种界面显示方法,包括:
展示音视频译文校对界面,所述译文校对界面包括第一文本信息、第二文本信息以及校对目标信息;所述第一文本信息的语种与所述第二文本信息的语种不同,所述校对目标信息是基于评价标准对所述第二文本信息的评价结果,所述评价标准基于所述第一文本信息得到;
响应于对所述第二文本信息的修改指令,对所述第二文本信息进行修改。
第二方面,本公开还提供了界面显示装置,包括:
展示模块,用于展示音视频译文校对界面,所述译文校对界面包括第一文本信息、第二文本信息以及校对目标信息;所述第一文本信息的语种与所述第二文本信息的语种不同,所述校对目标信息是基于评价标准对所述第二文本信息的评价结果,所述评价标准基于所述第一文本信息得到;
修改模块,用于响应于对所述第二文本信息的修改指令,对所述第二文本信息进行修改。
第三方面,本公开还提供了一种电子设备,所述电子设备包括:
一条或多条处理器;
存储装置,用于存储一条或多条程序;
当所述一条或多条程序被所述一条或多条处理器执行,使得所述一条或多条处理器实现如上所述的界面显示方法。
第四方面,本公开还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的界面显示方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:
本公开实施例提供的技术方案通过设置译文校对界面包括第一文本信息、第二文本信息以及校对目标信息;第一文本信息的语种与第二文本信息的语种不同,校对目标信息是基于评价标准对第二文本信息的评价结果,评价标准基于第一文本信息得到,实质是通过展示在音视频译文校对界面中的校对目标信息,提示校对员当前第二文本信息存在的问题,以使校对员根据校对目标信息对第二文本信息进行修改,最终实现校对后的第二文本信息合理,且与第一文本信息更加匹配,进而使得配音后的音视频易于理解,降低用户对音视频内容的理解难度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种界面显示方法的流程图;
图2为本公开实施例提供的一种音视频译文校对界面的示意图;
图3为本公开实施例提供的另一种音视频译文校对界面的示意图;
图4为本公开实施例中的一种界面显示装置的结构示意图;
图5为本公开实施例中的一种电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
在说明本公开实施例提供的界面显示方法之前,对音视频配音的流程进行简单介绍,以便于更好地理解本公开实施例提供的界面显示方法。
当需要为了某个音视频进行配音时,首先,获取该音视频对应的第一文本信息,该第一文本信息的语种与音视频的语种一致;其次,将该第一文本信息翻译为第二文本信息,第二文本信息的语种与第一文本信息的语种不同;再次,形成与该第二文本信息对应的配音音频,最后将原音视频中的音频替换为配音音频,得到配音后的音视频文件。
本申请提供的界面显示方法对应于将第一文本信息翻译为第二文本信息的环节。
图1为本公开实施例提供的一种界面显示方法的流程图,本实施例可适用于客户端中对音视频进行配音的情况,该方法可以由界面显示装置执行,该装置可以采用软件和/或硬件的方式实现,该装置可配置于电子设备中,例如终端,具体包括但不限于智能手机、掌上电脑、平板电脑、带显示屏的可穿戴设备、台式机、笔记本电脑、一体机、智能家居设备等。或者,本实施例可适用于服务端中对音视频进行配音的情况,该方法可以由界面显示装置执行,该装置可以采用软件和/或硬件的方式实现,该装置可配置于电子设备中,例如服务器。
如图1所示,该方法具体可以包括:
S110、展示音视频译文校对界面,译文校对界面包括第一文本信息、第二文本信息以及校对目标信息;第一文本信息的语种与第二文本信息的语种不同,校对目标信息为基于评价标准对第二文本信息的评价结果,评价标准基于第一文本信息得到。
第一文本信息是作为翻译基础的文本信息。在实际中,若音视频包括字幕信息,第一文本信息为从音视频直接分离出的字幕信息。若音视频不包括字幕信息,第一文本信息为对音视频进行音频提取,并基于提取到的音频进行语音识别获得的文本信息。在实际中,第一文本信息的语种与音视频对应的语种可以相同,也可以不同相同。本申请对此不作限制。
第二文本信息是对第一文本信息进行翻译,得到的翻译结果。
校对目标信息是基于评价标准对第二文本信息的评价结果。具体地,校对目标信息用于提示校对员当前第二文本信息存在何种问题的信息。校对目标信息可以使校对员明了当前对第二文本信息的修改方向。
对第二文本信息进行评价的评价标准有多种,本申请对此不作限制。示例性地,在设置评价标准时,考虑如果基于当前该第二文本信息生成配音音频,并利用该配音音频替换音视频的原音频后,观众是否易于理解该音视频。
音视频译文校对界面是指辅助校对员对第二文本信息进行校对的页面。并且,音视频译文校对界面可允许校对员对第二文本信息进行编辑、修改。
S120、响应于对第二文本信息的修改指令,对第二文本信息进行修改。
在校对过程中,根据校对目标信息,对第二文本信息进行修改,以达到校对的目的。
上述技术方案通过设置译文校对界面包括第一文本信息、第二文本信息以及校对目标信息;第一文本信息的语种与第二文本信息的语种不同,校对目标信息是基于评价标准对第二文本信息的评价结果,评价标准基于第一文本信息得到。其实质是利用校对目标信息提示校对员当前第二文本信息存在的问题,以使校对员根据校对目标信息对第二文本信息进行修改,最终实现校对后的第二文本信息合理,且与第一文本信息更加匹配,进而使得配音后的音视频易于理解,降低用户对音视频内容的理解难度。
在上述技术方案的基础上,可选地,在S120之后,更新校对目标信息。具体地,对第二文本信息进行修改之后,根据修改后的第二文本信息进行评价,得到新的校对目标信息,并利用新的校对目标信息替换修改前的校对目标信息,展示在译文校对界面中。这样设置可以便于校对员明了当前修改后的第二文本信息是否仍然存在问题,如果将其转化为配音音频,替换原音视频中的原音频后,该音视频是否易于用户理解。
在上述各技术方案的基础上,可选地,第一文本信息包括一条或多条第一子文本信息;第二文本信息包括一条或多条第二子文本信息;校对目标信息包括一条或多条子校对目标信息;一条第一子文本信息、一条第二子文本信息以及一条子校对目标信息构成一个校对信息组;在任意一个校对信息组中,第一子文本信息、第二子文本信息以及子校对目标信息三者具有对应关系。这样设置的实质是,通过化整为零的方式,降低校对第二文本信息的难度。可选地,在实际中,一句话为一条第一子文本信息。
在实际中,译文校对界面展示第一文本信息、第二文本信息以及校对目标信息的展示方法有多种,本申请对此不作限制。下面示例性地给出两种展示方法。
方法一
译文校对界面包括第一区域和第二区域。各第一子文本信息沿竖向依次显示在第一区域,各第二子文本信息沿竖向依次显示在第二区域;各子校对目标信息显示在第二区域,且各子校对目标信息的显示位置和与其对应的第二子文本信息的显示位置之间的距离小于设定距离阈值;在任意一个校对信息组中,第一子文本信息和第二子文本信息呈横向的对照关系。
其中,各子校对目标信息的显示位置和与其对应的第二子文本信息的显示位置之间的距离小于设定距离阈值,是指,各子校对目标信息和与其对应的第二子文本信息的距离较近,使得校对员可以直观地明确各子校对目标信息和各第二子文本信息的对应关系。
图2为本公开实施例提供的一种音视频译文校对界面的示意图。参见图2,该音视频译文校对界面包括第一区域A和第二区域B。第一文本信息10包括第一子文本信息11、第一子文本信息12、以及第一子文本信息13。第一子文本信息11、第一子文本信息12、以及第一子文本信息13沿竖向依次均被展示在第一区域A中。第二文本信息20包括第二子文本信息21、第二子文本信息22、以及第二子文本信息23。第二子文本信息21、第二子文本信息22、以及第二子文本信息23沿竖向依次均被展示在第二区域B中。校对目标信息30包括子校对目标信息31、子校对目标信息32以及子校对目标信息33。子校对目标信息31、子校对目标信息32以及子校对目标信息33沿竖向依次均被展示在第二区域B中。
第一子文本信息11、第二子文本信息21以及子校对目标信息31三者具有对应关系。即第二子文本信息21是对第一子文本信息11的翻译结果,子校对目标信息31是对第二子文本信息21的评价结果。第一子文本信息11、第二子文本信息21以及子校对目标信息31构成一个校对信息组。
类似地,第一子文本信息12、第二子文本信息22以及子校对目标信息32三者具有对应关系。即第二子文本信息22是对第一子文本信息12的翻译结果,子校对目标信息32是对第二子文本信息22的评价结果。第一子文本信息12、第二子文本信息22以及子校对目标信息32构成一个校对信息组。
第一子文本信息13、第二子文本信息23以及子校对目标信息33三者具有对应关系。即第二子文本信息23是对第一子文本信息13的翻译结果,子校对目标信息33是对第二子文本信息23的评价结果。第一子文本信息13、第二子文本信息23以及子校对目标信息33构成一个校对信息组。
继续参见图2,在任意一个校对信息组中,第一子文本信息和第二子文本信息呈横向的对照关系,子校对目标信息位于与其对应的第二子文本信息的右上角处,以方便校对员明确各第二子文本信息存在的问题,参考第一文本信息,对各第二文本信息进行校对,有助于提高校对效率与精度。
方法二
译文校对界面包括第三区域;各校对信息组沿竖向依次显示在第三区域;在任意一个校对信息组中,第一子文本信息、第二子文本信息呈竖向的对照关系;各子校对目标信息的显示位置和与其对应的第二子文本信息的显示位置小于设定距离阈值。
同样地,各子校对目标信息的显示位置和与其对应的第二子文本信息的显示位置之间的距离小于设定距离阈值,是指,各子校对目标信息和与其对应的第二子文本信息的距离较近,使得校对员可以直观地明确各子校对目标信息和各第二子文本信息的对应关系。
图3为本公开实施例提供的另一种音视频译文校对界面的示意图。参见图3,译文校对界面包括第三区域C;各校对信息组沿竖向依次排列在第三区域C。任一校对信息组中的第一子文本信息和第二子文本信息竖向排列。例如,第一个校对信息组中的第一子文本信息11、第二子文本信息21竖向排列。第二个校对信息组中的第一子文本信息12、第二子文本信息22竖向排列。第三个校对信息组中的第一子文本信息13、第二子文本信息23竖向排列。
各子校对目标信息位于与其对应的第二子文本信息的右上角。示例性地,子校对目标信息31位于与其对应的第二子文本信息21的右上角。子校对目标信息32位于与其对应的第二子文本信息22的右上角。子校对目标信息33位于与其对应的第二子文本信息23的右上角。以方便校对员明确各第二子文本信息存在的问题,参考第一子文本信息,对各第二子文本信息进行校对,有助于提高校对效率与精度。
需要说明的是,在上述实施例中,各子校对目标信息的显示位置还可以位于与其对应的第二子文本信息的显示位置的左侧、右侧、上方或下方等。
本领域技术人员可以理解,在实际中,造成用户对配音后视频内容理解困难的一个原因是,配音后视频中人物的语速忽快忽慢。而之所以会出现这个问题,是因为针对同一内容,采用不同语种表述,得到的句子对应的音素数不同。其中,音素是指根据语音的自然属性划分出来的最小语音单位。从声学性质来看,音素是从音质角度划分出来的最小语音单位。从生理性质来看,一个发音动作形成一个音素。如〔ma〕包含〔m〕〔a〕两个发音动作,是两个音素。
假设原视频中包括以中文表述的语句m和语句p,其中,语句m包括20个音素,语句p包括20个音素,原视频中人物说出语句m和说出语句p耗时一样。将该语句m翻译为以英文表述的语句n,该语句n包括40个音素。将该语句p翻译为以英文表述的语句q,该语句q包括10个音素。针对这种情况,为了达到“声画同步”的效果,需要对配音音频进行加减速处理才能与原画面的时间轴对应,最终导致配音后视频中人物在说语句n时语速较快,在说语句q时语速较慢。如此,整体表现为配音后视频中人物语速忽快忽慢。
针对于此,可选地,用于对第二文本信息进行评价的评价标准为目标音素数。可选地,目标音素数基于第一子文本信息对应的音频信息在音视频中的持续时长确定。具体地,目标音素数是指同一校对信息组中第一子文本信息对应的音频信息在音视频中的持续时长内可以容纳的音素的个数。其中,“可以容纳”应当理解为,以预设语速进行配音,在该持续时长内,可以说出的音素的个数。本申请对预设语速不作限制,但需要确保在该预设语速下,用户可以理解配音所表达的内容。
目标音素数的具体确定方法有多种,本申请对此不作限制。可选地,目标音素数基于第一子文本信息确定。
在一个实施例中,目标音素数基于第一子文本信息对于的音频信息在音视频中的持续时长确定。示例性地,可以基于原音视频,得到任一第一子文本信息的开始时刻和结束时刻,进而得到任一第一子文本信息的持续时长。由于持续时长和其可容纳的音素数成正比,可以预先构建持续时长和其可容纳的音素数的函数关系,该函数关系以持续时长为自变量,以可容纳的音素数为因变量。基于该函数关系以及任一第一子文本信息的持续时长,可以得到在任一第一子文本信息的持续时长内可以容纳的音素数,即任一第一子文本信息所属的校对信息组的目标音素数。
在另一个实施例中,目标音素数基于第一子文本信息对应的音素数确定。示例性地,预先构建用于计算文本信息对应的音素数的计算模型。该计算模型以文本信息为输入量,以该文本信息对应的音素数为输出量。将任一第一子文本信息输入到该计算模型,可以得到任一第一子文本信息对应的音素数。计算模型可以利用神经网络技术构建,此为现有技术。
需要说明的是,第一子文本信息对应的音素数,是指说出第一子文本信息时,需要说出的音素的总个数。
可选地,在确定第二子文本信息对应的音素数时,同样基于上述计算模型进行确定。
类似地,第二子文本信息对应的音素数,是指说出第二子文本信息时,需要说出的音素的总个数。
进一步地,在任意一个校对信息组中,若当前第二子文本信息对应的音素数与目标音素数的差值的绝对值小于或等于设定阈值,子校对目标信息处于目标达成状态;若当前第二子文本信息对应的音素数与目标音素数的差值的绝对值大于设定阈值,子校对目标信息处于目标未达成状态。
示例性地,设置设定阈值为0,继续参见图2或图3,第一个校对信息组中,第二子文本信息21对应的音素数与目标音素数的差值等于0,该校对信息组的子校对目标信息31处于目标达成状态。第二个校对信息组中,第二子文本信息22对应的音素数与目标音素数的差值等于-5,其绝对值(为5)大于0,该校对信息组的子校对目标信息32处于目标未达成状态。第三个校对信息组中,第二子文本信息23对应的音素数与目标音素数的差值等于+1,其绝对值(为1)大于0,该校对信息组的子校对目标信息33处于目标未达成状态。
在一个实施例中,处于目标达成状态的子校对目标信息包括目标达成提示符;处于目标未达成状态的子校对目标信息包括当前第二子文本信息对应的音素数与目标音素数的差值。继续参见图2或图3,目标达成提示符为“√”。这样设置可以便于校对员快速明了哪些第二子文本信息达标,不需要继续修改;哪些第二子文本信息未达标,需要继续修改,进而提高校对的效率。
可选地,在实际中,还可以设置处于目标未达成状态的子校对目标信息包括目标音素数与当前第二子文本信息对应的音素数的差值。
在另一个实施例中,处于目标达成状态的子校对目标信息的背景颜色与处于目标未达成状态的子校对目标信息的背景颜色不同;和/或,处于目标达成状态的校对目标信息的边框颜色与处于目标未达成状态的校对目标信息的边框颜色不同。这样设置可以便于校对员快速明了哪些第二子文本信息达标,不需要继续修改;哪些第二子文本信息未达标,需要继续修改,进而提高校对的效率。
在上述各技术方案的基础上,可选地,继续参见图2或图3,译文校对界面还包括音视频播放窗口D,该音视频播放窗口D用于播放音视频。这样设置便于校对员能够边看视频和/或边听音频,边进行第二文本信息的校对,可以满足校对员多样化的校对需求。
进一步地,在上述各技术方案的基础上,设置若音视频为直播音视频,设置已播放的内容对应的第一子文本信息与第二子文本信息所呈现的颜色为第一颜色,正在播放的内容对应的第一子文本信息与第二子文本信息所呈现的颜色为第二颜色,未播放的内容对应的第一子文本信息与第二子文本信息所呈现的颜色为第三颜色,第一颜色、第二颜色以及第三颜色中任意两者均不同。这样设置便于校对员在校对的过程中,能够实时了解当前播放进度,进而有的放矢地对第二文本信息进行校对。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
图4为本公开实施例中的一种界面显示装置的结构示意图。本公开实施例所提供的界面显示装置可以配置于客户端中,或者可以配置于服务端中。参见图4,该界面显示装置具体包括:
展示模块510,用于展示音视频译文校对界面,所述译文校对界面包括第一文本信息、第二文本信息以及校对目标信息;所述第一文本信息的语种与所述第二文本信息的语种不同,所述校对目标信息是基于评价标准对所述第二文本信息的评价结果,所述评价标准基于所述第一文本信息得到;
修改模块520,用于响应于对所述第二文本信息的修改指令,对所述第二文本信息进行修改。
进一步地,该装置还包括更新模块,
更新模块用于响应于对所述第二文本信息的修改指令,对所述第二文本信息进行修改之后,更新所述校对目标信息。
进一步地,所述第一文本信息包括一条或多条第一子文本信息;所述第二文本信息包括一条或多条第二子文本信息;所述校对目标信息包括一条或多条子校对目标信息;
一条所述第一子文本信息、一条所述第二子文本信息以及一条所述子校对目标信息构成一个校对信息组;在任意一个所述校对信息组中,所述第一子文本信息、所述第二子文本信息以及所述子校对目标信息三者具有对应关系。
进一步地,在任意一个所述校对信息组中,以目标音素数为评价标准,若当前所述第二子文本信息对应的音素数与目标音素数的差值的绝对值小于或等于设定阈值,所述子校对目标信息处于目标达成状态;若当前所述第二子文本信息对应的音素数与所述目标音素数的差值的绝对值大于设定阈值,所述子校对目标信息处于目标未达成状态;其中,所述目标音素数基于所述第一子文本信息确定。
进一步地,所述目标音素数基于所述第一子文本信息对应的音频信息在所述音视频中的持续时长确定。
进一步地,处于目标达成状态的所述子校对目标信息包括目标达成提示符;
处于目标未达成状态的所述子校对目标信息包括当前所述第二子文本信息对应的音素数与所述目标音素数的差值;或者,处于目标未达成状态的所述子校对目标信息包括所述目标音素数与当前所述第二子文本信息对应的音素数的差值。
进一步地,处于目标达成状态的所述子校对目标信息的背景颜色与处于目标未达成状态的所述子校对目标信息的背景颜色不同;和/或,
处于目标达成状态的所述子校对目标信息的边框颜色与处于目标未达成状态的所述子校对目标信息的边框颜色不同。
进一步地,所述译文校对界面包括第一区域和第二区域;
各所述第一子文本信息沿竖向依次显示在所述第一区域,各所述第二子文本信息沿竖向依次显示在所述第二区域;各所述子校对目标信息显示在所述第二区域,且各所述子校对目标信息的显示位置和与其对应的所述第二子文本信息的显示位置之间的距离小于设定距离阈值;
在任意一个所述校对信息组中,所述第一子文本信息和所述第二子文本信息呈横向的对照关系。
进一步地,所述译文校对界面包括第三区域;各所述校对信息组沿竖向依次显示在所述第三区域;
在任意一个所述校对信息组中,所述第一子文本信息、所述第二子文本信息呈竖向的对照关系;
各所述子校对目标信息的显示位置和与其对应的所述第二子文本信息的显示位置小于设定距离阈值。
本公开实施例提供的界面显示装置,可执行本公开方法实施例所提供的界面显示方法中客户端或服务端所执行的步骤,具备执行步骤和有益效果,此处不再赘述。
图5为本公开实施例中的一种电子设备的结构示意图。下面具体参考图5,其示出了适于用来实现本公开实施例中的电子设备1000的结构示意图。本公开实施例中的电子设备1000可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(条人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)、可穿戴电子设备等等的移动终端以及诸如数字TV、台式计算机、智能家居设备等等的固定终端。图5示出的电子设备仅仅是一条示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备1000可以包括处理装置(例如中央处理器、图形处理器等)1001,其可以根据存储在只读存储器(ROM)1002中的程序或者从存储装置1008加载到随机访问存储器(RAM)1003中的程序而执行各种适当的动作和处理以实现如本公开所述的实施例的界面显示方法。在RAM 1003中,还存储有电子设备1000操作所需的各种程序和信息。处理装置1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
通常,以下装置可以连接至I/O接口1005:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置1006;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置1007;包括例如磁带、硬盘等的存储装置1008;以及通信装置1009。通信装置1009可以允许电子设备1000与其他设备进行无线或有线通信以交换信息。虽然图5示出了具有各种装置的电子设备1000,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行程图所示的方法的程序代码,从而实现如上所述的界面显示方法。在这样的实施例中,该计算机程序可以通过通信装置1009从网络上被下载和安装,或者从存储装置1008被安装,或者从ROM 1002被安装。在该计算机程序被处理装置1001执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一条或多条导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的信息信号,其中承载了计算机可读的程序代码。这种传播的信息信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字信息通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一条或者多条程序,当上述一条或者多条程序被该电子设备执行时,使得该电子设备:
展示音视频译文校对界面,所述译文校对界面包括第一文本信息、第二文本信息以及校对目标信息;所述第一文本信息的语种与所述第二文本信息的语种不同,所述校对目标信息是基于评价标准对所述第二文本信息的评价结果,所述评价标准基于所述第一文本信息得到;
响应于对所述第二文本信息的修改指令,对所述第二文本信息进行修改。
可选的,当上述一条或者多条程序被该电子设备执行时,该电子设备还可以执行上述实施例所述的其他步骤。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一条独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每条方框可以代表一条模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一条或多条用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两条接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每条方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一条或多条硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一条或多条线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一条或多条实施例,本公开提供了一种电子设备,包括:
一条或多条处理器;
存储器,用于存储一条或多条程序;
当所述一条或多条程序被所述一条或多条处理器执行,使得所述一条或多条处理器实现如本公开提供的任一所述的界面显示方法。
根据本公开的一条或多条实施例,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开提供的任一所述的界面显示方法。
本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序或指令,该计算机程序或指令被处理器执行时实现如上所述的界面显示方法。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一条实体或者操作与另一条实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一条……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (12)
1.一种界面显示方法,其特征在于,包括:
展示音视频译文校对界面,所述译文校对界面包括第一文本信息、第二文本信息以及校对目标信息;所述第一文本信息的语种与所述第二文本信息的语种不同,所述校对目标信息是基于评价标准对所述第二文本信息的评价结果,所述评价标准基于所述第一文本信息得到;
响应于对所述第二文本信息的修改指令,对所述第二文本信息进行修改。
2.根据权利要求1所述的方法,其特征在于,所述响应于对所述第二文本信息的修改指令,对所述第二文本信息进行修改之后,还包括:
更新所述校对目标信息。
3.根据权利要求1或2所述的方法,其特征在于,
所述第一文本信息包括一条或多条第一子文本信息;所述第二文本信息包括一条或多条第二子文本信息;所述校对目标信息包括一条或多条子校对目标信息;
一条所述第一子文本信息、一条所述第二子文本信息以及一条所述子校对目标信息构成一个校对信息组;在任意一个所述校对信息组中,所述第一子文本信息、所述第二子文本信息以及所述子校对目标信息三者具有对应关系。
4.根据权利要求3所述的方法,其特征在于,
在任意一个所述校对信息组中,以目标音素数为评价标准,若当前所述第二子文本信息对应的音素数与目标音素数的差值的绝对值小于或等于设定阈值,所述子校对目标信息处于目标达成状态;若当前所述第二子文本信息对应的音素数与所述目标音素数的差值的绝对值大于设定阈值,所述子校对目标信息处于目标未达成状态;其中,所述目标音素数基于所述第一子文本信息确定。
5.根据权利要求4所述的方法,其特征在于,
所述目标音素数基于所述第一子文本信息对应的音频信息在所述音视频中的持续时长确定。
6.根据权利要求4所述的方法,其特征在于,
处于目标达成状态的所述子校对目标信息包括目标达成提示符;
处于目标未达成状态的所述子校对目标信息包括当前所述第二子文本信息对应的音素数与所述目标音素数的差值;或者,处于目标未达成状态的所述子校对目标信息包括所述目标音素数与当前所述第二子文本信息对应的音素数的差值。
7.根据权利要求4所述的方法,其特征在于,
处于目标达成状态的所述子校对目标信息的背景颜色与处于目标未达成状态的所述子校对目标信息的背景颜色不同;和/或,
处于目标达成状态的所述子校对目标信息的边框颜色与处于目标未达成状态的所述子校对目标信息的边框颜色不同。
8.根据权利要求3所述的方法,其特征在于,所述译文校对界面包括第一区域和第二区域;
各所述第一子文本信息沿竖向依次显示在所述第一区域,各所述第二子文本信息沿竖向依次显示在所述第二区域;各所述子校对目标信息显示在所述第二区域,且各所述子校对目标信息的显示位置和与其对应的所述第二子文本信息的显示位置之间的距离小于设定距离阈值;
在任意一个所述校对信息组中,所述第一子文本信息和所述第二子文本信息呈横向的对照关系。
9.根据权利要求3所述的方法,其特征在于,所述译文校对界面包括第三区域;各所述校对信息组沿竖向依次显示在所述第三区域;
在任意一个所述校对信息组中,所述第一子文本信息、所述第二子文本信息呈竖向的对照关系;
各所述子校对目标信息的显示位置和与其对应的所述第二子文本信息的显示位置小于设定距离阈值。
10.一种界面显示装置,其特征在于,包括:
展示模块,用于展示音视频译文校对界面,所述译文校对界面包括第一文本信息、第二文本信息以及校对目标信息;所述第一文本信息的语种与所述第二文本信息的语种不同,所述校对目标信息是基于评价标准对所述第二文本信息的评价结果,所述评价标准基于所述第一文本信息得到;
修改模块,用于响应于对所述第二文本信息的修改指令,对所述第二文本信息进行修改。
11.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210770953.0A CN115098211A (zh) | 2022-06-30 | 2022-06-30 | 一种界面显示方法、装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210770953.0A CN115098211A (zh) | 2022-06-30 | 2022-06-30 | 一种界面显示方法、装置、电子设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115098211A true CN115098211A (zh) | 2022-09-23 |
Family
ID=83295344
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210770953.0A Pending CN115098211A (zh) | 2022-06-30 | 2022-06-30 | 一种界面显示方法、装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115098211A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814496A (zh) * | 2020-08-04 | 2020-10-23 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、设备及存储介质 |
CN113891168A (zh) * | 2021-10-19 | 2022-01-04 | 北京有竹居网络技术有限公司 | 字幕处理方法、装置、电子设备和存储介质 |
CN114554238A (zh) * | 2022-02-23 | 2022-05-27 | 北京有竹居网络技术有限公司 | 直播语音同传方法、装置、介质及电子设备 |
-
2022
- 2022-06-30 CN CN202210770953.0A patent/CN115098211A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814496A (zh) * | 2020-08-04 | 2020-10-23 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、设备及存储介质 |
CN113891168A (zh) * | 2021-10-19 | 2022-01-04 | 北京有竹居网络技术有限公司 | 字幕处理方法、装置、电子设备和存储介质 |
CN114554238A (zh) * | 2022-02-23 | 2022-05-27 | 北京有竹居网络技术有限公司 | 直播语音同传方法、装置、介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110969012B (zh) | 文本纠错方法、装置、存储介质及电子设备 | |
CN111599343B (zh) | 用于生成音频的方法、装置、设备和介质 | |
CN111986655B (zh) | 音频内容识别方法、装置、设备和计算机可读介质 | |
CN112908292B (zh) | 文本的语音合成方法、装置、电子设备及存储介质 | |
CN113257218B (zh) | 语音合成方法、装置、电子设备和存储介质 | |
CN113778419B (zh) | 多媒体数据的生成方法、装置、可读介质及电子设备 | |
WO2021088790A1 (zh) | 用于目标设备的显示样式调整方法和装置 | |
CN112380365A (zh) | 一种多媒体的字幕交互方法、装置、设备及介质 | |
CN113886612A (zh) | 一种多媒体浏览方法、装置、设备及介质 | |
CN115967833A (zh) | 视频生成方法、装置、设备计存储介质 | |
CN110286776A (zh) | 字符组合信息的输入方法、装置、电子设备和存储介质 | |
CN110379406A (zh) | 语音评论转换方法、系统、介质和电子设备 | |
CN112242143B (zh) | 一种语音交互方法、装置、终端设备及存储介质 | |
CN115171695B (zh) | 语音识别方法、装置、电子设备和计算机可读介质 | |
CN112837672A (zh) | 对话归属的确定方法、装置、电子设备及存储介质 | |
CN115171645A (zh) | 一种配音方法、装置、电子设备以及存储介质 | |
CN110852801A (zh) | 信息处理方法、装置及设备 | |
CN115098211A (zh) | 一种界面显示方法、装置、电子设备以及存储介质 | |
CN113221514A (zh) | 文本处理方法、装置、电子设备和存储介质 | |
KR20220127935A (ko) | 정보 상호작용을 위한 방법 및 장치 | |
CN114398135A (zh) | 交互方法、装置、电子设备、存储介质和程序产品 | |
CN114697760B (zh) | 一种处理方法、装置、电子设备及介质 | |
CN114299950B (zh) | 一种字幕生成方法、装置及设备 | |
CN113132789B (zh) | 一种多媒体的交互方法、装置、设备及介质 | |
CN113241061B (zh) | 语音识别结果的处理方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |