CN113986161A - 一种音视频通信中实时提词的方法和装置 - Google Patents

一种音视频通信中实时提词的方法和装置 Download PDF

Info

Publication number
CN113986161A
CN113986161A CN202011354355.2A CN202011354355A CN113986161A CN 113986161 A CN113986161 A CN 113986161A CN 202011354355 A CN202011354355 A CN 202011354355A CN 113986161 A CN113986161 A CN 113986161A
Authority
CN
China
Prior art keywords
application
word
instruction
prompting
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011354355.2A
Other languages
English (en)
Inventor
张武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Kadoxi Technology Co ltd
Original Assignee
Shenzhen Kadoxi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Kadoxi Technology Co ltd filed Critical Shenzhen Kadoxi Technology Co ltd
Priority to CN202011354355.2A priority Critical patent/CN113986161A/zh
Publication of CN113986161A publication Critical patent/CN113986161A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • G06F3/1423Digital output to display device ; Cooperation and interconnection of the display device with other functional units controlling a plurality of local displays, e.g. CRT and flat panel display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明涉及通信技术领域,特别是涉及一种音视频通信中实时提词的方法和装置,其方法包括,获取响应于用户先后对第二提词应用、显词应用操作中的启动指令,在响应启动指令的第一显示终端中显示启动显词应用的用户界面,在响应启动指令的第二显示终端中显示启动第二提词应用的用户界面;获取响应于用户对第二提词应用操作的同步指令,根据同步指令将与第二提词应用中的文本内容同步于显词应用中,显词应用中的用户界面对文本内容进行滚动显示,提高了发言者发言正确性的同时也保证了通信中所展示的音视频效果。

Description

一种音视频通信中实时提词的方法和装置
技术领域
本发明涉及通信技术领域,特别是涉及一种音视频通信中实时提词的方法和装置。
背景技术
随着通讯技术的不断发展,在特定的音视频通信场景中,例如直播、视频会议等,发言者(主播)通常会借助提词以避免自己在实时通信发言的过程中出现忘词。
在移动终端,随着分屏技术的不断发展,多个应用程序可同时同屏运行。在音视频通信场景中,发言者可同时启动通信应用和提词应用,即,在通信的过程中进行提词,一般的,摄像头采集的图像占用大量界面,提词的文本内容占用小量界面进行滚动显示。虽然极大的提高了发言者言论的正确性,但在实时通信的过程中,发言者却难以发现后续可能存在错误的文本内容并及时修改,同样也可能造成发言失误。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种音视频通信中实时提词的方法和装置。
为了解决上述问题,本发明实施例公开了一种音视频通信中实时提词的方法,包括:
获取响应于用户先后对第二提词应用、显词应用操作中的启动指令,在响应所述启动指令的第一显示终端中显示启动所述显词应用的用户界面,在响应所述启动指令的第二显示终端中显示启动所述第二提词应用的用户界面;
获取响应于用户对所述第二提词应用操作的同步指令,根据所述同步指令将与所述第二提词应用中的文本内容同步于所述显词应用中,所述显词应用中的用户界面对所述文本内容进行滚动显示。
进一步的,所述获取响应于用户先后对第二提词应用、显词应用操作中的启动指令,之前,包括:
获取所述第一提词应用、所述第二提词应用和所述显词应用的标识信息;
调用基于Android系统的Binder接口,建立所述第一提词应用与所述显词应用之间、所述第二提词应用和所述显词应用之间的进程间通信。
进一步的,所述获取响应于用户先后对第二提词应用、显词应用操作中的启动指令,在响应所述启动指令的第一显示终端中显示启动所述显词应用的用户界面,在响应所述启动指令的第二显示终端中显示启动所述第二提词应用的用户界面,之后,还包括:
获取响应于用户对所述第一提词应用的启动指令;
判断进程占用状态,若当前进程以被所述第二提词应用占用,结束所述第二提词应用的运行,根据所述启动指令启动第一提词应用。
进一步的,所述获取响应于用户对所述第一提词应用的启动指令,之后,还包括:
获取响应于用户对所述第一提词应用的启动指令;
判断进程占用状态,若当前进程以被所述第二提词应用占用,发送进程被占用的提示信息至第一显示终端并通过该终端对所述提示信息进行显示;获取响应于用户对所述第二提词应用的结束指令,结束所述第二提词应用,启动所述第一提词应用;或,
获取响应于用户对所述第一提词应用的结束指令,结束所述第一提词应用。
进一步的,所述所述显词应用中的用户界面对所述文本内容进行滚动显示,之前,还包括:
获取响应于用户对所述第一提词应用或所述第二提词应用的编辑指令;
触发所述第一提词应用或第二提词应用中的对所述文本内容的编辑入口;
接收用户根据所述编辑入口对所述文本内容的编辑信息并存储;
根据所述同步指令,将存储的所述文本内容同步至所述显词应用中进行滚动显示。
进一步的,所述所述显词应用中的用户界面对所述文本内容进行滚动显示,之前,还包括:
获取响应于用户对所述第一提词应用或所述第二提词应用的编辑指令;
获取所述文本内容在所述显词应用中处于当前滚动显示的字符串的索引值范围;
根据所述索引值范围选取最大索引值,确定所述第一提词应用或所述第二提词应用中所述文本内容的编辑区域,所述编辑区域的字符串的最小索引值大于所述显词应用中处于当前滚动显示的字符串的最大索引值;
接收用户根据所述编辑入口对所述编辑区域中的所述文本内用的编辑信息并存储。
进一步的,所述接收用户根据所述编辑入口对所述编辑区域中的所述文本内用的编辑信息并存储,之后,包括:
确定所述显词应用中所述文本内容的替换区域,所述文本内容的替换区域的字符串的最小索引值大于所述显词应用中处于当前滚动显示的字符串的最大索引值;
根据所述同步指令,将所述编辑区域内已编辑的所述文本内容与所述替换区域内原始的所述文本内容进行替换。
还提供一种音视频通信中实时提词的装置,包括:
启动模块,用于获取响应于用户先后对第二提词应用、显词应用操作中的启动指令,在响应所述启动指令的第一显示终端中显示启动所述显词应用的用户界面,在响应所述启动指令的第二显示终端中显示启动所述第二提词应用的用户界面;
同步模块,用于获取响应于用户对所述第二提词应用操作的同步指令,根据所述同步指令将与所述第二提词应用中的文本内容同步于所述显词应用中,所述显词应用中的用户界面对所述文本内容进行滚动显示。
本发明实施例包括以下优点:
发言者使用第一显示终端进行音视频通信,例如直播或视频会议,协助者使用第二显示终端对第一显示终端中滚动显示的文本内容进行实时审阅和修改,避免了文本内容错误造成发言者发言失误,提高了发言者发言正确性的同时也保证了通信中所展示的音视频效果。
附图说明
图1是本发明的一种音视频通信中实时提词的方法流程图;
图2是本发明的一种音视频通信中实时提词的装置实施例的结构框图;
图3是本发明的一种音视频通信中实时提词的计算机设备。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
首先,对本申请实施例的应用场景进行说明。音视频通信,即音频、视频同步通信,如直播、视频会议等。发言者所使用的显示终端可以理解为如手机、平板等自带音视频采集功能的移动终端,也可以是电脑等外接音视频采集装置。
在本实施例中,发言者所使用的显示终端至少为两个,以两个显示终端为例,第一显示终端集成搭载有Android操作系统,Android操作系统中内置的两个操作界面lcd0和lcd1分别与第一显示终端的显示屏和第二显示终端的显示屏连接,可以理解为,lcd0克隆得到lcd1,此为现有技术,不作阐述。
第一显示终端和第二显示终端均可接收来自用户的触控指令,在第一显示终端上显示安装有第一提词应用和显词应用的用户界面,显词应用用以对提词应用中文本内容进行单独显示,在第二显示终端上显示安装有第二提词应用的用户界面,其中,第一提词应用和第二提词应用的APK(Android application package,Android应用程序包)共享Android操作系统中的同一进程,可以理解为,第一提词应用通过克隆或复制得到第二提词应用,亦或第二提词应用的图标为第一提词应用所复制的快捷方式,即,第一提词应用或第二提词应用在同一时间只能启动其中一个,也即,在同一进程的限制条件下,其中一提词应用占用时,另一提词应用则无法打开。
接收到用户对第一提词应用和显词应用的开启指令后,第一提词应用和显词应用先后被打开运行,当接收到用户对第二提词应用的开启指令时,判断到第二提词应用的进程已被第一提词应用所占,在第二显示终端的屏幕上则显示类似于“此应用进程被占用”的提示窗口,第二提词应用将不能被打开应用。
可以理解的,显词应用的主要作用是读取第一提词应用或第二提词应用中的文本内容,生成显词窗口使其滚动显示,也即,第一提词应用和第二提词应用分别与显词应用预先关联;在第一显示终端的操作界面上,用户可对显词窗口进行大小、位置进行调节,也可以对其滚动显示的速度、字体的大小和颜色进行调节,以适应发言者面对第一显示终端进行看词讲演。
本实施例中,发言者发言的过程中,发言者面对第一显示终端进行发言,第一显示终端上搭载有摄像头对其进行图像采集,其屏幕上显示所采集的图像,在分屏技术的加持下,还可在第一显示终端打开显词应用进行同屏显示,另一方面,协助者打开第二显示终端上的第二提词应用,将第二提词应用中的文本内容被显词应用读取并显示。
如图1,示出一种音视频通信中实时提词的方法流程图,其方法步骤包括:
S100,获取响应于用户先后对第二提词应用、显词应用操作中的启动指令,在响应所述启动指令的第一显示终端中显示启动所述显词应用的用户界面,在响应所述启动指令的第二显示终端中显示启动所述第二提词应用的用户界面。
S200,获取响应于用户对所述第二提词应用操作的同步指令,根据所述同步指令将与所述第二提词应用中的文本内容同步于所述显词应用中,所述显词应用中的用户界面对所述文本内容进行滚动显示。
在步骤S100中,第二提词应用的图标显示于第二显示终端的屏幕上,显词应用的图标显示于第一显示终端的屏幕上,发言者使用第一显示终端进行音视频通信,则协助者可使用第二显示终端对发言者参照的显词应用滚动显示的文本内容进行实时审阅,即,通过步骤S200,协助者在已启动的第二提词应用中操作发送同步指令,第二提词应用中的文本内容便可同步至显词应用中的用户界面中进行滚动显示。
在步骤S100之前,先要分别建立第一显示终端中第一提词应用与显词应用之间、第二显示终端中第二提词应用与所述显词应用之间的关联关系;建立各应用之间的关联关系的其中一个方法,包括:
获取所述第一提词应用、所述第二提词应用和所述显词应用的标识信息;
根据所述标识信息,调用基于Android系统的Binder接口,建立所述第一提词应用与所述显词应用之间、所述第二提词应用和所述显词应用之间的进程间通信。
第一提词应用和第二提词应用基于同一安装包,可以理解为第二提词应用是第一提词应用的快捷方式,两者共享同一进程,该进程仅能为其中一个应用启动时所提供,不管是第一提词应用还是第二提词应用,所关联的文本内容的存储路径一致,任何一个应用启动后均能读取文本内容,并能对其进行写入操作。
显词应用基于与第一提词应用或第二提词应用建立进程间通信关系,直接读取第一提词应用或第二提词应用同步的文本内容,不用链接文本内容的存储路径,因此不具备对文本内容的写入权限,仅提供显示窗口对所同步的文本内容进行滚动显示。
另一实施例中,发言者也可在第一显示终端启动第一提词应用对文本内容进行读写,其步骤包括:
获取响应于用户对所述第一提词应用的启动指令;
判断进程占用状态,若当前进程以被所述第二提词应用占用,结束所述第二提词应用的运行,根据所述启动指令启动第一提词应用。
在第二提词应用被关闭后,显词应用同步停止对第二提词应用中文本内容的滚动显示,即显词应用与第二提词应用的进程间通信切换至第一提词应用。在接收用户对第一提词应用的同步指令后,显词应用开始同步滚动显示第一提词应用中的文本内容。
另一实施例中,无论是第一显示终端还是第二显示终端,在后启动提词应用的显示终端还可对用户发出界面提示。还是以第二提词应用为在先启动为例,第一提词应用的启动步骤,包括:
获取响应于用户对所述第一提词应用的启动指令;
判断进程占用状态,若当前进程以被所述第二提词应用占用,发送进程被占用的提示信息至第一显示终端并通过该终端对所述提示信息进行显示;获取响应于用户对所述第二提词应用的结束指令,结束所述第二提词应用,启动所述第一提词应用;或,
获取响应于用户对所述第一提词应用的结束指令,结束所述第一提词应用。
本实施例中,在接收到对在后启动的提词应用的启动命令时,并没有立即根据该启动命令执行启动或结束指令,而是对用户发出界面提示,避免发言者在实时讲演的过程中,操作失误启动在后提词应用而造成滚动显示的文本内容出现异常情况。
另一实施例中,在发言者的讲演过程中,协助者可通过第二提词应用所同步到显词应用中的文本内容进行修改,同样的,发言者在讲演之前,也可通过第一提词应用对文本内容进行修改,其步骤包括:
获取响应于用户对所述第一提词应用或所述第二提词应用的编辑指令;
触发所述第一提词应用或第二提词应用中的对所述文本内容的编辑入口;
接收用户根据所述编辑入口对所述文本内容的编辑信息并存储;
根据所述同步指令,将存储的所述文本内容同步至所述显词应用中进行滚动显示。
另一实施例中,显词应用中对文本内容的滚动显示状态并不随提词应用中的编辑指令而停止。当前滚动显示的界面中仅能显示部分字符数,因此编辑指令默认仅能对当前未显示的文本内容进行编辑,在提词应用上,特别是事实发言的过程中,协助者可通过第二提词应用对未显示的文本内容进行审阅,并编辑,其步骤包括:
当所述文本内容在所述显词应用中滚动显示时,获取响应于用户对所述第一提词应用或所述第二提词应用的编辑指令;
获取所述文本内容在所述显词应用中处于当前滚动显示的字符串的索引值范围;
根据所述索引值范围选取最大索引值,确定所述第一提词应用或所述第二提词应用中所述文本内容的编辑区域,所述编辑区域的字符串的最小索引值大于所述显词应用中处于当前滚动显示的字符串的最大索引值;
接收用户根据所述编辑入口对所述编辑区域中的所述文本内用的编辑信息并存储。
在另一实施例中,为更快的响应文本内容编辑后的同步指令,步骤还包括:
确定所述显词应用中所述文本内容的替换区域,所述文本内容的替换区域的字符串的最小索引值大于所述显词应用中处于当前滚动显示的字符串的最大索引值;
根据所述同步指令,将所述编辑区域内已编辑的所述文本内容与所述替换区域内原始的所述文本内容进行替换。
本申请实施例中,实时的,第一显示终端可以选用平板设备,第二显示终端可以选用液晶显示器,第二显示终端可作为第一显示终端的扩展设备,发言者使用第一显示终端进行音视频通信,例如直播或视频会议,协助者使用第二显示终端对第一显示终端中滚动显示的文本内容进行实时审阅和修改,提高了发言者发言正确性的同时也不影响通信中所展示的音视频效果。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图2,示出了本发明的一种音视频通信中实时提词的装置实施例的结构框图,具体可以包括如下模块:
启动模块100,用于获取响应于用户先后对第二提词应用、显词应用操作中的启动指令,在响应所述启动指令的第一显示终端中显示启动所述显词应用的用户界面,在响应所述启动指令的第二显示终端中显示启动所述第二提词应用的用户界面;
同步模块200,用于获取响应于用户对所述第二提词应用操作的同步指令,根据所述同步指令将与所述第二提词应用中的文本内容同步于所述显词应用中,所述显词应用中的用户界面对所述文本内容进行滚动显示。
在本具体实施例与上述具体实施例中有重复的操作步骤,本具体实施例仅做简单描述,其余方案参考上述具体实施例描述即可。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
参照图3,示出了本发明的一种音视频通信中实时提词的计算机设备,具体可以包括如下:
在本发明实施例中,本发明还提供一种计算机设备,上述计算机设备12 以通用计算设备的形式表现,计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线18结构中的一种或多种,包括存储器总线18或者存储器控制器,外围总线18,图形加速端口,处理器或者使用多种总线18结构中的任意总线18结构的局域总线18。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线18,微通道体系结构(MAC)总线 18,增强型ISA总线18、音视频电子标准协会(VESA)局域总线18以及外围组件互连(PCI)总线18。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)31和/或高速缓存存储器32。计算机设备12可以进一步包括其他移动/不可移动的、易失性/非易失性计算机体统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(通常称为“硬盘驱动器”)。尽管图3中未示出,可以提供用于对可移动非易失性磁盘(如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如 CD~ROM,DVD~ROM或者其他光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块42,这些程序模块42被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具41,可以存储在例如存储器中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其他程序模块42以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24、摄像头等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)),广域网(WAN) 和/或公共网络(例如因特网)通信。如图所示,网络适配器21通过总线18 与计算机设备12的其他模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元16、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统34等。
处理单元16通过运行存储在系统存储器28中的程序,执行各种功能应用以及数据处理,例如实现本发明实施例所提供的一种音视频通信中实时提词的方法。
即上述处理单元16执行上述程序时实现:获取响应于用户先后对第二提词应用、显词应用操作中的启动指令,在响应所述启动指令的第一显示终端中显示启动所述显词应用的用户界面,在响应所述启动指令的第二显示终端中显示启动所述第二提词应用的用户界面;获取响应于用户对所述第二提词应用操作的同步指令,根据所述同步指令将与所述第二提词应用中的文本内容同步于所述显词应用中,所述显词应用中的用户界面对所述文本内容进行滚动显示。
在本发明实施例中,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有实施例提供的一种音视频通信中实时提词的方法。
也即,给程序被处理器执行时实现:获取响应于用户先后对第二提词应用、显词应用操作中的启动指令,在响应所述启动指令的第一显示终端中显示启动所述显词应用的用户界面,在响应所述启动指令的第二显示终端中显示启动所述第二提词应用的用户界面;获取响应于用户对所述第二提词应用操作的同步指令,根据所述同步指令将与所述第二提词应用中的文本内容同步于所述显词应用中,所述显词应用中的用户界面对所述文本内容进行滚动显示。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机克顿信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦可编程只读存储器(EPOM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD~ROM)、光存储器件、磁存储器件或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,改计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言——诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行或者完全在远程计算机或者服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种音视频通信中实时提词的方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种音视频通信中实时提词的方法,其特征在于,包括:
获取响应于用户先后对第二提词应用、显词应用操作中的启动指令,在响应所述启动指令的第一显示终端中显示启动所述显词应用的用户界面,在响应所述启动指令的第二显示终端中显示启动所述第二提词应用的用户界面;
获取响应于用户对所述第二提词应用操作的同步指令,根据所述同步指令将与所述第二提词应用中的文本内容同步于所述显词应用中,所述显词应用中的用户界面对所述文本内容进行滚动显示。
2.根据权利要求1所述的方法,其特征在于,所述获取响应于用户先后对第二提词应用、显词应用操作中的启动指令,之前,包括:
获取所述第一提词应用、所述第二提词应用和所述显词应用的标识信息;
调用基于Android系统的Binder接口,建立所述第一提词应用与所述显词应用之间、所述第二提词应用和所述显词应用之间的进程间通信。
3.根据权利要求1所述的方法,其特征在于,所述获取响应于用户先后对第二提词应用、显词应用操作中的启动指令,在响应所述启动指令的第一显示终端中显示启动所述显词应用的用户界面,在响应所述启动指令的第二显示终端中显示启动所述第二提词应用的用户界面,之后,还包括:
获取响应于用户对所述第一提词应用的启动指令;
判断进程占用状态,若当前进程以被所述第二提词应用占用,结束所述第二提词应用的运行,根据所述启动指令启动第一提词应用。
4.根据权利要求3所述的方法,其特征在于,所述获取响应于用户对所述第一提词应用的启动指令,之后,还包括:
获取响应于用户对所述第一提词应用的启动指令;
判断进程占用状态,若当前进程以被所述第二提词应用占用,发送进程被占用的提示信息至第一显示终端并通过该终端对所述提示信息进行显示;获取响应于用户对所述第二提词应用的结束指令,结束所述第二提词应用,启动所述第一提词应用;或,
获取响应于用户对所述第一提词应用的结束指令,结束所述第一提词应用。
5.根据权利要求1所述的方法,其特征在于,所述所述显词应用中的用户界面对所述文本内容进行滚动显示,之前,还包括:
获取响应于用户对所述第一提词应用或所述第二提词应用的编辑指令;
触发所述第一提词应用或第二提词应用中的对所述文本内容的编辑入口;
接收用户根据所述编辑入口对所述文本内容的编辑信息并存储;
根据所述同步指令,将存储的所述文本内容同步至所述显词应用中进行滚动显示。
6.根据权利要求5所述的方法,其特征在于,所述所述显词应用中的用户界面对所述文本内容进行滚动显示,之前,还包括:
获取响应于用户对所述第一提词应用或所述第二提词应用的编辑指令;
获取所述文本内容在所述显词应用中处于当前滚动显示的字符串的索引值范围;
根据所述索引值范围选取最大索引值,确定所述第一提词应用或所述第二提词应用中所述文本内容的编辑区域,所述编辑区域的字符串的最小索引值大于所述显词应用中处于当前滚动显示的字符串的最大索引值;
接收用户根据所述编辑入口对所述编辑区域中的所述文本内用的编辑信息并存储。
7.根据权利要求6所述的方法,其特征在于,所述接收用户根据所述编辑入口对所述编辑区域中的所述文本内用的编辑信息并存储,之后,包括:
确定所述显词应用中所述文本内容的替换区域,所述文本内容的替换区域的字符串的最小索引值大于所述显词应用中处于当前滚动显示的字符串的最大索引值;
根据所述同步指令,将所述编辑区域内已编辑的所述文本内容与所述替换区域内原始的所述文本内容进行替换。
8.一种音视频通信中实时提词的装置,其特征在于,包括:
启动模块,用于获取响应于用户先后对第二提词应用、显词应用操作中的启动指令,在响应所述启动指令的第一显示终端中显示启动所述显词应用的用户界面,在响应所述启动指令的第二显示终端中显示启动所述第二提词应用的用户界面;
同步模块,用于获取响应于用户对所述第二提词应用操作的同步指令,根据所述同步指令将与所述第二提词应用中的文本内容同步于所述显词应用中,所述显词应用中的用户界面对所述文本内容进行滚动显示。
9.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的音视频通信中实时提词的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的音视频通信中实时提词的方法的步骤。
CN202011354355.2A 2020-11-26 2020-11-26 一种音视频通信中实时提词的方法和装置 Pending CN113986161A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011354355.2A CN113986161A (zh) 2020-11-26 2020-11-26 一种音视频通信中实时提词的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011354355.2A CN113986161A (zh) 2020-11-26 2020-11-26 一种音视频通信中实时提词的方法和装置

Publications (1)

Publication Number Publication Date
CN113986161A true CN113986161A (zh) 2022-01-28

Family

ID=79731629

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011354355.2A Pending CN113986161A (zh) 2020-11-26 2020-11-26 一种音视频通信中实时提词的方法和装置

Country Status (1)

Country Link
CN (1) CN113986161A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022257645A1 (zh) * 2021-06-11 2022-12-15 荣耀终端有限公司 一种拍摄显示方法、电子设备及存储介质
CN117499560A (zh) * 2023-11-03 2024-02-02 杭州希德智能科技有限公司 一种演播室自动化提词器方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08251479A (ja) * 1995-03-13 1996-09-27 P-Ji One:Kk プロンプタ装置及びプロンプタシステム
CN102036051A (zh) * 2010-12-20 2011-04-27 华为终端有限公司 实现视频会议中提词的方法以及装置
CN106973244A (zh) * 2016-01-13 2017-07-21 奥多比公司 使用弱监督为图像配字幕
CN110602351A (zh) * 2019-09-06 2019-12-20 深圳市百视悦电子有限公司 提词器以及方法
CN110677560A (zh) * 2019-09-29 2020-01-10 西安工程大学 一种用于无线话筒的同步提词装置
CN110795910A (zh) * 2019-10-10 2020-02-14 北京字节跳动网络技术有限公司 一种文本信息处理方法、装置、服务器及存储介质
CN111372119A (zh) * 2020-04-17 2020-07-03 维沃移动通信有限公司 多媒体数据录制方法、装置及电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08251479A (ja) * 1995-03-13 1996-09-27 P-Ji One:Kk プロンプタ装置及びプロンプタシステム
CN102036051A (zh) * 2010-12-20 2011-04-27 华为终端有限公司 实现视频会议中提词的方法以及装置
CN106973244A (zh) * 2016-01-13 2017-07-21 奥多比公司 使用弱监督为图像配字幕
CN110602351A (zh) * 2019-09-06 2019-12-20 深圳市百视悦电子有限公司 提词器以及方法
CN110677560A (zh) * 2019-09-29 2020-01-10 西安工程大学 一种用于无线话筒的同步提词装置
CN110795910A (zh) * 2019-10-10 2020-02-14 北京字节跳动网络技术有限公司 一种文本信息处理方法、装置、服务器及存储介质
CN111372119A (zh) * 2020-04-17 2020-07-03 维沃移动通信有限公司 多媒体数据录制方法、装置及电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022257645A1 (zh) * 2021-06-11 2022-12-15 荣耀终端有限公司 一种拍摄显示方法、电子设备及存储介质
CN117499560A (zh) * 2023-11-03 2024-02-02 杭州希德智能科技有限公司 一种演播室自动化提词器方法及系统
CN117499560B (zh) * 2023-11-03 2024-05-03 杭州希德智能科技有限公司 一种演播室自动化提词器方法及系统

Similar Documents

Publication Publication Date Title
US11943486B2 (en) Live video broadcast method, live broadcast device and storage medium
US20190012140A1 (en) Voice input apparatus
CN111970577B (zh) 字幕编辑方法、装置和电子设备
WO2022242351A1 (zh) 一种多媒体处理方法、装置、设备及介质
CN112397104B (zh) 音频与文本的同步方法、装置、可读介质和电子设备
CN113986161A (zh) 一种音视频通信中实时提词的方法和装置
WO2014154097A1 (en) Automatic page content reading-aloud method and device thereof
CN113886612A (zh) 一种多媒体浏览方法、装置、设备及介质
CN111241043A (zh) 一种多媒体文件的分享方法、终端及存储介质
CN112256172B (zh) 应用显示方法、装置、终端和存储介质
WO2024002051A1 (zh) 文档编辑方法、装置、电子设备及存储介质
CN113194279B (zh) 网络会议的记录方法、计算机可读存储介质及电子设备
CN112530472B (zh) 音频与文本的同步方法、装置、可读介质和电子设备
US20140297285A1 (en) Automatic page content reading-aloud method and device thereof
CN111709342B (zh) 字幕分割方法、装置、设备及存储介质
CN114398135A (zh) 交互方法、装置、电子设备、存储介质和程序产品
CN110853643A (zh) 快应用中进行语音识别的方法、装置、设备及存储介质
CN112492381B (zh) 信息显示方法、装置及电子设备
CN110968706B (zh) 一种控制幻灯片播放动画的方法、系统和终端
EP4344230A1 (en) Video generation method, apparatus, and device, storage medium, and program product
CN117764029A (zh) 字体管理方法、装置、电子设备及存储介质
CN117917634A (zh) 无障碍处理方法、装置、电子设备和存储介质
CN114697760A (zh) 一种处理方法、装置、电子设备及介质
CN115390776A (zh) 投屏控制方法、装置、终端和存储介质
CN116501417A (zh) 信息处理方法、装置、终端和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination