CN111147444B - 一种交互方法及电子设备 - Google Patents

一种交互方法及电子设备 Download PDF

Info

Publication number
CN111147444B
CN111147444B CN201911140650.5A CN201911140650A CN111147444B CN 111147444 B CN111147444 B CN 111147444B CN 201911140650 A CN201911140650 A CN 201911140650A CN 111147444 B CN111147444 B CN 111147444B
Authority
CN
China
Prior art keywords
phoneme
conference group
user
phoneme sequence
conference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911140650.5A
Other languages
English (en)
Other versions
CN111147444A (zh
Inventor
续路波
胡育进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN201911140650.5A priority Critical patent/CN111147444B/zh
Publication of CN111147444A publication Critical patent/CN111147444A/zh
Priority to KR1020227020861A priority patent/KR20220104772A/ko
Priority to JP2022528722A priority patent/JP2023502386A/ja
Priority to PCT/CN2020/129320 priority patent/WO2021098675A1/zh
Priority to EP20889160.6A priority patent/EP4064280A4/en
Application granted granted Critical
Publication of CN111147444B publication Critical patent/CN111147444B/zh
Priority to US17/748,001 priority patent/US20220277730A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/401Support for services or applications wherein the services involve a main real-time session and one or more additional parallel real-time or time sensitive sessions, e.g. white board sharing or spawning of a subconference
    • H04L65/4015Support for services or applications wherein the services involve a main real-time session and one or more additional parallel real-time or time sensitive sessions, e.g. white board sharing or spawning of a subconference where at least one of the additional parallel sessions is real time or time sensitive, e.g. white board sharing, collaboration or spawning of a subconference
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0018Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/762Media network packet handling at the source 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/764Media network packet handling at the destination 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/39Electronic components, circuits, software, systems or apparatus used in telephone systems using speech synthesis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Abstract

本发明提供一种交互方法及电子设备,该方法包括:接收用户输入的目标会话消息;将所述目标会话消息转化为第一音素序列;按照第一会议群组对应的第一音素转换规则对所述第一音素序列进行音素编码,得到第二音素序列;将所述第二音素序列发送至所述第一会议群组的第一接收端;其中,所述目标会话消息为语音消息或文本消息。本发明实施例由于通过音素序列的形式传输远程会议的会话消息,从而避免了受到语音传输形式的限制,使得用户可以同时参与多个远程会议。

Description

一种交互方法及电子设备
技术领域
本发明涉及通信技术领域,尤其涉及一种交互方法及电子设备。
背景技术
目前的远程视频会议系统,不同地方的人可以同时参加一个会议,参加会议的各方都可以看到主会场的显示屏。由于目前远程视频会议通常是直接将音频、视频和电子文档发送至参会各方。这样,在一个时刻只能参加一个远程视频会议。因此,现有技术中,通过电子设备参加远程视频会议时,存在参会数量受限的问题。
发明内容
本发明实施例提供一种交互方法及电子设备,以解决通过电子设备参加视频会议时,存在视频会议数量受限的问题。
第一方面,本发明实施例提供了一种交互方法,应用于远程会议的第一发送端,包括:
接收用户输入的目标会话消息;
将所述目标会话消息转化为第一音素序列;
按照第一会议群组对应的第一音素转换规则对所述第一音素序列进行音素编码,得到第二音素序列;
将所述第二音素序列发送至所述第一会议群组的第一接收端;
其中,所述目标会话消息为语音消息或文本消息。
第二方面,本发明实施例还提供了一种交互方法,应用于远程会议的第一接收端,其特征在于,包括:
接收第一发送端发送的第二音素序列,所述第一发送端为第一会议群组中的设备;
按照所述第一会议群组对应的第一音素转换规则对所述第二音素序列解码,得到第一音素序列;
显示所述第一音素序列对应的文本内容,或者播放由所述第一音素序列合成的第三音频数据。
第三方面,本发明实施例还提供了一种电子设备,应用于远程会议的第一发送端,特征在于,包括:
第一接收模块,用于接收用户输入的目标会话消息;
转换模块,用于将所述目标会话消息转化为第一音素序列;
编码模块,用于按照第一会议群组对应的第一音素转换规则对所述第一音素序列进行音素编码,得到第二音素序列;
第一发送模块,用于将所述第二音素序列发送至所述第一会议群组的第一接收端;
其中,所述目标会话消息为语音消息或文本消息。
第四方面,本发明实施例还提供了一种电子设备,应用于远程会议的第一接收端,包括:
第五接收模块,用于接收第一发送端发送的第二音素序列,所述第一发送端为第一会议群组中的设备;
第二解码模块,用于按照所述第一会议群组对应的第一音素转换规则对所述第二音素序列解码,得到第一音素序列;
第二控制模块,用于显示所述第一音素序列对应的文本内容,或者播放由所述第一音素序列合成的第三音频数据。
第五方面,本发明实施例还提供了一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述交互方法的步骤。
第六方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述交互方法的步骤。
本发明实施例通过接收用户输入的目标会话消息;将所述目标会话消息转化为第一音素序列;按照第一会议群组对应的第一音素转换规则对所述第一音素序列进行音素编码,得到第二音素序列;将所述第二音素序列发送至所述第一会议群组的第一接收端,从而实现会话消息的发送。由于通过音素序列的形式传输远程会议的会话消息,从而避免了受到语音传输形式的限制,使得用户可以同时参与多个远程会议。与此同时,由于采用音素转换规则对传输的音素序列进行加密编码,从而提高了会话消息传输的安全性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的交互方法的流程图之一;
图2是本发明实施例提供的交互方法中远程会议界面示例图之一;
图3是本发明实施例提供的交互方法中远程会议界面示例图之二;
图4是本发明实施例提供的交互方法中远程会议界面示例图之三;
图5是本发明实施例提供的交互方法中远程会议界面示例图之四;
图6是本发明实施例提供的交互方法的流程图之二;
图7是本发明实施例提供的电子设备的结构图之一;
图8是本发明实施例提供的电子设备的结构图之二;
图9是本发明实施例提供的电子设备的结构图之三。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的一种交互方法的流程图,如图1所示,包括以下步骤:
步骤101,接收用户输入的目标会话消息;
本发明实施提供的交互方法,主要应用在远程会议中,用于对语音消息的传输进行控制。本实施例的交互方法应用于远程会议的第一发送端,具体的,参与远程会议中发送目标会话消息的一方为第一发送端,该第一发送端也可以接收参与远程会议其他方发送的会话消息。
上述所述目标会话消息为语音消息或文本消息,可选的,第一发送端的用户可以在方便进行语音发送的状态下,可以通过语音的形式输入目标会话消息;在不方便进行语音发送的状态下,可以通过文本的形式输入目标会话消息。上述远程会议可以为视频会议,也可以为语音会议,在此不做进一步的限定。
例如,在一实施例中,可以设置语音输入模式和文本输入模式供用户选择输入。应理解,在参与多个远程会议时,用户客户选择某一远程会议为语音输入模式,其他远程会议为文本输入模式。也可以设置所有的远程会议均为文本输入模式。本发明实施例中,语音输入模式,是指将本地采集的语音数据实时传输给远程会议中其余各参会方。
在另一实施例中,还可以设置语音输入控件,当按下操作控件时,可以进行语音输入。这样,可以针对每一远程会议设置一个交流界面,在该交流界面上显示其余各参会方发送的语音转换的文字消息,同时显示语音输入控件和文本输入控件,用户可以选择性进行文本或者语音的输入。应理解,该交流界面可以同时显示一个或者多个,例如,当显示一个时,可以通过切换操作切换显示不同的远程会议对应的交流界面。
步骤102,将所述目标会话消息转化为第一音素序列;
本发明实施例中,音素可以包括声母、韵母和整体认读音节。当目标会话消息为语音消息时,可以基于语音识别技术将用户输入的目标会话消息进行语音识别,得到第一音素序列。当目标会话消息为文本消息时,可以通过注音工具对目标会话消息进行注音,从而得到第一音素序列。
步骤103,按照第一会议群组对应的第一音素转换规则对所述第一音素序列进行音素编码,得到第二音素序列;
本发明实施例中,上述第一音素转换规则为一种加密规则或者可以理解为一种音素映射规则,将第一音素序列中的每一音素按照第一音素转换规则转换为另一映射。可选的,第一音素序列到第二音素序列可以为一一映射关系,也可以为一对多的映射关系,在此不做进一步的限定。
可选的,不同的会议群组对应的音素转换规则可以相同,也可以不同,在此不做进一步的限定,应理解,同一会议群组内的音素转换规则相同,从而可以保证各参会方都能正确的进行音素解码。本发明实施例中,由于采用音素转换规则对第一音素序列进行加密编码,从而可以保证只有参会各方能够正确解码,获知会议内容。因此可以提高消息发送安全性,避免会议内容被他人截获。上述会议群组是指,参加同一远程会议的所有参与方。
应理解,声母共21个:b、p、m、f、d、t、n、l、g、k、h、j、q、x、zh、ch、sh、r、z、c、s。
韵母24个:a、o、e、i、u、v、ai、ei、ui、ao、ou、iu、ie、ve、er、an、en、in、un、vn、ang、eng、ing、ong。每个韵母都有4个音调,所以韵母共有96个。
整体认读音节21个:zhi、chi、shi、ri、zi、ci、si、yuan、ya、yao、yan、yang、yuan、yo、yong、wa、wai、wan、wang、wo、weng。
其中y、w不作为声母,可以和y、w合并的韵母作为整体认读音节,看作一个音素。一个字的拼音可以由声母和韵母合并组成,也是一个韵母,或者是一个整体认读音节。每个整体认读音节有4个音调,所以韵母共有84个。
声母单独不可以表示一个字。所以在做音素编码的时候,声母只能编码为声母,韵母只能编码为韵母,整体认读音节只能编码为整体认读音节。
根据排列组合,声母有2121种编码形式,韵母有9696种编码形式,整体认读音节有8484种编码形式。最终可以形成(2121+9696+8484)种编码表(即上述音素转换规则),这样就使得编码表的破解变得非常困难。也就是说上述第一音素转换规则为(2121+9696+8484)种音素转换规则中的一种。因此,本发明实施例使用音素编码规则进行音素序列进行加密编码,从而可以提高消息传输的安全性。
例如,在一可选实施例中,用户输入的目标会话消息为“我的密码隐藏在这里”经过语音识别后得到的上述第一音素序列为“w o3 d e1 m i4 m a3 y ing3 c ang2 z ai4zh e4 l i1”。第一音素序列经过第一音素转换规则转换后的第二音素序列为“w o3 shuo1 j in1 t ian1 d e1 t ian1 q i1 zh en1 h ao3”。
步骤104,将所述第二音素序列发送至所述第一会议群组的第一接收端。
本发明实施例中,上述第一接收终端可以为上述第一会议群组中除第一发送端之外的所有参与方,也就是说,本实施例中,可以对用户输入的目标会话消息进行音素编码后向所有参与方进行发送。
应理解,一次远程会议包括位于主会场内的参与方以及位于主会场外的其他参与方。该第一发送方可以为在第一会议群组对应的远程会议中主会场内的参与方,也可以在其他会议群组对应的远程会议中主会场内的参与方,还可以为不在任一个远程会议中主会场内的参与方。
本发明实施例通过接收用户输入的目标会话消息;将所述目标会话消息转化为第一音素序列;按照第一会议群组对应的第一音素转换规则对所述第一音素序列进行音素编码,得到第二音素序列;将所述第二音素序列发送至所述第一会议群组的第一接收端,从而实现会话消息的发送。由于通过音素序列的形式传输远程会议的会话消息,从而避免了受到语音传输形式的限制,使得用户可以同时参与多个远程会议。与此同时,由于采用音素转换规则对传输的音素序列进行加密编码,从而提高了会话消息传输的安全性。
应理解,上述第一音素转换规则可以事先约定,各参会方直接在本地进行选择即可,也可以是一特定参会方(如主会场的参会方或者其他参会方)随机选择一种音素转换规则后发送至其他各参会方,在新增参会方时,可以由新增参会方向特定参会方请求音素转换规则,在获得特定参会方的授权后,特定参会方将音素转换规则发送至该新增参会方。
需要说明的是,当目标会话消息为文本消息时,可以理解第一发送端在第一会议群组中为不方便发送语音,例如,第一发送端在其他的会议群组中进行了语音通话(例如,位于其他会议群组对应的远程会议的主会场中),或者第一发送端当前的环境不适合发送语音(和他人进行交谈,会议内容不方便被他人获知)。此时,第一发送端向第一会议群组中的其余各参会方均采用音素的方式发送会话消息。
当目标会话消息为语音消息时,可以理解第一发送端在第一会议群组方便进行发送语音。此时,第一发送端可以向第一会议群组中不方便接听语音的参会方采用音素的方式发送会话消息,还可以向第一会议群组中方便接听语音的参会方采用音素或者音频的方式发送会话消息。例如,当所述目标会话消息为语音消息的情况下,上述步骤101之后,所述方法还包括:
将所述目标会话消息通过音频的方式发送至所述第一会议群组的第二接收端。
本实施例中,上述第一接收端为用户指定发送的参会方(或者全部参会方)中不方便接听的参会方;上述第二接收端为用户指定发送的参会方(或者全部参会方)中方便接听的参会方。由于在本实施例中,直接采用音频的方式向方便接听的参会方发送目标会话消息,从而可以提高会话消息发送的实效性。该指定发送的参会方可以为主会场的参会方或者其他参会方。
应理解,第一发送端除了用于发送会话消息,还可以用于接收会话消息。在接收会话消息时,可以以音频的方式进行接收,也可以以音素的方式进行接收。
例如,在一可选实施例中,所述方法还包括:
接收第二发送端发送的第一音频数据;所述第二发送端为第二会议群组中的用户对应的设备,所述第二会议群组与所述第一会议群组为同一会议群组或不同的会议群组;
播放所述第一音频数据。
需要说明的是,通常的,在同一时刻第一发送端只能在一个会议群组中按照音频的方式发送或者接收音频数据,在不同时刻,第一发送端可以切换到不同的会议群组进行语音通话,因此,对上述第一会议群组和第二会议群组可以为同一会议群组或不同的会议群组。若不能切换到不同的会议群组进行语音通话,且当第一发送端将所述目标会话消息通过音频的方式发送至所述第一会议群组的第二接收端的情况下,此时第一会议群组和第二会议群组为同一会议群组。
应理解,在播放第一音频数据时,可以按照默认的人声,也可以使用发送用户的声音(例如可以将声纹信息一并发送,在合成时按照发送用户的声纹进行合成)。在一实施例中,还可以保存参会各方的声纹信息,并在发送会话消息时增加用户标识,从而在接收方直接根据用户标识确定音素合成时所采用的声纹信息,这样可以减少声纹信息的传输。具体的,可以设置语音识别的过程中对声纹进行识别,从而确定用户标识。
在另一可选实施例中,所述方法还包括:
接收第三发送端发送的第三音素序列;所述第三发送端为第三会议群组中的用户对应的设备,所述第三会议群组与所述第一会议群组为同一会议群组或不同的会议群组;
按照所述第三会议群组对应的第二音素转换规则对所述第三音素序列进行音素解码,得到第四音素序列;
显示所述第四音素序列对应的文本内容,或者播放由所述第四音素序列合成的第二音频数据。
本发明实施例中,若第一发送端若为不方便接听的参与方,则可以显示所述第四音素序列对应的文本内容。若第一发送端为方便接听的参与方,则可以播放由所述第四音素序列合成的第二音频数据。具体的将第四音素序列合成第二音频数据的方式可以参照相关的技术,在此不做进一步的限定。
需要说明的是,通常的,在同一时刻第一发送端只能在一个会议群组中按照音频的方式发送或者接收音频数据,在不同时刻,第一发送端可以切换到不同的会议群组进行语音通话,因此,对上述第一会议群组和第三会议群组可以为同一会议群组或不同的会议群组。若不能切换到不同的会议群组进行语音通话,且当第一发送端将所述目标会话消息通过音频的方式发送至所述第一会议群组的第二接收端的情况下,此时第一会议群组和第三会议群组为同一会议群组。
进一步的,如图2所示,可以在显示第四音素序列对应的文本内容时,还可以显示该第四音素序列对应的发送用户的用户信息。同时还可以显示一个操作控件201,当用户点击该操作控件201时,可以以语音的形式播放该第四音素序列对应的文本内容。
可选的,对于远程会议的显示形式可以根据实际需要进行设置,例如,在一实施例中,以下对于折叠屏的电子设备,显示远程会议的方式进行详细说明。可选的,所述接收用户输入的目标会话消息之前,所述方法还包括:
在所述第一发送端的第一显示区域显示第一目标内容,在第二显示区域显示第二目标内容;
其中,所述第一目标内容包括电子演示文档、视频信息和会议聊天窗口中的至少一项;所述第二目标内容包括电子演示文档、视频信息和会议聊天窗口中的至少一项。
本实施例中,对于同一会议群组内的会议聊天窗口的显示可以根据实际需要进行设置,例如可以以社交聊天群组的方式显示会议群组内的会议聊天窗口。本实施例中,会议聊天窗口内显示的会话消息具体指通过音素的方式传输的会话消息。
上述电子演示文档可以为PPT和word等可以展示的多媒体文档。如图2至图5所示,以下结合具体的实例对远程会议的交互界面进行详细说明。
需要说明的是,对于每一个参与方是否方便以音频方式传输会话消息,可以由各参与方进行手动选择,也可以由参与方的电子设备进行自动检测,在此不做进一步的限定。在确定各参与方是否方便以音频方式传输会话消息的状态时,可以将该状态发送至各参会方,也可以是各参会方将各自是否方便以音频方式传输会话消息的状态发送至指定参会方(例如主会场的参会方),然后由主参会方将该状态发送至各参会方。
如图2所示,可以在第一显示区域显示单会场视频窗口,在第二显示区域显示单会场会议聊天窗口。在单会场视频窗口可以设置视频窗口的显示形式,可以仅显示单会场的PPT,可以仅显示单会场的现场视频,还可以同时显示单会场的PPT和现场视频。在单会场视频窗口上方以及单会场会议聊天窗口上方均显示了会议参与方,本实施例中以列表的形式进行显示,在列表中,每一行表示一个远程会议的所有参与方。用户可以通过相应的列表上进行操作,以切换单会场会议聊天窗口或者单会场会议聊天窗口显示的内容。与此同时用户还可以基于单会场会议聊天窗口上方的列表选择一次会话消息发送的参与方。可选的,还可以在列表中标记显示各参会方是否方便以音频方式传输会话消息的状态。本实施例中,单会场视频窗口和单会场会议聊天窗口可以属于同一远程会议,也可以属于不同远程会议,在此不做进一步的限定。
如图3所示,可以在第一显示区域显示单会场视频窗口,在第二显示区域显示单会场视频窗口。可选的,在单会场视频窗口可以设置视频窗口的显示形式,可以仅显示单会场的PPT,可以仅显示单会场的现场视频,还可以同时显示单会场的PPT和现场视频。其次,第一显示区域显示单会场视频窗口与第二显示区域显示单会场视频窗口的显示形式可以相同,也可以不同。
如图4所示,可以在第一显示区域显示单会场会议聊天窗口,在第二显示区域显示单会场会议聊天窗口。
如图5所示,可以在第一显示区域显示双会场视频窗口,在第二显示区域显示单会场会议聊天窗口。可选的,在双会场视频窗口可以设置视频窗口的显示形式,可以仅显示双会场的PPT,可以仅显示双会场的现场视频,还可以同时显示双会场的PPT和现场视频。
需要说明的是,在同一会议群组中,群组内的各用户对应的设备所采用的音素转换规相同,具体的,各设备确定在某一群组中的音素转换规的方式可以根据实际需要进行设置。
例如,在一可选实施例中,所述接收用户输入的目标会话消息之前,所述方法还包括:
确定所述第一音素转换规则;
将所述第一音素转换规则发送至第一设备,所述第一设备为所述第一会议群组中除第一目标用户之外的用户对应的设备,所述第一目标用户为所述第一发送端对应的用户。
本发明实施例中,上述第一发送端作为第一音素转换规则的决定方或者发送方,可以由第一发送端向第一会议群组中的其他用户发送第一音素转换规则。该第一发送端可以为第一会议群组对应的主会场内的某一参会方对应的设备。换句话说,在本发明实施例中,可以由主会场内的参会方确定音素转换规则,然后转发至其余参会方。具体的,第一发送方可以随机生成一组音素转换规则作为第一音素转换规则。当然在其他实施例中,也可以由主会场之外的某一参会方生成第一音素转换规则,然后发送给各个参会方。还可以是由主会场之外的某一参会方生成第一音素转换规则,并将第一音素转换规则发送给主会场参与方,由主会场参与方发送至其余各参会方。
应理解,在本实施例中,可以第一发送端发送第一音素转换规则,可以向第一会议群组中的部分或全部用户进行发送,例如,上述第一设备进一步地可以为第一发送端选择的设备,或者满足预设条件的用户对应的设备,该预设条件可以为用户等级大于预设等级的用户。这样提高了第一音素转换规则发送的针对性,提高了会议的安全性。
在另一可选实施例中,所述接收用户输入的目标会话消息之前,所述方法还包括:
接收第一设备发送的音素转换规则,所述第一设备为所述第一会议群组中除第一目标用户之外的用户对应的设备,所述第一目标用户为所述第一发送端对应的用户;
将所述第一设备发送的音素转换规则确定为所述第一音素转换规则。
本发明实施例中,与上述实施例的区别在于,第一发送端作为第一音素转换规则的接收方,该第一发送端可以为第一会议群组对应的主会场内某一参会方,或者为主会场外的参会方,在此不做进一步的限定。
进一步的,可以由第一发送端请求第一设备发送第一音素转换规则,也可以是第一发送端被动接收第一设备发送的第一音素转换规则。可选的,该第一发送端可以为满足预设条件的用户对应的设备,该预设条件可以为用户等级大于预设等级的用户。这样提高了第一音素转换规则发送的针对性,提高了会议的安全性。
需要说明的是,本发明实施例中介绍的多种可选的实施方式,彼此可以相互结合实现,也可以单独实现,对此本发明实施例不作限定。
进一步的,还可以设置电子设备与AR眼镜连接,利用AR眼镜可以同时观看现场的PPT和远程会议的PPT,而且可以看到远程会议说话人音频转换成的文本。
参照图6,本发明实施例提供了另一种交互方法,如图6所示,该方法包括:
步骤601,接收第一发送端发送的第二音素序列,所述第一发送端为第一会议群组中的设备;
步骤602,按照所述第一会议群组对应的第一音素转换规则对所述第二音素序列解码,得到第一音素序列;
步骤603,显示所述第一音素序列对应的文本内容,或者播放由所述第一音素序列合成的第三音频数据。
可选的,所述方法还包括:
接收第二发送端发送的第一音频数据;所述第二发送端为第二会议群组中的用户对应的设备,所述第二会议群组与所述第一会议群组为同一会议群组或不同的会议群组;
播放所述第一音频数据。
可选的,所述方法还包括:
接收第三发送端发送的第三音素序列;所述第三发送端为第三会议群组中的用户对应的设备,所述第三会议群组与所述第一会议群组为同一会议群组或不同的会议群组;
按照所述第三会议群组对应的第二音素转换规则对所述第三音素序列进行音素解码,得到第四音素序列;
显示所述第四音素序列对应的文本内容,或者播放由所述第四音素序列合成的第二音频数据。
可选的,所述接收第一发送端发送的第二音素序列之前,所述方法还包括:
确定所述第一音素转换规则;
将所述第一音素转换规则发送至第二设备,所述第二设备为所述第一会议群组中除第二目标用户之外的用户对应的设备,所述第二目标用户为所述第一接收端对应的用户。
可选的,所述接收第一发送端发送的第二音素序列之前,所述方法还包括:
接收第二设备发送的音素转换规则,所述第二设备为所述第一会议群组中除第二目标用户之外的用户对应的设备,所述第二目标用户为所述第一接收端对应的用户;
将所述第二设备发送的音素转换规则确定为所述第一音素转换规则。
需要说明的是,本发明实施例提供的种交互方法应用于远程会议的第一接收端,该第一接收端为上述实施例提供的第一发送端对应的接收端,其具体的实现可以参照上述实施例第一发送端接收第三音素序列过程的描述,在此不再赘述。
本发明实施例由于通过音素序列的形式传输远程会议的会话消息,从而避免了受到语音传输形式的限制,使得用户可以同时参与多个远程会议。与此同时,由于采用音素转换规则对传输的音素序列进行加密编码,从而提高了会话消息传输的安全性。
参见图7,图7是本发明实施例提供的电子设备的结构图,该电子设备应用于远程会议的第一发送端,如图7所示,电子设备700包括:
第一接收模块701,用于接收用户输入的目标会话消息;
转换模块702,用于将所述目标会话消息转化为第一音素序列;
编码模块703,用于按照第一会议群组对应的第一音素转换规则对所述第一音素序列进行音素编码,得到第二音素序列;
第一发送模块704,用于将所述第二音素序列发送至所述第一会议群组的第一接收端;
其中,所述目标会话消息为语音消息或文本消息。
可选的,当所述目标会话消息为语音消息的情况下,所述电子设备还包括:
第二发送模块,用于将所述目标会话消息通过音频的方式发送至所述第一会议群组的第二接收端。
可选的,所述电子设备700还包括:
第二接收模块,用于接收第二发送端发送的第一音频数据;所述第二发送端为第二会议群组中的用户对应的设备,所述第二会议群组与所述第一会议群组为同一会议群组或不同的会议群组;
第一播放模块,用于播放所述第一音频数据。
可选的,所述电子设备700还包括:
第三接收模块,用于接收第三发送端发送的第三音素序列;所述第三发送端为第三会议群组中的用户对应的设备,所述第三会议群组与所述第一会议群组为同一会议群组或不同的会议群组;
第一解码模块,用于按照所述第三会议群组对应的第二音素转换规则对所述第三音素序列进行音素解码,得到第四音素序列;
第一控制模块,用于显示所述第四音素序列对应的文本内容,或者播放由所述第四音素序列合成的第二音频数据。
可选的,所述电子设备700还包括:
显示模块,用于在所述第一发送端的第一显示区域显示第一目标内容,在第二显示区域显示第二目标内容;
其中,所述第一目标内容包括电子演示文档、视频信息和会议聊天窗口中的至少一项;所述第二目标内容包括电子演示文档、视频信息和会议聊天窗口中的至少一项。
可选的,所述电子设备700还包括:
第一确定模块,用于确定所述第一音素转换规则;
第三发送模块,用于将所述第一音素转换规则发送至第一设备,所述第一设备为所述第一会议群组中除第一目标用户之外的用户对应的设备,所述第一目标用户为所述第一发送端对应的用户。
可选的,所述电子设备700还包括:
第四接收模块,用于接收第一设备发送的音素转换规则,所述第一设备为所述第一会议群组中除第一目标用户之外的用户对应的设备,所述第一目标用户为所述第一发送端对应的用户;
第四发送模块,用于将所述第一设备发送的音素转换规则确定为所述第一音素转换规则。
本发明实施例提供的电子设备能够实现图1至图5的方法实施例中电子设备实现的各个过程,为避免重复,这里不再赘述。
参见图8,图8是本发明实施例提供的电子设备的结构图,该电子设备应用于远程会议的第一接收端,如图8所示,电子设备800包括:
第五接收模块801,用于接收第一发送端发送的第二音素序列,所述第一发送端为第一会议群组中的设备;
第二解码模块802,用于按照所述第一会议群组对应的第一音素转换规则对所述第二音素序列解码,得到第一音素序列;
第二控制模块803,用于显示所述第一音素序列对应的文本内容,或者播放由所述第一音素序列合成的第三音频数据。
可选的,所述电子设备800还包括:
第六接收模块,用于接收第二发送端发送的第一音频数据;所述第二发送端为第二会议群组中的用户对应的设备,所述第二会议群组与所述第一会议群组为同一会议群组或不同的会议群组;
第二播放模块,用于播放所述第一音频数据。
可选的,所述电子设备800还包括:
第七接收模块,用于接收第三发送端发送的第三音素序列;所述第三发送端为第三会议群组中的用户对应的设备,所述第三会议群组与所述第一会议群组为同一会议群组或不同的会议群组;
第三解码模块,用于按照所述第三会议群组对应的第二音素转换规则对所述第三音素序列进行音素解码,得到第四音素序列;
第三控制模块,用于显示所述第四音素序列对应的文本内容,或者播放由所述第四音素序列合成的第二音频数据。
可选的,所述电子设备800还包括:
第二确定模块,用于确定所述第一音素转换规则;
第五发送模块,用于将所述第一音素转换规则发送至第二设备,所述第二设备为所述第一会议群组中除第二目标用户之外的用户对应的设备,所述第二目标用户为所述第一接收端对应的用户。
可选的,所述电子设备800还包括:
第八接收模块,用于接收第二设备发送的音素转换规则,所述第二设备为所述第一会议群组中除第二目标用户之外的用户对应的设备,所述第二目标用户为所述第一接收端对应的用户;
第三确定模块,用于将所述第二设备发送的音素转换规则确定为所述第一音素转换规则。
本发明实施例提供的电子设备能够实现图6的方法实施例中电子设备实现的各个过程,为避免重复,这里不再赘述。
图9为实现本发明各个实施例的一种电子设备的硬件结构示意图。
该电子设备900包括但不限于:射频单元901、网络模块902、音频输出单元903、输入单元904、传感器905、显示单元906、用户输入单元907、接口单元908、存储器909、处理器910、以及电源911等部件。本领域技术人员可以理解,图9中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,射频单元901,用于接收用户输入的目标会话消息;
处理器910,用于将所述目标会话消息转化为第一音素序列;按照第一会议群组对应的第一音素转换规则对所述第一音素序列进行音素编码,得到第二音素序列;
射频单元901,还用于将所述第二音素序列发送至所述第一会议群组的第一接收端。
或者,射频单元901,用于接收第一发送端发送的第二音素序列,所述第一发送端为第一会议群组中的设备;
处理器910,用于按照所述第一会议群组对应的第一音素转换规则对所述第二音素序列解码,得到第一音素序列;显示所述第一音素序列对应的文本内容,或者播放由所述第一音素序列合成的第三音频数据。
需要说明的是,本发明实施例提供的电子设备能够实现图1和图6的方法实施例中电子设备实现的各个过程,为避免重复,这里不再赘述。本发明实施例由于通过音素序列的形式传输远程会议的会话消息,从而避免了受到语音传输形式的限制,使得用户可以同时参与多个远程会议。与此同时,由于采用音素转换规则对传输的音素序列进行加密编码,从而提高了会话消息传输的安全性。
应理解的是,本发明实施例中,射频单元901可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器910处理;另外,将上行的数据发送给基站。通常,射频单元901包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元901还可以通过无线通信系统与网络和其他设备通信。
电子设备通过网络模块902为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元903可以将射频单元901或网络模块902接收的或者在存储器909中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元903还可以提供与电子设备900执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元903包括扬声器、蜂鸣器以及受话器等。
输入单元904用于接收音频或视频信号。输入单元904可以包括图形处理器(Graphics Processing Unit,GPU)9041和麦克风9042,图形处理器9041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元906上。经图形处理器9041处理后的图像帧可以存储在存储器909(或其它存储介质)中或者经由射频单元901或网络模块902进行发送。麦克风9042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元901发送到移动通信基站的格式输出。
电子设备900还包括至少一种传感器905,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板9061的亮度,接近传感器可在电子设备900移动到耳边时,关闭显示面板9061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器905还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元906用于显示由用户输入的信息或提供给用户的信息。显示单元906可包括显示面板9061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板9061。
用户输入单元907可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元907包括触控面板9071以及其他输入设备9072。触控面板9071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板9071上或在触控面板9071附近的操作)。触控面板9071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器910,接收处理器910发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板9071。除了触控面板9071,用户输入单元907还可以包括其他输入设备9072。具体地,其他输入设备9072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板9071可覆盖在显示面板9061上,当触控面板9071检测到在其上或附近的触摸操作后,传送给处理器910以确定触摸事件的类型,随后处理器910根据触摸事件的类型在显示面板9061上提供相应的视觉输出。虽然在图9中,触控面板9071与显示面板9061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板9071与显示面板9061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元908为外部装置与电子设备900连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元908可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备900内的一个或多个元件或者可以用于在电子设备900和外部装置之间传输数据。
存储器909可用于存储软件程序以及各种数据。存储器909可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器909可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器910是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器909内的软件程序和/或模块,以及调用存储在存储器909内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器910可包括一个或多个处理单元;优选的,处理器910可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器910中。
电子设备900还可以包括给各个部件供电的电源911(比如电池),优选的,电源911可以通过电源管理系统与处理器910逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备900包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种电子设备,包括处理器910,存储器909,存储在存储器909上并可在所述处理器910上运行的计算机程序,该计算机程序被处理器910执行时实现上述交互方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现交互方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (16)

1.一种交互方法,应用于远程会议的第一发送端,特征在于,包括:
接收用户输入的目标会话消息;
将所述目标会话消息转化为第一音素序列;
按照第一会议群组对应的第一音素转换规则对所述第一音素序列进行音素编码,得到第二音素序列;
将所述第二音素序列发送至所述第一会议群组的第一接收端;
其中,所述目标会话消息为语音消息或文本消息。
2.根据权利要求1所述的方法,其特征在于,当所述目标会话消息为语音消息的情况下,所述接收用户输入的目标会话消息之后,所述方法还包括:
将所述目标会话消息通过音频的方式发送至所述第一会议群组的第二接收端。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收第二发送端发送的第一音频数据;所述第二发送端为第二会议群组中的用户对应的设备,所述第二会议群组与所述第一会议群组为同一会议群组或不同的会议群组;
播放所述第一音频数据。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:
接收第三发送端发送的第三音素序列;所述第三发送端为第三会议群组中的用户对应的设备,所述第三会议群组与所述第一会议群组为同一会议群组或不同的会议群组;
按照所述第三会议群组对应的第二音素转换规则对所述第三音素序列进行音素解码,得到第四音素序列;
显示所述第四音素序列对应的文本内容,或者播放由所述第四音素序列合成的第二音频数据。
5.根据权利要求1所述的方法,其特征在于,所述接收用户输入的目标会话消息之前,所述方法还包括:
在所述第一发送端的第一显示区域显示第一目标内容,在第二显示区域显示第二目标内容;
其中,所述第一目标内容包括电子演示文档、视频信息和会议聊天窗口中的至少一项;所述第二目标内容包括电子演示文档、视频信息和会议聊天窗口中的至少一项。
6.根据权利要求1所述的方法,其特征在于,所述接收用户输入的目标会话消息之前,所述方法还包括:
确定所述第一音素转换规则;
将所述第一音素转换规则发送至第一设备,所述第一设备为所述第一会议群组中除第一目标用户之外的用户对应的设备,所述第一目标用户为所述第一发送端对应的用户。
7.根据权利要求1所述的方法,其特征在于,所述接收用户输入的目标会话消息之前,所述方法还包括:
接收第一设备发送的音素转换规则,所述第一设备为所述第一会议群组中除第一目标用户之外的用户对应的设备,所述第一目标用户为所述第一发送端对应的用户;
将所述第一设备发送的音素转换规则确定为所述第一音素转换规则。
8.一种交互方法,应用于远程会议的第一接收端,其特征在于,包括:
接收第一发送端发送的第二音素序列,所述第一发送端为第一会议群组中的设备;
按照所述第一会议群组对应的第一音素转换规则对所述第二音素序列解码,得到第一音素序列;
显示所述第一音素序列对应的文本内容,或者播放由所述第一音素序列合成的第三音频数据。
9.根据权利要求8所述的交互方法,其特征在于,所述方法还包括:
接收第二发送端发送的第一音频数据;所述第二发送端为第二会议群组中的用户对应的设备,所述第二会议群组与所述第一会议群组为同一会议群组或不同的会议群组;
播放所述第一音频数据。
10.根据权利要求8或9所述的交互方法,其特征在于,所述方法还包括:
接收第三发送端发送的第三音素序列;所述第三发送端为第三会议群组中的用户对应的设备,所述第三会议群组与所述第一会议群组为同一会议群组或不同的会议群组;
按照所述第三会议群组对应的第二音素转换规则对所述第三音素序列进行音素解码,得到第四音素序列;
显示所述第四音素序列对应的文本内容,或者播放由所述第四音素序列合成的第二音频数据。
11.根据权利要求8所述的方法,其特征在于,所述接收第一发送端发送的第二音素序列之前,所述方法还包括:
确定所述第一音素转换规则;
将所述第一音素转换规则发送至第二设备,所述第二设备为所述第一会议群组中除第二目标用户之外的用户对应的设备,所述第二目标用户为所述第一接收端对应的用户。
12.根据权利要求8所述的方法,其特征在于,所述接收第一发送端发送的第二音素序列之前,所述方法还包括:
接收第二设备发送的音素转换规则,所述第二设备为所述第一会议群组中除第二目标用户之外的用户对应的设备,所述第二目标用户为所述第一接收端对应的用户;
将所述第二设备发送的音素转换规则确定为所述第一音素转换规则。
13.一种电子设备,应用于远程会议的第一发送端,特征在于,包括:
第一接收模块,用于接收用户输入的目标会话消息;
转换模块,用于将所述目标会话消息转化为第一音素序列;
编码模块,用于按照第一会议群组对应的第一音素转换规则对所述第一音素序列进行音素编码,得到第二音素序列;
第一发送模块,用于将所述第二音素序列发送至所述第一会议群组的第一接收端;
其中,所述目标会话消息为语音消息或文本消息。
14.一种电子设备,应用于远程会议的第一接收端,其特征在于,包括:
第五接收模块,用于接收第一发送端发送的第二音素序列,所述第一发送端为第一会议群组中的设备;
第二解码模块,用于按照所述第一会议群组对应的第一音素转换规则对所述第二音素序列解码,得到第一音素序列;
第二控制模块,用于显示所述第一音素序列对应的文本内容,或者播放由所述第一音素序列合成的第三音频数据。
15.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至12中任一项所述的交互方法的步骤。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的交互方法的步骤。
CN201911140650.5A 2019-11-20 2019-11-20 一种交互方法及电子设备 Active CN111147444B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201911140650.5A CN111147444B (zh) 2019-11-20 2019-11-20 一种交互方法及电子设备
KR1020227020861A KR20220104772A (ko) 2019-11-20 2020-11-17 인터랙션 방법 및 전자기기
JP2022528722A JP2023502386A (ja) 2019-11-20 2020-11-17 対話方法及び電子機器
PCT/CN2020/129320 WO2021098675A1 (zh) 2019-11-20 2020-11-17 交互方法及电子设备
EP20889160.6A EP4064280A4 (en) 2019-11-20 2020-11-17 INTERACTION METHOD AND ELECTRONIC DEVICE
US17/748,001 US20220277730A1 (en) 2019-11-20 2022-05-18 Interaction method and electronic device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911140650.5A CN111147444B (zh) 2019-11-20 2019-11-20 一种交互方法及电子设备

Publications (2)

Publication Number Publication Date
CN111147444A CN111147444A (zh) 2020-05-12
CN111147444B true CN111147444B (zh) 2021-08-06

Family

ID=70517185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911140650.5A Active CN111147444B (zh) 2019-11-20 2019-11-20 一种交互方法及电子设备

Country Status (6)

Country Link
US (1) US20220277730A1 (zh)
EP (1) EP4064280A4 (zh)
JP (1) JP2023502386A (zh)
KR (1) KR20220104772A (zh)
CN (1) CN111147444B (zh)
WO (1) WO2021098675A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111147444B (zh) * 2019-11-20 2021-08-06 维沃移动通信有限公司 一种交互方法及电子设备
CN114157991B (zh) * 2020-08-18 2023-04-25 成都鼎桥通信技术有限公司 群组呼叫的录音记录播放方法及设备
CN112069816A (zh) * 2020-09-14 2020-12-11 深圳市北科瑞声科技股份有限公司 中文标点符号添加方法和系统及设备
CN112532912A (zh) * 2020-11-20 2021-03-19 北京搜狗科技发展有限公司 一种视频处理方法、装置和电子设备
CN113178187A (zh) * 2021-04-26 2021-07-27 北京有竹居网络技术有限公司 一种语音处理方法、装置、设备及介质、程序产品
CN114442502B (zh) * 2022-01-27 2024-02-06 北京声智科技有限公司 信息交互方法、系统及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103796181A (zh) * 2012-11-05 2014-05-14 华为技术有限公司 一种发送消息的播放方法、系统及相关设备
CN104135638A (zh) * 2013-05-02 2014-11-05 阿瓦亚公司 优化的视频快照
CN105679306A (zh) * 2016-02-19 2016-06-15 上海语知义信息技术有限公司 语音合成中预测基频帧的方法及系统
CN107767205A (zh) * 2016-08-23 2018-03-06 阿里巴巴集团控股有限公司 评价信息的展示系统、方法、客户端及处理方法、服务器
CN108986790A (zh) * 2018-09-29 2018-12-11 百度在线网络技术(北京)有限公司 语音识别联系人的方法和装置
CN109558853A (zh) * 2018-12-05 2019-04-02 维沃移动通信有限公司 一种音频合成方法及终端设备

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3277095D1 (en) * 1981-08-03 1987-10-01 Texas Instruments Inc Allophone vocoder
JP2834260B2 (ja) * 1990-03-07 1998-12-09 三菱電機株式会社 音声のスペクトル包絡パラメータ符号化装置
DE59806220D1 (de) * 1998-02-03 2002-12-12 Siemens Ag Verfahren zum übermitteln von sprachdaten
US6073094A (en) * 1998-06-02 2000-06-06 Motorola Voice compression by phoneme recognition and communication of phoneme indexes and voice features
EP1215659A1 (en) * 2000-12-14 2002-06-19 Nokia Corporation Locally distibuted speech recognition system and method of its operation
US6789066B2 (en) * 2001-09-25 2004-09-07 Intel Corporation Phoneme-delta based speech compression
US7136811B2 (en) * 2002-04-24 2006-11-14 Motorola, Inc. Low bandwidth speech communication using default and personal phoneme tables
US20050273327A1 (en) * 2004-06-02 2005-12-08 Nokia Corporation Mobile station and method for transmitting and receiving messages
US8204748B2 (en) * 2006-05-02 2012-06-19 Xerox Corporation System and method for providing a textual representation of an audio message to a mobile device
US20080126093A1 (en) * 2006-11-28 2008-05-29 Nokia Corporation Method, Apparatus and Computer Program Product for Providing a Language Based Interactive Multimedia System
GB0623915D0 (en) * 2006-11-30 2007-01-10 Ibm Phonetic decoding and concatentive speech synthesis
US8301447B2 (en) * 2008-10-10 2012-10-30 Avaya Inc. Associating source information with phonetic indices
CN101789871B (zh) * 2009-01-23 2012-10-03 国际商业机器公司 支持多个同时在线会议的方法、服务器端及客户端设备
CN103474075B (zh) * 2013-08-19 2016-12-28 科大讯飞股份有限公司 语音信号发送方法及系统、接收方法及系统
GB201517331D0 (en) * 2015-10-01 2015-11-18 Chase Information Technology Services Ltd And Cannings Nigel H System and method for preserving privacy of data in a cloud
CN105430208A (zh) * 2015-10-23 2016-03-23 小米科技有限责任公司 语音会话方法、装置及终端设备
CN109859737A (zh) * 2019-03-28 2019-06-07 深圳市升弘创新科技有限公司 通讯加密方法、系统及计算机可读存储介质
CN110113316B (zh) * 2019-04-12 2022-10-14 深圳壹账通智能科技有限公司 会议接入方法、装置、设备及计算机可读存储介质
CN111147444B (zh) * 2019-11-20 2021-08-06 维沃移动通信有限公司 一种交互方法及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103796181A (zh) * 2012-11-05 2014-05-14 华为技术有限公司 一种发送消息的播放方法、系统及相关设备
CN104135638A (zh) * 2013-05-02 2014-11-05 阿瓦亚公司 优化的视频快照
CN105679306A (zh) * 2016-02-19 2016-06-15 上海语知义信息技术有限公司 语音合成中预测基频帧的方法及系统
CN107767205A (zh) * 2016-08-23 2018-03-06 阿里巴巴集团控股有限公司 评价信息的展示系统、方法、客户端及处理方法、服务器
CN108986790A (zh) * 2018-09-29 2018-12-11 百度在线网络技术(北京)有限公司 语音识别联系人的方法和装置
CN109558853A (zh) * 2018-12-05 2019-04-02 维沃移动通信有限公司 一种音频合成方法及终端设备

Also Published As

Publication number Publication date
KR20220104772A (ko) 2022-07-26
JP2023502386A (ja) 2023-01-24
US20220277730A1 (en) 2022-09-01
EP4064280A1 (en) 2022-09-28
WO2021098675A1 (zh) 2021-05-27
CN111147444A (zh) 2020-05-12
EP4064280A4 (en) 2023-01-11

Similar Documents

Publication Publication Date Title
CN111147444B (zh) 一种交互方法及电子设备
WO2021036566A1 (zh) 信息处理方法、装置、电子设备及介质
KR101633208B1 (ko) 인스턴트 통신 음성 인식 방법 및 단말기
CN106973330B (zh) 一种屏幕直播方法、装置和系统
US10741172B2 (en) Conference system, conference system control method, and program
WO2020042892A1 (zh) 通话模式切换方法及终端设备
US8965350B2 (en) Conference system and associated signalling method
CN110263131B (zh) 回复信息生成方法、装置及存储介质
CN109412932B (zh) 一种截屏方法和终端
CN108540655A (zh) 一种来电显示处理方法及移动终端
CN109257498B (zh) 一种声音处理方法及移动终端
CN107919138A (zh) 一种语音中的情绪处理方法及移动终端
CN109993821A (zh) 一种表情播放方法及移动终端
CN108763475B (zh) 一种录制方法、录制装置及终端设备
CN111447223A (zh) 一种通话处理方法及电子设备
WO2016157993A1 (ja) 情報処理装置、情報処理方法およびプログラム
CN108632465A (zh) 一种语音输入的方法及移动终端
WO2021238824A1 (zh) 屏幕控制方法及装置
CN115002493A (zh) 直播培训的交互方法、装置、电子设备及存储介质
CN110213431B (zh) 消息发送方法及移动终端
CN108513015B (zh) 一种通话方法及移动终端
CN107645604B (zh) 一种通话处理方法及移动终端
CN113329203A (zh) 通话控制方法、通话控制装置、电子设备和可读存储介质
CN111326175A (zh) 一种对话者的提示方法及穿戴设备
CN111431795A (zh) 一种共享内容显示方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant