CN109600307A - 即时通讯方法、终端、设备、计算机可读介质 - Google Patents

即时通讯方法、终端、设备、计算机可读介质 Download PDF

Info

Publication number
CN109600307A
CN109600307A CN201910085470.5A CN201910085470A CN109600307A CN 109600307 A CN109600307 A CN 109600307A CN 201910085470 A CN201910085470 A CN 201910085470A CN 109600307 A CN109600307 A CN 109600307A
Authority
CN
China
Prior art keywords
information
audio
text
received
frequency information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910085470.5A
Other languages
English (en)
Inventor
李兴彪
杨箫
王超
周轶景
范慧敏
邵瀚瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910085470.5A priority Critical patent/CN109600307A/zh
Publication of CN109600307A publication Critical patent/CN109600307A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/043Real-time or near real-time messaging, e.g. instant messaging [IM] using or handling presence information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)

Abstract

本公开提供了一种即时通讯方法,包括:在第一状态下,接收语音信号;根据所述语音信号得到音频信息,根据所述语音信号转换得到文字信息;将所述音频信息和所述文字信息绑定得到绑定信息;发送所述绑定信息。本公开还提供了一种终端、设备、计算机可读介质。

Description

即时通讯方法、终端、设备、计算机可读介质
技术领域
本公开实施例涉及互联网技术领域,特别涉及即时通讯方法、终端、设备、计算机可读介质。
背景技术
利用即时通讯(IM,Instant Messaging)软件可实现不同终端(如手机)间实时的信息交互,满足人们进行实时聊天的需求。在不同的情况下,人们对即时通讯信息的可靠性、输入速度、信息形式等有不同的要求。因此,以合适的形式发送即时通讯信息是很重要的。
一种即时通讯方式是通过输入法输入文字,并发送相应文字信息。但是,输入文字和观看文字的速度都较慢,效率低,而且,部分用户可能无法观看文字信息(例如对视障人士或不识字的人士)。
另一种即时通讯方式是输入语音以获得音频信息,并发送音频信息。但是,用户在很多情况下可能无法收听语音(例如在开会,或者周围声音嘈杂,或者因口音、录音质量而听不懂,或者对听障人士)。
发明内容
本公开实施例提供一种即时通讯方法、终端、设备、计算机可读介质。
第一方面,本公开实施例提供了一种即时通讯方法,其包括:
在第一状态下,接收语音信号;
根据所述语音信号得到音频信息,并根据所述语音信号转换得到文字信息;
将所述音频信息和所述文字信息绑定得到绑定信息;
发送所述绑定信息。
在一些实施例中,所述方法还包括:
在第二状态下,接收语音信号,根据所述语音信号得到音频信息,单独发送所述音频信息;
和/或,
在第三状态下,接收语音信号,根据所述语音信号转换得到文字信息,单独发送所述文字信息;
和/或
在第四状态下,接收文字输入,根据所述文字输入得到文字信息,单独发送所述文字信息。
在一些实施例中,在任意两不同状态之间,还包括:
接收切换操作,根据所述切换操作改变当前所处的状态。
在一些实施例中,所述方法还包括:
接收编辑操作,并根据所述编辑操作修改未发送的所述文字信息。
在一些实施例中,所述方法还包括:
接收播放操作,开始播放所述音频信息;
和/或,
接收暂停操作,暂停播放所述音频信息;
和/或,
接收选择操作,并根据所述选择操作调整所述音频信息的播放进度。
第二方面,本公开实施例提供了一种即时通讯方法,其包括:
接收绑定信息,所述绑定信息包括音频信息和文字信息,其中所述音频信息是根据语音信号得到的,所述文字信息是根据同一所述语音信号转换得到的。
在一些实施例中,所述方法还包括:
单独接收所述音频信息;
和/或,
单独接收文字信息,所述文字信息由所述语音信号转换得到,或根据文字输入得到。
在一些实施例中,所述方法还包括:
接收播放操作,开始播放所述音频信息;
和/或,
接收暂停操作,暂停播放所述音频信息;
和/或,
接收选择操作,并根据所述选择操作调整所述音频信息的播放进度。
第三方面,本公开实施例提供了一种用于进行即时通讯的终端,其包括:
语音接收单元,用于接收语音信号;
音频生成单元,用于根据所述语音信号得到音频信息;
语音转换单元,用于根据所述语音信号转换得到文字信息;
信息绑定单元,用于将根据同一所述语音信号得到的音频信息和文字信息绑定,得到绑定信息;
发送单元,用于发送所述绑定信息。
在一些实施例中,所述发送单元还用于:
单独发送音频信息;
和/或,
单独发送文字信息。
在一些实施例中,所述终端还包括:
状态切换单元,用于接收切换操作,根据所述切换操作改变所述发送单元发送的信息的类型。
在一些实施例中,所述终端还包括:
文字输入单元,用于接收文字输入,根据所述文字输入得到文字信息。
在一些实施例中,所述终端还包括:
文字编辑单元,用于接收编辑操作,并根据所述编辑操作修改未发送的所述文字信息。
在一些实施例中,所述终端还包括音频播放单元,所述音频播放单元用于:
接收播放操作,开始播放所述音频信息;
和/或,
接收暂停操作,暂停播放所述音频信息;
和/或,
接收选择操作,并根据所述选择操作调整所述音频信息的播放进度。
第四方面,本公开实施例提供了一种用于进行即时通讯的终端,其包括:
接收单元,用于接收绑定信息,所述绑定信息包括音频信息和文字信息,其中所述音频信息是根据语音信号得到的,所述文字信息是根据同一所述语音信号转换得到的。
在一些实施例中,所述接收单元还用于:
单独接收所述音频信息;
和/或,
单独接收文字信息,所述文字信息由所述语音信号转换得到,或根据文字输入得到。
在一些实施例中,所述终端还包括音频播放单元,所述音频播放单元用于:
接收播放操作,开始播放所述音频信息;
和/或,
接收暂停操作,暂停播放所述音频信息;
和/或,
接收选择操作,并根据所述选择操作调整所述音频信息的播放进度。
第五方面,本公开实施例提供了一种设备,其括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一种即时通讯方法。
第六方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现上述任意一种即时通讯方法。
本公开实施例提供的即时通讯方法中,可通过语音实现信息输入,相对于通过输入法直接进行文字输入的方式,其输入更加快速、便捷、信息量大。
本公开实施例的即时通讯方法中,可同时得到音频信息和文字信息,接收者可根据情况选择让终端播放音频信号并进行收听(例如用户存在视力障碍、不识字等,或因时间紧来不及看文字),或让终端显示文字并进行观看(例如因环境而不方便听语音或者听不清语音,或者用户存在听力障碍等),满足不同场合的需要。同时,在语音转换得到文字的过程中不可避免的存在一定的错误,故文字信息中存在错误的可能性较高;而由于口音、录音质量等原因,有时接收者可能无法通过音频信息正确理解发送者的意思;根据本公开实施例的即时通讯方法,可通过音频信息和文字信息进行相互的验证,保证能获得正确的信息,提高可靠性。
进一步的,本公开实施例的即时通讯方法中还可包括其它的信息发送方式,即可实现多种不同的信息发送方式的切换,故用户可根据具体情况选择合适的方式发送信息,从而满足不同用户、不同场合的需求,扩展了聊天信息发送方式,提高了聊天效率。
附图说明
附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:
图1为本公开实施例提供的一种即时通讯方法的流程图;
图2为本公开实施例提供的一种即时通讯方法中进行状态切换的操作示意图;
图3为本公开实施例提供的另一种即时通讯方法的流程图;
图4为本公开实施例提供的一种终端的组成框图;
图5为本公开实施例提供的另一种终端的组成框图。
具体实施方式
为使本领域的技术人员更好地理解本公开的技术方案,下面结合附图对本公开提供的即时通讯方法、终端、计算机可读介质进行详细描述。
在下文中将参考附图更充分地描述示例实施例,但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。
如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由……制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其他特征、整体、步骤、操作、元件、组件和/或其群组。
除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
本公开实施例用于即时通讯(IM,Instant Messaging)领域。即时通讯是一种可实现实时的信息交互的技术,即一个终端可实时的将信息(包括但不限于文字信息、音频信息等)发送给其它的一个或多个终端,使其它的一个或多个终端实时的接收相应信息,并能根据该信息做出反馈。
其中,终端是指具有发送和/或接收即时通讯的信息的能力的电子设备,其包括但不限于台式电脑、笔记本电脑、移动通讯终端(如手机)、平板电脑等。
图1为本公开实施例的一种即时通讯方法的流程图。
第一方面,本公开实施例提供一种即时通讯方法,该方法用于在即时通讯中发送信息。
参照图1,本方法可包括以下的步骤:
S101、在第一状态下,接收语音信号。
第一状态属于语音输入状态,更具体是要发送绑定信息的状态。在第一状态下,终端可通过麦克风等接收用户输入的语音信号。
S102、根据语音信号得到音频信息,并根据语音信号转换得到文字信息。
将语音信号录制为音频信息并保存下来。以及,利用语音转换技术(即将语音转为对应文字的技术)对语音信号进行转换,得到与该语音信号对应的文字信息。
当然,应当理解,本步骤中得到音频信息和得到文字信息的操作并无必然的顺序关系。
S103、将音频信息和文字信息绑定得到绑定信息。
在以上得到的音频信息和文字信息间建立特定的关系,从而将二者绑定在一起,形成绑定信息。
其中,绑定信息中包括音频信息和文字信息,且该音频信息和文字信息具有确定的联系,故它们应当一起被发送,而不会单独的仅发送其中的一者(如果仅发送一者就不是绑定信息了)。在屏幕上,绑定信息可显示为一条信息,而音频信息和文字信息为其中的两个不同部分;或者,绑定信息中的音频信息和文字信息也可显示为两条连续的信息,且需标明两条信息间具有绑定关系。
S104、发送绑定信息。
将以上得到绑定信息(包括音频信息和文字信息)作为一个整体发送给目标终端。
本公开实施例提供的即时通讯方法中,可通过语音实现信息输入,相对于通过输入法直接进行文字输入的方式,其输入更加快速、便捷、信息量大。
本公开实施例的即时通讯方法中,可同时得到音频信息和文字信息,接收者可根据情况选择让终端播放音频信号并进行收听(例如用户存在视力障碍、不识字等,或因时间紧来不及看文字),或让终端显示文字并进行观看(例如因环境而不方便听语音或者听不清语音,或者用户存在听力障碍等),满足不同场合的需要。同时,在语音转换得到文字的过程中不可避免的存在一定的错误,故文字信息中存在错误的可能性较高;而由于口音、录音质量等原因,有时接收者可能无法通过音频信息正确理解发送者的意思;根据本公开实施例的即时通讯方法,可通过音频信息和文字信息进行相互的验证,保证能获得正确的信息,提高可靠性。
进一步的,本公开实施例的即时通讯方法中还可包括其它的信息发送方式,即可实现多种不同的信息发送方式的切换,故用户可根据具体情况选择合适的方式发送信息,从而满足不同用户、不同场合的需求,扩展了聊天信息发送方式,提高了聊天效率。
其中,实现接收语音信号的操作的具体方式可以是多样的。
例如,可在屏幕上显示录音图标(如标注有文字“开始录音”的录音图标),通过长按该录音图标即可开始接收语音信号(即开始录音),而当松开录音图标时则结束语音信号的接收(即结束录音),且在长按录音图标时,还可通过向特定方向的滑动(如向上滑动)取消本次录音。
或者,也可以是通过点击录音图标开始接收语音信号(同时录音图标的文字可变为“结束录音”),之后再次点击录音图标结束语音信号的接收。
在一些实施例中,即时通讯方法还包括以下步骤的至少一项:
S105、在第二状态下,接收语音信号,根据语音信号得到音频信息,单独发送音频信息。
第二状态属于语音输入状态,更具体是仅发送音频信息的状态。在第二状态下,终端可通过麦克风等接收用户输入的语音信号,并将语音信号保存为音频信息,之后发送该音频信息(其中不产生和发送文字信息)。
S106、在第三状态下,接收语音信号,根据语音信号转换得到文字信息,单独发送文字信息。
第三状态属于语音输入状态,更具体是仅发送文字信息的状态。在第三状态下,终端可通过麦克风等接收用户输入的语音信号,并利用语音转换技术(即将语音转为对应文字的技术)对语音信号进行转换,得到与该语音信号对应的文字,之后发送该文字信息(其中不产生和发送音频信息)。
S107、在第四状态下,接收文字输入,根据文字输入得到文字信息,单独发送文字信息。
第四状态属于文字输入状态,且仅发送文字信息。在第四状态下,终端可通过触摸屏、键盘等接收用户的文字输入,并根据该文字输入产生相应的文字信息,之后发送该文字信息(其中不涉及语音信号和音频信息)。
本公开实施例的即时通讯方法中,也可通过语音输入而发送音频信息,也可通过语音输入转换得到文字并发送文字信息,也可通过文字输入直接得到文字信息并发送文字信息。
由此,本公开实施例的即时通讯方法中可实现多种不同的信息发送方式的切换,故用户可根据具体情况选择合适的方式发送信息,从而满足不同用户、不同场合的需求,扩展了聊天信息发送方式,提高了聊天效率。
在一些实施例中,在不同的状态(第一状态至第四状态)之间,还包括:接收切换操作,根据切换操作改变当前所处的状态。
由于在不同的状态下需要进行的步骤是不同的,故必须先处于特定状态才可进行相应的后续步骤。而当具有多种可能的状态时,若要改变状态,就需要进行状态的切换。当要切换状态时,可接收用户的切换操作,并根据切换操作改变当前状态。
具体的,切换操作可以采用多种不同的方式,但优选采用操作方便、符合用户习惯、学习成本低的切换方式。例如,参照图2,可在屏幕上显示切换语音输入和文字输入状态的切换图标(图中有“切换”字样的图标),通过点击该切换图标,可切换文字输入状态(第四状态)和语音输入状态(第一状态、第二状态、第三状态)。
当点击切换图标进入文字输入状态后,可在屏幕上自动显示文字输入框等。
而当点击切换图标进入语音输入状态后,可先处于第一状态、第二状态、第三状态中的一种状态(可以是系统默认的状态,也可以是用户设定的状态,也可以是上次退出时所处的状态等,图中以默认处于第一状态为例进行说明),并在屏幕上显示录音图标(图中有“按住说话”字样的图标)和子切换图标(图中显示状态的图标)。通过操作录音图标可实现语音输入;而通过长按子切换图标,可弹出第一状态、第二状态、第三状态的列表供用户进一步选择;或者也可通过点击子切换图标在第一状态、第二状态、第三状态间轮流切换。
当然,应当理解,以上的不同状态并无必然的执行顺序、执行次数等关系。例如,用户可长期在一个状态下发送多条信息而不进行切换,或者,用户也可每发送一条信息都进行状态的切换。
在一些实施例中,即时通讯方法还包括:
接收编辑操作,并根据编辑操作修改未发送的文字信息。
本公开实施例中可通过多种方式得到文字信息,例如通过语音输入转换得到(包括单独得到文字信息和绑定信息中的文字信息),或通过文字输入得到。但是,基于识别精度等因素的限制,通过语音转换得到的文字信息中存在错误的可能性较高,而由于操作错误等,通过文字输入得到的文字信息中也可能存在一定的错误。为此,在得到文字信息后,可先不发送文字信息,而是先接收编辑操作,允许用户对文字信息进行修改,消除其中的错误,之后再进行发送(如通过点击发送图标),从而提高文字信息的正确率与可靠性。
尤其是,由于音频信息一般不存在错误且不方便进行编辑,故可在是得到音频信息(即录音结束)后直接发送音频信息。而对于第一状态中要发送绑定信息的情况,由于绑定信息中同时也包括文字信息,故必须在对其中的文字信息进行编辑后,再将文字信息与音频信息一起发送,而不能先单独发送音频信息(因为这样发送的就不是绑定信息了)。
在一些实施例中,即时通讯方法还包括:
接收播放操作,开始播放音频信息;
和/或,
接收暂停操作,暂停播放音频信息;
和/或,
接收选择操作,并根据选择操作调整音频信息的播放进度。
用户可播放并收听任意的音频信息(包括单独的音频信息和绑定信息中的音频信息,也包括未发送的音频信息和已发送的音频信息),以确认其中的内容。该播放还可包括暂停播放(如通过点击暂停/继续图标),也可包括跳跃性的选择播放进度(如通过拖动播放进度条或点击播放进度条的特定位置)。
由此,本公开实施例的即时通讯方法实现了对音频信息的更自由的播放,方便用户按照想要的方式收听音频信息。
图3为本公开实施例的另一种即时通讯方法的流程图。
第二方面,本公开实施例的一种即时通讯方法,该方法用于在即时通讯中接收信息。
参照图3,本方法可包括以下的步骤:
S201、接收绑定信息,绑定信息包括音频信息和文字信息,其中音频信息是根据语音信号得到的,文字信息是根据同一语音信号转换得到的。
本公开实施例的即时通讯方法中,可同时接收到源自同一语音信号的音频信息和文字信息,从而用户可根据情况选择收听语音或观看文字,满足不同用户、不同场合的需求;且用户可利用音频信息和文字信息进行相互验证,以确保信息的准确性。
在一些实施例中,本公开实施例的即时通讯方法还包括:
S202、单独接收音频信息;
和/或,
S203、单独接收文字信息,文字信息由语音信号转换得到,或根据文字输入得到。
本公开实施例的即时通讯方法中,也可单独接收音频信息或文字信息,以适应更多情况的需求。当然,以上文字信息可以是由语音信号转换得到的,也可以是通过文字输入直接得到的。
当然,应当理解,以上接收不同信息的步骤同样并无必然的执行顺序、执行次数等关系。
在一些实施例中,本公开实施例的即时通讯方法还包括:
接收播放操作,开始播放音频信息;
和/或,
接收暂停操作,暂停播放音频信息;
和/或,
接收选择操作,并根据选择操作调整音频信息的播放进度。
对接收到的音频信息(包括单独的音频信息和绑定信息中的音频信息),也可进行播放,且播放中也可进行暂停、调整进度等。
图4为本公开实施例的一种终端的组成框图。
第三方面,本公开实施例提供一种用于进行即时通讯的终端,更具体是用于在即时通讯中发送信息的终端。
参照图4,以上终端包括:
语音接收单元,用于接收语音信号;
音频生成单元,用于根据语音信号得到音频信息;
语音转换单元,用于根据语音信号转换得到文字信息;
信息绑定单元,用于将根据同一语音信号得到的音频信息和文字信息绑定,得到绑定信息;
发送单元,用于发送绑定信息。
本公开实施例的终端中语音接收单元能接收用户输入的语音信号,其具体可包括麦克风、话筒等。
音频生成单元和语音转换单元则能将语音信号分别转变为音频信息和文字信息;而信息绑定单元则利用源自同一语音信号的音频信息和文字信息生成绑定信息。
发送单元具有方式发送以上绑定信息的能力,其具体可包括天线等。
本公开实施例的终端可实现以上即时通讯方法。
在一些实施例中,发送单元还用于:
单独发送音频信息;
和/或,
单独发送文字信息。
本公开实施例的终端中,发送单元也可单独的发送音频信息或文字信息。
在一些实施例中,本公开实施例的终端包括:
状态切换单元,用于接收切换操作,根据切换操作改变发送单元发送的信息的类型(即改变终端所处的状态)。
在一些实施例中,本公开实施例的终端包括:
文字输入单元,用于接收文字输入,根据文字输入得到文字信息。
在一些实施例中,本公开实施例的终端还包括:
文字编辑单元,用于接收编辑操作,并根据编辑操作修改未发送的文字信息。
在一些实施例中,本公开实施例的终端还包括音频播放单元,音频播放单元用于:
接收播放操作,开始播放音频信息;
和/或,
接收暂停操作,暂停播放音频信息;
和/或,
接收选择操作,并根据选择操作调整音频信息的播放进度。
本公开实施例的终端中,也可具有状态切换单元以实现状态的切换,也可具有文字输入单元以实现文字输入,也可具有文字编辑单元以实现对文字信息的编辑,也可具有音频播放单元以播放音频信息等。
图5为本公开实施例的另一种终端的组成框图。
第四方面,本公开实施例提供一种用于进行即时通讯的终端,用更具体是用于在即时通讯中接收信息的终端。
参照图5,以上终端包括:
接收单元,用于接收绑定信息,绑定信息包括音频信息和文字信息,其中音频信息是根据语音信号得到的,文字信息是根据同一语音信号转换得到的。
本公开实施例的终端中,接收单元可接收源自同一语音信号的音频信息和文字信息(绑定信息),其具体可包括天线等。
在一些实施例中,接收单元还用于:
单独接收音频信息;
和/或,
单独接收文字信息,文字信息由语音信号转换得到,或根据文字输入得到。
本公开实施例的终端中,接收单元也可单独接收音频信息或文字信息。当然,以上文字信息可以是由语音信号转换得到的,也可以是通过文字输入直接得到的。
在一些实施例中,终端还包括音频播放单元,音频播放单元用于:
接收播放操作,开始播放音频信息;
和/或,
接收暂停操作,暂停播放音频信息;
和/或,
接收选择操作,并根据选择操作调整音频信息的播放进度。
本公开实施例的终端中,也可具有能播放音频信息的音频播放单元。
当然,应当理解,以上终端用于即时通讯并不代表其仅能用于即时通讯,终端也可具有其它功能。而且,在同一终端中,可同时具有以上接收单元和发送单元,即终端既可发送即时通讯信息,也可接收即时通讯信息,从而可实现完整的即时通讯过程。
其中,为接收用户的输入,部分单元可包括触摸屏、键盘、麦克风等输入器件;而为进行数据处理,部分单元可包括处理器等用于进行数据处理的器件;而音频播放单元可包括扬声器、耳机等输出器件。
应当理解,以上各不同单元可全部或部分的集成在一起。例如,触摸屏、处理器等均可同时属于多个单元。
第五方面,本公开实施例提供一种设备,其中,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器上述任意一种即时通讯方法。
第六方面,本公开实施例提供一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述任意一种即时通讯方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其他实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本公开的范围的情况下,可进行各种形式和细节上的改变。

Claims (19)

1.一种即时通讯方法,其包括:
在第一状态下,接收语音信号;
根据所述语音信号得到音频信息,根据所述语音信号转换得到文字信息;
将所述音频信息和所述文字信息绑定得到绑定信息;
发送所述绑定信息。
2.根据权利要求1所述的方法,其中,还包括:
在第二状态下,接收语音信号,根据所述语音信号得到音频信息,单独发送所述音频信息;
和/或,
在第三状态下,接收语音信号,根据所述语音信号转换得到文字信息,单独发送所述文字信息;
和/或
在第四状态下,接收文字输入,根据所述文字输入得到文字信息,单独发送所述文字信息。
3.根据权利要求2所述的方法,其中,在任意两不同状态之间,还包括:
接收切换操作,根据所述切换操作改变当前所处的状态。
4.根据权利要求1至3中任意一项所述的方法,其中,还包括:
接收编辑操作,并根据所述编辑操作修改未发送的所述文字信息。
5.根据权利要求1至3中任意一项所述的方法,其中,还包括:
接收播放操作,开始播放所述音频信息;
和/或,
接收暂停操作,暂停播放所述音频信息;
和/或,
接收选择操作,并根据所述选择操作调整所述音频信息的播放进度。
6.一种即时通讯方法,其包括:
接收绑定信息,所述绑定信息包括音频信息和文字信息,其中所述音频信息是根据语音信号得到的,所述文字信息是根据同一所述语音信号转换得到的。
7.根据权利要求6所述的方法,其中,还包括:
单独接收所述音频信息;
和/或,
单独接收文字信息,所述文字信息由所述语音信号转换得到,或根据文字输入得到。
8.根据权利要求6或7所述的方法,其中,还包括:
接收播放操作,开始播放所述音频信息;
和/或,
接收暂停操作,暂停播放所述音频信息;
和/或,
接收选择操作,并根据所述选择操作调整所述音频信息的播放进度。
9.一种用于进行即时通讯的终端,其包括:
语音接收单元,用于接收语音信号;
音频生成单元,用于根据所述语音信号得到音频信息;
语音转换单元,用于根据所述语音信号转换得到文字信息;
信息绑定单元,用于将根据同一所述语音信号得到的音频信息和文字信息绑定,得到绑定信息;
发送单元,用于发送所述绑定信息。
10.根据权利要求9所述的终端,其中,所述发送单元还用于:
单独发送所述音频信息;
和/或,
单独发送文字信息,所述文字信息由所述语音信号转换得到,或根据文字输入得到。
11.根据权利要求10所述的终端,其中,还包括:
状态切换单元,用于接收切换操作,根据所述切换操作改变所述发送单元发送的信息的类型。
12.根据权利要求9至11中任意一项所述的终端,其中,还包括:
文字输入单元,用于接收文字输入,根据所述文字输入得到文字信息。
13.根据权利要求9至11中任意一项所述的终端,其中,还包括:
文字编辑单元,用于接收编辑操作,并根据所述编辑操作修改未发送的所述文字信息。
14.根据权利要求9至11中任意一项所述的终端,其中,还包括音频播放单元,所述音频播放单元用于:
接收播放操作,开始播放所述音频信息;
和/或,
接收暂停操作,暂停播放所述音频信息;
和/或,
接收选择操作,并根据所述选择操作调整所述音频信息的播放进度。
15.一种用于进行即时通讯的终端,其包括:
接收单元,用于接收绑定信息,所述绑定信息包括音频信息和文字信息,其中所述音频信息是根据语音信号得到的,所述文字信息是根据同一所述语音信号转换得到的。
16.根据权利要求15所述的终端,其中,所述接收单元还用于:
单独接收所述音频信息;
和/或,
单独接收文字信息,所述文字信息由所述语音信号转换得到,或根据文字输入得到。
17.根据权利要求15所述的终端,其中,还包括音频播放单元,所述音频播放单元用于:
接收播放操作,开始播放所述音频信息;
和/或,
接收暂停操作,暂停播放所述音频信息;
和/或,
接收选择操作,并根据所述选择操作调整所述音频信息的播放进度。
18.一种设备,其包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现权利要求1至8任意一项所述的方法。
19.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现根据权利要求1至8任意一项所述的方法。
CN201910085470.5A 2019-01-29 2019-01-29 即时通讯方法、终端、设备、计算机可读介质 Pending CN109600307A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910085470.5A CN109600307A (zh) 2019-01-29 2019-01-29 即时通讯方法、终端、设备、计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910085470.5A CN109600307A (zh) 2019-01-29 2019-01-29 即时通讯方法、终端、设备、计算机可读介质

Publications (1)

Publication Number Publication Date
CN109600307A true CN109600307A (zh) 2019-04-09

Family

ID=65966765

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910085470.5A Pending CN109600307A (zh) 2019-01-29 2019-01-29 即时通讯方法、终端、设备、计算机可读介质

Country Status (1)

Country Link
CN (1) CN109600307A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112530435A (zh) * 2019-09-19 2021-03-19 比亚迪股份有限公司 数据传输方法、装置、系统、可读存储介质及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101297541A (zh) * 2005-10-27 2008-10-29 国际商业机器公司 在具有不同通信模式的设备之间的通信
CN101496096A (zh) * 2006-07-31 2009-07-29 高通股份有限公司 话音及文本通信系统、方法及设备
CN101610465A (zh) * 2008-06-18 2009-12-23 朗讯科技公司 用于将文本信息转换为语音信息的通信方法及通信系统
US20100217600A1 (en) * 2009-02-25 2010-08-26 Yuriy Lobzakov Electronic device and method of associating a voice font with a contact for text-to-speech conversion at the electronic device
CN102821196A (zh) * 2012-07-25 2012-12-12 江西好帮手电子科技有限公司 一种移动终端文字语音对等通话方法及其移动终端
CN103632670A (zh) * 2013-11-30 2014-03-12 青岛英特沃克网络科技有限公司 语音和文本消息自动转换系统及其方法
US20140082102A1 (en) * 2012-09-18 2014-03-20 Weerawan Wongmanee Unified communication system
CN106409296A (zh) * 2016-09-14 2017-02-15 安徽声讯信息技术有限公司 基于分核处理技术的语音快速转写校正系统
CN106997764A (zh) * 2016-01-26 2017-08-01 阿里巴巴集团控股有限公司 一种基于语音识别的即时通信方法和即时通信系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101297541A (zh) * 2005-10-27 2008-10-29 国际商业机器公司 在具有不同通信模式的设备之间的通信
CN101496096A (zh) * 2006-07-31 2009-07-29 高通股份有限公司 话音及文本通信系统、方法及设备
CN101610465A (zh) * 2008-06-18 2009-12-23 朗讯科技公司 用于将文本信息转换为语音信息的通信方法及通信系统
US20100217600A1 (en) * 2009-02-25 2010-08-26 Yuriy Lobzakov Electronic device and method of associating a voice font with a contact for text-to-speech conversion at the electronic device
CN102821196A (zh) * 2012-07-25 2012-12-12 江西好帮手电子科技有限公司 一种移动终端文字语音对等通话方法及其移动终端
US20140082102A1 (en) * 2012-09-18 2014-03-20 Weerawan Wongmanee Unified communication system
CN103632670A (zh) * 2013-11-30 2014-03-12 青岛英特沃克网络科技有限公司 语音和文本消息自动转换系统及其方法
CN106997764A (zh) * 2016-01-26 2017-08-01 阿里巴巴集团控股有限公司 一种基于语音识别的即时通信方法和即时通信系统
CN106409296A (zh) * 2016-09-14 2017-02-15 安徽声讯信息技术有限公司 基于分核处理技术的语音快速转写校正系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112530435A (zh) * 2019-09-19 2021-03-19 比亚迪股份有限公司 数据传输方法、装置、系统、可读存储介质及电子设备
CN112530435B (zh) * 2019-09-19 2024-04-16 比亚迪股份有限公司 数据传输方法、装置、系统、可读存储介质及电子设备

Similar Documents

Publication Publication Date Title
KR101872759B1 (ko) 음성 채팅을 가능하게 하는 시스템, 방법 및 프로그램
US7603414B2 (en) System, method and computer program product for collaborative background music among portable communication devices
US10324587B2 (en) Participant selection and abuse prevention for interactive video sessions
CN105898557A (zh) 一种语音弹幕的生成、播放方法及其装置、客户端
US10581773B2 (en) Voice enabled social artifacts
CN105991854B (zh) 一种智能终端上VoIP电话会议可视化的系统及方法
US20170168660A1 (en) Voice bullet screen generation method and electronic device
US8965344B2 (en) Method and apparatus for multipoint call service in mobile terminal
US9706055B1 (en) Audio-based multimedia messaging platform
CN109600307A (zh) 即时通讯方法、终端、设备、计算机可读介质
CN112954426B (zh) 视频播放方法、电子设备及存储介质
KR20100118936A (ko) 음성 통화 중 인스턴트 오더블을 확장하기 위한 장치 및 방법
US10938918B2 (en) Interactively updating multimedia data
US20230276001A1 (en) Systems and methods for improved audio/video conferences
CN108924648B (zh) 用于向用户播放视频数据的方法、装置、设备和介质
KR20090121760A (ko) 컨텐츠 공유 방법, 단말 및 그 방법을 실행하는 프로그램이기록된 기록매체
US20170359396A1 (en) System and Method for a Broadcast Terminal and Networked Devices
US20130210419A1 (en) System and Method for Associating Media Files with Messages
CN103905483A (zh) 音视频共享方法、设备和系统
CN103685523B (zh) 一种对多媒体数据进行处理的方法和装置
CN106797339A (zh) 视频拣选器
CN105913698A (zh) 一种播放课程多媒体信息的方法和装置
KR20190027645A (ko) 멀티미디어 북 제작 방법
JP7139766B2 (ja) 端末装置、端末装置の動作方法およびプログラム
CN113838488B (zh) 音频播放包生成方法、装置和音频播放方法、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190409

RJ01 Rejection of invention patent application after publication