CN114363280B - 基于多段语音汇总式传输的手机聊天辅助系统 - Google Patents

基于多段语音汇总式传输的手机聊天辅助系统 Download PDF

Info

Publication number
CN114363280B
CN114363280B CN202210268862.7A CN202210268862A CN114363280B CN 114363280 B CN114363280 B CN 114363280B CN 202210268862 A CN202210268862 A CN 202210268862A CN 114363280 B CN114363280 B CN 114363280B
Authority
CN
China
Prior art keywords
voice
module
voice data
state
receiving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210268862.7A
Other languages
English (en)
Other versions
CN114363280A (zh
Inventor
冯丽卿
冯秋波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ou'le Intelligent Industry Co ltd
Original Assignee
Shenzhen Ou'le Intelligent Industry Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Ou'le Intelligent Industry Co ltd filed Critical Shenzhen Ou'le Intelligent Industry Co ltd
Priority to CN202210268862.7A priority Critical patent/CN114363280B/zh
Publication of CN114363280A publication Critical patent/CN114363280A/zh
Application granted granted Critical
Publication of CN114363280B publication Critical patent/CN114363280B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明涉及语音传输技术领域,具体地说,涉及基于多段语音汇总式传输的手机聊天辅助系统。其包括语音读取单元、语音截停单元、状态采集单元和语音汇总单元,其中:所述语音读取单元用于读取语音发送端输出的语音数据;所述状态采集单元用于对语音接收端的聊天状态进行采集,并在聊天状态为非接收状态时形成截停点。本发明中通过状态采集单元对语音接收端的聊天状态进行采集,然后语音截停单元根据聊天的状态判断出截停点,从而利用截停点截停后续传输的语音数据,并通过语音汇总单元对截停点后的语音数据进行汇总,进而避免语音数据在非接收状态下单独传输。

Description

基于多段语音汇总式传输的手机聊天辅助系统
技术领域
本发明涉及语音传输技术领域,具体地说,涉及基于多段语音汇总式传输的手机聊天辅助系统。
背景技术
随着互联网的发展,很多的聊天软件借助互联网也得到了快速的发展。
聊天软件这种实时传讯与电子邮件最大的不同在于不用等候,不需要每隔两分钟就按一次“传送与接收”,只要两个人都同时在线,就能像多媒体电话一样,传送文字、档案、声音、影像给对方,只要有网络,无论对方在天涯海角,或是双方隔得多远都没有距离。
但相应的也会出现一些问题,由于现在的语音数据需要点击进行收听,而且与文字不同的是,语音数据是看不到的,所以当语音接收端无法收听语音数据时,可是此时的语音发送端不知道语音接收端能不能收听,当语音发送端发送多条语音数据时,接收端再次上线就需要往上翻聊天记录,然后一一收听,非常的麻烦,而且很容易漏听或者错听,鉴于此,本发明提出了基于多段语音汇总式传输的手机聊天辅助系统。
发明内容
本发明的目的在于提供基于多段语音汇总式传输的手机聊天辅助系统,以解决上述背景技术中提出的问题。
为实现上述目的,提供了基于多段语音汇总式传输的手机聊天辅助系统,包括语音读取单元、语音截停单元、状态采集单元和语音汇总单元,其中:
所述语音读取单元用于读取语音发送端输出的语音数据;
所述状态采集单元用于对语音接收端的聊天状态进行采集,并在聊天状态为非接收状态时形成截停点;
所述语音截停单元用于接收截停点,接收后截停语音数据的传输;
所述语音汇总单元用于对截停点后的语音数据进行汇总,汇总后的语音数据合并传输至语音接收端。
作为本技术方案的进一步改进,所述语音读取单元包括授权获取模块、语音接收端读取模块和语音数据读取模块;所述授权获取模块用于获取语音发生端和语音接收端的读取授权情况,在二者均授权的情况下:
所述语音接收端读取模块用于读取语音接收端的状态信息;
所述语音数据读取模块用于读取语音发生端的语音数据。
作为本技术方案的进一步改进,所述状态采集单元包括状态信息采集模块和截停点记录模块;所述状态信息采集模块用于采集语音接收端读取模块读取的状态信息;所述截停点记录模块根据状态信息得出截停点,其中:
非接收状态包括聊天框离线状态和语音收听状态。
作为本技术方案的进一步改进,所述语音截停单元包括截停点接收模块和语音传输截停模块;所述截停点接收模块用于接收截停点,在接收到截停点的同时所述语音传输截停模块截停当前未完成传输的语音数据,其中:
所述语音截停单元还包括汇总反馈模块,所述汇总反馈模块在语音汇总单元汇总完成后形成反馈节点,并将反馈节点反馈至截停点接收模块,同时删除当前的截停点。
作为本技术方案的进一步改进,所述语音汇总单元包括语音数据接收模块、整合汇总模块和合并传输模块;所述语音数据接收模块用于接收语音数据读取模块读取的语音数据;所述整合汇总模块用于将接收的语音数据进行整合汇总,并通过合并传输模块将整合汇总后的语音数据合并传输至语音接收端。
作为本技术方案的进一步改进,所述整合汇总模块对语音数据的汇总采用逼近式汇总算法,其算法公式如下:
Figure 609589DEST_PATH_IMAGE001
其中,
Figure 610912DEST_PATH_IMAGE002
为汇总后的语音数据;
Figure 902216DEST_PATH_IMAGE004
为截停点下的语音数据;
Figure 372511DEST_PATH_IMAGE006
Figure 528336DEST_PATH_IMAGE008
时刻下的语音数据;
Figure 134898DEST_PATH_IMAGE010
为语音数据总数;
Figure 846371DEST_PATH_IMAGE012
为逼近数;
Figure 803963DEST_PATH_IMAGE014
为逼近项。
作为本技术方案的进一步改进,所述整合汇总模块对语音数据的整合采用分段式整合算法,其算法步骤如下:
S1、获取汇总语音数据中的逼近项;
S2、整合时,根据逼近项对汇总后的语音数据进行划分,并形成划分界线。
作为本技术方案的进一步改进,所述状态信息采集模块用于采集语音接收端的语音收听状态。
作为本技术方案的进一步改进,所述辅助系统还包括语音拆分单元,所述语音拆分单元包括界线获取模块、收听状态接收模块和收听状态记忆模块;所述界线获取模块用于获取划分界线;所述收听状态接收模块用于接收状态信息采集模块采集的语音收听状态;所述收听状态记忆模块根据划分界线对收听时段进行记忆。
作为本技术方案的进一步改进,所述语音拆分单元包括语音拆分模块,所述语音拆分模块根据划分界线对整合后的语音数据进行拆分。
与现有技术相比,本发明的有益效果:
1、该基于多段语音汇总式传输的手机聊天辅助系统中,通过状态采集单元对语音接收端的聊天状态进行采集,然后语音截停单元根据聊天的状态判断出截停点,从而利用截停点截停后续传输的语音数据,并通过语音汇总单元对截停点后的语音数据进行汇总,进而避免语音数据在非接收状态下单独传输,而是通过汇总的方式将多个单独的语音数据合并成一个整体,以方便语音接收端进行收听。
2、该基于多段语音汇总式传输的手机聊天辅助系统中,通过授权获取模块获取语音发生端和语音接收端的读取授权情况,并且在语音接收端和语音发送端都授权的情况下才能进行聊天的辅助,以保证语音发送端以及语音接收端的隐私安全。
3、该基于多段语音汇总式传输的手机聊天辅助系统中,汇总反馈模块在语音汇总单元汇总完成后形成反馈节点,并将反馈节点反馈至截停点接收模块,同时删除当前的截停点,以便于后续截停点的接收,保证整个过程的连续性。
附图说明
图1为本发明的整体单元模块框图图;
图2为本发明的语音读取单元模块框图;
图3为本发明的状态采集单元模块框图;
图4为本发明的语音截停单元模块框图;
图5为本发明的语音汇总单元模块框图;
图6为本发明的语音拆分单元模块框图其一;
图7为本发明的语音拆分单元模块框图其二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-7所示,本实施例目的在于,提供了基于多段语音汇总式传输的手机聊天辅助系统,包括语音读取单元、语音截停单元、状态采集单元和语音汇总单元,其中:
语音读取单元用于读取语音发送端输出的语音数据,读取完成后,状态采集单元对语音接收端的聊天状态进行采集,并在聊天状态为非接收状态(非接收状态包括聊天框离线状态和语音收听状态,也就是说语音接收端无法收听语音发送端发送的语音)时形成截停点,然后语音截停单元接收截停点,并在接收后截停语音数据的传输;
同时,语音汇总单元对截停点后的语音数据进行汇总,汇总后的语音数据合并传输至语音接收端。
本实施例中,通过状态采集单元对语音接收端的聊天状态进行采集,然后语音截停单元根据聊天的状态判断出截停点,从而利用截停点截停后续传输的语音数据,并通过语音汇总单元对截停点后的语音数据进行汇总,进而避免语音数据在非接收状态下单独传输,而是通过汇总的方式将多个单独的语音数据合并成一个整体,以方便语音接收端进行收听。
具体工作原理如下:
请参阅图2所示,本实施例具体公开语音读取单元,语音读取单元包括授权获取模块、语音接收端读取模块和语音数据读取模块;授权获取模块用于获取语音发生端和语音接收端的读取授权情况,从而保证语音发送端以及语音接收端的隐私,所以说只有在二者均授权的情况下才能完成下述的原理;
首先语音接收端读取模块读取语音接收端的状态信息,然后语音数据读取模块读取语音发生端的语音数据,假设此时语音接收端为离线状态(即:聊天框离线状态),由于此时语音发送端发送的语音数据语音接收端是无法进行收听的,所以需要对此时段语音接收端接收的语音数据进行汇总,为此本实施例还公开了语音截停单元、状态采集单元和语音汇总单元,请参阅图3所示,状态采集单元包括状态信息采集模块和截停点记录模块,工作时,状态信息采集模块采集语音接收端读取模块读取的状态信息,然后截停点记录模块根据状态信息(聊天框离线状态)得出截停点。
进一步的,请参阅图4所示,语音截停单元包括截停点接收模块和语音传输截停模块,工作时,截停点接收模块接收截停点记录模块得出的截停点,在接收到截停点的同时语音传输截停模块截停当前未完成传输的语音数据,并且考虑到语音数据汇总完成后需要等待新的截停点出现,所以语音截停单元还包括汇总反馈模块,汇总反馈模块在语音汇总单元汇总完成后形成反馈节点,并将反馈节点反馈至截停点接收模块,同时删除当前的截停点,以便于后续截停点的接收,保证整个过程的连续性。
再进一步的,请参阅图5所示,语音汇总单元包括语音数据接收模块、整合汇总模块和合并传输模块,当截停点接收后,语音数据接收模块会接收语音数据读取模块读取的语音数据,然后整合汇总模块将接收的语音数据进行整合汇总,并通过合并传输模块将整合汇总后的语音数据合并传输至语音接收端,从而方便语音接收端上线后统一对语音数据进行收听,具体的:
整合汇总模块对语音数据的汇总采用逼近式汇总算法,其算法公式如下:
Figure 744237DEST_PATH_IMAGE015
其中,
Figure 221617DEST_PATH_IMAGE016
为汇总后的语音数据;
Figure 854723DEST_PATH_IMAGE017
为截停点下的语音数据;
Figure DEST_PATH_IMAGE018
Figure DEST_PATH_IMAGE019
时刻下的语音数据;
Figure DEST_PATH_IMAGE020
为语音数据总数;
Figure DEST_PATH_IMAGE021
为逼近数;
Figure DEST_PATH_IMAGE022
为逼近项。
工作原理:
利用语音数据发送的时刻
Figure DEST_PATH_IMAGE024
对时刻对应的语音数据进行合并,由于截停点下的语音数据为初始语音数据,所以其初始端无须考虑时间的问题,而后续的语音数据为了保证收听的连贯性,需要对时间进行逼近,也就是通过逼近项完成的。
此外,考虑到后期还需要对整合后的语音数据进行提取,所以整合汇总模块对语音数据的整合采用分段式整合算法,其算法步骤如下:
S1、获取汇总语音数据中的逼近项;
S2、整合时,根据逼近项对汇总后的语音数据进行划分,并形成划分界线,这样对整合后的语音数据有清楚的时间线,并配合语音拆分单元完成后期的辅助操作,语音拆分单元包括界线获取模块、收听状态接收模块和收听状态记忆模块,其中:
请参阅图6所示,状态信息采集模块还会采集语音接收端的语音收听状态,如果在收听过程中,由于外界因素导致语音终端,比如:用户暂停收听,有其他语音的接入等等,此时为了避免下次重头收听导致时间上的浪费,界线获取模块会获取划分界线,然后收听状态接收模块接收状态信息采集模块采集的语音收听状态,当收听中断时,收听状态记忆模块根据划分界线对收听时段进行记忆,比如:此时有时间划分界限a1、a2和a3,此时我听到a2中间时刻我暂停播放了,下次再次收听时可以从a2中间时刻进行播放,但是还可以,从a2开头进行播放,这样便于对前面语境进行回忆。
另外:请参阅图7所示,语音拆分单元还包括语音拆分模块,语音拆分模块根据划分界线对整合后的语音数据进行拆分,拆分后的语音数据可进行选择,例如:多项选择删除、单项语音数据的收听、多项选择复制等等。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (5)

1.基于多段语音汇总式传输的手机聊天辅助系统,其特征在于:包括语音读取单元、语音截停单元、状态采集单元和语音汇总单元,其中:
所述语音读取单元用于读取语音发送端输出的语音数据;
所述状态采集单元用于对语音接收端的聊天状态进行采集,并在聊天状态为非接收状态时形成截停点;
所述语音截停单元用于接收截停点,接收后截停语音数据的传输;
所述语音汇总单元用于对截停点后的语音数据进行汇总,汇总后的语音数据合并传输至语音接收端;
所述语音读取单元包括授权获取模块、语音接收端读取模块和语音数据读取模块;所述授权获取模块用于获取语音发生端和语音接收端的读取授权情况,在二者均授权的情况下:
所述语音接收端读取模块用于读取语音接收端的状态信息;
所述语音数据读取模块用于读取语音发生端的语音数据;
所述状态采集单元包括状态信息采集模块和截停点记录模块;所述状态信息采集模块用于采集语音接收端读取模块读取的状态信息;所述截停点记录模块根据状态信息得出截停点,其中:
非接收状态包括聊天框离线状态和语音收听状态;
所述语音截停单元包括截停点接收模块和语音传输截停模块;所述截停点接收模块用于接收截停点,在接收到截停点的同时所述语音传输截停模块截停当前未完成传输的语音数据,其中:
所述语音截停单元还包括汇总反馈模块,所述汇总反馈模块在语音汇总单元汇总完成后形成反馈节点,并将反馈节点反馈至截停点接收模块,同时删除当前的截停点;
所述语音汇总单元包括语音数据接收模块、整合汇总模块和合并传输模块;所述语音数据接收模块用于接收语音数据读取模块读取的语音数据;所述整合汇总模块用于将接收的语音数据进行整合汇总,并通过合并传输模块将整合汇总后的语音数据合并传输至语音接收端;
所述整合汇总模块对语音数据的汇总采用逼近式汇总算法,其算法公式如下:
Figure 391978DEST_PATH_IMAGE001
其中,
Figure 14720DEST_PATH_IMAGE002
为汇总后的语音数据;
Figure 428384DEST_PATH_IMAGE003
为截停点下的语音数据;
Figure 46447DEST_PATH_IMAGE004
Figure 129941DEST_PATH_IMAGE005
时刻下的语音数据;
Figure 833455DEST_PATH_IMAGE006
为语音数据总数;
Figure 785230DEST_PATH_IMAGE007
为逼近数;
Figure 398745DEST_PATH_IMAGE008
为逼近项。
2.根据权利要求1所述的基于多段语音汇总式传输的手机聊天辅助系统,其特征在于:所述整合汇总模块对语音数据的整合采用分段式整合算法,其算法步骤如下:
S1、获取汇总语音数据中的逼近项;
S2、整合时,根据逼近项对汇总后的语音数据进行划分,并形成划分界线。
3.根据权利要求2所述的基于多段语音汇总式传输的手机聊天辅助系统,其特征在于:所述状态信息采集模块用于采集语音接收端的语音收听状态。
4.根据权利要求3所述的基于多段语音汇总式传输的手机聊天辅助系统,其特征在于:所述辅助系统还包括语音拆分单元,所述语音拆分单元包括界线获取模块、收听状态接收模块和收听状态记忆模块;所述界线获取模块用于获取划分界线;所述收听状态接收模块用于接收状态信息采集模块采集的语音收听状态;所述收听状态记忆模块根据划分界线对收听时段进行记忆。
5.根据权利要求4所述的基于多段语音汇总式传输的手机聊天辅助系统,其特征在于:所述语音拆分单元包括语音拆分模块,所述语音拆分模块根据划分界线对整合后的语音数据进行拆分。
CN202210268862.7A 2022-03-18 2022-03-18 基于多段语音汇总式传输的手机聊天辅助系统 Active CN114363280B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210268862.7A CN114363280B (zh) 2022-03-18 2022-03-18 基于多段语音汇总式传输的手机聊天辅助系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210268862.7A CN114363280B (zh) 2022-03-18 2022-03-18 基于多段语音汇总式传输的手机聊天辅助系统

Publications (2)

Publication Number Publication Date
CN114363280A CN114363280A (zh) 2022-04-15
CN114363280B true CN114363280B (zh) 2022-06-17

Family

ID=81094497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210268862.7A Active CN114363280B (zh) 2022-03-18 2022-03-18 基于多段语音汇总式传输的手机聊天辅助系统

Country Status (1)

Country Link
CN (1) CN114363280B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106559540A (zh) * 2015-09-30 2017-04-05 北京奇虎科技有限公司 语音数据处理方法及装置
CN113724735A (zh) * 2021-09-01 2021-11-30 广州博冠信息科技有限公司 语音流处理方法及装置、计算机可读存储介质、电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7124202B2 (en) * 2001-11-13 2006-10-17 Intel Corporation System and method for aggregating channel segment ID's into a first section and data segments into a second section
ATE552680T1 (de) * 2006-07-21 2012-04-15 Google Inc Verfahren und system zur generierung und präsentation von konversationsfäden mit e-mail-, voicemail- und chat-nachrichten
US7831673B1 (en) * 2007-10-31 2010-11-09 Google Inc. Methods and systems for processing offline chat messages
WO2012020717A1 (ja) * 2010-08-10 2012-02-16 日本電気株式会社 音声区間判定装置、音声区間判定方法および音声区間判定プログラム
US9947319B1 (en) * 2016-09-27 2018-04-17 Google Llc Forming chatbot output based on user state
CN109245997B (zh) * 2018-09-26 2021-08-06 北京小米移动软件有限公司 语音消息播放方法及装置
CN112600750A (zh) * 2020-12-25 2021-04-02 支付宝(杭州)信息技术有限公司 即时通信中多条对话信息的处理方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106559540A (zh) * 2015-09-30 2017-04-05 北京奇虎科技有限公司 语音数据处理方法及装置
CN113724735A (zh) * 2021-09-01 2021-11-30 广州博冠信息科技有限公司 语音流处理方法及装置、计算机可读存储介质、电子设备

Also Published As

Publication number Publication date
CN114363280A (zh) 2022-04-15

Similar Documents

Publication Publication Date Title
CN104113471B (zh) 通讯连接异常时的信息处理方法和装置
US6393461B1 (en) Communication management system for a chat system
CN105100360B (zh) 用于语音通话的通话辅助方法和装置
TWI507063B (zh) 資訊共用方法、終端、伺服器及系統
CN103888581B (zh) 一种通信终端及其记录通话信息的方法
CN109474763A (zh) 一种基于语音、语义的ai智能会议系统及其实现方法
CN103095557A (zh) 即时通信消息进行语音输出的方法及系统
CN107360332B (zh) 通话状态显示方法、装置、移动终端及存储介质
CN103346953B (zh) 一种群组通讯数据交互的方法、装置及系统
CN111683183B (zh) 一种多媒体会议非参会对话屏蔽处理方法及其系统
CN111128241A (zh) 语音通话的智能质检方法及系统
US20220335949A1 (en) Conference Data Processing Method and Related Device
CN114363280B (zh) 基于多段语音汇总式传输的手机聊天辅助系统
CN113259620B (zh) 视频会议数据同步方法及装置
CN109300478A (zh) 一种听力障碍者的辅助对话装置
CN109803189A (zh) 一种基于ble协议的蓝牙耳机
CN105657149B (zh) 一种语音通信方法、系统和通信终端
WO2020125588A1 (zh) 一种语音通话识别方法、装置及存储介质
WO2018232668A1 (zh) 一种通讯账号登录方法和装置
CN208656882U (zh) 呼叫中心话务管理系统
US9485458B2 (en) Data processing method and device
CN111667837A (zh) 会议记录的获取方法、智能终端及具有存储功能的装置
CN108735234A (zh) 一种采用语音信息监测健康状况的装置
CN109428803A (zh) 一种语音信息发送方法和系统
CN207083147U (zh) 通话录音系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant