CN112908335A - 语音通信辅助方法、装置及电子设备 - Google Patents
语音通信辅助方法、装置及电子设备 Download PDFInfo
- Publication number
- CN112908335A CN112908335A CN202110113656.4A CN202110113656A CN112908335A CN 112908335 A CN112908335 A CN 112908335A CN 202110113656 A CN202110113656 A CN 202110113656A CN 112908335 A CN112908335 A CN 112908335A
- Authority
- CN
- China
- Prior art keywords
- text
- input
- information
- voice information
- communication voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 235
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000004044 response Effects 0.000 claims description 41
- 238000012937 correction Methods 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 7
- 238000012790 confirmation Methods 0.000 claims description 5
- 238000002372 labelling Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 20
- 238000012549 training Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000007599 discharging Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种语音通信辅助方法、装置及电子设备,属于通信技术领域。该方法包括:接收用户发送的第一通信语音信息;在确定所述第一通信语音信息对应的文本句式为问句的情况下,文本显示与所述第一通信语音信息对应的答复信息;所述答复信息提取于在所述第一通信语音信息之后接收到的目标通信语音信息,方便用户在进行语音聊天时直接得到自己想要的答复信息,而且在用户不方便听取语音时,也可快速获取到对应的答复信息,节省时间,方便快捷。
Description
技术领域
本申请属于电子设备领域,具体涉及一种语音通信辅助方法、装置及电子设备。
背景技术
随着即时通信软件越来越多的使用,信息的交互越来越多,太多的信息对用户很可能造成疲劳轰炸,目前方案中,由于通信群组中的信息量较大,用户在提出问题后,则需要按照接收顺序将通信消息依次进行查看或收听语音信息,或者在翻看时需要往回翻看较多的通信消息,导致浪费时间。
在实现本申请过程中,发明人发现现有技术中至少存在如下问题:当用户在使用语音提出问题后,需要听取大量的语音信息才能得到对应的答复信息。
申请内容
本申请实施例的目的是提供一种语音通信辅助方法、装置及电子设备,能够解决用户在提出问题后不能方便快捷地得到相应的答复信息的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种语音通信辅助方法,该方法包括:
接收用户发送的第一通信语音信息;
在确定所述第一通信语音信息对应的文本句式为问句的情况下,文本显示与所述第一通信语音信息对应的答复信息;所述答复信息提取于在所述第一通信语音信息之后接收到的目标通信语音信息。
第二方面,本申请实施例提供了一种语音通信辅助装置,该装置包括:
第一接收模块,用于接收用户发送的第一通信语音信息;
第一显示模块,用于在确定所述第一通信语音信息对应的文本句式为问句的情况下,文本显示与所述第一通信语音信息对应的答复信息;所述答复信息提取于在所述第一通信语音信息之后接收到的目标通信语音信息
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的语音通信辅助方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的语音通信辅助方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的语音通信辅助方法。
在本申请实施例中,在接收用户发送的第一通信语音信息;在确定所述第一通信语音信息为问句的情况下,文本显示与所述第一通信语音信息对应的答复信息;所述答复信息提取于所述目标通信语音信息,方便用户在进行语音聊天时直接得到自己想要的答复信息,而且在用户不方便听取语音时,也可快速获取到对应的答复信息,节省时间,方便快捷。
附图说明
图1为本申请实施例提供的一种语音通信辅助方法的流程图;
图2为本申请实施例提供的历史信息浏览的界面示意图;
图3为本申请实施例提供的对识别的文本进行分句的示意图;
图4为本申请实施例提供的响应于第一输入的界面示意图;
图5为本申请实施例提供的响应于第一输入的界面示意图之一;
图6为本申请实施例提供的响应于第三输入的界面示意图之二;
图7为本申请实施例提供的响应于第二五输入的界面示意图之三;
图8a为本申请实施例提供的响应于第六输入的界面示意图之一;
图8b为本申请实施例提供的响应于第六输入的界面示意图之二;
图9为本申请实施例提供的历史信息浏览的界面示意图;
图10为本申请实施例提供的一种目标信息的提示框的示意图;
图11为本申请实施例提供一种语音通信辅助装置的组成示意图;
图12为实现本申请实施例的一种电子设备的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的语音通信辅助方法进行详细地说明。
请参见图1,图1为本申请实施例提供的一种语音通信辅助方法的流程图,如图1所示,所述语音通信辅助方法包括以下步骤:
本申请又一实施例中,在通信中为了实现用户提出的问题的快速答复信息获取,方便用户不用浏览全部回复的文本或接听全部的语音信息,就可以得到对方给出的答复信息,本申请实施例中还可以进行以下步骤:
步骤101:接收用户发送的第一通信语音信息;
具体地,在本实施例中,用户在进行语音聊天的过程中,既可以是在一对一的私聊过程中,也可以在两个用户以上的群聊中,当用户有问题需要提出时,可以使用语音信息在聊天对话框中发出第一通信语音信息。
在通信对象接收到第一通信语音信息并进行查看到,会发出对用户的问题进行解答的目标通信语音信息,当然,这里的目标通信语音信息并不指的是一条语音信息,也可以是多条语音信息。
步骤102在确定所述第一通信语音信息为问句的情况下,文本显示与所述第一通信语音信息对应的答复信息;所述答复信息提取于在所述第一通信语音信息之后接收到的目标通信语音信息。
也就是说,本申请中,首先需要确定用户发出的第一通信语音信息是否为问句,如果是问句的情况下可以在得到对方的答复后进行相应的答复信息提取,具体地可以基于问答意图模型判断所述第一通信语音信息是否为问句;在确定所述第一通信语音信息为问句的情况下,基于阅读理解模型在所述目标通信语音信息中提取与所述问句对应的答复信息;然后通过文本形式显示所述答复信息于所述第一通信语音信息的标注区域,例如可以将所述答复信息显示与第一通信语音信息的右侧区域,当然也可以是方便用户查看的其他区域或位置。
示例性地,如图2所示,图2为本申请实施例提供的历史信息浏览的界面示意图,图中可以看到用户发出问句“今天几点来接我啊”,而对端用户发出了长达56s的语音信息,此时文本识别出的文段为“小明啊,我今天有点忙,下班还要去洗个车,然后狗粮没了,我要去买点狗粮,可能得晚点去接你啦,大概八点多吧,十分抱歉呀”,这时对于用户来讲,无论是接听语音信息还是阅读文本都比较浪费时间,因此本申请中直接基于问句中的“几点”提取出对应的答复信息“八点多”,从而方便用户快速获得问题的答复信息。
在上述实施例的基础上,本实施例中,如图3所示,图3为本申请实施例提供的对识别的文本进行分句的示意图;对于本申请上述实施例中的目标通信语音信息,可以通过语音识别技术将其转换为文本形式,并且可以使用中文文本分句技术将该语音段识别出的文本进行分句,当分句完成后用户可以方便地文本进行阅读,而不需要耗费时间去听语音。当然在进行文本识别时可能会出现识别不准确的情况,这时可以对用户不能理解的地方进行纠错,具体地可以进行以下步骤:接收用户的第一输入,所述第一输入为对所述目标通信语音信息识别出的错误文本的纠错确认输入;其中,所述错误文本为所述目标通信语音信息识别出的文本进行分句后的至少一个分句;响应于所述第三输入,对所述错误文本进行纠错,得到正确文本。
具体地,如图4所示,图4为本申请实施例提供的响应于第一输入的界面示意图之一,可以看到在进行文本纠错时,有三个选项“纠错”、“收听”、“反馈”,下面分别对三个选项的相应操作进行范例行说明。
示范性地:接收用户的第二输入,所述第一子输入为用户对所述错误文本的选取输入;响应于所述第二输入,显示与所述错误文本对应的纠错选项;接收用户对所述纠错选项的第二输入;响应于所述第二输入,通过纠错模型对所述错误文本进行纠错,得到正确文本;其中,所述纠错模型是基于错误文本的样本数据以及对应的正确文本进行训练后得到的。
也就是说,有语音信息识别出的文本中存在许多分句,此时,用户对不能理解的分句,可以通过第二输入进行选取,例如可以使用点按该错误本文的方式进行选取,在选取该错误文本后,在该错误文本的相应位置显示出纠错选项,本实施例中出现的选项为“纠错”,在选择“纠错”选项后,如图5所示,图5为本申请实施例提供的响应于第一输入的界面示意图之二;纠错模型将自动对该错误文本进行纠错,并且显示正确文本。
示例性地,本申请又一实施例中提供另外的对错误文本的解决方式,如图6所示,图6为本申请实施例提供的响应于第三输入的界面示意图;具体地,可以接收用户的第三输入,所述第三输入为用户对所述错误文本的选取输入;响应于所述第三输入,显示与所述错误文本对应的收听选项;接收用户对所述收听选项的第三输入;响应于所述第三输入,播放与所述错误文本对应的音频片段。
也就是说,本实施例中,采用将用户不能理解的分句对应的音频提取出来并播放给用户接听,从而用户可以直接听到语音信息的相应部分,在无需接听全部语音片段的情况下,实现对端用户发送的语音信息的理解。
当然,对于用户不能理解的内容,还可以将该内容发送到发送该语音信息的对端用户所使用的电子终端,以便对端用户重新把意思讲清楚,具体地可以进行以下步骤:接收用户的第四输入,所述第四输入为用户对所述错误文本的选取输入;响应于所述第四输入,显示与所述错误文本对应的反馈选项;接收用户对所述反馈选项的第五输入;响应于所述第五输入,发送问询信息到通信对象,所述问询信息包括:与所述错误文本对应的音频片段以及预设询问文本。具体地,如图7所示,图7为本申请实施例提供的响应于第五输入的界面示意图,也就是说,将错误文本对应的语音片段截取出来并发送给通信对象,并且附上“不好意思,我现在不方便接听语音,这句话麻烦您重说一下或者输入问题”类似的语段,让对象重新提供正确的意思表示内容,而且,当对方提供正确的语句时,并且通过这种方法可以积攒文本纠错的错误文本和对应的正确文本,还可以作为文本纠错模型的训练样本。当然,也可以采用其他的方式进行错误文本的用户理解,本申请实施例中不一一列举,上述方法都可有效避免因为某段语音识别错误带来的整段文字的收听,节省用户时间。
在上述实施例的基础上,本实施例中,如图8a,图8b所示,图8a为本申请实施例提供的响应于第四输入的界面示意图之一;图8b为本申请实施例提供的响应于第四输入的界面示意图之二;在确定所述第一通信语音信息对应的文本句式为问句的情况下,文本显示与所述第一通信语音信息对应的答复信息之后,还可以接收用户对所述目标通信语音信息的显示文本的第六输入;响应于所述第六输入,以第一形式显示对所述识别文本中的至少一个目标分句;对所述至少一个目标分句进行关键词提取,以第二形式显示所述关键词于所述目标通信语音信息对应的目标位置。也就是说,可以对重点的分句人工添加标记,从而方便后续进行浏览,而且还可以对基于添加了标记的分句进行关键词的提取,具体地可以对所述至少一个目标分句进行关键词提取;显示所述关键词于所述目标通信语音信息。如图8a所示,界面示意图中可以看到有三个分句:小明,今天干的不错;辛苦一下周六三点记得接王总;今晚可以早点回去休息。其中对“辛苦一下周六三点记得接王总”进行了星型标记,并且在该语音信息的后边显示有“周六三点接王总”的关键字,该关键字是在标记了星型的“辛苦一下周六三点记得接王总”中提取的。
示例性地,如图8b图所示,在又一语音信息中分句得到:具体有哪些不足;你需要继续优化性能,尝试不同方法……,其中“你需要继续优化性能,尝试不同方法”为标记了的重点分句,因此,在该语音信息的后边的关键词为:优化性能。而且,如果目标通信语音信息为目标信息,那么还可以使用预设颜色(例如红色、黄色等与其他语音信息不同的颜色)对所述目标通信语音信息进行预设颜色的标记处理,从而后续进行突出显示。
在进行了上述的处理后,在进行历史通信信息预览的情况下,通过预设颜色显示所述目标通信语音信息;显示所述关键词于所述目标通信语音信息;显示具有重点标记的分句于所述目标通信语音信息。如图9所示,图9为本申请实施例提供的历史信息浏览的界面示意图;如图可以看到对重要的分句使用了第一形式进行标记,具体地对于重要的语音信息颜色加深显示,而且添加了重点标记的分句也显示在了语音信息的下方,而且使用第二形式显示了关键词于所述目标通信语音信息对应的目标位置,具体地,重点标记了的分句的关键词也被显示在了语音信息的后边,从而方便用户进行关键信息的浏览。
本申请实施例中,在回顾历史消息时,标红信息将被突出显示,标星内容将展示在语音段下方,关键字信息将展示在语音段后面,不显示其他冗余信息,重要的信息一目了然,而且在转发语音消息时,在标红,加星的分句和关键词信息将直接用于转发,无需全文转文字转发。
在本申请实施例中,通过对通信对象发送的目标通信语音信息进行是否为目标信息的确定在根据所述目标通信语音信息的用户反应特征确定所述目标通信语音信息为目标信息的情况下,输出所述目标通信语音信息为目标信息的提示信息,避免用户对大量信息不能及时进行处理,将重要语音信息推送给用户以免用户漏掉目标信息。
需要说明的是,本申请实施例提供的语音通信辅助方法,执行主体可以为语音通信辅助装置,或者,或者该语音通信辅助装置中的用于执行加载语音通信辅助方法的控制模块。本申请实施例中以语音通信辅助装置执行加载语音通信辅助的方法为例,说明本申请实施例提供的语音通信辅助的方法。
在本申请的又一实施例中,为了避免用户对大量信息不能及时进行处理,将重要语音信息推送给用户以免用户漏掉重要信息,可以进行以下步骤:
步骤201:接收通信对象发送的目标通信语音信息;
在本申请实施例中,首先需要接收通信对象发送的目标通信语音信息,目标通信语音信息接收到第一通信界面中,第一通信界面可以为语音播放装置的使用用户与对端用户的通信界面。其中,对端用户可以为一个,也可以为多个,本申请实施例对此不作限定。例如,第一通信界面可以为用户与一个对端用户的通信界面,也可以为使用用户与一个通信群组中的多个对端用户的通信界面,也就是说,目标通信语音信息可以是单独通信的语音信息,也可以是众多通信对象的群聊对话框中的语音信息。
在一种示例中,第一通信界面可以为第一应用程序中的界面。需要说明的是,目标通信语音信息为第一通信界面中对端用户的语音消息,在本申请实施例中,目标通信语音信息可以包括一条语音消息,也可以包括多条语音消息,本申请实施例对此不作限定。在一种示例中,第一语音消息可以为第一通信界面中的多条语音消息拼接得到的一条语音消息。
步骤202:响应于所述目标通信语音信息的接收,在根据所述目标通信语音信息的用户反应特征确定所述目标通信语音信息为目标信息的情况下,输出所述目标通信语音信息为目标信息的提示信息。
在接收到目标通信语音信息后,可以基于判断该消息是否重要的结果来确定是否将该信息推送到用户,具体地可以设定指定的发送人发送的信息全部为目标信息,从而将该信息推送到用户。当然,也可以基于其它的方式进行目标信息的确定,例如用户特别关注某些方面的信息,因此,可以在接收到目标通信语音信息后,判断该信息是否符合用户关注的预设方面,来进行是否为目标信息的确定。
当然,在本申请的一种具体实施方式中,在所述目标通信语音信息为群聊信息的情况下,可以基于群聊对话框中的其他用户对该目标通信语音信息的反应来判断该条信息是否重要,具体地,可以进行以下步骤:获取所述目标通信语音信息的群聊用户反应特征信息;输入所述群聊用户反应特征信息到判断模型,得到所述目标通信语音信息是否重要的判断结果;在所述判断结果为重要的情况下,推送所述目标通信语音信息到用户的终端界面;其中所述判断模型是基于群聊用户反应特征信息的样本数据以及对应的判断结果标签进行训练后得到的,所述判断结果标签是基于群聊用户反应特征信息的样本数据预先确定的,并与所述样本数据一一对应。
也就是说,在群聊中,不断地接收到新的语音信息,可以基于训练好的判断模型对群聊中所有的语音信息逐条地做是否为目标信息的判断,从而辨别这些语音信息中是否存在目标信息。
在判断该目标通信语音信息重要的情况下,可以使用预设提示音对用户进行声音提醒,并且将该目标通信语音信息提取出来单独现在预设提示框中对用户进行提醒,例如当用户的电子设备处于息屏状态下,当出现目标信息时,可以发出“叮”的一声,并且使用预设提示框将该信息展示在电子设备的显示屏上,从而方便用户快速进行查看。
具体在使用预训练的判断模型进行目标信息的判断时,使用到的样本数据中的群聊用户特征包括下列至少一种:所述目标通信语音信息的收听次数、所述目标通信语音信息的收听完成次数、所述目标通信语音信息的收听完成度(比如甲收听了80%,乙收听了30%,丙收听了100%等)、所述目标通信语音信息被反复收听的次数、所述目标通信语音信息的长度、所述目标通信语音信息的发送方。当然,还可以使用其他的群聊用户对该目标通信语音信息的反应特征来进行判断和训练,例如还可以使用用户后续发送信息时@该目标通信语音信息的发送者的次数,或者引用回复该目标通信语音信息的次数来进行目标信息的判断和判断模型的训练,这里不一一列举。
本申请的又一实施例中,考虑到有些信息虽然判断模型的结果显示不重要,但是从概率上来讲,该信息为目标信息的概率要大于该信息上下文的信息,因此也可以将该信息最终判定为目标信息,并对用户进行提示。具体为可以进行以下步骤:输入所述群聊用户反应特征信息到判断模型,得到所述目标通信语音信息为目标信息的第一概率值和判断结果值;在所述判断结果值为不重要的情况下,若所述第一概率值同时大于第二概率值和第三概率值,则所述目标通信语音信息为目标信息;在所述判断结果值为重要的情况下,所述目标通信语音信息为目标信息;其中,所述第二概率值为与所述目标通信语音信息相邻的前一条语音信息为目标信息的概率值,所述第三概率值为与所述目标通信语音信息相邻的后一条语音信息为目标信息的概率值。
也就是说,判断模型输出目标通信语音信息是否为目标信息的初步判断值,0代表不重要,1代表重要;并且判断模型也会输出该语音信息为目标信息的概率,如果一条语音信息的与它前后的语音信息相比,概率值处于波峰位置,那么说明该条语音信息相对于上下文来讲是重要的,因此可以将该条语音信息也判定为目标信息。
如图10所示,图10为本申请实施例提供的一种目标信息的提示框的示意图;图中有多条目标信息,依次按照时间的先后顺序从上到下排列。在本申请又一实施例中,在将确定为目标信息的目标通信语音信息发送到用户的终端界面后,用户可以进行操作从而实现该语音信息的接听和上下文的浏览。具体地为了实现该条语音信息上下文浏览,可以进行以下步骤:接收用户对所述目标通信语音信息的第七输入;响应于所述第七输入,显示群聊对话框中所述目标通信语音信息的位置。示例性地,用户可以在提示框中长按(例如3秒)该目标通信语音信息,电子设备在接收到该长按信号后,将显示画面跳转到通信界面中,并且进行该目标通信语音信息的定位,显示对话框中所述目标通信语音信息的位置,从而方便用户进行上下文的浏览。
当然,用户也可以直接对该语音信息进行接听,可以进行以下步骤:接收用户对所述目标通信语音信息的第八输入;响应于所述第八输入,语音播放所述目标通信语音信息。例如,可以点击该目标通信语音信息,从而实现语音信息的播放和接听。
如图11所示,图11为本申请实施例提供一种语音通信辅助装置的组成示意图,该装置包括:
第一接收模块111,用于接收用户发送的第一通信语音信息;
第一显示模块112,用于在确定所述第一通信语音信息对应的文本句式为问句的情况下,文本显示与所述第一通信语音信息对应的答复信息;所述答复信息提取于在所述第一通信语音信息之后接收到的目标通信语音信息。
可选地,所述第一显示模块包括:
第一判断单元,用于判断所述第一通信语音信息对应的文本句式是否为问句;
第一提取单元,用于在确定所述第一通信语音信息为问句的情况下,在所述目标通信语音信息中提取与所述问句对应的答复信息;
第二显示单元,用于通过文本形式显示所述答复信息于所述第一通信语音信息的标注区域。
可选地,所述装置还包括:
第二接收模块,用于接收用户的第一输入,所述第一输入为对所述目标通信语音信息识别出的错误文本的纠错确认输入;其中,所述错误文本为所述目标通信语音信息识别出的文本进行分句后的至少一个分句;
第二响应模块,用于响应于所述第一输入,对所述错误文本进行纠错,得到正确文本。
可选地,所述装置还包括:
第三接收模块,用于接收用户的第二输入,所述第二输入为用户对所述错误文本的选取输入;
第三响应模块,用于响应于所述第二输入,显示与所述错误文本对应的收听选项;
第四接收模块,用于接收用户对所述收听选项的第三输入;
第四响应模块,用于响应于所述第三输入,播放与所述错误文本对应的音频片段。
可选地,所述装置还包括:
第五接收模块,用于接收用户的第四输入,所述第四输入为用户对所述错误文本的选取输入;
第五响应模块,用于响应于所述第四输入,显示与所述错误文本对应的反馈选项;
第六接收模块,用于接收用户对所述反馈选项的第五输入;
第六响应模块,用于响应于所述第五输入,发送问询信息到通信对象,所述问询信息包括:与所述错误文本对应的音频片段以及预设询问文本。
可选地,所述装置还包括:
第七接收模块,用于接收用户对所述目标通信语音信息的显示文本的第六输入;
第七响应模块,用于响应于所述第六输入,以第一形式显示对所述识别文本中的至少一个目标分句;
第一提取模块,用于对所述至少一个目标分句进行关键词提取,以第二形式显示所述关键词于所述目标通信语音信息对应的目标位置。
本申请实施例中的语音通信辅助装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的语音通信辅助装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为iOS操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的语音通信辅助装置能够实现上述任一种实施例中的语音通信辅助方法实施例中语音通信辅助装置实现的各个过程,为避免重复,这里不再赘述。
可选地,本申请实施例还提供一种电子设备,包括处理器,存储器,存储在存储器上并可在所述处理器上运行的程序或指令,该程序或指令被处理器110执行时实现上述语音通信辅助方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要注意的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图12为实现本申请实施例的一种电子设备的硬件结构示意图。
该电子设备1200包括但不限于:射频单元1201、网络模块1202、音频输出单元1203、输入单元1204、传感器1205、显示单元1206、用户输入单元1207、接口单元1208、存储器1209、以及处理器1210等部件。
本领域技术人员可以理解,电子设备1200还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器1210逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图12中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
可选地,输入单元1204,还用于接收用户发送的目标通信语音信息第一通信语音信息;
显示单元1206,还用于在确定所述第一通信语音信息为问句的情况下,文本显示与所述目标通信语音信息第一通信语音信息对应的答复信息;所述答复信息提取于在所述第一通信语音信息之后接收到的目标通信语音信息。
可选地,处理器1210,还用于判断所述第一通信语音信息对应的文本句式是否为问句;
可选地,处理器1210,还用于在确定所述第一通信语音信息为问句的情况下,在所述目标通信语音信息中提取与所述问句对应的答复信息;
可选地,显示单元1206,还用于通过文本形式显示所述答复信息于所述第一通信语音信息的标注区域。
可选地,输入单元1204,还用于接收用户的第一输入,所述第一输入为对所述目标通信语音信息识别出的错误文本的纠错确认输入;其中,所述错误文本为所述目标通信语音信息识别出的文本进行分句后的至少一个分句;
处理器1210,还用于响应于所述第一输入,对所述错误文本进行纠错,得到正确文本。
可选地,输入单元1204,还用于接收用户的第二输入,所述第二输入为用户对所述错误文本的选取输入;
处理器1210,还用于响应于所述第二输入,显示与所述错误文本对应的收听选项;
输入单元1204,还用于接收用户对所述收听选项的第三输入;
处理器1210,还用于响应于所述第三输入,播放与所述错误文本对应的音频片段。
可选地,输入单元1204,还用于接收用户的第四输入,所述第四输入为用户对所述错误文本的选取输入;
处理器1210,还用于响应于所述第四输入,显示与所述错误文本对应的反馈选项;
输入单元1204,还用于接收用户对所述反馈选项的第五输入;
处理器1210,还用于响应于所述第五输入,发送问询信息到通信对象,所述问询信息包括:与所述错误文本对应的音频片段以及预设询问文本。
可选地,输入单元1204,还用于接收用户对所述目标通信语音信息的显示文本的第六输入;
处理器1210,还用于响应于所述第六输入,以第一形式显示对所述识别文本中的至少一个目标分句;
处理器1210,还用于对所述至少一个目标分句进行关键词提取,以第二形式显示所述关键词于所述目标通信语音信息对应的目标位置。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述语音通信辅助方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述语音通信辅助方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括基于所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (14)
1.一种语音通信辅助方法,其特征在于,包括:
接收用户发送的第一通信语音信息;
在确定所述第一通信语音信息对应的文本句式为问句的情况下,文本显示与所述第一通信语音信息对应的答复信息;所述答复信息提取于在所述第一通信语音信息之后接收到的目标通信语音信息。
2.根据权利要求1所述的方法,其特征在于,所述在确定所述第一通信语音信息对应的文本句式为问句的情况下,文本显示与所述第一通信语音信息对应的答复信息;所述答复信息提取于在所述第一通信语音信息之后接收到的目标通信语音信息包括:
判断所述第一通信语音信息对应的文本句式是否为问句;
在确定所述第一通信语音信息为问句的情况下,在所述目标通信语音信息中提取与所述问句对应的答复信息;
通过文本形式显示所述答复信息于所述第一通信语音信息的标注区域。
3.根据权利要求1所述的方法,其特征在于,在确定所述第一通信语音信息对应的文本句式为问句的情况下,文本显示与所述第一通信语音信息对应的答复信息之后,所述方法还包括:
接收用户的第一输入,所述第一输入为对所述目标通信语音信息识别出的错误文本的纠错确认输入;其中,所述错误文本为所述目标通信语音信息识别出的文本进行分句后的至少一个分句;
响应于所述第一输入,对所述错误文本进行纠错,得到正确文本。
4.根据权利要求1所述的方法,其特征在于,在确定所述第一通信语音信息对应的文本句式为问句的情况下,文本显示与所述第一通信语音信息对应的答复信息之后,所述方法还包括:
接收用户的第二输入,所述第二输入为用户对错误文本的选取输入;
响应于所述第二输入,显示与所述错误文本对应的收听选项;
接收用户对所述收听选项的第三输入;
响应于所述第三输入,播放与所述错误文本对应的音频片段。
5.根据权利要求1所述的方法,其特征在于,在确定所述第一通信语音信息对应的文本句式为问句的情况下,文本显示与所述第一通信语音信息对应的答复信息之后,所述方法还包括:
接收用户的第四输入,所述第四输入为用户对错误文本的选取输入;
响应于所述第四输入,显示与所述错误文本对应的反馈选项;
接收用户对所述反馈选项的第五输入;
响应于所述第五输入,发送问询信息到通信对象,所述问询信息包括:与所述错误文本对应的音频片段以及预设询问文本。
6.根据权利要求1至5任一项所述的方法,其特征在于,在确定所述第一通信语音信息对应的文本句式为问句的情况下,文本显示与所述第一通信语音信息对应的答复信息之后,所述方法还包括:
接收用户对所述目标通信语音信息的显示文本的第六输入;
响应于所述第六输入,以第一形式显示所述目标通信语音信息的识别文本中的至少一个目标分句;
对所述至少一个目标分句进行关键词提取,以第二形式显示所述关键词于所述目标通信语音信息对应的目标位置。
7.一种语音通信辅助装置,其特征在于,包括:
第一接收模块,用于接收用户发送的第一通信语音信息;
第一显示模块,用于在确定所述第一通信语音信息对应的文本句式为问句的情况下,文本显示与所述第一通信语音信息对应的答复信息;所述答复信息提取于在所述第一通信语音信息之后接收到的目标通信语音信息。
8.根据权利要求7所述的装置,其特征在于,所述第一显示模块包括:
第一判断单元,用于判断所述第一通信语音信息对应的文本句式是否为问句;
第一提取单元,用于在确定所述第一通信语音信息为问句的情况下,在所述目标通信语音信息中提取与所述问句对应的答复信息;
第二显示单元,用于通过文本形式显示所述答复信息于所述第一通信语音信息的标注区域。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二接收模块,用于接收用户的第一输入,所述第一输入为对所述目标通信语音信息识别出的错误文本的纠错确认输入;其中,所述错误文本为所述目标通信语音信息识别出的文本进行分句后的至少一个分句;
第二响应模块,用于响应于所述第一输入,对所述错误文本进行纠错,得到正确文本。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第三接收模块,用于接收用户的第二输入,所述第二输入为用户对错误文本的选取输入;
第三响应模块,用于响应于所述第二输入,显示与错误文本对应的收听选项;
第四接收模块,用于接收用户对所述收听选项的第三输入;
第四响应模块,用于响应于所述第三输入,播放与所述错误文本对应的音频片段。
11.根据权利要求7所述的装置,所述装置还包括:
第五接收模块,用于接收用户的第四输入,所述第四输入为用户对错误文本的选取输入;
第五响应模块,用于响应于所述第四输入,显示与错误文本对应的反馈选项;
第六接收模块,用于接收用户对所述反馈选项的第五输入;
第六响应模块,用于响应于所述第五输入,发送问询信息到通信对象,所述问询信息包括:与所述错误文本对应的音频片段以及预设询问文本。
12.根据权利要求7至11任一项所述的装置,其特征在于,所述装置还包括:
第七接收模块,用于接收用户对所述目标通信语音信息的显示文本的第六输入;
第七响应模块,用于响应于所述第六输入,以第一形式显示所述目标通信语音信息的识别文本中的至少一个目标分句;
第一提取模块,用于对所述至少一个目标分句进行关键词提取,以第二形式显示所述关键词于所述目标通信语音信息对应的目标位置。
13.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至6任一项所述的语音通信辅助方法的步骤。
14.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至6任一项所述的语音通信辅助方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110113656.4A CN112908335B (zh) | 2021-01-27 | 2021-01-27 | 语音通信辅助方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110113656.4A CN112908335B (zh) | 2021-01-27 | 2021-01-27 | 语音通信辅助方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112908335A true CN112908335A (zh) | 2021-06-04 |
CN112908335B CN112908335B (zh) | 2024-04-23 |
Family
ID=76119136
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110113656.4A Active CN112908335B (zh) | 2021-01-27 | 2021-01-27 | 语音通信辅助方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112908335B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004357092A (ja) * | 2003-05-30 | 2004-12-16 | Casio Comput Co Ltd | 情報機器、デジタルカメラおよびデータ表示方法 |
CN103621119A (zh) * | 2011-06-21 | 2014-03-05 | 雅虎公司 | 用于向计算设备的用户呈现语音消息信息的系统和方法 |
CN105320736A (zh) * | 2014-07-31 | 2016-02-10 | 三星电子株式会社 | 用于提供信息的装置和方法 |
CN107104887A (zh) * | 2017-06-01 | 2017-08-29 | 珠海格力电器股份有限公司 | 一种即时消息提醒方法、装置及其用户终端 |
CN109274814A (zh) * | 2018-08-20 | 2019-01-25 | 维沃移动通信有限公司 | 一种消息提示方法、装置及终端设备 |
CN111369994A (zh) * | 2020-03-16 | 2020-07-03 | 维沃移动通信有限公司 | 语音处理方法及电子设备 |
-
2021
- 2021-01-27 CN CN202110113656.4A patent/CN112908335B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004357092A (ja) * | 2003-05-30 | 2004-12-16 | Casio Comput Co Ltd | 情報機器、デジタルカメラおよびデータ表示方法 |
CN103621119A (zh) * | 2011-06-21 | 2014-03-05 | 雅虎公司 | 用于向计算设备的用户呈现语音消息信息的系统和方法 |
CN105320736A (zh) * | 2014-07-31 | 2016-02-10 | 三星电子株式会社 | 用于提供信息的装置和方法 |
CN107104887A (zh) * | 2017-06-01 | 2017-08-29 | 珠海格力电器股份有限公司 | 一种即时消息提醒方法、装置及其用户终端 |
CN109274814A (zh) * | 2018-08-20 | 2019-01-25 | 维沃移动通信有限公司 | 一种消息提示方法、装置及终端设备 |
CN111369994A (zh) * | 2020-03-16 | 2020-07-03 | 维沃移动通信有限公司 | 语音处理方法及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112908335B (zh) | 2024-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10795944B2 (en) | Deriving user intent from a prior communication | |
US8117178B2 (en) | Natural language based service selection system and method, service query system and method | |
CN113285815B (zh) | 群聊场景下的人员统计、加入群组方法、装置及设备 | |
JP6730994B2 (ja) | 問答情報の処理方法、装置、記憶媒体及び装置 | |
JP2006092473A (ja) | 回答支援システムおよび装置、回答支援プログラム | |
CN112434501B (zh) | 工单智能生成的方法、装置、电子设备及介质 | |
CN102708454A (zh) | 终端故障解决方案提供方法及装置 | |
CN108062316A (zh) | 一种辅助客户服务的方法和装置 | |
CN101193069A (zh) | 信息查询系统、即时通信机器人服务器及信息查询方法 | |
CN110347848A (zh) | 一种演示文稿管理方法及装置 | |
CN112291423A (zh) | 通信呼叫智能应答处理方法、装置、电子设备及存储介质 | |
CN111563037B (zh) | 基于测试试题的测试优化方法及装置、存储介质、终端 | |
CN114117012A (zh) | 一种智能推荐方法、装置、设备和可读存储介质 | |
CN113138702B (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN108509582B (zh) | 一种信息的回复方法、终端设备及计算机可读存储介质 | |
CN106911562B (zh) | 一种用于即时通信中的信息校正提示方法及其装置 | |
CN101119339B (zh) | 即时通信系统中建立多用户讨论组的方法及装置 | |
CN112908335A (zh) | 语音通信辅助方法、装置及电子设备 | |
KR100707725B1 (ko) | 자동완성 질의어 제공 시스템, 방법 및 상기 방법을실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한기록 매체 | |
CN114202363B (zh) | 基于人工智能的话术调用方法、装置、计算机设备及介质 | |
CN112416143B (zh) | 文本信息编辑方法、装置和电子设备 | |
CN113489833B (zh) | 信息播报方法、装置、设备及存储介质 | |
CN114398127A (zh) | 消息显示方法及其装置 | |
KR100782556B1 (ko) | 질의어 자동완성 서비스 방법 및 상기 방법을 수행하는서버 | |
CN115243062B (zh) | 场景展示方法、装置、屏显设备、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |