CN109309751B

CN109309751B - 语音记录方法、电子设备及存储介质

Info

Publication number: CN109309751B
Application number: CN201710652825.5A
Authority: CN
Inventors: 佟林; 杜育璋
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2017-07-28
Filing date: 2017-07-28
Publication date: 2021-08-06
Anticipated expiration: 2037-07-28
Also published as: CN109309751A

Abstract

本发明实施例公开了一种语音记录方法、电子设备及存储介质。所述一种语音记录方法，应用第一用户终端中，包括：采集语音信息；获取与所述语音信息的语义识别结果相适配的记录信息；其中，所述记录信息包括：至少部分所述语义识别结果，所述记录信息还包括：关联信息和/或操作控件；所述关联信息为与所述语义识别结果相关的信息；所述操作控件，用于检测至少针对于所述记录信息的第一类预设操作；显示所述记录信息。

Description

语音记录方法、电子设备及存储介质

技术领域

本发明涉及通信技术领域，尤其涉及一种语音记录方法、电子设备及存储介质。

背景技术

在进行语音通话的时候，可能为了方便后续再次重温通话内容，一般会采用录音的方式的录制下语音通话的通话内容，形成音频文件。在还有一些情况下，用户不方便利用笔纸进行文字记录，例如，在开车的时候，仅能利用录音录制下当前产生的灵感，以方便后续查阅。这两种录音形成后，在查阅时，调出对应的音频文件并播放音频文件。

这种语音的记录方法，虽然可以实现用户的后续查阅。但是存在以下问题：

第一方面，用户需要查看对应的通话内容，可能需要在整个音频文件中进行查找，查找效率低。

第二方面，查阅的内容仅限于通话内容自身。

第三方面，在进行语音的记录过程中，用户不能干预，录音效果完全取决于当前的通话质量及录音效果等。

故现有技术中，对语音通话的记录方法，存在记录效果差、不方便查阅、信息内容无法智能调整等不能达到预期记录效果等问题。

发明内容

有鉴于此，本发明实施例期望提供一种语音记录方法、电子设备及存储介质，至少解决上述问题之一。

为达到上述目的，本发明的技术方案是这样实现的：

第一方面，本发明实施例提供一种语音记录方法，应用第一用户终端中，包括：

当所述第一用户终端进行语音通话时，启动录音以采集所述语音通话的语音信息；

获取与所述语音信息的语义识别结果相适配的记录信息；其中，所述记录信息包括：至少部分所述语义识别结果；关联信息和/或操作控件；

其中，所述关联信息为与所述语义识别结果相关的信息；所述操作控件，用于检测至少针对于所述记录信息的第一类预设操作，所述第一类预设操作包括以下至少之一：删除记录信息、存储记录信息；

当所述语音通话未完成时，将新产生的所述记录信息以记录卡片的形式插入到信息队列中展示；

当所述语音通话完成时，以记录卡片的形式显示所述记录信息；

其中，所述记录卡片包括以下至少之一：通话日期、通话时间、联系人。

第二方面，本发明实施例提供一种语音记录方法，应用于服务器中，包括：

当第一用户终端进行语音通话时，从所述第一用户终端采集由所述第一用户终端录音形成的所述语音通话的语音信息；

识别所述语音信息获得语音识别结果；

对所述语音识别结果进行语义识别，获得语义识别结果；

向所述第一用户终端发送与所述语义识别结果相适配的记录信息，或向所述第一用户终端发送生成所述记录信息的模板信息、所述语义识别结果及生成记录卡片的卡片模板，用于当所述第一用户终端未完成所述语音通话时，将新产生的所述记录信息以记录卡片的形式插入到信息队列中展示，还用于当所述语音通话完成时，以记录卡片的形式显示所述记录信息；

其中，所述记录卡片包括以下至少之一：通话日期、通话时间、联系人；所述记录信息包括：至少部分所述语义识别结果；关联信息和/或操作控件；

其中，所述关联信息为与所述语义识别结果相关的信息；所述操作控件，用于检测至少针对于所述记录信息的第一类预设操作，所述第一类预设操作包括以下至少之一：删除记录信息、存储记录信息。

第三方面，本发明实施例提供一种电子设备，所述电子设备为第一用户终端，包括：

采集单元，用于当所述第一用户终端进行语音通话时，启动录音以采集所述语音通话的语音信息；

获取单元，用于获取与所述语音信息的语义识别结果相适配的记录信息；其中，所述记录信息包括：至少部分所述语义识别结果；关联信息和/或操作控件；其中，所述关联信息为与所述语义识别结果相关的信息；所述操作控件，用于检测至少针对于所述记录信息的第一类预设操作，所述第一类预设操作包括以下至少之一：删除记录信息、存储记录信息；

显示单元，用于当所述语音通话未完成时，将新产生的所述记录信息以记录卡片的形式插入到信息队列中展示；当所述语音通话完成时，以记录卡片的形式显示所述记录信息；其中，所述记录卡片包括以下至少之一：通话日期、通话时间、联系人。

第四方面，本发明实施例提供一种电子设备，所述电子设备为服务器，包括：

接收单元，用于当第一用户终端进行语音通话时，从所述第一用户终端采集由所述第一用户终端录音形成的所述语音通话的语音信息；

语音识别单元，用于识别所述语音信息获得语音识别结果；

语义识别单元，用于对所述语音识别结果进行语义识别，获得语义识别结果；

发送单元，用于向所述第一用户终端发送与所述语义识别结果相适配的记录信息，或向所述第一用户终端发送生成所述记录信息的模板信息、所述语义识别结果及生成记录卡片的卡片模板，用于当所述第一用户终端未完成所述语音通话时，将新产生的所述记录信息以记录卡片的形式插入到信息队列中展示，还用于当所述语音通话完成时，以记录卡片的形式显示所述记录信息；其中，所述记录卡片包括以下至少之一：通话日期、通话时间、联系人；所述记录信息包括：至少部分所述语义识别结果；关联信息和/或操作控件；所述关联信息为与所述语义识别结果相关的信息；所述操作控件，用于检测至少针对于所述记录信息的第一类预设操作，所述第一类预设操作包括以下至少之一：删除记录信息、存储记录信息。

第五方面，本发明实施例提供一种电子设备，包括：存储器、处理器及存储在所述存储器上并由所述处理器运行的计算机程序；

所述处理器，与所述存储器连接，通过运行所述计算机程序，实现前述一个或多个技术方案提供的语音记录方法。

第六方，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序；所述计算机程序被执行后，能够实现前述一个或多个技术方案提供的语音记录方法。

本发明实施例提供的语音记录方法、电子设备及存储介质，在进行语音记录时，不再局限于录音形成音频格式的语音信息，而是会进行语音识别及语义识别获得与语义识别结果获得可直接显示的记录信息。

第一方面，本发明实施例中的记录信息是可显示的信息。通过记录信息的输出，方便用户通过观看方式，快速通过翻页等查询到对应的记录内容，是一种非音频方式的记录，从而提升了后续用户查看的速率，简化了查看。

第二方面，在一些情况下，在所述记录信息不仅显示有至少部分语音识别结果，还可包括与语义识别结果关联的关联信息，这样的语音记录，实现了语音记录的信息拓展。

第三方面，在另一些情况下，所述记录信息还会显示有操作控件，可以满足用户存储、删除或转发这些记录信息的用户操作，这样满足了用户对记录信息的控制需求，从而方便用户整个语音记录的控制，提升了用户对用户终端的使用满意度。

附图说明

图1为本发明实施例提供的一种语音记录系统的结构示意图；

图2为本发明实施例提供的一种电子设备的结构示意图；

图3为本发明实施例提供的第一种语音记录方法的流程示意图；

图4为本发明实施例提供的第一种记录信息的显示效果示意图；

图5为本发明实施例提供的第二种记录信息的显示效果示意图；

图6为本发明实施例提供的第三种记录卡片的显示效果示意图；

图7为本发明实施例提供的第二种语音记录方法的流程示意图；

图8为本发明实施例提供的一种启动提示的显示效果示意图；

图9为本发明实施例提供的第四种记录信息的显示效果示意图；

图10为本发明实施例提供的第五种记录信息的显示效果示意图；

图11为本发明实施例提供的第三种语音记录方法的流程示意图；

图12为本发明实施例提供的第四种语音记录方法的流程示意图；

图13为本发明实施例提供的一种第一用户终端的结构示意图；

图14为本发明实施例提供的一种服务器的结构示意图；

图15为本发明实施例提供的另一种电子设备的结构示意图；

图16为本发明实施例提供的一种语音通话记录方法的流程示意图；

图17为本发明实施例一种语用数据库的训练流程示意图。

具体实施方式

以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所提供的实施例仅仅用以解释本发明，并不用于限定本发明。另外，以下所提供的实施例是用于实施本发明的部分实施例，而非提供实施本发明的全部实施例，在不冲突的情况下，本发明实施例记载的技术方案可以任意组合的方式实施。

对本发明进行进一步详细说明之前，对本发明实施例中涉及的名词和术语进行说明，本发明实施例中涉及的名词和术语适用于如下的解释。

1)用户终端：在用户侧运行应用客户端的设备，可以为台式机电脑、电视机顶盒、Xbox/PS3游戏机、户外广告展示屏等固定终端；也可以为智能手机、笔记本电脑、平板电脑和车载广告展示屏等移动终端。移动终端又可以分为由人便携的，例如，手机或可穿戴设备等人载终端，或安装在交通工具上的车载终端。

2)采集语音信息，可包括：收集已经采集语音数据；也可以是通过开启麦克风等方式通过录音采集获得所述语音信息。若是通过录音的方式采集语音数据，可能会会形成录音文件，该录音文件为一种音频文件，录音文件内包括：采集的语音等语音信号的音频信息。

3)语音识别：利用终端或服务器等机器设备，将语音信号转换成文本信号的技术。例如，将采集的用户语音转换成对应的文本语音，典型的语音识别应用包括：iphone手机中的siri应用。

4)语义识别：对文本内容进行自然语音处理，从而提取出自然语言的角度对应的语义意图或语义内容。例如，当前文本为“武汉大学生”，可以通过语义识别，确定出该文本表达的具体是武汉的大学生，还是武汉大学的学生等。

5)语音助理：一种采集语音并识别语音的应用，可以通过语音采集、语音识别及语义识别，提取出用户的语音意图，并执行与语义意图相关的操作，例如，控制用户终端执行对应的操作。这里的操作，可包括：自动发起呼叫请求等。

6)移动笔记应用：在手机、电脑或等用户终端设备上的一种记录电子比较的应用程序，通常通过插件，方便用户输入、记录文字或语音，通过特定方式，满足用户的记录需求。

7)模板信息：为基于语义识别结果生成所述记录信息的一种参考信息。所述模板信息可包括：记录信息包括的信息类型，例如，该信息类型可用于指示是否包括关联信息、是否生成对应的操作控件。所述模板信息还可包括：记录信息中各类型的信息。例如，语义识别结果、关联信息及操作控件的分布参数等。所述模板信息可包括：卡片模板；该卡片模板可用于生成组成记录信息的记录卡片。具体如，所述卡片模板：为定义了数据结构的一种模板信息。在本发明实施例中，卡片模板，用于生成记录卡片。所述数据结构定义了记录卡片生成后可包括的内容类型、各内容之间的分布等记录卡片的属性。

8)记录卡片：采用预定数据结构的卡片模板，结合特定内容产生的图像界面或图像。在本实施例中，所述特定内容可包括语义识别结果。所述卡片模板，会采用特定的输出格式，形成所述图形界面。

9)语音通话：通信双方或多方进行语音数据包交互的通信。所述语音数据可包括：基于用户输入的语音产生的语音信号的数据包。所述语音通话，可包括：移动通信中的基于电路域的语音通话，还可包括：基于分组交换域的语音通话。例如，所述语音通话可包括：实时通信的语音通话，和即时通信的语音通话。所述实时通信可包括：手机传统的通话。所述即时通信可包括：基于微信、QQ或其他即时通信工具的语音通话。

参见图1示出的本发明实施例提供的语音记录系统10的一个可选的架构示意图，在图1中，包括：用户侧的用户终端11、用户终端12、用户终端13、及网络侧的服务器14，以下结合图1对语音记录系统10的拓扑结构进行说明。

在一些实施例中，服务器14可以直接基于录音形成结构化笔记返回给终端。在另一些实施例中，所述服务器可提供录音的语音和/或语音识别功能，也可以为用户终端提供语音及语义识别的辅助支持，协助用户终端提供精确的语音及语义识别，从而生成用户所需求的记录卡片。

本发明实施例还提供实施应用上述语音记录方法的用户终端或服务器的电子设备。在硬件层面上，示例性地，电子设备包括：计算资源(如处理器)和通信资源(如网络接口)实现，在软件层面上，电子设备可以实施为存储介质中的可执行指令(包括诸如程序、模块之类的计算机可执行指令)。

如上所述，参见图2示出的电子设备140的一个可选的软硬件结构示意图，电子设备140包括硬件层、中间层、操作系统层和软件层。然而，本领域的技术人员应当理解，图2示出的电子设备140的结构仅为示例，并不构成对电子设备140结构的限定。例如，电子设备140可以根据实施需要设置较图3更多的组件，或者根据实施需要省略设置部分组件。

电子设备140的硬件层包括处理器141、输入/输出接口143，存储介质144以及网络接口142，组件可以经系统总线连接通信。

处理器141可以采用中央处理器(CPU)、微处理器(MCU，Microcontroller Unit)、专用集成电路(ASIC，Application Specific Integrated Circuit)或逻辑可编程门阵列(FPGA，Field－Programmable Gate Array)实现。

输入/输出接口143可以采用如显示屏、触摸屏、扬声器等输入/输出器件实现。

存储介质144可以采用闪存、硬盘、光盘等非易失性存储介质实现，也可以采用双倍率(DDR，Double Data Rate)动态缓存等易失性存储介质实现，其中存储有用以执行上述信息处理方法的可执行指令。

网络接口142向处理器141提供外部数据如异地设置的存储介质144的访问能力，示例性地，网络接口142可以基于近场通信(NFC，Near Field Communication)技术、蓝牙(Bluetooth)技术、紫蜂(ZigBee)技术进行的近距离通信，另外，还可以实现如基于码分多址(CDMA，Code Division Multiple Access)、宽带码分多址(WCDMA，Wideband CodeDivision Multiple Access)等通信制式及其演进制式的通信。

驱动层包括用于供操作系统146识别硬件层并与硬件层各组件通信的中间件145，例如可以为针对硬件层的各组件的驱动程序的集合。

操作系统146用于提供面向用户的图形界面，示例性地，包括插件图标、桌面背景和应用图标，操作系统146支持用户经由图形界面对设备的控制本发明实施例对上述设备的软件环境如操作系统类型、版本不做限定，例如可以是安卓操作系统、iOS操作系统、Linux操作系统或UNIX操作系统等。

利用如图1所示的语音记录系统或图2所示的电子设备，可执行如图3所示的语音记录方法。所述语音记录方法可应用第一用户终端中，包括：

步骤S110：采集语音信息；

步骤S120：获取与所述语音信息的语义识别结果相适配的记录信息；其中，所述记录信息包括：至少部分所述语义识别结果，所述记录信息还包括：关联信息和/或操作控件；

进一步的，所述关联信息为与所述语义识别结果相关的信息；所述操作控件，用于检测至少针对于所述记录信息的第一类预设操作；

步骤S130：显示所述记录信息。

在本实施例中所述第一用户终端可为手机、平板电脑、可穿戴式设备或车载终端等。

在步骤S110中第一用户终端可开启音频采集设备(开启麦克风)，例如，通过语音助理的应用开启，触发硬件层音频采集设备的开启，采集用户输入的语音。这里的采集的语音，可为用户从人机交互接口输入的语音，也可以是第一用户终端自行采用音频输出设备输出的语音。在另一些实施例中，所述第一用户终端，还可以直接通过拦截第二用户终端发送的语音数据包，形成所述语音信息。总之，在步骤S110中，第一电子设备采集语音，形成包括语音信号的语音信息。

例如，用户A可以通过滑动操作等方式触发第一用户终端启动笔记应用，笔记应用开启之后，检测到用户输入的语音，则形成包括语音信号的录音文件。

在步骤S120中第一用户终端会获取与所述语音信息的语义识别结果相对应的记录信息。这里的记录信息是一种可显示的显示信息，而非音频信息，这样后续可以通过显示的方式供用户查阅。

所述记录信息，包括：对语音信息进行语义识别的至少部分语音识别结果。与此同时，所述记录信息还会包括关联信息及操作控件的至少其中之一。

关联信息为并非所述语音信息的直接识别结果，或文本转换，而是与语音识别结果有对应关联关系的关联信息，通常，所述关联信息包括：生成所述记录卡片的电子设备基于搜索产生的搜索信息。例如，当语音识别结果中包括：某一个地理位置时，所述关联信息可包括：显示所述地理位置的地图信息。在该地图上通常除了显示有该地理位置以外，还可能显示有该地理位置的周边位置的信息。

例如，如图4所示。语义识别结果中包括地理位置(中关村)，而关联信息可为显示有中关村的地图。

再例如，如图5所示，语义识别结果中包括：今天的天气；而关联信息中包括：从天气服务器搜索到的对应日期的天气信息。该天气信息可包括：当前温度、当前最高温度、当天最低温度、当前是晴雨情况等。

总之，在本实施例中，所述关联信息为基于语义识别结果产生的信息，但是并不仅是包括语义识别结果信息。

在图4和图5所示的记录信息中包括：语义识别结果、关联信息及操作控件。

图6是另一种记录信息，在该记录信息中包括：语义识别结果及关联信息，但是并没有包含操作控件。需要对图6所示的记录信息进行操作时，可以利用第一用户终端的操作系统提供的系统控件，或者，对应应用提供的应用控件，对所述记录信息进行操作。例如，通过应用层的对话框，删除、修改或存储对应的记录信息。而包括在记录信息自身内部的操作控件不同于系统控件和应用控件的空间。

在一些实施例中，所述记录信息以记录卡片的形式呈现。该记录卡片是采用特定的卡片模板产生的。所述卡片模板对应于特定数据结构或特定输出结构。在本实施例中，所述记录卡片，包括：对语音信息进行语义识别的至少部分语义识别结果。总之，所述记录卡片按照卡片模板展示有至少部分所述语义识别结果，还展示有所述关联信息和/或所述操作控件。故所述步骤S120可包括获取基于所述语音信息的语义识别结果产生的记录卡片。

所述记录卡片可能是展示有：部分或全部语义识别结果及关联信息的图片；也可能是包括：部分或全部语义识别结果及操作控件，或者是，部分或全部语义识别结果及关联信息及操作控件的图像操作界面。

所述操作控件可包括检测用户操作的检测图形。例如，将所述记录信息显示在触摸屏上，当检测到用户作用于所述操作控件显示位置的选择操作时，执行与所述操作控件内显示的操作对应的第一类预设操作，例如，删除控件，通常会显示“删除”字样，若检测到作用于删除控件的点击操作或滑动操作等选择操作时，会对所述记录信息执行删除操作。

例如，修改控件，通常会显示“修改”字样，若检测到作用于修改控件的操作时，会控制所述记录信息从非编辑模式进入到编辑模式，第一用户终端根据用户的输入，修改记录信息的显示内容，例如，修改语义识别结果、修改关联信息等。

在本实施例中所述第一类预设操作可包括：针对记录卡片整体的预设操作，例如，删除记录信息、存储记录信息、修改记录信息、转发记录信息、共享记录信息。通常转发记录信息，可为将记录信息发送给特定对象；共享记录信息，可以为在社交应用上(例如，微信朋友圈、微博页面或论坛内)进行展示，从而方便不特定用户的查看。

首先，在本实施例中，所述记录信息可以是一种图形界面，是可供显示的信息，并非音频文件仅能够通过音频输出的方式进行输出的信息。这样用户在查看具体的录音内容时，不用通过录音播放和定位找到自己想要的文字，可以快速显示信息的显示翻页等方式，找到自己想要部分的记录信息。

其次，当所述记录信息包括有关联信息时，用户不仅可以通过记录信息的查阅，查看当时通话或录音的相关内容，还可以通过记录信息的查阅获得部分关联信息。

再次，当所述记录信息包括有操作控件时，用户可以直接通过作用于对应的操作控件，对该记录信息进行对应的操作，从而增强了用户对录音的记录信息的可控性，可满足用户的不同需求。

获取所述记录卡片的方式有多种，以下提供几种可实现方式：

纯远程方式，如图7所示，所述步骤S120可包括：

步骤S121：将所述语音信息发送给服务器；

步骤S122：接收所述服务器返回的与所述语义识别结果相适配的记录信息，例如，所述记录信息可包括：记录卡片。

纯本地方式，所述步骤S120可包括：

所述第一用户终端自动对所述语音信息获得语音识别结果；

对所述语音识别结果进行语义识别，获取语义识别结果；

根据所述语义识别结果生成的记录信息，例如，基于与所述语义识别结果适配的卡片模板，生成所述记录卡片。

基于优先权及当前状况信息的优先选择方式，所述步骤S120可包括：

以第一优先级采用纯本地方式进行语音识别及语义识别并提供记录信息，以第二优先级采用纯远程方式进行语音识别及语义识别，并提供的记录信息。

例如，所述第二优先级低于所述第一优先级，则优先采用所述纯本地方式进行语音识别及语义识别，若出现语音识别及语义识别的至少其中之一的异常或无法识别时，采用纯远程方式，将原始的语音信息发送给服务器，由识别功能更加强大的语音服务器，进行远程的语音及语义识别，并提供对应的记录信息。

再例如，第二优先级高于第一优先级时，即优先以纯远程方式进行语音及语义识别并给出记录信息，若出现第一用户终端的网络连接异常等无法连接到网络侧的服务器，或者，网络侧的服务器因为负载率过高拒绝执行远程的语音及语义识别等操作的服务器拒绝操作时，所述第一用户终端采用纯本地方式，识别出所述语音信息的语义，并形成对应的记录信息。

远程识别及本地生成的联合方式，所述步骤S120可包括：

将所述语音信息发送给服务器；

接收所述服务器返回的语义识别结果与所述语义识别结果对应的模板信息；

结合所述语义识别结果及所述模板信息生成所述记录信息，例如，基于卡片模板生成记录卡片等。

语音识别及语义识别由所述服务器完成，且模板信息的选择也是由所述服务器完成，所述服务器完成所述语音语义识别及模板信息的选择之后，可以将所述模板信息及语义识别结果返回给所述第一用户终端，由用户终端基于服务器提供的语义识别结果及模板信息，在本地生成所述记录信息。

故综上所述，所述方法还包括：

获取所述第一用户终端的当前状态信息，其中，所述当前状态信息用于指示所述第一用户终端的网络连接状态、负载状态及可用带宽状态的至少其中之一；确定与所述当前状态信息相适配的获取方式；

所述步骤S120可包括：利用与当前状态信息相适配的获取方式来获取所述记录信息，例如，所述步骤S120可包括：利用所述获取方式，获取所述语义识别结果并获取所述关联信息和/或所述操作控件。

这里的获取方式包括：纯本地方式、纯远程方式、基于优先权及当前状况信息的优先选择方式或所述联合方式。

例如，所述纯远程方式及联合方式，所述第一用户终端必须有网络连接，或者，网络连接可提供的带宽至少大于阈值等。

若检测到当前第一用户终端是可通过WiFi连接到网络的，若采用远程方式，不需要消耗手机的数据流量，可以选择所述远程方式、联合方式的中的一种进行所述记录信息的获取。

所述负载状况信息可为负载率或负载量等。当所述负载率或负载量超于预定阈值时，可以采用远程方式，若低于预定阈值时可以采用本地方式。

在步骤S110中采集的语音可为：采集用户专门收集的语音，也可以是自动开启后随机采集的语音。在本实施例中采集的语音可为：第一用户终端和第二用户终端进行语音通话时产生的语音。故所述步骤S110可包括：

当所述第一用户终端与第二用户终端进行语音通话时，监听所述语音通话，以形成所述语音信息。

例如，当所述第一用户终端主动发起与第二用户终端进行语音通话的通话请求或接收到第二用户终端的呼叫请求时，所述第一用户终端自动启动语音助理或者基于用户操作启动所述及语音助理，从而所述第一用户终端进入语音通话的监听状态。在本实施例中，此时采集的语音信息可为第一用户终端本地的语音，还可以包括第二用户终端采集的语音，通过语音通话链路传输到第一用户终端后，第一用户终端输出第二用户终端提供的语音数据包形成的录音。在还有些实施例中，所述步骤S110可包括：直接提取第二用户终端发送的语音数据包，作为被监听的结果，形成所述语音信息。故此时，形成的语音信息可包括：本地采集的本地用户的输入语音，还可包括：第二用户终端发送的语音数据包。

在本实施例中所述语音信息可包括：按照一定时序关系产生的语音信号。所述语音识别可包括：

利用滑动时间窗按照时间先后顺序截取语音信号，并识别截取的语音信号，得到语音信号对应的识别文本；这里得到的识别文本在时序上与语音信号的时序具有对应关系。

以滑动识别窗的滑动步长截取所述识别文本，进行语义意图的提取，获得所述语义识别结果。

例如，所述滑动识别窗包括N个字符；所述滑动步长可为n个字符，其中，所述n和N均为正整数；所述n不大于所述N，取值可为1或2等。在一次语音识别过程中，可以以不同滑动步长进行滑动识别窗的移动，从而获得多种不同的语义识别结果。

当得到的语义识别结果可能有多种，利用概率模型，通过对语义识别结果的信息处理，可以得到可信度概率最高的语义识别结果，作为生成所述记录卡片的依据。

所述概率模型可为利用样本语音和对应的语音意图进行样本训练，产生的向量机识别模型，和/或，神经网络等。在本实施例中，这些识别模型以所述识别文本为输入，在输出包括语义意图的语义识别结果时，还输出表征可信度的概率。该概率可包括：正概率和/或负概率。所述正概率为指示可信的概率，所述负概率可为指示不可信的概率。最后可以结合每一种语义识别结果，选择出正概率最高的语义识别结果作为最终识别结果，或选择出负概率最低的语义识别结果作为最终语义识别结果，或者，按照一定的函数关系以所述正概率及负概率进行函数值计算，根据函数值选择所述最终识别结果。例如，所述函数关系可为Ap1-Bp2。所述p1为正概率；所述p2为负概率；所述A可为对应正概率输出模型的精确度匹配的权值；所述B可为与负概率输出模型的精确度匹配的权值。选择函数值最大的语义识别结果作为所述最终识别结果。当然，以上仅是语音识别及语义识别的举例，具体实现时，不局限于上述任意一种。

图8所示为一种第一用户终端接收到第二用户终端的呼叫请求时，所述第一用户终端显示语音助理的启动提示的显示示意图。在图8中展示的启动提示为：“是否开启智能笔记？”。这里的智能笔记可为包括语音助理的一种应用。

故本实施例所述的方法还包括：

当检测到所述第一用户终端向所述第二用户终端发起呼叫请求，或接收到第二用户终端的呼叫请求时，显示语音助理的启动提示；

检测针对于所述启动提示的第三类用户操作；

执行与所述第三类用户操作的语音助理的启动或屏蔽启动操作。

在一些实施例中，所述启动提示优选为显示在所述语音通话的呼叫页面或接听页面的提示信息，所述提示信息可为对话框等。

这里的语音通话，可包括：传统的实时语音通话，还可包括基于即时通信的语音通话，例如，可为基于网络协议多媒体子系统(Internet protocol Multimedia Subsystem，IMS)的语音业务(Voice of Long Term Evolution，VoLTE)通话。

在本实施例中，所述语音信息源于语音通话时，则所述记录卡片的显示可以分为两个阶段。

第一阶段，所述步骤S130可包括通话中显示；所述通话中显示可如下：

在所述语音通话过程中，在显示屏的第一区域显示控制所述语音通话的操作界面；并在所述显示屏的第二区域显示所述记录信息。

在本实施例中的通话中显示，一方面为了方便用户控制语音通话，另一方面为了方便用户查看和/或操作所述记录卡片，将所述语音通话的操作界面和所述记录卡片分区域显示在第一用户终端上。具体可如9或如图10所示。在图9及图10所示的同时显示操作界面及记录信息的示意图。在图9及图10所示的操作界面中显示语音通话的挂断控件。在该操作界面上还显示有与第一用户终端的第二用户终端的通信号码及通话时长等通话信息。在图9和图10所示的界面上显示有则作为所述记录信息一种的记录卡片，该记录卡片上展示有关联信息，关联信息可以作为记录卡片的一个子卡片呈现。

第二阶段，所述步骤S130还可包括通话后显示，所述通话后显示可如下：

在所述语音通话结束后，基于查看操作显示所述记录信息。

通话后显示的显示效果图可如图6所示，还可以如图4和图5所示。

在一些实施例中，显示所述记录信息可以仅包括：通话中显示或通话后显示，还可包括两者。

所述查看操作，可以为通话后在操作系统的系统页面或通话应用的应用界面检测到查看操作。

可选地，所述方法还包括：

检测作用于所述操作控件的第一类预设操作，其中，所述操作控件，包括：存储所述记录卡片的存储控件、修改所述记录卡片的显示内容的修改控件、删除所述记录卡片的删除控件及转发所述记录卡片的转发控件的至少其中之一；

当检测到所述第一类预设操作时，对所述记录卡片执行所述第一类预设操作。

在本实施例中在显示所述记录信息时，显示包括有操作控件的记录卡片，并检测组用于所述操作控件的第一类操作，当检测第一类操作对记录信息执行对应的操作。例如，在通话中显示所述记录信息，用户在通过蓝牙耳机或有线耳机或外放进行通话时，同时可以通过点击操作等输入作用于所述操作控件的第一类操作，从而确定当前第一用户终端是否需要将所述记录信息存储到特定位置，方便后续查看。若不存储，当前位于内存空间内的记录信息可能会被丢弃掉，或者，在预定显示时长内未检测到用户针对于所述操作控件的第一类操作，则默认将所述结构化存储到所述特定位置。若通话过程中执行了存储操作或未执行删除操作，则可以在通话后进行查看，从而所述步骤S130会执行通话后显示。

可选地，所述方法还包括：

根据所述记录信息的产生时间，生成信息队列；

所述步骤S130可包括：

根据所述记录卡片在所述信息队列中的位置，依次显示所述记录信息，例如，在语音通话时，保持语音通话的操作界面显示不变的同时，按照一定的切换策略切换显示屏上显示的记录信息，可选地，切换记录卡片的显示等。

在本实施例中若一次性生成的记录信息包括多条时，为了方便对记录信息的管理和维护，会产生信息队列，所有的记录信息位于信息队列中。根据记录信息在信息队列的位置，依次进行显示。在一些实施例中，一条所述记录信息对应于一个所述记录卡片。

在步骤S130中可以自动切换记录信息的显示，例如，对每一条记录信息进行显示计时，当对应的记录信息的显示时长达到预定时长时，则显示信息队列中的下一条记录信息，例如，下一张记录卡片。在一些实施例中，所述记录信息的显示可以在所述信息队列中所有记录信息都显示完毕之后结束。在一些实施例中，所述信息队列可为循环队列，在步骤S130中若当前完成了当前显示的记录信息的显示，则下一条显示的记录信息为位于所述信息队列的队头的记录信息，且当前显示的记录信息再次压入到信息队列的队尾，从而方便用户循环查看所述记录信息。

在一些实施例中，在显示屏的第二显示区域显示所述记录信息，可包括：

检测针对于所述记录卡片的第一类操作，若检测到对应的第一类操作之后，结束当前显示的记录信息的显示，切换到信息队列中下一张记录信息的显示。所述第一类操作可包括作用于记录信息自身携带的操作控件上的操作，还可以通过第一用户终端的系统控件或应用层控件或实体按键检测的对整个记录信息实行对应操作的用户指示的操作。

例如，所述方法还包括：当检测到用户输入的存储操作时，则存储对应的记录信息，在完成当前显示的记录信息之后，显示所述信息队列中的下一条记录信息。值得注意的是，这里的存储记录信息的存储操作，可为在第一用户终端的本地存储所述记录信息，也可以是在第一用户终端运行的应用账号对应的应用服务器中存储所述记录信息。当远程存储时，向应用服务器连接，向所述应用服务器发送所述记录信息，供所述应用服务器存储所述记录信息，方便后续第一用户终端远程查询所述记录信息。

再例如，所述方法还包括：当检测到用户输入的删除操作时，将当前显示的记录信息删除，并在删除当前显示的记录信息后，显示信息队列中的下一张记录信息。

又例如，所述方法还包括：当检测到用户输入的转发操作后，将当前显示的记录信息转发给特定对象，并结束其在第一用户终端的显示，并切换到信息队列的下一条记录信息的显示。

总之，本实施例中当出现多条记录信息时，形成信息队列，基于信息队列依次显示所述记录信息，减少记录信息的随机显示的无序性，提升用户查看记录信息的用户体验。

进一步地，所述记录信息中包括的至少部分语义识别结果包括：与生成所述信息的模板信息相适配的关键语句，例如，与生成记录卡片的卡片模板对应的关键语句；所述关联信息至少包括：语音的输出主体、与所述关键语句相适配的搜索信息及所述记录卡片的产生时间的至少其中之一。

在一些实施例中，所述第一用户终端或网络侧都设置有关键语句数据库，所述关键语句数据库包括：预先定义的关键语句；所述关键语句可包括：关键字、关键词、以及关键字和关键词组成的关键句。在本实施例中，所述关键语句可为包括：关键子、关键词或关键句的语句。

在本实施例中若“天气”为位于关键语句数据库中的关键词，当语音信息中包括“天气”的语音信号，通过语音识别，发现语音信息中包括“天气”这一个关键词的语句，则为所述关键语句。通过对关键语句的语义意图的提取，可以得到关键语句作为所述语义识别结果的一部分。在本实施例中位于记录卡片中的至少部分语义识别结果，可包括所述关键语句。

所述关联信息可为与所述关键语句具有关联关系的各种信息。

所述语音的输出主体，可为通过声纹识别获得的。例如，第一用户和第二用户在进行通话，所述语音信息中同时包括第一用户和第二用户的语音的语音信息。这时需要去区分语音的输出主体，可以在进行语音识别之前，进行声纹识别，通过对应语句的声纹特征的提取，声纹特征与预先与用户具有匹配关系的预定声纹特征的匹配，可以由第一用户终端或服务器，识别出语音信息中每一个语句的输出主体。该输出主体作为记录卡片包括的信息之一显示。

在一些实施例中，若所述语音信息仅来自一个用户(即一个输出主体)，则所述记录卡片可以不包括所述语音的输出主体。

在还有一些实施例中，第一用户终端在形成语音信息时，为了简化自身或服务器的对输出主体的识别，会在语音信息中根据录音来源进行标记，后续，第一用户终端或服务器可以根据所述标记区分输出主体。例如，语音信息包括：麦克风采集的本地语音，则利用第一标记对应的语音数据包。又例如，语音信息包括的数据包是从第二用户终端接收的，利用第二标记进行标记。这样后续第一用户终端或服务器，基于第一标记和第二标记的提取，就可以确定出语音的输出主体。

所述产生时间即为生成所述记录卡片等记录信息的时间，通常与所述录音的产生时间非常接近，从而该时间一定程度上返回了语音通话或语音录制的时间，方便用户基于产生时间进行记忆，也方便队列卡片对记录卡片的处理。

所述关联信息包括：包含所述搜索信息；所述方法还包括：当检测到作用于所述记录子卡的第二类预设操作时，启动与所述搜索信息相适配的应用。

在一些实施例中，若所述记录信息以记录卡片的形式呈现，则所述搜索信息可以以记录子卡的形式成像。在本实施例中，所述搜索信息是以记录子卡的形式作为所述记录卡片的一部分。在本实施例中，可如图4所示的天气子卡及图5所示的地图子卡。

所述第二类预设操作可为操作搜索信息的操作。所述搜索信息可包括：地图信息、天气信息、美食信息以及电影上映信息等。

例如，当检测到作用于图4所示的天气子卡的点击操作等预定操作时，启动天气应用，方便用户查看对应日期或当前的天气信息。再例如，当检测到作用于图5所示的地图子卡上的预定操作时，第一用户终端后台启动地图应用，方便用户在地图应用的应用界面，查看该对应位置的详细信息，例如，查看从当前位置出发到语音信息中提到的某一个位置的路线和/或当前交通状况等。

在一些实施例中，所述记录子卡除了上述提到的天气子卡、地图子卡，还可包括：日程子卡。当检测到显示有日程信息的第二类预设操作时，第一用户终端启动日程应用，方便用户在日程应用中查看当前的日程信息，或，直接进入日程应用编辑日程信息等。

总之，所述记录子卡有多种，不局限于上述任意一种。

如图11所示，本实施例提供一种语音记录方法，应用于服务器中，包括：

步骤S210：从第一用户终端语音采集后形成的语音信息；

步骤S220：识别所述语音信息获得语音识别结果；

步骤S230：对所述语音识别结果进行语义识别，获得语义识别结果；

步骤S240：向所述第一用户终端发送与所述语义识别结果相适配的记录信息，或向所述第一用户终端发送生成所述记录信息的模板信息及所述语义识别结果；其中，所述记录信息包括：至少部分所述语义识别结果，所述记录信息还包括：关联信息和/或操作控件；所述关联信息为与所述语义识别结果相关的信息；所述操作控件，用于检测至少针对于所述记录信息的第一类预设操作。

本实施例提供的语音记录方法，是应用于网络侧的服务器中的。

在本实施例中所述服务器协助所述第一用户终端进行录音的识别及记录处理。

在步骤S210中首先需要从第一用户终端接收所述语音信息。

在接收到语音信息之后，在步骤S220中，会将所述语音信息转换可进行语义识别的识别文本等。

在步骤S230中通过语义识别，获得包括语义意图等语义识别结果。

在一些实施例中，所述服务器会基于语义识别结果生成对应的记录信息，或者，从而向第一用户终端发送所述记录信息。在另一些实施例中，所述服务器不会直接生成所述记录信息，而是查询生成所述记录信息的模板信息，然后将语义识别结果及模板信息一同发送给第一用户终端。这里由第一用户终端自行按照所述模板信息及所述语义识别结果生成所述记录信息。

在一些实施例中，所述步骤S240可包括：

向所述第一用户终端发送记录卡片，其中，所述记录卡片按照卡片模板展示有至少部分所述语义识别结果，还展示有所述关联信息和/或所述操作控件。

在另一些实施例中，所述步骤S240可包括：向所述第一用户终端发送生成所述记录卡片的卡片模板。

例如，会基于语义识别结果，选择与当前语音识别结果相适配的卡片模板，在步骤S240中可生成所述记录卡片发送给第一用户终端，也可以仅将语义识别结果及模板信息返回给第一用户终端，由第一用户终端自行生成记录信息板。在获得所述记录信息之后，第一用户终端会执行记录信息的存储和/或显示操作。在本实施例中，至少语音及语义的识别及模板信息的确定，是由服务器完成的。这样的话，减轻了用户终端的负荷，降低了用户终端的功耗。与此同时，服务器通常的语音及语义识别能力更强，能够提供更加精确的识别结果。

可选地，如图12所示，所述方法还包括：

步骤S231：判断所述语义识别结果所满足的语用条件；

步骤S232：向预定数据库发送携带有所述语用条件的查询请求；

步骤S233：接收所述预定数据库返回的所述模板信息，例如，所述卡片模板。

在本实施例中，所述服务器通过与预定数据库的交互，选择出与当前语义识别结果对应的模板信息。

例如，所述服务器通过语义识别，获得语义识别结果。判断所述语义识别结果是否满足预设语用条件。这里的语用条件，可包括：

根据所述语义识别结果中的语义意图，判断所述语义意图是否为预先定义的预定义意图，若为预定义意图则可确定满足所述语用条件。

所述预定义意图，可包括：导航意图、天气查询意图、美食搜索意图、论文搜索意图等。

与导航意图对应的模板信息可为导航模板信息；在导航模板中配置可插入用于导航的搜索信息的数据结构。

与天气查询意图对应的模板信息可为天气查询模板，在天气查询模板中可配置有插入用于天气查询的搜索信息的数据结构。

与导航意图对应的模板信息可为美食搜索模板；在美食搜索模板中可配置有插入用于查询美食兴趣点(Point of Interest，POI)的记录子卡的数据结构。

与文搜索意图对应的模板信息可为美食搜索模板；在美食搜索模板中可配置有插入用于搜索论文文库的搜索信息的数据结构等。

总之，本实施例中判断是否满足语用条件，实质上基于所述语义识别结果，选择与语义意图相适配的模板信息的过程。

如图13所示，本实施例提供一种电子设备，所述电子设备为第一用户终端，包括采集单元110、获取单元120及显示单元130。

所述采集单元110，用于采集语音信息；这里的采集单元110，可对应于麦克风等可以采集语音的各种软硬件。

所述获取单元120，用于获取与所述语音信息的语义识别结果相适配的记录信息；其中，所述记录信息包括：至少部分所述语义识别结果，所述记录信息还包括：关联信息和/或操作控件；所述关联信息为与所述语义识别结果相关的信息；所述操作控件，用于检测至少针对于所述记录信息的第一类预设操作。所述获取单元120可对应于通信接口，可以通过向服务器发送所述语音信息并接收服务器提供的所述记录信息。

在另一些实施例中，所述获取单元120还可对应于处理器或处理电路。所述处理器可为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)、应用处理器(AU)、可编程阵列(PLC)或专用集成电路(ASIC)等，可以通过计算机程序等计算机可执行指令的执行，实现在本地通过语音识别、语义识别及基于语义识别结果生成对应的记录信息。

所述显示单元130，用于显示所述记录信息。在本实施例中所述显示单元130可对应于显示屏，可用于信息显示的信息结构。所述显示屏可包括：液晶显示屏、电子墨水显示屏、投影显示屏等各种显示结构，从而实现记录卡片等记录信息的显示输出，方便用户查看。

本实施例提供第一用户终端，可以通过语音信息的形成，生成的图像和/或图形界面形式的记录结果，即所述记录信息，且记录结果中不仅包括：语义识别结果，还可包括：与语义识别结果对应的关联信息或操作控件等，一方面通过关联信息拓展了记录内容，另一方面通过操作控件，方便用户控制记录信息的处理，满足用户不同的记录需求。

可选地，所述采集单元110，具体用于当所述第一用户终端与第二用户终端进行语音通话时，监听所述语音通话，以形成所述语音信息。对应地，所述显示单元130，具体用于在所述语音通话过程中，在显示屏的第一区域显示控制所述语音通话的操作界面；并在所述显示屏的第二区域显示所述记录信息；在所述语音通话结束后，基于查看操作显示所述记录信息。

在本实施例中所述语音信息是对语音通话的录音产生。在显示所述记录信息时，会进行显示屏的分区域显示，例如，分区域并列显示，方便用户分别对语音通话及记录信息的操作，从而同时满足用户的对通话控制及记录信息的操作需求。

在一些实施例中，所述获取单元120，可用于获取基于所述语义识别结果产生的记录卡片，其中，所述记录卡片按照卡片模板展示有至少部分所述语义识别结果，还展示有所述关联信息和/或所述操作控件。

在一些实施例中，所述获取单元120可包括：发送模块，对应于发送天线或网络接口，用于将所述语音信息发送给服务器；接收模块，对应于接收天线或网络接口，可用于接收所述服务器返回的与所述语义识别结果相适配的记录信息。

在本实施例中，所述获取单元120通过与服务器的信息交互，获得所述记录信息。

在另一些实施例中，所述获取单元120还可包括：语音识别模块，对应于处理器，可用于自动对所述语音信息获得语音识别结果；语义识别模块，与语音识别模块连接，对应于处理器，可用于对所述语音识别结果进行语义识别，获取语义识别结果；生成模块，同样可对应于处理器，可用于根据所述语义识别结果适配的模板信息，生成所述记录信息。

在本实施例中，所述获取单元120在第一用户终端中本地生成所述记录信息，实现本地操作。

可选地，所述第一用户终端还包括：

队列单元，用于根据所述记录信息的产生时间，生成信息队列；

所述显示单元130，可用于根据所述记录信息在所述信息队列中的位置，依次显示所述记录信息。

可选地，所述方法还包括：

检测作用于所述操作控件的第一类预设操作，其中，所述操作控件，包括：存储所述记录卡片的存储控件、修改所述记录卡片的显示内容的修改控件、删除所述记录卡片的删除控件及转发所述记录卡片的转发控件的至少其中之一；当检测到所述第一类预设操作时，对所述记录卡片执行所述第一类预设操作。这里的第一类预设操作包括的针对所述记录卡片的整体的操作。

可选地，所述记录信息包括的至少部分语义识别结果包括：与所述记录信息生成的模板信息相适配的关键语句；所述关联信息至少包括：语音的输出主体、与所述关键语句相适配的搜索信息及所述记录信息的产生时间的至少其中之一。

在一些实施例中，所述关联信息包括：与所述语义识别结果满足预设匹配关系的搜索信息；所述第一用户终端还包括启动单元；所述启动单元，用于当检测到作用于所述关联信息的第二类预设操作时，启动与所述搜索信息相适配的应用。

例如，所述记录信息以记录卡片的形式呈现，所述记录卡片包括：包含所述搜索信息的记录子卡；所述第一用户终端还包括：启动单元；所述启动单元可对应于处理器等，用于当检测到作用于所述记录子卡的第二类预设操作时，启动与所述搜索信息相适配的应用。例如，所述启动单元，具体用于基于所述记录子卡的类型，启动对应的应用，例如，启动对应于导航卡片的地图应用，启动美食搜索卡片的团购应用功能，启动购物相关的购物应用，启动社交卡片的社交应用。

在一些实施例中，所述第一用户终端还可包括：状态获取单元，用于还可被用于获取所述第一用户终端的当前状态信息，其中，所述当前状态信息用于指示所述第一用户终端的网络连接状态、负载状态及可用带宽状态的至少其中之一；方式确定单元，用于确定与所述当前状态信息相适配的获取方式；所述获取单元120，具体用于利用所述获取方式获取所述记录信息。

这样就可以采用与第一用户终端的当前状态相适配的获取方式来获取所述记录信息。

如图14所示，本实施例提供一种电子设备，所述电子设备为服务器，包括：

接收单元210，可对应于网络接口等接收器，可用于第一用户终端进行信息交互，具体可用于从第一用户终端语音采集后形成的语音信息；

语音识别单元220，用于识别所述语音信息获得语音识别结果；

语义识别单元230，用于对所述语音识别结果进行语义识别，获得语义识别结果；

发送单元240，可对应于网络接口等发送器，用于向所述第一用户终端发送与所述语义识别结果相适配的记录信息，或向所述第一用户终端发送生成所述记录信息的模板信息及所述语义识别结果；其中，所述记录信息包括：至少部分所述语义识别结果，所述记录信息还包括：关联信息和/或操作控件；所述关联信息为与所述语义识别结果相关的信息；所述操作控件，用于检测至少针对于所述记录信息的第一类预设操作。

本实施例提供的电子设备为位于网络侧的服务器。该服务器可至少用于协助第一用户终端进行精确的语音识别及语义识别，并选择出与当前语义识别结果对应的卡片模板。在一些实施例中，所述服务器还可包括：生成单元，该生成单元，可基于所述语义识别结果及所述卡片模板生成所述结构化记录卡片；所述发送单元240直接发送的就是记录卡片。而在另一些实施例中，所述发送单元240发送的所述语义识别结果及所述卡片模板，具体的记录卡片的生成由所述第一用户终端自行完成。

所述语音识别单元220、语义识别单元230及所述生成单元均可对应于服务器中的CPU、MCU、DSP、AP、PLC或ASIC等，可通过计算机程序的执行实现上述各个单元的操作。

在一些情况下，所述服务器还包括：选择单元；所述选择单元，具体可包括：判断模块，可对应于处理器，可用于判断所述语义识别结果所满足的语用条件；发送模块，对应于发送接口，可用于向预定数据库发送携带有所述语用条件的查询请求；接收接口，对应于接收接口，可用于接收所述预定数据库返回的模板信息，所述模板信息可包括：卡片模板。

在本实施例中服务器通过与预定服务器的信息交互，选择出与当前语义识别结果对应的模板信息，用于使得记录信息以模板信息限定的显示参数显示或呈现。例如，利用目标信息中的卡片模板生成记录卡片。

如图15所示，本实施例提供一种电子设备，包括：存储器310、处理器320及存储在所述存储器310上并由所述处理器320运行的计算机程序；

所述处理器320，与所述存储器310连接，通过运行所述计算机程序，实现前述一个或多个技术方案提供的语音记录方法，具体可以执行如图1、图7及图11所示的语音记录方法。

所述存储器310可包括：各种类型的存储介质的存储结构，至少可包括：存储介质，该存储介质可为非瞬间存储介质，可用于存储所述计算机程序。

所述处理器320可为CPU、MCU、DSP、AP、PLC或ASIC等各种类型的处理器。

所述处理器320可通过集成电路总线等与所述存储器310连接，通过读取存储器310上的计算机程序，控制存储器310的信息存储，并执行前述的一个或多个技术方案的语音记录方法。

在本实施例中所述电子设备可为前述的第一用户终端或服务器。若所述电子设备为第一用户终端，则所述电子设备还至少包括显示器；所述显示器与所述处理器320连接。所述显示器根据处理器的控制指令，进行显示，可至少用于显示所述记录信息，在一些实施例中还可以显示通话界面等。若所述电子设备为服务器，则所述电子设备还可包括：收发器，该收发器可用于第一用户终端进行信息交互，至少用于获取所述语音信息，并基于语音信息向对应的第一用户终端返回所述记录信息或者模板信息及语义识别结果。

本实施例还提供一种计算机存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序被处理器执行后，能够实现前述任意一个或多个技术方案提供的语音记录方法。

在本实施例中所述计算机存储介质，可为随机存储介质、只读存储介质、闪存、移动硬盘、光盘或磁带等各种存储介质，可选为一种非瞬间存储介质，可用于在掉电后依然存储有计算机程序的存储介质。

以下结合上述任意一个实施例提供几个示例：

示例1：

如图16所示，本示例提供一种语音通话的记录方法，包括：

步骤S1：进入语音通话；

步骤S2：检测启动智能笔记的指令，这里的智能笔记可为包括语音助理的一种应用；

步骤S3：启动录音，以获取语音信息；

步骤S4：语音识别；

步骤S5：语义识别，基于语音识别结果，提取出语义意图等信息；

步骤S6：判断是否满足语用条件，是则进入下一步；例如，判断所述语义识别结果中的语音意图是否为预先定义的语义意图。

步骤S7：展示与匹配语用条件对应的记录卡片。

步骤S8：判断语音通话是否结束，若是则进入步骤S9，若否则返回步骤S4；

步骤S9：结束录音。

示例2：

本示例提供另一种通话录音的记录方法，包括：

步骤1：检测到用户已开始通话；

步骤2：收到开启智能笔记的指令，该指令可为第一用户终端内置的预先设定的自动触发指令，也可以是从人机交互界面接收的用户指令。

例如，A：可以通过唤醒语音指令，启动智能笔记；

又例如，B：主动通过启动提示的输出，询问用户是否开启智能笔记，当检测到确定启动的指令时，启动智能笔记。

步骤3：发起录音并进行语音识别，并对语音识别产生的识别文本进行语义识别，提取出包括语义意图的语义识别结果。这里的语义意图可为用户想要表的语义内容。

步骤4：判断语义识别记过是否满足语用条件；

如图17所示，判断满足语用条件时，智能笔记的服务器向支持标记的智能笔记的语用数据库发送查询请求，该查询请求携带有已识别语音意图匹配的预先定义的意图类型。预定数据库以所述意图类型进行检索，检索出与所述意图类型匹配的卡片模板，若检索到对应的卡片模板则将该卡片模板返回给服务器，若未检索出对应的卡片模板，则向服务器返回空或返回查询失败的信息。在利用所述语用数据库时，还需先建立所述语用数据库。如图17所示，建立所述语用数据库可包括：

1)获取预先在已支持的语义集，并在语义集中挑选适合作为智能笔记的意图类型；

2)判断是否适用智能笔记，若适用则进入步骤3)；

3)为该意图类型设计为对应的卡片模板；

4)将卡片模板与意图类型对应存储到支持标记的智能笔记语用数据库。在图17中显示有m中卡片模板，分别是卡片模板1、卡片模板2一直到卡片模板m。

步骤5：在用户终端上展示利用所述卡片模板生成的记录卡片。

该记录卡片上展示的信息可包括：

通过声纹识别判断的说话主体、命中该语义的关键语句、记录子卡、生成时间、删除、收藏、修改等操作控件。用户可对该记录卡片标记、删除、修改。收藏后，该记录卡片将作为重要记录出现在笔记中。删除后，该记录卡片将不再笔记中出现。用户可对记录卡片操作修改，修改后将保存至笔记中。

步骤6：判断是否完成通话；若未完成通话，则新产生的记录卡片将插入用户终端信息队列中展示；若完成通话，则直接展示通话笔记。该通话笔记可为所述记录卡片的一种。所述通话笔记上的展示信息包括：通话日期、时长、时间段、联系人、时间轴、笔记时间点、对应时间点的笔记。

A、在本示例中，通过用户主动发起智能笔记，对通话录音进行语音识别、语义分析，自动将常用、有用、适用的语义标记为结构化的语用记录子卡，不仅能作为通话时的信息提示、提高沟通效率，还能够将通话内容记录下来，作为智能笔记保存，实用性有很大提升。

B、本示例中，通过建立语用笔记数据库，能够将精心设计的记录子卡展示给用户，减少信息噪音和干扰，在效率、美观和实用性上比单纯的记录录音文字大大的提高。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元，即可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个处理模块中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种语音记录方法，其特征在于，应用第一用户终端中，包括：

当所述语音通话未完成时，在显示屏的第一区域中显示控制所述语音通话的操作界面，并

在所述显示屏的第二区域中，以记录卡片的形式将新产生的所述记录信息按照所述记录信息的产生时间插入到信息队列中显示；

当所述语音通话完成时，根据所述记录信息在所述信息队列中的位置，以记录卡片的形式依次显示所述记录信息；

其中，所述记录卡片是采用卡片模板生成的；所述卡片模板是定义了数据结构的模板信息；所述记录卡片包括以下至少之一：通话日期、通话时间、联系人。

2.根据权利要求1所述的方法，其特征在于，

所述获取与所述语音信息的语义识别结果相适配的记录信息，包括：

获取基于所述语义识别结果产生的记录卡片，其中，所述记录卡片按照卡片模板展示有至少部分所述语义识别结果，还展示有所述关联信息和/或所述操作控件。

3.根据权利要求1所述的方法，其特征在于，

所述记录信息中的至少部分语义识别结果包括：与生成所述记录信息的模板信息相适配的关键语句；

所述关联信息至少包括：语音的输出主体、与所述关键语句相适配的搜索信息及所述记录信息的产生时间中的至少之一。

4.根据权利要求1、2或3所述的方法，其特征在于，

所述当所述第一用户终端进行语音通话时，启动录音以采集所述语音通话的语音信息，包括：

当所述第一用户终端与第二用户终端进行语音通话时，启动录音以监听所述语音通话，以获取所述语音信息；

所述显示所述记录信息，包括：

基于查看操作显示所述记录信息。

5.根据权利要求1、2或3所述的方法，其特征在于，

所述关联信息包括：与所述语义识别结果满足预设匹配关系的搜索信息；

所述方法还包括：

当检测到作用于所述关联信息的第二类预设操作时，启动与所述搜索信息相适配的应用。

6.根据权利要求1、2或3所述的方法，其特征在于，

所述方法还包括：

根据所述记录信息的产生时间，生成所述信息队列。

7.根据权利要求1、2或3所述的方法，其特征在于，

所述方法还包括：

获取所述第一用户终端的当前状态信息，其中，所述当前状态信息用于指示所述第一用户终端的网络连接状态、负载状态及可用带宽状态的至少其中之一；

确定与所述当前状态信息相适配的获取方式；

利用所述获取方式获取所述记录信息。

8.一种语音记录方法，其特征在于，应用于服务器中，包括：

识别所述语音信息获得语音识别结果；

对所述语音识别结果进行语义识别，获得语义识别结果；

向所述第一用户终端发送与所述语义识别结果相适配的记录信息，或向所述第一用户终端发送生成所述记录信息的模板信息、所述语义识别结果及生成记录卡片的卡片模板，用于当所述第一用户终端未完成所述语音通话时，在显示屏的第一区域中显示控制所述语音通话的操作界面，并在所述显示屏的第二区域中，以记录卡片的形式将新产生的所述记录信息按照所述记录信息的产生时间插入到信息队列中显示，还用于当所述语音通话完成时，根据所述记录信息在所述信息队列中的位置，以记录卡片的形式依次显示所述记录信息；

其中，所述记录卡片是采用卡片模板生成的；所述卡片模板是定义了数据结构的模板信息；所述记录卡片包括以下至少之一：通话日期、通话时间、联系人；所述记录信息包括：至少部分所述语义识别结果；关联信息和/或操作控件；

9.根据权利要求8所述的方法，其特征在于，

所述向所述第一用户终端发送与所述语义识别结果相适配的记录信息，包括：

向所述第一用户终端发送所述记录卡片，其中，所述记录卡片按照所述卡片模板展示有至少部分所述语义识别结果，还展示有所述关联信息和/或所述操作控件。

10.根据权利要求8或9所述的方法，其特征在于，

所述方法还包括：

判断所述语义识别结果所满足的语用条件；

向预定数据库发送携带有所述语用条件的查询请求；

接收所述预定数据库返回的所述模板信息。

11.一种电子设备，其特征在于，所述电子设备为第一用户终端，包括：

显示单元，用于当所述语音通话未完成时，在显示屏的第一区域中显示控制所述语音通话的操作界面，并在所述显示屏的第二区域中，以记录卡片的形式将新产生的所述记录信息按照所述记录信息的产生时间插入到信息队列中显示；当所述语音通话完成时，根据所述记录信息在所述信息队列中的位置，以记录卡片的形式依次显示所述记录信息；其中，所述记录卡片是采用卡片模板生成的；所述卡片模板是定义了数据结构的模板信息；所述记录卡片包括以下至少之一：通话日期、通话时间、联系人。

12.根据权利要求11所述的电子设备，其特征在于，

所述采集单元，具体用于当所述第一用户终端与第二用户终端进行语音通话时，启动录音以监听所述语音通话，以形成所述语音信息；

所述显示单元，具体用于在所述语音通话过程中，在所述显示屏的第二区域显示部分语音识别结果，并在所述第二区域显示所述关联信息和/或操作控件；和/或，在所述语音通话结束后，基于查看操作显示所述部分所述语义识别结果及显示所述关联信息和/或操作控件。

13.一种电子设备，其特征在于，所述电子设备为服务器，包括：

语音识别单元，用于识别所述语音信息获得语音识别结果；

发送单元，用于向所述第一用户终端发送与所述语义识别结果相适配的记录信息，或向所述第一用户终端发送生成所述记录信息的模板信息、所述语义识别结果及生成记录卡片的卡片模板，用于当所述第一用户终端未完成所述语音通话时，在显示屏的第一区域中显示控制所述语音通话的操作界面，并在所述显示屏的第二区域中，以记录卡片的形式将新产生的所述记录信息按照所述记录信息的产生时间插入到信息队列中显示，还用于当所述语音通话完成时，根据所述记录信息在所述信息队列中的位置，以记录卡片的形式依次显示所述记录信息；其中，所述记录卡片是采用卡片模板生成的；所述卡片模板是定义了数据结构的模板信息；所述记录卡片包括以下至少之一：通话日期、通话时间、联系人；所述记录信息包括：至少部分所述语义识别结果；关联信息和/或操作控件；所述关联信息为与所述语义识别结果相关的信息；所述操作控件，用于检测至少针对于所述记录信息的第一类预设操作，所述第一类预设操作包括以下至少之一：删除记录信息、存储记录信息。

14.一种电子设备，其特征在于，包括：存储器、处理器及存储在所述存储器上并由所述处理器运行的计算机程序；

所述处理器，与所述存储器连接，通过运行所述计算机程序，实现权利要求1至10任一项提供的所述语音记录方法。

15.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序；所述计算机程序被执行后，能够实现权利要求1至10任一项提供的所述语音记录方法。