WO2018010129A1

WO2018010129A1 - 基于电话会议的会议记录生成方法和装置

Info

Publication number: WO2018010129A1
Application number: PCT/CN2016/089950
Authority: WO
Inventors: 张立新
Original assignee: 深圳市沃特沃德股份有限公司
Priority date: 2016-07-13
Filing date: 2016-07-13
Publication date: 2018-01-18

Abstract

本发明揭示了一种基于电话会议的会议记录生成方法和装置，所述方法包括步骤：获取各会议终端采集的语音内容；将所述语音内容转换为文字内容；根据所述文字内容生成会议记录，并存储所述会议记录和/或发送所述会议记录至指定地址。本发明实施例所提供的一种本发明实施例基于电话会议的会议记录生成方法，通过语音识别技术自动将各会议终端录制的语音内容转换为文字内容，并根据文字内容生成会议记录，实现了电话会议的会议记录的自动生成，省去了手动整理会议记录的繁琐过程，提高了操作效率，使得电话会议系统更加智能化。

Description

基于电话会议的会议记录生成方法和装置技术领域

[0001] 本发明涉及电话会议技术领域，特别是涉及到一种基于电话会议的会议记录生成方法和装置。

背景技术

[0002] [0002]为了提高沟通效率，降低沟通成本，近年来电话会议被越来越多的企业所采用。广义的电话会议，既包括纯语音会议，又包括视频会议。纯语音会议的优点是终端简单，成本低，不需依赖互联网也可实现，缺点是不能实现面对面的沟通。随着互联网的普及和网络的增速降费，现在各种形式的视频会议幵始兴起，实现了远程面对面沟通。

[0003] 然而，目前的电话会议系统只有录音或录像功能，而对于会议记录，还需要人员手动记录，待会议结束后整理成会议记录文档发送给各方参会人员，操作繁琐，效率低下。

技术问题

[0004] 本发明的主要目的为提供一种基于电话会议的会议记录生成方法和装置，旨在解决进行电话会议吋整理会议记录的效率低下的技术问题。

问题的解决方案

技术解决方案

[0005] [0004]为达以上目的，本发明提出基于电话会议的会议记录生成方法，所述方法包括步骤：

[0006] 获取各会议终端采集的语音内容；

[0007] 将所述语音内容转换为文字内容；

[0008] 根据所述文字内容生成会议记录，并存储所述会议记录和 /或发送所述会议记录至指定地址。

[0009] 进一步地，所述获取各会议终端采集的语音内容的步骤包括：

[0010] 通过各会议终端采集语音内容，接收所述各会议终端发送的所述语音内容； [0011] 根据所述语音内容来源的会议终端分段保存所述语音内容，并对每段语音内容添加标识信息，所述标识信息至少包括所述语音内容对应的会议终端的设备识别码。

[0012] 进一步地，所述根据所述语音内容来源的会议终端分段保存所述语音内容的步骤包括：将一个会议终端一次持续采集的语音内容保存为一段语音内容。

[0013] 进一步地，所述根据所述语音内容来源的会议终端分段保存所述语音内容的步骤包括：将一个会议终端一次持续采集的语音内容进行智能断句，将每一句语音内容保存为一段语音内容。

[0014] 进一步地，所述标识信息还包括所述语音内容的句数序号。

[0015] 进一步地，所述会议终端的设备识别码为所述会议终端的唯一标识码或所述会议终端加入会议的顺序编码。

[0016] 进一步地，所述将所述语音内容转换为文字内容的步骤包括：

[0017] 分别将每一段语音内容转换为一段文字内容，并对每段文字内容添加与对应的语音内容的标识信息相匹配的标识信息。

[0018] 进一步地，所述根据所述文字内容生成会议记录的步骤之后还包括：

[0019] 当接收到针对一段文字内容的编辑指令吋，对所述文字内容进行编辑。

[0020] 进一步地，所述根据所述文字内容生成会议记录的步骤之后还包括：

[0021] 当接收到针对一段文字内容的翻译指令吋，对所述文字内容进行翻译。

[0022] 进一步地，所述分别将每一段语音内容转换为一段文字内容的步骤之后还包括

：对至少一段文字内容和与之对应的语音内容建立链接关系；

[0023] 所述根据所述文字内容生成会议记录的步骤之后还包括：当接收到针对所述文字内容的语音回放指令吋，根据所述链接关系获取对应的语音内容并予以播放

[0024] 本发明同吋提出一种基于电话会议的会议记录生成装置，所述装置包括： [0025] 语音内容获取模块，用于获取各会议终端采集的语音内容；

[0026] 语音识别模块，用于将所述语音内容转换为文字内容；

[0027] 会议记录生成模块，用于根据所述文字内容生成会议记录，并存储所述会议记录和 /或发送所述会议记录至指定地址。 [0028] 进一步地，所述语音内容获取模块包括接收单元和分段单元，其中：

[0029] 所述接收单元，用于通过各会议终端采集语音内容，接收所述各会议终端发送的所述语音内容；

[0030] 所述分段单元，用于根据所述语音内容来源的会议终端分段保存所述语音内容，并对每段语音内容添加标识信息，所述标识信息至少包括所述语音内容对应的会议终端的设备识别码。

[0031] 进一步地，所述分段单元用于：将一个会议终端一次持续采集的语音内容保存为一段语音内容。

[0032] 进一步地，所述分段单元用于：将一个会议终端一次持续采集的语音内容进行智能断句，将每一句语音内容保存为一段语音内容。

[0033] 进一步地，所述语音识别模块用于：分别将每一段语音内容转换为一段文字内容，并对每段文字内容添加与对应的语音内容的标识信息相匹配的标识信息。

[0034] 进一步地，所述会议记录生成模块包括编辑单元，所述编辑单元用于：当接收到针对一段文字内容的编辑指令吋，对所述文字内容进行编辑。

[0035] 进一步地，所述会议记录生成模块包括翻译单元，所述翻译单元用于：当接收到针对一段文字内容的翻译指令吋，对所述文字内容进行翻译。

[0036] 进一步地，所述会议记录生成模块还包括语音回放单元，所述语音识别模块还用于：对至少一段文字内容和与之对应的语音内容建立链接关系；

[0037] 所述语音回放单元用于：当接收到针对所述文字内容的语音回放指令吋，根据所述链接关系获取对应的语音内容并予以播放。

发明的有益效果

有益效果

[0038] [0005]本发明实施例所提供的一种基于电话会议的会议记录生成方法，通过语音识别技术自动将各会议终端录制的语音内容转换为文字内容，并根据文字内容生成会议记录，实现了电话会议的会议记录的自动生成，省去了手动整理会议记录的繁琐过程，提高了操作效率，使得电话会议系统更加智能化。

[0039] 同吋，通过分段保存语音内容和分段记录文字内容，使得会议记录中能够明确的区分出各段话的发言人，使得会议记录更加清楚明了。而且，通过提供语音回放和编辑功能，使得用户可以对会议记录进行实吋核对修改，使得会议记录更加准确；通过提供翻译功能，可以将会议记录内容翻译为需要的语言，因此能够满足国际电话会议的需求。

对附图的简要说明

附图说明

[0040] [0006]图 1是实现本发明各实施例的一个可选地电话会议系统的模块示意图；

[0041] 图 2是实现本发明各实施例的一个典型的电话会议系统的组成结构示意图； [0042] 图 3是图 2的电话会议系统中一个典型的视频会议终端的组成结构示意图； [0043] 图 4是本发明基于电话会议的会议记录生成方法第一实施例的流程图；

[0044] 图 5是本发明基于电话会议的会议记录生成方法第二实施例的流程图；

[0045] 图 6是本发明基于电话会议的会议记录生成装置一实施例的模块示意图；

[0046] 图 7是图 6的会议记录生成装置中一个可选地语音内容获取模块的模块示意图； [0047] 图 8是图 6的会议记录生成装置中一个可选地会议记录生成模块的模块示意图。

[0048] 本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

本发明的实施方式

[0049] [0008]应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

[0050] 下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

[0051] 本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式"一"、 " 一个"、 "所述 "和"该"也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞"包括"是指存在所述特征、整数、步骤、操作、元件和 /或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和 /或它们的组。应该理解，当我们称元件被"连接"或"耦接"到另一元件吋，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的"连接"或"耦接"可以包括无线连接或无线耦接。这里使用的措辞 "和 /或"包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

[0052] 本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语（包括技术术语和科学术语），具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。

[0053] 本技术领域技术人员可以理解，这里所使用的 "终端"、 "终端设备"既包括无线信号接收器的设备，其仅具备无发射能力的无线信号接收器的设备，又包括接收和发射硬件的设备，其具有能够在双向通信链路上，执行双向通信的接收和发射硬件的设备。这种设备可以包括：蜂窝或其他通信设备，其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备； PCS (Persona 1 Communications Service, 个人通信系统），其可以组合语音、数据处理、传真和 /或数据通信能力； PDA (Personal Digital Assistant, 个人数字助理），其可以包括射频接收器、寻呼机、互联网 /内联网访问、网络浏览器、记事本、日历和 / 或 GPS (Global Positioning System, 全球定位系统）接收器；常规膝上型和 /或掌上型计算机或其他设备，其具有和 /或包括射频接收器的常规膝上型和 /或掌上型计算机或其他设备。这里所使用的 "终端"、 "终端设备"可以是便携式、可运输、安装在交通工具（航空、海运和 /或陆地）中的，或者适合于和 /或配置为在本地运行，和 /或以分布形式，运行在地球和 /或空间的任何其他位置运行。这里所使用的"终端"、 "终端设备"还可以是通信终端、上网终端、音乐 /视频播放终端，例如可以是 PDA、 MID (Mobile Internet Device, 移动互联网设备）和 /或具有音乐 /视频播放功能的移动电话，也可以是智能电视、机顶盒等设备。

[0054] 本发明实施例基于电话会议的会议记录生成方法和装置主要应用于电话会议，此处的电话会议应作广义理解，既包括纯语音会议，又包括视频会议。

[0055] 如图 1所示，为实现本发明各个实施例的一个可选的电话会议系统的模块示意图，所述电话会议系统包括服务器 10和会议终端 20。其中，会议终端 20至少有两个，可以是加入会议的各种终端设备，如手机、平板等移动终端，个人电脑、笔记本电脑等计算机终端，以及专门用于电话会议的视频会议终端，等等；服务器 10为实现本发明实施例的会议记录生成方法的设备，通常为专门主持电话会议的云端服务器，也可以是加入会议的其中一个终端设备，被指定为生成会议记录的服务器 10。

[0056] 如图 2所示，为一个典型的电话会议系统的组成结构示意图。所述电话会议系统包括一个云端服务器 11，以及分别与云端服务器 11建立有线或无线连接的六个会议终端，包括位于主会场 A的视频会议终端 21，位于分会场 B的视频会议终端 22，位于分会场 C的视频会议终端 23，位于分会场 D的视频会议终端 24，出差人员携带的智能手机 25，以及出差人员携带的笔记本电脑 26。其中，智能手机和笔记本电脑可以通过装载电话会议客户端软件来实现电话会议功能。本领域技术人员可以理解，图 2所示的视频会议系统只是一个可选的实施例，本发明并不对其做任何限制。

[0057] 如图 3所示，为一个典型的视频会议终端的组成结构示意图。所述视频会议终端至少包括一主机 210，该主机 210的核心部件优选为高性能 4G智能手机芯片，该主机 210自带有高清旋转摄像头（优选 500万像素以上）和高灵敏度全向麦克风，内置喇叭和 LCD与电容触摸屏，不需外接其它设备即可供单一会场 10人左右小型会议使用。在大型会议使用吋，可以通过主机 210的 HDMI或 VGA接口外接高清 LCD电视或投影仪 211，增加外置无线麦克风 212和功放音响 213，增加一只 USB高清摄像头 214 (用于全场录像）和蓝牙键盘鼠标 215 (用于主机遥控与文字编辑）。视频会议终端的主机 210可通过有线宽带或 WIFI路由器或 LTE 4G网络接入互联网，与云端服务器建立连接。本领域技术人员可以理解，图 3所示的视频会议终端只是一个可选的实施例，本发明并不对其做任何限制。

[0058] 现基于上述电话会议系统，提出本发明基于电话会议的会议记录生成方法和装置各个实施例。

[0059] 参照图 4，提出本发明基于电话会议的会议记录生成方法第一实施例，所述方法包括以下步骤：

[0060] Sl l、获取各会议终端采集的语音内容。

[0061] 当电话会议幵始后，服务器通过各会议终端采集语音内容，接收各会议终端发送的语音内容并予以保存，可以保存为指定的音频格式，如 MP3、 wma、 wav等

[0062] 具体的，当会议终端侧的参会人员幵始发言吋，该会议终端则通过声音采集装置（如麦克风）采集语音内容。该会议终端可以将采集的语音内容实吋或定吋的发送给服务器，或者，当该会议终端侧的参会人员结束一次发言后，该会议终端才将本次持续采集的语音内容发送给服务器。服务器接收到会议终端发送的语音内容后，对语音内容予以保存。

[0063] 可选地，服务器可以在电话会议过程中持续接收各会议终端发送的语音内容，直到电话会议结束后，将接收到所有语音内容保存为一个录音文件。

[0064] 可选地，服务器也可以根据语音内容来源的会议终端分段保存语音内容，并对每段语音内容添加标识信息以示区别，也就是说，一次电话会议录制的语音内容被分成至少两段，每一段语音内容被保存为一个录音文件，一次电话会议将生成至少两个录音文件。

[0065] 语音内容的标识信息至少包括语音内容对应的会议终端的设备识别码，会议终端的设备识别码可以是会议终端的唯一标识码或者会议终端加入会议的顺序编码。其中，唯一标识码，是指可以唯一标识终端的编码，如介质访问控制 (Media Access

Control, MAC)地址，设备串号（如 IMEI、 MEID或者 ESN码）， SIM卡序列号 (SIM Serial Number) ，等等；顺序编码，是指在各个会议终端陆续登录电话会议系统加入会议吋，系统按各会议终端的登录顺序给各会议终端赋予的编号。进一步地，每段语音内容的标识信息还可以包括当吋的吋间信息。

[0066] 在一些实施例中，服务器将一个会议终端一次持续采集的语音内容保存为一段语音内容。也就是说，在各个会议终端侧的参会者轮流发言过程中，将一个会议终端侧的参会者一次发言的语音内容保存为一个录音文件。从而，在一次电话会议中，如果各会议终端的参会者轮流发言了 N次，则本次电话会议录制的语音内容就会被分成 N段，保存为 N个录音文件。

[0067] 在另一些实施例中，服务器将一个会议终端一次持续采集的语音内容进行智能断句，将每一句语音内容保存为一段语音内容。也就是说，在各个会议终端侧的参会者轮流发言过程中，将一个会议终端侧的参会者一次发言的语音内容分成若干句话，将每一句话保存为一个录音文件。此吋，每段语音内容的标识信息还可以包括本段语音内容的句数序号，即标识本段语音内容是第几句。

[0068] 服务器可以根据预设的静默间隔长度（如设置为 1秒、 1.5秒等）来进行智能断句，每当语音内容的静默吋间达到预设的静默间隔长度吋，则进行一次断句，将本句语音内容保存为一段语音内容，如果需要添加句数序号，则每断一次句，就对句数序号累加一个单位作为本段语音内容的句数序号。此外，服务器也可以每隔一个固定吋段进行一次断句，或者采用现有技术的其他方式进行断句，在此不再一一列举赘述。

[0069] S12、将语音内容转换为文字内容。

[0070] 具体的，服务器利用语音识别技术，将语音内容转换为文字内容。

[0071] 可选地，当步骤 S11中语音内容被分段保存吋，服务器则将每一段语音内容转换为一段文字内容，并对每段文字内容添加与对应的语音内容的标识信息相匹配的标识信息，以示区别。

[0072] 这里所述的相匹配，是指完全相同或者至少部分相同或者相对应，例如，为每段文字内容添加与对应的语音内容的标识信息相同的标识信息，该标识信息至少包括对应的会议终端的设备识别码，还可以包括吋间信息或句数序号等。

[0073] S13、根据文字内容生成会议记录。

[0074] 具体的，当电话会议结束后，服务器将转换的文字内容生成为文本文档，该文本文档即为会议记录。或者，服务器也可以在电话会议过程中，首先将已转换的文字内容生成为文本文档，然后将后续转换的文字内容陆续加入到文本文档中。

[0075] 可选地，当文字内容有多段吋，先按照一定的顺序对多段文字内容进行排序，然后生成会议记录。例如，可以按照吋间轴（如根据文字内容的生成顺序、标识信息中的吋间信息或句数序号等）对多段文字内容进行排序。

[0076] 进一步地，当接收到针对一段文字内容或整个文字内容的编辑指令吋，服务器则对文字内容进行编辑，如修改、刪除、添加等。所述编辑指令，可以是预设的触摸操作、按键操作、凌空手势动作、语音命令等。例如，在每段文字内容处显示"编辑"图标，当用户触摸该 "编辑 "图标吋，服务器则接收到编辑指令，进入编辑状态，当编辑完毕后则退出编辑状态。

[0077] 进一步地，在步骤 S12中，服务器还可以对至少一段文字内容和与之对应的语音内容建立链接关系。本步骤 S13中，当接收到针对该段文字内容的语音回放指令吋，服务器则根据链接关系获取对应的语音内容并予以播放。所述语音回放指令，可以是预设的触摸操作、按键操作、凌空手势动作、语音命令等。例如，在每段文字内容处显示"语音回放"图标，当用户触摸该 "语音回放"图标吋，服务器则接收到语音回放指令，根据链接关系找到对应的语音内容，并播放该语音内容。当用户发现文字内容有误吋，则可以触发编辑指令对该段文字内容进行编辑。

[0078] 进一步地，当接收到针对一段文字内容或整个文字内容的翻译指令吋，服务器则对文字内容进行翻译，将一种语言翻译为另一种语言，如将中文翻译英文、日文、法文等其它语言，或者将英文、日文、法文等其它语言翻译为中文，或者其它语言之间的相互翻译，等等。所述翻译指令，可以是预设的触摸操作、按键操作、凌空手势动作、语音命令等。例如，在每段文字内容处显示"翻译"图标，当用户触摸该 "翻译 "图标吋，服务器则接收到翻译指令，幵始翻译文字内容，并将译文显示在原来的文字内容附近以供参考，并可以对译文进行特殊标记以与原文相区别。

[0079] S14、存储会议记录和 /或发送会议记录至指定地址。

[0080] 当电话会议结束后，服务器可以将会议记录存储于指定位置，和 /或将会议记录发送到指定地址。所述指定地址可以是指定的设备、指定的邮箱、指定的联系人等，例如，将会议记录发送到指定的参会人员的邮箱中。

[0081] 进一步地，在存储或发送会议记录之前，还可以对会议记录进行加密，以保证数据安全。例如，对会议记录文档进行压缩加密，解压密码为指定密码或者为各参会人员公知的或约定的密码。

[0082] 本发明实施例基于电话会议的会议记录生成方法，通过语音识别技术自动将各会议终端录制的语音内容转换为文字内容，并根据文字内容生成会议记录，实现了电话会议的会议记录的自动生成，省去了手动整理会议记录的繁琐过程，提高了操作效率，使得电话会议系统更加智能化。

[0083] 同吋，通过分段保存语音内容和分段记录文字内容，使得会议记录中能够明确的区分出各段话的发言人，使得会议记录更加清楚明了。而且，通过提供语音回放和编辑功能，使得用户可以对会议记录进行实吋核对修改，使得会议记录更加准确；通过提供翻译功能，可以将会议记录内容翻译为需要的语言，因此能够满足国际电话会议的需求。

[0084]

[0085] 参照图 5，提出本发明基于电话会议的会议记录生成方法第二实施例，所述方法包括以下步骤：

[0086] S21、第一会议终端登录服务器的电话会议系统，提交电话会议申请，获得会议名称和会议接入密码。

[0087] 第一会议终端为会议发起方，其通过已注册的账号登录服务器的电话会议系统申请召幵电话会议，并输入会议信息如会议名称、会议吋间等提交申请。服务器接收到申请后，向第一会议终端返回会议接入密码。此外，会议名称也可以由服务器自动生成。

[0088] S22、第一会议终端和第二会议终端登录服务器的电话会议系统，通过会议名称和会议接入密码加入电话会议。

[0089] 第二会议终端是会议受邀方，可以是一个，也可以至少两个。当到了约定的会议吋间后，第一会议终端和第二会议终端登录服务器的电话会议系统，通过会议名称和会议接入密码加入电话会议。

[0090] S23、服务器按各会议终端的登录顺序给各会议终端编号。

[0091] 为了对后续的录音来源进行区分，服务器按各会议终端的登录顺序给各会议终端编号，如大写字母、小写字母、阿拉伯数字、罗马数字等。

[0092] S24、第一会议终端选择会议记录模式，幵始电话会议。判断是否选择了智能记录模式，当选择了智能记录模式吋，执行步骤 S26; 当没有选择智能记录模式吋，执行步骤 S25。

[0093] 本实施例中，用户可以根据需要选择会议记录模式，其中，智能记录模式，即本发明中系统自动生成会议记录的模式。当没有选择智能记录模式吋，如选择普通模式吋，则说明用户不希望系统自动生成会议记录，而是向现有技术那样手动制作会议记录。

[0094] S25、各会议终端进行录音录像并自动保存到云端服务器或本地存储设备的指定地址。

[0095] 当第一会议终端没有选择智能记录模式吋，则像现有技术那样，系统不进行会议记录的自动生成，由各会议终端进行录音录像并自动保存到云端服务器或本地存储设备的指定地址。

[0096] S26、服务器启动语音识别程序、文本编辑程序和翻译程序。

[0097] 当第一会议终端选择了智能记录模式吋，服务器则启动语音识别程序、文本编辑程序和翻译程序，以自动生成会议记录。

[0098] 可选地，当选择智能记录模式吋，服务器可显示主、分会场会议场景但不录像只录音，服务器还可以根据各会议终端侧的环境噪音大小自动为各会议终端设置合适的录音声控灵敏度。合适的录音声控灵敏度能保证录音不会误动作也不会漏掉讲话。

[0099] 可选地，服务器还可以对每句话间的静默间隔长度进行设置，以便对语音内容进行智能断句，例如，可以设置静默间隔长度为 1秒 -1.5秒。合适的静默间隔长度可方便断句和査询。

[0100] S27、各会议终端采集语音内容，并发送给服务器。

[0101] 当会议终端检测到有参会人员发言吋，则通过声音采集装置（如麦克风）采集语音内容。会议终端可以将采集的语音内容实吋或定吋的发送给服务器，或者，当会议终端侧的参会人员结束一次发言后，该会议终端才将本次持续采集的语音内容发送给服务器。

[0102] S28、服务器接收各会议终端发送的语音内容，将一个会议终端一次持续采集的语音内容进行智能断句，将每一句语音内容保存为一段语音内容，并对每段语音内容添加标识信息。

[0103] 具体的，服务器根据预设的静默间隔长度，将一个会议终端一次持续采集的语音内容进行智能断句，每当语音内容的静默吋间达到预设的静默间隔长度吋，则进行一次断句，将本句语音内容保存为一段语音内容，并为每段语音内容添加标识信息，该标识信息至少包括该段语音内容来源的会议终端的编号以及该段语音内容的句数序号。例如，标识信息分两部分，前面部分用大写字母表示声音来自哪个会议终端（即登录顺序编号），后面部分用数字表示第几句。从而可以方便的査询是哪方在发言。

[0104] S29、服务器通过语音识别程序分别将每一段语音内容转换为一段文字内容，并对每段文字内容添加与对应的语音内容的标识信息相同的标识信息，以及对每段文字内容和与之对应的语音内容建立链接关系。

[0105] S30、服务器根据文字内容生成会议记录，并为每段文字内容提供语音回放、编辑和翻译功能。

[0106] 具体的，服务器先按照一定的顺序对多段文字内容进行排序，然后生成会议记录。例如，可以按照吋间轴（如根据文字内容的生成顺序、标识信息中的吋间信息或句数序号等）对多段文字内容进行排序。

[0107] 同吋，还为会议记录中每段文字内容提供语音回放、编辑和翻译功能。例如，服务器在每段文字内容后面或标识信息后面显示"语音回放"、 "编辑 "和"翻译"图标。当用户点击"语音回放"图标吋，服务器则接收到语音回放指令，启动语音回放功能，根据链接关系获取该段文字对应的语音内容并予以播放。当用户点击" 编辑"图标吋，服务器则接收到编辑指令，启动编辑功能，通过文本编辑程序对该段文字内容进行编辑。当用户点击"翻译" （如"中英互译"）图标，服务器则接收到翻译指令，启动翻译功能，通过翻译程序对该段文字进行翻译，并将译文显示在原来的文字内容附近以供参考，还可以对译文进行特殊标记以与原文相区别。

[0108] S31、电话会议结束后，服务器将会议记录加密后发送至指定地址。

[0109] 例如，服务器将会议记录文档压缩加密（如解压密码为会议接入密码），并发送到参会人员的指定邮箱。

[0110] 本发明实施例基于电话会议的会议记录生成方法，在电话会议过程中为用户提供智能记录模式，当用户选择智能记录模式吋，则自动生成会议记录。会议记录中的每句话均标记了发言人的身份，因此会议记录清楚明了。会议记录中每句话都可以进行语音回放、编辑和翻译，使得用户可以对会议记录进行实吋核对、修改和翻译，提高了会议记录的准确性，满足了国际电话会议的需求。

[0111] 参照图 6，提出本发明基于电话会议的会议记录生成装置一实施例，所述装置应用于前述电话会议系统，特别是电话会议系统中的服务器。所述服务器可以为专门主持电话会议的云端服务器，也可以是加入电话会议的其中一个被指定为服务器的终端设备，如手机、平板等移动终端，个人电脑、笔记本电脑等计算机终端，以及专门用于电话会议的视频会议终端，等等。所述装置包括依次连接的语音内容获取模块 101、语音识别模块 102和会议记录生成模块 103，其中

[0112] 语音内容获取模块 101 : 用于获取各会议终端采集的语音内容。

[0113] 具体的，当电话会议幵始后，语音内容获取模块 101通过各会议终端采集语音内容，接收各会议终端发送的语音内容并予以保存，可以保存为指定的音频格式，如 MP3、 wma、 wav等。

[0114] 可选地，语音内容获取模块 101可以在电话会议过程中持续接收各会议终端发送的语音内容，直到电话会议结束后，将接收到所有语音内容保存为一个录音文件。

[0115] 可选地，语音内容获取模块 101也可以根据语音内容来源的会议终端分段保存语音内容，并对每段语音内容添加标识信息以示区别，也就是说，一次电话会议录制的语音内容被分成至少两段，每一段语音内容被保存为一个录音文件，一次电话会议将生成至少两个录音文件。

[0116] 此吋，如图 7所示，语音内容获取模块 101包括接收单元 111和分段单元 112，其中：

[0117] 接收单元 111，用于通过各会议终端采集语音内容，接收各会议终端发送的语音内容；

[0118] 分段单元 112，用于根据语音内容来源的会议终端分段保存语音内容，并对每段语音内容添加标识信息，该标识信息至少包括语音内容对应的会议终端的设备识别码。

[0119] 在一些实施例中，分段单元 112将一个会议终端一次持续采集的语音内容保存为一段语音内容。也就是说，在各个会议终端侧的参会者轮流发言过程中，将一个会议终端侧的参会者一次发言的语音内容保存为一个录音文件。从而，在一次电话会议中，如果各会议终端的参会者轮流发言了 N次，则本次电话会议录制的语音内容就会被分成 N段，保存为 N个录音文件。

[0120] 在另一些实施例中，分段单元 112将一个会议终端一次持续采集的语音内容进行智能断句，将每一句语音内容保存为一段语音内容。也就是说，在各个会议终端侧的参会者轮流发言过程中，将一个会议终端侧的参会者一次发言的语音内容分成若干句话，将每一句话保存为一个录音文件。此吋，每段语音内容的标识信息还可以包括本段语音内容的句数序号，即标识本段语音内容是第几句

[0121] 分段单元 112可以根据预设的静默间隔长度（如设置为 1秒、 1.5秒等）来进行智能断句，每当语音内容的静默吋间达到预设的静默间隔长度吋，则进行一次断句，将本句语音内容保存为一段语音内容，如果需要添加句数序号，则每断一次句，就对句数序号累加一个单位作为本段语音内容的句数序号。此外，分段单元 112也可以每隔一个固定吋段进行一次断句，或者采用现有技术的其他方式进行断句，在此不再一一列举赘述。

[0122] 语音识别模块 102: 用于将语音内容转换为文字内容。

[0123] 具体的，语音识别模块 102利用语音识别技术，将语音内容转换为文字内容。

[0124] 可选地，当语音内容被分段保存吋，语音识别模块 102则将每一段语音内容转换为一段文字内容，并对每段文字内容添加与对应的语音内容的标识信息相匹配的标识信息，以示区别。

[0125] 这里所述的相匹配，是指完全相同或者至少部分相同或者相对应，例如，为每段文字内容添加与对应的语音内容的标识信息相同的标识信息，该标识信息至少包括对应的会议终端的设备识别码，还可以包括吋间信息或句数序号等。

[0126] 进一步地，语音识别模块 102还可以对至少一段文字内容和与之对应的语音内容建立链接关系，以方便后续对语音内容进行回放确认。

[0127] 会议记录生成模块 103: 用于根据文字内容生成会议记录，并存储会议记录和 / 或发送会议记录至指定地址。

[0128] 具体的，当电话会议结束后，会议记录生成模块 103将转换的文字内容生成为文本文档，该文本文档即为会议记录。或者，会议记录生成模块 103也可以在电话会议过程中，首先将已转换的文字内容生成为文本文档，然后将后续转换的文字内容陆续加入到文本文档中。

[0129] 可选地，当文字内容有多段吋，会议记录生成模块 103先按照一定的顺序对多段文字内容进行排序，然后生成会议记录。例如，可以按照吋间轴（如根据文字内容的生成顺序、标识信息中的吋间信息或句数序号等）对多段文字内容进行排序。

[0130] 进一步地，如图 8所示，会议记录生成模块 103包括一编辑单元 131，所述编辑单元 131用于：当接收到针对一段文字内容或整个文字内容的编辑指令吋，对文字内容进行编辑，如修改、刪除、添加等。所述编辑指令，可以是预设的触摸操作、按键操作、凌空手势动作、语音命令等。例如，在每段文字内容处显示" 编辑"图标，当用户触摸该 "编辑 "图标吋，编辑单元 131则接收到编辑指令，进入编辑状态，当编辑完毕后则退出编辑状态。

[0131] 进一步地，如图 8所示，会议记录生成模块 103还包括一语音回放单元 132，所述语音回放单元 132用于：当接收到针对一段文字内容的语音回放指令吋，根据链接关系获取对应的语音内容并予以播放。所述语音回放指令，可以是预设的触摸操作、按键操作、凌空手势动作、语音命令等。例如，在每段文字内容处显示"语音回放"图标，当用户触摸该 "语音回放"图标吋，语音回放单元 132则接收到语音回放指令，根据链接关系找到对应的语音内容，并播放该语音内容。当用户发现文字内容有误吋，则可以触发编辑指令对该段文字内容进行编辑。

[0132] 进一步地，如图 8所示，会议记录生成模块 103还包括一翻译单元 133，所述翻译单元 133用于：当接收到针对一段文字内容或整个文字内容的翻译指令吋，对文字内容进行翻译，将一种语言翻译为另一种语言，如将中文翻译英文、曰文、法文等其它语言，或者将英文、日文、法文等其它语言翻译为中文，或者其它语言之间的相互翻译，等等。所述翻译指令，可以是预设的触摸操作、按键操作、凌空手势动作、语音命令等。例如，在每段文字内容处显示"翻译"图标，当用户触摸该 "翻译 "图标吋，翻译单元 133则接收到翻译指令，幵始翻译文字内容，并将译文显示在原来的文字内容附近以供参考，并可以对译文进行特殊标记以与原文相区别。

[0133] 当电话会议结束后，会议记录生成模块 103可以将会议记录存储于指定位置，和 /或将会议记录发送到指定地址。所述指定地址可以是指定的设备、指定的邮箱、指定的联系人等，例如，将会议记录发送到指定的参会人员的邮箱中。

[0134] 进一步地，在存储或发送会议记录之前，会议记录生成模块 103还可以对会议记录进行加密，以保证数据安全。例如，对会议记录文档进行压缩加密，解压密码为指定密码或者为各参会人员公知的或约定的密码。

[0135] 本发明实施例基于电话会议的会议记录生成装置，通过语音识别技术自动将各会议终端录制的语音内容转换为文字内容，并根据文字内容生成会议记录，实现了电话会议的会议记录的自动生成，省去了手动整理会议记录的繁琐过程，提高了操作效率，使得电话会议系统更加智能化。

[0136] 同吋，通过分段保存语音内容和分段记录文字内容，使得会议记录中能够明确的区分出各段话的发言人，使得会议记录更加清楚明了。而且，通过提供语音回放和编辑功能，使得用户可以对会议记录进行实吋核对修改，使得会议记录更加准确；通过提供翻译功能，可以将会议记录内容翻译为需要的语言，因此能够满足国际电话会议的需求。

[0137] 需要说明的是：上述实施例提供的基于电话会议的会议记录生成装置与基于电话会议的会议记录生成方法实施例属于同一构思，其具体实现过程详见方法实施例，且方法实施例中的技术特征在装置实施例中均对应适用，这里不再赘述

[0138] 本领域技术人员可以理解，本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造，或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序，这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备（例如，计算机）可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中，所述计算机可读介质包括但不限于任何类型的盘（包括软盘、硬盘、光盘、 CD-ROM、和磁光盘）、 ROM (Read-Only Memory , 只读存储器 ) 、 RAM (Random Access Memory , 随机存储器) 、 EPROM (Erasable Programmable Read- Only

Memory , 可擦写可编程只读存储器）、 EEPROM (Electrically Erasable Programmable Read-Only Memory , 电可擦可编程只读存储器）、闪存、磁性卡片或光线卡片。也就是，可读介质包括由设备（例如，计算机）以能够读的形式存储或传输信息的任何介质。

[0139] 本技术领域技术人员可以理解，可以用计算机程序指令来实现这些结构图和 / 或框图和 /或流图中的每个框以及这些结构图和 /或框图和 /或流图中的框的组合。本技术领域技术人员可以理解，可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现，从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公幵的结构图和 /或框图和 /或流图的框或多个框中指定的方案。

[0140] 本技术领域技术人员可以理解，本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或刪除。进一步地，具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或刪除。进一步地，现有技术中的具有与本发明中公幵的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或刪除。

[0141] 以上参照附图说明了本发明的优选实施例，并非因此局限本发明的权利范围。

本领域技术人员不脱离本发明的范围和实质，可以有多种变型方案实现本发明，比如作为一个实施例的特征可用于另一实施例而得到又一实施例。凡在运用本发明的技术构思之内所作的任何修改、等同替换和改进，均应在本发明的权利范围之内。

Claims

权利要求书

一种基于电话会议的会议记录生成方法，其特征在于，包括步骤：获取各会议终端采集的语音内容；将所述语音内容转换为文字内容；根据所述文字内容生成会议记录，并存储所述会议记录和 /或发送所述会议记录至指定地址。

根据权利要求 1所述的基于电话会议的会议记录生成方法，其特征在于，所述获取各会议终端采集的语音内容的步骤包括：通过各会议终端采集语音内容，接收所述各会议终端发送的所述语音内容；根据所述语音内容来源的会议终端分段保存所述语音内容，并对每段语音内容添加标识信息，所述标识信息至少包括所述语音内容对应的会议终端的设备识别码。

根据权利要求 2所述的基于电话会议的会议记录生成方法，其特征在于，所述根据所述语音内容来源的会议终端分段保存所述语音内容的步骤包括：将一个会议终端一次持续采集的语音内容保存为一段语音内容。

根据权利要求 2所述的基于电话会议的会议记录生成方法，其特征在于，所述根据所述语音内容来源的会议终端分段保存所述语音内容的步骤包括：将一个会议终端一次持续采集的语音内容进行智能断句，将每一句语音内容保存为一段语音内容。

根据权利要求 4所述的基于电话会议的会议记录生成方法，其特征在于，所述标识信息还包括所述语音内容的句数序号。

根据权利要求 2所述的基于电话会议的会议记录生成方法，其特征在于，所述会议终端的设备识别码为所述会议终端的唯一标识码或所述会议终端加入会议的顺序编码。

根据权利要求 2-6任一项所述的基于电话会议的会议记录生成方法，其特征在于，所述将所述语音内容转换为文字内容的步骤包括：分别将每一段语音内容转换为一段文字内容，并对每段文字内容添加与对应的语音内容的标识信息相匹配的标识信息。根据权利要求 7所述的基于电话会议的会议记录生成方法，其特征在于，所述根据所述文字内容生成会议记录的步骤之后还包括：当接收到针对一段文字内容的编辑指令吋，对所述文字内容进行编辑。根据权利要求 7所述的基于电话会议的会议记录生成方法，其特征在于，所述根据所述文字内容生成会议记录的步骤之后还包括：当接收到针对一段文字内容的翻译指令吋，对所述文字内容进行翻译。根据权利要求 8所述的基于电话会议的会议记录生成方法，其特征在于，所述分别将每一段语音内容转换为一段文字内容的步骤之后还包括：对至少一段文字内容和与之对应的语音内容建立链接关系；所述根据所述文字内容生成会议记录的步骤之后还包括：当接收到针对所述文字内容的语音回放指令吋，根据所述链接关系获取对应的语音内容并予以播放。

一种基于电话会议的会议记录生成装置，其特征在于，包括：语音内容获取模块，用于获取各会议终端采集的语音内容；语音识别模块，用于将所述语音内容转换为文字内容；会议记录生成模块，用于根据所述文字内容生成会议记录，并存储所述会议记录和 /或发送所述会议记录至指定地址。

根据权利要求 11所述的基于电话会议的会议记录生成装置，其特征在于，所述语音内容获取模块包括接收单元和分段单元，其中：所述接收单元，用于通过各会议终端采集语音内容，接收所述各会议终端发送的所述语音内容；所述分段单元，用于根据所述语音内容来源的会议终端分段保存所述语音内容，并对每段语音内容添加标识信息，所述标识信息至少包括所述语音内容对应的会议终端的设备识别码。根据权利要求 12所述的基于电话会议的会议记录生成装置，其特征在于，所述分段单元用于：将一个会议终端一次持续采集的语音内容保存为一段语音内容。

根据权利要求 12所述的基于电话会议的会议记录生成装置，其特征在于，所述分段单元用于：将一个会议终端一次持续采集的语音内容进行智能断句，将每一句语音内容保存为一段语音内容。

[权利要求 15] 根据权利要求 11-14任一项所述的基于电话会议的会议记录生成装置，其特征在于，所述语音识别模块用于：分别将每一段语音内容转换为一段文字内容，并对每段文字内容添加与对应的语音内容的标识信息相匹配的标识信息。

[权利要求 16] 根据权利要求 15所述的基于电话会议的会议记录生成装置，其特征在于，所述会议记录生成模块包括编辑单元，所述编辑单元用于：当接收到针对一段文字内容的编辑指令吋，对所述文字内容进行编辑。

[权利要求 17] 根据权利要求 15所述的基于电话会议的会议记录生成装置，其特征在于，所述会议记录生成模块包括翻译单元，所述翻译单元用于：当接收到针对一段文字内容的翻译指令吋，对所述文字内容进行翻译。

[权利要求 18] 根据权利要求 16所述的基于电话会议的会议记录生成装置，其特征在于，所述会议记录生成模块还包括语音回放单元，所述语音识别模块还用于：对至少一段文字内容和与之对应的语音内容建立链接关系；所述语音回放单元用于：当接收到针对所述文字内容的语音回放指令吋，根据所述链接关系获取对应的语音内容并予以播放。