WO2013182129A2

WO2013182129A2 - 一种云笔记实现方法及装置

Info

Publication number: WO2013182129A2
Application number: PCT/CN2013/079366
Authority: WO
Inventors: 陈斌
Original assignee: 中兴通讯股份有限公司
Priority date: 2013-03-22
Filing date: 2013-07-15
Publication date: 2013-12-12
Also published as: WO2013182129A3; CN104064188A

Abstract

一种云笔记实现方法及装置，其中，所述装置包括：交互模块、语音文字化处理模块以及语音文字化云笔记生成模块，所述方法包括：云端接收终端发来的语音音频段的数据；所述云端对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，对所述格式化的处理结果再进行文档逻辑化处理；所述云端接收所述语音音频段的数据结束后，根据所有经文档逻辑化处理后的内容生成整体的云笔记文档。这种方法及装置将语音转换为文字化信息，把语音真正融入到通用的信息流中，真正实现互联网的语音信息化。

Description

一种云笔记实现方法及装置

技术领域

本发明涉及通信领域，尤其涉及一种云笔记实现方法及装置。

背景技术随着移动终端的日益普及，围绕移动终端的语音场景层出不穷，包括通话等沟通类场景、会议场景、课堂场景、访谈场景、直播场景等等。语音当之无愧的成为最为普通的、覆盖面非常大的用户场景，包含了大量 "用户数据" ，真可谓 "数据金矿" ！挖掘语音数据的黄金价值的关键在于：要改变语音数据单独存在的现状，要让语音数据融于文字化的数据流中，才能让其价值不断的提升。

相关技术中，互联网上为移动终端提供的云笔记类应用渐趋热门，主要有印象笔记、有道云笔记等，就目前业务形式来看， "语音内容上传互联网" 还只是简单的将终端的语音文件直接上传到云端，仍然以语音格式的文件存在，相当于终端侧录音文件的云上传。对于语音格式文件，只能通过播放器播放，无法与互联网的数据流、内容流融通，使得移动语音资源的信息化拓展空间受限。发明内容本发明实施例提供一种云笔记实现方法及装置，将语音转换为文字化信息， 4巴语音真正融入到通用的信息流中，真正实现互联网的语音信息化。为了解决上述技术问题，本发明实施例提供了一种云笔记实现方法，包括：云端接收终端发来的语音音频段的数据；所述云端对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，对所述格式化的处理结果再进行文档逻辑化处理；以及所述云端接收所述语音音频段的数据结束后，根据所有经文档逻辑化处理后的内容生成整体的云笔记文档。所述云端对所述语音音频段进行语音到文字的转换并生成格式化的处理结果的步骤包括：所述云端识别所述语音音频段中的可识别文字部分以及各空白段的时间段长度，生成格式化的处理结果，所述处理结果的格式为：文字部分以及在文字前后或文字中间分布的一个或多个空白段的时间段长度。

所述云端根据所述空白段的时间段长度与文档逻辑符号的对应关系，将所述空白段转换为相应的文档逻辑符号，并将所述格式化的处理结果生成云笔记文档。在所述云端接收终端发来的语音音频段的数据之前，所述方法还包括：所述云端接收所述终端发送的本次云笔记的头信息并保存，并发送确认信息给所述终端；以及当所述云端根据所有经文档逻辑化处理后的内容生成整体的云笔记文档时，将保存的本次云笔记的头信息作为所述云笔记文档的头信息。所述方法还包括：所述云端将所述整体的云笔记文档保存在用户账号下的云端个人数据中心的云笔记中的语音笔记子目录中。为了解决上述技术问题，本发明实施例还提供了一种云笔记实现装置，包括：

交互模块，其设置成：接收终端发来的语音音频段的数据；语音文字化处理模块，其设置成：对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，对所述格式化的处理结果再进行文档逻辑化处理，并将经文档逻辑化处理后的内容发送至语音文字化云笔记生成模块；以及语音文字化云笔记生成模块，其设置成：接收并保存所述语音文字化处理模块发来的经文档逻辑化处理后的内容，并在接收所述语音音频段的数据结束后，根据所有经文档逻辑化处理后的内容生成整体的云笔记文档。所述语音文字化处理模块还包括：语音文字转换模块，其设置成：识别所述语音音频段中的可识别文字部分以及各空白段的时间段长度，生成格式化的处理结果，并将所述格式化的处理结果发送至文档逻辑化处理模块；所述处理结果的格式为：文字部分以及在文字前后或文字中间分布的一个或多个空白段的时间段长度；以及文档逻辑化处理模块，其设置成：接收所述语音文字转换模块发送来的格式化的处理结果，并根据所述空白段的时间段长度与文档逻辑符号的对应关系，将所述空白段转换为相应的文档逻辑符号，并将所述格式化的处理结果生成云笔记文档。所述交互模块还设置成：接收所述终端发送的本次云笔记的头信息并保存，并发送确认信息给所述终端；以及所述语音文字化云笔记生成模块还设置成：当根据所有经文档逻辑化处理后的内容生成整体的云笔记文档时，将保存的本次云笔记的头信息作为所述云笔记文档的头信息。所述语音文字化云笔记生成模块还设置成：将所述整体的云笔记文档保存在用户账号下的云端个人数据中心的云笔记中的语音笔记子目录中。

本发明实施例提供的一种云笔记实现方法及装置，利用云端高效的云计算处理能力支撑下的语音文字化处理过程，将语音转换为文字化信息，形成云笔记，进入云服务的个人数据中心，从而与云服务系统融通，后续还可以进一步拓展各种云服务，例如，同步、共享等，把语音真正融入到通用的信息流中，真正实现互联网的语音信息化。

附图概述图 1 是实施例中语音文字化的云笔记实现装置的结构图；图 2 是实施例中语音文字化的云笔记实现方法流程图；图 3是一个应用示例中移动终端的结构图；图 4是一个应用示例中语音文字化的云笔记实现装置的结构图；图 5是一个应用示例中语音文字化的云笔记实现方法流程图。

本发明的较佳实施方式

下文中将结合附图对本发明的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

实施例：

如图 1所示，本实施例提供了一种云笔记实现装置，包括：交互模块 11 , 其设置成：接收终端发来的语音音频段的数据；语音文字化处理模块 12, 其设置成：对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，对所述格式化的处理结果再进行文档逻辑化处理，并将经文档逻辑化处理后的内容发送至语音文字化云笔记生成模块 13; 其中，所述语音文字化处理模块 12还包括：语音文字转换模块 121 , 其设置成：识别所述语音音频段中的可识别文字部分以及各空白段的时间段长度，生成格式化的处理结果，并将所述格式化的处理结果发送至文档逻辑化处理模块 122; 所述处理结果的格式为：文字部分以及在文字前后或文字中间分布的一个或多个空白段的时间段长度；文档逻辑化处理模块 122 , 其设置成：接收所述语音文字转换模块 121 发送来的格式化的处理结果，并根据所述空白段的时间段长度与文档逻辑符号的对应关系，将所述空白段转换为相应的文档逻辑符号，并将所述格式化的处理结果生成云笔记文档。语音文字化云笔记生成模块 13 , 其设置成：接收并保存所述语音文字化处理模块 12发来的经文档逻辑化处理后的内容，并在所述交互模块 11接收语音音频段的数据结束后，根据所有经文档逻辑化处理后的内容生成整体的笔记文档。所述交互模块 11还设置成：接收所述终端发送的本次云笔记的头信息并保存，并发送确认信息给所述终端；所述语音文字化云笔记生成模块 13还设置成：当根据所有经文档逻辑化处理后的内容生成整体的云笔记文档时，将保存的本次云笔记的头信息作为所述云笔记文档的头信息。所述语音文字化云笔记生成模块 13还设置成：将所述整体的云笔记文档保存在用户账号下的云端个人数据中心的云笔记中的语音笔记子目录中。

如图 2所示，本实施例提供了一种云笔记实现方法，包括以下步骤： S101 : 云端接收终端发来的语音音频段的数据；

S102: 云端对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，对所述格式化的处理结果再进行文档逻辑化处理；

其中，所述云端对所述语音音频段进行语音到文字的转换并生成格式化的处理结果的步骤包括：

所述云端识别所述语音音频段中的可识别文字部分以及各空白段的时间段长度，生成格式化的处理结果，所述处理结果的格式为：文字部分以及在文字前后或文字中间分布的一个或多个空白段的时间计数长度。包括：

所述云端根据所述空白段的时间段长度与文档逻辑符号的对应关系，将所述空白段转换为相应的文档逻辑符号，并将所述格式化的处理结果生成云笔记文档。

S103 : 在云端接收所述语音音频段的数据结束后，根据所有经文档逻辑化处理后的内容生成整体的云笔记文档。在步骤 S101之前还包括：所述云端接收所述终端发送的本次云笔记的头信息并保存，并发送确认信息给所述终端；

步骤 S103还包括：所述云端根据所有经文档逻辑化处理后的内容生成整体的笔记文档时，将保存的本次云笔记的头信息作为该笔记文档的头信息。

在步骤 S103之后还包括以下步骤：

所述云端将所述整体的笔记文档保存在用户账号下的云端个人数据中心的"云笔记 "中的"语音笔记，，子目录中。

在一个应用示例中，以移动终端为例，当然也不排除其他如 PC等可以与云端进行交互，并且能够釆集音频数据上传云端的终端。移动终端通过循环釆集，将循环釆集的音频数据分批上传至云端，可以减轻终端处理负荷、优化业务过程，且移动终端具有便携性好，釆集语音实时性强的优点，使得 "语音云笔记" 的业务体验真正达到用户级要求。因此，下面以移动终端为例，对本实施例做详细说明。如图 3所示，该移动终端至少包括：语音文字化云笔记功能设置模块 31、语音釆集模块 32、语音緩存模块 33和数据交互模块 34。

所述语音文字化云笔记功能设置模块 31 , 在终端上为语音文字化云笔记功能的运行提供设置。该模块提供 "启动" I "停止" 语音文字化云笔记的功能键。用户点击 "启动"键后进入登录云端的登录界面，完成登录后进入 "启动" 配置界面，该界面为本次云笔记任务填写包括但不限于以下信息项：云笔记标题、角色说明以及场景说明，作为本次语音文字化云笔记的头信息。

所述语音釆集模块 32, 其设置成：在终端平台上釆集语音。该模块在语音文字化云笔记功能开启状态下一直处在工作状态，并循环向语音緩存模块 33存入语音数据。

所述语音緩存模块 33 , 其设置成：緩存从语音釆集模块 32釆集到的语音数据。所述数据交互模块 34, 其设置成：终端与云端之间的消息交互，将本次云笔记的头信息发送至云端，以及将语音緩存模块 33的緩冲区语音数据依次提取并向云端发送。

在本应用示例中，如图 4所示，所述语音文字化的云笔记实现装置包括：数据交互模块 41、语音文字转换模块 42、文档逻辑化处理模块 43、数据緩存模块 44和语音文字化云笔记生成模块 45 , 其中：

所述数据交互模块 41 , 其设置成：云端与移动终端之间的消息交互，接收移动终端发送的本次云笔记的头信息并保存，发送确认信息给所述终端；并接收来自移动终端的数据交互模块发送过来的语音音频段的数据，并循环传递到语音文字转换模块 42, 以及接收来自移动终端结束本次云笔记消息，并传递给语音文字化云笔记生成模块 45;

所述语音文字转换模块 42, 其设置成：将数据交互模块 41传递来的语音数据进行语音文字转换及空白段处理，即识别当前釆集的音频段中的可识别文字部分以及各空白段的时间段长度，并生成格式化的处理结果，所述处理结果的格式为：文字部分以及在文字前后、文字中间分布的一个或多个空白段的时间段长度，该时间段长度单位为秒。语音文字转换模块 42将格式化的处理结果输出给文档逻辑化处理模块 43;

所述文档逻辑化处理模块 43 , 其设置成：接收所述语音文字转换模块 42 发送来的格式化的处理结果，并根据系统设定的所述空白段的时间段长度与文档逻辑符号的对应逻辑规则，将语音文字转换模块 42输出的格式化的处理结果进行文档逻辑化处理：对于空白段，根据其时间段长度分级转换为相应的文档逻辑符号，这里文档逻辑符号包括：冒号、逗号、顿号、双引号、句号，以及换行符、段落符等，这样文档逻辑化处理模块 43就可以根据空白段的时间段长短生成有文档逻辑符号有段落的云笔记文档了。所述文档逻辑化处理模块 43将逻辑化处理的当前结果存入数据緩存模块 44;

所述数据緩存模块 44, 其设置成：緩存来自文档逻辑化处理模块 43循环输出的文档数据；

所述语音文字化云笔记生成模块 45 , 其设置成：在收到数据交互模块 41 发来的结束本次云笔记消息后，将数据緩存模块 44中的文档数据构建成整体的文字化云笔记，并通过文档头信息生成本次云笔记的笔记文档，格式为 txt; 并将整体的文字化云笔记文档保存在用户账号下的云端个人数据中心的"云笔记"中的"语音笔记"子目录中。

在本应用示例中，以学生听讲座的语音场景为例，釆用上述应用示例中的移动终端和语音文字化的云笔记实现装置，如图 5所示，语音文字化的云笔记实现方法，包括以下步骤：

S201 : 用户点击移动终端语音文字化云笔记功能设置模块中的 "启动" 键；

S202: 用户进入登录云端的登录界面，用户完成登录后进入 "启动" 配置界面；

S203 : 用户完成语音文字化云笔记 "启动 "配置中的信息项（包括：云笔记标题：讲座 -2013.03.20、角色说明：学生、场景说明：听讲座)的信息配置，作为本次云笔记的头信息，然后，通过系统提交给移动终端的数据交互模块； S204: 移动终端的数据交互模块把为本次语音文字化云笔记配置的头信息发送给云端的数据交互模块；

S205: 云端的数据交互模块接收到本次语音文字化云笔记的头信息后，给移动终端发送确认消息；

S206: 移动终端的数据交互模块接收到云端确认消息后，提示用户本次云笔记在用户 "确认" 后可开始工作；

S207: 用户 "确认" 后，移动终端的语音釆集模块开始循环釆集语音数据；

S208: 移动终端的语音釆集模块在釆集语音的每个循环中，将釆集到的语音数据存入移动终端的语音緩存模块；

S209: 移动终端的数据交互模块从移动终端的语音緩存模块中提取当前緩存语音数据向云端的数据交互模块发送；

S210: 云端的数据交互模块接收到当前语音数据段后传递给云端的语音文字转换模块； S211 : 云端的语音文字转换模块对当前的语音段数据进行语音文字转换及空白段处理，并生成格式化的处理结果，将该处理结果输出给云端的文档逻辑化处理模块；

S212: 云端的文档逻辑化处理模块根据系统设定的逻辑规则，将语音文字转换模块输出的格式化的处理结果进行文档逻辑化处理，并将处理结果存入云端的数据緩存模块；

S213 : 用户在终端侧关闭语音文字化云笔记功能，移动终端的数据交互模块向云端的数据交互模块发送语音文字化云笔记结束消息；

S214: 当云端的数据交互模块接收到该结束消息后，调用语音文字化云笔记生成模块；语音文字化云笔记生成模块从云端的数据緩存模块中获取到所有经文档逻辑化处理后的所有内容块后生成整体的笔记内容，并通过文档头信息生成本次云笔记的笔记文档，格式为 txt; 并将本次云笔记完整的语音文字化笔记文档保存在用户账号下的云端个人数据中心的 "云笔记"中的 "语音笔记"子目录中。从上述实施例可以看出，相对于相关技术，上述实施例中提供的云笔记实现方法及装置，通过移动终端作为语音信息入口，利用移动终端循环釆集分批上传音频数据，以及其便携性和随时可以釆集音频数据的优点，釆用移动终端的緩冲技术将现场语音数据依次发送到云端，利用云端高效的云计算处理能力支撑下的语音文字化处理过程，将语音数据转换为文字化信息，形成云笔记，进入云服务的个人数据中心，从而与云服务系统融通，后续还可以拓展各种云服务，例如，同步、共享等，把语音真正融入到通用的信息流中，真正实现互联网的语音信息化。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的各模块 /单元可以釆用硬件的形式实现，也可以釆用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。

以上所述仅为本发明的优选实施例而已，并非用于限定本发明的保护范围。根据本发明的发明内容，还可有其他多种实施例，在不背离本发明精神改变和变形，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

工业实用性

Claims

权利要求书

1、一种云笔记实现方法，包括：云端接收终端发来的语音音频段的数据；所述云端对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，对所述格式化的处理结果再进行文档逻辑化处理；以及所述云端接收所述语音音频段的数据结束后，根据所有经文档逻辑化处理后的内容生成整体的云笔记文档。

2、如权利要求 1所述的方法，其中：所述云端对所述语音音频段进行语音到文字的转换并生成格式化的处理结果的步骤包括：所述云端识别所述语音音频段中的可识别文字部分以及各空白段的时间段长度，生成格式化的处理结果，所述处理结果的格式为：文字部分以及在文字前后或文字中间分布的一个或多个空白段的时间段长度。

3、如权利要求 2所述的方法，其中：

4、如权利要求 1所述的方法，其中：在所述云端接收终端发来的语音音频段的数据之前，所述方法还包括：所述云端接收所述终端发送的本次云笔记的头信息并保存，并发送确认信息给所述终端；以及当所述云端根据所有经文档逻辑化处理后的内容生成整体的云笔记文档时，将保存的本次云笔记的头信息作为所述云笔记文档的头信息。

5、如权利要求 4所述的方法，所述方法还包括：所述云端将所述整体的云笔记文档保存在用户账号下的云端个人数据中心的云笔记中的语音笔记子目录中。

6、一种云笔记实现装置，包括：

交互模块，其设置成：接收终端发来的语音音频段的数据；语音文字化处理模块，其设置成：对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，对所述格式化的处理结果再进行文档逻辑化处理，并将经文档逻辑化处理后的内容发送至语音文字化云笔记生成模块；以及语音文字化云笔记生成模块，其设置成：接收并保存所述语音文字化处理模块发来的经文档逻辑化处理后的内容，并在接收所述语音音频段的数据结束后，根据所有经文档逻辑化处理后的内容生成整体的云笔记文档。

7、如权利要求 6所述的装置，其中：所述语音文字化处理模块还包括：语音文字转换模块，其设置成：识别所述语音音频段中的可识别文字部分以及各空白段的时间段长度，生成格式化的处理结果，并将所述格式化的处理结果发送至文档逻辑化处理模块；所述处理结果的格式为：文字部分以及在文字前后或文字中间分布的一个或多个空白段的时间段长度；以及文档逻辑化处理模块，其设置成：接收所述语音文字转换模块发送来的格式化的处理结果，并根据所述空白段的时间段长度与文档逻辑符号的对应关系，将所述空白段转换为相应的文档逻辑符号，并将所述格式化的处理结果生成云笔记文档。

8、如权利要求 6所述的装置，其中：所述交互模块还设置成：接收所述终端发送的本次云笔记的头信息并保存，并发送确认信息给所述终端；以及所述语音文字化云笔记生成模块还设置成：当根据所有经文档逻辑化处理后的内容生成整体的云笔记文档时，将保存的本次云笔记的头信息作为所述云笔记文档的头信息。

9、如权利要求 8所述的装置，其中：所述语音文字化云笔记生成模块还设置成：将所述整体的云笔记文档保存在用户账号下的云端个人数据中心的云笔记中的语音笔记子目录中。