CN102486801A - 一种语音识别方式获取出版物内容的方法 - Google Patents

一种语音识别方式获取出版物内容的方法 Download PDF

Info

Publication number
CN102486801A
CN102486801A CN2011102623361A CN201110262336A CN102486801A CN 102486801 A CN102486801 A CN 102486801A CN 2011102623361 A CN2011102623361 A CN 2011102623361A CN 201110262336 A CN201110262336 A CN 201110262336A CN 102486801 A CN102486801 A CN 102486801A
Authority
CN
China
Prior art keywords
content
user
publication
terminal
contents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011102623361A
Other languages
English (en)
Inventor
顾健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Bolu Information Technology Co Ltd
Original Assignee
Shanghai Bolu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Bolu Information Technology Co Ltd filed Critical Shanghai Bolu Information Technology Co Ltd
Priority to CN2011102623361A priority Critical patent/CN102486801A/zh
Publication of CN102486801A publication Critical patent/CN102486801A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明揭示了一种语音识别方式获取出版物内容的方法,包含移动终端客户端,接口模块、业务逻辑模块,语音识别模块,数据搜索模块、资源推送模块等模块。本发明通过后台内容系统预先抓取和保存出版物内容,用户口述出版物部分内容,终端或系统进行语音的识别,将用户口述的语音片段转换为文本内容,并以该部分文字内容为关键词搜索后台数据库系统,系统搜索到对应的完整内容后推送该部分内容到用户的系统空间或用户自定义空间,从而帮助用户快速获取对应出版物内容的数字资源。 本发明通过移动终端用户口述部分出版物内容进行搜索获取对应出版物电子版本,为用户便捷获取和保存出版物内容提供了一种高效的方法。

Description

一种语音识别方式获取出版物内容的方法
技术领域
本发明涉及智能终端和系统软件,语音识别技术领域,更具体地说,涉及一种语音识别方式获取出版物内容的方法。
背景技术
随着移动通信业务的发展,特别是第三代移动通信业务技术的发展,移动通信与互联网结合越来越紧密,移动增值业务益发丰富。在这种移动通信业务大发展的情况下,各个运营商都在大力进军增值业务领域,尝试建立各种移动通信增值业务平台。
传统出版物媒体非常丰富,各种媒体刊物内容繁多,很多用户想保存部分或全部内容,传统方式是复印或购买出版物进行保存,对于用户来说非常不便,而移动终端的发展可以方便的获取出版物对应的电子版本的内容和进行小额的计费,同时,语音识别技术的发展,提供了基于终端和系统的语音识别能力,通过语音获取文本进行自动化的搜索和内容的推送,解决了用户快速获取出版物内容的需求。
发明内容
通过用户口述出版物部分内容在终端或请求系统进行语音识别和解析断句获取对应文本内容,并通过系统后台进行内容的搜索,获取出版物电子版本并推送到用户预设或系统的存储空间,为用户提供了使用简单快捷的一种语音识别方式获取出版物内容的方法。
 
具体来说具有以下优点:
使用方式简单:
    用户简单地口述出版物部分语句即可获取对应出版物内容,无需出版物进行编码等配合,系统自动进行语句的识别,解析和识别,实现方式简单便捷。
云模式识别:
     满足不同能力的终端,可以在终端进行语音的识别,也可以通过系统端的语音识别服务进行语音识别,满足了不同硬件层次能力的终端。
存储方式灵活:
存储方式满足多种方式,用户可以灵活指定各种方式存储系统推送的电子化内容,包含邮件,网上空间(网络硬盘等)。
多层次获取粒度:
根据识别出版物内容所在部分,如正文,标题,书籍封面文字,系统判断内容是整个出版物还是出版物的一部分,如一本书中的一篇文章。
自动推送和保存:
    用户触发业务后,系统将自动推送内容到用户绑定的存储空间或者用户设定的邮箱等个人存储空间,获取的内容的粒度多样,根据用户的选择可以是出版物的部分内容也可以是全部出版物的内容。
 
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明系统模块结构的示意图。
图2为本发明业务流程示意图。
图3为本发明用户注册流程。
图4为本发明用户计费流程示意图。
图5为本发明语音识别流程示意图。
 
具体实施方式
下面参照附图对本发明进行更全面的描述,其中说明本发明的示例性实施例。
为实现上述目的,提出了一种语音识别方式获取出版物内容的方法。
以下通过结合附图,对本发明的实施方式进行描述
实现一种语音识别方式获取出版物内容的方法的关键点如下:
语音获取:
    用户通过终端麦克风录下用户选取和口述的出版物部分片段内容并编码压缩成语音识别接受的语音格式,内容范围包含封面,标题,正文内容的一部分,对应整本书,一篇文章,系统约定用户选取范围为一个以上的完整的句子,以保证断句和选取关键语句,关键词的成功率。
语音识别:
    用户口述文字启动语音识别,识别模块在终端或系统端,根据终端能力在终端安装语音识别库进行语音识别,或系统端提供语音识别能力并以服务形式进行开放,终端请求系统端的语音识别服务,提交记录的语音数据,系统进行语音识别。
智能断句:
    在识别部分文字后,系统将根据文字语义和标点符号,截取完整的句子或多个词语作为搜索的关键词,智能进行断句和提取搜索关键词。
全文检索:
    系统在获取用户扫描的文本并进行断句后的关键句或关键词,在系统数据库进行全文检索,搜索系统内和和系统具有接口的第三方存储系统,并将搜索结果提供给业务逻辑模块进行处理。
网络推送和保存
用户触发请求数字资源业务,系统成功查询和获取到用户请求的数字
资源后,系统根据用户预置的推送逻辑将数字内容进行推送到用户预置的媒体空间或者根据用户的选择保存在系统,系统为用户分配对应数字资源的访问权限,用户通过系统分配的权限对该资源进行存取。
分布式查询:
    内容存储系统由集中式存储和分布式存储构成,用户的请求首先在本
地集中存储系统进行查询,如未查询到则根据用户请求的内容定向到对应的存储平台进行获取,获取成功后保存该对象的副本在本地集中式存储系统中供其他用户的快速获取。
 
主要功能模块如图1所示:
移动终端侧:
终端是指具备移动互联网网功能和相机的各种智能终端设备,包含智能手机,带移动数据功能的平板电脑等设备;
终端本地存储100:
     保存终端数据的数据库,包含各种应用数据,系统数据等,并提供数据存取的接口。
业务逻辑101:
    终端业务逻辑,执行和完成各个业务的逻辑功能,并与周边的各个功能模块进行数据的传递和功能的调用。
录音模块102:
    调用终端音频功能和麦克风记录用户语音,并转换为识别服务模块要求的语音格式,提供给识别模块进行内容的识别。
语音识别模块103:
    终端侧可选模块,负责识别用户口述的语音内容,并将其转换为文字提供给搜索等其他功能模块。
消息模块104:
    终端侧负责收发系统各种消息,并提供给其他逻辑模块,给用户进行消息的提示和查看。
服务请求模块105:
    与系统远程服务的接口,终端通过请求远程系统提供各种服务功能,包含识别服务等。
认证模块106:
    负责管理用户的鉴权认证数据,发起和提交终端的鉴权和认证数据到系统进行鉴权,并接收对应的鉴权认证消息。
接口模块107: 
    终端与系统之间的数据接口,通过接口发送和接收系统端的服务响应消息的各种数据。
用户参数配置管理模块108:
    终端侧用户进行各种用户参数和业务参数的配置,包含用户数据配置,业务参数配置,包含保存内容空间的设置,用户的付费参数等。
传输通道109:
包含移动网和互联网,承载数据传输通道和各种业务,传输终端和系统之间的各种数据。
用户资源空间110:
     用户设定的用于保存数字资源的网络空间,可以是邮件、网络空间,
网络硬盘等可以通过网络进行存取的网络空间,用户需授权系统进行用户
空间的存取或者将资源保存在系统平台,系统平台分配用户的访问权限。
资源数据库111:
    系统中负责保存本地的数字资源的数据库,提供各种数据库的管理功
能如信息的查询,增加,删除等功能。
数据接口模块112:
  负责与移动终端通过数据网进行通信,获取移动终端提交的编码信息
和系统与业务请求交互的各种数据信息。
移动网络接口113:
    负责与移动通信网的网元,与移动网络核心网各个网元进行通讯,包含核心网计费系统,客户管理系统等。
外部内容系统接口114:
    系统与第三方内容系统如出版内容系统之间的接口,可以是自动化的消息传递、文件同步或者手动的消息或文件同步,负责传送和同步系统为出版内容对应数字资源的电子版本。
安全模块115:
    负责系统业务安全管理,对应终端侧的鉴权认证模块的用户鉴权认证的验证,数据传输的安全,包含数据的加密解密等涉及业务安全的各种功能。
数据推送模块116:
    系统中负责将查询到的数字资源的内容推送到用户预置的保存空间并将推送的结果状态返回给调用模块。
业务逻辑模块117:
根据用户提交的各种信息和数据执行对应的业务逻辑的各种功能并负责与其周边的模块进行通信并交换各种数据。
用户管理模块118:
  管理系统用户的各种数据,设置用户的各种权限及参数,对终端用户
提供终端参数设置界面和设置功能,管理和设置用户空间地址,空间管理
参数如转发,容量等参数。
系统计费模块119:
根据用户获取的内容对发起业务的移动终端进行计费并生成消费记录,计费方式可以是运营商计费或第三方支付系统计费。
系统识别模块120:
     系统负责识别终端侧发送的原始数据内容,通过接口服务,终端远程调用系统识别模块的识别服务,并将识别结果提交给其他功能模块以继续下一步流程。
数据搜索模块121:
  根据用户的搜索请求进行查询或搜索,搜索范围是本地数据库或者分布式数据库,并将搜索结果返回给系统。
消息模块122:
    负责发送各种消息给终端,系统端的各个功能模块通过消息模块与终端进行消息的传递。
第三方支付系统123:
    第三方支付系统,提供系统外的支付方式,通过支付系统的各种调用方式接口完成支付的请求和支付状态的获取,以及资金的划转。
系统管理模块124:
    对整个系统进行管理和配置,包含用户管理,日志记录和管理,业务逻辑的管理等等。
终端门户125:
提供终端业务入口,为终端用户使用业务提供业务使用和管理界面的各种数据,是终端登入的显示门户。
系统门户126:
提供业务平台用户的入口,为平台用户管理平台提供业务管理界面、
参数配置等管理功能;
下面举一个例子来说明本发明系统的移动终端通过语音方式触发业务的流程,该实施例中,业务包括以下步骤:
前置条件:用户在系统进行注册并安装客户端。
步骤1:用户打开终端客户端,口述出版物部分内容;
步骤2:终端通过麦克风记录用户语音,转换成音频格式数据,提交终端或系统进行语音的识别;
步骤3:系统进行语音识别,解析包含的内容,转换成文字,并进行分析,解析出一个完整的句子;
步骤4.  系统将获取的句子作为搜索参数发起全文查找;
步骤5.  系统检索到包含该句子的内容后,执行对应的业务逻辑,并将结果的摘要和标题等信息推送到终端并提示用户进行内容和计费确认;;
步骤6.  用户进行内容和计费的确认,系统推送用户选择确认的电子版本的内容到用户预设的网络空间。
步骤7.  管理模块将本次业务的各种数据记录到数据库。
 
本发明的描述是为了示例和说明起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims (10)

1.一种语音识别方式获取出版物内容的方法,其特征在于,通过用户口述出版物部门内容,移动终端或系统进行语音识别,转换为文字并以识别结果为关键词发起内容搜索,获取对应出版物内容的电子版本并推送到用户预置的保存空间。
2.如权利要求1所述,移动终端是包含各种移动便携的终端设备,其特征在于,移动终端包含了手机,平板电脑等支持相机和移动互联网功能的各种移动终端智能设备。
3.如权利要求1所述,用户口述出版物部分内容片段,终端记录该语音并进行识别,其特征在于,用户口述出版物部分内容片段,以句子为单位进行口述,终端通过麦克风获取和记录用户语音数据,转换为语音识别要求的语音格式和数据,根据终端设备软硬件识别能力选择在终端进行语音识别,或通过以服务方式开放的系统端语音识别接口请求系统进行语音识别,获取语音对应的文本。
4.如权利要求3所述,用户口述以句子为单位的内容,系统对其进行解析,其特征在于,用户口述以标点符号分隔的语句片段,语音解析将识别语音停顿,获取以标点符号为分隔的其中一个或多个完整句子组成部分,并以获取的文字部分作为搜索关键词进行搜索,并通过识别部分所处的位置,获取对应出版物内容范围,包含正文,标题,封面等不同层级,对应一篇文章和整本内容,以此控制获取内容的范围。
5.如权利要求3所述,终端获取语音内容后在终端本地或系统进行识别,其特征在于,根据终端软硬件环境和能力,终端可以加载语音识别模块,也可以通过发送获取的音频内容到系统在线语音识别服务进行内容的识别,识别后的内容通过识别的标点符号进行断句或通过语句语义分析,获取一个以上的完整语句片段,语句片段是指在两个标点符号如逗号或句号之间的一个完整的语句。
6.如权利要求4所述,终端获取语音对应的文本内容后发起内容的搜索,其特征在于,系统通过以识别的语句文字为关键词进行对应内容的搜索,
系统搜索到对应的内容如果多于一个以上,则通过提示用户再次口述更多内容的方式或提供内容选择列表提示用户选取对应的对象,通过多次过滤精确获得对应的内容,并在获取内容后系统自动推送到用户预置的目标地址空间。
7.如权利要求6所述,系统识别和搜索到对应的内容后根据系统内置的对象属性对内容进行自动分类和加上属性标签并触发内容用户空间推送,其特征在于,内容在推送到用户保存空间后系统根据出版物的数字资源编码辨别属性自动进行内容的分类保存到不同的目录,如类别属性、时间属性等。
8.如权利要求6所述,系统在获取识别语音对应片段的内容作为搜索参数在系统内进行搜索,其特征在于,系统将出版物的电子版本的内容以本地或在线分布式数据库形式保存,并建立全文数据索引,查询本地或分布式第三方系统的内容平台。
9.如权利要求7所述,系统搜索获取文字内容触发获取内容业务流程请求获取对应内容的电子版本,系统根据用户或系统的设定进行推送,其特征在于,系统根据用户设定推送内容的电子版本到用户设定的网络空间,邮箱、网络硬盘等,如用户未设置和绑定邮箱或者网络空间,系统自动为用户分配一个系统的存储空间或者提示用户进行保存空间的设定,在计费的情况下系统对该内容进行计费处理,并标记用户获取内容的状态属于该用户所有,用户可以随后登陆系统进行保存空间的设定以获取该对应的电子版本的内容。
10.如权利要求9所述,系统可对终端用户获取内容的电子版本进行计费处理,其特征在于,系统通过返回的推送的内容的结果状态码和具体推送的内容和收费策略对移动终端进行业务计费,免费业务计费数据为零,通过各种计费方式,包含移动运营商计费系统,第三方支付系统等方式进行扣费,并获取扣费状态回执确认计费结果,整个业务流程完成后,对应业务完成状态将通过数据方式或者短信、彩信、PUSH方式将结果下发到手机,用户此时可获知内容获取结果和计费结果状态。
CN2011102623361A 2011-09-06 2011-09-06 一种语音识别方式获取出版物内容的方法 Pending CN102486801A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011102623361A CN102486801A (zh) 2011-09-06 2011-09-06 一种语音识别方式获取出版物内容的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011102623361A CN102486801A (zh) 2011-09-06 2011-09-06 一种语音识别方式获取出版物内容的方法

Publications (1)

Publication Number Publication Date
CN102486801A true CN102486801A (zh) 2012-06-06

Family

ID=46152294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102623361A Pending CN102486801A (zh) 2011-09-06 2011-09-06 一种语音识别方式获取出版物内容的方法

Country Status (1)

Country Link
CN (1) CN102486801A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855295A (zh) * 2012-08-14 2013-01-02 周宇 一种基于个人能力发展需求描述的出版标签表达系统
CN103347137A (zh) * 2013-07-24 2013-10-09 联创亚信科技(南京)有限公司 一种用户业务办理数据的处理方法及装置
CN104142831A (zh) * 2013-05-06 2014-11-12 北京奇虎科技有限公司 应用程序搜索方法及装置
CN105702254A (zh) * 2012-05-24 2016-06-22 上海博泰悦臻电子设备制造有限公司 基于移动终端的语音控制装置及其语音控制方法
CN108255841A (zh) * 2016-12-28 2018-07-06 北京新唐思创教育科技有限公司 一种题目搜索的方法及其装置
CN108388664A (zh) * 2018-03-14 2018-08-10 深圳市网域科技股份有限公司 语句片段的整合方法、装置、计算机设备和存储介质
CN109754809A (zh) * 2019-01-29 2019-05-14 北京猎户星空科技有限公司 语音识别方法、装置、电子设备及存储介质
CN110136688A (zh) * 2019-04-15 2019-08-16 平安科技(深圳)有限公司 一种基于语音合成的文字转语音方法及相关设备
CN111785259A (zh) * 2019-04-04 2020-10-16 北京猎户星空科技有限公司 信息处理方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1716413A (zh) * 2004-07-02 2006-01-04 深圳市朗科科技有限公司 车载语音识别视听播放设备及方法
CN101404035A (zh) * 2008-11-21 2009-04-08 北京得意音通技术有限责任公司 一种基于文本或语音的信息搜索方法
CN101505328A (zh) * 2008-02-04 2009-08-12 台达电子工业股份有限公司 应用语音识别的网络数据检索方法及其系统
US20090326953A1 (en) * 2008-06-26 2009-12-31 Meivox, Llc. Method of accessing cultural resources or digital contents, such as text, video, audio and web pages by voice recognition with any type of programmable device without the use of the hands or any physical apparatus.
CN101894108A (zh) * 2009-05-19 2010-11-24 上海易狄欧电子科技有限公司 网上搜索书源的方法及其系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1716413A (zh) * 2004-07-02 2006-01-04 深圳市朗科科技有限公司 车载语音识别视听播放设备及方法
CN101505328A (zh) * 2008-02-04 2009-08-12 台达电子工业股份有限公司 应用语音识别的网络数据检索方法及其系统
US20090326953A1 (en) * 2008-06-26 2009-12-31 Meivox, Llc. Method of accessing cultural resources or digital contents, such as text, video, audio and web pages by voice recognition with any type of programmable device without the use of the hands or any physical apparatus.
CN101404035A (zh) * 2008-11-21 2009-04-08 北京得意音通技术有限责任公司 一种基于文本或语音的信息搜索方法
CN101894108A (zh) * 2009-05-19 2010-11-24 上海易狄欧电子科技有限公司 网上搜索书源的方法及其系统

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105702254A (zh) * 2012-05-24 2016-06-22 上海博泰悦臻电子设备制造有限公司 基于移动终端的语音控制装置及其语音控制方法
CN102855295A (zh) * 2012-08-14 2013-01-02 周宇 一种基于个人能力发展需求描述的出版标签表达系统
CN104142831A (zh) * 2013-05-06 2014-11-12 北京奇虎科技有限公司 应用程序搜索方法及装置
CN103347137A (zh) * 2013-07-24 2013-10-09 联创亚信科技(南京)有限公司 一种用户业务办理数据的处理方法及装置
CN103347137B (zh) * 2013-07-24 2016-05-11 亚信科技(南京)有限公司 一种用户业务办理数据的处理方法及装置
CN108255841A (zh) * 2016-12-28 2018-07-06 北京新唐思创教育科技有限公司 一种题目搜索的方法及其装置
CN108388664A (zh) * 2018-03-14 2018-08-10 深圳市网域科技股份有限公司 语句片段的整合方法、装置、计算机设备和存储介质
CN109754809A (zh) * 2019-01-29 2019-05-14 北京猎户星空科技有限公司 语音识别方法、装置、电子设备及存储介质
CN109754809B (zh) * 2019-01-29 2021-02-09 北京猎户星空科技有限公司 语音识别方法、装置、电子设备及存储介质
CN111785259A (zh) * 2019-04-04 2020-10-16 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
CN110136688A (zh) * 2019-04-15 2019-08-16 平安科技(深圳)有限公司 一种基于语音合成的文字转语音方法及相关设备
CN110136688B (zh) * 2019-04-15 2023-09-29 平安科技(深圳)有限公司 一种基于语音合成的文字转语音方法及相关设备

Similar Documents

Publication Publication Date Title
CN102486801A (zh) 一种语音识别方式获取出版物内容的方法
CN101360118B (zh) 一种适合移动终端多媒体文件共享与搜索的方法和协议
CN111460506B (zh) 数据访问控制方法及装置
CN101729546B (zh) 配置用于网络化设备的用户定制服务
CN1205554C (zh) 利用媒体可写入区域的可写入媒体访问控制
CN104078043B (zh) 网络交易系统的语音操作指令识别处理方法和系统
US20100100439A1 (en) Multi-platform system apparatus for interoperable, multimedia-accessible and convertible structured and unstructured wikis, wiki user networks, and other user-generated content repositories
CN1731726B (zh) 一种手机关联服务器组建的安全基础设施及增值方案
CN106981017A (zh) 一种基于人脸识别技术的大数据精准营销装置及营销方法
CN111223485A (zh) 智能交互方法、装置、电子设备及存储介质
US20130103464A1 (en) Systems and methods for establishing transactions utilizing a data store of billing information
CN109034437A (zh) 一种基于云终端的图书馆系统
CN107481072A (zh) 便携式网络开票系统及方法
CN102368252A (zh) 将搜索查询应用到内容集
KR102039989B1 (ko) 비정형 텍스트 이미지에서 텍스트 데이터를 추출하는 방법 및 장치
CN101517997A (zh) 为使用sms通信提供移动设备服务的系统和方法
US9195641B1 (en) Method and apparatus of processing user text input information
CN101957959A (zh) 移动终端付款处理方法、移动终端收款处理方法和系统
CN105045919B (zh) 一种信息输出方法及装置
CN102902968A (zh) 一种手机扫描快速获取出版物内容的方法
US20190073680A1 (en) Interfaces and methods for licensing media
CN103347137A (zh) 一种用户业务办理数据的处理方法及装置
CN103152417A (zh) 面向共同客户端的多企业云文件夹部署与信息交互方法
CN101917471B (zh) 一种资讯推送方法及服务器
CN102196376A (zh) 一种基于移动终端的快速获取出版物内容的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120606