CN104078038B

CN104078038B - 一种页面内容朗读方法和装置

Info

Publication number: CN104078038B
Application number: CN201310104807.5A
Authority: CN
Inventors: 张凯; 胡博; 唐廷勇; 刘人方; 王智培; 周睿奕; 王曦; 谢郑凯; 贺柏森; 黄英; 李未; 冯诚; 杨惠姣; 刘玉磊
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2013-03-28
Filing date: 2013-03-28
Publication date: 2019-03-01
Anticipated expiration: 2033-03-28
Also published as: WO2014154097A1; CN104078038A

Abstract

本发明公开了一种页面内容朗读方法和装置：获取用户请求浏览的页面内容，并确定页面内容的格式是否符合预定要求；如果是，则将页面内容展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来；如果否，则在将页面内容转换为符合预定要求的格式后，展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。本发明所述方案具有广泛适用性，并能够降低实现成本。

Description

一种页面内容朗读方法和装置

技术领域

本发明涉及网络技术，特别涉及一种页面内容朗读方法和装置。

背景技术

为方便用户获取页面内容，现有技术中提出了一种页面内容朗读技术，即当用户需要浏览某一页面内容时，可由系统将该页面内容为用户朗读出来，这样，用户即可通过收听的方式而不是浏览的方式方便地获取到页面内容。

在某些场景下，如用户开车不方便操控手机的场景下，上述技术将非常实用。

现有页面朗读技术主要有以下两种实现方式：

1）用户在自身的终端如手机上安装专门的小说朗读软件，用户可浏览该软件所能提供的任一小说的页面内容，并且，可针对任一页面内容发出朗读请求，相应地，该软件将该页面内容为用户朗读出来；

2）针对不同的页面内容，分别通过真人录制的方式生成对应的朗读材料，并存储，当接收到用户针对任一页面内容的朗读请求时，播放对应的朗读材料。

但是，上述两种方式在实际应用中均会存在一定的问题，如：

对于方式1），在页面内容上有很大的局限性，即仅适用于小说，不能实现对于其它页面内容，如新闻、论坛、杂志等的朗读，适用范围有限；

对于方式2），由于实际应用中会涉及到各式各样的页面内容，如果均进行真人录制，将需要很高的实现成本，包括人力成本和存储成本等。

发明内容

有鉴于此，本发明提供了一种页面内容朗读方法和装置，可以对不同类型的网页内容进行朗读且不用提前进行真人录制，具有广泛适用性，并能够降低实现成本。

一种页面内容朗读方法，包括：

获取用户请求浏览的页面内容，并确定页面内容的格式是否符合预定要求；

如果是，则将页面内容展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来；

如果否，则在将页面内容转换为符合预定要求的格式后，展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。

一种页面内容朗读装置，包括：获取模块和朗读模块；

所述获取模块，用于获取用户请求浏览的页面内容，并发送给所述朗读模块；

所述朗读模块，用于确定页面内容的格式是否符合预定要求；

可见，采用本发明所述方案，获取用户请求浏览的页面内容，并确定页面内容的格式是否符合预定要求，如果是，则可直接将页面内容展示给用户，否则，可将页面内容转换为符合预定要求的格式，并展示给用户，当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容为用户朗读出来；相比于现有方式1），本发明所述方案可适用于任意页面内容，即不再局限于小说，对其它页面内容如新闻、论坛、杂志等均适用，从而扩大了本发明所述方案的适用范围，即本发明所述方案具有广泛适用性；相比于现有方式2），本发明所述方案无需进行真人录制，从而降低了实现成本，包括人力成本和存储成本等。

附图说明

图1为本发明页面内容朗读装置的运行环境示意图。

图2为本发明页面内容朗读方法实施例的流程图。

图3为本发明页面内容朗读方法较佳实施例的流程图。

图4为本发明页面内容朗读装置实施例的组成结构示意图。

具体实施方式

针对现有技术中存在的技术问题，本发明中提出一种改进后的页面内容朗读方案，采用文本到语音的合成（TTS，Text To Speech）技术与页面正文抽取技术相结合的实现方式。

其中，TTS技术又称为语音合成技术，是一种将文本转化为语音的技术，即将文本按字或词分解为音素，并通过查询语音库得到不同音素对应的语音，通过扬声器等播放出来，所播放出来的声音采用真人普通话作为标准发音，朗读速度可达到3～4个汉字/秒，使用户可以听到清晰悦耳的音质和连贯流畅的语调。

页面正文抽取技术是指当用户通过浏览器客户端对某一页面内容发出浏览请求后，由后台服务器对该页面内容进行过滤和标记，将广告等用户不感兴趣的内容进行滤除，并对正文内容的头尾进行标记，而后由浏览器客户端根据后台服务器所作的标记，将正文内容展示给用户。

图1为本发明页面内容朗读装置的运行环境示意图。该页面内容朗读装置可置于浏览器客户端内，如图1所示，该浏览器客户端可包括：人机交互电路11、通信电路12、存储器13、音频电路14和处理器15等。

其中，人机交互电路11可用于进行人机交互，如接收用户的请求，将用户所请求的页面内容展示给用户等；通信电路12可用于与服务器进行信息交互，如从服务器中获取用户请求的页面内容等；存储器13可用于存储上述页面内容朗读装置所对应的程序指令，并存储从服务器获取到的页面内容以及经过各种处理后的页面内容等；音频电路14可用于播放所朗读的页面内容等；处理器15可用于控制其它各部分（如存储器13中所存储的页面内容朗读装置的程序指令）进行工作，并执行页面内容的格式转换和页面内容的朗读等功能。

为了使本发明的技术方案更加清楚、明白，以下参照附图并举实施例，对本发明所述方案作进一步地详细说明。

图2为本发明页面内容朗读方法实施例的流程图。该方法应用于浏览器客户端中。如图2所示，该方法包括以下步骤：

步骤21：获取用户请求浏览的页面内容。

如何获取为现有技术，在此不再赘述。

步骤22：确定页面内容的格式是否符合预定要求，如果是，则执行步骤23，否则，执行步骤24。

在实际应用中，当接收到用户针对任一页面内容的浏览请求时，可首先确定页面内容是否为进行页面正文抽取后的页面内容，并可根据确定结果的不同，后续采用不同的处理方式，即如果确定页面内容为进行页面正文抽取后的页面内容，则执行步骤23，否则，执行步骤24。

步骤23：将页面内容展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。

如果步骤22中确定出页面内容为进行页面正文抽取后的页面内容，则本步骤中，可直接将页面内容展示给用户，并可在展示的同时，在展示界面的菜单中显示一个“朗读”按钮，当确定用户点击该按钮后，即可认为用户发出了朗读请求，相应地，可利用TTS技术，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。

步骤24：在将页面内容转换为符合预定要求的格式后，展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。

具体而言，浏览器客户端首先将页面内容发送给后台服务器，由后台服务器对页面内容进行页面正文抽取，并接收后台服务器返回的处理后的页面内容，展示给用户。在展示的同时，在展示界面的菜单中显示一个“朗读”按钮，当确定用户点击该按钮后，即可利用TTS技术，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。

另外，为方便用户定位当前朗读的位置，便于在听和看之间进行顺利切换，本发明所述方案中还提出，在朗读的同时，可将朗读完的文字以卡拉OK跟读模式进行标示。

具体来说，可在接收到用户的朗读请求之前，通过对标点符号的判断等，对所展示的页面内容进行分句处理，从而得到一个个的句子；相应地，在对所展示的页面内容进行朗读的同时，每朗读完一个句子，则将句子进行标示。

如何进行标示，本实施例不作限制。

比如，假设正常情况下，所展示的页面内容中的文字均为黑色，那么，可在每朗读完一个句子后，将该句子中的文字显示为蓝色，这样，用户即可方便直观地了解到当前朗读到的位置。

基于上述介绍，图3为本发明页面内容朗读方法较佳实施例的流程图。如图3所示，包括以下步骤：

步骤31：获取用户请求浏览的页面内容。

步骤32：确定页面内容是否为进行页面正文抽取后的页面内容，如果是，则执行步骤33，否则，执行步骤34。

步骤33：将页面内容展示给用户，之后执行步骤35。

步骤34：将页面内容发送给后台服务器进行页面正文抽取，接收后台服务器返回的处理后的页面内容，展示给用户，之后执行步骤35。

步骤35：当接收到用户的朗读请求时，利用TTS技术将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。

步骤36：在朗读的同时，将朗读完的文字以卡拉OK跟读模式进行标示。

本发明同时公开了一种页面内容朗读装置。

图4为本发明页面内容朗读装置实施例的组成结构示意图。如图4所示，包括：获取模块41和朗读模块42；

获取模块41，用于获取用户请求浏览的页面内容，并发送给朗读模块42；

朗读模块42，用于确定页面内容的格式是否符合预定要求；

其中，

朗读模块42可具体包括：展示单元421和朗读单元422；

展示单元421，用于确定页面内容的格式是否符合预定要求；如果是，则将页面内容展示给用户，并在当接收到用户的朗读请求时，通知朗读单元422执行朗读功能；如果否，则在将页面内容转换为符合预定要求的格式后，展示给用户，并在当接收到用户的朗读请求时，通知朗读单元422执行朗读功能；

朗读单元422，用于将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。

具体地，

展示单元421确定页面内容是否为进行页面正文抽取后的页面内容，如果是，则确定页面内容的格式符合预定要求，否则，确定不符合预定要求，将页面内容发送给后台服务器进行页面正文抽取，并接收后台服务器返回的处理后的页面内容。

朗读单元422利用TTS技术，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。

另外，

展示单元421可进一步用于，在朗读单元422朗读的同时，将朗读完的文字以卡拉OK跟读模式进行标示。

展示单元421还可进一步用于，在将页面内容转换为符合预定要求的格式之后，在接收到用户的朗读请求之前，对所展示的页面内容进行分句处理；

相应地，朗读单元422每朗读完一个句子，展示单元421则将该句子进行标示。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种在驾驶场景下的页面内容朗读方法，其特征在于，包括：

获取用户请求浏览的页面内容，并确定页面内容的格式是否符合预定要求，其中，确定页面内容的格式是否符合预定要求包括：确定页面内容是否为进行页面正文抽取后的页面内容；

如果否，则将页面内容发送给后台服务器以使其对所述页面内容进行页面正文抽取，将抽取出的内容展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。

2.根据权利要求1所述的方法，其特征在于，

所述后台服务器通过对所述页面内容进行过滤和标记，将所述页面内容的正文内容以外的内容滤除，并对所述页面内容的正文内容的头尾进行标记。

3.根据权利要求1所述的方法，其特征在于，所述将页面内容处理成适合朗读的形式是通过文本到语音的合成技术来实现。

4.根据权利要求1、2或3所述的方法，其特征在于，

该方法进一步包括：在朗读的同时，将朗读完的文字以卡拉OK跟读模式进行标示。

5.根据权利要求4所述的方法，其特征在于，

在将页面内容转换为符合预定要求的格式之后，在接收到用户的朗读请求之前，进一步包括：对所展示的页面内容进行分句处理；

所述在朗读的同时，将朗读完的文字以卡拉OK跟读模式进行标示的步骤包括：每朗读完一个句子，则将该句子进行标示。

6.一种在驾驶场景下的页面内容朗读装置，其特征在于，包括：获取模块和朗读模块；

所述朗读模块，用于确定页面内容的格式是否符合预定要求,其中，确定页面内容的格式是否符合预定要求包括：确定页面内容是否为进行页面正文抽取后的页面内容；

如果否，则将页面内容发送给后台服务器以使其对所述页面内容进行页面正文抽取，并将接收的所述后台服务器返回的处理后的页面内容展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。

7.根据权利要求6所述的装置，其特征在于，

其中，所述后台服务器通过对所述页面内容进行过滤和标记，将所述页面内容的正文内容以外的内容滤除，并对所述页面内容的正文内容的头尾进行标记。

8.根据权利要求6所述的装置，其特征在于，

所述朗读模块利用文本到语音的合成技术，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。