WO2017157067A1

WO2017157067A1 - 一种电子书的翻页方法及装置

Info

Publication number: WO2017157067A1
Application number: PCT/CN2016/110696
Authority: WO
Inventors: 李祎哲
Original assignee: 广州阿里巴巴文学信息技术有限公司
Priority date: 2016-03-16
Filing date: 2016-12-19
Publication date: 2017-09-21
Also published as: CN107205076A

Abstract

本发明公开了一种电子书的翻页方法及装置，涉及电子阅读领域，解决了现有的电子书无法为用户提供灵活便捷的语音翻页服务的问题。本发明的方法包括：通过麦克风采集设置的翻页提示音；保存采集的所述翻页提示音；对麦克风进行监听，获取所述麦克风采集的声音信息；确认所述声音信息与所述翻页提示音匹配，则触发与所述翻页提示音对应的翻页操作。本发明主要用于阅读新闻资讯、小说等各类阅读软件中。

Description

一种电子书的翻页方法及装置

技术领域

本发明涉及电子阅读领域，特别是涉及一种电子书的翻页方法及装置。

背景技术

随着移动终端的发展，人们的阅读方式也逐渐发生改变，从原来的纸质阅读变成了电子阅读。电子阅读的方式虽然能够便于人们通过随身携带的移动终端进行阅读，但是在电子阅读的过程中也需要人们进行翻页操作。由于当今的阅读类软件越来越多，翻页模式也越来越丰富。

在现有的众多翻页模式中，主要可以分为两类，一类是用户手动翻页，另一类是软件自动翻页，软件自动翻页作为较为便捷的一种翻页模式应用较广。在软件自动翻页模式中，用户根据软件自带的翻页提示音，通过发音触发翻页操作的翻页模式比通过软件设定翻页速度的翻页方式更先进，但是用户在通过软件自带的翻页提示音进行翻页操作时，必须模仿软件自带的翻页提示音，从而给用户的发音造成诸多不便。因此，如何在阅读过程中使用户能够更加灵活便捷的进行语音翻页成为现有电子阅读中亟待解决的问题。

发明内容

有鉴于此，本发明提出了一种电子书的翻页方法及装置，主要目的在于解决现有的电子书无法为用户提供灵活便捷的语音翻页服务的问题。

依据本发明的第一个方面，本发明提供一种电子书的翻页方法，包括：

通过麦克风采集设置的翻页提示音；

保存采集的所述翻页提示音；

对麦克风进行监听，获取所述麦克风采集的声音信息；

确认所述声音信息与所述翻页提示音匹配，则触发与所述翻页提示音对应的翻页操作。

依据本发明的第二个方面，本发明提供一种电子书的翻页装置，包括：

采集单元，用于通过麦克风采集设置的翻页提示音；

保存单元，用于保存采集的所述翻页提示音；

所述采集单元还用于对麦克风进行监听，获取所述麦克风采集的声音信息；

确认单元，用于确认所述声音信息与所述翻页提示音匹配，则触发与所述翻页提示音对应的翻页操作。

依据本发明的第三个方面，本发明提供了一种电子书的翻页装置，包括存储器和处理器，所述存储器用于存储指令，所述指令用于控制所述处理器进行操作以执行根据本发明第一个方面所述的方法。

依据本发明的第四个方面，本发明提供了一种计算机可读存储介质，其存储有用于执行根据本发明第一个方面所述方法的程序代码。

借由上述技术方案，本发明实施例提供的一种电子书的翻页方法及装置，能够通过麦克风采集用户设置的翻页提示音，并保存采集的所述翻页提示音，随后在启动电子阅读应用后，对麦克风进行监听，获取所述麦克风采集的声音信息，只有在确认所述声音信息与所述翻页提示音匹配时，才触发与所述翻页提示音对应的翻页操作。而在现有技术中，用户在通过软件自带的翻页提示音进行翻页操作时，必须模仿软件自带的翻页提示音，从而给用户的发音造成诸多不便。因此，与现有的翻页模式给用户的阅读过程带来不便的缺陷相比，本发明能够使用户自定义设置翻页提示音，从而在进行翻页时可以轻松的通过发音进行翻页，使用户不必刻意模仿软件自带的翻页提示音进行翻页。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明实施例提供的一种电子书的翻页方法的流程图；

图2示出了本发明实施例提供的一种电子书的翻页装置的组成框图；

图3示出了本发明实施例提供的另一种电子书的翻页装置的组成框图；

图4示出了本发明实施例提供的电子设备的组成框图。

具体实施方式

下面将参照附图更加详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

随着移动终端的发展，越来越多的用户开始使用电子书进行阅读。在电子阅读过程中同样需要翻页，电子书现有的翻页模式分为用户手动翻页和软件自动翻页。在软件自动翻页模式中，应用较为普遍的是用户通过软件自带的翻页提示音进行翻页操作，但是在这种翻页模式中，用户必须模仿软件自带的翻页提示音，从而给用户的发音造成诸多不便。因此，电子书现有的翻页模式无法给用户提供灵活便捷的语音翻页服务。

为了解决上述问题，本发明实施例提供了一种电子书的翻页方法，能够根据用户自定义设置的翻页提示音进行翻页，给用户提供更加灵活便捷的语音翻页服务。如图1所示，该方法包括：

101、通过麦克风采集设置的翻页提示音。

由于现有的语音翻页模式中，软件自带的翻页提示音使得用户在触发翻页操作时必须模仿软件的翻页提示音，从而在用户发音时给用户造成诸多不便，如用户发音不准确造成无法匹配翻页提示音，或用户无法准确模仿出软件中的翻页提示音。因此，本发明提供的电子书的翻页方法，能够使用户自己设置翻页提示音。在用户自定义设置翻页提示音时，需要执行步骤101通过麦克风采集设置的翻页提示音。

102、保存采集的所述翻页提示音。

当在步骤101中采集到用户设置的翻页提示音后，就需要对用户设置的翻页提示音进行识别，并将识别后的翻页提示音按照特定的格式进行保存。

103、对麦克风进行监听，获取所述麦克风采集的声音信息。

由于本发明是通过设置个性化的翻页提示音，当客户端通过语音识别确定用户发音符合所述翻页提示音时进行翻页操作。因此在本发明的后续实施过程中，需要执行步骤103对麦克风进行监听，获取所述麦克风采集的声音信息。

104、确认所述声音信息与所述翻页提示音匹配，则触发与所述翻页提示音对应的翻页操作。

当在步骤103中获取到麦克风采集的声音信息后，需要确认所述声音信息与用户自定义设置的翻页提示音是否匹配。其中，所述声音信息既包含用户发出的声音信息，也包含环境声音信息；在确认所述声音信息与用户自定义设置的翻页提示音是否匹配的过程中，需要将所述声音信息进行识别，只有当其识别结果与用户自定义设置的翻页提示音对应的识别结果相同时，才能确认所述声音信息与翻页提示音相匹配。当确认所述声音信息与用户自定义设置的翻页提示音相匹配时，说明用户进行了翻页提示，此时需要触发与所述翻页提示音对应的翻页操作。

本发明实施例提供的一种电子书的翻页方法，能够通过麦克风采集用户设置的翻页提示音，并保存采集的所述翻页提示音，随后在启动电子阅读应用后，对麦克风进行监听，获取所述麦克风采集的声音信息，只有在确认所述声音信息与所述翻页提示音匹配时，才触发与所述翻页提示音对应的翻页操作。而在现有技术中，用户在通过软件自带的翻页提示音进行翻页操作时，必须模仿软件自带的翻页提示音，从而给用户的发音造成诸多不便。因此，与现有的翻页模式给用户的阅读过程带来不便的缺陷相比，本发明能够使用户自定义设置翻页提示音，从而在进行翻页时可以轻松的通过发音进行翻页，使用户不必刻意模仿软件自带的翻页提示音进行翻页。

为了更好的对上述图1所示的方法进行理解，作为对上述实施方式的细化和扩展，本发明实施例将针对图1中的步骤进行详细说明。

由于本发明实施例是为了使用户在进行语音翻页时，不必刻意模仿软件自带的翻页提示音进行翻页，所以本发明实施例可以由用户自定义设置翻页提示音。具体的，用户设定翻页提示音的时机是在对麦克风进行监听之前，其设定方法为：首先，要通过麦克风采集翻页提示音，所述翻页提示音是由用户自定义设定的，通常为用户发出的语音。然后，获取到用户设定的翻页提示音之后就需要将其进行保存，具体的保存方法为：将所述翻页提示音转换为第一文本信息列表。所述第一文本信息列表由发音与所述翻页提示音具有相似度关系的不同第一文本信息组成。这里所述的将翻页提示音转换为第一文本信息列表，(以安卓系统为例)是通过启动语音输入active后，android.speech.RecognizerIntent识别翻页提示音并转换为文本信息，并通过onActivityResult()方法接收文本信息，形成第一文本信息列表。所述第一文本信息列表中包含有一系列不同的第一文本信息，这些第一文本信息的共同点在于，其发音与翻页提示音的发音具有相似度关系。例如，若翻页提示音的发音为fan(一声)，则将其识别后转换得到的第一文本信息就包含：饭、翻、繁、烦、返、帆、反、范等。当通过上述方式得到第一文本信息列表之后，就可以基于信息选择操作，从所述第一文本信息列表中确定一个第一文本信息，作为对应所述翻页提示音的第一文本信息。采用这样的处理方式，是由于用户发音会存在一定误差，所以识别用户设定的翻页提示音得到的是一系列可能的文本信息，只有将这些可能的文本信息以列表的形式进行展示，供用户点击选择自己真正想说的文本信息，才能准确设定翻页提示音。当在第一文本信息列表中确定了对应所述翻页提示音的第一文本信息之后，就可以将确定的所述第一文本信息进行保存，以便后续用于将采集的声音信息与设定的翻页提示音进行匹配的过程中。

这里需要说明的是，在通过麦克风采集所述翻页提示音之前，可以基于语言选择操作设定所述翻页提示音的语种类型。仍以安卓系统为例，可以通过.putExtra()方法输入RecognizerIntent.EXTRA_LANGUAGE_MODE语言类型，所述语言类型是客户端语言识别系统能够识别出的语言，其可以是英文，也可以是中文。所述语言类型的设定可以是出厂时就设定好的，当然也可以由用户自行进行设定。例如，当设定的语言类型为英文时，对于用户以中文设定翻页提示音而言，则android.speech.RecognizerIntent会由于无法识别中文的声音信息进而无法完成翻页提示音的设定。

由于本发明实施例需要通过识别用户的发音进行相应的翻页操作，因此本发明实施例在启动电子阅读应用后，需要通过监听麦克风来获取麦克风采集的声音信息，从而判断所述声音信息与翻页提示音是否匹配。其中，客户端获取麦克风采集的声音信息，也就是客户端接收外界的声音信息。由于客户端通常都具有语音输入及识别功能，因此在本发明实施例中以安卓系统客户端为例进行说明。其中，对采集的声音信息进行识别的过程与上述对用户设置的翻页提示音的识别过程类似。例如，安卓系统中的android.speech是安卓系统语音输入的核心包，其中android.speech.RecognizerIntent是一个主要的类，这个active会接收语音输入，识别语音内容转为文本。因此，在使用安卓系统的客户端中，当电子阅读应用被启动后，客户端可以通过android.speech.RecognizerIntent获取麦克风采集的声音信息，所述声音信息既可能包含用户发出的声音信息，也可能包含环境产生的声音信息。这里需要说明的是，在获取麦克风采集的声音信息并对其进行识别之前，还可以对获取的声音信息的语言类型进行设定，其中设定的声音信息的语言类型，既可以是客户端出厂时初始化设定的语言类型，也可以是由用户在使用客户端的过程中自定义设定的语言类型。具体的，以使用安卓系统的客户端为例，在.putExtra()方法还需要输入RecognizerIntent.EXTRA_LANGUAGE_MODE语言类型，所述语言类型可以是英文，也可以是中文。例如，当设定的语言类型为中文时，对于获取的声音信息而言，android.speech.RecognizerIntent只会识别中文的声音信息并将其转换为文本。

当通过上述方式获取到麦克风采集的声音信息之后，就需要确认所述声音信息与用户设置的翻页提示音是否匹配，只有在确认所述声音信息与所述翻页提示音匹配时，才触发与所述翻页提示音对应的翻页操作。其具体的确认过程可以如下：

(1)将所述声音信息转换为第二文本信息列表，所述第二文本信息列表由发音与所述声音信息具有相似度关系的不同第二文本信息组成，所述第二文本信息按照相似度由高到低的顺序排列。

这里所述的将声音信息转换为第二文本信息列表，以安卓系统为例，可以是通过启动语音输入active后，android.speech.RecognizerIntent识别声音信息并转换为文本信息，并通过startActivityForResult()方法接收文本信息，形成第二文本信息列表。所述第二文本信息列表中包含有一系列不同的第二文本信息，这些第二文本信息的共同点在于，其发音与获取的声音信息的发音具有相似度关系。例如，若获取的声音信息的发音为fan(一声)，则将其识别后转换得到的第二文本信息就包含：饭、翻、繁、烦、返、帆、反、范等。并且，这些第二文本信息是按照与获取的声音信息的发音相似度的高度顺序，由高到低在第二文本信息列表中排列的，以上述列举的第二文本信息为例，其中发音为一声的“翻”、“帆”的相似度比发音为二声的“烦”、“繁”，发音为三声的“返”、“反”以及发音为四声的“饭”、“范”的相似度都要高，因此在第二文本信息列表中的排列顺序为：翻、帆、烦、繁、返、反、饭、范。

(2)判断所述第二文本信息列表的目标文本信息集合中是否包含与所述翻页提示音对应的第一文本信息，所述目标文本信息集合由所述第二文本信息列表的TOP N个(即排序位置靠前的N个)第二文本信息组成，所述N为正整数。

当将所述声音信息转换为第二文本信息列表之后，就需要判断所述第二文本信息列表的目标文本信息集合中是否包含与所述翻页提示音对应的第一文本信息。这里需要说明的是，所述目标文本信息集合通常由所述第二文本信息列表中排序位置靠前的N个第二文本信息组成，也就是第二文本信息列表中的TOP N个第二文本信息组成，所述N为正整数。这里的N 可以为1，也可以大于1，以避免因用户发音发生改变或者同一发音识别出的多种结果而导致声音信息与所述翻页提示音的匹配出现偏差。例如，以上述获取的声音信息的发音为fan(一声)为例，可以选取其第二文本信息列表中的TOP 3个第二文本信息作为目标文本信息集合，所述目标文本信息集合包含：翻、帆、烦。进而在判断获取的声音信息是否与用户设置的翻页提示音匹配时，就可以在包含有翻、帆、烦的目标文本信息集合中查找其是否包含与所述翻页提示音对应的第一文本信息。

(3)若判断结果为所述目标文件信息集合中包含与所述翻页提示音对应的第一文本信息，则确定所述声音信息与所述翻页提示音匹配。

以上述包含有翻、帆、烦的目标文本信息集合为例，当所述目标文本信息集合中包含有所述翻页提示音对应的第一文本信息时，可以确定所述声音信息与所述翻页提示音匹配；当所述目标文本信息集合中未包含有所述翻页提示音对应的第一文本信息时，可以确定所述声音信息与所述翻页提示音不匹配。

上述实施方式虽然能够通过识别麦克风采集的声音信息与用户设置的翻页提示音是否匹配，来决定是否触发与所述翻页提示音对应的翻页操作。但是，麦克风采集的声音信息通常既包含用户声音信息，也包含环境声音信息，而其中需要用来匹配翻页提示音的是用户声音信息，环境声音信息就是无用声音信息。因此，当通过麦克风采集到多种声音信息时，若根据上述实施方式识别采集到的每一个声音信息，就会造成识别过程用时较长，从而导致翻页操作延迟。为了避免识别过多的无用声音信息，本发明实施例提供了一种实施方式，也就是在判断获取的声音信息与用户设置的翻页提示音是否匹配之前，需要从获取到的声音信息中过滤环境音对应的声音信息。

具体的，本发明实施例提供了两种实施方式用于从获取到的声音信息中过滤环境音对应的声音信息。这两种实施方式包括：

(1)从获取到的声音信息中剔除音量小于预设音量阈值的声音信息。

由于用户在阅读电子书时，用户发音(声源)的位置通常比环境音(声源)的位置更加靠近客户端的麦克风位置，因此对于麦克风识别到的音量大小而言，处于远处的环境声音信息的音量大小一定远小于靠近麦克风的用户声音信息的音量大小。因此可以根据声音信息的音量大小，从获取到的声音信息中剔除音量小于预设音量阈值的声音信息。所述预设音量阈值可以是麦克风识别的用户声音信息的平均音量值。获取到的音量小于预设音量阈值的声音信息可以认为是无用的环境声音信息，后续无需将这些声音信息与翻页提示音进行匹配，从而能够大大降低从获取的声音信息中识别出翻页提示音的识别时长，提高识别效率。

(2)在预设的声音信息库中查找所述获取到的声音信息对应的匹配成功率；若所述匹配成功率小于预设成功率阈值，则剔除所述获取到的声音信息，即将获取到的声音信息作为环境音对应的声音信息剔除掉。当获取到麦克风采集的声音信息之后，可以在预设的声音信息库中查找所述获取到的声音信息对应的匹配成功率。其中，所述声音信息库中记录有先前识别过的各种声音信息与用户声音信息的匹配成功率，若所述获取到的声音信息的匹配成功率小于预设成功率阈值，可以认为获取到的声音信息为环境音对应的声音信息，则可以剔除所述获取到的声音信息。此外，如果声音信息库中没有记录所述获取到的声音信息，则可以将所述获取到的声音信息添加到声音信息库中，并开始记录其匹配成功率。同时，为了降低由于声音信息库中统计匹配成功率而对后续声音信息的处理效率造成影响，所述统计匹配成功率的操作可以选择在电子书(阅读应用)开启或关闭时由后台进行。通过这种方式，可以在判断所述获取到的声音信息与用户设置的翻页提示音是否匹配之前，就将无用的环境声音信息剔除，从而能够大大降低从获取的声音信息中识别出翻页提示音的识别时长，提高识别效率。

进一步地，可以输出例如是“当前输入的声音信息无效，请重新输入声音信息”的提示，以使用户根据该提示重新输入声音信息。

在用户实际阅读过程中，有时会需要一次翻过多个页面，若每翻一页都需要识别翻页提示音，那么翻页过程将会浪费很多时间。因此，本发明实施例还提供了一种实施方式，即当用户发出的翻页提示音中包含数字M时，所述翻页提示音对应的翻页操作为连续翻过M页，所述M为正整数。并且，以上各个实施方式中的翻页提示音包括：向前翻页提示音(翻上一页)及向后翻页提示音(翻下一页)。

此外，本发明实施例中提到的用户的声音信息，既可以指用户的语音信息，也可以包含用户通过拍手、击掌等发出的声音信息，用户发出的这些声音信息都可以用于设定本发明实施例中的翻页提示音。

进一步的，作为对上述图1所示方法的实现，本发明实施例提供了一种电子书的翻页装置，如图2所示，该装置包括：采集单元21、保存单元22以及确认单元23；其中，

采集单元21，用于通过麦克风采集设置的翻页提示音；

保存单元22，用于保存采集的翻页提示音；

采集单元21还用于对麦克风进行监听，获取麦克风采集的声音信息；

确认单元23，用于确认所述声音信息与所述翻页提示音匹配，则触发与所述翻页提示音对应的翻页操作。

进一步的，如图3所示，保存单元22，包括：

第一转换模块221，用于将翻页提示音转换为第一文本信息列表，第一文本信息列表由发音与翻页提示音具有相似度关系的不同第一文本信息组成；

第一确定模块222，用于基于信息选择操作从第一文本信息列表中确定一个第一文本信息，作为对应翻页提示音的第一文本信息；

保存模块223，用于保存确定的第一文本信息。

进一步的，如图3所示，确认单元23，包括：

第二转换模块231，用于将声音信息转换为第二文本信息列表，第二文本信息列表由发音与声音信息具有相似度关系的不同第二文本信息组成，第二文本信息按照相似度由高到低的顺序排列；

判断模块232，用于判断第二文本信息列表的目标文本信息集合中是否包含保存的第一文本信息，目标文本信息集合由第二文本信息列表的TOP N个第二文本信息组成，N为正整数；

第二确定模块233，用于当判断结果为目标文件信息集合中包含保存的第一文本信息时，确定声音信息与翻页提示音匹配。

进一步的，如图3所示，该装置进一步包括，过滤单元24，用于在确认所述声音信息与所述翻页提示音匹配之前，从获取到的声音信息中过滤环境音对应的声音信息。

进一步的，如图3所示，过滤单元24，包括：

第一过滤模块241，用于从获取到的声音信息中剔除音量小于预设音量阈值的声音信息。

进一步的，如图3所示，过滤单元24，包括第二过滤模块242，用于：

在预设的声音信息库中查找获取到的声音信息对应的匹配成功率；

当匹配成功率小于预设成功率阈值时，剔除获取到的声音信息。

进一步的，采集单元21，用于在通过麦克风采集设置的翻页提示音之前，基于语言选择操作设定翻页提示音的语种类型。

进一步的，当采集单元21采集的翻页提示音中包含数字M时，翻页提示音对应的翻页操作为连续翻过M页，M为正整数。

进一步的，采集单元21采集的翻页提示音包括：向前翻页提示音及向后翻页提示音。

本发明实施例提供的一种电子书的翻页装置，能够通过麦克风采集用户设置的翻页提示音，并保存采集的所述翻页提示音，随后在启动电子阅读应用后，对麦克风进行监听，获取所述麦克风采集的声音信息，只有在确认所述声音信息与所述翻页提示音匹配时，才触发与所述翻页提示音对应的翻页操作。而在现有技术中，用户在通过软件自带的翻页提示音进行翻页操作时，必须模仿软件自带的翻页提示音，从而给用户的发音造成诸多不便。因此，与现有的翻页模式给用户的阅读过程带来不便的缺陷相比，本发明能够使用户自定义设置翻页提示音，从而在进行翻页时可以轻松的通过发音进行翻页，使用户不必刻意模仿软件自带的翻页提示音进行翻页。

另外，本发明实施例还提供了电子书的翻页装置的一种硬件结构，图4是一种硬件结构的方框原理图。

根据图4所示，该电子设备包括存储器401和处理器402，存储器401用于存储指令，指令用于控制处理器402进行操作以执行根据本发明的电子书的翻页方法。

该存储器401可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。

该处理器402可以包括但不限于微处理器MCU、数字信号处理器DSP、或者可编程逻辑器件FPGA等处理装置。

该电子设备还可以进一步包括输入装置404、通信装置406、接口装置403和显示装置405等。

该通信装置406例如能够进行有有线或无线通信。

该接口装置403例如包括USB接口、网口等。

该输入装置404例如可以包括触摸屏、按键等，以输入各种信息。

该显示装置405例如是液晶显示屏、触摸显示屏等，以显示电子书内容。

尽管在图4中示出了多个装置，但是，本发明电子设备400可以仅涉及其中的部分装置，例如，处理器401、存储器402、显示装置405等。

本发明的实施例还提供了一种计算机可读存储介质。可选地，在本实施例中，上述存储介质可以用于保存本发明所提供的翻页方法所执行的程序代码。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本发明翻页方法的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本发明的各个方面。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

可以理解的是，上述方法及装置中的相关特征可以相互参考。另外，上述实施例中的“第一”、“第二”等是用于区分各实施例，而并不代表各实施例的优劣。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的发明名称(如确定网站内链接等级的装置)中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

一种电子书的翻页方法，其特征在于，所述方法包括：

通过麦克风采集设置的翻页提示音；

保存采集的所述翻页提示音；

对麦克风进行监听，获取所述麦克风采集的声音信息；

确认所述声音信息与所述翻页提示音匹配，则触发与所述翻页提示音对应的翻页操作。
根据权利要求1所述的方法，其特征在于，所述保存采集的所述翻页提示音，包括：

将所述翻页提示音转换为第一文本信息列表，所述第一文本信息列表由发音与所述翻页提示音具有相似度关系的不同第一文本信息组成；

基于信息选择操作从所述第一文本信息列表中确定一个第一文本信息，作为对应所述翻页提示音的第一文本信息；

保存确定的所述第一文本信息。
根据权利要求2所述的方法，其特征在于，所述确认所述声音信息与所述翻页提示音匹配，包括：

将所述声音信息转换为第二文本信息列表，所述第二文本信息列表由发音与所述声音信息具有相似度关系的不同第二文本信息组成，所述第二文本信息按照相似度由高到低的顺序排列；

判断所述第二文本信息列表的目标文本信息集合中是否包含保存的所述第一文本信息，所述目标文本信息集合由所述第二文本信息列表的TOPN个第二文本信息组成，所述N为正整数；

若判断结果为所述目标文件信息集合中包含保存的所述第一文本信息，则确定所述声音信息与所述翻页提示音匹配。
根据权利要求1至3中任一项所述的方法，其特征在于，在确认所述声音信息与所述翻页提示音匹配之前，所述方法进一步包括：

从获取到的声音信息中过滤环境音对应的声音信息。
根据权利要求4所述的方法，其特征在于，所述从获取到的声音信息中过滤环境音对应的声音信息，包括：

从所述获取到的声音信息中剔除音量小于预设音量阈值的声音信息。
根据权利要求4所述的方法，其特征在于，所述从获取到的声音信息中过滤环境音对应的声音信息，包括：

在预设的声音信息库中查找所述获取到的声音信息对应的匹配成功率；

若所述匹配成功率小于预设成功率阈值，则剔除所述获取到的声音信息。
根据权利要求1至6中任一项所述的方法，其特征在于，在通过麦克风采集设置的翻页提示音之前，所述方法进一步包括：

基于语言选择操作设定所述翻页提示音的语种类型。
根据权利要求1至7中任一项所述的方法，其特征在于，当所述翻页提示音中包含数字M时，所述翻页提示音对应的翻页操作为连续翻过M页，所述M为正整数。
根据权利要求1至8中任一项所述的方法，其特征在于，所述翻页提示音包括：向前翻页提示音及向后翻页提示音。
一种电子书的翻页装置，其特征在于，所述装置包括：

采集单元，用于通过麦克风采集设置的翻页提示音；

保存单元，用于保存采集的所述翻页提示音；

所述采集单元还用于对麦克风进行监听，获取所述麦克风采集的声音信息；

确认单元，用于确认所述声音信息与所述翻页提示音匹配，则触发与所述翻页提示音对应的翻页操作。
根据权利要求10所述的装置，其特征在于，所述保存单元，包括：

第一转换模块，用于将所述翻页提示音转换为第一文本信息列表，所述第一文本信息列表由发音与所述翻页提示音具有相似度关系的不同第一文本信息组成；

第一确定模块，用于基于信息选择操作从所述第一文本信息列表中确定一个第一文本信息，作为对应所述翻页提示音的第一文本信息；

保存模块，用于保存确定的所述第一文本信息。
根据权利要求11所述的装置，其特征在于，所述确认单元，包括：

第二转换模块，用于将所述声音信息转换为第二文本信息列表，所述第二文本信息列表由发音与所述声音信息具有相似度关系的不同第二文本信息组成，所述第二文本信息按照相似度由高到低的顺序排列；

判断模块，用于判断所述第二文本信息列表的目标文本信息集合中是否包含保存的所述第一文本信息，所述目标文本信息集合由所述第二文本信息列表的TOP N个第二文本信息组成，所述N为正整数；

第二确定模块，用于当判断结果为所述目标文件信息集合中包含保存的所述第一文本信息时，确定所述声音信息与所述翻页提示音匹配。
根据权利要求10至12中任一项所述的装置，其特征在于，所述装置进一步包括：过滤单元，用于在确认所述声音信息与所述翻页提示音匹配之前，从获取到的声音信息中过滤环境音对应的声音信息。
根据权利要求13所述的装置，其特征在于，所述过滤单元，包括：

第一过滤模块，用于从所述获取到的声音信息中剔除音量小于预设音量阈值的声音信息。
根据权利要求13所述的装置，其特征在于，所述过滤单元，包括第二过滤模块，用于：

在预设的声音信息库中查找所述获取到的声音信息对应的匹配成功率；

当所述匹配成功率小于预设成功率阈值时，剔除所述获取到的声音信息。
根据权利要求10至15中任一项所述的装置，其特征在于，所述采集单元，还用于在通过麦克风采集设置的翻页提示音之前，基于语言选择操作设定所述翻页提示音的语种类型。
根据权利要求10至16中任一项所述的装置，其特征在于，当所述采集单元采集的所述翻页提示音中包含数字M时，所述翻页提示音对应的翻页操作为连续翻过M页，所述M为正整数。
根据权利要求10至17中任一项所述的装置，其特征在于，所述采集单元采集的所述翻页提示音包括：向前翻页提示音及向后翻页提示音。
一种电子书的翻页装置，包括存储器和处理器，其特征在于，所述存储器用于存储指令，所述指令用于控制所述处理器进行操作以执行根据权利要求1至9中任一项所述的方法。
一种计算机可读存储介质，其特征在于，存储有用于执行根据权利要求1至9中任一项所述方法的程序代码。