CN107203569B - 一种面向沉浸式阅读的阅读主题智能设置方法和装置 - Google Patents
一种面向沉浸式阅读的阅读主题智能设置方法和装置 Download PDFInfo
- Publication number
- CN107203569B CN107203569B CN201610158212.1A CN201610158212A CN107203569B CN 107203569 B CN107203569 B CN 107203569B CN 201610158212 A CN201610158212 A CN 201610158212A CN 107203569 B CN107203569 B CN 107203569B
- Authority
- CN
- China
- Prior art keywords
- reading
- scene
- information
- scene information
- scene description
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/438—Presentation of query results
- G06F16/4387—Presentation of query results by the use of playlists
- G06F16/4393—Multimedia presentations, e.g. slide shows, multimedia albums
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种用于电子书的阅读主题设置方法,包括:步骤1,从用户阅读的电子书文本中的场景描述语句中获取阅读内容场景信息;步骤2,根据所述阅读内容场景信息设置阅读主题。本发明还相应地提供了一种阅读主题设置装置。本发明的技术方案能够实现对用户阅读内容的场景分析;使阅读主题与阅读内容中的场景和用户所处的环境直接相关;从而使阅读氛围更有沉浸感,提升阅读体验。
Description
技术领域
本发明涉及智能终端和人机交互领域,具体地说,本发明涉及一种面向沉浸式阅读的阅读主题智能设置方法和装置。
背景技术
随着信息技术的发展,在计算机、手机、平板电脑等电子设备上阅读电子书已经和阅读纸质书一样成为人们获取知识和休闲娱乐的重要方式,并且也出现了专用的电子书阅读终端,如“Kindle”和“汉王电纸书”。相对于纸质书,电子书的内容呈现方式更为丰富多彩,例如,可以设置阅读的字体、背景颜色或背景图片,还可以在用户阅读的同时播放背景音乐。当前,很多电子书阅读器都提供阅读主题设置功能,允许用户设置背景、字体以及其它显示格式,从而使用户获得个性化的阅读体验。目前的阅读主题设置大多数由用户手动完成,设置的主题主要反映了用户对背景图案、颜色、字体大小等的个人偏好,而与用户正在阅读的内容无关。
目前虽然已有一些根据阅读内容自动设置背景图片和音乐的技术,但其对阅读内容的分析和利用主要有两种方式:一是获取阅读内容的主题或类型(如“激烈”、“奔放”等),然后根据主题或类型设置背景图片或音乐。这种方法对阅读内容的理解较为粗略,无法实现对阅读中场景的分析,从而也很难达到沉浸式、身临其境的效果;另一种方法是在阅读内容中提取关键词,利用得到的关键词搜索或匹配背景图片或音乐。这种方法只基于零散的关键词而缺乏对场景整体的识别和分析,其所设置的背景可能与阅读内容中的场景并不吻合。例如,若阅读内容中出现“小花拎着一瓶‘草原’酒走在路上”的句子,这些方法可能会因为检测到“小花”、“草原”、“路”等关键词而切换到含有花和路的草原的图片,而事实上该内容对应的场景与草原和花都没有关系。
综上所述,现有技术无法很好地实现对用户阅读内容的场景分析,从而无法实现符合用户期望的对阅读主题的智能设置。
发明内容
本发明的目的是提供一种能够克服上述技术问题的解决方案。
本发明提供了一种用于电子书的阅读主题设置方法,包括:步骤1,从用户阅读的电子书文本中的场景描述语句中获取阅读内容场景信息;步骤2,根据所述阅读内容场景信息设置阅读主题。
优选地,在步骤1中,所述场景描述语句是从用户当前阅读的电子书文本中自动提取的。
优选地,在步骤1中,所场景描述语句来源于与所述电子书文本对应的标注文件。
优选地,步骤1进一步包括:从所述场景描述语句中自动提取出对应的阅读内容场景信息。
优选地,步骤1进一步包括:从所述场景描述语句中人工标注出对应的阅读内容场景信息。
优选地,步骤1进一步包括:采用统计分类器从所述场景描述语句中提取出对应的阅读内容场景信息。
优选地,步骤2进一步包括:根据所述阅读内容场景信息设置所述阅读主题中的背景图片和/或背景音乐。
优选地,步骤1还包括:从用户的阅读环境中获取环境场景信息;所述步骤2还包括:根据所述阅读内容场景信息和所述环境场景信息设置所述阅读主题。
优选地,在步骤2中,所述环境场景信息包括:时间场景信息、光照场景信息、声音场景信息。
本发明还相应地提供了一种用于电子书的阅读主题设置装置,包括:用于从用户阅读的电子书文本中的场景描述语句中获取阅读内容场景信息的模块;用于根据所述阅读内容场景信息设置阅读主题的模块。
与现有技术相比,本发明提出的技术方案能够实现对用户阅读内容的场景分析;使阅读主题与阅读内容中的场景和用户所处的环境直接相关;从而使阅读氛围更有沉浸感,提升阅读体验。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图并不构成对于本发明的技术方案的限制。
图1是根据本发明的实施例的阅读主题设置方法的流程示意图;
图2是根据本发明的一个实施例的获取场景描述语句的方法的流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步地描述。
发明人经研究发现,相对于设置固定的阅读主题,事实上读者更希望能实现一种沉浸式的智能的阅读主题设置方式。在这种模式下,系统可以根据阅读内容中的场景自动切换主题,如当用户正在阅读的小说中人物正处于草原场景时,电子书阅读器的背景图片自动切换为草原的图片,同时还可以播放与草原相关的音乐,如果小说场景中还有关于风、云、雨、雪等的描写,在背景中也可以采用动画等技术呈现相应的效果;而当阅读内容中的场景切换时,如从草原进入村镇或城市,则电子书阅读器的主题(包括但不限于背景图片、音乐等)也随之相应变化,呈现与村镇或城市相关的内容。通过这种方式,可以营造一种身临其境的感觉,增强用户阅读的愉悦感,同时也有益于用户理解和记忆阅读的内容。
另一方面,要想营造一种舒适的、身临其境的阅读氛围,除了要考虑用户正在阅读的内容之外,有些情况下还需考虑用户本身所在的真实世界场景。例如,当用户在深夜较暗的环境中阅读时,一般不宜出现太过明亮的颜色和太过激烈的背景音乐。
图1示出了根据本发明的实施例的阅读主题设置方法的流程示意图。如图1所示,该方法一方面获取阅读内容中的场景描述语句,从场景描述语句中获取阅读内容场景信息;另一方面从环境场景数据中获取用户的阅读环境的场景信息。利用从阅读内容中提取的阅读内容场景信息和从环境场景数据中提取的环境场景信息共同确定背景图片、屏幕亮度、背景音乐等阅读主题,使该阅读主题与阅读内容中的场景和用户的环境场景直接相关。
现结合本发明的实施例,将该方法具体描述如下。
步骤102.检测用户当前阅读的电子书文本(以下简称为当前的电子书文本)中是否存在场景描述语句,如果有,则获取所述场景描述语句。
所述场景描述语句,是指书中,特别是文学类书中介绍人物所在的或故事发生的场景的描述性语句,如“转过山怀中,隐隐露出一带黄泥筑就矮墙,墙头皆用稻茎掩护。有几百株杏花,如喷火蒸霞一般。里面数楹茅屋。外面却是桑,榆,槿,柘,各色树稚新条,随其曲折,编就两溜青篱。篱外山坡之下,有一土井,旁有桔槔辘轳之属。下面分畦列亩,佳蔬菜花,漫然无际。”(出自曹雪芹《红楼梦》)。又如,“路边的田里长着碧绿的青麦子,整齐地随风摇曳。他们登上一段坡道,渐渐地看见了黄土台地和浅山夹着的湟水河滩。铁灰色的河滩上也有些棋盘般方正的绿麦地,一溜蹲成并排的一串花头巾在麦浪上蠕动。”(出自张承志《北方的河》)。
根据本发明的一个实施例,可以采用基于预先标注的方法获取当前的电子书文本中的场景描述语句,即提供一个与电子书文件对应的标注文件,在该标注文件中预先人工标注出该电子书文件中的所有场景描述语句,并提供该语句的位置信息,如对应的章节和页码等。在需要检测和获取场景描述语句时,读取该标注文件,如果标注文件中有场景描述语句,则获取相应的场景描述语句。
根据本发明的另一个实施例,可以采用基于文本分析自动提取的方法检测并获取当前的电子书文本中的场景描述语句,即系统自动分析正在阅读的电子书文本,自动检测并提取其中的场景描述语句。如图2所示,可以采用如下所述的基于统计分类器的场景描述语句检测和提取方法。
步骤102.1将当前阅读的电子书文本切分为词并标注词性,然后提取其中的名词。可采用现有的词语切分方法(例如,基于字符串匹配的分词方法、基于统计的分词方法,等)和词性标注方法(例如,基于隐马尔可夫模型、感知器、条件随机场等统计学习模型的词性标注方法)来进行对电子书文本的切分及词性标注。
步骤102.2采用一个滑动窗口,即按顺序每次取m个提取出的名词,构造特征向量。根据本发明的一个实施例,可以构造出形如[(w1,f1),(w2,f2),...,(wn,fn)]的特征向量,其中,w1,...,wn为汉语中所有的名词,由一个预先准备的词典给出;fi为wi(i=1,...,n)在当前滑动窗口中出现的频率,若未出现则为0。其中,m的取值原则是与现实文本中出现的场景描述语句中的名词的平均数量近似。根据本发明的实施例,优选地,m的取值范围可为5至20中的任一整数;进一步优选地,在本发明的一个实施例中,m为10。
步骤102.3采用预先训练的统计分类器对当前滑动窗口提取的特征向量进行分类,决定当前滑动窗口所对应的语句内容是否为场景描述语句。若是(例如,统计分类器判断当前滑动窗口提取的特征向量所对应的语句为场景描述语句的概率大于或等于预设的阈值),则进入步骤102.4;若否(例如,统计分类器判断当前滑动窗口提取的特征向量所对应的语句为场景描述语句的概率小于预设的阈值),则转入步骤102.2进行下一滑动窗口的处理。其中,统计分类器可采用现有的方法构建,如贝叶斯分类器、KNN分类器、支持向量机(SVM)等。其中,统计分类器的训练方法为:(1)收集大量电子书形成电子书文本库;(2)对电子书文本库中的文本进行与步骤102.1中相同的分词、词性标注、名词提取操作;(3)对电子书文本库中提取的名词进行与步骤102.2中相同的滑动窗口和特征向量提取操作;(4)人工标注每个滑动窗口对应的内容是否为场景描述语句(即,人工寻找窗口中的名词所在的句子,然后人工判断该句子是否在描述场景),是则为1,否则为0;(5)利用电子书文本库中所有滑动窗口提取的特征向量及其对应的是否为场景描述语句的标注信息训练统计分类器。
步骤102.4对于被统计分类器判定为其对应的语句是场景描述语句的滑动窗口,提取该滑动窗口对应的场景描述语句。方法为:找到该滑动窗口对应的文字(即以该滑动窗口中处于两端的名词为边界的电子书文本中的所有文字内容),调整该文字的前后边界,将其分别向前或向后扩展到最近的表示句子结束的标点符号(例如,句号、问号、感叹号等),使其包含完整的句子。通过提取完整的场景描述语句用于提取阅读内容场景信息,使得在后续步骤中能够比较全面的提取到当前电子书文本中的阅读内容场景信息,减少甚至防止信息的遗漏,保障所获取的阅读内容场景信息与电子书文本所表达的内容吻合。
优选地,可以进一步以当前的滑动窗口对应的文字为中心,通过适当扩展其文字边界的方式,确定包含场景描述语句的最优边界。根据本发明的一个实施例,可以根据当前电子书文本的原文顺序,将当前的滑动窗口对应的文字的前后边界的1至K个句子依次加入当前的滑动窗口中,即将所增加的句子中的名词并入当前的滑动窗口中,形成多个窗口,对每一个窗口采用与步骤102.3中相同的分类器分类方法,获取窗口内容对应为场景描述语句的概率,取概率最大的窗口对应的文字为最终获取的场景描述语句。其中,优选地,K的取值不宜过大;进一步地,根据本发明的实施例,K的取值范围为1至3中的任一整数;进一步优选地,在一个实施例中,K的取值可为2。
步骤102.5如果相邻多个滑动窗口都被判定为其对应的文字是场景描述语句,则将这些滑动窗口中提取的所有场景描述语句通过取并集的方式进行合并,得到合并的场景描述语句。
应当注意的是,对电子书文本检测并提取场景描述语句的时机和所检测的电子书文本范围并非对于本发明的限制。根据本发明的实施例,使用电子书的文本时,可以一次性使用当前阅读的电子书的全部文本提取其中所有场景描述语句,也可只针对其一部分文本,如正在显示的页及其若干相邻页,或正在显示的文本所在的章节提取其中所有的场景描述语句。例如,在根据本发明的一个实施例中,当用户首次打开一本电子书时,使用该电子书的文本提取其中所有的场景描述语句;在另一个实施例中,当用户阅读至电子书的每一个新的章节时,使用该章节的文本提取场景描述语句;在又一个实施例中,在用户每次翻页时,使用正在显示的页的文本提取其中的场景描述语句。
步骤104.从场景描述语句中获取阅读内容场景信息
获取场景描述语句之后,即从所获取的场景阅读语句中获取阅读内容场景信息,并记录所获取的阅读内容场景信息以及其在电子书文本中的位置作为当前的电子书文本的阅读内容场景信息的获取结果。其中,所获取的阅读内容场景信息包含两部分:颜色描述信息和景物描述信息。其中,颜色描述信息为一组颜色词,用于指明阅读内容场景中的主要颜色;景物描述信息为一组对应景物的名词,用于指明阅读内容场景中有哪些物体。
根据本发明的一个实施例,可以采用基于人工标注的方法获取阅读内容场景信息,即提供一个与电子书文件对应的标注文件,在该标注文件中对获取的场景描述语句通过人工标注的方式标注出与其对应的阅读内容场景信息。其中,人工标注的具体示例,例如,在一个实施例中,对于场景描述语句“路边的田里长着碧绿的青麦子,整齐地随风摇曳。他们登上一段坡道,渐渐地看见了黄土台地和浅山夹着的湟水河滩。铁灰色的河滩上也有些棋盘般方正的绿麦地,一溜蹲成并排的一串花头巾在麦浪上蠕动。”,人工标注其颜色描述信息为:{土黄色,绿色,银灰色},景物描述信息为:{黄土地,河,湟水,河滩,山,麦地,麦苗,农妇,花头巾}。根据本发明的实施例,从获取的场景描述语句中基于人工标注的方法获取对应的阅读内容场景信息的步骤所涉及的标注文件可以与前述步骤102中基于预先标注的方法的实施例所涉及的标注文件为同一文件。例如,根据本发明的一个实施例,可以提供一个与电子书文件对应的标注文件,在该标注文件中根据前述步骤102预先人工标注出该电子书文件中的所有场景描述语句,并进一步根据步骤104预先通过人工标注的方式,分别标注出与所有场景描述语句对应的阅读内容场景信息,并提供相应信息的位置信息,如对应的章节和页码等。在需要检测和获取阅读内容场景信息时,读取该标注文件,如果标注文件中有对应的阅读内容场景信息,则获取相应的阅读内容场景信息。
根据本发明的实施例,从获取的场景描述语句中基于人工标注的方法获取对应的阅读内容场景信息的步骤所涉及的标注文件可以与前述步骤102中基于预先标注的方法的实施例所涉及的标注文件为不同的文件。例如,根据本发明的一个实施例,基于适于在前述步骤102采用的任意一种方法所获得的场景描述语句在步骤104中被提供给特定的操作者(例如,阅读终端(例如,手机、平板电脑等)的使用者、与阅读终端通信的服务器端的服务提供人员,等等);进而该操作者通过如前所述的人工标注的方式提供一个标注了与获得的场景描述语句对应的阅读内容场景信息及其的位置信息(如对应的章节和页码等)的标注文件;读取该标注文件,如果标注文件中有对应的阅读内容场景信息,则获取相应的阅读内容场景信息。
根据本发明的另一个实施例,可以采用基于文本分析自动提取的方法获取阅读内容场景信息,即系统自动分析其获得的场景描述语句,提取其中的阅读内容场景信息。根据本发明的一个实施例,基于文本分析自动提取的方法如下:将场景描述语句分词并标注词性,然后提取其中的颜色词作为颜色描述信息,提取除颜色词外的其它名词作为景物描述信息。其中,颜色词的提取采用一个预先准备的包含所有颜色的词表,把场景描述语句中出现的包含在该词表中的词提取出来。例如,在一个实施例中,对于场景描述语句“路边的田里长着碧绿的青麦子,整齐地随风摇曳。他们登上一段坡道,渐渐地看见了黄土台地和浅山夹着的湟水河滩。铁灰色的河滩上也有些棋盘般方正的绿麦地,一溜蹲成并排的一串花头巾在麦浪上蠕动。”,基于文本分析自动提取的颜色描述信息为:{碧绿,青,灰色,绿},景物描述信息为:{路,田,麦子,风,坡道,黄土,台地,山,湟水,河滩,棋盘,麦地,头巾,麦浪}。
步骤106.获取用户的阅读环境的场景信息(即环境场景信息)
根据本发明的实施例,在每次发生翻页操作时,获取用户的环境场景信息。其中,环境场景信息,是指与用户所处的真实环境相关的场景信息,包括:时间场景信息、光照场景信息、声音场景信息等。
根据本发明的实施例,时间场景信息对应一天中的不同时段,可根据实际情况和经验设定。例如,在根据本发明的一个实施例中,可将时间场景信息设定为:早晨(6:00-9:00)、白天(9:00-18:00)、晚上(18:00-23:00)、深夜及凌晨(23:00-6:00)。其中,时间可由阅读终端设备的时钟获取。
根据本发明的实施例,光照场景信息用于反映用户所处环境的光照强弱,可由阅读终端设备的光线传感器获取。其中,可将光线传感器获取的光强数据分为若干个等级。例如,在根据本发明的一个实施例中,可将光线传感器所获取的光强数据分为强、中、弱、极弱四个等级。
根据本发明的实施例,声音场景信息用于反映用户所处环境的背景声音的强弱,可由阅读终端设备的麦克风获取。根据本发明的一个实施例,可通过麦克风采集一段声音,提取该声音的平均能量特征,根据该特征的数值将背景声音分为若干个等级。例如,在一个实施例中,可根据所采集的声音的平均能量特征将背景声音的强度分为强、中、弱、极弱四个等级。
步骤108.结合所获取的阅读内容场景信息和环境场景信息,自动设置当前的阅读主题,包括:背景图片、背景音乐等。根据本发明的实施例,在每次翻页时,判断翻页后当前显示的页面包含的文字中是否包含有阅读内容场景信息,即检索与当前显示的页面文本所对应的阅读内容场景信息获取结果中是否存在相应的阅读内容场景信息。如果含有阅读内容场景信息,则进行阅读主题设置。
根据本发明的实施例,背景图片的设置方法为:利用阅读内容场景信息搜索得到候选背景图片;进一步地,利用环境场景信息对候选背景图片进行筛选,将筛选得到的图片设置为阅读背景。其中,利用阅读内容场景信息搜索得到候选背景图片时,可以利用通用的网络图片搜索引擎,也可以在专门创建的图片库中搜索。
根据本发明的一个实施例,利用通用的网络图片搜索引擎时,将颜色描述信息和景物描述信息中的所有词作为关键词输入网络图片搜索引擎,然后获取排在前N(优选地,N的参考取值范围为1至20中的任一整数)位的搜索结果作为候选背景图片。
根据本发明的另一个实施例,在专门创建的图片库中搜索时,需预先创建一个图片库,并为其中的每张图片标注颜色信息和景物信息。其中,颜色信息为图片中的主要颜色,是颜色词的集合;景物信息为图片中的主要景物,是一组名词的集合。搜索时,把阅读内容场景信息和图片库中每张图片进行匹配,计算相似度。根据本发明的实施例,相似度Sp的计算方法为:Sp=ScSo,其中Sc为颜色相似度,So为景物相似度。其中,计算颜色相似度时,将阅读内容场景信息中的颜色描述信息与图片标注中的颜色信息进行比较:设阅读内容场景信息中的颜色描述信息中有n1个颜色词,图片标注中的颜色信息中有n2个颜色词,两者中相同的颜色词有ns个,则Sc=2ns/(n1+n2)。计算景物相似度时,将阅读内容场景信息中的景物描述信息与图片标注中的景物信息进行比较:设阅读内容场景信息中的景物描述信息中有m1个词,图片标注中的景物信息中有m2个颜色词,两者中相同的词有ms个,则So=2ms/(m1+m2)。将所有图片按相似度Sp排序,并取排在前N位的搜索结果作为候选背景图片。
进一步地,得到候选背景图片后,可以利用环境场景信息对候选背景图片进行筛选。根据本发明的实施例,对候选背景图片进行筛选的方法为计算每一张候选背景图片的平均亮度,根据时间场景信息和光照场景选择平均亮度符合要求的M(优选地,M的参考取值为1至5中的任一整数)张作为背景图片。根据本发明的实施例,平均亮度的计算方法为:将彩色图片转换为灰度图像,然后将灰度图像中所有像素灰度的平均值作为图片的平均亮度。在一个实施例中,选择的规则可为:将所有候选背景图片按平均亮度按由低到高排序,如果时间场景信息为深夜或者光照场景为极弱,则选择平均亮度最低的M张图片;如果时间场景信息为早晨或晚上,或者光照场景为弱,则在平均亮度排序位于20-30%的候选背景图片中随机选择M张图片;如果光照场景为强,则选择平均亮度最高的M张图片;对于其他情况,在平均亮度排序位于40-60%的候选背景图片中随机选择M张图片。
在得到M张图片后,可以采用多种方法将这些图片设置为阅读背景。例如,可固定采用其中的一张;可以将M张图片都作为阅读背景并按照一定的时间间隔循环切换;也可以提示阅读终端的使用者自己在M张图片中选择一张或几张作为阅读背景。优选地,作为阅读背景时,为避免影响阅读,图片可做适当的透明处理。
根据本发明的实施例,背景音乐的设置方法为:利用阅读内容场景信息搜索得到背景音乐并播放;进一步地,利用环境场景信息设置播放音量。其中,利用阅读内容场景信息搜索得到背景音乐时,可以利用通用的网络音乐搜索引擎,也可以在专门创建的音乐库中搜索。
根据本发明的一个实施例,利用通用的网络音乐搜索引擎时,将景物描述信息中所有词作为关键词输入网络音乐搜索引擎,然后获取排在前N’(优选地,N’的参考取值范围为1至20中的任一整数)位的搜索结果作为候选背景音乐。
根据本发明的另一个实施例,在专门创建的音乐库中搜索时,需预先创建一个音乐库,并为其中的每首音乐附加文本信息以作为对该音乐的检索依据。其中,文本信息可以是歌曲的歌词,也可以是对音乐内容的描述和介绍。搜索时,把阅读内容场景信息中的景物描述信息和音乐库中每首音乐的文本信息进行匹配,计算相似度。根据本发明的实施例,相似度Sm计算方法为:Sm=nm/nt,其中nt为阅读内容场景信息中的景物描述信息中的词的数目,nm为这些词中出现在一首音乐的文本信息中的词的数目。将所有音乐按相似度Sm排序,并取排在前M’(M’的参考取值范围为1至5中的任一整数)位的搜索结果作为背景音乐。
在得到M’首音乐后,可以采用多种方法将这些音乐设置为阅读的背景音乐。例如,可固定采用其中的一首;可以将M’首音乐都作为背景音乐并按照顺序循环播放;也可以提示阅读终端的使用者自己在M’首音乐中选择一首或几首作为背景音乐。
进一步地,在背景音乐播放时,利用环境场景信息设置播放音量。根据本发明的实施例,设置播放音量的方法为:将播放的音量分类若干个等级,并根据环境场景信息中的声音场景信息中的等级设置播放音量的等级。在一个实施例中,播放的音量可分为强、中、弱、极弱四个等级,分别对应设备最大音量的80%,60%,40%和20%,声音场景信息也分为强、中、弱、极弱四个等级。该实施例中,播放音量的等级设定为与声音场景信息的等级相同。
以上所述仅为本发明示意性的具体实施方式,并非用以限定本发明的范围。任何本领域的技术人员,在不脱离本发明的精神和范围的前提下所作的等同变化、修改与结合,均应属于本发明要求保护的范围。本发明要求的保护范围由所附的权利要求书及其等同界定。
Claims (8)
1.一种用于电子书的阅读主题设置方法,包括:
步骤1,采用统计分类器从用户阅读的电子书文本中获取场景描述语句,其中所述统计分类器是利用作为样本的电子书文本中的名词构造的特征向量及其对应的语句是否为所述场景描述语句的标注信息训练的,所述步骤1进一步包括:
使用滑动窗口提取所述电子书文本中的名词构造特征向量;
采用所述统计分类器对所述特征向量进行分类,以确定所述滑动窗口所对应的语句是否为所述场景描述语句;
根据所述统计分类器的分类结果,提取所述场景描述语句;
步骤2,将所述场景描述语句分词并从中提取颜色词和除颜色词以外的名词作为阅读内容场景信息;
步骤3,根据所述阅读内容场景信息设置阅读主题。
2.根据权利要求1所述的方法,其特征在于,所述步骤2进一步包括:
从所述场景描述语句中自动提取出对应的阅读内容场景信息。
3.根据权利要求1所述的方法,其特征在于,所述步骤2进一步包括:
从所述场景描述语句中人工标注出对应的阅读内容场景信息。
4.根据权利要求1所述的方法,其特征在于,所述统计分类器的训练包括下列步骤:
由电子书文本构成电子书文本库;
使用滑动窗口对所述电子书文本提取特征向量;
通过标注所述滑动窗口对应的语句是否为所述场景描述语句获得标注信息;
利用所述电子书文本库中的全部所述特征向量及其对应的所述标注信息训练所述统计分类器。
5.根据权利要求1所述的方法,其特征在于,所述步骤3进一步包括:
根据所述阅读内容场景信息设置所述阅读主题中的背景图片和/或背景音乐。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
步骤4,从用户的阅读环境中获取环境场景信息;
步骤5,根据所述环境场景信息调整所述步骤3设置的阅读主题。
7.根据权利要求6所述的方法,其特征在于,所述环境场景信息包括:时间场景信息、光照场景信息、声音场景信息。
8.一种用于电子书的阅读主题设置装置,包括:
用于采用统计分类器从用户阅读的电子书文本中获取场景描述语句的第一模块,其中所述统计分类器是利用作为样本的电子书文本中的名词构造的特征向量及其对应的语句是否为所述场景描述语句的标注信息训练的,所述第一模块进一步包括:用于使用滑动窗口提取所述电子书文本中的名词构造特征向量的子模块、用于采用所述统计分类器对所述特征向量进行分类以确定所述滑动窗口所对应的语句是否为所述场景描述语句的子模块,以及用于根据所述统计分类器的分类结果提取所述场景描述语句的子模块;
用于将所述场景描述语句分词并从中提取颜色词和除颜色词以外的名词作为阅读内容场景信息的第二模块;
用于根据所述阅读内容场景信息设置阅读主题的第三模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610158212.1A CN107203569B (zh) | 2016-03-18 | 2016-03-18 | 一种面向沉浸式阅读的阅读主题智能设置方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610158212.1A CN107203569B (zh) | 2016-03-18 | 2016-03-18 | 一种面向沉浸式阅读的阅读主题智能设置方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107203569A CN107203569A (zh) | 2017-09-26 |
CN107203569B true CN107203569B (zh) | 2021-07-20 |
Family
ID=59904616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610158212.1A Active CN107203569B (zh) | 2016-03-18 | 2016-03-18 | 一种面向沉浸式阅读的阅读主题智能设置方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107203569B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108228544B (zh) * | 2017-12-28 | 2019-03-29 | 掌阅科技股份有限公司 | 电子书阅读参数调整方法、电子设备及计算机存储介质 |
CN108877803B (zh) * | 2018-06-08 | 2020-03-27 | 百度在线网络技术(北京)有限公司 | 用于呈现信息的方法和装置 |
CN111104544A (zh) * | 2018-10-29 | 2020-05-05 | 阿里巴巴集团控股有限公司 | 背景音乐的推荐方法、设备、客户端装置及电子设备 |
CN109918509B (zh) * | 2019-03-12 | 2021-07-23 | 明白四达(海南经济特区)科技有限公司 | 基于信息提取的场景生成方法及场景生成系统的存储介质 |
CN110795635B (zh) * | 2019-10-31 | 2023-04-07 | 上海连尚网络科技有限公司 | 一种呈现书籍的方法与设备 |
CN111488091A (zh) * | 2020-04-16 | 2020-08-04 | 深圳传音控股股份有限公司 | 移动终端的界面显示方法、移动终端及存储介质 |
CN115082602B (zh) * | 2022-06-15 | 2023-06-09 | 北京百度网讯科技有限公司 | 生成数字人的方法、模型的训练方法、装置、设备和介质 |
CN116484091A (zh) * | 2023-03-10 | 2023-07-25 | 湖北天勤伟业企业管理有限公司 | 卡牌信息程序交互方法和装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102193903A (zh) * | 2010-03-15 | 2011-09-21 | 索尼公司 | 信息处理装置、信息处理方法以及程序 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103559193B (zh) * | 2013-09-10 | 2016-08-31 | 浙江大学 | 一种基于选择单元的主题建模方法 |
CN103646094B (zh) * | 2013-12-18 | 2017-05-31 | 上海紫竹数字创意港有限公司 | 实现视听类产品内容摘要自动提取生成的系统及方法 |
CN104991708B (zh) * | 2015-07-22 | 2018-04-10 | 北京奇虎科技有限公司 | 电子阅读设备及其阅读场景自适应配置方法 |
CN105335455A (zh) * | 2015-08-28 | 2016-02-17 | 广东小天才科技有限公司 | 一种阅读文字的方法及装置 |
-
2016
- 2016-03-18 CN CN201610158212.1A patent/CN107203569B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102193903A (zh) * | 2010-03-15 | 2011-09-21 | 索尼公司 | 信息处理装置、信息处理方法以及程序 |
Also Published As
Publication number | Publication date |
---|---|
CN107203569A (zh) | 2017-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107203569B (zh) | 一种面向沉浸式阅读的阅读主题智能设置方法和装置 | |
CN107169430B (zh) | 基于图像处理语义分析的阅读环境音效增强系统及方法 | |
CN106778757B (zh) | 基于文本显著性的场景文本检测方法 | |
Hendricks et al. | Deep compositional captioning: Describing novel object categories without paired training data | |
CN107346420B (zh) | 一种基于深度学习的自然场景下文字检测定位方法 | |
CN101271528B (zh) | 一种输出图像的方法及装置 | |
Vu et al. | Predicting actions from static scenes | |
KR101667463B1 (ko) | 콘텍스트 정보를 이용한 모바일 디바이스 상에서의 광학적 문자 인식 | |
CN101620680B (zh) | 字符图像的识别和翻译方法以及装置 | |
Ren et al. | A novel text structure feature extractor for Chinese scene text detection and recognition | |
CN113536793A (zh) | 一种实体识别方法、装置、设备以及存储介质 | |
CN106257496B (zh) | 海量网络文本与非文本图像分类方法 | |
US20160026872A1 (en) | Identifying presentation styles of educational videos | |
CN109344298A (zh) | 一种将非结构化数据转化为结构化数据的方法及装置 | |
CN104537028B (zh) | 一种网页信息处理方法及装置 | |
Zhou et al. | Detecting multilingual text in natural scene | |
WO2022100352A1 (zh) | 用于显示识别结果的方法和计算机系统 | |
CN110347302B (zh) | 一种电子书的显示方法和装置 | |
CN113821663A (zh) | 图像处理方法、装置、设备及计算机可读存储介质 | |
CN104834757A (zh) | 图像语义检索方法及其系统 | |
CN113407766A (zh) | 视觉动画显示方法及相关设备 | |
Mylonas et al. | Context modelling for multimedia analysis | |
Satwashil et al. | English text localization and recognition from natural scene image | |
Pavlidis | Why meaningful automatic tagging of images is very hard | |
CN113887334A (zh) | 一种视频知识点抽取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |