CN108573260A - 信息处理方法和装置、电子设备、计算机可读存储介质 - Google Patents
信息处理方法和装置、电子设备、计算机可读存储介质 Download PDFInfo
- Publication number
- CN108573260A CN108573260A CN201810272170.3A CN201810272170A CN108573260A CN 108573260 A CN108573260 A CN 108573260A CN 201810272170 A CN201810272170 A CN 201810272170A CN 108573260 A CN108573260 A CN 108573260A
- Authority
- CN
- China
- Prior art keywords
- file
- word
- plain text
- voice
- text information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 49
- 238000003672 processing method Methods 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 13
- 238000004590 computer program Methods 0.000 claims description 15
- 230000000875 corresponding effect Effects 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 8
- 238000000926 separation method Methods 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 230000006854 communication Effects 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000012905 input function Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Telephone Function (AREA)
Abstract
本申请涉及一种信息处理方法、装置、电子设备和计算机可读存储介质。该方法包括:若识别被打开的文件的格式为指定格式,则扫描所述文件;从所述文件中提取文字得到纯文本信息;将所述纯文本信息中的文字转化为语音,并进行播放。上述信息处理方法、装置、电子设备、计算机可读存储介质,识别到文件的格式为特定格式文件时,从文件中提取文字得到文本信息,将文本信息中的文字转化为语音进行播放,实现了指定格式文件中内容的语音播放,方便以音频方式播放指定格式的文件。
Description
技术领域
本申请涉及信息处理领域,特别是涉及一种信息处理方法、装置、电子设备、计算机可读存储介质。
背景技术
随着电子设备的普及,越来越多的用户携带电子设备查看文件、播放音乐,或者通过电子设备上的语音识别系统将文字信息识别为语音进行播放等。然而,电子设备无法通过语音播放一些格式的文件。
发明内容
本申请实施例提供一种信息处理方法、装置、电子设备、计算机可读存储介质,可以通过音频播放文件中的内容。
一种信息处理方法,包括:
若识别被打开的文件的格式为指定格式,则扫描所述文件;
从所述文件中提取文字得到纯文本信息;
将所述纯文本信息中的文字转化为语音,并进行播放。
一种信息处理装置,包括:
扫描模块,用于若识别被打开的文件的格式为指定格式,则扫描所述文件;
提取模块,用于从所述文件中提取文字得到纯文本信息;
播放模块,用于将所述纯文本信息中的文字转化为语音,并进行播放。
一种电子设备,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述的信息处理方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的信息处理方法的步骤。
本申请实施例中的信息处理方法、装置、电子设备、计算机可读存储介质,识别到文件的格式为特定格式文件时,从文件中提取文字得到文本信息,将文本信息中的文字转化为语音进行播放,实现了指定格式文件中内容的语音播放,方便以音频方式播放指定格式的文件。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中信息处理方法的应用环境示意图;
图2为一个实施例中信息处理方法的流程图;
图3为另一个实施例中信息处理方法的流程图;
图4为另一个实施例中信息处理方法的流程图;
图5为一个实施例的信息处理装置的结构框图;
图6为另一个实施例的信息处理装置的结构框图;
图7为一个实施例中电子设备的内部结构示意图;
图8为一个实施例中电子设备相关的手机的部分结构的框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一客户端称为第二客户端,且类似地,可将第二客户端称为第一客户端。第一客户端和第二客户端两者都是客户端,但其不是同一客户端。
图1为一个实施例中信息处理方法的应用环境示意图。如图1所示,该应用环境包括电子设备110。电子设备110识别到被打开的文件的格式为指定格式,则扫描整个文件,从文件中提取文字得到纯文本信息,从纯文本信息中的文字转化为语音进行播放。实现了将指定格式的文件内容通过语音播放,方便播放非音频格式的文件。电子设备110可为智能手机、平板电脑或者个人数字助理或穿戴式设备等。
图2为一个实施例中信息处理方法的流程图。本实施例中的信息处理方法,以运行于图1中的电子设备上为例进行描述。如图2所示,一种信息处理方法包括步骤202至步骤206。
步骤202,若识别被打开的文件的格式为指定格式,则扫描所述文件。
具体地,计算机文件是以计算机硬盘为载体存放在计算机上的信息集合。文件可以是文本文档、图片、程序等等。文件通常具有后缀名。后缀名用于指示文件的格式类型。例如,文件的后缀名为.jpg,则该文件为图片文件。指定格式是指系统默认的格式,或者用户选择的文件格式。指定格式可为包含图形的文件的格式。在一个实施例中,指定格式可为PDF(Portable Document Format,便携式文档)格式、JPEG(Joint Photographic ExpertsGROUP)格式、PPT(Power point)格式等。PDF格式的文件是采用投影制作的,不能直接被音频播放。电子设备接收到点击某个文件的触发指令后,通过调用对应的应用程序读取该文件数据,并将该文件数据通过电子设备进行输出。
电子设备识别被打开的文件的格式是否为指定格式,可通过将被打开的文件的格式与指定格式进行匹配,若相同,则被打开的文件的格式为指定格式,若不同,则被打开的文件不为指定格式。
当电子设备识别到被打开的文件的格式为指定格式,则扫描整个文件。电子设备扫描文件可采用逐行扫描方式,或者采用多行同时扫描方式。
步骤204,从所述文件中提取文字得到纯文本信息。
具体地,电子设备可以对该指定格式的文件进行整体扫描,然后识别出文件中的文字,并将提取的文字按照在文件中出现的先后顺序排列组成纯文本信息。纯文本信息是指只包含文字。
步骤206,将所述纯文本信息中的文字转化为语音,并进行播放。
具体地,电子设备中的文字转语音系统可将纯文本信息中的文字转化为语音,然后将语音播放,通过电子设备的音频输出单元将声音放出。音频输出单元可为麦克风或扬声器。
本实施例的信息处理方法,识别到被打开的文件的格式为指定格式时,对该文件进行扫描,提取文件中的文字得到文本信息,将文本信息中文字转化为语音进行播放,实现了对指定格式文件的语音播放,扩展了文件输出方式,方便以音频方式播放非音频格式的文件内容。
在一个实施例中,识别被打开的文件的格式为指定格式的步骤包括:识别被打开的文件的后缀名是否包含预设字符串;当该文件的后缀名包含预设字符串,则该文件的格式为指定格式。
具体地,后缀名是指文件的扩展名,用于表示文件的类型。例如文件的后缀名为.pdf,则文件为PDF文档;文件的后缀名为.doc,则文件为word文档。预设字符串是指指定格式的文件的后缀名所包含的字符串。可以将指定格式的文件的后缀名的字符串放置在字符串集合。
电子设备识别被打开的文件的后缀名是否包含预设字符串,若包含,则该文件的格式为指定格式,则对该文件进行扫描,提取该文件中的文字。电子设备可将被打开的文件的后缀名与字符串集合中的预设字符串进行比对,若该文件的后缀名包含了字符串集合中的预设字符串,则该文件的格式为指定格式。
在一个实施例中,从文件中提取文字得到纯文本信息,包括:获取文件中的图像,将该图像中的文字和图形分离,获取文字,得到纯文本信息。
具体地,被打开的文件中包含图像,电子设备将图像中的文字和图形可通过影像成形方式分离。电子设备通过影像成形方式识别出文件中的文字行,将文字行切割,得到字符串,再将字符串切割得到单个字符,如此将文字和图形分类,去除图形得到纯文本信息。
在一个实施例中,如图3所示,一种信息处理方法,包括步骤302至步骤308。其中:
步骤302,若识别被打开的文件的格式为指定格式,则扫描所述文件。
具体地,指定格式可为包含图形的文件的格式。指定格式可为PDF格式、JPEG格式、PPT格式等。
步骤304,从所述文件中提取文字得到纯文本信息。
步骤306,将所述纯文本信息存放在文本文件中。
具体地,文本文件是指用于存储纯文本信息的文件。文本文件的格式可为txt格式。电子设备将纯文本信息存储到txt格式的文件中。
步骤308,对所述文本文件中的文字进行依次读取,转化为语音,并进行播放。
具体地,电子设备通过调用文字转语音系统对txt格式的文件中的文字进行依次读取,然后转化为语音,通过扬声器等音频输出单元输出。
本实施例中的信息处理方法,通过识别到被打开的文件格式为指定格式,从该文本中提取文字,得到纯文本信息,将纯文本信息存放在文本文件中,然后依次读取文本文件中的文字,转化为语音进行播放,实现了对指定格式文件内容的语音播放,从文本文件中读取指定格式的文件中的文字,保证读取方便,不易出现错误。
在一个实施例中,将纯文本信息中的文字转化为语音,并进行播放,包括:对所述文本文件中的文字进行依次读取,转化为语音,并进行播放。
在一个实施例中,将纯文本信息中的文字转化为语音,并进行播放,包括:将该纯文本信息中的文字转化为语音,以预设播放速率进行播放。
具体地,预设播放速率是预先设置的语音播放速率,例如可为每秒20字节。预设播放速率可以是用户设置,也可以是系统默认,也可以根据历史播放速率得到的。
在一个实施例中,对所述文本文件中的文字进行依次读取,转化为语音,并进行播放,包括:对该文本文件中的文字进行依次读取,转化为语音,以预设播放速率进行播放。
具体地,预设播放速率是预先设置的语音播放速率,例如可为每秒20字节。预设播放速率可以是用户设置,也可以是系统默认。
在一个实施例中,将该纯文本信息中的文字转化为语音,以预设播放速率进行播放,包括:将纯文本信息中的文字转化为语音,获取与用户标识对应的使用频率最高的历史播放速率,以使用频率最高的历史播放速率播放该语音。
具体地,用户标识是用于唯一标识用户身份的信息。用户标识可为即时通信账号、电子邮箱账号、手机号码、身份证号码等。统计用户标识对应的历史播放速率,获取使用频率最高的历史播放速率,以使用频率最高的历史播放速率播放该语音。以使用频率最高的历史播放速率播放语音更加符合用户的播放速率习惯,满足用户的需求。
在一个实施例中,将该纯文本信息中的文字转化为语音,以预设播放速率进行播放,包括:将纯文本信息中的文字转化为语音,获取与用户标识对应的历史播放速率,以历史播放速率的平均速率播放该语音。
具体地,获取用户标识对应的历史播放速率,求取该历史播放速率的平均值得到平均速率,以该历史播放速率的平均速率播放该语音,可以满足用户的需求。
在一个实施例中,上述信息处理方法还包括:检测环境音量值,当环境音量值大于第一音量阈值,则调高语音播放音量值,当环境音量值大于第二音量阈值,则关闭语音播放,其中,第一音量阈值小于第二音量阈值。
第一音量阈值和第二音量阈值根据需要设置。本申请实施例中,根据环境音量值大小调节语音播放音量值或者关闭语音播放,方便自动控制语音播放,适应周围环境。
在一个实施例中,上述信息处理方法还包括:获取车辆运行速率,根据该车辆运行速率调节语音播放速率,车辆运行速率与语音播放速率负相关。
具体地,车辆运行速率与语音播放速率负相关是指车辆运行速率越快,则语音播放速率越慢。根据车辆运行速率调节语音播放速率,确保行车安全。
语音播放速率的范围可配置参考播放速率和2倍参考播放速率之间。参考播放速率是指用户阅读文件的平均速率。根据车辆运行速率可将语音播放速率在参考播放速率和2倍参考播放速率之间进行调节。
在一个实施例中,一种信息处理方法,包括:
首先,电子设备识别被打开的文件的后缀名是否包含预设字符串,当该文件的后缀名包含预设字符串,则被打开的文件的格式为指定格式,则扫描该文件;
接着,电子设备获取该文件中的图像,将该图像中的内容通过影像成形方式将文字和图形分离,获取文字,得到纯文本信息;
再者,电子设备将纯文本信息存放在文本文件中,对文本文件中的文字进行依次读取,转化为语音,并按照预设播放速度进行播放。
下面结合具体的应用场景描述上述信息处理方法。以上述信息处理方法应用于电子设备中,识别PDF文档中的文字进行语音播放为例,如图4所示,该信息处理方法包括:
步骤402,当电子设备识别到被打开的文件的后缀名为pdf,则表示识别到打开PDF格式的文件,对PDF文件进行扫描。
具体地,电子设备可为手机、平板电脑、个人数字助理、穿戴式设备等。
步骤404,电子设备扫描PDF文件中的图像,将图像中的内容用影像成形方式将文字和图像剥离,得到去除了图形的纯文本信息。
步骤406,将该纯文本信息存放在txt格式的文件中。
步骤408,电子设备调用语音识别系统对txt格式的文件中的文字进行依次读取,并通过麦克风将声音输出。
本实施例中信息处理方法,应用于识别PDF文件,并将PDF文件中的文字提取得到纯文本信息,将纯文本信息存放在txt格式的文件中,调用语音识别系统从txt格式的文件中依次读取,通过麦克风将声音输出,可方便将PDF文件的内容通过语音播放,方便播放PDF格式文件,可适用于各种场景中,例如在驾驶车辆或者跑步等场景中,不便于阅读PDF文件,可通过语音播放该PDF文件内容。
应该理解的是,虽然图2至4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
图5为一个实施例的信息处理装置的结构框图。如图5所示,一种信息处理装置,包括扫描模块510、提取模块520和播放模块530。其中:
扫描模块510用于若识别被打开的文件的格式为指定格式,则扫描所述文件。具体地,指定格式可为包含图形的文件的格式。在一个实施例中,指定格式可为PDF格式、JPEG格式、PPT格式等。
提取模块520用于从所述文件中提取文字得到纯文本信息。
播放模块530用于将所述纯文本信息中的文字转化为语音,并进行播放。
在一个实施例中,提取模块520还用于获取所述文件中的图像,将所述图像中的文字和图形分离,获取文字,得到纯文本信息。
在一个实施例中,如图6所示,该信息处理装置还包括识别模块508和存放模块522。
识别模块508用于识别被打开的文件的后缀名是否包含预设字符串,当所述被打开的文件的后缀名包含预设字符串,则所述被打开的文件的格式为指定格式。
存放模块522用于将所述纯文本信息存放在文本文件中。
播放模块530还用于对所述文本文件中的文字进行依次读取,转化为语音,并进行播放。
在一个实施例中,播放模块530还用于将所述纯文本信息中的文字转化为语音,以预设播放速率进行播放。
在一个实施例中,播放模块530还用于将所述纯文本信息中的文字转化为语音,获取与用户标识对应的使用频率最高的历史播放速率,以使用频率最高的历史播放速率播放所述语音。
在一个实施例中,播放模块530还用于将所述纯文本信息中的文字转化为语音,获取与用户标识对应的历史播放速率,以所述历史播放速率的平均速率播放所述语音。
在一个实施例中,上述信息处理装置还包括音量控制模块。该音量控制模块用于检测环境音量值,当环境音量值大于第一音量阈值,则调高语音播放音量值,当环境音量值大于第二音量阈值,则关闭语音播放,其中,第一音量阈值小于第二音量阈值。
第一音量阈值和第二音量阈值根据需要设置。本申请实施例中,根据环境音量值大小调节语音播放音量值或者关闭语音播放,方便自动控制语音播放,适应周围环境。
在一个实施例中,播放模块530还用于获取车辆运行速率,根据该车辆运行速率调节语音播放速率,车辆运行速率与语音播放速率负相关。
具体地,车辆运行速率与语音播放速率负相关是指车辆运行速率越快,则语音播放速率越慢。根据车辆运行速率调节语音播放速率,确保行车安全。
语音播放速率的范围可配置参考播放速率和2倍参考播放速率之间。参考播放速率是指用户阅读文件的平均速率。根据车辆运行速率可将语音播放速率在参考播放速率和2倍参考播放速率之间进行调节。
上述信息处理装置中各个模块的划分仅用于举例说明,在其他实施例中,可将信息处理装置按照需要划分为不同的模块,以完成上述信息处理装置的全部或部分功能。
关于信息处理装置的具体限定可以参见上文中对于信息处理方法的限定,在此不再赘述。上述信息处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图7为一个实施例中电子设备的内部结构示意图。如图7所示,该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该处理器用于提供计算和控制能力,支撑整个电子设备的运行。存储器用于存储数据、程序等,存储器上存储至少一个计算机程序,该计算机程序可被处理器执行,以实现本申请实施例中提供的适用于电子设备的信息处理方法。存储器可包括非易失性存储介质及内存储器。非易失性存储介质存储有操作系统和计算机程序。该计算机程序可被处理器所执行,以用于实现以下各个实施例所提供的一种信息处理方法。内存储器为非易失性存储介质中的操作系统计算机程序提供高速缓存的运行环境。网络接口可以是以太网卡或无线网卡等,用于与外部的电子设备进行通信。该电子设备可以是手机、平板电脑或者个人数字助理或穿戴式设备等。
本申请实施例中提供的信息处理装置中的各个模块的实现可为计算机程序的形式。该计算机程序可在电子设备上运行。该计算机程序构成的程序模块可存放在电子设备的存储器上。该计算机程序被处理器执行时,实现本申请实施例中所描述方法的步骤。
本申请实施例还提供了一种计算机可读存储介质。一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当所述计算机可执行指令被一个或多个处理器执行时,使得所述处理器执行信息处理方法的步骤。
一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行信息处理方法。
本申请实施例还提供了一种电子设备。如图8所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该电子设备可以为包括手机、平板电脑、PDA(Personal Digital Assistant,个人数字助理)、POS(Point of Sales,销售终端)、车载电脑、穿戴式设备等任意终端设备,以电子设备为手机为例:
图8为与本申请实施例提供的电子设备相关的手机的部分结构的框图。参考图8,手机800包括:射频(Radio Frequency,RF)电路810、存储器820、输入单元830、显示单元840、传感器850、音频电路860、无线保真(wireless fidelity,WiFi)模块870、处理器880、以及电源890等部件。本领域技术人员可以理解,图8所示的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,RF电路810可用于收发信息或通话过程中,信号的接收和发送,可将基站的下行信息接收后,给处理器880处理;也可以将上行的数据发送给基站。通常,RF电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier,LNA)、双工器等。此外,RF电路810还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(Global System ofMobile communication,GSM)、通用分组无线服务(General Packet Radio Service,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband CodeDivision Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE))、电子邮件、短消息服务(Short Messaging Service,SMS)等。
存储器820可用于存储软件程序以及模块,处理器880通过运行存放在存储器820的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器820可主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能的应用程序、图像播放功能的应用程序等)等;数据存储区可存储根据手机的使用所创建的数据(比如音频数据、通讯录等)等。此外,存储器820可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元830可用于接收输入的数字或字符信息,以及产生与手机800的用户设置以及功能控制有关的键信号输入。具体地,输入单元830可包括触控面板831以及其他输入设备832。触控面板831,也可称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板831上或在触控面板831附近的操作),并根据预先设定的程式驱动相应的连接装置。在一个实施例中,触控面板831可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器880,并能接收处理器880发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板831。除了触控面板831,输入单元830还可以包括其他输入设备832。具体地,其他输入设备832可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)等中的一种或多种。
显示单元840可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元840可包括显示面板841。在一个实施例中,可以采用液晶显示器(LiquidCrystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板841。在一个实施例中,触控面板831可覆盖显示面板841,当触控面板831检测到在其上或附近的触摸操作后,传送给处理器880以确定触摸事件的类型,随后处理器880根据触摸事件的类型在显示面板841上提供相应的视觉输出。虽然在图8中,触控面板831与显示面板841是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板831与显示面板841集成而实现手机的输入和输出功能。
手机800还可包括至少一种传感器850,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板841的亮度,接近传感器可在手机移动到耳边时,关闭显示面板841和/或背光。运动传感器可包括加速度传感器,通过加速度传感器可检测各个方向上加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换)、振动识别相关功能(比如计步器、敲击)等;此外,手机还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器等。
音频电路860、扬声器861和传声器862可提供用户与手机之间的音频接口。音频电路860可将接收到的音频数据转换后的电信号,传输到扬声器861,由扬声器861转换为声音信号输出;另一方面,传声器862将收集的声音信号转换为电信号,由音频电路880接收后转换为音频数据,再将音频数据输出处理器880处理后,经RF电路810可以发送给另一手机,或者将音频数据输出至存储器820以便后续处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块870可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图8示出了WiFi模块870,但是可以理解的是,其并不属于手机800的必须构成,可以根据需要而省略。
处理器880是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存放在存储器820内的软件程序和/或模块,以及调用存放在存储器820内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。在一个实施例中,处理器880可包括一个或多个处理单元。在一个实施例中,处理器880可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等;调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器880中。
手机800还包括给各个部件供电的电源890(比如电池),优选的,电源可以通过电源管理系统与处理器880逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
在一个实施例中,手机800还可以包括摄像头、蓝牙模块等。
在本申请实施例中,该电子设备所包括的处理器880执行存放在存储器上的计算机程序时实现信息处理方法的步骤。
本申请所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM),它用作外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种信息处理方法,其特征在于,包括:
若识别被打开的文件的格式为指定格式,则扫描所述文件;
从所述文件中提取文字得到纯文本信息;
将所述纯文本信息中的文字转化为语音,并进行播放。
2.根据权利要求1所述的方法,其特征在于,所述识别被打开的文件的格式为指定格式,包括:
识别被打开的文件的后缀名是否包含预设字符串;
当所述被打开的文件的后缀名包含预设字符串,则所述被打开的文件的格式为指定格式。
3.根据权利要求1所述的方法,其特征在于,所述从文件中提取文字得到纯文本信息,包括:
获取所述文件中的图像,将所述图像中的文字和图形分离,获取文字,得到纯文本信息。
4.根据权利要求1至3中任一项所述的方法,其特征在于,在所述从所述文件中提取文字得到纯文本信息之后,还包括:
将所述纯文本信息存放在文本文件中;
所述将所述纯文本信息中的文字转化为语音,并进行播放,包括:
对所述文本文件中的文字进行依次读取,转化为语音,并进行播放。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述将所述纯文本信息中的文字转化为语音,并进行播放,包括:
将所述纯文本信息中的文字转化为语音,以预设播放速率进行播放。
6.根据权利要求5所述的方法,其特征在于,所述将所述纯文本信息中的文字转化为语音,以预设播放速率进行播放,包括:
将所述纯文本信息中的文字转化为语音,获取与用户标识对应的使用频率最高的历史播放速率,以使用频率最高的历史播放速率播放所述语音;
或者,将所述纯文本信息中的文字转化为语音,获取与用户标识对应的历史播放速率,以所述历史播放速率的平均速率播放所述语音。
7.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:
获取车辆运行速率,根据所述车辆运行速率调节语音播放速率,所述车辆运行速率与语音播放速率负相关。
8.一种信息处理装置,其特征在于,包括:
扫描模块,用于若识别被打开的文件的格式为指定格式,则扫描所述文件;
提取模块,用于从所述文件中提取文字得到纯文本信息;
播放模块,用于将所述纯文本信息中的文字转化为语音,并进行播放。
9.一种电子设备,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述的信息处理方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810272170.3A CN108573260A (zh) | 2018-03-29 | 2018-03-29 | 信息处理方法和装置、电子设备、计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810272170.3A CN108573260A (zh) | 2018-03-29 | 2018-03-29 | 信息处理方法和装置、电子设备、计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108573260A true CN108573260A (zh) | 2018-09-25 |
Family
ID=63573990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810272170.3A Pending CN108573260A (zh) | 2018-03-29 | 2018-03-29 | 信息处理方法和装置、电子设备、计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108573260A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109461461A (zh) * | 2018-09-29 | 2019-03-12 | 北京小米移动软件有限公司 | 音频播放方法、装置、电子设备及储存介质 |
CN109658917A (zh) * | 2019-01-17 | 2019-04-19 | 深圳壹账通智能科技有限公司 | 电子书诵读方法、装置、计算机设备及存储介质 |
CN112750418A (zh) * | 2020-12-28 | 2021-05-04 | 苏州思必驰信息科技有限公司 | 音频或音频链接的生成方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1707552A (zh) * | 2005-05-29 | 2005-12-14 | 吴伟 | 一种读书方式 |
CN1991817A (zh) * | 2005-12-29 | 2007-07-04 | 罗兆鑫 | 电子邮件辅助暨文字转语音系统 |
CN202331842U (zh) * | 2011-11-08 | 2012-07-11 | 广州金蟾软件研发中心有限公司 | 具pdf转eba功能的手持阅读终端装置 |
CN103077388A (zh) * | 2012-10-31 | 2013-05-01 | 浙江大学 | 面向便携式计算设备的快速文本扫读方法 |
CN103295001A (zh) * | 2013-06-03 | 2013-09-11 | 哈尔滨理工大学 | 应用于手持设备的发票信息识别设备及发票信息识别方法 |
CN103942797A (zh) * | 2014-04-24 | 2014-07-23 | 中国科学院信息工程研究所 | 基于直方图和超像素的场景图像文字检测方法及系统 |
CN105528601A (zh) * | 2016-02-25 | 2016-04-27 | 华中科技大学 | 基于接触式传感器的身份证图像采集、识别系统及采集识别方法 |
CN106970774A (zh) * | 2017-03-29 | 2017-07-21 | 广州阿里巴巴文学信息技术有限公司 | 一种音量调节装置及方法、一种终端 |
CN107274884A (zh) * | 2017-02-15 | 2017-10-20 | 赵思聪 | 一种基于文本解析和语音合成的信息获取方法 |
-
2018
- 2018-03-29 CN CN201810272170.3A patent/CN108573260A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1707552A (zh) * | 2005-05-29 | 2005-12-14 | 吴伟 | 一种读书方式 |
CN1991817A (zh) * | 2005-12-29 | 2007-07-04 | 罗兆鑫 | 电子邮件辅助暨文字转语音系统 |
CN202331842U (zh) * | 2011-11-08 | 2012-07-11 | 广州金蟾软件研发中心有限公司 | 具pdf转eba功能的手持阅读终端装置 |
CN103077388A (zh) * | 2012-10-31 | 2013-05-01 | 浙江大学 | 面向便携式计算设备的快速文本扫读方法 |
CN103295001A (zh) * | 2013-06-03 | 2013-09-11 | 哈尔滨理工大学 | 应用于手持设备的发票信息识别设备及发票信息识别方法 |
CN103942797A (zh) * | 2014-04-24 | 2014-07-23 | 中国科学院信息工程研究所 | 基于直方图和超像素的场景图像文字检测方法及系统 |
CN105528601A (zh) * | 2016-02-25 | 2016-04-27 | 华中科技大学 | 基于接触式传感器的身份证图像采集、识别系统及采集识别方法 |
CN107274884A (zh) * | 2017-02-15 | 2017-10-20 | 赵思聪 | 一种基于文本解析和语音合成的信息获取方法 |
CN106970774A (zh) * | 2017-03-29 | 2017-07-21 | 广州阿里巴巴文学信息技术有限公司 | 一种音量调节装置及方法、一种终端 |
Non-Patent Citations (1)
Title |
---|
连新元著: "《听觉媒介景观再造 城市广播转型研究》", 31 August 2017, 中国传媒大学出版社 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109461461A (zh) * | 2018-09-29 | 2019-03-12 | 北京小米移动软件有限公司 | 音频播放方法、装置、电子设备及储存介质 |
CN109461461B (zh) * | 2018-09-29 | 2021-01-15 | 北京小米移动软件有限公司 | 音频播放方法、装置、电子设备及储存介质 |
CN109658917A (zh) * | 2019-01-17 | 2019-04-19 | 深圳壹账通智能科技有限公司 | 电子书诵读方法、装置、计算机设备及存储介质 |
CN112750418A (zh) * | 2020-12-28 | 2021-05-04 | 苏州思必驰信息科技有限公司 | 音频或音频链接的生成方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108391206A (zh) | 信号处理方法、装置、终端、耳机及可读存储介质 | |
CN108521621A (zh) | 信号处理方法、装置、终端、耳机及可读存储介质 | |
CN106652996A (zh) | 一种提示音生成方法和装置、移动终端 | |
US20170249934A1 (en) | Electronic device and method for operating the same | |
CN104123937A (zh) | 提醒设置方法、装置和系统 | |
CN107402964A (zh) | 一种信息推荐方法、服务器及终端 | |
CN103513769A (zh) | 按键功能的设置方法、装置和移动终端 | |
CN105959482B (zh) | 一种场景音效的控制方法、及电子设备 | |
CN110097895B (zh) | 一种纯音乐检测方法、装置及存储介质 | |
CN107948729B (zh) | 富媒体处理方法、装置、存储介质和电子设备 | |
CN108540900A (zh) | 音量调节方法及相关产品 | |
CN106126174A (zh) | 一种场景音效的控制方法、及电子设备 | |
CN108573260A (zh) | 信息处理方法和装置、电子设备、计算机可读存储介质 | |
CN104217172A (zh) | 隐私内容查看方法及装置 | |
CN105096962B (zh) | 一种信息处理方法及终端 | |
CN106973168A (zh) | 语音播放方法、装置及计算机设备 | |
CN106569815A (zh) | 一种消息显示方法及终端 | |
CN112689872B (zh) | 音频检测方法、计算机可读存储介质和电子设备 | |
CN106713636B (zh) | 图片数据的加载方法、装置及移动终端 | |
CN106126171B (zh) | 一种音效处理方法及移动终端 | |
CN109240486B (zh) | 一种弹出消息处理方法、装置、设备及存储介质 | |
CN111897916B (zh) | 语音指令识别方法、装置、终端设备及存储介质 | |
CN107205082A (zh) | 一种短信清理方法、及移动终端 | |
CN110430321A (zh) | 给来电用户备注的方法、存储介质以及移动终端 | |
CN110248028A (zh) | 基于已设置为铃声的音频保护方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180925 |