CN114880495A - 一种高亮显示内容的方法、装置和系统 - Google Patents
一种高亮显示内容的方法、装置和系统 Download PDFInfo
- Publication number
- CN114880495A CN114880495A CN202110278153.2A CN202110278153A CN114880495A CN 114880495 A CN114880495 A CN 114880495A CN 202110278153 A CN202110278153 A CN 202110278153A CN 114880495 A CN114880495 A CN 114880495A
- Authority
- CN
- China
- Prior art keywords
- content
- highlighting
- information
- text
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004590 computer program Methods 0.000 claims description 13
- 230000000694 effects Effects 0.000 abstract description 19
- 230000008569 process Effects 0.000 abstract description 7
- 230000003993 interaction Effects 0.000 abstract description 3
- 239000000463 material Substances 0.000 description 9
- 230000004397 blinking Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000002045 lasting effect Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/432—Query formulation
- G06F16/433—Query formulation using audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/44—Browsing; Visualisation therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明涉及一种高亮显示内容的方法、装置和系统。根据本发明所提供的一种高亮显示内容的方法,包括以下步骤:显示一信息;接收一段语音;识别所接收语音的文字;在所述信息中检索包含所述识别出的文字的内容;和高亮显示所检索到的内容。本发明通过根据用户的语音发言,自动将屏幕显示信息中的对应文字或者对应的图片或流媒体进行高亮,提高了用户的演讲效果和听众的注意力,增强了用户和听众之间的交互效果,避免了在现有技术下,用户不得不用激光笔、教鞭、手指、鼠标或其他物件等指向显示屏幕上的某些内容以引导听众目光到特定文字的冗余操作,同时也可以避免在制作演示资料过程中的繁琐的高亮效果设计等。
Description
技术领域
本发明涉及电子产品领域,特别是一种高亮显示内容的方法、装置和系统。
背景技术
在电子产品领域,尤其是计算机领域,投影仪和显示屏是十分普遍使用的屏幕显示装置。在学校教学、企事业单位会议、新闻发布会、产品发布会等场合,使用投影仪器将计算机屏幕上显示的内容投在大型屏幕上以展示给多人观看是再寻常不过的了。
在通过大屏幕演示的时候,用户通常需要一只激光笔、或者教鞭、或者直接用手指指着要讲述的内容,以引导听众的目光关注到屏幕上的某项内容,例如某句话中的某个词汇或者某个图片。即使演讲者在制作演示内容时,已经对某些内容做了高亮处理,这种指指点点的情形通常也是不可避免的。激光笔的激光除了可能不小心照到听众或者演讲者的眼睛造成伤害外,强烈的光也引起听众和用户的不适,而在显示屏幕很大的时候,教鞭或者手指通常触及不到要精确指向的地方,只能做示意而已,并不能引导听众准确的定位到相应内容。
CN102323924A公开了一种控制嵌入式媒体播放器同步显示字幕、演示文稿、笔记的方法、系统和设备,其中所披露的方法包括步骤:打开或播放媒体文件或媒体流,所述媒体文件或媒体流存储在本地或通过网络访问;访问与所述媒体文件或媒体流相对应的字幕资源、演示文稿资源、笔记资源,加载并转换为适合处理的数据结构;在播放过程中,不间断地查询所述媒体文件或媒体流的播放进度,获得当前播放时间后,同步显示与当前播放时间相匹配的字幕资源数据、与当前播放时间相匹配的演示文稿资源数据、与当前播放时间相匹配的笔记资源数据,且所述笔记资源数据为高亮度显示。该方法要求查询播放进度然后匹配数据并高亮显示出来,但不能根据用户的进度进行高亮,特别是当屏幕已经显示的情形下不能选择性高亮用户当时正在讲解的内容,不能给用户和听众提供更好的交互体验。
因此,需要提供一种能够方便的帮助用户快速引导听众到演示屏幕上相关内容的方法和装置及系统。
发明内容
本发明的一个目的是提供一种高亮显示内容的方法。根据本发明所提供的高亮显示内容的方法,包括以下步骤:显示一信息;接收一段语音;识别所接收语音的文字;在所述信息中检索包含所述识别出的文字的内容;和高亮显示所检索到的内容。
本发明的另一个目的是提供一种高亮显示内容的装置。根据本发明所提供的高亮显示内容的装置,包括以下模块:一个显示模块,用于显示一信息;一个语音接收模块,用于接收一段语音;一个识别模块,用于识别所接收语音的文字;一个检索模块,用于在所述信息中检索包含所述识别出的文字的内容;和一个高亮模块,用于在所述信息中高亮显示检索到的内容。
本发明的再一个目的是提供一个用于高亮显示内容的系统。根据本发明所提供的用于高亮显示内容的系统包括:一个主机装置,用于所述系统和所述系统中模块的控制;一个显示模块,用于显示一信息;一个语音接收模块,用于接收一段语音;一个识别模块,用于识别所接收语音的文字;一个检索模块,用于在所述信息中检索包含所述识别出的文字的内容;和一个高亮模块,用于在所述显示的信息中高亮显示检索到的内容。
本发明的又一个目的在于提供一个计算机装置。根据本发明所提供的计算机装置,包括一个处理器和一个存储器,所述存储器上存储有一个计算机程序,其特征在于,所述计算机程序当被所述处理器执行时实现如下步骤:显示一信息;接收一段语音;识别所接收语音的文字;在所述信息中检索包含所述识别出的文字的内容;和高亮显示所检索到的内容。
本发明的又一个目的在于提供一种计算机可读存储介质。根据本发明存储有一计算机程序存储介质上存储有一计算机程序,其特征在于所述计算机程序当被执行时实现如下步骤:显示一信息;接收一段语音;识别所接收语音的文字;在所述信息中检索包含所述识别出的文字的内容;和高亮显示所检索到的内容。
在本发明中,所述信息包括文字,或者名称中包括文字的一个图片或者流媒体文件。
在本发明中,所述识别所接收语音的文字包括识别所接受语音中的一个、两个或多个关键字。
在本发明中,在所述信息中检索包含所述识别出的文字的内容包括在所述信息的文字中检索包含所述识别出的文字,和/或在所述信息中检索名称中包括所述识别出的文字的图片或流媒体文件。
在本发明中,所述高亮显示所检索到的内容,包括高亮显示在所述信息中检索到的所述识别出的文字,和/或高亮显示所述信息中名称中包括所述识别出的文字的图片或流媒体文件。
在本发明中,所述高亮显示所述内容包括持续显示所述内容一个、两个或多个设定时间。在所检索的内容为一个可播放流媒体文件时,所述高亮显示指播放所述流媒体文件。
在本发明中,所述显示装置的一个实施例包括一个计算机显示器或投影显示装置。
本发明通过根据用户的语音发言,自动将屏幕显示信息中的对应文字或者对应的图片或流媒体进行高亮,提高了用户的演讲效果和听众的注意力,增强了用户和听众之间的交互效果,避免了在现有技术下,用户不得不用激光笔、教鞭、手指、鼠标或其他物件等指向显示屏幕上的某些内容以引导听众目光到特定文字的冗余操作,同时也可以避免在制作演示资料过程中的繁琐的高亮效果设计等。
附图说明
在本发明的说明书附图中,同样的附图标记一般指代相同部分。图不是按照比例绘制,仅在于是示例性的图示本发明的原理。
图1所示为根据本发明的一种高亮显示内容的方法的具体实施例示意图。
图2所示为根据本发明的一种高亮显示内容的装置具体实施例示意图。
具体实施方案
在现有技术中,在需要高亮显示屏幕所显示的内容时,通常是在制作演示材料时提前将需要高亮演示的文字内容进行设置,例如直接通过该文字内容设为与其他不需要高亮的文字内容不同的颜色或背景,也可以通过在演示材料中添加动画的方式,例如利用微软公司的Microsoft PowerPoint中的动画功能添加高亮效果。然后,在演讲时通过鼠标控制呈现高亮效果。更为传统的高亮方式就是,在演示过程中,用户用激光笔、鼠标、手指、教鞭或其他物件指向需要特别观众关注的内容。有些现有技术提到了同步高光相关内容,但是也只是根据预先设定的播放进度进行同步高光,无法根据用户的演讲进程提供特定内容的高光显示效果,特别是无法对那些在准备演示材料时未设置高光效果的文字内容提供高光效果。
本发明提供的一种高亮显示内容的方法、装置和系统通过语音的接收、识别、检索等步骤和/或模块实现了根据用户的演讲进程自动提供动态高光显示内容的技术效果,可以减少演示材料准备过程中的工作,提高用户的演讲效果和听众的注意力,增强用户和听众之间的交互效果,避免在现有技术下,用户不得不用激光笔、教鞭、手指、鼠标或其他物件等指向屏幕上的某些文字以引导听众目光到特定文字内容的冗余操作,同时也避免了在制作演示资料过程中的繁琐的高亮效果设计等。
在以下详细描述中,为了解释而非限制的目的,披露了特别细节的代表性实施例,以便提供对要求保护的发明的彻底理解。然而,本领域技术人员将认识到,根据本说明书教导的不偏离本说明书公开的特别细节的其它实施例也在本发明权利要求的保护范围内。
图1所示为根据本发明的一种高亮显示内容的方法的一个具体实施例示意图。
如图1所示,在用户演讲过程中,为了增强演讲效果,通常用显示装置,例如电脑屏幕或者投屏屏幕或者其他外接显示装置屏幕全部或部分显示或提示所演讲的内容(步骤S110)。听众可以结合显示装置上的显示信息和演讲者的语音和肢体动作接收演讲信息。
接收用户的一段语音(步骤S120)。接收用户语音的方式有多种,例如可以通过计算机自带或外接的麦克风和录音设备等。接收的一段语音例如可以是实时的接收用户的发言。实时的接收用户发言的语音,并实时进行后续处理,可以尽可能减少延迟,有效提高在屏幕上高亮相关文字、图片等内容的显示效果,因此是优选的。
在一个实施例中,为了避免在演讲过程中非用户的语音的干扰,可以在演讲之前,对用户的声音进行识别备案。例如通过允许用户预先录制一段语音,识别用户的发音特征,以便排除后续演讲过程中的非用户的杂音,确保在屏幕上高亮显示用户发言的相关内容,而不至于产生让观众混淆的情形。
然后,将所接收到的用户的语音进行文字识别(步骤S130)。将语音转化为文字的技术在现有技术中已广泛存在,例如,科大讯飞的语音转文字的技术等。在现有技术中可以选择合适的数据库和识别技术。
通常,在屏幕显示信息中,所显示的文字为书面语,而用户在演讲过程中的讲解更偏重于口语化,例如包含较多的“这个”,“那个”,“那么“,”后来呢“,”再来看一下”,“下面呢“等等口语化的词汇。这些口语化词汇可以在对用户语音进行文字识别时或者之后进行排除或过滤掉,不作为文字识别的结果,避免对后续操作的干扰,除非用户特别需要。因此,步骤130可以进一步包含在根据用户语音识别出的文字中删除日常口语词汇的步骤,该进一步包括的步骤可以有效提取根据用户语音识别出的文字的关键词作为步骤S130的输出结果。
在自然语言处理领域,对语言的分词处理技术可以应用到本发明中对语音进行文字识别的处理,无论是中文还是英文或其他语言。将接收到的语音全部转化为文字,然后通过分词技术找出其中的实词,例如其中的名词或动词,并将它们作为一个数组作为步骤S130的输出。例如,以中文为例,用户讲到“我们的政府努力创造良好的环境,提高企业创新能力”并被识别出来时,可以进一步将其分词得到一个词语的数组,包括“我们”,“政府”,“努力”,“创造”,“良好”,“环境”,“良好的环境”,“提高”,“企业”,“”创新“,“创新能力”,“企业创新能力“等,并且将该数组作为步骤S130的将语音进行文字识别的输出结果。
因此,根据步骤S130所识别出的文字可以包括一段或一句话,也可以包括一个、两个或多个关键词。
接着,在屏幕显示信息中检索包含所述识别出的文字的内容(步骤S140)。如果根据用户语音所识别的文字是一个完整的句子,那么该句子可能不会精确的出现在屏幕显示信息中,除非用户朗读屏幕所显示的内容。根据步骤S130所识别出的文字,在屏幕显示信息中进行检索时,可以优选只将与所识别出的文字中相同的文字检索出来。例如,用户讲到“我们的政府努力创造良好的环境,提高企业创新能力“并被识别为一段话或者一个、两个或多个关键词时,屏幕上内容中只有”鼓励发明创造,推动发明创造的应用,提高创新能力“中的”创新能力”与所识别出的文字相同,那么“创新能力”就作为步骤S140的检索结果输出。
屏幕显示信息可以是文字或者图片或可播放的流媒体文件等。在根据所识别的文字对屏幕显示信息进行检索时,既可以包括检索屏幕显示信息中的文字,也可以包括检索屏幕显示信息中的图片或流媒体等文件的文件名。如果是在屏幕显示信息中的文字中检索所述识别出的文字,那么检索到的内容就是文字内容。如果是在屏幕显示信息中的图片或流媒体等文件的文件名中检索所述识别的文字,那么检索到的内容就是所述图片或流媒体等文件。
最后,在得到从屏幕显示信息中检索到的内容后,将所检索到的内容在屏幕上高亮显示(步骤S150)。将在屏幕上检索到的内容高亮显示,是指将该内容以不同于其他非检索到的文字的颜色、且不同于屏幕背景而相对鲜明的方式显示,或者以动画或者以闪烁的方式或其他明显区别于该内容之前或周围其他信息的显示方式显示。高亮的颜色可以根据用户自定义实现,也可以自动控制,例如与其他非检索到的文字的RGB颜色的互补和/或与背景颜色的RGB颜色保持一定差异而相对突出的颜色显示等。高亮也可以包括在所述内容为可播放的流媒体时,自动触发该流媒体文件的播放,并且在此情形下,高亮可以仅代表打开该文件,而不涉及到高亮的持续时间问题,或者也可以高亮(例如闪烁)所述流媒体的图标,以提示用户播放该文件。
高亮显示的内容可以持续高亮直到被关闭,例如屏幕显示内容换页,也可以持续高亮一个、两个或多个设定时间。将所检索到的内容(此处指文字或图片)高亮显示的时间可以由用户根据自身喜好自行设定,例如1秒或3秒等,也可以缺省设置下的自动控制,例如100毫秒、500毫秒、800毫秒、1秒、1.5秒、2秒、2.5秒到3秒等。在一个实施例中,高亮显示为多个设定时间,呈闪烁性的高亮效果,如每高亮300毫秒后关闭100毫秒,共持续2秒等。
图2所示为根据本发明的一种高亮显示内容的装置具体实施例示意图。
在图2中,用户210借助屏幕显示装置220向听众230进行演讲。屏幕显示装置220可以是计算机显示装置,也可以是计算机外接的其他显示装置或者投影装置等。
语音接收模块222,用于实时接收用户210的语音。接收用户语音的方式有多种,例如可以通过计算机自带的麦克风等。接收的一段语音例如可以是实时的接收用户的发言。实时的接收用户发言的语音,并实时进行后续处理,可以尽可能减少延迟,可以有效提高在屏幕上高亮相关内容的显示效果,因此是优选的。
在一个实施例中,为了避免非用户的语音的干扰,可以在演讲之前,对用户的声音进行识别备案。例如可以通过允许用户预先录制一段语音,识别用户的发音特征,以排除或过滤后续演讲过程中的非用户的杂音,确保在高亮屏幕上用户210语音中的相关内容,而不至于产生让观众混淆的情形。
文字识别模块224,用于将所述接收到的语音识别为文字。将语音识别转化为文字的技术在现有技术中已广泛存在,例如科大讯飞的语音转为文字的技术。在现有技术中可以选择合适的数据库和识别技术。
通常,在屏幕显示信息中,所显示的文字为书面语,而用户在演讲过程中的讲解更偏重于口语化,例如包含较多的“这个”,“那个”,“那么“,”后来呢“,”再来看一下”,“下面呢“等等口语化的词汇。这些口语化词汇可以在对用户语音进行文字识别时或者之后进行排除或过滤掉,不作为文字识别的结果,避免对后续操作的干扰,除非用户210特别需要显示该等口语内容。因此,文字识别模块224可以进一步包含在根据用户语音识别出的文字中删除日常口语词汇的子模块,可以有效提取根据用户语音识别出的文字的关键词作为模块224的输出结果。
在自然语言处理领域,对语言的分词处理技术可以应用到本发明中对语音进行文字识别的处理,无论是中文还是英文或其他语言。将接收到的语音全部转化为文字,然后通过分词技术找出其中的实词,例如其中的名词或动词,并将它们作为一个数组作为模块224的输出。例如,用户210讲到“我们的政府努力创造良好的环境,提高企业创新能力”并被识别出来时,可以进一步将其分词得到一个词语的数组,包括“我们”,“政府”,“努力”,“创造”,“良好”,“环境”,“良好的环境”,“提高”,“企业”,“”创新“,“创新能力”,“企业创新能力“等,并且将该数组作为模块224的将语音进行文字识别的输出结果。
因此,根据模块224所识别出的文字可以包括一段或一句话,也可以包括一个、两个或多个关键词。
检索模块226,用于在屏幕显示信息中检索所述文字。如果根据用户语音所识别的文字是一个完整的句子,那么该句子可能通常不会精确的出现在屏幕显示信息中,除非用户朗读屏幕所显示的内容。根据模块224所识别出的文字,在屏幕显示信息中进行检索时,可以优选只将与根据模块224所识别出的文字相同的文字检索出来。例如,用户讲到“我们的政府努力创造良好的环境,提高企业创新能力“并被识别为一段话或者一个、两个或多个关键词时,屏幕上内容中只有”鼓励发明创造,推动发明创造的应用,提高创新能力“中的”创新能力”与所识别出的文字相同,那么“创新能力”就作为检索模块226的检索结果输出。屏幕显示信息可以包括文字或者图片或可播放的流媒体文件等。在根据所识别的文字对屏幕显示信息进行检索时,既可以包括检索屏幕显示信息中的文字,也可以包括检索屏幕显示信息中的图片或可播放流媒体等文件的文件名。如果是在屏幕显示信息中的文字中检索所述识别出的文字,那么检索到的内容就是文字内容。如果是在屏幕显示信息中的图片或流媒体等文件的文件名中检索所述识别的文字,那么检索到的内容就是所述图片或流媒体等文件。
高亮模块228,用于将从屏幕显示信息中检索到的内容进行高亮显示。在得到从屏幕显示信息中检索到的内容后,将所检索到的内容在屏幕上高亮显示。将在屏幕上检索到的内容高亮显示,是指将该内容以不同于其他非检索到的文字的颜色、且不同于屏幕背景相对鲜明的显示,或者以动画或者以闪烁的方式或其他明显区别于该内容之前或周围其他信息的显示方式显示。高亮的颜色可以根据用户自定义实现,也可以自动控制,例如与其他非检索到的文字的RGB颜色的互补和/或与背景颜色的RGB颜色保持一定距离而相对突出的颜色显示等。高亮也可以包括在所述内容为可播放的流媒体时,自动触发该流媒体文件的播放,并且在此情形下,高亮可以仅代表打开该文件,而不涉及到高亮的持续时间问题。
高亮显示的内容可以持续高亮直到被关闭,也可以持续高亮一个、两个或多个设定时间。将所检索到的内容高亮显示的时间可以由用户根据自身喜好自行设定,例如1秒或3秒等,也可以缺省设置下的自动控制,例如100毫秒、500毫秒、800毫秒、1秒、1.5秒、2秒、2.5秒到3秒等。在一个实施例中,高亮显示为多个设定时间,呈闪烁性的高亮效果,如每高亮300毫秒后关闭100毫秒,共持续2秒等。
根据本发明所提供的一种计算机装置,包括一个处理器和一个存储器,所述存储器上存储有一个计算机程序,其特征在于,所述计算机程序当被所述处理器执行时实现如下步骤:显示一信息;接收一段语音;识别所接收语音的文字;在所述信息中检索包含所述识别出的文字的内容;和高亮显示所检索到的内容。所述信息包括文字,或者名称中包括文字的图片或者流媒体文件;或者,所述识别所接收语音的文字包括识别所接受语音中的一个、两个或多个关键字;或者,在所述信息中检索包含所述识别出的文字的内容包括在所述信息的文字中检索包含所述识别出的文字,和/或在所述信息中检索名称中包括所述识别出的文字的图片或流媒体文件;或者,所述高亮显示所检索到的内容,包括高亮显示在所述信息中检索到的所述识别出的文字,和/或高亮显示所述信息中名称中包括所述识别出的文字的图片或流媒体文件;或者,所述高亮显示所述内容包括持续显示所述内容一个、两个或多个设定时间。接收的一段语音例如可以是实时的接收用户的发言。将语音识别为文字的技术在现有技术中已广泛存在。在现有技术中可以选择合适的数据库和识别技术。将在屏幕显示信息中检索到的内容高亮显示,是指将该内容(例如文字)以不同于其他内容的颜色、且不同于屏幕背景相对鲜明的显示。高亮的颜色可以根据用户自定义实现,也可以自动控制,例如与其他非检索到的文字的RGB颜色的互补和/或与背景颜色的RGB颜色保持一定距离而相对突出的颜色显示等。高亮显示的文字可以持续高亮直到被关闭,也可以持续高亮一个、两个或多个设定时间。在所检索到的内容为可播放文件如流媒体文件时,所述高亮可以指打开所述可播放文件,并且在此情形下,通常不包括高亮持续时间的设置,或者也可以高亮(例如闪烁)所述流媒体的图标,以提示用户播放该文件。
本发明所提供一种计算机可读存储介质,所述计算机可读存储介质上存储有一计算机程序,其特征在于所述计算机程序当被执行时实现如下步骤:显示一信息;接收一段语音;识别所接收语音的文字;在所述信息中检索包含所述识别出的文字的内容;和高亮显示所检索到的内容。所述信息包括文字,或者名称中包括文字的一个图片或者可播放流媒体文件;或者,所述识别所接收语音的文字包括识别所接受语音中的一个、两个或多个关键字;或者,在所述信息中检索包含所述识别出的文字的内容包括在所述信息的文字中检索包含所述识别出的文字,和/或在所述信息中检索名称中包括所述识别出的文字的图片或流媒体文件;或者,所述高亮显示所检索到的内容,包括高亮显示在所述信息中检索到的所述识别出的文字,和/或高亮显示所述信息中名称中包括所述识别出的文字的图片或流媒体文件;或者,所述高亮显示所述内容包括持续显示所述内容一个、两个或多个设定时间。接收的一段语音例如可以是实时的接收用户的发言。将语音转化为文字的技术在现有技术中已广泛存在。在现有技术中可以选择合适的数据库和识别技术。在屏幕显示内容中进行检索时,可以优选只将与所识别出的文字相同的那部分文字检索出来即可。将在屏幕上检索到的文字高亮显示,是指将该文字以不同于其他非检索到的文字的颜色、且不同于屏幕背景相对鲜明的显示。高亮的颜色可以根据用户自定义实现,也可以自动控制,例如与其他非检索到的文字的RGB颜色的互补和/或与背景颜色的RGB颜色保持一定距离而相对突出的颜色显示等。高亮显示的文字可以持续高亮直到被关闭,也可以持续高亮一个、两个或多个设定时间。在所检索到的内容为可播放文件如流媒体文件时,所述高亮还可以包括打开所述可播放文件,并且在此情形下,通常不包括高亮持续时间的设置,或者也可以高亮(例如闪烁)所述流媒体的图标,以提示用户播放该文件。
尽管本说明书已经描述和图示了若干创新实施例,但是本领域普通技术人员将容易设想到用于执行本说明书描述的功能和/或获得本说明书描述的结果和/或本说明书描述的一个、两个或多个优点的各种其它手段和/或结构,并且这样的变化和/或修改中的每一个被视为处于本说明书描述的创新实施例的范围内。更一般地,本领域技术人员将容易认识到,本说明书描述的所有参数、尺寸、材料和配置是示例性的,并且实际参数、尺寸、材料和/或配置将取决于该创新教导将用于的具体应用或多个应用。通过仅仅使用例行试验,本领域技术人员将认识到,或能够确认本说明书描述的具体创新实施例的很多等同形式。因此,应当理解的是,仅通过示例的方式呈现前述实施例,并且在所附权利要求及其等同形式的范围内,可以以如具体描述和要求保护的方式不同的方式实践创新实施例。本公开的创新实施例针对本说明书描述的每一个个体特征、系统、制品、材料、装备和/或方法。此外,两个或更多个这样的特征、系统、制品、材料、装备和/或方法的任意组合(如果这样的特征、系统、制品、材料、装备和/或方法不相互矛盾的话)包括在本说明书公开的创新范围内。如本文定义和使用的所有定义应当被理解为控制在字典定义、通过引用并入的文档中的定义和/或所定义的术语的普通含义之上。如在本说明书和权利要求书中使用的“一个”和“一”应当被理解为表示”至少一个”,除非明确相反声明。如本说明书和权利要求书中使用的短语“和/或”应当被理解为表示如此连结的元素中的“任一个或两者”,即在一些情况下连结地存在并且在其它情况下分离地存在的元素。利用“和/或”列出的多个元素应当以同一方式解释,即如此连结的元素中的“一个、两个或多个”。除了通过“和/或”具体标识的元素之外,可以可选地存在其它元素,无论与具体标识的那些元素相关还是不相关。如本说明书和权利要求书中使用的,关于一个、两个或多个元素的列表的短语“至少一个“应当被理解为表示从元素列表中的任何一个、两个或多个元素中选择的至少一个元素,但是不一定包括元素列表中具体列出的每一个元素中的至少一个,并且不排除元素列表中的元素的任意组合。该定义还允许可以可选地存在除了短语“至少一个”所涉及的元素列表中具体标识的元素之外的元素,无论与具体标识的那些元素相关还是不相关。还应当理解的是,除非明确相反声明,否则在本说明书要求保护的包括多于一个步骤或行为的任何方法中,方法的步骤或行为的顺序不一定受限于方法的步骤或行为被记载的顺序。而且,在权利要求中出现于括号中的附图标记(如果存在的话)仅仅被提供用于方便并且不应当被解释为以任何方式限制权利要求。在权利要求中,以及在本说明书中,诸如“包括”、“包含”、“承载”、“具有”、“含有“等所有过渡短语应当被理解为开放式的,即表示包括但不限于。仅仅过渡短语“由……构成”和“基本上由……构成”应当分别是封闭式或者半封闭式过渡短语。
Claims (10)
1.一种高亮显示内容的方法,包括以下步骤:显示一信息;接收一段语音;识别所接收语音的文字;在所述信息中检索包含所述识别出的文字的内容;和高亮显示所检索到的内容。
2.如权利要求1所述方法,其中,所述信息包括文字或者名称中包括文字的一个图片或者流媒体文件;或者,所述识别所接收语音的文字包括识别所接受语音中的一个、两个或多个关键字;或者,在所述信息中检索包含所述识别出的文字的内容包括在所述信息的文字中检索包含所述识别出的文字,和/或在所述信息中检索名称中包括所述识别出的文字的图片或流媒体文件;或者,所述高亮显示所检索到的内容,包括高亮显示在所述信息中检索到的所述识别出的文字,和/或高亮显示所述信息中名称中包括所述识别出的文字的图片或流媒体文件;或者,所述高亮显示所述内容包括持续显示所述内容一个、两个或多个设定时间。
3.一种高亮显示内容的装置,包括以下模块:一个显示模块,用于显示一信息;一个语音接收模块,用于接收一段语音;一个识别模块,用于识别所接收语音的文字;一个检索模块,用于在所述信息中检索包含所述识别出的文字的内容;和一个高亮模块,用于在所述显示的信息中高亮显示检索到的内容。
4.如权利要求3所述装置,其中,所述信息包括文字,或者名称中包括文字的一个图片或者流媒体文件;或者,所述识别所接收语音的文字包括识别所接受语音中的一个、两个或多个关键字;或者,在所述信息中检索包含所述识别出的文字的内容包括在所述信息的文字中检索包含所述识别出的文字,和/或在所述信息中检索名称中包括所述识别出的文字的图片或流媒体文件;或者,所述高亮显示所检索到的内容,包括高亮显示在所述信息中检索到的所述识别出的文字,和/或高亮显示所述信息中名称中包括所述识别出的文字的图片或流媒体文件;或者,所述高亮显示所述内容包括持续显示所述内容一个、两个或多个设定时间。
5.一个用于高亮显示内容的系统,所述系统包括:一个主机装置,用于所述系统的控制;一个显示模块,用于显示一信息;一个语音接收模块,用于接收一段语音;一个识别模块,用于识别所接收语音的文字;一个检索模块,用于在所述信息中检索包含所述识别出的文字的内容;和一个高亮模块,用于在所述显示的信息中高亮显示检索到的内容。
6.如权利要求5所述系统,其中,所述信息包括文字,或者名称中包括文字的一个图片或者流媒体文件;或者,所述识别所接收语音的文字包括识别所接受语音中的一个、两个或多个关键字;或者,在所述信息中检索包含所述识别出的文字的内容包括在所述信息的文字中检索包含所述识别出的文字,和/或在所述信息中检索名称中包括所述识别出的文字的图片或流媒体文件;或者,所述高亮显示所检索到的内容,包括高亮显示在所述信息中检索到的所述识别出的文字,和/或高亮显示所述信息中名称中包括所述识别出的文字的图片或流媒体文件;或者,所述高亮显示所述内容包括持续显示所述内容一个、两个或多个设定时间。
7.一种计算机装置,包括一个处理器和一个存储器,所述存储器上存储有一个计算机程序,其特征在于,所述计算机程序当被所述处理器执行时实现如下步骤:显示一信息;接收一段语音;识别所接收语音的文字;在所述信息中检索包含所述识别出的文字的内容;和高亮显示所检索到的内容。
8.如权利要求7所述装置,其中,所述信息包括文字,或者名称中包括文字的一个图片或者流媒体文件;或者,所述识别所接收语音的文字包括识别所接受语音中的一个、两个或多个关键字;或者,在所述信息中检索包含所述识别出的文字的内容包括在所述信息的文字中检索包含所述识别出的文字,和/或在所述信息中检索名称中包括所述识别出的文字的图片或流媒体文件;或者,所述高亮显示所检索到的内容,包括高亮显示在所述信息中检索到的所述识别出的文字,和/或高亮显示所述信息中名称中包括所述识别出的文字的图片或流媒体文件;或者,所述高亮显示所述内容包括持续显示所述内容一个、两个或多个设定时间。
9.一种计算机可读存储介质,所述计算机可读存储介质上存储有一计算机程序,其特征在于所述计算机程序当被执行时实现如下步骤:显示一信息;显示一信息;接收一段语音;识别所接收语音的文字;在所述信息中检索包含所述识别出的文字的内容;和高亮显示所检索到的内容。
10.如权利要求9所述计算机可读存储介质,其中,所述信息包括文字,或者名称中包括文字的一个图片或者流媒体文件;或者,所述识别所接收语音的文字包括识别所接受语音中的一个、两个或多个关键字;或者,在所述信息中检索包含所述识别出的文字的内容包括在所述信息的文字中检索包含所述识别出的文字,和/或在所述信息中检索名称中包括所述识别出的文字的图片或流媒体文件;或者,所述高亮显示所检索到的内容,包括高亮显示在所述信息中检索到的所述识别出的文字,和/或高亮显示所述信息中名称中包括所述识别出的文字的图片或流媒体文件;或者,所述高亮显示所述内容包括持续显示所述内容一个、两个或多个设定时间。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110165968X | 2021-02-05 | ||
CN202110165968 | 2021-02-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114880495A true CN114880495A (zh) | 2022-08-09 |
Family
ID=82667451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110278153.2A Pending CN114880495A (zh) | 2021-02-05 | 2021-03-15 | 一种高亮显示内容的方法、装置和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114880495A (zh) |
-
2021
- 2021-03-15 CN CN202110278153.2A patent/CN114880495A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107193841B (zh) | 媒体文件加速播放、传输及存储的方法和装置 | |
US6377925B1 (en) | Electronic translator for assisting communications | |
US11238854B2 (en) | Facilitating creation and playback of user-recorded audio | |
US20200294487A1 (en) | Hands-free annotations of audio text | |
US9548052B2 (en) | Ebook interaction using speech recognition | |
US8719029B2 (en) | File format, server, viewer device for digital comic, digital comic generation device | |
JP4127668B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
KR20160111275A (ko) | 외국어 학습 시스템 및 외국어 학습 방법 | |
CN115082602B (zh) | 生成数字人的方法、模型的训练方法、装置、设备和介质 | |
JP2022533310A (ja) | 対象言語のコンテンツを二つの形態で同時表現させ、対象言語の聴解力を向上させるためのシステムと方法 | |
US20120226500A1 (en) | System and method for content rendering including synthetic narration | |
US9286287B1 (en) | Reference content determination from audio content | |
CN109460548B (zh) | 一种面向智能机器人的故事数据处理方法及系统 | |
JP6865701B2 (ja) | 音声認識誤り修正支援装置およびそのプログラム | |
US20080243510A1 (en) | Overlapping screen reading of non-sequential text | |
KR101932340B1 (ko) | 원어민 동영상의 자막인지 및 해석기능을 갖는 영어 학습시스템을 이용한 영어 교육방법 | |
KR102346668B1 (ko) | 회의 통역 장치 | |
KR102396263B1 (ko) | 스크립트를 이용한 스마트 어학학습서비스를 제공하는 시스템 | |
CN114880495A (zh) | 一种高亮显示内容的方法、装置和系统 | |
JP2004325905A (ja) | 外国語学習装置および外国語学習プログラム | |
KR20230025708A (ko) | 오디오 제시 인터렉션을 갖는 자동화된 어시스턴트 | |
KR20170009487A (ko) | 청크 기반 언어 학습 방법 및 이를 수행하는 전자 기기 | |
Zwitserlood et al. | Annotation of sign and gesture cross-linguistically | |
WO2023026544A1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
US20230281248A1 (en) | Structured Video Documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
DD01 | Delivery of document by public notice |
Addressee: Liu Zhonghao Document name: Deemed withdrawal notice |
|
DD01 | Delivery of document by public notice |