CN111399950B - 语音输入界面管理方法及装置、语音输入设备 - Google Patents
语音输入界面管理方法及装置、语音输入设备 Download PDFInfo
- Publication number
- CN111399950B CN111399950B CN201811619167.0A CN201811619167A CN111399950B CN 111399950 B CN111399950 B CN 111399950B CN 201811619167 A CN201811619167 A CN 201811619167A CN 111399950 B CN111399950 B CN 111399950B
- Authority
- CN
- China
- Prior art keywords
- text
- container
- height
- voice input
- width
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007726 management method Methods 0.000 title abstract description 30
- 238000000034 method Methods 0.000 claims abstract description 44
- 238000013519 translation Methods 0.000 claims description 64
- 230000000007 visual effect Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 5
- 230000014616 translation Effects 0.000 description 52
- 238000010586 diagram Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 230000008859 change Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000007667 floating Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种语音输入界面管理方法及装置,所述方法包括:实时获取当前语音输入对应的文本;所述文本包括:识别文本和译文文本;根据所述文本的内容确定用于在显示界面承载所述文本的容器的宽度和高度,并在所述容器的宽度达到设定的最大宽度后,保持所述最大宽度,在所述容器的高度达到设定的最大高度后,保持所述最大高度;利用所述容器实时展现所述文本;在所述容器的高度达到设定的最大高度后,如果有新文本加入所述容器,则使所述容器中展现的文本向上滚动,以展现所述新文本。本发明还公开一种语音输入设备。利用本发明,可以实现语音输入内容实时上屏,并提高文字界面的灵活性及显示效果。
Description
技术领域
本发明涉及文字显示领域,具体涉及一种语音输入界面管理方法及装置,还涉及一种语音输入设备。
背景技术
现有技术中,语音翻译场景下,若用户在对话聊天,则在语音翻译APP的当前界面上需要点击中文按钮,开始说中文,说完后再点击完成,中文识别内容及对应的翻译内容上屏显示。然后马上听别人说话,又需要点击说英语,说完再点击完成,对应的英文识别内容及对应的翻译内容上屏显示。整个过程不但操作繁琐,而且内容显示不够及时,用户体验较差。
发明内容
本发明实施例一方面提供一种语音输入界面管理方法及装置,以实现语音翻译场景下语音输入内容及翻译内容的实时上屏。
本发明实施例另一方面提供一种语音输入设备。
为此,本发明提供如下技术方案:
一种语音输入界面管理方法,所述方法包括:
实时获取当前语音输入对应的文本;所述文本包括:对所述当前语音输入进行语音识别得到的识别文本,和对所述识别文本进行翻译得到的译文文本;
根据所述文本的内容确定用于在显示界面承载所述文本的容器的宽度和高度,并在所述容器的宽度达到设定的最大宽度后,保持所述最大宽度,在所述容器的高度达到设定的最大高度后,保持所述最大高度;
利用所述容器实时展现所述文本;
在所述容器的高度达到设定的最大高度后,如果有新文本加入所述容器,则使所述容器中展现的文本向上滚动,以展现所述新文本。
可选地,所述方法还包括:
根据屏幕的大小自适应地确定所述容器的最大宽度和最大高度。
可选地,所述根据所述文本的内容确定用于在显示界面承载所述文本的容器的宽度和高度包括:
在所述文本的宽度小于所述容器的最大宽度时,所述容器的宽度=所述文本的宽度+所述容器两侧边框分别与所述文本两侧边缘之间的间距;
在所述文本的高度小于所述容器的最大高度时,所述容器的高度=文本段落高度+所述容器上下边框分别与所述文本段落上下边缘之间的间距。
可选地,所述方法还包括:
将每次语音输入对应的文本使用新容器承载,并控制所述新容器的高度向下增加;
在所述新容器的高度增加过程中,控制屏幕显示页面向上滚动,以展现所述新容器。
可选地,所述方法还包括:
将所述识别文本及其译文文本进行同步展现,并且在当前语句结束前,将对应当前语句的新译文文本覆盖屏幕上展现的对应当前语句的原译文文本。
可选地,所述方法还包括:
使所述识别文本及其译文文本在显示界面的不同区域展现。
可选地,所述方法还包括:
将所述识别文本及其译文文本以不同视觉表现方式展现。
可选地,所述视觉表现方式包括以下任意一种或多种:颜色、字体、大小。
一种语音输入界面管理装置,所述装置包括:
文本获取模块,用于实时获取当前语音输入对应的文本;所述文本包括:对所述当前语音输入进行语音识别得到的识别文本,和对所述识别文本进行翻译得到的译文文本;
容器确定模块,用于根据所述文本的内容确定用于在显示界面承载所述文本的容器的宽度和高度,并在所述容器的宽度达到设定的最大宽度后,保持所述最大宽度,在所述容器的高度达到设定的最大高度后,保持所述最大高度;
展现模块,用于利用所述容器实时展现所述文本;
文本控制模块,用于在所述容器的高度达到设定的最大高度后,有新文本加入所述容器时,使所述容器中展现的文本向上滚动,以展现所述新文本。
可选地,所述容器确定模块,还用于根据屏幕的大小自适应地确定所述容器的最大宽度和最大高度。
可选地,所述容器确定模块,具体用于在所述文本的宽度小于所述容器的最大宽度时,计算所述容器的宽度=所述文本的宽度+所述容器两侧边框分别与所述文本两侧边缘之间的间距;在所述文本的高度小于所述容器的最大高度时,计算所述容器的高度=文本段落高度+所述容器上下边框分别与所述文本段落上下边缘之间的间距。
可选地,所述容器确定模块,还用于将每次语音输入对应的文本使用新容器承载,并控制所述新容器的高度向下增加;
页面控制模块,用于在所述新容器的高度增加过程中,控制屏幕显示页面向上滚动,以展现所述新容器。
可选地,所述文本控制模块,还用于将所述识别文本及其译文文本进行同步展现,并且在当前语句结束前,将对应当前语句的新译文文本覆盖屏幕上展现的对应当前语句的原译文文本。
可选地,所述文本控制模块,还用于使所述识别文本及其译文文本之间保持一定距离。
可选地,所述文本控制模块,还用于将所识别文本及其译文文本以不同视觉表现方式展现。
可选地,所述视觉表现方式包括以下任意一种或多种:颜色、字体、大小。
一种语音输入设备,所述语音输入设备包括:语音接收模块、语音识别模块、显示屏、以及前面所述的语音输入界面管理装置;
语音接收模块,用于实时接收语音输入;
语音识别模块,用于对所述语音输入进行识别,得到识别文本,并将所述识别文本传送给所述语音输入界面管理装置;
所述语音输入界面管理装置,用于将所述识别文本承载到容器中并在所述显示屏上实时展现。
可选地,所述终端设备还包括:
翻译模块,用于对所述识别文本进行翻译,得到译文文本;
所述语音输入界面管理装置,还用于将所述译文文本承载到容器中并在所述显示屏上实时展现。
一种电子设备,包括:一个或多个处理器、存储器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现前面所述的方法。
一种可读存储介质,其上存储有指令,所述指令被执行以实现前面所述的方法。
本发明实施例提供的语音输入界面管理方法及装置,对实时语音输入对应的文本,利用容器承载该文本,并根据所述文本的内容确定所述容器的宽度和高度;在利用所述容器实时展现所述文本时,在所述容器的宽度达到设定的最大宽度后,保持所述容器的宽度不变;在所述容器的高度达到设定的最大高度后,如有新文本加入所述容器,则使所述容器中展现的文本向上滚动,从而可以展现所述新文本。本发明实施例提供的语音输入界面管理方法及装置,可以实现语音输入内容及对应的译文内容实时上屏,而且文字界面的显示更具灵活性及更佳的显示效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本发明实施例语音输入界面管理方法的流程图;
图2是本发明实施例中根据屏幕的大小自适应地确定容器大小的示意图;
图3是本发明实施例中容器随展现文本内容的变化而动态变化的示意图;
图4是本发明实施例中容器内展现的文本向上滚动变化的示意图;
图5是本发明实施例中屏幕显示页面向上滚动变化的示意图;
图6是本发明实施例语音输入界面管理装置的结构框图;
图7是本发明实施例语音输入界面管理装置的另一种结构框图;图8是本发明实施例语音输入设备的一种结构框图;
图9是本发明实施例语音输入设备的另一种结构框图;
图10是根据一示例性实施例示出的一种用于输入方法的装置的框图;
图11是本发明实施例中服务器的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步的详细说明。
本发明实施例提供一种语音输入界面管理方法及装置,对实时语音输入对应的文本,利用容器承载该文本,并根据所述文本的内容确定所述容器的宽度和高度;在利用所述容器实时展现所述文本时,在所述容器的宽度达到设定的最大宽度后,保持所述容器的宽度不变;在所述容器的高度达到设定的最大高度后,如有新文本加入所述容器,则使所述容器中展现的文本向上滚动,从而可以展现所述新文本。
如图1所示,是本发明实施例语音输入界面管理方法的流程图,包括以下步骤:
步骤101,实时获取当前语音输入对应的文本。
在实际应用中,所述文本可以根据应用需要来确定,比如,根据应用场景的不同,所述文本可以有以下几种情况:
(1)所述文本包括语音转文字得到的文本,也就是说,对当前语音输入进行语音识别得到的识别文本。
(2)所述文本包括所述识别文本及对应所述识别文本的译文文本,对应目标语言的文本。
当然,所述目标语言可以预先设定,比如,某应用仅提供针对一种源语言和一种目标语言的对话翻译的情况下,无需用户设定。当然,在所述应用支持多种不同源语言和目标语言的语音输入及翻译的情况下,可以由用户来选择相应的源语言和目标语言。
(3)对应当前语音输入的译文文本。当然,所述译文文本也是先经过对当前语音输入进行识别,然后对识别文本进行翻译得到的对应目标语言的文本。
步骤102,根据所述文本的内容确定用于在显示界面承载所述文本的容器的宽度和高度,并在所述容器的宽度达到设定的最大宽度后,保持所述最大宽度,在所述容器的高度达到设定的最大高度后,保持所述最大高度。
在本发明实施例中,利用容器承载所述文本,也就是说,将所述文本放到所述容器中进行显示。所述容器的大小可以根据待显示文本内容进行实时确定,也就是说,所述容器的大小是动态变化的,与所述文本内容的多少有关。所述容器可以气泡等形式,其形状可以根据屏幕界面的形状来确定。
由于不同终端设备其屏幕的大小及形状会有所不同,因此,为了适应不同的终端设备并使屏幕显示尽可能多的文字内容,可以预先根据屏幕的大小自适应地确定所述容器的最大宽度和最大高度,具体如下:
所述容器的最大宽度=屏幕宽度-所述容器左边框与屏幕左侧边缘的间距-所述容器右边框与屏幕右侧边缘的间距;
所述容器的最大高度=屏幕高度-所述容器上边框与屏幕上边缘的间距-所述容器的下边框与屏幕下边缘的间距。
例如图2所示,设置所述容器的最大宽度Xmax=W-x0-x1min;所述容器的最大宽度Ymax=H-d1min-d2min。
其中,W为屏幕宽度,H为屏幕高度;x0为所述容器左边框与屏幕左侧边缘的间距,x1min为所述容器右边框与屏幕右侧边缘的间距;d1min为所述容器上边框距离屏幕顶部的最小值,d2min为所述容器下边框距离屏幕底部的最小值。
在对所述文本进行实时展现时,根据当前待显示文本的内容实时确定所述容器的宽度和高度。
具体地,在所述文本的宽度小于所述容器的最大宽度时,所述容器的宽度=所述文本的宽度+所述容器两侧边框分别与所述文本两侧边缘之间的间距;在所述文本的高度小于所述容器的最大高度时,所述容器的高度=文本段落高度+所述容器上下边框分别与所述文本段落上下边缘之间的间距。
所述容器两侧边框与所述文本两侧边缘之间的间距、以及所述容器上下边框与所述文本段落上下边缘之间的间距可以根据需要设定,比如设定为0.5cm。
当然,在所述容器的宽度达到最大宽度后,其宽度将不再变化,保持该最大宽度,所述容器内的文本通过换行展现。
同样,在所述容器的高度达到最大高度后,其高度将不再变化,保持该最大高度。
步骤103,利用所述容器实时展现所述文本。
步骤104,在所述容器的高度达到设定的最大高度后,如果有新文本加入所述容器,则使所述容器中展现的文本向上滚动,以展现所述新文本。
向上滚动的距离可以根据需要设定,比如每次向上滚动半行或一行的距离。
通过文本滚动的方式,可以在有限的容器展现范围内使用户可以察看更多的语音输入历史记录。比如,采用滚动视图(tableview)开发,用户滑动容器右侧的滚动条,可以使容器中的文本内容上下滚动。
需要说明的是,无论是语音对话场景,还是其它语音输入场景,语音输入可以连续有多次,为了便于用户查看历史记录,在本发明方法另一实施例中,对于连续多次语音输入对应的文本,还可以将其放入不同的容器中,也就是说,将每次语音输入对应的文本放入一个容器中展现。每个容器的大小及对容器内文本的控制方式与图1所示实施例相同。
具体地,将每次语音输入对应的文本使用新容器承载,并控制所述新容器的高度向下增加;在所述新容器的高度增加过程中,控制屏幕显示页面向上滚动,以展现所述新容器。
相应地,在用户需要查看以前的语音输入记录时,可以滑动屏幕显示页面右侧的滚动条,使页面上下滚动。
本发明实施例提供的语音输入界面管理方法可以适用于多种应用场景,比如:在对话翻译应用中,用户长按终端设备(比如手机)上的语音按钮,然后说话,对应说话内容的文本以及该文本的译文可以同步实时展现在屏幕上,用户不仅可以实时看到自己说话的语音转文字的结果,而且可以实时看到相应的翻译结果,即译文文本。
需要说明的是,在需要展现识别文本及对应的译文文本的应用场景中,所述识别文本及所述译文文本可以同步展现。由于随着用户语音输入的进行,译文文本会发生变化,比如,语音输入的识别文本为“我”,其对应的译文文本为“I”,在屏幕上显示的译文文本为“I”;然后识别文本变为“我们”,此时,译文文本变为“We”,此时需要修改屏幕上已显示的译文文本,而不是直接在原译文文本后面增加新的译文文本。因此,在本发明实施例中,在对所述识别文本及其译文文本进行同步展现时,在当前语句结束前,需要将对应当前语句的新译文文本覆盖屏幕上展现的对应当前语句的原译文文本,也就是说,用新译文文本替换掉原译文文本,以实时展现与当前语音输入对应的译文文本。
另外,在展现识别文本和译文文本时,可以使所述识别文本及其译文文本在显示界面的同一区域展现,两者之间保持一定距离,该距离相比识别文本的行距和/或译文文本的行距设置得较大些,当然,也可以设置同一语言文本之间的行距与不同语言文本之间的行距离相同,对此本发明实施例不做限定。
另外,在展现识别文本和译文文本时,也可以使所述识别文本及其译文文本在显示界面的不同区域展现,比如识别文本在容器中靠左侧对齐展现,译文文本在容器中靠右侧对齐展现。或者,识别文本在显示界面的上方区域展现,对应的译文文本在显示界面的下方区域展现。
另外,还可以将所识别文本及其译文文本以相同或不同的视觉表现方式展现,所述视觉表现方式包括但不限于以下任意一种或多种:颜色、字体、大小。
图3、图4和图5分别给出了本发明实施例中容器随展现文本内容的变化而动态变化的一种示例、容器内展现的文本向上滚动变化的一种示例、以及屏幕显示页面向上滚动变化的一种示例。
进一步地,还可以在文字显示窗口即容器内设置分割线,以分割识别文本及对应的译文文本,所述分割线可以设置在文字显示窗口上下居中的位置,或者根据识别文本及对应的译文文本的内容动态调整,对此本发明实施例不做限定。
利用本发明实施例提供的语音输入界面管理方法,可以实现对话翻译场景中语音输入内容及对应翻译内容的实时上屏操作,通过实时计算语音识别得到的文本对应的文本框的高度,进一步地,在需要同时展现译文文本时,实时计算识别文本及译文文本对应的文本框的高度,确定承载所述文本内容的容器的大小,在所述容器的高度达到设定的最大高度后,如有新文本加入所述容器,则使所述容器中展现的文本向上滚动,从而可以展现所述新文本,保证了当前对话内容的实时展现。
相应地,本发明实施例还提供一种语音输入界面管理装置,如图6所示,是该装置的一种结构框图。
在该实施例中,所述装置包括以下各模块:
文本获取模块601,用于实时获取当前语音输入对应的文本;
容器确定模块602,用于根据所述文本的内容确定用于在显示界面承载所述文本的容器的宽度和高度,并在所述容器的宽度达到设定的最大宽度后,保持所述最大宽度,在所述容器的高度达到设定的最大高度后,保持所述最大高度;
展现模块603,用于利用所述容器实时展现所述文本;
文本控制模块604,用于在所述容器的高度达到设定的最大高度后,有新文本加入所述容器时,使所述容器中展现的文本向上滚动,以展现所述新文本。
根据应用需求不同,所述文本可以包括:对当前输入语音进行语音识别得到的识别文本,和/或所述识别文本的译文文本。
对于语音识别及文字翻译可以采用现有技术,对此本发明实施例不做限定。
在本发明实施例中,所述容器的大小由所述容器确定模块602根据待显示文本内容进行实时确定,也就是说,所述容器的大小是动态变化的,与所述文本的多少有关。所述容器可以气泡等形式,其形状可以根据屏幕界面的形状来确定。
需要说明的是,所述容器的大小是动态变化的,但为了适应不同的终端设备并使屏幕显示尽可能多的文字内容,所述容器确定模块602还可以根据屏幕的大小自适应地确定所述容器的最大宽度和最大高度,具体确定方式在前面已有详细说明,在此不再赘述。
所述容器确定模块602根据所述文本的内容确定所述容器的宽度和高度的具体公式如下:
在所述文本的宽度小于所述容器的最大宽度时,所述容器的宽度=所述文本的宽度+所述容器两侧边框分别与所述文本两侧边缘之间的间距;
在所述文本的宽度达到所述容器的最大宽度后,所述容器的宽度保持该最大宽度,文本内容换行展现;
在所述文本的高度小于所述容器的最大高度时,所述容器的高度=文本段落高度+所述容器上下边框分别与所述文本段落上下边缘之间的间距。
在所述文本的高度达到所述容器的最大高度后,所述容器的高度保持该最大高度,文本内容向上滚动展现。
前面提到,在实际应用中,所述文本可以同时包括:识别文本及其译文文本。相应地,在这种情况下,所述文本控制模块604可以控制所述识别文本及其译文文本同步展现。而且,在对所述识别文本及其译文文本进行同步展现时,在当前语句结束前,所述文本控制模块604需要将对应当前语句的新译文文本覆盖屏幕上展现的对应当前语句的原译文文本,也就是说,用新译文文本替换掉原译文文本,以实时展现与当前语音输入对应的译文文本。
另外,所述文本控制模块604还可以控制所述识别文本及其译文文本在显示界面的同一区域展现,两者之间保持一定距离,该距离相比识别文本的行距和/或译文文本的行距设置得较大些,当然,也可以设置同一语言文本之间的行距与不同语言文本之间的行距离相同,对此本发明实施例不做限定。
所述文本控制模块604还可以控制所述识别文本及其译文文本在显示界面的不同区域展现,比如分别在容器的左、右两侧对齐展现,或者分别在显示界面的上、下方区域展现。
另外,所述文本控制模块604还可以将所识别文本及其译文文本以相同或不同的视觉表现方式展现,所述视觉表现方式包括但不限于以下任意一种或多种:颜色、字体、大小。
本发明实施例提供的语音输入界面管理装置,可以实现对话翻译场景中语音输入内容及对应翻译内容的实时上屏操作。根据对应当前语音输入的待显示文本内容,动态地调整承载所述文本的容器的大小,在所述容器的高度达到设定的最大高度后,如有新文本加入所述容器,则使所述容器中展现的文本向上滚动,从而可以展现所述新文本,保证了当前对话内容的实时展现。相较于现有的固定浮层显示方式,可以有更好的显示效果,并能最大可能地利用屏幕显示区域,在有限的屏幕上为用户提供尽可能多的展现内容。
图7是本发明实施例语音输入界面管理装置的另一种结构框图。
与图6所示实施例不同的是,在该实施例中,所述装置还包括:页面控制模块605。在该实施例中,文本获取模块601实时获取当前语音输入对应的文本;容器确定模块602为本次语音输入对应的文本建立新容器,将所述语音输入对应的文本使用该新容器承载,并控制所述新容器的高度向下增加;并根据所述文本的内容确定用于在显示界面承载所述文本的容器的宽度和高度,并在所述容器的宽度达到设定的最大宽度后,保持所述最大宽度,在所述容器的高度达到设定的最大高度后,保持所述最大高度。展现模块603利用所述新容器展现所述文本。
在文本展现过程中,文本控制模块604在所述容器的高度达到设定的最大高度后,有新文本加入所述容器时,使所述容器中展现的文本向上滚动,以展现所述新文本。页面控制模块605在所述新容器的高度增加过程中,控制屏幕显示页面向上滚动,以展现所述新容器。
利用本发明实施例的语音输入界面管理装置,不仅可以使用户查看容器内展现的文本的历史记录,而且可以查看屏幕显示页面中已显示过的历史记录。
相应地,本发明实施例还提供一种语音输入设备,如图8所示,是该语音输入设备的一种结构框图。
该语音输入设备包括:
语音接收模块701、语音识别模块702、显示屏703、以及前面所述的语音输入界面管理装置600。其中:
语音接收模块701,用于实时接收语音输入;
语音识别模块702,用于对所述语音输入进行识别,得到识别文本,并将所述识别文本传送给所述语音输入界面管理装置;
所述语音输入界面管理装置,用于将所述识别文本承载到容器中并在所述显示屏703上实时展现。
本发明实施例提供的语音输入设备,可以应用于即时通讯应用,根据对应当前语音输入的文本内容,动态地调整承载所述文本的容器的大小,在所述容器的高度达到设定的最大高度后,如有新文本加入所述容器,则使所述容器中展现的文本向上滚动,从而可以展现所述新文本,保证了当前对话内容的实时展现。相较于现有的固定浮层显示方式,可以有更好的显示效果,并能最大可能地利用屏幕显示区域,在有限的屏幕上为用户提供尽可能多的展现内容。
需要说明的是,在即时通讯应用中,所述语音输入设备还可以接收对方用户通过其它用户设备,比如手机发来的语音信息或文本信息,对于该信息,同样可以将其放入相应的容器中进行显示,具体地,可以设置两个容器,分别放置本用户及对方用户发送的信息,容器的大小及动态调整方式可以参照前面的描述进行适应性调整。
如图9所示,是本发明实施例语音输入设备的另一种结构框图。
与图8所示实施例的区别在于,在该实施例中,所述语音输入设备还包括:
翻译模块704,用于对所述识别文本进行翻译,得到译文文本;
所述语音输入界面管理装置,还用于将所述译文文本承载到容器中并在所述显示屏上实时展现。
本发明实施例提供的语音输入设备,可以提供语音输入翻译应用,根据对应当前语音输入的译文内容,或者根据对应当前语音输入的识别文本及译文文本,动态地调整承载所述文本的容器的大小,在所述容器的高度达到设定的最大高度后,如有新文本加入所述容器,则使所述容器中展现的文本向上滚动,从而可以展现所述新文本,保证了当前对话内容的实时展现。相较于现有的固定浮层显示方式,可以有更好的显示效果,并能最大可能地利用屏幕显示区域,在有限的屏幕上为用户提供尽可能多的展现内容。
图10是根据一示例性实施例示出的一种用于搜索词权重确定方法的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图10,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类别的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类别的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述按键误触纠错方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本发明还提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行上述本发明方法实施例中的全部或部分步骤。
图11是本发明实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (18)
1.一种语音输入界面管理方法,其特征在于,所述方法包括:
实时获取当前语音输入对应的文本;所述文本包括:对所述当前语音输入进行语音识别得到的识别文本,和对所述识别文本进行翻译得到的译文文本;
根据所述文本的内容确定用于在一个屏幕的显示界面承载所述文本的容器的宽度和高度,并在所述容器的宽度达到设定的最大宽度后,保持所述最大宽度,在所述容器的高度达到设定的最大高度后,保持所述最大高度;
利用所述容器实时展现所述文本;
在所述容器的高度达到设定的最大高度后,如果有新文本加入所述容器,则使所述容器中展现的文本向上滚动,以展现所述新文本;
针对每次语音输入对应的文本,根据所述每次语音输入对应的文本的内容,确定在所述一个屏幕的显示界面的新容器的宽度和高度,将所述每次语音输入对应的文本使用所述新容器承载,并控制所述新容器的高度向下增加;在所述新容器的高度增加过程中,控制所述一个屏幕的显示界面向上滚动,以展现所述新容器。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据屏幕的大小自适应地确定所述容器的最大宽度和最大高度。
3.根据权利要求2所述的方法,其特征在于,所述根据所述文本的内容确定用于在显示界面承载所述文本的容器的宽度和高度包括:
在所述文本的宽度小于所述容器的最大宽度时,所述容器的宽度=所述文本的宽度+所述容器两侧边框分别与所述文本两侧边缘之间的间距;
在所述文本的高度小于所述容器的最大高度时,所述容器的高度=文本段落高度+所述容器上下边框分别与所述文本段落上下边缘之间的间距。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述识别文本及其译文文本进行同步展现,并且在当前语句结束前,将对应当前语句的新译文文本覆盖屏幕上展现的对应当前语句的原译文文本。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
使所述识别文本及其译文文本在显示界面的不同区域展现。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
将所述识别文本及其译文文本以不同视觉表现方式展现。
7.根据权利要求6所述的方法,其特征在于,所述视觉表现方式包括以下任意一种或多种:颜色、字体、大小。
8.一种语音输入界面管理装置,其特征在于,所述装置包括:
文本获取模块,用于实时获取当前语音输入对应的文本;所述文本包括:对所述当前语音输入进行语音识别得到的识别文本,和对所述识别文本进行翻译得到的译文文本;
容器确定模块,用于根据所述文本的内容确定用于在一个屏幕的显示界面承载所述文本的容器的宽度和高度,并在所述容器的宽度达到设定的最大宽度后,保持所述最大宽度,在所述容器的高度达到设定的最大高度后,保持所述最大高度;
展现模块,用于利用所述容器实时展现所述文本;
文本控制模块,用于在所述容器的高度达到设定的最大高度后,有新文本加入所述容器时,使所述容器中展现的文本向上滚动,以展现所述新文本;针对每次语音输入对应的文本,根据所述每次语音输入对应的文本的内容,确定在所述一个屏幕的显示界面的新容器的宽度和高度,将所述每次语音输入对应的文本使用所述新容器承载,并控制所述新容器的高度向下增加;在所述新容器的高度增加过程中,控制所述一个屏幕的显示界面向上滚动,以展现所述新容器。
9.根据权利要求8所述的装置,其特征在于,
所述容器确定模块,还用于根据屏幕的大小自适应地确定所述容器的最大宽度和最大高度。
10.根据权利要求9所述的装置,其特征在于,
所述容器确定模块,具体用于在所述文本的宽度小于所述容器的最大宽度时,计算所述容器的宽度=所述文本的宽度+所述容器两侧边框分别与所述文本两侧边缘之间的间距;在所述文本的高度小于所述容器的最大高度时,计算所述容器的高度=文本段落高度+所述容器上下边框分别与所述文本段落上下边缘之间的间距。
11.根据权利要求8所述的装置,其特征在于,
所述文本控制模块,还用于将所述识别文本及其译文文本进行同步展现,并且在当前语句结束前,将对应当前语句的新译文文本覆盖屏幕上展现的对应当前语句的原译文文本。
12.根据权利要求11所述的装置,其特征在于,
所述文本控制模块,还用于使所述识别文本及其译文文本之间保持一定距离。
13.根据权利要求11所述的装置,其特征在于,
所述文本控制模块,还用于将所识别文本及其译文文本以不同视觉表现方式展现。
14.根据权利要求13所述的装置,其特征在于,所述视觉表现方式包括以下任意一种或多种:颜色、字体、大小。
15.一种语音输入设备,其特征在于,所述语音输入设备包括:语音接收模块、语音识别模块、显示屏、以及权利要求8至14任一项所述的语音输入界面管理装置;
语音接收模块,用于实时接收语音输入;
语音识别模块,用于对所述语音输入进行识别,得到识别文本,并将所述识别文本传送给所述语音输入界面管理装置;
所述语音输入界面管理装置,用于将所述识别文本承载到容器中并在所述显示屏上实时展现。
16.根据权利要求15所述的语音输入设备,其特征在于,所述语音输入设备还包括:
翻译模块,用于对所述识别文本进行翻译,得到译文文本;
所述语音输入界面管理装置,还用于将所述译文文本承载到容器中并在所述显示屏上实时展现。
17.一种电子设备,其特征在于,包括:一个或多个处理器、存储器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现如权利要求1至7任一项所述的方法。
18.一种可读存储介质,其上存储有指令,所述指令被执行以实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811619167.0A CN111399950B (zh) | 2018-12-28 | 2018-12-28 | 语音输入界面管理方法及装置、语音输入设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811619167.0A CN111399950B (zh) | 2018-12-28 | 2018-12-28 | 语音输入界面管理方法及装置、语音输入设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111399950A CN111399950A (zh) | 2020-07-10 |
CN111399950B true CN111399950B (zh) | 2024-06-11 |
Family
ID=71428293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811619167.0A Active CN111399950B (zh) | 2018-12-28 | 2018-12-28 | 语音输入界面管理方法及装置、语音输入设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111399950B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111953852B (zh) * | 2020-07-30 | 2021-12-21 | 北京声智科技有限公司 | 通话记录生成方法、装置、终端及存储介质 |
CN114329273B (zh) * | 2021-12-29 | 2023-04-14 | 北京金堤科技有限公司 | 气泡宽度的确定方法、装置、电子设备及计算机存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0971285A2 (en) * | 1998-06-30 | 2000-01-12 | Sun Microsystems, Inc. | Method and apparatus for providing feedback while scrolling |
JP2000268027A (ja) * | 1999-03-18 | 2000-09-29 | Hitachi Information Systems Ltd | Webページにおけるテキストボックス表示方法およびそのプログラムを記録した記録媒体 |
CN103838475A (zh) * | 2012-11-26 | 2014-06-04 | 腾讯科技(深圳)有限公司 | 网页中进行文本框输入的方法及装置 |
CN105430208A (zh) * | 2015-10-23 | 2016-03-23 | 小米科技有限责任公司 | 语音会话方法、装置及终端设备 |
CN106095374A (zh) * | 2016-06-23 | 2016-11-09 | Tcl集团股份有限公司 | 一种文字大小自适应各国语言显示的方法及系统 |
CN106814879A (zh) * | 2017-01-03 | 2017-06-09 | 北京百度网讯科技有限公司 | 一种输入方法和装置 |
CN107273366A (zh) * | 2017-05-25 | 2017-10-20 | 深圳市比邻软件有限公司 | 一种翻译物理设备程序界面的方法及系统 |
CN107678645A (zh) * | 2017-09-21 | 2018-02-09 | 咪咕音乐有限公司 | 一种信息显示处理方法及装置和存储介质 |
CN107766340A (zh) * | 2017-10-24 | 2018-03-06 | 广东欧珀移动通信有限公司 | 显示文本的方法、装置及终端 |
CN108538284A (zh) * | 2017-03-06 | 2018-09-14 | 北京搜狗科技发展有限公司 | 同声翻译结果的展现方法及装置、同声翻译方法及装置 |
CN108650419A (zh) * | 2018-05-09 | 2018-10-12 | 深圳市知远科技有限公司 | 基于智能手机的电话翻译系统 |
CN109033423A (zh) * | 2018-08-10 | 2018-12-18 | 北京搜狗科技发展有限公司 | 同传字幕显示方法及装置、智能会议方法、装置及系统 |
-
2018
- 2018-12-28 CN CN201811619167.0A patent/CN111399950B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0971285A2 (en) * | 1998-06-30 | 2000-01-12 | Sun Microsystems, Inc. | Method and apparatus for providing feedback while scrolling |
JP2000268027A (ja) * | 1999-03-18 | 2000-09-29 | Hitachi Information Systems Ltd | Webページにおけるテキストボックス表示方法およびそのプログラムを記録した記録媒体 |
CN103838475A (zh) * | 2012-11-26 | 2014-06-04 | 腾讯科技(深圳)有限公司 | 网页中进行文本框输入的方法及装置 |
CN105430208A (zh) * | 2015-10-23 | 2016-03-23 | 小米科技有限责任公司 | 语音会话方法、装置及终端设备 |
CN106095374A (zh) * | 2016-06-23 | 2016-11-09 | Tcl集团股份有限公司 | 一种文字大小自适应各国语言显示的方法及系统 |
CN106814879A (zh) * | 2017-01-03 | 2017-06-09 | 北京百度网讯科技有限公司 | 一种输入方法和装置 |
CN108538284A (zh) * | 2017-03-06 | 2018-09-14 | 北京搜狗科技发展有限公司 | 同声翻译结果的展现方法及装置、同声翻译方法及装置 |
CN107273366A (zh) * | 2017-05-25 | 2017-10-20 | 深圳市比邻软件有限公司 | 一种翻译物理设备程序界面的方法及系统 |
CN107678645A (zh) * | 2017-09-21 | 2018-02-09 | 咪咕音乐有限公司 | 一种信息显示处理方法及装置和存储介质 |
CN107766340A (zh) * | 2017-10-24 | 2018-03-06 | 广东欧珀移动通信有限公司 | 显示文本的方法、装置及终端 |
CN108650419A (zh) * | 2018-05-09 | 2018-10-12 | 深圳市知远科技有限公司 | 基于智能手机的电话翻译系统 |
CN109033423A (zh) * | 2018-08-10 | 2018-12-18 | 北京搜狗科技发展有限公司 | 同传字幕显示方法及装置、智能会议方法、装置及系统 |
Non-Patent Citations (2)
Title |
---|
ActiveX and Visual Basic Enhance the Display of Long Text Strings in a Combobox or Listbox;Calvert J 等;MSDN Magazine;20001231;第104-107页 * |
用VB实现文本框内容翻页滚动的两种方法;储君, 王平松;计算机应用研究;19990128(第01期);第92页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111399950A (zh) | 2020-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10296201B2 (en) | Method and apparatus for text selection | |
CN109637518B (zh) | 虚拟主播实现方法及装置 | |
EP3171279A1 (en) | Method and device for input processing | |
CN110147467A (zh) | 一种文本描述的生成方法、装置、移动终端及存储介质 | |
US9959487B2 (en) | Method and device for adding font | |
CN104394265A (zh) | 基于移动智能终端的自动会话方法及装置 | |
CN110610720B (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN105094539B (zh) | 参考信息显示方法和装置 | |
CN108538284A (zh) | 同声翻译结果的展现方法及装置、同声翻译方法及装置 | |
CN109388810A (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN111399950B (zh) | 语音输入界面管理方法及装置、语音输入设备 | |
CN107801282B (zh) | 台灯、台灯控制方法及装置 | |
CN109725736B (zh) | 一种候选排序方法、装置及电子设备 | |
CN107656694B (zh) | 用户界面的显示控制方法及装置 | |
CN106339160A (zh) | 浏览交互处理方法及装置 | |
CN107179837B (zh) | 输入方法及装置 | |
CN105955637B (zh) | 处理文本输入框的方法和装置 | |
CN109887492B (zh) | 一种数据处理方法、装置和电子设备 | |
CN111679746A (zh) | 一种输入方法、装置和电子设备 | |
CN111208910B (zh) | 一种云端联想方法和相关装置 | |
CN109144336B (zh) | 一种数据处理方法、装置、设备及可读存储介质 | |
CN113035189A (zh) | 一种文档演示的控制方法、装置和设备 | |
CN113050805A (zh) | 基于输入工具的智能交互方法及装置 | |
CN109697005A (zh) | 表情发送方法和装置、终端设备及存储介质 | |
CN110716653B (zh) | 一种联想源确定方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |