CN103680492B - 移动终端及其控制方法 - Google Patents

移动终端及其控制方法 Download PDF

Info

Publication number
CN103680492B
CN103680492B CN201310453278.XA CN201310453278A CN103680492B CN 103680492 B CN103680492 B CN 103680492B CN 201310453278 A CN201310453278 A CN 201310453278A CN 103680492 B CN103680492 B CN 103680492B
Authority
CN
China
Prior art keywords
output
feedback
mobile terminal
controller
meaning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310453278.XA
Other languages
English (en)
Other versions
CN103680492A (zh
Inventor
金兑俊
南允爱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN103680492A publication Critical patent/CN103680492A/zh
Application granted granted Critical
Publication of CN103680492B publication Critical patent/CN103680492B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/086Detection of language
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • G10L21/10Transforming into visible information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. short messaging services [SMS] or e-mails
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72427User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for supporting games or graphical animations

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Telephone Function (AREA)
  • Controls And Circuits For Display Device (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

公开一种移动终端及其控制方法,通过其在通过句子单元输出与自然语言相对应的声音的过程中输出匹配自然语言的意义的反馈。本发明包括:显示单元,该显示单元被配置成通过句子单元显示文本;音频输出模块,该音频输出模块被配置成输出从将文本转换成声音而产生的合成声音;以及控制器,该控制器被配置成生成合成声音,提取文本的意义,并且控制匹配文本的意义的反馈以在经由音频输出模块输出合成声音时被输出。

Description

移动终端及其控制方法
技术领域
本发明涉及一种移动终端,并且更具体地涉及移动终端及其控制方法。虽然本发明适合于广泛的应用,但是它特别适用于在通过句子单元输出与自然语言相对应的声音的过程中输出匹配自然语言的意义的反馈。
背景技术
通常,能够将终端分类为移动/便携终端和固定终端。根据用户的直接携带性移动终端能够再次被分类为手持终端和车载终端。
随着终端功能的多样化,将终端实现为多媒体播放器,该多媒体播放器具有复合功能,诸如例如照片或运动图片的拍摄、音乐或移动图片文件的回放、玩游戏、广播接收等。
为了支持和增加终端功能,其能够考虑终端的结构部分和/或软件部分的改进。
最近,输出与被显示在移动终端的显示单元上的文本信息相对应的声音的语音输出功能被添加到移动终端以便于增强移动终端用户的便利。由于语音输出功能,移动终端的用户能够容易地识别被显示在显示单元上的内容同时没有观看显示单元。
然而,因为现有技术的语音输出功能仅能够以语音读取被显示在显示单元上的文本,所以其在被用作适合于将直播的信息递送给用户的装置中引起问题。
发明内容
因此,本发明的实施例涉及移动终端及其控制方法,其实质上消除了由于现有技术的限制和缺点而导致的一个或多个问题。
本发明的目的是为了提供一种移动终端及其控制方法,通过该移动终端及其控制方法能够进一步增强用户的便利。
特别地,本发明的目的是为了提供一种移动终端及其控制方法,由此在输出从经由移动终端将被指定的文本转换成声音而产生的合成声音的过程中能够输出匹配被指定的文本的意义的反馈。
在此的公开以及附图中将阐述本发明的另外的优点、目的和特征。本领域内的技术人员也可以基于此的公开理解这样的方面。
为了实现这些目的和其它的优点并且根据本发明的用途,如在此具体化和广泛地描述的,根据本发明的移动终端可以包括:显示单元,该显示单元被配置成通过句子单元显示文本;音频输出模块,该音频输出模块被配置成输出从将文本转换成声音而产生的合成声音;以及控制器,该控制器被配置成生成合成声音,提取文本的意义,并且控制匹配文本的意义的反馈以在经由音频输出模块输出合成声音时被输出。
在本发明的另一方面中,根据本发明的控制移动终端的方法可以包括下述步骤,通过句子单元显示文本;从将文本转换成声音产生合成声音;提取文本的意义;确定匹配文本的意义的反馈;输出合成声音;以及输出反馈同时输出合成声音。
优选地,反馈可以包括用作合成声音的背景声音的背景声音或者匹配文本的意义的图像文件。
优选地,可以以改变显示单元的输出颜色或者调节显示单元的亮度的方式调节反馈。
从本发明可获得的效果可以不受上述效果的限制。并且,在本发明所属的技术领域中的普通技术人员可以从下面的描述清楚地理解其他未提及的效果。应当理解,本发明的上述一般描述和下面的详细描述是示例性的和解释性的,并且意欲提供所要求保护的发明的进一步的解释。
附图说明
被包括以提供本发明的进一步理解并且被并入且构成本说明书的一部分的附图图示了本发明的(一个或多个)实施例并且连同说明书一起用作解释本发明的原理。在结合附图考虑下面优选实施例的描述之后,本发明的以上和其它方面、特征以及优点将会变得更加明显。在附图中:
图1是根据本发明的一个实施例的移动终端的框图;
图2是根据本发明的一个实施例的移动终端的前透视图;
图3是根据本发明的一个实施例的移动终端的后透视图;
图4是根据本发明的一个实施例的用于移动终端的操作的流程图;
图5是用于描述用于输出与反馈相对应的图像的过程的一个示例的图;
图6是用于描述用于输出与反馈相对应的图像的过程的另一示例的图;
图7是用于描述核心词的输出时序点和反馈的输出时序点的一个示例的图;
图8是用于描述核心词的输出时序点和反馈的输出时序点的另一示例的图;
图9是用于描述合成词的输出时序点和反馈的输出时序点的一个示例的图;
图10是用于描述合成词的输出时序点和反馈的输出时序点的另一示例的图;
图11是用于描述用于在合成声音的输出之前和之后添加静默时段的过程的一个示例的图;
图12是用于描述用于在输出反馈的过程中输出振动的过程的一个示例的图;以及
图13是用于描述用于与用户共享用户数据库的过程的一个示例的图。
具体实施方式
现在详细地参考本发明的优选实施例,在附图中图示其示例。只要有可能,贯穿附图将使用相同的附图标记来指代相同或者相似的部件。在下面的描述中对于元件使用的后缀“模块”和“单元”仅是考虑便于撰写本公开而共同地给出或者使用的,而不具有相互区分的意义或者作用。
首先,在本公开中描述的移动终端能够包括移动电话、智能电话、膝上型计算机、数字广播终端、PDA(个人数字助理)、PMP(便携式多媒体播放器)、导航系统等等。
除了仅可应用于移动终端的情况之外,对本领域的技术人员来说显然的是,根据在本公开中描述的实施例的配置可应用于诸如数字TV、桌上型计算机等等的固定终端。
图1是根据本发明的一个实施例的移动终端的框图。
参考图1,根据本发明的一个实施例的移动终端100包括无线通信单元110、W/V(音频/视频)输入单元120、用户输入单元130、感测单元140、输出单元150、存储器160、接口单元170、控制器180、电源单元190等等。图1示出具有各种组件的移动终端100,但是应理 解,不必实现所有图示的组件。可以替代地实现更多的或者更少的组件。
在下面的描述中,依次解释移动终端100的以上元件。
首先,无线通信单元110通常包括允许在移动终端100和移动终端100所位于的无线通信系统或者网络之间进行无线通信的一个或者多个组件。例如,无线通信单元110能够包括广播接收模块111、移动通信模块112、无线互联网模块113、短程通信模块114、位置定位模块115等等。
广播接收模块111经由广播信道从外部广播管理服务器接收广播信号和/或广播关联信息。
广播信道可以包括卫星信道和陆地信道。
广播管理服务器通常指的是生成并且发送广播信号和/或广播关联信息的服务器,或者被提供有先前生成的广播信号和/或广播关联信息并且然后将所提供的信号或者信息发送到终端的服务器。广播信号可以被实现为TV广播信号、无线电广播信号以及数据广播信号等。如果需要,广播信号可以进一步包括与TV或者无线电广播信号相组合的广播信号。
广播关联信息包括与广播频道、广播节目、广播服务提供商等等相关联的信息。并且,可以经由移动通信网络提供广播关联信息。在这样的情况下,能够通过移动通信模块112接收广播关联信息。
能够以各种形式实现广播关联信息。例如,广播关联信息可以包括数字多媒体广播(DMB)的电子节目指南(EPG)和手持数字视频广播(DVB-H)的电子服务指南(ESG)。
广播接收模块111可以被配置为接收从各种类型的广播系统发送的广播信号。通过非限定的示例,此类广播系统包括陆地数字多媒体广播(DMB-T)、卫星数字多媒体广播(DMB-S)、手持数字视频广播(DVB-H)、被称为媒体仅前向链路()的数据广播系统以及陆地综合业务数字广播(ISDB-T)。可选的,广播接收模块111能够被配置为适合于其它的广播系统以及在上面解释的数字广播系统。
通过广播接收模块111接收到的广播信号和/或广播关联信息可以被存储在诸如存储器160的适合的设备中。
移动通信模块112将无线信号发送到一个或者多个网络实体(例如,基站、外部终端、服务器等等)/从该一个或者多个网络实体接收无线信号。此类无线信号可以表示音频、视频以及根据文本/多媒体消息收发的数据等。
无线互联网模块113支持用于移动终端100的互联网访问。此模块可以被内部地或者外部地耦合到移动终端100。在这样的情况下,无线互联网技术能够包括WLAN(无线LAN)(Wi-Fi)、Wibro(无线宽带)、Wimax(全球微波接入互操作性)、HSDPA(高速下行链路分组接入)等等。
短程通信模块114有助于相对短程的通信。用于实现此模块的适当的技术包括射频识别(RFID)、红外数据协会(IrDA)、超宽带(UWB)、以及通常被称为蓝牙和紫蜂(ZigBee)的网络技术等等。
位置定位模块115识别或者以其它方式获得移动终端100的位置。如果需要,可以通过全球定位系统(GPS)模块实现此模块。
参考图1,音频/视频(A/V)输入单元120被配置为将音频或者视频信号输入提供到移动终端100。如所示,A/V输入单元120包括相机121和麦克风122。相机121在视频呼叫模式或者拍摄模式下接收并且处理通过图像传感器获得的静止图片或者视频的图像帧。并且,已处理的图像帧能够被显示在显示单元151上。
通过相机121处理的图像帧能够被存储在存储器160中或者能够经由无线通信单元110外部地发送。可选地,根据使用环境可以将至少两个相机121提供到移动终端100。
当便携式设备处于诸如电话呼叫模式、记录模式以及语音识别的特定模式中时,麦克风122接收外部音频信号。此音频信号被处理并且转换为电音频信号。在呼叫模式的情况下,被处理的音频数据被变换为经由移动通信模块112可发送到移动通信基站的格式。麦克风122通常包括各种噪声消除算法以消除在接收外部音频信号的过程中生成的噪声。
用户输入单元130响应于相关联的一个或多个输入设备的用户操作而生成输入数据。这样的设备的示例包括键盘、薄膜开关、触摸板(例如,静压/电容)、拨动轮(jogwheel)、拨动开关(jog switch)等等。
感测单元140提供感测信号,用于使用移动终端的各方面的状态测量来控制移动终端100的操作。例如,感测单元140可以检测移动终端100的打开/关闭状态、移动终端100的组件(例如,显示器和键盘)的相对定位、移动终端100或移动终端100的组件的位置改变、是否存在用户与移动终端100的接触、移动终端100的方位或加速/减速。作为示例,考虑被配置为滑盖式移动终端的移动终端100。在该配置中,感测单元140可以感测移动终端的滑动部分是打开还是关闭。其它示例包括感测单元140感测由电源单元190提供的电力存在与否、 接口单元170与外部设备之间的耦合或其它连接的存在与否。并且,感测单元140能够包括接近传感器141。
输出单元150生成与视觉、听觉、触觉等等相关的输出。并且,输出单元150包括显示单元151、音频输出模块152、警报单元153、触觉模块154、投影仪模块155等等。
将显示单元151典型地实现为视觉地显示(输出)与移动终端100相关联的信息。例如,如果移动终端在电话呼叫模式下操作,则显示器通常将提供包括与拨打、进行以及终止电话呼叫相关联的信息的用户界面(UI)或图形用户界面(GUI)。作为另一示例,如果移动终端100处于视频呼叫模式或拍摄模式,则显示单元151可以附加地或替代地显示与这些模式相关联的图像、UI或GUI。
可以使用已知的显示器技术来实现显示模块151,这些技术例如包括液晶显示器(LCD)、薄膜晶体管液晶显示器(TFT-LCD)、有机发光二极管显示器(OLED)、柔性显示器和三维显示器。移动终端100可以包括一个或多个这样的显示器。
能够将上述显示器中的一些实现为透明或透光型,它们可被称为透明显示器。作为透明显示器的代表性示例,存在TOLED(透明OLED)等等。也能够将显示单元151的后部配置实现为透光型。在该配置中,用户能够经由被终端主体的显示单元151占据的区域看见终端主体后部的对象。
根据移动终端100的所实现的配置,能够向移动终端100提供至少两个显示单元151。例如,可以以相互隔开或置入一个主体的方式将多个显示单元布置在移动终端100的单个面上。替代地,能够将多个显示单元布置在移动终端100的不同面上。
在显示单元151和用于检测触摸动作的传感器(在下文中称为“触摸传感器”)配置交互层结构(在下文中被称为“触摸屏”)的情况下,能够将显示单元151用作输入设备以及输出设备。在这样的情况下,能够将触摸传感器配置为触摸膜、触摸片、触摸板等等。
触摸传感器能够被配置为将施加于显示单元151的特定部分的压力或者从显示单元151的特定部分生成的电容变化转换为电输入信号。此外,能够配置触摸传感器以检测触摸压力以及触摸位置或尺寸。
如果向触摸传感器进行触摸输入,则与该触摸相对应的(一个或多个)信号被传送到触摸控制器。触摸控制器处理(一个或多个)信号,并且然后将已处理的(一个或多个)信号传送到控制器180。因此,控制器180能够获知显示单元151的指定部分是否被触摸。
参考图1,接近传感器(在附图中未示出)能够被提供到移动终端100被触摸屏包围的内部区域或触摸屏周围。接近传感器是在没有机械接触的情况下使用电磁场强度或红外线来检测是否存在靠近指定检测表面的对象或者在接近传感器周围是否存在对象的传感器。因此,接近传感器与接触型传感器相比具有更长的耐用性,并且与接触型传感器相比还具有更广的用途。
接近传感器能够包括透射性光电传感器、直接反射式光电传感器、镜像反射式光电传感器、射频振荡接近传感器、静电电容接近传感器、磁性接近传感器、红外接近传感器等等中的一个。在触摸屏包括静电电容接近传感器的情况下,其被配置为使用电场根据指示器的接近的变化来检测指示器的接近。在这样的情况下,能够将触摸屏(触摸传感器)归类为接近传感器。
在下面的描述中,为了清楚起见,指示器靠近而不接触触摸屏的情况下被识别为位于触摸屏上的动作被称为“接近触摸”。并且,指 示器实际上接触触摸屏的动作被称为“接触触摸”。在触摸屏上由指示器接近触摸的位置的含义是指当指示器执行接近触摸时,与触摸屏垂直相对的指示器的位置。
接近传感器检测接近触摸和接近触摸模式(例如,接近触摸距离、接近触摸持续时间、接近触摸位置、接近触摸位移状态等等)。并且,能够将与所检测到的接近触摸动作和所检测到的接近触摸模式相对应的信息输出到触摸屏。
音频输出模块152在包括呼叫接收模式、呼叫拨打模式、记录模式、语音识别模式、广播接收模式等等的各种模式中起作用,以输出从无线通信单元110接收到的音频数据或存储在存储器160中的音频数据。在操作期间,音频输出模块152输出与特定功能(例如,接收到呼叫、接收到消息等等)相关的音频。通常使用一个或多个扬声器、蜂鸣器、其它音频产生设备及其组合来实现音频输出模块152。
警报单元153输出信号,用于通告与移动终端100相关联的特定事件的发生。典型事件包括接收到呼叫事件、接收到消息事件以及接收到触摸输入事件。警报单元153能够通过振动以及视频或音频信号的方式来输出用于通告事件发生的信号。能够经由显示单元151或音频输出单元152来输出视频或音频信号。因此,能够将显示单元151或音频输出模块152能够视作警报单元153的一部分。
触觉模块154生成用户能感测到的各种触觉效果。振动是由触觉模块154生成的触觉效果的代表性效果。由触觉模块154生成的振动的强度和模式是可控的。例如,能够以合成在一起的方式输出不同的振动,或者能够依次输出不同的振动。
触觉模块154能够生成除了振动之外的各种触觉效果。例如,触觉模块154生成归因于相对于接触皮肤表面垂直移动的针布置的效果、 归因于空气通过注入/抽吸孔的注入/抽吸力的效果、归因于掠过皮肤表面的效果、归因于与电极接触的效果、归因于静电力的效果、归因于使用吸热设备或放热设备表示热/冷感觉的效果等等。
触觉模块154能够被实现为使得用户能够通过手指、手臂等的肌肉感觉来感测触觉效果,以及通过直接接触来传送触觉效果。可选地,根据移动终端100的对应配置类型,能够向移动终端100提供至少两个触觉模块154。
投影仪模块155是用于使用移动终端100来执行图像投影仪功能的元件。并且,根据控制器180的控制信号,投影仪模块155能够在外部屏幕或者墙上显示与在显示单元151上显示的图像相同或者至少部分不同的图像。
具体地,投影仪模块155能够包括光源(在附图中未示出),该光源生成用于外部地投射图像的光(例如,激光);图像产生装置(在附图中未示出),该图像产生装置用于使用从光源生成的光产生图像以外部地输出;以及透镜(在附图中未示出),该透镜用于放大以在预定的焦距上向外输出图像。并且,投影仪模块155能够进一步包括用于通过机械地移动透镜或者整个模块来调整图像投射的方向的设备(在附图中未示出)。
投影仪模块155能够根据显示装置的设备类型被归类为CRT(阴极射线管)模块、LCD(液晶显示器)模块、DLP(数字光处理)模块等。特别地,通过使得从光源生成的光能够在DMD(数字微镜器件)芯片上反射的机制来操作DLP模块,并且能够有利地减小投影仪模块151的尺寸。
优选地,能够在移动终端100的横向长度方向、前侧或者背侧方向上提供投影仪模块155。并且,应当理解,根据投影仪模块155的必 要性,投影仪模块155能够被提供到移动终端100的任何位置。
存储器单元160一般用于存储各种类型的数据,以支持移动终端100的处理、控制和存储要求。这样的数据的示例包括用于在移动终端100上操作的应用的程序指令、接触数据、电话簿数据、消息、音频、静止图片、运动图片等等。并且,能够将每个数据的累积使用频率(例如,每个电话簿、每个消息或每个多媒体的使用频率)或最近使用历史存储在存储器单元160中。此外,能够将在触摸输入到触摸屏的情况下输出的各种模式的振动和/或声音的数据存储在存储器单元160中。
可以使用任何类型或者合适的易失性和非易失性存储器或者存储设备的组合来实现存储器160,存储设备包括硬盘、随机存取存储器(RAM)、静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁性存储器、闪存、磁盘或光盘、多媒体卡微型存储器、卡式存储器(例如,SD存储器、XD存储器等等),或其它类似的存储器或数据存储设备。并且,能够与用于在互联网上执行存储器160的存储功能的网络存储关联地操作移动终端100。
接口单元170通常被实现为将移动终端100与外部设备耦合。接口单元170从外部设备接收数据,或者被供电并且然后向移动终端100中的各个元件传送数据或电力,或者使得移动终端100内的数据能够传送到外部设备。接口单元170可以使用有线/无线头戴式受话器端口、外部充电器端口、有线/无线数据端口、存储卡端口、用于耦合到具有标识模块的设备的端口、音频输入/输出端口、视频输入/输出端口、耳机端口等等来配置。
标识模块是用于存储用于验证移动终端100的使用权限的各种信 息的芯片,并且可以包括用户标识模块(UIM)、订户标识模块(SIM)、通用订户标识模块(USIM)等等。具有标识模块的设备(下面称为“标识设备”)能够被制造为智能卡。因此,标识设备经由对应端口可连接到移动终端100。
当将移动终端100连接到外部支架时,接口单元170变成用于从支架向移动终端100提供电力的通道,或者变成用于将由用户从支架输入的各种命令信号递送到移动终端100的通道。从支架输入的各种命令信号或电力的每个可以作为使得移动终端100识别已经被正确装入支架的信号操作。
控制器180通常控制移动终端100的整体操作。例如,控制器180执行与语音呼叫、数据通信、视频呼叫等等相关联的控制和处理。控制器180可以包括提供多媒体回放的多媒体模块181。多媒体模块181可以被配置为控制器180的一部分,或实现为单独的组件。
此外,控制器180能够执行模式识别处理,用于将在触摸屏上执行的书写输入和绘图输入分别识别为字符或图像。
电源单元190提供移动终端100的各种组件所需的电力。电力可以是内部电力、外部电力或其组合。
例如可以使用计算机软件、硬件或其一些组合在计算机可读介质中实现在此所描述的各种实施例。对于硬件实施方式,可以在一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计成执行在此所描述的功能的其它电子单元,或它们的选择性组合中实现在此所描述的实施例。也可以通过控制器180来实现这样的实施例。
对于软件实施方式,可以利用诸如进程和函数的独立的软件模块来实现在此所描述的实施例,其每一个执行在此所描述的功能和操作中的一个或多个。能够利用以任何合适的编程语言编写的软件应用来实现软件代码,并且可以将该软件代码存储在诸如存储器160的存储器中,并且通过诸如控制器180的控制器或处理器来执行。
图2是根据本发明的一个实施例的移动终端的正面透视图。
在附图中示出的移动终端100具有直板式终端主体。但是,也可以以各种不同的配置实现移动终端100。此类配置的示例包括:折叠式、滑盖式、旋转式、摇摆式以及其组合。为了清楚起见,进一步的公开将主要涉及直板式移动终端100。然而,这样的教导同样适用于其它类型的移动终端。
参考图2,移动终端100包括配置其外部的壳体(外壳、机壳、盖等等)。在本实施例中,壳体能够被划分为前壳体101和后壳体102。各种电/电子部件被装载在前壳体101与后壳体102之间提供的空间中。可选地,至少一个中间壳体能够进一步被另外提供在前壳体101和后壳体102之间。
壳体101和102通过合成树脂的注入成型来形成或者能够由诸如不锈钢(STS)、钛(Ti)等的金属物质来形成。
显示单元151、音频输出单元152、相机121、用户输入单元130/131以及132、麦克风122、接口180等等能够被提供到终端主体,并且更加具体地,被提供到前壳体101。
显示单元151占据前壳体101的正面的大部分。音频输出单元151和相机121被提供到与显示单元151的两个端部中的一个相邻的区域,而用户输入单元131和麦克风122被提供到与显示单元151的另一个 端部相邻的另一区域。用户输入单元132和接口170能够被提供到前壳体101和后壳体102的横向侧。
输入单元130被操纵以接收用于控制终端100的操作的命令。并且,输入单元130能够包括多个操纵单元131和132。操纵单元131和132能够被称为操纵部分并且可以采用使得用户能够通过体验触觉感觉来执行操纵动作的触觉方式的任何机构。
通过第一操纵单元131或者第二操纵单元132输入的内容能够被不同地设置。例如,诸如开始、结束、滚动等等的命令被输入到第一操纵单元131。并且,用于从音频输出单元152输出的声音的音量调整的命令、用于切换到显示单元151的触摸识别模式等等的命令能够被输入到第二操纵单元132。
图3是图2中示出的移动终端的背侧的透视图。
参考图3,相机121’可以被另外提供到终端主体的背侧,并且更加具体地,被提供到后壳体102。相机121’具有与图2中所示的前一个相机121的拍摄方向大体上相反的拍摄方向并且可以具有与前一个相机121的像素不同的像素。
优选地,例如,前一个相机121具有足以捕获并且发送用户面部的图片以用于视频呼叫的低像素,而后一个相机121’可以具有用于在不发送所捕获的物体的情况下捕获普通物体以用于拍摄的高像素。并且,相机121和121’中的每一个可以被安装在终端主体上以旋转或者弹出。
闪光灯123和镜子124可以被另外提供为与相机121’相邻。在使用相机121’拍摄物体的情况下,闪光灯123朝着物体投射光。在用户尝试使用相机121’来对用户拍照(自拍)的情况下,镜子124使得 用户能够看到通过镜子124反射的用户的面容。
另外的音频输出模块152’可以被提供到终端主体的背侧。附加的音频输出模块152’能够与图2中所示出的前一个音频输出模块152一起实现立体声功能,并且可以被用于实现在通过终端谈话中的免提模式。
广播信号接收天线124以及用于通信的天线等可以被另外提供到终端主体的横向侧。构成图1中示出的广播接收模块111的一部分的天线124可以可收缩地提供到终端主体。
用于向移动终端100供电的电源单元190可以被提供到终端主体。并且,电源单元190可以被配置为内置在终端主体内。替代地,电源单元190可以被配置为可拆卸地连接到终端主体。
用于检测触摸的触摸板135可以被另外提供到后壳体102。像显示单元151一样,触摸板135可以被配置为透光型。在这样的情况下,如果显示单元151被配置为从其两面输出视觉信息,则其也能够经由触摸板135来识别视觉信息。能够通过触摸板135整体控制从两面输出的信息。替代地,显示器被进一步提供到触摸板135,使得触摸屏也能够被提供到后壳体102。
可以通过与前壳体101的显示单元151互连来激活触摸板135。触摸板135能够被平行地提供在显示单元151的后面。触摸板135能够具有等于或者小于显示单元151大小的大小。
为了以下描述清楚起见,假定根据本发明的移动终端100可以包括在图1中示出的前述组件中的至少一个。特别地,根据本发明的移动终端100被假定为包括在图1中示出的显示单元151、音频输出模块152、存储器160以及控制器180。有时候,根据本发明的移动终端100 可以进一步包括在图1中示出的组件当中的无线通信单元和相机。
此外,本发明的控制器180可以包括TTS(文本到语音)模块(在图1中未示出)、自然语言处理模块(在图1中未示出)以及反馈评估模块(在图1中未示出)。
TTS模块将被显示在显示单元151上的自然语言转换成语音并且然后将该语音递送给音频输出模块152。特别地,TTS模块将自然语言直接地转换成声音并且然后将该声音递送给音频输出模块152。本发明的TTS模块通过由句子单元自动地分析自然语言来创建合成声音并且然后能够将所创建的合成声音递送给音频输出模块152。当自然语言被显示在显示单元151上时,其可以被显示为文本串组合的文本。
自然语言处理模块被配置成通过机械地分析语言现象将人类发出的语言现象转换成计算机可理解的形式。自然语言处理模块通过执行词法(morphological)分析、短语单元分析、解析等等来分析人类语言并且能够输出具有自然语言的意义的编译器语言。本发明的自然语言处理模块通过句子单元分析自然语言的意义并且然后能够分析自然语言的意义。
关于自然语言处理单元,词法分析可以意指输出任何目标词的所有可能的分析结果。特别地,使用表解析,自然语言处理模块能够从大量的所有场合中选择适当的结果,其中能够递送词。解析单元分析可以意指分析名词短语、动词短语、状语短语等等。并且,从句单元分析可以意指通过短句分解诸如复合句子、复杂句子等等的句子。解析可以意指通过将句子分解成构造相对应的句子的成分并且然后分析其中层次关系确定句子的结构。
反馈评估模块被配置成,确定匹配从自然语言处理模块输出的自然语言的意义的反馈。反馈评估模块可以包括背景声音评估模块、振 动确定模块、显示确定模块以及光源确定模块中的至少一个。背景声音评估模块被配置成确定匹配自然语言的意义的音频数据。并且,振动确定模块被配置成响应于自然语言的意义确定是否输出振动。同样地,显示确定模块被配置成确定是否响应于自然语言的意义更改显示单元151的输出。并且,光源确定模块可以被配置成确定是否响应于自然语言的意义闪烁光源。
基于上述内容,如下详细地描述根据本发明的移动终端100。
图4是用于根据本发明的实施例的移动终端的操作的流程图。
参考图4,控制器180能够控制句子单元的自然语言以被显示在显示单元151上[S401]。当人类想法或者感觉被表达为语言并且通常由主语和动词构成时句子是指示全部内容的最小单位。但是,对于句子来说可能不必须被构造有主语和动词。例如,诸如“bowwow”、“ding-dong”等等的具有被省略的主语和动词的拟声词可以构造句子。对于另一示例,不具有动词的句子(例如,“真的?”)也能够构造句子。在步骤S401中,控制器180可以控制自然语言以将电子书、文档文件、网页、文本键入的图像文件等等输出到显示单元151的方式输出。在从图像文件提取自然语言的情况下,控制器180能够使用文本识别算法从图像文件提取自然语言。
一旦句子单元的自然语言被显示在显示单元151上,控制器180的TTS模块能够通过对句子单元的自然语言执行TTS分析控制要从将自然语言转换成声音而生成的合成声音[S402]。此外,控制器180的自然语言处理模块能够通过分析句子单元的分析语言提取自然语言的意义[S403]。
一旦自然语言的意义被分析,控制器180的反馈确定模块能够确定匹配自然语言的意义的反馈[S404]。特别地,反馈可以被表示为背景 声音的输出、图像的显示、显示单元151的输出变化、振动的输出以及光源的闪烁中的至少一个。在下面的描述中,详细地解释被输出到显示单元151的自然语言和用于响应于自然语言的意义输出反馈的过程的示例。
[反馈的示例:背景声音]
控制器180能够将匹配自然语言意义的背景声音确定为反馈。在这样的情况下,背景声音可以在经由音频输出模块152输出合成声音时在支持合成声音中起作用。特别地,控制器180能够从被保存在存储器160中的背景声音数据库提取匹配自然语言意义的背景声音。如下地详细描述参考自然语言的详细示例确定反馈的示例。
<自然语言示例1:本周末将会下雨。>
因为在示例1的意义中主语“雨”采取动词“下”的行动,所以控制器180能够从背景声音数据库中提取匹配示例1中的“下雨”的意义的背景声音。特别地,控制器180从背景数据库中提取与雨的声音相对应的背景声音并且然后能够将其用作反馈。
<自然语言示例2:预期强风伴随有大雨。>
在示例2中的意义中,主语“大雨”采取动词“预期”的行动,并且宾语“强风”采取动词“伴随”的行动。可以这样说,在示例2的意义中,意义“刮强风”和意义“下大雨”被相互合成。因此,控制器180从背景声音数据库中提取表示匹配“刮强风”的意义的风声的背景声音和表示匹配“下大雨”的意义的雨声的背景声音,并且然后能够将被提取的背景声音用作反馈。
如参考自然语言示例1和2在上面的描述中所提及的,本发明的控制器180能够控制匹配自然语言的意义的背景声音以被确定为反馈。但是,在从背景声音数据中不能够提取匹配自然语言的意义的背景声音的情况下,不能够使用背景声音作为反馈。
此外,如果句子的意义与否定或者不存在有关,则控制器180不能输出反馈。参考下面的示例进行描述。
<自然语言示例3:有时本周可能不下雨。>
示例3的意义是要通告“下雨的可能性”的不存在(即,“不存在”)。特别地,示例3的意义可以被视为具有“将不会下雨”的否定意义。因此,在与参考自然语言示例1的前述描述相反,控制器180不能够从背景声音数据库中提取与雨的声音相对应的背景声音。特别地,在示例3中,控制器180能够控制背景声音不被输出以与自然语言的意义一致。
像自然语言示例3一样,本发明的控制器180没有确定每句子的关键词的反馈,而是能够控制要根据句子的整个意义确定的反馈。特别地,即使关键字“雨”被包含在自然语言示例3的句子中,对于“雨的声音”来说无需强制被确定为反馈。
[反馈的示例:振动]
控制器180能够控制振动以根据自然语言的意义作为反馈被输出。特别地,在自然语言的意义与摇动、振动、冲击、破损、损坏等等有关的情况下,控制器180可以控制振动作为反馈被输出。如下参考自然语言的详细示例详细描述用于作为反馈输出振动的过程。
<自然语言示例4:公共汽车在乡村的崎岖不平的道路上行驶时严重地摇动。>
示例4的意义指示主语“公共汽车”执行动作“行驶”和动作“摇动”。控制器180可以控制振动以作为匹配示例4的意义中的意义“公共汽车摇动”的反馈被输出。特别地,像示例4的意义一样,为了给出仿佛公共汽车在崎岖不平的道路上行驶的触觉效果,控制器180可以控制振动以经由移动终端100被输出。
<自然语言示例5:他用拳头猛击前门>
示例5的意义指示主语“他”使用补语“拳头”对宾语“前门”执行“击”的动作。像示例5一样,如果句子的意义包含将冲击应用于特定目标的意义,则控制器180可以控制振动以作为反馈被输出。在示例5中,为了给出仿佛拳头击中前门的效果,控制器180可以控制振动以经由移动终端100被输出。
[反馈的示例:图像]
控制器180可以根据自然语言的意义控制要作为反馈输出的图像。特别地,控制器180能够从被保存在存储器160中的图像数据库中提取匹配自然语言意义的图像。如下参考自然语言的详细示例描述作为反馈输出图像的情况。
<自然语言示例6:棒球飞过来打碎隔壁的窗户。>
示例6的意义指示主语“棒球”对宾语“隔壁的窗户”执行“打碎”的动作。特别地,示例6的意义可以理解为包括诸如玻璃的目标被打碎的意义。因此,控制器180从图像数据库中提取能够匹配示例6中的意义“玻璃被打碎”的图像,并且能够将被提取的图像确定为反馈。例如,参考图5,控制器180能够控制表示匹配示例6的意义的“被打碎的玻璃”的图像,以在显示单元151上作为反馈被输出。在图5中示出的示例中,控制器180可以在经由显示单元151输出自然语言时控制被确定为反馈的图像以配置背景图像。
<自然语言示例7:在窗外飘落大的雪花。>
示例7的意义指示主语“雪花”执行“飘落”的动作。特别地,示例7的意义可以被理解为包括“雪花飘落”的意义。因此,控制器180从图像数据库提取能够匹配示例7中的意义“雪花飘落”的图像,并且然后能够将被提取的图像确定为反馈。例如,参考图6,控制器180可以控制表示雪景的图像,以作为反馈被输出以匹配示例7的意义。
在反馈作为自然语言的背景被输出的情况下,如在图5或者图6中所示,控制器180能够控制自然语言的字母颜色以与背景图像的颜色明显对比。即,在自然语言被显示的位置处自然语言的字母颜色与背景图像的相类似的情况下,防止由于背景图像降低自然语言的可见性的问题。特别地,在确定自然语言的颜色与作为反馈输出的背景图像的相类似的情况下,控制器180能够在反馈被输出到显示单元151时控制要以从第一颜色变成第二颜色的方式显示的自然语言的字母颜色。在自然语言被显示的位置处第二颜色可以包括与第一颜色或者背景图像的颜色互补的颜色,这可以不是强制的。如果自然语言的字母颜色从第一颜色变成第二颜色,则在图像被显示为反馈时能够确保被显示的自然语言的可见性。
此外,对于被用作反馈的图像来说可能不必须包括静止图像。例如,控制器180能够使用运动图像或者视频作为反馈。
[反馈的示例:显示单元151的亮度或者颜色的变化]
控制器180能够根据自然语言的意义控制要作为反馈改变的显示单元151的亮度或者颜色。特别地,例如,如果自然语言的意义与亮度的变化,诸如日/夜的变化、电器的开/关等等有关,则控制器180可以控制要通过改变显示单元151的亮度输出的匹配自然语言的意义的反馈。对于另一示例,如果自然语言的意义与特定颜色有关,则控制器180可以通过经由显示单元151输出特定颜色来控制反馈将被输出。如下参考自然语言的详细示例详细地描述用于通过显示单元151的亮度或者颜色变化输出反馈的过程。
<自然语言示例8:在深谷中黑暗已经降落。>
示例8的意义指示宾语“黑暗”执行“降落”的动作。特别地,示例8可以被理解为包括“变黑”的意义。因此,为了表示意义“变黑”,控制器180能够控制显示单元151的亮度级别以逐渐地降低。
<自然语言示例9:在又厚又黑的云升起之后太阳升起。>
示例9的意义包括宾语“太阳”执行动作“升起”。特别地,示例9可以被理解为包括意义“太阳升起”。因此,为了表示意义“太阳升起”,控制器180能够控制亮度级别以逐渐地上升。
<自然语言示例10:他把衣服染成黄色。>
示例10的意义包括主语“他”对补语“衣服”执行动词“染色”的动作。特别地,示例10可以被理解为包括“衣服变成黄色”的意义。因此,能够以将显示单元151的颜色逐渐地变成黄色的方式表示意义“变成黄色”。
[反馈的示例:光源单元的闪烁]
如在前面的描述中所提及的,根据本发明的移动终端100可以通过调节显示单元151的亮度来表示亮度的变化。可替选地,根据本发明的移动终端100可以通过光源单元的闪烁来表示亮度的变化。在这样的情况下,光源单元可以包括被用于补充拍摄的光的相机闪光和被提供给键盘的背侧的背光LED中的至少一个。如下参考自然语言的详细示例详细地描述用于经由光源单元的闪烁输出反馈的过程。
<自然语言示例11:黑云一聚集闪电就击中闪光。>
示例11的自然语言包括主语“闪电”执行动词“击中”的动作的意义。为了匹配示例11的意义“闪电击中”,控制器180能够控制反馈以光源单元闪烁的方式被输出。
在上述示例中,反馈的示例包括背景声音、振动、图像、显示单元151的亮度变化、显示单元151的颜色变化以及光源单元的闪烁。对于反馈来说没有强制被确定为在上面列举的示例中的一个。例如,反馈可以被确定为在上面被列举的示例中的至少两个的组合。特别地,反馈可以包括背景声音、振动、图像、显示单元151的亮度变化、显 示单元151的颜色变化以及光源单元的闪烁中的至少一个。
例如,从自然语言“雷电发出巨大的声音”,控制器180可以控制反馈以包括与雷声相对应的背景声音、表示雷击的图像、表示雷击的显示器的亮度或者颜色的瞬时变化、光源单元的闪烁等等的各种形式中的一个输出。
现在参考图4,控制器180控制从自然语言转换的合成声音以经由音频输出单元152输出[S405],并且能够控制反馈在输出合成声音时被输出[S406]。通过控制匹配自然语言的意义的反馈以在输出从自然语言转换的合成声音的过程中被输出,控制器180能够控制用户以更加容易地理解自然语言的意义。
在控制要经由语音输出模块152输出合成声音的过程中输出的反馈中,控制器180能够基于与自然语言中的反馈相对应的核心词(例如,关键字)的存在或者不存在调节反馈的输出时间或者合成声音和反馈的播放时间。
如下参考详细示例详细地描述用于调节反馈的输出时间的过程。
[反馈输出时间点示例1:输出反馈以匹配核心词的输出]
在与反馈相对应的核心词存在的情况下,控制器180能够控制要以合成声音被输出以匹配核心词的输出时间点的反馈。如下参考图7进行详细的描述。
图7和图8是用于在输出自然语言“明天,将会下雨”的合成声音的过程中输出反馈的示例的图。在图7中示出的示例中,合成声音条被配置成指示合成声音的输出数量。配置合成声音条的各个块示出当自然语言被转换成声音时各个字母的输出时间的一个示例。反馈条指示反馈的输出数量,并且可以被理解为具有根据反馈的类型的不同 意义。例如,反馈的数量可以意指背景声音的播放时间、图像显示的时间、对于显示单元151的亮度逐渐地改变直到达到亮度目标的时间、对于显示单元151的输出颜色逐渐地改变直到达到颜色目标的时间、保持光源单元的照明所耗费的时间、以及对于光源单元闪烁与被确定的计数一样多的次数所耗费的时间中的至少一个。
例如,在图7中示出的示例中,如果反馈是表示“雨声”的背景声音,则匹配反馈的核心词可以包括“雨”。因此,参考图7,控制器180能够控制要响应于合成声音中的词“雨”的输出起始点而输出的反馈。
对于另一示例,参考图8,控制器180能够控制反馈在合成声音中的词“雨”的输出中心点和反馈的中心点被设置为相互一致时被输出。在这样的情况下,在词“雨”作为声音输出之前或者之后可以输出反馈。
另一方面,不同于在图7中示出的示例,控制器180可以控制要以词“雨”的输出的结束点和反馈的结束点被设置为相互一致的方式输出的反馈[在附图中未示出]。
如在上述示例的前面描述中所提及的,控制器180提取匹配反馈的核心词,并且然后可以控制反馈的输出时序点以被调节为与对应于被提取的核心词相对应的语音的输出时序点一致。如果与反馈相对应的核心词不存在,则能够参考下面的描述中的输出点示例2。
[反馈输出时序点示例2:输出反馈以匹配整个合成声音的输出]
控制器180可以控制要被输出的反馈以与整个合成声音的输出的输出时序点一致。特别地,合成声音的输出一开始,控制器180就可以控制反馈将被输出。可替选地,控制器180使合成声音的输出中心与反馈的输出中心一致,并且然后可以控制反馈将被输出。将会参考 图9和图10进行描述。为了下面的描述清楚起见,假定反馈包括表示在图9或者图10中示出的示例中的交通堵塞的背景声音。
图9和图10是用于描述在输出自然语言“返回汉城的交通堵塞将会开始”的合成声音的过程中输出反馈的示例的图。例如,参考图9,控制器180能够控制反馈以被匹配合成声音的输出开始点的方式被输出。
对于另一实例,参考图10,控制器180控制合成声音的总播放时间的中心点以与反馈的总播放时间的中心点一致,并且然后能够控制反馈将被输出。
另一方面,不同于图9中示出的示例,控制器180可以控制要以合成声音的输出结束点和反馈的输出结束点被设置为相互一致的方式输出的反馈[在附图中未示出]。
如在上面的示例的描述中所提及的,控制器180能够控制反馈的输出时序点以被匹配到合成声音的输出时序点的方式被调节。
响应于用户设置或者匹配反馈的核心词的存在或者不存在可以确定反馈将会遵循反馈输出时序点示例1还是反馈输出时序点示例2。在反馈遵循输出时序点示例1或者输出时序点示例2的情况下,在合成词被输出之前或者之后可能需要输出反馈。例如,如果反馈的总播放时间比合成声音的长,则在合成声音的输出之前或者之后可能需要输出反馈。在这样的情形下,控制器180控制静默时段以被给予在所创建的合成声音的输出开始之前的时段和在合成声音的输出完成之后的时段中的至少一个,从而控制在播放合成声音的过程中要输出的反馈。在静默时段被添加到合成声音的情况下,在合成声音的静默时段已经结束之后自然语言可以作为声音被输出。但是,反馈可以保持被输出,尽管静默时段被输出。用于在合成声音的前面/后面添加静默时段的过 程可以参考图11。
图11是用于描述用于在合成声音的输出之前和之后添加静默时段的过程的一个示例的图。在图11中示出的示例中,在合成声音的总播放时间的中心点已经被设置为与反馈的总播放时间的中心点一致之后,反馈被输出。这样做,如果反馈的总播放时间大于合成声音的总播放时间,则参考图11,控制器180能够控制要在所创建的合成声音的输出之前和之后添加的静默时段。如果在所创建的合成声音的前面和后面添加静默时段,则添加了静默时段的合成声音的播放时间能够被控制以等于或者大于反馈的播放时间。
与在图11中示出的示例一样,如果在所创建的合成声音前面和后面添加静默时段,则其能够防止反馈在与反馈不具有关系的合成声音被输出时被输出。例如,在移动终端100需要连续地输出通过句子单元的第一自然语言的合成语言和通过句子单元的第二自然语言的合成语言的情况下,在输出第二自然语言的合成语言时匹配第二自然语言的意义的第二反馈可能需要被输出,替代匹配第一自然语言的意义的第一反馈。因此,为了防止匹配第二自然语言的合成语言或者第二自然语言的意义的第二反馈以与匹配第一自然语言的意义的第一反馈重叠的方式被输出,并且防止匹配第二自然语言的意义的第二反馈以与匹配第一自然语言的合成语言或者第一自然语言的意义的第一反馈重叠的方式被输出,控制器180能够控制静默时段以被给予第一自然语言的合成语言或者第二自然语言的合成语言。因此,虽然第一自然语言的合成语言被输出,但是仅可以输出第一反馈。虽然第二自然语言的合成语言被输出,但是仅可以输出第二反馈。
虽然图11分别示出静默时段被添加到所创建的合成时段的两侧,但是静默时段仅可以被添加到所创建的合成声音的一侧。
在反馈包括背景声音的情况下,控制器180控制合成声音和背景 声音以合并到一个文件中并且然后输出被合并的音频文件,从而控制要在输出合成声音的过程中输出的反馈。
现在参考图4,控制器180能够控制在输出反馈时反馈所伴随的振动被输出[S407]。特别地,在反馈包括背景声音的情况下,控制器180能够取决于背景声音的强度控制是否输出振动。
如下参考图12详细描述用于除了反馈之外输出振动的过程。首先,假定反馈包括图12中的背景声音。
图12是用于描述用于在输出反馈的过程中输出振动的过程的一个示例的图。特别地,图12示出在时域中划分背景声音的波形。参考图12(a),控制器180能够通过分析背景声音的波形扫描其中背景声音的振幅大于阈值的间隔。随后,控制器180能够将对于阈值时间具有比阈值大的振幅值的间隔设置为超过间隔1210。控制器180可以控制振动以在输出反馈的超过间隔时被输出。
在这样的情况下,阈值可以包括背景声音的平均振幅,本发明不受此限制。例如,控制器180能够基于用户设定值调节阈值。
在反馈的超过间隔被输出时振动被输出的情况下,控制器180可以控制响应于超过间隔1210的最大振幅值与阈值的比率来确定的振动的强度水平。特别地,控制器180能够控制基于公式1和公式2确定的振动的强度水平。
[公式1]
如果
[公式2]
如果
在公式1或者公式2中,Nlevel可以指示在相对应的超过间隔中的振动强度水平,Int可以指示整数函数,Local_Max Amp可以指示相对应的超过间隔中的最大振幅(在下文中被称为局部最大振幅),Global_Max Amp可以指示在所有的超过间隔中的最大振幅或者在背景声音的所有波形中的最大振幅(在下文中被称为全局最大振幅),Threshold可以指示阈值,并且NMaxlevel可以指示可设置的振动的最大强度水平。公式2中的步长是最大强度水平、全局最大振幅以及振动的阈值的函数,并且可以通过公式3来定义。
[公式3]
关于参考公式1和公式2的振动强度水平的确定,如果最大振幅与阈值的比率等于或者小于振动的最大强度水平[公式1],则控制器180能够将最大振幅与用于每个超过间隔的阈值的整数比率确定为每个超过间隔中的振动强度水平。特别地,控制器180能够控制在强度水平上的振动将被输出,如果超过间隔具有更高的最大振幅则其变得更高。
相反地,如果最大振幅与阈值的比率大于振动的最大强度水平[公式2],则控制器180能够将从将步长的逆数乘以局部最大振幅与阈值的比率产生的值中提取的整数确定为每个超过间隔中的振动强度水平。如果局部最大振幅与阈值的比率大于振动的最大强度水平,则能够通过将局部最大振幅与阈值的比率乘以步长的逆数来控制振动的强度水平以根据超过间隔的实际强度被适当地分布。例如,虽然局部最 大振幅与阈值的比率大于每个超过间隔中的振动的最大强度水平,但如果公式1被应用,则在每一个超过间隔中的振动强度水平将会被确定为振动的最大强度水平。当替代公式1应用公式2时,即使局部最大振幅与每一个超过间隔中的阈值的比率大于振动的最大强度水平,在每一个间隔也不能输出在最大强度水平处的振动。在这样的情况下,在具有局部最大振幅与全局最大振幅相比的相对小的值的间隔中,在相对较小的强度水平处将会输出振动。在具有局部最大振幅与全局最大振幅的相等值的间隔中,能够在相对大的强度水平处输出振动。
在图4中示出的步骤S404的描述中,背景声音或者图像可以作为反馈被选择。特别地,控制器180能够从被保存在存储器180中的背景声音或者图像数据库中提取匹配自然语言的意义的背景声音或者图像。在这样的情况下,背景声音数据库可以包括默认背景声音数据库和用户背景声音数据库,从该背景声音数据库中将会提取背景声音。并且,图像数据库可以包括默认图像数据库和用户图像数据库,从该图像数据库将会提取图像。为了下面的描述清楚起见,背景声音数据库或者图像数据库将会被称为数据库,默认背景声音数据库或者默认图像数据库将会被称为默认数据库,并且用户背景声音数据库或者用户图像数据库将会被称为用户数据库。
默认数据库是被配置成存储主要提供的背景声音或者图像的数据库。并且,用户数据库可以意指能够配置用户期待的背景声音或者图像的数据库。经由web在用户之间可以共享用户数据库。例如,图13是用于描述用于与用户共享用户数据库的过程的一个示例的图。用户能够将被保存在用户的移动终端100中的数据库上传到包括全局数据库的web服务器。并且,用户能够从web服务器的全局数据库中下载由不同用户上传的用户数据库。例如,参考图13,如果用户2至4的数据库被上传到全局数据库,则用户1能够下载并且使用用户2至3的数据库中的至少一个。特别地,移动终端100能够通过全局数据库更新用户数据库。
在确定匹配自然语言的意义的背景声音或者图像的反馈中,不强制使用被保存在存储器160中的背景声音或者图像数据库。对于另一实例,控制器180经由无线通信单元110访问全局数据库或者不同的终端,并且然后能够外部地接收匹配自然语言的意义的背景声音或者图像。特别地,控制器180经由网络连接接入外部数据库并且然后能够接收诸如背景声音、图像等等的反馈。
如在示例的描述中所提及的,在多个数据库被保存在存储器160中的情况下,控制器180能够根据数据库的优先级提取背景声音或者图像。例如,如果默认数据库的优先级比用户数据库的高,只有当从默认数据库不能提取通过句子单元匹配自然语言的意义的反馈时,尝试从用户数据库提取反馈。
为了使用户能够编辑用户数据库,控制器180可以控制被配置成编辑用户数据库的模板以被显示。在这样的情况下,模板可以包括索引项目、元数据项目、以及数据缓冲器项目。索引项目可以被提供以记录索引。并且,被链接到背景声音或者图像的词或者意义可以被记录在元数据项目中。此外,背景声音或者图像数据可以被记录在数据缓冲器项目中。
例如,在被记录在数据缓冲器项目中的背景声音是“雨声”的情况下,索引(例如,数据库中的序列)可以被记录在索引项目中,并且与“雨声”(例如,台风、雨、阵雨、多雨持续期等等)相关联的意义可以被记录在元数据项目中。
在使用模板编辑用户数据库中,控制器180能够支持复制功能、交换功能、添加功能、链接功能以及下载功能中的至少一个。复制功能可以被提供以从被保存在存储器160中的不同数据库中带来数据,并且交换功能可以被提供以与不同文件交换被记录在数据库中的背景 声音或者图像文件。添加功能可以被提供以添加没有被记录在数据库中的新的背景声音或者图像。链接功能可以被提供以通过与被保存在外部终端中的用户数据库的链接修改数据库的内容。并且,下载功能可以被提供以通过从全局数据库下载不同用户的数据库来配置用户数据库。
根据参考图4的前面的描述,在通过将句子单元的自然语言转换成声音已经创建合成声音[S402]之后,进行自然语言意义提取步骤S403和确定匹配自然语言意义的反馈的步骤S404。但是,对于步骤S403和步骤S404来说,不必要在步骤S402的完成之后。相反地,在步骤S403或者步骤S404已经结束之后,可以进行步骤S402,或者步骤S402和S403或者步骤S402和S404可以被同时执行。
因此,本发明的实施例提供各种效果和/或特征。
首先,本发明提供一种移动终端,通过该终端能够增强用户的便利。
特别地,虽然经由移动终端输出从将指定的文本转换成声音而产生的合成声音,但是匹配指定的文本的意义的反馈被输出,从而根据本发明的移动终端能够将文本意义有效地递送给用户。
本领域的技术人员将会理解,在没有脱离本发明的精神或者范围的情况下本发明能够被指定为其它形式。
另外,能够在程序记录介质中实现上述方法作为计算机可读代码。计算机可读介质可以包括存储了由计算机系统可读的数据的所有种类的记录设备。计算机可读介质可以包括例如ROM、RAM、CD-ROM、磁带、软盘、光学数据存储设备等,并且也包括载波型实现方式(例如,经由互联网的传输)。此外,计算机可以包括终端的控制器180。
本领域内的技术人员可以明白,在不偏离本发明的精神或范围的情况下,能够在本发明中进行各种修改和变化。因此,意图是本发明涵盖本发明的修改和变化,只要它们落在所附权利要求和其等同内容的范围内。

Claims (13)

1.一种移动终端,包括:
显示单元,所述显示单元被配置成通过句子单元显示文本;
音频输出模块,所述音频输出模块被配置成输出从将所述文本转换成声音而产生的合成声音;以及
控制器,所述控制器被配置成生成所述合成声音,提取所述文本的意义,并且控制匹配所述文本的意义的反馈在经由所述音频输出模块输出合成声音时被输出,
其中,所述反馈包括用作所述合成声音的背景声音的背景声音,以及
其中,当所述背景声音被输出时,所述控制器进一步被配置成:
控制伴随所述背景声音的输出的振动将被输出,
分析所述背景声音的声音波形,并且然后将具有大于阈值的声音波形的振幅的间隔设置为超过间隔,并且
控制所述振动以在经由所述音频输出单元输出超过间隔的所述声音波形时被输出。
2.根据权利要求1所述的移动终端,其中,如果与所述反馈相对应的核心词被包括在所述文本中,则所述控制器进一步被配置成,当所述合成声音中的核心词的输出开始时,控制所述反馈将被输出。
3.根据权利要求1所述的移动终端,其中,如果所述反馈的播放时间比所述合成声音的播放时间长,则所述控制器控制静默时段以被添加到在开始所述合成声音的输出之前的情况和在所述合成声音的输出的完成之后的情况中的至少一个。
4.根据权利要求3所述的移动终端,其中,添加了所述静默时段的合成声音的播放时间等于或者大于所述反馈的播放时间。
5.根据权利要求1所述的移动终端,其中,所述阈值包括所述声音波形的平均振幅。
6.根据权利要求1所述的移动终端,其中,所述控制器进一步被配置成基于所述阈值和所述超过间隔中的最大振幅之间的比率控制所述振动的输出强度将被调节。
7.根据权利要求5所述的移动终端,其中,所述振动的输出强度取决于如下公式:
如果
如果
并且
S t e p = 1 N M a x l e v e l &times; I n t ( G l o b a l _ M a x A m p T h r e s h o l d )
其中,Nlevel指示所述超过间隔中的振动强度水平,Int指示整数函数,Local_Max Amp指示所述超过间隔中的最大振幅;Threshold指示阈值,并且NMaxlevel指示可设置的最大振幅强度水平。
8.根据权利要求1所述的移动终端,其中,所述反馈包括显示匹配所述文本的意义的图像。
9.根据权利要求8所述的移动终端,其中,所述控制器进一步被配置成控制图像以在所述合成声音被输出时被显示为所述显示单元的背景屏幕。
10.根据权利要求1所述的移动终端,其中,所述控制器进一步被配置成控制所述反馈以改变所述显示单元的输出颜色或者调节所述显示单元的亮度的方式被输出。
11.根据权利要求1所述的移动终端,其中,所述反馈包括光源的闪烁。
12.根据权利要求11所述的移动终端,其中,所述光源包括相机闪光,所述相机闪光被配置成补充拍摄中的光。
13.一种控制移动终端的方法,所述方法包括下述步骤:
通过句子单元显示文本;
从将所述文本转换成声音产生合成声音;
提取所述文本的意义;
确定匹配所述文本的意义的反馈;
输出所述合成声音;以及
输出所述反馈同时输出所述合成声音,
其中,所述反馈包括用作所述合成声音的背景声音的背景声音,以及
其中,当所述背景声音被输出时,所述方法进一步包括:
控制伴随所述背景声音的输出的振动将被输出,
分析所述背景声音的声音波形,并且然后将具有大于阈值的声音波形的振幅的间隔设置为超过间隔,并且
控制所述振动以在经由所述移动终端的音频输出单元输出超过间隔的声音波形时被输出。
CN201310453278.XA 2012-09-24 2013-09-24 移动终端及其控制方法 Expired - Fee Related CN103680492B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2012-0105683 2012-09-24
KR1020120105683A KR101978209B1 (ko) 2012-09-24 2012-09-24 이동 단말기 및 이의 제어 방법

Publications (2)

Publication Number Publication Date
CN103680492A CN103680492A (zh) 2014-03-26
CN103680492B true CN103680492B (zh) 2017-03-01

Family

ID=49123616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310453278.XA Expired - Fee Related CN103680492B (zh) 2012-09-24 2013-09-24 移动终端及其控制方法

Country Status (4)

Country Link
US (1) US9401139B2 (zh)
EP (1) EP2712155B1 (zh)
KR (1) KR101978209B1 (zh)
CN (1) CN103680492B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101605347B1 (ko) * 2009-12-18 2016-03-22 삼성전자주식회사 휴대단말의 외부 출력 제어 방법 및 장치
US10013482B2 (en) * 2014-06-19 2018-07-03 International Business Machines Corporation Context-dependent evidence detection
US9652450B1 (en) * 2016-07-06 2017-05-16 International Business Machines Corporation Rule-based syntactic approach to claim boundary detection in complex sentences
CN108733341B (zh) * 2018-05-18 2021-09-14 出门问问信息科技有限公司 一种语音交互方法及装置
CN108833992A (zh) * 2018-06-29 2018-11-16 北京优酷科技有限公司 字幕显示方法及装置
CN112424853A (zh) * 2018-07-24 2021-02-26 谷歌有限责任公司 以对文本文档的音频回放进行补充的视觉内容为特点的文本到语音界面
CN109036373A (zh) * 2018-07-31 2018-12-18 北京微播视界科技有限公司 一种语音处理方法及电子设备
CN109119066A (zh) * 2018-09-30 2019-01-01 苏州浪潮智能软件有限公司 一种快速进行语音播放的方法
CN112750423B (zh) * 2019-10-29 2023-11-17 阿里巴巴集团控股有限公司 个性化语音合成模型构建方法、装置、系统及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6324511B1 (en) * 1998-10-01 2001-11-27 Mindmaker, Inc. Method of and apparatus for multi-modal information presentation to computer users with dyslexia, reading disabilities or visual impairment
CN1584979A (zh) * 2004-06-01 2005-02-23 安徽中科大讯飞信息科技有限公司 在语音合系统中将背景音与文本语音混合输出的方法
US7200560B2 (en) * 2002-11-19 2007-04-03 Medaline Elizabeth Philbert Portable reading device with display capability
CN101896803A (zh) * 2007-12-12 2010-11-24 诺基亚公司 用于从源数据到音频/视频数据的语义媒体转换的方法、设备和计算机程序产品

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3968277B2 (ja) * 2002-08-26 2007-08-29 株式会社日立製作所 メールサーバ、そのメールサーバを実現するためのプログラム及び携帯端末
DE10327239A1 (de) * 2003-06-17 2005-01-27 Opticom Dipl.-Ing. Michael Keyhl Gmbh Vorrichtung und Verfahren zum extrahieren eines Testsignalabschnitts aus einem Audiosignal
JP2005115896A (ja) * 2003-10-10 2005-04-28 Nec Corp 通信装置及び通信方法
US7163311B2 (en) * 2004-10-22 2007-01-16 Kramer James F Foodware having visual sensory stimulating or sensing means
JP3955881B2 (ja) * 2004-12-28 2007-08-08 松下電器産業株式会社 音声合成方法および情報提供装置
GB2441434B (en) * 2006-08-29 2010-06-23 David Charles Dewhurst Audiotactile vision substitution system
US10133372B2 (en) * 2007-12-20 2018-11-20 Nokia Technologies Oy User device having sequential multimodal output user interface
US9857872B2 (en) * 2007-12-31 2018-01-02 Apple Inc. Multi-touch display screen with localized tactile feedback
US20100152600A1 (en) * 2008-04-03 2010-06-17 Kai Sensors, Inc. Non-contact physiologic motion sensors and methods for use
US8378979B2 (en) * 2009-01-27 2013-02-19 Amazon Technologies, Inc. Electronic device with haptic feedback
KR101628782B1 (ko) * 2009-03-20 2016-06-09 삼성전자주식회사 휴대용 단말기에서 복수의 진동자를 이용한 햅틱 기능 제공방법 및 장치
US20110029106A1 (en) * 2009-07-30 2011-02-03 Sony Ericsson Mobile Communications Ab Method and arrangement in a mobile terminal
US8782556B2 (en) * 2010-02-12 2014-07-15 Microsoft Corporation User-centric soft keyboard predictive technologies
WO2012064918A2 (en) * 2010-11-12 2012-05-18 Semantic Compaction Systems Sequenced multi-meaning tactile symbols useable to produce synthetic plural word messages including words, phrases, and sentences
US20120229264A1 (en) * 2011-03-09 2012-09-13 Analog Devices, Inc. Smart linear resonant actuator control
JP5697521B2 (ja) * 2011-04-07 2015-04-08 京セラ株式会社 文字入力装置、文字入力制御方法および文字入力プログラム
US9405424B2 (en) * 2012-08-29 2016-08-02 Wolfram Alpha, Llc Method and system for distributing and displaying graphical items

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6324511B1 (en) * 1998-10-01 2001-11-27 Mindmaker, Inc. Method of and apparatus for multi-modal information presentation to computer users with dyslexia, reading disabilities or visual impairment
US7200560B2 (en) * 2002-11-19 2007-04-03 Medaline Elizabeth Philbert Portable reading device with display capability
CN1584979A (zh) * 2004-06-01 2005-02-23 安徽中科大讯飞信息科技有限公司 在语音合系统中将背景音与文本语音混合输出的方法
CN101896803A (zh) * 2007-12-12 2010-11-24 诺基亚公司 用于从源数据到音频/视频数据的语义媒体转换的方法、设备和计算机程序产品

Also Published As

Publication number Publication date
EP2712155B1 (en) 2018-08-08
EP2712155A2 (en) 2014-03-26
KR20140039502A (ko) 2014-04-02
KR101978209B1 (ko) 2019-05-14
EP2712155A3 (en) 2016-12-07
US20140088955A1 (en) 2014-03-27
CN103680492A (zh) 2014-03-26
US9401139B2 (en) 2016-07-26

Similar Documents

Publication Publication Date Title
CN103680492B (zh) 移动终端及其控制方法
US11715473B2 (en) Intuitive computing methods and systems
KR102222122B1 (ko) 감성음성 합성장치, 감성음성 합성장치의 동작방법, 및 이를 포함하는 이동 단말기
JP5843207B2 (ja) 直観的コンピューティング方法及びシステム
CN104182168B (zh) 移动终端及其控制方法
CN104049885B (zh) 移动终端和控制移动终端的方法
CN109947972A (zh) 缩略图生成方法及装置、电子设备、存储介质
KR101625884B1 (ko) 휴대 단말기 및 그 동작 제어방법
CN109657236B (zh) 引导信息获取方法、装置、电子装置及存储介质
CN107112010A (zh) 用于使用语法模型执行话音识别的方法和设备
CN102467343A (zh) 移动终端以及控制移动终端的方法
JP7240505B2 (ja) 音声パケット推薦方法、装置、電子機器およびプログラム
CN110321192A (zh) 一种呈现寄宿程序的方法与设备
CN105430494A (zh) 在播放视频的设备中识别视频中音频的方法和装置
CN110795007A (zh) 一种获取截图信息的方法及装置
CN108959274A (zh) 一种应用程序的翻译方法及服务器
CN111428522B (zh) 翻译语料生成方法、装置、计算机设备及存储介质
US20140189554A1 (en) Mobile terminal and control method thereof
CN112632445A (zh) 网页播放方法、装置、设备及存储介质
CN113220590A (zh) 语音交互应用的自动化测试方法、装置、设备及介质
CN109726379B (zh) 内容项编辑方法、装置、电子设备及存储介质
WO2021185174A1 (zh) 一种电子卡的选取方法、装置、终端以及存储介质
GB2445279A (en) System and method for improving the efficiency, comfort and/or reliability in operating systems.
CN114328815A (zh) 文本映射模型的处理方法、装置、计算机设备及存储介质
WO2024103775A1 (zh) 答案生成方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170301

Termination date: 20190924