CN101605171B - 移动终端及其中的文本校正方法 - Google Patents

移动终端及其中的文本校正方法 Download PDF

Info

Publication number
CN101605171B
CN101605171B CN2009101287987A CN200910128798A CN101605171B CN 101605171 B CN101605171 B CN 101605171B CN 2009101287987 A CN2009101287987 A CN 2009101287987A CN 200910128798 A CN200910128798 A CN 200910128798A CN 101605171 B CN101605171 B CN 101605171B
Authority
CN
China
Prior art keywords
speech
candidate word
selected speech
portable terminal
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009101287987A
Other languages
English (en)
Other versions
CN101605171A (zh
Inventor
申宗壕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN101605171A publication Critical patent/CN101605171A/zh
Application granted granted Critical
Publication of CN101605171B publication Critical patent/CN101605171B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/1613Constructional details or arrangements for portable computers
    • G06F1/1615Constructional details or arrangements for portable computers with several enclosures having relative motions, each enclosure supporting at least one I/O or computing function
    • G06F1/1624Constructional details or arrangements for portable computers with several enclosures having relative motions, each enclosure supporting at least one I/O or computing function with sliding enclosures, e.g. sliding keyboard or display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/1613Constructional details or arrangements for portable computers
    • G06F1/1626Constructional details or arrangements for portable computers with a single-body enclosure integrating a flat display, e.g. Personal Digital Assistants [PDAs]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/1613Constructional details or arrangements for portable computers
    • G06F1/1633Constructional details or arrangements of portable computers not specific to the type of enclosures covered by groups G06F1/1615 - G06F1/1626
    • G06F1/1637Details related to the display arrangement, including those related to the mounting of the display in the housing
    • G06F1/1643Details related to the display arrangement, including those related to the mounting of the display in the housing the display being associated to a digitizer, e.g. laptops that can be used as penpads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/1613Constructional details or arrangements for portable computers
    • G06F1/1633Constructional details or arrangements of portable computers not specific to the type of enclosures covered by groups G06F1/1615 - G06F1/1626
    • G06F1/1684Constructional details or arrangements related to integrated I/O peripherals not covered by groups G06F1/1635 - G06F1/1675
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. SMS or e-mail
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/12Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/22Details of telephonic subscriber devices including a touch pad, a touch sensor or a touch detector
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/60Details of telephonic subscriber devices logging of communication history, e.g. outgoing or incoming calls, missed calls, messages or URLs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/70Details of telephonic subscriber devices methods for entering alphabetical characters, e.g. multi-tap or dictionary disambiguation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种移动终端及其中的文本校正方法。移动终端包括:语音接收单元,被配置为接收输入语音;控制器,被配置为将接收的输入语音转换为文本;显示器,被配置为显示转换的文本;和输入单元,被配置为选择所显示的转换文本中包括的词。此外,该控制器进一步被配置为,控制显示器按照如下安排显示与所选词相对应的多个可能候选词,即利用与所选词的接近度显示相应的显示候选词,该接近度基于相应的候选词与所选词的相似程度。

Description

移动终端及其中的文本校正方法
技术领域
本发明涉及一种用于允许用户容易地编辑或改变在终端上显示的语音转换文本的移动终端及相应方法。
背景技术
除了基本呼叫服务之外,移动终端现在还提供许多额外服务。例如,用户现在可以接入因特网、玩游戏、观看视频、听音乐、捕捉图像和视频、记录音频文件等。移动终端现在还提供广播节目,使得用户可以观看电视剧、体育节目、视频等。
一些移动终端还包括语音识别技术,允许用户向终端输入诸如“呼叫家庭”的语音命令。该终端然后呼叫与存储在终端的存储器中的家庭电话薄项相对应的号码。然而,背景语音识别技术受到限制并且常常不能正确地解释用户输入的语音指令。
发明内容
因此,本发明的一个目的在于解决上述的和其他的缺陷。
本发明的另一目的在于提供一种用于允许用户容易地编辑和改变在终端上显示的语音转换文本的移动终端及相应方法。
本发明的又一目的在于提供一种用于显示具有与所选或者曲解的词相似的发音的候选词的移动终端及相应方法。
本发明的还一目的在于提供一种用于按照如下安排显示与所选词相对应的多个可能候选词的移动终端及相应方法:利用与所选词的接近度显示相应的显示候选词,该接近度基于相应的候选词与所选词的相似程度。
为了实现这些和其他优点并且根据本发明的目的,如此处体现的和广泛描述的,本发明在一个方面提供了一种移动终端,包括:语音接收单元,被配置为接收输入语音;控制器,被配置为将所接收的输入语音转换为文本;显示器,被配置为显示所转换的文本;和输入单元,被配置为选择在所显示的转换文本中包括的词。此外,该控制器进一步被配置为控制显示器按照如下安排显示与所选词相对应的多个可能候选词:利用与所选词的接近度显示相应的显示候选词,该接近度基于相应的候选词与所选词的相似程度。本发明还提供了一种控制移动终端的相应方法。
在另一方面,本发明提供了一种移动终端,包括:语音接收单元,被配置为接收输入语音;控制器,被配置为将所接收的输入语音转换为文本;显示器,被配置为显示所转换的文本;和输入单元,被配置为选择在所显示的转换文本中包括的词。此外,该控制器进一步被配置为控制语音接收单元接收请求所选词的编辑操作的新的输入语音指令,并且控制显示器基于所接收的新的输入语音指令显示用于编辑所选词的编辑窗口。本发明还提供了一种控制移动终端的相应方法。
根据下面结合附图对本发明的详细描述,本发明的前面的和其他的目的、特征、方面和优点将变得更加明显。根据下文给出的详细描述,本发明的适用性的进一步范围将变得明显。然而,应当理解,详细描述和具体示例在指出本发明的优选实施例的同时,仅以说明的目的给出,因为根据该详细描述,在本发明的精神和范围内的各种改变和修改对于本领域的技术人员将变得明显。
附图说明
被包括用于提供本发明的进一步理解并且并入本说明书并构成本说明书的一部分的附图,说明了本发明的实施例并且与该描述一起用于解释本发明的原理。
在附图中:
图1是示出根据本发明的一个实施例的移动终端的框图;
图2是根据本发明的实施例的移动终端的前立体图;
图3是图2中所示的移动终端的后立体图;
图4是可与根据本发明的实施例的移动终端一同操作的通信系统的概略图;
图5是说明根据本发明的实施例的移动终端中的菜单语音控制方法的流程图;
图6A包括说明根据本发明的实施例的移动终端中的用于激活语音识别功能的方法的显示屏的概略图;
图6B和图6C包括说明根据本发明的实施例的移动终端中的用于输出帮助信息的方法的显示屏的概略图;
图7A是说明根据本发明的实施例的移动终端中的用于识别语音命令的方法的流程图;
图7B是说明根据本发明的实施例的移动终端中的用于识别语音的方法的概略图;
图8包括说明根据本发明的实施例的移动终端中的用于显示与语音识别率协调的菜单的方法的显示屏的概略图;
图9包括说明根据本发明的实施例的移动终端中的用于识别语音命令的方法的显示屏的概略图;
图10是说明根据本发明的实施例的移动终端中的用于识别语音命令的数据库组织的概略图;
图11是说明根据本发明的实施例的移动终端中的文本校正方法的流程图;
图12A和图12B包括说明根据本发明的实施例的用于选择任意词以便校正在移动终端的屏幕上显示的文本的方法的显示屏的概略图;
图13A和图13B包括说明根据本发明的实施例的用于显示关于来自在移动终端的屏幕上显示的文本的特定选择词的候选词的方法的显示屏的概略图;
图14A和图14B包括说明根据本发明的实施例的用于将在移动终端的屏幕上显示的文本改变为从候选词列表选择的候选词的方法的显示屏的概略图;
图15是说明根据本发明的另一实施例的移动终端中的文本校正方法的流程图;
图16A和图16B包括说明根据本发明的实施例的用于编辑在移动终端上显示的特定词的方法的显示屏的概略图;以及
图17A和图17B包括说明根据本发明的另一实施例的用于编辑在移动终端上显示的特定词的方法的显示屏的概略图。
具体实施方式
现将详细参考本发明的优选实施例,其示例在附图中得到说明。
图1是根据本发明的实施例的移动终端100的框图。如所示出的,移动终端100包括具有一个或多个组件的无线通信单元110,该无线通信单元110允许在移动终端100和该移动终端所处的无线通信系统或网络之间的无线通信。
例如,无线通信单元110包括广播接收模块111,该广播接收模式111经由广播信道从外部广播管理实体接收广播信号和/或广播关联信息。该广播信道可以包括卫星信道和地面信道。
此外,广播管理实体通常是指传送广播信号和/或广播关联信息的系统。广播关联信息的示例包括与广播信道、广播节目、广播服务提供商等相关联的信息。例如,广播关联信息可以包括数字多媒体广播(DMB)系统的电子节目指南(EPG)和手持数字视频广播(DVB-H)系统的电子服务指南(ESG)。
此外,广播信号可被实现为TV广播信号、无线电广播信号和数据广播信号等。广播信号可以进一步包括组合有TV或无线电广播信号的广播信号。
广播接收模块111还被配置为接收从各种类型的广播系统传送的广播信号。例如,这样的广播系统包括地面数字多媒体广播(DMB-T)系统、卫星数字多媒体广播(DMB-S)系统、手持数字视频广播(DVB-H)系统、被称为媒体前向单链路
Figure G2009101287987D00051
的数据广播系统和地面集成服务数字广播(ISDB-T)系统等。接收多播信号也是可能的。此外,由广播接收模块111接收的数据可以被存储在诸如存储器160的适当设备中。
无线通信单元110还包括移动通信模块112,该移动通信模块112向一个或多个网络实体(例如基站、节点B)传送无线信号/从其接收无线信号。这样的信号可以表示音频、视频、多媒体、控制信令和数据等。
还包括支持移动终端接入因特网的无线因特网模块113。该模块113可以内部或外部耦接到终端。无线通信单元110还包括帮助相对短程的通信的短程通信模块114。用于实现该模块的适当技术包括射频识别(RFID)、红外数据关联(IrDA)、超宽带(UWB)以及通常被称为蓝牙和紫蜂(Zigbee)的联网技术,仅列出了小许。
无线通信单元110中还包括位置定位模块115,该位置定位模块115识别或以其他方式获得移动终端100的位置。位置定位模块115可以使用与相关联的卫星协作的全球定位系统(GPS)组件、网络组件及其组合实现。
此外,如图1中示出的,移动终端100还包括向移动终端100提供音频或视频信号的音频/视频(A/V)输入单元120。如所示出的,A/V输入单元120包括照相机121和麦克风122。照相机121接收和处理静态图片或视频的图像帧。
此外,当便携式设备处于特定模式中时,诸如处于电话呼叫模式、记录模式和语音识别模式时,麦克风122接收外部音频信号。接收的音频信号然后被处理并转换为数字数据。而且,便携式设备,并且具体地,A/V输入单元120,通常包括杂类噪声移除算法以移除在接收外部音频信号的过程中生成的噪声。此外,A/V输入单元120产生的数据可被存储在存储器160中,被输出单元150利用,或经由通信单元110的一个或多个模块传送。如果需要,可使用两个或更多麦克风和/或照相机。
移动终端100还包括响应于用户对相关联的输入设备的操作生成输入数据的用户输入单元130。这样的设备的示例包括键盘、薄膜开关(dome switch)、触摸板(例如,静压/电容)、滚轮及滚动开关。一个特定示例是其中用户输入单元130被配置为与触摸屏显示器协作的触摸板,这将在下文中更详细描述。
感测单元140也包括在移动终端100中并提供移动终端100的各方面的状态测量。例如,感测单元140可检测移动终端100的打开/闭合状态、移动终端100的组件(例如,显示器及键盘)的相对定位、移动终端100或移动终端100的组件的位置变化、存在或不存在与移动终端100的用户接触、移动终端100的方向或加速/减速等。
作为一个示例,当移动终端100是滑盖式移动终端时,感测单元140可感测移动终端100的滑动部分是打开还是闭合。其它示例包括感测单元140感测存在或不存在电源190提供的电力、在接口单元170与外部设备之间存在或不存在耦接或其它连接等。
此外,接口单元170经常被实现为将移动终端100与外部设备耦接。典型的外部设备包括有线/无线头戴式耳机、外部充电器、电源、被配置为存储数据(例如音频、视频、图片等)的存储设备、耳机及麦克风等。此外,接口单元170可被使用有线/无线数据端口、卡槽(例如,用于耦接至存储卡、定户身份模块(SIM)卡、用户身份模块(UIM)卡、可拆卸用户身份模块(RUIM)卡等)、音频输入/输出端口及视频输入/输出端口配置。
输出单元150通常包括支持移动终端100的输出要求的各种组件。移动终端100还包括以视觉方式显示与移动终端100相关联的信息的显示模块151(下文中称为显示器151)。例如,如果移动终端100正以电话呼叫模式工作,则显示器151将通常提供包括与拨打、进行和终止电话呼叫相关联的信息的用户界面或图形用户界面。作为另一示例,如果移动终端100正处于视频呼叫模式或排照模式,则显示器151可另外或可替代地显示与这些模式相关联的图像。
此外,显示器151还优选地包括与诸如触摸板的输入设备协作工作的触摸屏。此配置允许显示器151起输出设备和输入设备两者的作用。此外,显示器151可使用包括例如如下的显示技术实现:液晶显示器(LCD)、薄膜晶体管液晶显示器(TFT-LCD)、有机发光二极管显示器(OLED)、柔性显示器和三维显示器。
移动终端100还可包括一个或多个这样的显示器。双显示器实施例的示例是其中一个显示器被配置为内部显示器(当终端处于打开位置时可见)及第二个显示器被配置为外部显示器(在打开和闭合位置均可见)。
图1进一步示出具有支持移动终端100的音频输出要求的音频输出模块152的输出单元150。音频输出模块152通常使用一个或多个扬声器、蜂鸣器、其它音频产生设备、及其组合来实现。此外,音频输出模块152在各种模式下起作用,包括呼叫接收模式、呼叫拨打模式、记录模式、语音识别模式及广播接收模式。在操作期间,音频输出模块152输出与特定功能(例如,收到呼叫、收到消息及错误)相关的音频。
此外,输出单元150进一步被示出为具有警报器153,其被用于发信号或以其它方式识别与移动终端100相关联的特定事件的发生。典型的事件包括收到呼叫、收到消息和收到用户输入。这样的输出的示例包括向用户提供触感(例如,震动)。例如,警报器153可被配置为响应于移动终端100接收到呼叫或消息而震动。
作为另一示例,响应于在移动终端100接收到用户输入而由警报器153提供震动,从而提供触觉反馈机制。此外,输出单元150的组件提供的各种输出可分别执行,或这样的输出可使用这样的组件的任意组合执行。
此外,存储器160通常被用来存储各种类型的数据,以支持移动终端100的处理、控制和存储需求。这样的数据的示例包括用于在移动终端100上运行的应用的程序指令、呼叫历史、联系数据、电话簿数据、消息、图片、视频等。
此外,图1中所示的存储器160可使用合适的易失性和非易失性存储器或存储设备的任意类型及其组合实现,所述易失性和非易失性存储器或存储设备包括随机存取存储器(RAM)、静态随机存取存储器(SRAM)、电可擦可编程只读存储器(EEPROM)、可擦可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、闪存、磁盘或光盘、卡类存储器、或其它类似存储器或数据存储设备。
终端100还包括通常控制移动终端100的全部操作的控制器180。例如,控制器180执行与语音呼叫、数据通信、即时消息通信、视频呼叫、照相机操作和记录操作相关联的控制和处理。如图1所示,控制器180还可包括用来提供多媒体回放功能的多媒体模块181。多媒体模块181可被配置为控制器180的一部分,或可作为单独组件实现。此外,电源190为便携式设备提供各种组件使用的电力。所提供的电力可以是内部电力、外部电力或其组合。
下面,图2是根据本发明的实施例的移动终端100的前侧视图。如图2所示,移动终端100包括被配置为可滑动地与第二机身205协作的第一机身200。图1中描述的用户输入单元130可包括诸如功能键210的第一输入单元、诸如键盘215的第二输入单元以及诸如侧键245的第三输入单元。
功能键210与第一机身200相关联,键盘215与第二机身205相关联。键盘215包括各种按键(例如,数字、字符及符号)以使用户能拨打电话、准备文本或多媒体消息以及以其它方式操作移动终端100。
此外,第一机身200在打开和闭合位置之间相对于第二机身205滑动。在闭合位置,第一机身200以诸如键盘215基本上或完全被第一机身200遮盖的方式置于第二机身205之上。在打开位置,用户能够访问键盘215、显示器151以及功能键210。功能键210便于用户输入诸如开始、停止和滚动命令的命令。
此外,移动终端100可以待机模式(例如,能够接收呼叫或消息,接收并响应网络控制信令)或活动呼叫模式操作。典型地,移动终端100在闭合位置时处于待机模式,在打开位置时处于活动模式。然而,模式配置可根据要求或需要改变。
此外,第一机身200由第一外壳220和第二外壳225形成,第二机身205由第一外壳230和第二外壳235形成。第一及第二外壳优选地由诸如注模塑料的合适脊材料形成,或使用诸如不锈钢(STS)及钛(Ti)的金属材料形成。
如果需要,可在第一机身200和第二机身205中的一个或两个的第一外壳和第二外壳之间提供一个或多个中间外壳。此外,第一机身200和第二机身205通常尺寸被确定为容纳用于支持移动终端100的操作的电子组件。
而且,第一机身200包括照相机121和被配置为扬声器、相对显示器151定位的音频输出单元152。照相机121也可以以选择性地相对第一机身200定位(例如,转动、旋转等)的方式构建。
此外,功能键210位于邻近显示器151的下侧。如上所述,显示器151可被实现为LCD或OLED。显示器151也可被配置为具有下垫触摸板的触摸屏,触摸板响应于与触摸屏的用户接触(例如,手指、触笔等)生成信号。
而且,第二机身205包括位于邻近键盘215处的麦克风122以及沿着第二机身205侧面定位的作为一种用户输入单元的侧键245。优选地,侧键245被配置为热键,以使得侧键245与移动终端100的特定功能相关联。如所示,接口单元170定位在邻近侧键245处,以电池形式的电源190位于第二机身205的下部。
图3是图2所示的移动终端100的后侧视图。如图3所示,第二机身205包括照相机121、相关闪存250及反射镜255。闪存250与第二机身205的照相机121协同操作,反射镜255用于在自拍模式帮助用户定位照相机121。此外,第二机身205的照相机121所面对的方向与图2所示的第一机身200的照相机121所面对的方向相反。
此外,第一机身200与第二机身205的照相机121中的每一个可具有相同或不同的性能。例如,在一个实施例中,第一机身200的照相机121以比第二机身205的照相机121相对低的分辨率操作。这样的安排在例如其中反向链接带宽性能可能是有限的视频会议呼叫期间工作良好。此外,第二机身205的照相机121的相对较高的分辨率(图3)对于获取用于以后使用的高质量照片是有用的。
第二机身205还包括被配置为扬声器的位于在第二机身205上侧的音频输出模块152。第一机身200和第二机身205的音频输出模块也可一起协作来提供立体声输出。而且,这些音频输出模块中的任何一个或两者可被配置成作为扩音器来操作。
终端100还包括位于第二机身205的上端的广播信号接收天线260。天线260与广播接收模块111(图1)协同起作用。天线260也可以是固定的或被配置成收缩在第二机身205内。此外,第一机身200的后侧包括可与位于第二机身205的前侧的相应滑动模块滑动地耦接的滑动模块265。
此外,第一机身200和第二机身205的各种组件的所示布置可根据要求或需要修改。例如,一个机身上的某些或所有组件可替代地实现在另一机身上。此外,这样的组件的位置和相对定位可定位在与代表图所示的那些位置不同的位置。
此外,图1-3的移动终端100可被配置为在经由帧或分组传送数据的包括无线和有线通信系统、卫星通信系统的通信系统内操作。这样的通信系统利用不同的无线接口和/或物理层。
通信系统利用的这样的无线接口的示例包括例如频分多址(FDMA)、时分多址(TDMA)、码分多址(CDMA)、通用移动通信系统(UMTS)、UMTS的长期演进(LTE)以及全球移动通信系统(GSM)。仅作为非限定性示例,进一步的描述将涉及CDMA通信系统,但这样的教导同样适用于其它系统类型。
下面,图4示出了具有多个移动终端100、多个基站270、多个基站控制器(BSC)275和移动交换中心(MSC)280的CDMA无线通信系统。
MSC 280被配置为与公共交换电话网(PSTN)290相接口,MSC280还被配置为与BSC 275相接口。此外,BSC 275经由回程线耦接至基站270。此外,回程线可被依据若干接口中的任意一种配置,这些接口包括例如E1/T1、ATM、IP、PPP、帧中继、HDSL、ADSL或xDSL。此外,该系统可包括两个以上BSC 275。
而且,每个基站270可包括一个或多个区段(sector),每个区段具有全向天线或指向放射状远离基站270的特定方向的天线。替代地,每个区段可包括用于分集接收的两个天线。此外,每个基站270可被配置为支持多个频率分配,每个频率分配具有特定频谱(例如,1.25MHz,5MHz)。
区段与频率分配的交会可以被称为CDMA信道。基站270也可被称为基站收发器子系统(BTS)。在有些情况下,术语“基站”可用来统称BSC 275以及一个或多个基站270。
基站270也可被表示为“信元站点”。替代地,给定基站270的各个区段可被称为信元站点。此外,地面数字多媒体广播(DMB)发射器295被示为正向在该系统中操作的移动终端100进行广播。
此外,移动终端100的广播接收模块111(图1)典型地被配置为接收DMB发射器295传送的广播信号。对如上所述的其它种类的广播及多播信令可实现类似布置。
图4还示出了几个全球定位系统(GPS)卫星300。这样的卫星便于定位某些或所有移动终端100的位置。在图4中,示出了两颗卫星,但是位置信息可以通过更多或更少卫星获取。
此外,移动终端100的位置定位模块115(图1)典型地被配置为与卫星300协作来获取所期望的位置信息。然而,可替代地实现其它类型的位置检测技术,诸如可以除GPS定位技术之外或代替GPS定位技术使用的定位技术。某些或所有GPS卫星300可替代地或另外被配置为提供卫星DMB传输。
此外,在无线通信系统的操作期间,基站270从各种移动终端100接收成组的反向链路信号。移动终端100还进行呼叫、发消息或其它通信。
此外,给定基站270接收到的每个反向链路信号在该基站270内被处理,并将结果数据转发到相关联的BSC 275。BSC 275提供呼叫资源分配以及包括基站270间软切换的移动性管理功能。
此外,BSC 275还将所接收的数据路由至MSC 280,其提供附加的路由服务用于与PSTN 290接口。类似地,PSTN与MSC 280接口,MSC 280与BSC 275接口。BSC 275还控制基站270将成组的前向链路信号传送至移动终端100。
在下面的描述中,相对各种实施例解释可应用于上述配置的移动终端100的控制方法。然而,下述实施例可独立实现或通过其组合实现。此外,在下面的描述中,假定显示器151包括触摸屏。
根据本发明的移动终端被配置为使得用于语音识别的算法和用于话音到文本转换(STT)的算法被存储在存储器160中。此外,语音识别功能和STT功能一起协同操作以便将用户的语音转换成文本格式。所转换的文本还可以被输出在终端的执行屏幕上。因此,用户可以通过向终端讲话来执行诸如生成用于文本消息或邮件的文本的功能。控制器180还可以激活语音识别功能并且自动地驱动STT功能。
下面,图5是说明根据本发明的实施例的用于移动终端的菜单语音控制方法的流程图。如图5中所示,控制器180确定语音识别功能是否已被激活(S101)。此外,语音识别功能可以通过用户选择移动终端上的硬件按钮或者显示器151上显示的软触摸按钮而激活。用户还可以通过操纵显示器151上显示的特定菜单、通过生成特定声音或声效、通过短程或长程无线信号或者通过诸如手势或体态的用户身体信息来激活语音识别功能。
更详细地,特定声音或声效可以包括级别大于特定级别的碰撞声音。此外,可以简单地使用声音级别检测算法来检测特定声音或声效。此外,声音级别检测算法优选地比语音识别算法简单,并且因此消耗较少的移动终端资源。而且,声音级别检测算法(或电路)可以独立于语音识别算法或电路实现,或者可被实现为指定语音识别算法的某些功能。
此外,可以通过无线通信单元110接收无线信号,并且可以通过感测单元140接收用户的手势或体态。因此,在本发明的实施例中,无线通信单元110、用户输入单元130和感测单元140可被称为信号输入单元。此外,语音识别功能也可以通过相似的方式终止。
由于用户更加了解他们将要使用语音命令来控制终端,因此用户物理地激活语音识别功能是特别有利的。也就是说,由于用户须首先执行终端的物理操纵,因此他或她直观地识别他们正要将语音命令或指令输入到终端中,并且因此更加清楚或缓慢地讲话,由此激活特定的功能。因此,由于用户更加清楚或缓慢地讲话,因此例如准确地识别语音指令的概率增加。也就是说,在本发明的实施例中,语音识别功能的激活是通过对终端上的按钮的物理操纵来执行的,而非通过对终端讲话来激活语音识别功能。
此外,控制器180可以基于用户触摸触摸屏的特定按钮或部分的次数、用户触摸触摸屏的特定按钮或部分的时长等,开始或终止语音识别功能的激活。用户还可以使用本发明提供的适当的菜单选项,设定控制器180如何激活语音识别功能。例如,用户可以选择终端上的菜单选项,该菜单选项包括1)基于选择语音激活按钮的次数X设定语音识别的激活,2)基于选择语音激活按钮的时间量X设定语音识别的激活,3)当选择按钮X和Y时设定语音识别的激活,等。然后用户可以输入X和Y的值以可变地设定控制器180如何确定语音激活功能被激活。因此,根据本发明的实施例,用户主动参与其自己的移动终端的语音激活功能,这增加了控制器180将确定与用户的语音指令相对应的正确功能的概率,并且允许用户根据其需要定制语音激活功能。
控制器180还可以在指定按钮被触摸或选择时保持语音识别功能的激活状态,并且在指定按钮被释放时停止语音识别功能。替代地,控制器180可以在指定按钮被触摸或选择之后将语音识别功能的激活保持预定的时间段,并且在预定的时间段结束时停止或终止语音识别功能。在另一实施例中,控制器180可以在使语音识别功能保持激活状态的同时将接收的语音指令存储在存储器160中。
此外,如图5中所示,对与终端上的特定功能或菜单相关的信息,指定用作用于识别语音命令的含意的参考的数据库域(S102)。例如,指定的数据库域可以是与当前在显示器151上显示的菜单相关的信息,或者与一个显示菜单的子菜单相关的信息。此外,由于指定了数据库域,因此提高了对输入语音命令的识别率。域的示例包括电子邮件域、接收呼叫域和多媒体域等。
而且,与子菜单相关的信息可被配置为数据库中的数据。例如,该信息可被配置为关键词的形式,并且多个信息可以对应于一个功能或菜单。此外,数据库可以是根据信息的特征的多个数据库,并且可以被存储在存储器160中。
此外,数据库中的信息可以有利地通过学习过程被更新或翻新。各个数据库的每个域也可以被指定为与当前输出的功能或菜单相关的域,以便增强对语音命令的识别率。该域还可以随着菜单步骤继续进行而改变。
一旦激活了语音识别功能(S101中是)并且指定了域(S102),则控制器180确定用户是否已输入语音命令(S103)。当控制器180确定用户已输入语音命令(S103中是)时,控制器180基于特定数据库分析通过麦克风122输入的语音命令或指令的上下文和内容,由此判断语音命令的含意(S104)。
此外,控制器180可以基于所访问的域的语言模型和声学模型确定语音指令或命令的含意。更详细地,语言模型涉及词本身并且声学模型对应于说出词的方式(例如,所说的词或短语的频率分量)。使用语言和声学模型以及特定域和移动终端100的状态,控制器180可以有效地确定输入的语音指令或命令的含意。
此外,当控制器180将输入的语音命令存储在存储器160中时,控制器180可以在用户释放语音识别功能的激活时立即开始用于判断输入的语音命令的含意的过程,或者可以在输入语音命令时同时执行语音激活功能。
此外,如果语音命令未完全输入(S103中否),则控制器180可以仍然执行其他功能。例如,如果用户通过触摸菜单选项等执行另一动作,或者按压终端上的按钮(S109中是),则控制器180执行相应的所选功能(S110)。
此外,在在步骤104中控制器180确定输入的语音命令的含意之后,控制器180输出该含意的结果值(S105)。也就是说,该结果值可以包括用于执行与对应于所确定的含意的功能或服务相关的菜单、用于控制移动终端的特定组件等的控制信号。该结果值还可以包括用于显示与所识别的语音命令相关的信息的数据。
控制器180还可以请求用户确认输出的结果值是准确的(S106)。例如,当语音命令具有低识别率或者被确定为具有多个含意时,控制器180可以输出与各个含意相关的多个菜单,并且然后执行由用户所选择的菜单(S107)。而且,控制器180可以询问用户是否执行具有高识别率的特定菜单,并且然后根据用户的选择或响应执行或显示相应的功能或菜单。
此外,控制器180还可以输出要求用户选择特定的菜单或选项的语音消息,所述菜单或选项诸如是“您是否希望执行消息撰写功能?请用是或否答复。”然后,控制器180基于用户的响应执行或不执行与该特定菜单或选项相对应的功能。如果用户在特定的时间段(例如五秒)内没有响应,则控制器180也可以立即执行该特定菜单或选项。也就是说,如果不存在来自用户的响应,则控制器180可以通过将无响应判断为肯定回答,自动地执行功能或菜单。
也就是说,通过再次接收语音命令输入,或者通过显示具有大于特定级别的识别率的多个菜单或者可被判断为具有相似含意的多个菜单,可以执行错误处理步骤(S108)。用户然后可以选择多个菜单中的一个菜单。而且,当具有大于特定级别的识别率的功能或菜单的数目小于预设数目(例如两个)时,控制器180可以自动地执行相应的功能或菜单。
下面,图6A是示出根据本发明的实施例的用于为移动终端激活语音识别功能的方法的概略图。如显示屏410中所示,用户可以通过触摸软按钮411激活语音识别功能。用户还可以通过释放软按钮411终止语音识别功能。更详细地,用户可以通过触摸软按钮411激活语音识别功能并且继续触摸软按钮411,或者硬按钮412,直至完成语音指令。也就是说,当已完成语音指令时,用户可以释放软按钮411或硬按钮412。因此,使控制器180了解何时将输入语音指令以及语音指令何时完成。如上文讨论的,由于用户直接牵涉该确定过程,因此增加了输入的语音命令的解释的准确性。
例如,控制器180还可被配置为在用户首次触摸软按钮411时识别语音激活特征的开始,并且然后在用户触摸软按钮411两次时识别出语音指令已完成。其他的选择方法也是可以的。此外,如图6A中的显示屏410中所示,不是使用软按钮411,可以通过操纵终端上的硬按钮412执行语音激活和去激活。
此外,显示屏410中所示的软按钮411可以是单个软按钮,用户按压或释放该软按钮来激活/去激活语音识别功能,或者可以是菜单按钮,当该菜单按钮被选择时产生菜单列表,诸如“1.开始语音激活,2.停止语音激活”。软按钮411也可以在例如待机状态期间显示。
在另一示例中,并且如显示屏420中所示,用户还可以通过触摸屏幕的任意位置激活和去激活语音识别功能。显示屏430说明了另一示例,其中用户通过产生大于特定级别的特定声音或声效来激活和去激活语音识别功能。例如,用户可以拍手来产生这样的碰撞声音。
因此,根据本发明的实施例,语音识别功能可被以两种模式实现。例如,语音识别功能被实现为在第一模式中用于检测大于特定级别的特定声音或声效,而在第二模式中用于识别语音命令和确定该语音命令的含意。如果在第一模式中声音或声效大于特定级别,则激活第二模式,由此识别语音命令。
显示屏440说明了用户激活和去激活语音识别功能的另一方法。在该示例中,控制器180被配置为将用户的身体移动解释为开始和停止语音激活功能。例如,并且如显示屏440中所示,控制器180可被配置为将用户使其手向显示器移动解释为激活语音识别功能的指令,并且将用户使其手远离显示器移动解释为终止语音激活功能的指令。短程或长程无线信号也可以被用来开始和停止语音识别功能。
因此,根据本发明的实施例,由于开始和停止语音激活功能,因此不连续执行语音识别功能。也就是说,当语音识别功能连续保持在激活状态时,移动终端上的资源量相比于本发明的实施例增加。
此外,如上文参考图5讨论的,当语音识别功能被激活时,控制器180将用作用于语音命令识别的参考的特定数据库的域指明为与显示器151上的菜单列表相关的域。然后,如果从该菜单列表选择或执行特定菜单,则该数据库的域可被指定为与所选菜单或特定菜单的子菜单相关的信息。
此外,当通过语音命令或触摸输入选择或执行特定菜单时,控制器180可以以语音消息或者弹出窗口或气球的形式输出与特定菜单的子菜单相关的帮助信息。例如,如图6B中所示,当用户经由触摸或语音操作选择“多媒体菜单”时,控制器180将与“多媒体菜单”的子菜单(例如,广播、照相机、文本浏览器等)相关的信息显示为气球形状的帮助信息441。替代地,控制器180可以输出包括帮助信息的语音信号442。用户然后可以使用语音命令或者通过触摸操作选择所显示的帮助选项中的一个。
图6C说明了用户使用其身体移动(在该示例中,用户的手势)选择菜单项的实施例。更详细地,当用户移动其手指接近菜单项443时,控制器180显示与菜单443相关的子菜单444。控制器180可以经由例如感测单元140识别用户的身体移动信息。此外,所显示的帮助信息可被显示为,具有根据用户的距离控制的透明度或亮度。也就是说,当用户的手变得越近时,所显示的项可以越高亮。
如上文讨论的,控制器180可被配置为基于各种不同的方法确定语音识别功能的开始和停止。例如,用户可以选择/操纵软或硬按钮、触摸触摸屏上的任意位置等。控制器180还可以将语音识别功能的激活保持预定的时间量,并且然后在预定的时间量结束时自动地结束该激活。而且,控制器180可以仅在执行特定按钮或触摸操作时保持激活,并且然后在释放输入时自动地结束激活。控制器180还可以在特定的时间量内未输入语音命令时结束激活过程。
下面,图7A是示出根据本发明的实施例的移动终端中的用于识别语音命令的方法的流程图。参考图7A,当语音识别功能被激活时,控制器180将可以用作用于语音命令识别的参考的数据库域指定为与显示器151上显示的菜单相关的域、菜单的子菜单、或者与当前执行的功能或菜单相关的域(S201)。用户还使用精确的菜单名称或者使用自然语言(例如,说英语)输入语音命令(S202)。
控制器180然后将输入的语音命令存储在存储器160中(S203)。此外,当语音命令被输入在指明的域下时,控制器180通过使用语音识别算法基于所指定的域分析语音命令的上下文和内容。而且,语音命令可被转换为文本类型的信息用于分析(S204),并且然后存储在存储器160的特定数据库中。然而,将语音命令转换为文本类型的信息的步骤可以省略。
然后,为了分析语音命令的上下文和内容,控制器180检测语音命令的特定词或关键词(S205)。基于所检测的词或关键词,控制器180分析语音命令的上下文和内容并且通过参考存储在特定数据库中的信息确定或判断语音命令的含意(S206)。
此外,如上文讨论的,用作参考的数据库包括指定的域,并且执行与基于数据库判断的语音命令的含意相对应的功能或菜单(S207)。例如,如果假设在执行文本消息编写功能之后使用STT功能输入文本,则用于语音命令识别的这样信息的优先级可被设定为与修改文本相关的命令或者与搜索另一方相关的命令以接收文本消息或传输这样的消息。而且,由于针对与当前执行的功能或菜单相关的每个信息,指定用于语音识别的数据库,因此提高了识别语音命令的识别率和速度,并且减少了终端上使用的资源量。此外,识别率指示与对特定菜单预设的名称的匹配程度。
还可以通过与语音命令的特定功能或菜单相关的信息数目,来判断对输入的语音命令的识别率。因此,当信息精确地与语音命令中包括的特定功能或菜单(例如,菜单名称)匹配时,提高了对输入的语音命令的识别率。
更详细地,图7B是示出根据本发明的实施例的移动终端的用于识别语音命令的方法的概略图。如图7B中所示,用户输入作为自然语言由六个词“I want to send text messages.(我想发送文本消息)”组成的语音命令。在该示例中,基于与特定菜单(例如,文本消息)相关的有意义的词(例如,发送、文本、消息)的数目,可以判断识别率。此外,控制器180可以基于存储在数据库中的信息确定语音命令中包括的词是否是与特定功能或菜单相关的有意义的词。例如,与特定菜单无关的自然语言语音命令(例如,我想发送文本消息)中包括的无意义的词可以是主语(I)或介词(to)。
而且,自然语言是通常由人使用的语言,并且具有与人工语言相反的概念。此外,自然语言可以通过使用自然语言处理算法进行处理。自然语言可以包括或者可以不包括与特定菜单相关的精确名称,该名称有时导致难以完全精确地识别语音命令。因此,根据本发明的实施例,当语音命令具有大于特定级别(例如,80%)的识别率时,控制器180判断识别是精确的。
此外,当控制器180判断多个菜单具有相似的含意时,控制器180显示该多个菜单并且用户可以选择所显示的菜单中的一个以执行其的功能。此外,具有相对较高的识别率的菜单可以被首先显示或者相比于其他菜单被区别显示。
例如,图8是示出根据本发明的实施例的移动终端的用于显示关于语音识别率的菜单的方法的概略图。如图8中所示,具有较高识别率的菜单图标显示在显示屏510的中心部分处,或者可被显示为具有较大的尺寸或者较深的颜色,如显示屏520中所示。具有较高识别率的菜单图标也可以被首先显示并且随后按照顺序或者连续的方式显示较低识别率的菜单。
此外,控制器180可以通过改变菜单的尺寸、位置、颜色、亮度中的至少一个或者通过按照较高识别率的顺序高亮,来区别显示多个菜单。也可以适当地改变或控制菜单的透明度。
此外,如图8的下部中所示,具有较高的用户选择率的菜单可被更新或设定为具有识别率。也就是说,控制器180存储用户选择的历史(S231)并且执行学习过程(S232),由此更新对于被用户选择的次数多于其他菜单选项的菜单选项的特定识别率(S233)。因此,用户选择频繁使用的菜单的次数可应用于菜单的识别率。因此,根据用户选择特定菜单的次数,以发音或内容的相同或相似的方式输入的语音命令可能具有不同的识别率。
此外,控制器180还可以存储用户执行特定功能的时间。例如,每当用户在星期一至星期五起床时可能检查电子邮件或者未读消息。该时间信息也可以用于提高识别率。终端状态(例如,待机模式等)也可用于提高识别率。例如,当第一次打开其移动终端时、当终端从关闭位置打开时等等,用户可能检查电子邮件或未读消息。
下面,图9是示出根据本发明的另一实施例的移动终端的用于识别语音命令的方法的概略图。如图9中所示,用户激活语音识别功能,并且输入语音命令“我想发送文本消息。”控制器180然后将用于语音命令识别的数据库域指定为与所显示的子菜单相关的域。控制器180然后解释语音命令(S241)并且在该示例中,显示概率大于特定值(例如,80%)的多个菜单(S242)。如图9中的显示屏610中所示,控制器显示四个多个媒体菜单。
控制器180还区别显示具有最高概率的菜单(例如,在该示例中是特定的菜单选项621“发送文本(Send Text)”)。用户然后可以选择任何一个所显示的菜单以执行对应于所选菜单的功能。在图9中所示的示例中,用户选择发送文本菜单选项621并且控制器180显示与所选的发送文本菜单选项621相关的子菜单,如显示屏620中所示。
而且,如图9的下部中的步骤(S242)中所示,当确定仅有单个菜单高于预定的概率时,控制器180还可以立即执行功能。也就是说,当发送文本菜单选项621被确定为具有比预定阈值高的识别率或概率的唯一菜单时,控制器180立即显示如显示屏620中所示的与文本发送相关的信息,无需用户选择发送文本菜单选项621。
此外,如上文参考图6讨论的,当根据操作状态或模式(例如,用于指示语音识别功能的模式)通过语音命令或者触摸输入选择或执行特定菜单时,控制器180还可以以语音或文本格式向用户输出与子菜单相关的气球形状的帮助信息。此外,用户可以使用环境设定菜单中提供的适当的菜单选项设定用于输出帮助的操作模式。因此,用户可以在无需高水平技能的情况下操作本发明的终端。也就是说,许多老年人可能未体验过操作终端提供的多个不同菜单。然而,利用本发明的终端,通常不熟悉该终端提供的用户接口的复杂特征的用户可以容易地操作该移动终端。
此外,当控制器180识别出语音命令具有多个含意时(即,当自然语言语音命令(例如,我想发送文本消息)不包括精确菜单名称,诸如当菜单包括在“发送消息”类别中但是不具有“发送图片”、“发送邮件”和“发件箱”中的精确名称时,控制器180显示识别率大于某个值(例如80%)的多个菜单。
下面,图10是示出根据本发明的实施例的移动终端的用于识别语音命令的由控制器180使用的多个数据库的概略图。在该实施例中,数据库存储控制器180使用的用于判断语音命令的含意的信息,并且可以是根据信息特征的任何数目个数据库。此外,根据信息特征配置的各个数据库可以在控制器180的控制下通过连续学习过程更新。
例如,该学习过程尝试将用户的语音与对应的词匹配。例如,当用户发音的词“waiting(等待)”被误解为词“eighteen(十八)”时,用户将词“eighteen”校正为“waiting”。因此,用户随后输入的相同发音被识别为“waiting”。
如图10中所示,根据信息特征的各个数据库包括第一数据库161、第二数据库162、第三数据库163和第四数据库164。在该实施例中,第一数据库161以音素或音节或者词素为单位存储用于识别通过麦克风输入的语音的语音信息。第二数据库162存储用于基于所识别的语音信息判断语音命令的完整含意的信息(例如,语法、发音精度、句子结构等)。第三数据库163存储与移动终端的功能或服务的菜单相关的信息,并且第四数据库164存储将从移动终端输出的消息或语音信息以便于接收用户对所判断的语音命令的含意的确认。
此外,第三数据库163可被指定为根据为语音命令识别预设的域与特定类别的菜单相关的信息。而且,各个数据库可以存储声音(发音)信息,以及对应于发音信息的音素、音节、词素、词、关键词或者句子。因此,控制器180可以通过使用多个数据库161至164中的至少一个来确定或判断语音命令的含意,并且执行与对应于所判断的语音命令的含意的功能或服务相关的菜单。
此外,本发明可以通过使用特定形状的指示符或图标显示应用于其的语音命令识别功能或STT功能的操作状态或模式。然后,在输出该指示符或图标之后,可以通过特定的声音或语音通知用户。
下面,图11是说明根据本发明的实施例的移动终端的文本校正方法的流程图。如图11中所示,当用户输入其语音时(S301),控制器180将用户的语音转换为文本(S302)。也就是说,控制器180使用特定的STT算法将语音转换为文本。然后,在将语音转换为文本之后,控制器180显示所转换的文本(S303)。此外,该文本可以是包括多个词的句子。
控制器180还确定用户是否已从所显示的词中选择了词(S304)。也就是说,用户可以看到句子中的所显示的词之一是不正确的,指出控制器180未完全识别关于特定词的用户语音。因此,用户可以从显示器151上显示的多个词中选择不正确解释的词。
此外,为了选择显示器151上的词,用户可以使用预设键、触摸该词、使用特定的手势、向某个部分施加特定压力、倾斜或偏斜该终端、输入额外的语音命令等。也就是说,根据本发明的实施例的移动终端可以配备有接近度检测传感器、压力检测传感器或者姿势检测传感器。下面的描述参考用户触摸触摸屏来选择词,但是如上所述也可以使用其他输入方法。
此外,相比于文本中的其他词,控制器180可以区别地或者强调地显示用户选择的词。例如,控制器180可以使用不同的颜色或亮度、比其他词粗或大、不断闪烁、或者通过为所选词加下划线或者改变所选词的字体等来区别显示所选词。
当控制器180确定用户已选择待校正的词时(S304中是),控制器180显示具有与所选词相似的发音的词(在下文中被称为“候选词”)(S305)。例如,如果所选词是“sea”,则具有与该词相似的发音的候选词可以包括“see”、“set”、“saw”等。此外,候选词无需预设在数据库中。而且,根据本发明的实施例,语音识别步骤S302中识别的高于某个识别率的词可以按照最高识别率的次序顺序显示。
然后,当用户从显示的候选词中选择候选词(例如“see”)时(S306中是),控制器180将不正确识别的词(例如“sea”)改变为所选的候选词(例如“see”)并且显示校正的词(S307)。此外,用户可以使用上文讨论的任何选择方法选择一个候选词。下面的描述参考用户触摸候选词以选择它。此外,从显示文本中选择特定词并且将其改变为不同的候选词的过程可以重复执行。
下面,图12A和12B包括说明根据本发明的实施例的用于选择任意词以便校正在移动终端的屏幕上显示的文本的方法的显示屏的概略图。
如图12A(a)中所示,用户输入陈述“I want to see my picture.(我想查看我的图片)”。如图12A(b)中所示,控制器180使用存储器160中存储的特定的STT算法将用户输入的语音转换为文本并且显示该文本。此外,如图12A(c)中所示,控制器180可以强调地显示相比于文本中的其他词语音识别率低于预定参考值的特定词。控制器180还可以将光标置于该特定词上。在图12A(c)中所示的示例中,控制器180使词“sea”高亮,这是因为它的识别率低于预定的参考值。
而且,如图12B(a)中所示,用户可以使用导航键830移动光标以选择待校正的词。用户还可以选择特定键(例如,硬件键或软件键)以便移动光标和选择词,或者简单地触摸该词。此外,如图12B(b)中所示,用户可以使用语音命令(例如,“修改sea”)识别待校正的词。如图12B(c)中所示,控制器180通过使词的尺寸相比于句子中的其他词增加,强调地显示用户选择的不正确识别的词820。
图13A和13B包括说明根据本发明的实施例的用于显示关于用户从在移动终端的屏幕上显示的文本选择的特定词的候选词的方法的显示屏的概略图。如图13A(a)中所示,控制器180显示窗口840,该窗口840包括关于待校正的所选词820的候选词列表中的候选词。
更详细地,当用户选择词“sea”时,控制器180显示窗口840,该窗口840包括具有与所选词相似的发音的候选词列表(例如,see、set、saw等)。此外,弹出窗口840上显示的候选词列表中的候选词优选地按照具有较高概率(即,是正确地语音识别的词的概率或者语音识别率)的次序显示。图13B(b)说明了控制器180在显示屏的另一位置处显示窗口840。
而且,如图13B中所示,控制器180可以基于所选词(例如“sea”)以离开所选词的各自特定间隔显示候选词。也就是说,根据候选词的概率将候选词显示为与所选词间隔开。更详细地,并且如图13B中所示,词set、see和saw包括概率850。如所示,词“see”具有最高的概率0.9并且被显示为最接近所选词“sea”。此外,候选词“saw”具有最低的概率0.2并且被放置为距离所选词“sea”最远。
此外,控制器180可以将候选词显示为使得显示所有候选词或者可以仅显示预定数目的候选词。替代地,控制器180可以仅显示用户触摸并且将其手指沿图13B中所示的滑动条滑动的候选词。因此,当用户触摸图13B中所示的条的特定部分时,控制器180显示对应于所触摸部分的候选词。因此,用户可以使其手指沿滑动条向上或向下滑动以查看不同的候选词。
此外,不同于显示图13B中的滑动条,控制器180可以以所选词被相对于在树形图上的第一位置定位并且多个候选词被基于对应的候选词与所选词的相似程度定位在树形图上的不同位置来显示树形图。
此外,可以通过语法确定或者通过学习确定每个候选词的概率。而且,每个候选词的概率可以经由学习或重复过程自动地改变和更新或者由用户手工地改变。也就是说,在选择特定的候选词之后,用户可以拖动所选的候选词接近所选词或者移动所选的候选词的位置,并且因此根据其位置移动改变所选的候选词的识别率。
此外,控制器180还可以显示每个候选词的识别率,如图13B中所示。控制器180还可以径向显示每个候选词,使得候选词不会相互重叠。然后,如图14A(a)中所示,用户可以通过触摸候选词或者通过说出候选词选择特定的候选词。然后,如图14(b)中所示,当用户选择候选词时,控制器180将不正确识别的词改变为所选的候选词。
此外,在用户从候选词列表选择特定的候选词之后,控制器180优选地释放候选词列表。控制器180还可以强调地显示已被添加到句子的所选的候选词,如图14A(b)中所示。
此外,图14B说明了用户选择和校正显示词的替选实施例。更详细地,如图14B(a)中所示,用户可以通过触摸词选择未被正确转换的词。如图14B(b)中所示,控制器180强调地显示所选词820。用户随后可以通过向终端说出正确的词(例如“see”)校正词820。然后控制器180显示校正的词860,如图14B(c)中所示。校正曲解的所说词的过程可以根据需要重复以校正句子中的多个词。
图15是说明根据本发明的实施例的移动终端中的文本校正方法的流程图。在该实施例中,编辑和校正所选词的字符。更详细地,用户首先使用其语音将信息输入到终端中(S401)。控制器180随后将输入的语音信息转换为文本(S402)。
此外,该文本可以包括一个或多个句子。用户还可以可视地检查所显示的文本是否包含误识别的词(即待校正的词)。用户然后可以选择其希望校正的词(S403中是),并且控制器180显示用于编辑所选词的屏幕(S404)。再一次地,用户可以使用如上文描述的触摸输入方法等选择词。
控制器180然后确定用户是否已完成校正所选词(S405中是),并且利用用户编辑的词校正错拼或曲解的词(S406)。例如,用户可以选择词并且然后输入语音命令(例如修改),该语音命令已被预设用于编辑所选词的字符。替代地,语音命令可以是“修改sea”,其中控制器180选择词“sea”并且提供编辑屏幕,由此用户可以编辑所选词。
在另一实施例中,控制器180可以基于用户向所显示的文本中包括的特定词移动其手指或触笔,选择特定词。也就是说,当用户向特定词移动其手指而非实际触摸该词时(例如,基于接近度触摸),控制器180可以选择特定词。控制器180还可以根据例如用户的手指或触笔的接近度,相比于文本中的其他词强调所选词。还可以使用包括微触摸操作的压力选择方法。
这样,根据本发明的实施例的移动终端对用于选择词的用户初步操作(例如,词接近操作、或者施加小于参考值的压力的微触摸操作)和决定操作(例如,触摸词的操作或者施加大于参考值的压力的触摸操作)进行区分。
此外,为了编辑所选词,控制器180可以自动地显示编辑屏幕或者仅基于用户输入的手工操作显示编辑屏幕。这些不同的操作可以根据预设的环境设置选项设定。
下面,图16A和16B包括说明根据本发明的实施例的用于编辑在移动终端上显示的特定词的方法的显示屏的概略图。更详细地,如图16A(a)中所示,用户输入语音指令“我想查看我的图片。”控制器180然后转换输入的语音指令并且将转换的文本显示在显示屏上。此外,控制器180可以自动地强调显示具有低于参考值的语音识别率的一个或多个特定词(或者具有高的待校正概率的词)。用户可以参考强调状态下的显示信息,并且选择所强调的词或者显示屏上显示的任何其他的词。
在图16A(b)中,相比于其他词,控制器180强调显示所选词870。例如,所选词可被放大或者可以使用不同的颜色或亮度显示、可以是更粗的、可以闪烁、可以加下划线等。控制器180还可以基于用户向所选词移动手指、触笔等、基于用户按压大于预设参考值的词等,选择特定词。
此外,如图16A(b)和16A(c)中所示,当用户选择词时,控制器180提供编辑屏幕870,其中用户可以编辑所选词中的各个字符。控制器180还可以调节编辑屏幕870的透明度,使得屏幕870可以显示在文本上面。然后,在用户在屏幕870中已编辑(例如使用键盘特征)所选词之后,控制器180更新所校正的词,如图16A(d)中所示。此外,控制器180可以以各种方式确定用户已完成编辑所选词。例如,用户可以按压回车键、触摸OK软按钮、执行特定的移动或者手势等。
下面,图16B包括说明用于编辑图16A中选择的词的另一方法的显示屏的概略图。更详细地,如图16B(a)中所示,用户已选择词“sea”待被校正。控制器180然后显示包括可被选择的词的候选词列表841,如图16B(a)中所示。在图16B(a)中所示的示例中,候选词列表841中包括的词不包括用户所需的词“see”。
因此,在该情况中,用户可以选择编辑软键831(或者另一硬键)以便直接编辑所选词。当用户选择预定键831由此编辑所选词时,控制器180显示编辑窗口870,用户可以使用该编辑窗口870编辑所选词的各个字符,如图16B(b)中所示。控制器180还显示软件键盘832,用户可以使用该软件键盘832编辑所选词。此外,控制器180可以根据语言类型(例如,韩语、英语、数字、特殊字符等)自动地显示适当的键盘832。因此,如图16B(b)中所示,用户可以使用显示器151上显示的软件键盘832编辑所选词。替代地,如图16B(c)中所示,用户可以使用在第二用户输入单元215上提供的键编辑所选词。然后,在用户完成编辑所选词之后,控制器180将所选词更新为新编辑的词,如图16B(d)中所示。
图16A和16B中的编辑窗口870也可以是新窗口,使得所显示的转换文本(例如,“我想查看我的图片”)被覆盖并且不能被看见。替代地,编辑窗口870可以是透明的、部分覆于其他显示文本上面等等。
下面,图17A和17B包括说明根据本发明的另一实施例的用于编辑在移动终端上显示的特定词的方法的显示屏的概略图。如图17A(a)中所示,控制器180已将用户输入的语音转换为文本,并且已强调显示语音识别率小于预设参考值的词820(或者具有高的待校正概率的词)。
用户然后选择词820待被校正(用户还可以选择任何其他的显示词)。当用户选择词820时,控制器180显示包括多个候选词的候选词列表841。在图17A(a)中所示的示例中,候选词列表841不包括用户希望选择的词。因此,用户请求控制器180显示编辑屏幕870,如图17A(b)中所示。
用户可以使用各种输入方法请求编辑屏幕870,包括附加的语音命令、特定的键操纵、触摸、压力、按压、接近等。用户还可以双触摸所选词或者触摸并且保持触摸所选词预定的时间量。
然后,如图17A(c)中所示,用户在编辑窗口870中手工校正所选词。在用户校正所选词之后,控制器180更新校正的词,如图17A(d)中所示。
图17B包括说明图17A中的用于编辑所选词的替选方法的显示屏的概略图。如图17B(a)中所示,当用户选择词820时,控制器180显示候选词列表841。然而,与图17A中所示的实施例相似,候选词列表841未包括用户希望选择的词。
因此,在该情况中,用户选择预设的编辑键831以指示控制器180显示编辑屏幕870,使得用户可以手工编辑所选词,如图17B(b)中所示。此外,图17B(b)说明了控制器180显示软键盘832并且图17B(c)说明了用户使用手工键盘215编辑所选词。这与图16B(b)和16B(c)中所示的实施例相似。然后,如图17B(d)中所示,控制器180校正所选词870。
此外,上述各种实施例可使用例如计算机软件、硬件、或其某种组合在计算机可读介质中实现。对于硬件实现,上述实施例可在一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行在此所述功能的其它电子单元、或其选择性的组合中实现。
对于软件实现,在此所述实施例可用单独的软件模块实现,诸如过程和函数,每个模块执行在此所述的一个或多个功能及操作。软件代码可用以任意适当的编程语言编写的软件应用实现,并可存储在存储器(例如,存储器160)中,并由控制器或处理器(例如,控制器180)执行。也就是说,本发明的实施例可以在具有记录为计算机可读代码的程序的介质中实现。该计算机可读介质可以包括所有类型的记录装置,每个记录装置存储可由计算机系统读取的数据。这样的计算机可读介质的示例可以包括ROM、RAM、CD-ROM、磁带、软盘、光数据存储元件等。
此外,移动终端100可以各种不同的配置实现。这样的配置的示例包括折叠式、滑动式、直板式、转动式、摆动式及其组合。
由于本发明的特征在不偏离其特征的前提下可以具体化为数种形式,因此还应当理解,除非另外指明,否则上文描述的实施例不限于前面描述的任何细节,而是应在所附权利要求限定的本发明的范围内广泛解释,并且因此落入权利要求范围内的所有改变和修改或者该范围的等效物旨在被所附权利要求涵盖。

Claims (24)

1.一种移动终端,包括:
语音接收单元,被配置为接收输入语音;
控制器,被配置为将所接收的输入语音转换为文本;
显示器,被配置为显示所转换的文本;和
输入单元,被配置为选择所显示的转换文本中包括的词,
其中所述控制器进一步被配置为以所选词被相对于树形图上的第一位置定位并且多个候选词被基于所述多个候选词与所选词的相似程度的概率值定位在所述树形图上的不同位置来显示所述树形图,挨着它们各自的候选词显示所述概率值,以及根据所述树形图中候选词的移动来改变候选词的概率值。
2.如权利要求1所述的移动终端,其中所述显示器进一步被配置为将具有与所选词最高的相似度的相应的候选词显示为最接近所选词,并且将具有与所选词最低的相似度的相应的候选词显示为最远离所选词。
3.如权利要求1所述的移动终端,其中所述控制器进一步被配置为显示滑动条,所选词被相对于所述滑动条上的第一位置定位,并且所述多个候选词被基于相应的候选词与所选词的相似程度定位在所述滑动条上的不同位置。
4.如权利要求3所述的移动终端,其中所述控制器进一步被配置为接收与正在所述滑动条上执行的触摸和拖拉操作相对应的触摸和拖拉信号,并且当正在所述滑动条上执行所述触摸和拖拉操作时显示所述多个候选词。
5.如权利要求1所述的移动终端,其中所述控制器进一步被配置为利用所选的相应的候选词更新用于将所接收的输入语音转换为文本的语音识别算法。
6.如权利要求1所述的移动终端,其中所述控制器进一步被配置为基于下列中的一个利用所选的候选词更新所选词:1)触摸所选的候选词并且将其拖拉到所选词,2)指示所述控制器利用所选的候选词更新所选词的语音指令,和3)所述终端上的软键或硬键的操纵。
7.如权利要求1所述的移动终端,其中所述控制器进一步被配置为显示编辑窗口,所述编辑窗口允许基于显示所述编辑窗口的指令编辑所选词。
8.如权利要求1所述的移动终端,其中所述显示器进一步被配置为将所选词与在所述显示器上显示的其他词区分地显示。
9.一种控制移动终端的方法,所述方法包括:
接收输入语音;
将所接收的输入语音转换为文本;
显示所转换的文本;
当接收与对在所显示的转换文本中包括的词的选择相对应的信号时,从所显示的转换文本中选择词;
以所选词被相对于树形图上的第一位置定位并且多个候选词被基于所述多个候选词与所选词的相似程度的概率值定位在所述树形图上的不同位置来显示所述树形图;
挨着它们各自的候选词显示所述概率值;以及
根据所述树形图中候选词的移动来改变候选词的概率值。
10.如权利要求9所述的方法,其中所述显示步骤将具有与所选词最高的相似度的相应的候选词显示为最接近所选词,并且将具有与所选词最低的相似度的相应的候选词显示为最远离所选词。
11.如权利要求9所述的方法,进一步包括:
显示滑动条,所选词被相对于所述滑动条上的第一位置定位,并且所述多个候选词被基于相应的候选词与所选词的相似程度定位在所述滑动条上的不同位置。
12.如权利要求11所述的方法,进一步包括:
接收与正在所述滑动条上执行的触摸和拖拉操作相对应的触摸和拖拉信号,
其中所述显示步骤在正在所述滑动条上执行所述触摸和拖拉操作时显示所述多个候选词。
13.如权利要求9所述的方法,进一步包括:
利用所选的相应的候选词更新用于将所接收的输入语音转换为文本的语音识别算法。
14.如权利要求9所述的方法,进一步包括:
基于下列中的一个利用所选的候选词更新所选词:1)触摸所选的候选词并且将其拖拉到所选词,2)指示利用所选的候选词更新所选词的语音指令,和3)所述终端上的软键或硬键的操纵。
15.如权利要求9所述的方法,其中所述显示步骤进一步包括显示编辑窗口,所述编辑窗口允许基于显示所述编辑窗口的指令编辑所选词。
16.如权利要求9所述的方法,其中所述显示步骤进一步包括将所选词与在所述显示器上显示的其他词区分地显示。
17.一种移动终端,包括:
语音接收单元,被配置为接收输入语音;
控制器,被配置为将所接收的输入语音转换为文本;
显示器,被配置为显示所转换的文本;和
输入单元,被配置为选择在所显示的转换文本中包括的词,
其中所述控制器进一步被配置为以所选词被相对于树形图上的第一位置定位并且多个候选词被基于所述多个候选词与所选词的相似程度的概率值定位在所述树形图上的不同位置来显示所述树形图,挨着它们各自的候选词显示所述概率值,根据所述树形图中候选词的移动来改变候选词的概率值,控制所述语音接收单元以接收请求所选词的编辑操作的输入语音指令,以及控制所述显示器以显示用于基于所接收的新的输入语音指令编辑所选词的编辑窗口。
18.如权利要求17所述的移动终端,其中所显示的编辑窗口是使得所显示的转换文本不能被看到的新窗口。
19.如权利要求17所述的移动终端,其中所述编辑窗口与所显示的转换文本重叠。
20.如权利要求17所述的移动终端,其中具有与所选词最高的相似度的相应的候选词被显示为最接近所选词,并且具有与所选词最低的相似度的相应的候选词被显示为最远离所选词。
21.一种控制移动终端的方法,所述方法包括:
接收输入语音;
将所接收的输入语音转换为文本;
显示所转换的文本;和
当接收与对所显示的转换文本中包括的词的选择相对应的选择信号时,从所显示的转换文本中选择词;
以所选词被相对于树形图上的第一位置定位并且多个候选词被基于所述多个候选词与所选词的相似程度的概率值定位在所述树形图上的不同位置来显示所述树形图;
挨着它们各自的候选词显示所述概率值;以及
根据所述树形图中候选词的移动来改变候选词的概率值;
接收请求所选词的编辑操作的输入语音指令;以及
显示用于基于所接收的新的输入语音指令编辑所选词的编辑窗口。
22.如权利要求21所述的方法,其中所显示的编辑窗口是使得所显示的转换文本不能被看到的新窗口。
23.如权利要求21所述的方法,其中所述编辑窗口与所显示的转换文本重叠。
24.如权利要求21所述的方法,其中具有与所选词最高的相似度的相应的候选词被显示为最接近所选词,并且具有与所选词最低的相似度的相应的候选词被显示为最远离所选词。
CN2009101287987A 2008-06-09 2009-03-13 移动终端及其中的文本校正方法 Expired - Fee Related CN101605171B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020080053713A KR100988397B1 (ko) 2008-06-09 2008-06-09 이동 단말기 및 그의 텍스트 수정방법
KR10-2008-0053713 2008-06-09
KR1020080053713 2008-06-09

Publications (2)

Publication Number Publication Date
CN101605171A CN101605171A (zh) 2009-12-16
CN101605171B true CN101605171B (zh) 2012-07-18

Family

ID=40941644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101287987A Expired - Fee Related CN101605171B (zh) 2008-06-09 2009-03-13 移动终端及其中的文本校正方法

Country Status (4)

Country Link
US (1) US8543394B2 (zh)
EP (1) EP2133869A3 (zh)
KR (1) KR100988397B1 (zh)
CN (1) CN101605171B (zh)

Families Citing this family (240)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US20170169700A9 (en) * 2005-09-01 2017-06-15 Simplexgrinnell Lp System and method for emergency message preview and transmission
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8165886B1 (en) 2007-10-04 2012-04-24 Great Northern Research LLC Speech interface system and method for control and interaction with applications on a computing system
US8595642B1 (en) 2007-10-04 2013-11-26 Great Northern Research, LLC Multiple shell multi faceted graphical user interface
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
KR20090107365A (ko) * 2008-04-08 2009-10-13 엘지전자 주식회사 이동 단말기 및 그 메뉴 제어방법
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
KR101481408B1 (ko) * 2008-06-04 2015-01-14 주식회사 팬택 이동통신 단말기에서의 최근 통화 목록을 이용한 단축다이얼 기능 제공 장치 및 방법
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US9009053B2 (en) 2008-11-10 2015-04-14 Google Inc. Multisensory speech detection
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US20100201617A1 (en) * 2009-02-06 2010-08-12 Inventec Corporation Real-time Translation display interface and display method thereof
US9280971B2 (en) * 2009-02-27 2016-03-08 Blackberry Limited Mobile wireless communications device with speech to text conversion and related methods
US8605039B2 (en) * 2009-03-06 2013-12-10 Zimpl Ab Text input
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10540976B2 (en) * 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8494852B2 (en) * 2010-01-05 2013-07-23 Google Inc. Word-level correction of speech input
US9053098B2 (en) 2010-01-14 2015-06-09 Abbyy Development Llc Insertion of translation in displayed text consisting of grammatical variations pertaining to gender, number and tense
US9031831B1 (en) * 2010-01-14 2015-05-12 Abbyy Development Llc Method and system for looking up words on a display screen by OCR comprising a set of base forms of recognized inflected words
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8676581B2 (en) * 2010-01-22 2014-03-18 Microsoft Corporation Speech recognition analysis via identification information
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20120010870A1 (en) * 2010-07-09 2012-01-12 Vladimir Selegey Electronic dictionary and dictionary writing system
KR101735836B1 (ko) * 2010-12-13 2017-05-15 삼성전자주식회사 휴대단말기의 메뉴실행 장치 및 방법
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
EP2506202A1 (en) * 2011-03-29 2012-10-03 Research In Motion Limited Mobile wireless communications device for selecting a payment account to use with a payment processing system based upon a microphone or device profile and associated methods
US9263045B2 (en) * 2011-05-17 2016-02-16 Microsoft Technology Licensing, Llc Multi-mode text input
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US9185225B1 (en) * 2011-06-08 2015-11-10 Cellco Partnership Method and apparatus for modifying digital messages containing at least audio
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8468022B2 (en) * 2011-09-30 2013-06-18 Google Inc. Voice control for asynchronous notifications
KR101590332B1 (ko) * 2012-01-09 2016-02-18 삼성전자주식회사 영상장치 및 그 제어방법
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
CN102681695B (zh) * 2012-04-25 2016-12-07 北京三星通信技术研究有限公司 光标控制方法及装置
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
CN102723080B (zh) * 2012-06-25 2014-06-11 惠州市德赛西威汽车电子有限公司 一种语音识别测试系统及方法
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
KR101971513B1 (ko) * 2012-07-05 2019-04-23 삼성전자주식회사 전자 장치 및 이의 음성 인식 오류 수정 방법
KR20140008835A (ko) * 2012-07-12 2014-01-22 삼성전자주식회사 음성 인식 오류 수정 방법 및 이를 적용한 방송 수신 장치
KR101911251B1 (ko) * 2012-07-13 2018-10-24 엘지전자 주식회사 휴대 단말기 및 그 제어 방법
KR20140014510A (ko) * 2012-07-24 2014-02-06 삼성전자주식회사 음성 인식에 의하여 형성된 문자의 편집 방법 및 그 단말
US9298295B2 (en) * 2012-07-25 2016-03-29 Facebook, Inc. Gestures for auto-correct
US10838513B2 (en) * 2012-08-06 2020-11-17 Nokia Technologies Oy Responding to selection of a displayed character string
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
CN103714048B (zh) * 2012-09-29 2017-07-21 国际商业机器公司 用于校正文本的方法和系统
KR102009423B1 (ko) 2012-10-08 2019-08-09 삼성전자주식회사 음성 인식을 이용한 미리 설정된 동작 모드의 수행 방법 및 장치
US8713433B1 (en) * 2012-10-16 2014-04-29 Google Inc. Feature-based autocorrection
WO2014060053A1 (de) 2012-10-16 2014-04-24 Audi Ag Bearbeiten eines textes während einer fahrt in einem kraftfahrzeug
KR101992191B1 (ko) * 2012-11-01 2019-06-24 엘지전자 주식회사 이동 단말기 및 그 제어방법
KR102023008B1 (ko) * 2012-12-10 2019-09-19 엘지전자 주식회사 음성-텍스트 변환 디스플레이 장치 및 그 방법
KR102306899B1 (ko) 2013-01-21 2021-09-30 키포인트 테크놀로지스 인디아 프라이비트 리미티드 텍스트 입력 시스템 및 방법
IN2013CH00469A (zh) * 2013-01-21 2015-07-31 Keypoint Technologies India Pvt Ltd
CN104969289B (zh) 2013-02-07 2021-05-28 苹果公司 数字助理的语音触发器
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
KR101759009B1 (ko) 2013-03-15 2017-07-17 애플 인크. 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것
US8768687B1 (en) * 2013-04-29 2014-07-01 Google Inc. Machine translation of indirect speech
KR102052971B1 (ko) * 2013-05-14 2020-01-08 엘지전자 주식회사 지문 스캔너를 포함하는 포터블 디바이스 및 그 제어 방법
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
KR101959188B1 (ko) 2013-06-09 2019-07-02 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
WO2014200731A1 (en) 2013-06-13 2014-12-18 Apple Inc. System and method for emergency calls initiated by voice command
CN104281600B (zh) * 2013-07-05 2018-12-28 腾讯科技(深圳)有限公司 智能选词的方法和装置
KR102179056B1 (ko) * 2013-07-19 2020-11-16 엘지전자 주식회사 이동 단말기 및 그것의 제어방법
KR101749009B1 (ko) 2013-08-06 2017-06-19 애플 인크. 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화
GB2518002B (en) * 2013-09-10 2017-03-29 Jaguar Land Rover Ltd Vehicle interface system
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
CN104732975A (zh) * 2013-12-20 2015-06-24 华为技术有限公司 一种语音即时通讯方法及装置
DE112015001468T5 (de) * 2014-03-27 2016-12-15 Sony Corporation Elektronische Vorrichtung und Verfahren zum Identifizieren von Eingabebefehlen eines Benutzers
US9082407B1 (en) * 2014-04-15 2015-07-14 Google Inc. Systems and methods for providing prompts for voice commands
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
CN105446572A (zh) * 2014-08-13 2016-03-30 阿里巴巴集团控股有限公司 一种用于屏幕显示设备的文字编辑方法及装置
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
KR102245747B1 (ko) 2014-11-20 2021-04-28 삼성전자주식회사 사용자 명령어 등록을 위한 디스플레이 장치 및 방법
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
CN105869632A (zh) * 2015-01-22 2016-08-17 北京三星通信技术研究有限公司 基于语音识别的文本修订方法和装置
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
EP3089159B1 (en) 2015-04-28 2019-08-28 Google LLC Correcting voice recognition using selective re-speak
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
DE102015212413A1 (de) 2015-07-02 2017-01-05 Volkswagen Aktiengesellschaft Verfahren und Vorrichtung zum Auswählen eines Bestandteils einer Spracheingabe
US10424293B1 (en) * 2015-07-21 2019-09-24 Amazon Technologies, Inc. Using audio input and output to interact with text-based interactive content
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
CN105206274A (zh) * 2015-10-30 2015-12-30 北京奇艺世纪科技有限公司 一种语音识别的后处理方法及装置和语音识别系统
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
JP2017146437A (ja) * 2016-02-17 2017-08-24 本田技研工業株式会社 音声入力処理装置
KR102561711B1 (ko) * 2016-02-26 2023-08-01 삼성전자주식회사 컨텐트를 인식하는 방법 및 장치
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
DK201670539A1 (en) * 2016-03-14 2017-10-02 Apple Inc Dictation that allows editing
US11176930B1 (en) * 2016-03-28 2021-11-16 Amazon Technologies, Inc. Storing audio commands for time-delayed execution
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10831366B2 (en) * 2016-12-29 2020-11-10 Google Llc Modality learning on mobile devices
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
CN108874797B (zh) * 2017-05-08 2020-07-03 北京字节跳动网络技术有限公司 语音处理方法和装置
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
KR101955225B1 (ko) * 2017-11-03 2019-03-08 주식회사 셀바스에이아이 전자의무기록 서비스의 편집 인터페이스를 제공하는 방법 및 장치
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
KR102519635B1 (ko) 2018-01-05 2023-04-10 삼성전자주식회사 음성 명령을 처리하기 위한 전자 문서 표시 방법 및 그 전자 장치
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
KR20190088737A (ko) * 2018-01-19 2019-07-29 현대자동차주식회사 음성 인식 장치 및 그 제어 방법
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
CN110544473B (zh) * 2018-05-28 2022-11-08 百度在线网络技术(北京)有限公司 语音交互方法和装置
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
KR102592907B1 (ko) * 2018-06-22 2023-10-23 삼성전자주식회사 텍스트 입력 디바이스 및 그 방법
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
JP7243106B2 (ja) * 2018-09-27 2023-03-22 富士通株式会社 修正候補提示方法、修正候補提示プログラムおよび情報処理装置
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
JP7119857B2 (ja) * 2018-09-28 2022-08-17 富士通株式会社 編集プログラム、編集方法および編集装置
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
JP2020185870A (ja) * 2019-05-14 2020-11-19 株式会社東海理化電機製作所 制御装置、制御システム及び制御プログラム
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
CN110767234B (zh) * 2019-10-31 2022-12-23 抖音视界有限公司 音频信息处理方法、装置、电子设备及存储介质
EP4139784A1 (en) * 2020-04-21 2023-03-01 Google LLC Hierarchical context specific actions from ambient speech
CN112669845B (zh) * 2020-12-25 2024-04-12 竹间智能科技(上海)有限公司 语音识别结果的校正方法及装置、电子设备、存储介质
JP7357030B2 (ja) * 2021-08-25 2023-10-05 ソフトバンク株式会社 通信端末、プログラム、及び表示方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5855000A (en) * 1995-09-08 1998-12-29 Carnegie Mellon University Method and apparatus for correcting and repairing machine-transcribed input using independent or cross-modal secondary input

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4582441A (en) * 1984-08-22 1986-04-15 International Business Machines Corporation Text editing with voice prompting
US5899976A (en) 1996-10-31 1999-05-04 Microsoft Corporation Method and system for buffering recognized words during speech recognition
US5909667A (en) * 1997-03-05 1999-06-01 International Business Machines Corporation Method and apparatus for fast voice selection of error words in dictated text
US6282507B1 (en) 1999-01-29 2001-08-28 Sony Corporation Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6611802B2 (en) * 1999-06-11 2003-08-26 International Business Machines Corporation Method and system for proofreading and correcting dictated text
US7444286B2 (en) 2001-09-05 2008-10-28 Roth Daniel L Speech recognition using re-utterance recognition
KR20040008546A (ko) * 2002-07-18 2004-01-31 엘지전자 주식회사 연속 음성인식 기기의 오인식 수정 방법
US6993482B2 (en) * 2002-12-18 2006-01-31 Motorola, Inc. Method and apparatus for displaying speech recognition results
US20050049868A1 (en) * 2003-08-25 2005-03-03 Bellsouth Intellectual Property Corporation Speech recognition error identification method and system
EP1776691A1 (en) 2004-08-06 2007-04-25 Philips Intellectual Property & Standards GmbH A method for a system of performing a dialogue communication with a user
US7778821B2 (en) * 2004-11-24 2010-08-17 Microsoft Corporation Controlled manipulation of characters

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5855000A (en) * 1995-09-08 1998-12-29 Carnegie Mellon University Method and apparatus for correcting and repairing machine-transcribed input using independent or cross-modal secondary input

Also Published As

Publication number Publication date
KR20090130350A (ko) 2009-12-23
KR100988397B1 (ko) 2010-10-19
US20090306980A1 (en) 2009-12-10
US8543394B2 (en) 2013-09-24
EP2133869A3 (en) 2010-05-19
CN101605171A (zh) 2009-12-16
EP2133869A2 (en) 2009-12-16

Similar Documents

Publication Publication Date Title
CN101605171B (zh) 移动终端及其中的文本校正方法
CN101557432B (zh) 移动终端及其菜单控制方法
CN101557651B (zh) 移动终端及其菜单控制方法
US9900414B2 (en) Mobile terminal and menu control method thereof
CN101572750B (zh) 移动终端及其呼叫内容管理方法
KR101462932B1 (ko) 이동 단말기 및 그의 텍스트 수정방법
CN101729656B (zh) 移动终端及其控制方法
KR101502003B1 (ko) 이동 단말기 및 그 텍스트 입력 방법
CN101604521B (zh) 移动终端和用于识别其语音的方法
US8428654B2 (en) Mobile terminal and method for displaying menu thereof
RU2412463C2 (ru) Терминал мобильной связи и способ управления его меню
US20100248757A1 (en) Method for creating short message and portable terminal using the same
KR101502004B1 (ko) 이동 단말기 및 그의 음성 명령 인식 방법
KR20090115599A (ko) 이동 단말기 및 그 정보 처리방법
KR101451661B1 (ko) 이동 단말기 및 그 메뉴 제어 방법
KR20090107366A (ko) 이동 단말기 및 그 메뉴 제어방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120718

Termination date: 20210313

CF01 Termination of patent right due to non-payment of annual fee