CN110895925A - 电子装置及其控制方法、以及用于电子装置的存储介质 - Google Patents
电子装置及其控制方法、以及用于电子装置的存储介质 Download PDFInfo
- Publication number
- CN110895925A CN110895925A CN201910814214.5A CN201910814214A CN110895925A CN 110895925 A CN110895925 A CN 110895925A CN 201910814214 A CN201910814214 A CN 201910814214A CN 110895925 A CN110895925 A CN 110895925A
- Authority
- CN
- China
- Prior art keywords
- language
- control unit
- unit
- voice
- main
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000008859 change Effects 0.000 claims abstract description 27
- 238000004891 communication Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 description 23
- 230000015654 memory Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 229910052744 lithium Inorganic materials 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- OJIJEKBXJYRIBZ-UHFFFAOYSA-N cadmium nickel Chemical compound [Ni].[Cd] OJIJEKBXJYRIBZ-UHFFFAOYSA-N 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229910052987 metal hydride Inorganic materials 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- PXHVJJICTQNCMI-UHFFFAOYSA-N nickel Substances [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 1
- -1 nickel metal hydride Chemical class 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/263—Language identification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
- G06F9/454—Multi-language systems; Localisation; Internationalisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/58—Details of telephonic subscriber devices including a multilanguage function
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
- Telephone Function (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了电子装置及其控制方法、以及用于电子装置的存储介质。电子装置包括语音接收单元、显示单元、以及控制单元。所述控制单元被配置为执行控制以便识别由所述语音接收单元接收的语音的语言。在确定识别的语言是与被设置为所述电子装置上的主语言的第二语言不同的第一语言的语音的情况下,所述控制单元被配置为在所述显示单元上以所述第一语言和第二语言这两者显示用于确认是否要将所述主语言从所述第二语言改变为所述第一语言的消息。
Description
技术领域
本发明涉及接收语音输入(语音)的电子装置。
背景技术
近年来,已知能够辨识接收到的语音的电子装置。另外,用户可以在使用电子装置时从各种语言当中设置任意语言。作为使用语音来设置电子装置上的语言的示例,日本专利申请特开No.2006-65528讨论了一种电子装置,该电子装置在以与设置到电子装置的语言不同的语言接收到语音时将设置改变为接收到的语音的语言。
然而,日本专利申请特开No.2006-65528涉及这样的问题:即使当用户的语音的语言被不正确地辨识时,电子装置也非期望地将设置改变为这种不正确地辨识的语言,从而不方便地将设置改变为用户非预期的语言。
发明内容
根据本发明的一个方面,一种电子装置包括被配置为语音接收单元、显示单元、以及控制单元。所述控制单元被配置为执行控制以便识别由所述语音接收单元接收的语音输入的语言。在确定识别的语言是与被设置为所述电子装置上的主语言(primary language)的第二语言不同的第一语言的情况下,所述控制单被配置为所述显示单元上以所述第一语言和第二语言这两者显示用于确认是否要将所述主语言从所述第二语言改变为所述第一语言的消息。
从以下参考附图的示例性实施例的描述,本发明的进一步的特征将变得清楚。下面描述的本发明的每个实施例可以单独实现或者作为多个实施例的组合实现。而且,来自不同实施例的特征可以在必要时组合,或者在单个实施例中来自各个实施例的元件或特征的组合是有益的。
附图说明
图1是图示根据第一示例性实施例的智能电话的一个示例的框图。
图2图示了根据第一示例性实施例的智能电话的一个示例的外观。
图3图示了根据第一示例性实施例的用于改变智能电话上的主语言的设置的方法的一个示例。
图4图示了根据第一示例性实施例的用于确认是否要改变主语言的设置的智能电话的画面的一个示例。
图5是图示根据第一示例性实施例的由智能电话执行的处理的一个示例的流程图。
图6图示了根据第一示例性实施例的用于从多个语言候选(candidate)中选择主语言的智能电话的画面的一个示例。
图7图示了在向用户确认是否要改变主语言的设置的情况下智能电话通过语音向用户确认的方法的一个示例。
图8图示了根据第二示例性实施例的用于改变智能电话上的主语言的设置的方法的一个示例。
图9图示了根据第二示例性实施例的用于确认是否要改变主语言的设置的智能电话的画面的一个示例。
图10是图示根据第二示例性实施例的由智能电话执行的处理的一个示例的流程图。
图11图示了智能电话使用图像接收用户的语音的方法的一个示例。
具体实施方式
在以下描述中,将参考附图描述本发明的示例性实施例中的每一个的操作。在示例性实施例中,设置到电子装置的作为由用户使用的语言的语言将被与其它语言可区分地称为主语言。
在以下描述中,将描述第一示例性实施例。图1是图示智能电话100的配置的示例的框图,该智能电话100是根据本示例性实施例的电子装置的一个示例。
控制单元101根据输入信号和下面将描述的程序控制智能电话100的每个单元。代替控制单元101控制整个装置,多个硬件设备可以通过在它们之间划分处理来控制整个装置。
非易失性存储器103是电可擦除且可记录的非易失性存储器。非易失性存储器103在其中记录作为由控制单元101执行的基本软件的操作系统(OS)、以及与这个OS协作地实现高级功能的应用。这些应用包括用于识别接收到的语音数据的语言的程序和用于执行根据下面将描述的各种流程图的处理的程序。
工作存储器104被用作用于在下面将描述的显示单元106上显示图像的存储器、控制单元101的工作区域等。工作存储器104在其中存储识别由麦克风107接收的语音的语言所需的语音数据和经由通信单元111接收的语音数据。
操作单元105用于从用户接收针对智能电话100的指示。操作单元105包括例如操作部件,诸如用于供用户指示智能电话100接通/关断智能电话100的电源的电源按钮、以及在显示单元106上提供的触摸面板。控制单元101检测到操作单元105被用户操作,并且根据这个操作执行处理。
显示单元106例如显示图像数据并且显示用于交互操作的文字。然而,显示单元106不一定必须在智能电话100中提供。可以以任何方式提供显示单元106,只要智能电话100可以连接到显示单元106并且至少具有控制显示单元106上的显示的显示控制功能即可。在本示例性实施例中,液晶显示器被用作显示单元106。然而,显示单元106不限于液晶显示器,并且可以使用诸如有机电致发光(EL)显示器的另一种方法。
麦克风107用于接收语音。麦克风107接收来自外部的语音,并且将接收到的语音输出到控制单元101。控制单元101执行用于对接收到的语音进行从模拟数据到数字数据的模拟(A)/数字(D)转换的处理。替代地,麦克风107可以执行用于进行A/D转换的处理,并且将通过A/D转换所转换的数字数据输出到控制单元101。麦克风107内置在智能电话100中,但是代替地,智能电话100可以被配置为经由线缆等连接到外部麦克风。
扬声器108用于回放(play back)语音。控制单元101执行用于对要由扬声器108回放的语音进行从数字数据到模拟数据的D/A转换的处理,并且将模拟数据输出到麦克风107。替代地,扬声器108可以代替控制单元101执行用于进行D/A转换的处理。扬声器108内置在智能电话100中,但是代替地,智能电话100可以被配置为经由线缆等连接到外部扬声器。
记录介质110可以被配置为可附接到智能电话100并且从智能电话100可拆卸,或者可以内置在智能电话100中。可以以任何方式提供记录介质110,只要智能电话100至少可访问记录介质110即可。
通信单元111是用于连接到外部装置的接口。根据本示例性实施例的智能电话100可以经由通信单元111向外部装置发送数据和从外部装置接收数据。例如,智能电话100可以经由通信单元111向外部装置发送由麦克风107接收的语音数据。另外,智能电话100可以从外部装置接收语音数据。在本示例性实施例中,通信单元111包括用于遵照电气和电子工程师协会(IEEE)802.11标准经由无线局域网(LAN)与外部装置通信的接口。控制单元101通过控制通信单元111来实现与外部装置的无线通信。通信方法不限于比如无线LAN的无线通信方法,并且可以是有线通信方法。尽管通信单元111内置在智能电话100中,但是智能电话100可以被配置为经由LAN线缆连接到外部通信模块。
电源单元112包括一次电池(诸如碱性电池和锂电池)、二次电池(诸如镍镉(NiCd)电池、镍金属氢化物(NiMH)电池和锂(Li)电池)、交流(AC)适配器等。
图2图示了智能电话100的外观,该智能电话100是电子装置的一个示例。智能电话100包括显示单元106、麦克风107、扬声器108和语音输入按钮220。语音输入按钮220是包括在操作单元105中的操作部件,并且用户可以通过按下语音输入按钮220来向智能电话100输入语音。这里,使智能电话100接收声音的触发可以是在显示单元106上显示的画面上由用户执行的操作,而不是由用户按下语音输入按钮220的操作。例如,语音输入按钮220是图2中的物理机构,并且图3中所示的麦克风按钮301是图形用户界面(GUI),比如经由触摸面板可操作的项目。用户通过操作语音输入按钮220或麦克风按钮301来向智能电话100输入语音。
智能电话100可以识别接收到的语音的语言。这里,将描述由智能电话100识别接收到的语音的语言的方法的两个示例。首先,在两种方法中的一种中,智能电话100将接收到的语音转换成语音数据以将它存储到工作存储器104中,并且使用记录在非易失性存储器103中的程序识别这个语音数据的语言。在另一种方法中,智能电话100经由通信单元111将接收到的语音数据发送到位于外部的服务器。这个位于外部的服务器分析接收到的语音数据的语言,并且将关于分析结果的信息发送到智能电话100。然后,根据这种方法,智能电话100通过经由通信单元111接收该信息来识别语音的语言。在第二方法示例中,关于分析语音的结果的信息包含由外部服务器辨识的语言的至少一个候选作为语音数据的语言。在本示例性实施例中,采用第二方法示例。
图3图示了根据本示例性实施例的用于通过语音来改变主语言的设置的方法的一个示例。在图3中,将智能电话100把持在手中的用户已打开用于改变智能电话100上的主语言的设置的画面300。这里,智能电话100上的主语言在初始状态下是英语。在图3的左上侧示出的智能电话100的图是由用户把持的智能电话100上的画面的放大图。在这种情况下,用户通过在按下语音输入按钮220或麦克风按钮301的同时讲出任意语言名称(在图3的情况下是含义为“日语”的单词)来改变智能电话100上的主语言。智能电话100接收这个语言名称,并且在已使用上述用于分析语言的程序识别语言的情况下显示用于确认是否要改变主语言的画面,比如图4中所示的示例。
在图4中,智能电话100显示用于确认是否要将主语言从当前的主语言改变为接收到的语音的语言的画面。智能电话100在对话框401中以当前的主语言(英语)显示确认是否要改变设置的通知,并且与此并行地,在对话框402中以接收到的语音的语言(日语)显示确认是否要改变设置的通知。这些对话框401和402是要由用户操作的操作UI。用户可以操作任一对话框。用户可以通过使用操作单元105或语音操作智能电话100来设置主语言。在用户通过语音操作智能电话100的情况下,根据本示例性实施例的智能电话100接受指示,而不管该指示是以英语还是日语给出。以这种方式,智能电话100通过以主语言和接收到的语音的语言这两者通知用户来允许用户容易地防止主语言被改变为用户非预期的语言。
图5是图示用于改变智能电话100上的主语言的设置的处理过程的一个示例的流程图。记录在非易失性存储器103中的软件被展开到工作存储器104中并且由控制单元101执行,由此实现这个处理。另外,当控制单元101在显示单元106上显示用于改变智能电话100上的主语言的设置的画面时,显示的画面触发处理开始。例如,当显示图3中所示的画面300时,控制单元101开始根据本流程图的处理。
在步骤S501中,控制单元101确定语音输入按钮220是否被按下。如果控制单元101确定语音输入按钮220被按下(步骤S501中为是),那么处理前进到步骤S502。如果控制单元101确定语音输入按钮220没有被按下(步骤S501中为否),那么处理前进到步骤S505。
在步骤S502中,控制单元101通过麦克风107接收声音。
在步骤S503中,控制单元101确定语音输入按钮220是否被释放。如果语音输入按钮220没有被释放(步骤S503中为否),那么处理返回到步骤S502,在该步骤S502中控制单元101继续接收声音。如果语音输入按钮220被释放(步骤S503中为是),那么处理前进到步骤S504。
在步骤S504中,控制单元101确定是否已接收到语音。例如,如果已接收到比阈值大的语音,那么控制单元101确定已接收到语音。如果语音的音量已是阈值或更低,那么控制单元101确定尚未接收到语音。首先,将描述当控制单元101尚未接收到语音时处理如何继续。在这种情况下(步骤S504中为否),处理前进到步骤S505。
在步骤S505中,控制单元101确定用户是否使用操作单元105选择了在显示单元106上显示的语言。如果控制单元101确定没有使用操作单元105选择语言(步骤S505中为否),那么处理返回到步骤S501。如果控制单元101确定使用操作单元105选择了语言(步骤S505中为是),那么处理前进到步骤S506。
在步骤S506中,控制单元101以在步骤S505中选择的语言被设置为智能电话100上的主语言的方式改变设置,并且结束根据本流程图的处理。
接下来,将描述当在步骤S504中控制单元101已接收到语音时处理如何继续。在这种情况下(步骤S504中为是),处理前进到步骤S507。
在步骤S507中,控制单元101确定是否存在适合于在步骤S502中接收的语音的语言的语言候选。例如,如上所述,控制单元101使用外部服务器获取语音的语言的候选。如果存在适合于接收到的语音的语言的语言(步骤S507中为是),那么处理前进到步骤509。如果不存在适合于接收到的语音的语言的语言(步骤S507中为否),那么处理前进到步骤S508。
在步骤S508中,控制单元101在显示单元106上显示表示在步骤S507中不存在适合于接收到的语音的语言的语言候选的通知。在控制单元101执行本处理之后,处理返回到步骤S501。
同时,在步骤S509中,控制单元101从在步骤S507中确定的语言候选中选择一个。
在步骤S510中,控制单元101确定在步骤S509中选择的语言和主语言是否彼此匹配。如果两种语言彼此不同(步骤S510中为是),那么处理前进到步骤S512。如果两种语言彼此匹配(步骤S510中为否),那么处理前进到步骤S511。
在步骤S511中,控制单元101在显示单元106上显示表示主语言将不被改变的通知,因为接收到的语音的语言与主语言匹配。替代地,控制单元101使用扬声器108以主语言回放表示主语言将不被改变的声音或语音,并且结束根据本流程图的处理。
另一方面,在步骤S512中,控制单元101在显示单元106上显示向用户确认主语言将被改变为接收到的语音的语言的通知。此时,控制单元101在显示单元106上显示的画面上以主语言和接收到的语音的语言这两者显示表示相同内容的通知。例如,在主语言是英语并且接收到的语音是“日语”的情况下,控制单元101在对话框401(以英语表示)和对话框402(以日语表示)中显示确认是否要改变主语言的通知,如图4中所示。以这种方式,当用户改变主语言的设置时,控制单元101通过以主语言和接收到的语音的语言呈现显示来允许用户确认多种语言并且确定是否要将语言从主语言改变为接收到的语音的语言。这允许用户容易地防止智能电话100将主语言的设置改变为用户非预期的语言。
在步骤S513中,控制单元101确定用户是否批准了主语言的设置的改变。例如,在图4中,控制单元101确定在对话框401上是触摸了“YES”(即,执行用于改变主语言的操作)还是触摸了“NO”(即,执行不改变主语言的操作)。另外,例如,在图4中,控制单元101确定在对话框402上是触摸了“HAI(日语中的是)”(即,执行用于改变主语言的操作)还是触摸了“IIE(日语中的否)”(即,执行不改变主语言的操作)。如果执行用于改变主语言的操作(步骤S513中为是),那么处理前进到步骤S514。如果执行不改变主语言的操作(步骤S513中为否),那么处理前进到步骤S511。
在步骤S514中,控制单元101将主语言的设置改变为接收到的语音的语言。此后,控制单元101结束根据本流程图的处理。
以这种方式,已聚焦于当控制单元101显示用于改变主语言的设置的画面时控制单元101改变主语言的处理描述了本示例性实施例。通过这个处理,智能电话100可以允许用户容易地将电子装置上的语言的设置改变为用户预期的语言。
另外,如果在步骤S509中控制单元101确定存在接收到的语音的语言的多个候选,那么在步骤S512中,控制单元101以主语言和多个候选显示对话框。例如,如果确定主语言是英语并且接收到的语音是日语或韩语,那么控制单元101显示对话框601、对话框602、对话框603和对话框604,如图6中所示。现在,出于说明的目的已通过示例的方式将接收到的语音的候选描述为日语和韩语,但是这不意味着日语单词和韩语单词的发音听起来相似。控制单元101分别在对话框601和对话框602中以英语(主语言)显示是否要将语言从英语改变为日语(接收到的语音的语言的候选)以及是否要将语言从英语改变为韩语(接收到的语音的语言的候选)。控制单元101分别在对话框603和对话框604中以日语和韩语(接收到的语音的语言的候选)显示是否要将语言从英语改变为日语(接收到的语音的语言的候选)以及是否要将语言从英语改变为韩语(接收到的语音的语言的候选)。如果所有的对话框601至604不能包含在画面内,那么控制单元101在允许使用操作单元105滚动画面的同时在显示单元106上显示对话框601至604,如图6中所示。
另外,在步骤S512中,控制单元101可以使用扬声器108回放包含用于向用户确认是否要将语言从主语言改变为接收到的语音的语言的内容的声音或语音。例如,如果确定主语言是英语并且接收到的语音是日语,那么控制单元101以英语和日语回放包含用于向用户确认主语言将被从英语改变为日语的内容的声音或语音。在这种情况下,扬声器108以语言中的每一种顺次地回放声音或语音,如图7中所示。用户收听声音或语音,然后通过操作单元105或语音来操作智能电话100,从而确定是否要改变主语言。
另外,在步骤S513中,用户可以在确定是否要改变主语言时通过语音来操作智能电话100。根据本示例性实施例的智能电话100接受或者以英语或者以日语发出的指示。在这种情况下,控制单元101通过麦克风107接收用户的语音,并且执行处理以便使得用户能够以改变之前的主语言或接收到的语音的语言这两者来确定是否要改变语言。
另外,在步骤S504中,控制单元101可以通过分析接收到的声音的音量的时间变化来确定接收到的声音是否是语音。例如,控制单元101预先将语音的音量的时间变化的特征量记录到非易失性存储器103中,并且通过将接收到的声音与这个特征量进行比较来确定接收到的声音是否是语音。
接下来,将描述第二示例性实施例。第二示例性实施例将被描述为控制单元101使用语音辨识功能来改变主语言的处理。语音辨识功能是指允许电子装置基于接收到的语音的含义来执行处理的功能。例如,智能扬声器具有语音辨识功能,该语音辨识功能使得智能扬声器在接收到用户的语音含义(例如,“开启电视”或“播放最喜欢的音乐”)时能够经由无线通信根据接收到的语音的含义接通电视的电源或回放已高频率地回放的歌曲。在第二示例性实施例中,假设智能电话100能够使用语音辨识功能来改变主语言的设置。
图8图示了根据本示例性实施例的用于使用语音辨识功能来改变主语言的设置的方法的一个示例。在图8中,将智能电话100把持在手中的用户已打开用于使用语音辨识功能来改变主语言的设置的画面800。这里,智能电话100上的主语言在初始状态下是英语。在图8的左上侧示出的智能电话100的图是由用户把持的智能电话100上的画面的放大图。在这种情况下,用户通过说出任意语言名称(在图8的情况下是含义为韩语的日语单词“kankokugo”)来改变智能电话100上的主语言。在图8中,智能电话100可以基于由用户说出的单词的含义来确定韩语是一个候选。另外,智能电话100可以确定日语也是另一个候选,因为已接收到日语单词“kankokugo”。智能电话100接收由用户说出的语言名称,并且如果使用语音辨识功能成功地确定了语言,那么显示用于确认是否要改变主语言的画面,比如图9中所示的示例。
在图9中,智能电话100显示用于确认是否要将主语言从当前的主语言改变为接收到的语言的画面。图9中所示的画面具有与图6中所示的画面类似的功能。然而,图9中所示的画面在对话框被布置的次序方面与图6中所示的画面不同。在图8中,认为用户具有基于说出的单词的含义将主语言改变为韩语的意图。然而,还认为用户可能想要将智能电话100上的主语言改变为日语,因为用户已以日语说出了该单词。因此,在图9中,智能电话100在画面的比日语高的位置上显示韩语。当以这种方式存在要被设置为主语言的语言的多个候选时,智能电话100对语言的这些候选设置优先级,并且按优先级的降序显示对话框。在本示例性实施例中,智能电话100将通过语言辨识功能辨识的单词的含义优先于单词本身的语言显示,但是这个优先次序可以反过来。另外,如果不能够辨识由用户说出的单词的含义但是能够确定存在这个单词本身的语言的多个候选,那么智能电话100按优先次序显示多个候选。例如,如果确定语言相比于韩语更有可能是日语,那么智能电话100将对日语设置比韩语的优先级高的优先级。
图10是图示用于改变智能电话100上的主语言的设置的处理过程的流程图。记录在非易失性存储器103中的软件被展开到工作存储器104中并且由控制单元101执行,由此实现这个处理。另外,当开启操作单元105的电源按钮时,通过该操作作为触发来开始处理。
在步骤S1001中,控制单元101在显示单元106上显示用于改变智能电话100上的主语言的设置的画面。例如,用于改变主语言的设置的画面是用于供用户从智能电话100上可用的语言中选择任意语言的画面,如由图3中所示的画面300所表示的。例如,在用户第一次接通智能电话100的电源的情况下或者在用户根据预定的操作过程接通智能电话100的电源的情况下,电源按钮的开启充当使控制单元101显示用于改变主语言的设置的画面的触发。
在步骤S1002中,控制单元101确定语音输入按钮220是否被按下。如果控制单元101确定语音输入按钮220被按下(步骤S1002中为是),那么处理前进到步骤S1005。如果控制单元101确定语音输入按钮220没有被按下(步骤S1002中为否),那么处理前进到步骤S1003。
步骤S1003和步骤S1004中的处理分别类似于图5中所示的步骤S505和步骤S506中的处理。
在步骤S1005中,控制单元101在显示单元106上显示用于通过语音辨识功能接收语音的画面。另外,本步骤中的画面与图8中所示的画面800对应。
步骤S1006中的处理类似于图5中所示的步骤S502中的处理。
在步骤S1007中,控制单元101确定是否已接收到语音。即使当尚未经过预定时间时,如果在步骤S1006中已接收到具有大于阈值的音量的语音,那么控制单元101也确定已接收到语音。如果语音的音量已是阈值或更小,那么控制单元101确定尚未接收到语音。
在步骤S1008中,控制单元101确定自从开始接收语音是否已经过预定或更长时间。如果自从开始接收语音已经过的时间短于预定时间(步骤S1008中为否),那么处理返回到步骤S1006。如果自从开始接收语音已经过预定或更长时间(步骤S1008中为是),那么处理前进到步骤S1010。
步骤S1009至步骤S1016分别类似于图5中所示的步骤S507至步骤S514。
以这种方式,已聚焦于控制单元101使用语音辨识功能来改变主语言的处理描述了本示例性实施例。
尽管在本示例性实施例中用户通过向智能电话100说出语言名称来改变主语言的设置,但是在语音辨识功能可以从任意语音确定语言的情况下,用户可以使用任意单词来改变主语言的设置。另外,控制单元101可以接收关于特定图像而不是语言名称说出的单词。例如,参考图11,控制单元101在显示单元106上显示苹果的图像1101。控制单元101确定由用户针对苹果的图像1101说出的内容。如果接收到含义为苹果的日语单词“ringo”,那么控制单元101可以确定由用户说出的单词是日语。在另一种情况下,如果接收到英语单词“apple”,那么控制单元101可以确定由用户说出的单词是英语。
本发明还可以通过将能够实现上述示例性实施例的一个或多个功能的程序经由网络或存储介质供给到系统或装置、并且使该系统或装置的计算机中的一个或多个处理器读出并执行程序的处理来实现。另外,本发明还可以通过能够实现一个或多个功能的电路(例如,专用集成电路(ASIC))来实现。
本发明不限于上述示例性实施例,因为它们是或者可以在被实际实现时利用在不脱离本发明的精神的范围内修改的组件来实现。另外,可以通过在上述示例性实施例中公开的多个组件的任意组合来做出各种发明。例如,可以从示例性实施例中表示的所有组件中省略若干组件。另外,组件可以跨不同的示例性实施例任意组合。
其它实施例
本发明的实施例还可以通过读出并执行记录在存储介质(其也可以被更完整地称为‘非暂时性计算机可读存储介质’)上的计算机可执行指令(例如,一个或多个程序)以执行上述实施例中的一个或多个的功能和/或包括用于执行上述实施例中的一个或多个的功能的一个或多个电路(例如,专用集成电路(ASIC))的系统或装置的计算机、以及通过由系统或装置的计算机通过例如读出并执行来自存储介质的计算机可执行指令以执行上述实施例中的一个或多个的功能和/或控制一个或多个电路以执行上述实施例中的一个或多个的功能而执行的方法来实现。计算机可以包括一个或多个处理器(例如,中央处理单元(CPU)、微处理单元(MPU)),并且可以包括单独的计算机或单独的处理器的网络,以读出并执行计算机可执行指令。计算机可执行指令可以例如从网络或存储介质提供给计算机。存储介质可以包括例如硬盘、随机存取存储器(RAM)、只读存储器(ROM)、分布式计算系统的存储设备、光盘(诸如紧凑盘(CD)、数字多功能盘(DVD)或蓝光盘(BD)TM)、闪速存储器设备、存储卡等中的一个或多个。
本发明的实施例还可以通过如下的方法来实现,即,通过网络或者各种存储介质将执行上述实施例的功能的软件(程序)提供给系统或装置,该系统或装置的计算机或是中央处理单元(CPU)、微处理单元(MPU)读出并执行程序的方法。
虽然已参考示例性实施例描述了本发明,但是要理解的是,本发明不限于所公开的示例性实施例。以下权利要求的范围要被赋予最广泛的解释,以便涵盖所有这样的修改以及等同的结构和功能。
Claims (13)
1.一种电子装置,包括:
语音接收单元;
显示单元;以及
控制单元,
其中所述控制单元被配置为执行控制以便识别由所述语音接收单元接收的语音输入的语言,并且
其中,在确定识别的语言是与被设置为所述电子装置上的主语言的第二语言不同的第一语言的情况下,所述控制单元被配置为在所述显示单元上以所述第一语言和第二语言这两者显示用于确认是否要将所述主语言从所述第二语言改变为所述第一语言的消息。
2.根据权利要求1所述的电子装置,其中所述控制单元被配置为在所述显示单元上以所述第一语言和第二语言这两者显示与所述消息对应的操作用户界面(UI)。
3.根据权利要求1所述的电子装置,其中,在确定接收到的语音输入的内容包含与所述第一语言和第二语言这两者不同的第三语言的情况下,所述控制单元被配置为以所述第三语言和第二语言这两者显示用于确认是否要将语言从所述第二语言改变为所述第三语言的消息。
4.根据权利要求1所述的电子装置,其中,在确定存在所述第一语言的多个候选的情况下,所述控制单元被配置为在所述显示单元上以被设置为所述电子装置上的主语言的第二语言显示用于确认是否要将所述主语言从所述第二语言改变为作为所述多个候选的各个语言的消息中的任何一个。
5.根据权利要求1所述的电子装置,其中,在确定存在所述第一语言的多个候选的情况下,所述控制单元被配置为在所述显示单元上以第四语言显示用于确认是否要将所述主语言从所述第二语言改变为所述第四语言的消息,所述第四语言是来自所述多个候选的语言中的一个。
6.根据权利要求1所述的电子装置,其中,在确定所述第一语言和第二语言彼此匹配的情况下,所述控制单元被配置为发出表示所述主语言不被改变的通知。
7.根据权利要求1所述的电子装置,还包括通信单元,
其中所述控制单元被配置为通过将语音输入转换成语音数据、经由所述通信单元将所述语音数据发送到外部装置、以及经由所述通信单元从所述外部装置接收作为分析所述语音数据的结果的信息来识别由所述语音接收单元接收的语音输入的语言。
8.根据权利要求1所述的电子装置,其中所述控制单元被配置为确定所述第一语言和第二语言是否彼此不同。
9.根据权利要求1所述的电子装置,其中,在所述显示单元上显示用于确认是否要改变所述主语言的设置的消息的情况下,所述控制单元被配置为使所述语音接收单元接收通过用户说出的用于改变所述主语言的指示,并且
其中所述控制单元被配置为根据由所述语音接收单元接收的通过用户说出的指示来确定是否要改变所述主语言的设置。
10.根据权利要求1所述的电子装置,还包括操作单元,
其中所述操作单元被配置为接收是否要从所述第二语言改变所述主语言的指示。
11.一种用于控制电子装置的方法,所述电子装置包括语音接收单元和显示单元,所述方法包括:
执行控制以便识别由所述语音接收单元接收的语音输入的语言;以及
在确定识别的语言是与被设置为所述电子装置上的主语言的第二语言不同的第一语言的情况下,在所述显示单元上以所述第一语言和第二语言这两者显示用于确认是否要将所述主语言从所述第二语言改变为所述第一语言的消息。
12.一种用于存储计算机可读程序的非暂时性计算机可读存储介质,所述计算机可读程序用于使包括语音接收单元和显示单元的电子装置执行如下控制方法,所述控制方法包括:
执行控制以便识别由所述语音接收单元接收的语音输入的语言;以及
在确定识别的语言是与被设置为所述电子装置上的主语言的第二语言不同的第一语言的情况下,在所述显示单元上以所述第一语言和第二语言这两者显示用于确认是否要将所述主语言从所述第二语言改变为所述第一语言的消息。
13.一种电子装置,包括:
语音接收单元;
通知单元;以及
控制单元,
其中所述控制单元被配置为执行控制以便识别由所述语音接收单元接收的语音输入的语言,并且
其中,在确定识别的语言是与被设置为所述电子装置上的主语言的第二语言不同的第一语言的情况下,所述控制单元被配置为通过所述通知单元以所述第一语言和第二语言这两者表示用于确认是否要将主语言从所述第二语言改变为所述第一语言的消息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018-171938 | 2018-09-13 | ||
JP2018171938A JP7406874B2 (ja) | 2018-09-13 | 2018-09-13 | 電子機器、その制御方法、およびそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110895925A true CN110895925A (zh) | 2020-03-20 |
CN110895925B CN110895925B (zh) | 2024-04-12 |
Family
ID=68207180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910814214.5A Active CN110895925B (zh) | 2018-09-13 | 2019-08-30 | 改变语言设置的电子装置及其控制方法、以及存储介质 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11188714B2 (zh) |
JP (1) | JP7406874B2 (zh) |
CN (1) | CN110895925B (zh) |
DE (1) | DE102019124350A1 (zh) |
GB (1) | GB2578512A (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7406874B2 (ja) * | 2018-09-13 | 2023-12-28 | キヤノン株式会社 | 電子機器、その制御方法、およびそのプログラム |
US11100926B2 (en) * | 2018-09-27 | 2021-08-24 | Coretronic Corporation | Intelligent voice system and method for controlling projector by using the intelligent voice system |
US11087754B2 (en) | 2018-09-27 | 2021-08-10 | Coretronic Corporation | Intelligent voice system and method for controlling projector by using the intelligent voice system |
JP2022181868A (ja) * | 2021-05-27 | 2022-12-08 | セイコーエプソン株式会社 | 表示システム、表示装置、及び表示装置の制御方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000293353A (ja) * | 1999-04-02 | 2000-10-20 | Canon Inc | 表示言語切替装置、表示言語切替方法、及び記憶媒体 |
JP2001175278A (ja) * | 1999-12-13 | 2001-06-29 | Sharp Corp | 表示手段を有する制御装置 |
JP2006244280A (ja) * | 2005-03-04 | 2006-09-14 | Kts:Kk | 表示言語切換装置及びプログラム |
CN1856142A (zh) * | 2005-04-25 | 2006-11-01 | 三星电子株式会社 | 设置移动终端中的主语言的方法和实现该方法的移动终端 |
JP2008077373A (ja) * | 2006-09-21 | 2008-04-03 | Oki Data Corp | 情報処理システム |
US20090204387A1 (en) * | 2008-02-13 | 2009-08-13 | Aruze Gaming America, Inc. | Gaming Machine |
CN101690146A (zh) * | 2007-07-10 | 2010-03-31 | 佳能株式会社 | 通信设备 |
JP2011008435A (ja) * | 2009-06-24 | 2011-01-13 | Kyocera Corp | 携帯端末、言語設定プログラムおよび言語設定方法 |
EP2821991A1 (en) * | 2013-07-04 | 2015-01-07 | Samsung Electronics Co., Ltd | Apparatus and method for recognizing voice and text |
CN105389162A (zh) * | 2014-09-09 | 2016-03-09 | 北京金山安全软件有限公司 | 终端系统语言的更改方法、装置及终端 |
EP3007059A1 (en) * | 2014-10-08 | 2016-04-13 | LG Electronics Inc. | Mobile terminal and controlling method thereof |
CN105511857A (zh) * | 2015-11-27 | 2016-04-20 | 小米科技有限责任公司 | 系统语言设置方法及装置 |
CN106681709A (zh) * | 2016-11-24 | 2017-05-17 | 宇龙计算机通信科技(深圳)有限公司 | 一种系统语言切换方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7689404B2 (en) | 2004-02-24 | 2010-03-30 | Arkady Khasin | Method of multilingual speech recognition by reduction to single-language recognizer engine components |
JP2006065528A (ja) | 2004-08-26 | 2006-03-09 | Sato Corp | 情報表示装置およびその方法 |
US9953630B1 (en) | 2013-05-31 | 2018-04-24 | Amazon Technologies, Inc. | Language recognition for device settings |
DE102017200976B4 (de) | 2017-01-23 | 2018-08-23 | Audi Ag | Verfahren zum Betreiben eines Kraftfahrzeugs mit einer Bedienvorrichtung |
WO2019084890A1 (en) | 2017-11-03 | 2019-05-09 | Tencent Technology (Shenzhen) Company Limited | Method and system for processing audio communications over a network |
JP7406874B2 (ja) * | 2018-09-13 | 2023-12-28 | キヤノン株式会社 | 電子機器、その制御方法、およびそのプログラム |
-
2018
- 2018-09-13 JP JP2018171938A patent/JP7406874B2/ja active Active
-
2019
- 2019-08-15 US US16/541,397 patent/US11188714B2/en active Active
- 2019-08-30 CN CN201910814214.5A patent/CN110895925B/zh active Active
- 2019-09-03 GB GB1912645.7A patent/GB2578512A/en not_active Withdrawn
- 2019-09-11 DE DE102019124350.5A patent/DE102019124350A1/de active Pending
-
2021
- 2021-11-24 US US17/535,077 patent/US11914958B2/en active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000293353A (ja) * | 1999-04-02 | 2000-10-20 | Canon Inc | 表示言語切替装置、表示言語切替方法、及び記憶媒体 |
JP2001175278A (ja) * | 1999-12-13 | 2001-06-29 | Sharp Corp | 表示手段を有する制御装置 |
JP2006244280A (ja) * | 2005-03-04 | 2006-09-14 | Kts:Kk | 表示言語切換装置及びプログラム |
CN1856142A (zh) * | 2005-04-25 | 2006-11-01 | 三星电子株式会社 | 设置移动终端中的主语言的方法和实现该方法的移动终端 |
JP2008077373A (ja) * | 2006-09-21 | 2008-04-03 | Oki Data Corp | 情報処理システム |
CN101690146A (zh) * | 2007-07-10 | 2010-03-31 | 佳能株式会社 | 通信设备 |
US20090204387A1 (en) * | 2008-02-13 | 2009-08-13 | Aruze Gaming America, Inc. | Gaming Machine |
JP2011008435A (ja) * | 2009-06-24 | 2011-01-13 | Kyocera Corp | 携帯端末、言語設定プログラムおよび言語設定方法 |
EP2821991A1 (en) * | 2013-07-04 | 2015-01-07 | Samsung Electronics Co., Ltd | Apparatus and method for recognizing voice and text |
CN105389162A (zh) * | 2014-09-09 | 2016-03-09 | 北京金山安全软件有限公司 | 终端系统语言的更改方法、装置及终端 |
EP3007059A1 (en) * | 2014-10-08 | 2016-04-13 | LG Electronics Inc. | Mobile terminal and controlling method thereof |
CN105511857A (zh) * | 2015-11-27 | 2016-04-20 | 小米科技有限责任公司 | 系统语言设置方法及装置 |
CN106681709A (zh) * | 2016-11-24 | 2017-05-17 | 宇龙计算机通信科技(深圳)有限公司 | 一种系统语言切换方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110895925B (zh) | 2024-04-12 |
US20220083735A1 (en) | 2022-03-17 |
GB2578512A (en) | 2020-05-13 |
JP2020042745A (ja) | 2020-03-19 |
JP7406874B2 (ja) | 2023-12-28 |
US20200089753A1 (en) | 2020-03-19 |
GB201912645D0 (en) | 2019-10-16 |
US11188714B2 (en) | 2021-11-30 |
US11914958B2 (en) | 2024-02-27 |
DE102019124350A1 (de) | 2020-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110895925B (zh) | 改变语言设置的电子装置及其控制方法、以及存储介质 | |
KR102572688B1 (ko) | 음성 인식 시스템, 서버, 디스플레이 장치 및 그 제어 방법 | |
EP3396665B1 (en) | Voice data processing method and electronic device supporting the same | |
US9983849B2 (en) | Voice command-driven database | |
KR102245747B1 (ko) | 사용자 명령어 등록을 위한 디스플레이 장치 및 방법 | |
TWI497406B (zh) | 用於為一語音辨識互動模組提供輸入功能之方法及電腦可讀取媒體 | |
CN109343819B (zh) | 在语音识别系统中控制显示装置的显示装置和方法 | |
US11462213B2 (en) | Information processing apparatus, information processing method, and program | |
US9734871B2 (en) | Voice retrieval apparatus, voice retrieval method, and non-transitory recording medium | |
JP5821639B2 (ja) | 音声認識装置 | |
US10599469B2 (en) | Methods to present the context of virtual assistant conversation | |
US8255218B1 (en) | Directing dictation into input fields | |
EP3608906A1 (en) | System for processing user voice utterance and method for operating same | |
US10586528B2 (en) | Domain-specific speech recognizers in a digital medium environment | |
JP2014049140A (ja) | 使用者デバイスで入力文字を利用した知能型サービス提供方法及び装置 | |
KR20130068303A (ko) | 음성 명령 수행장치, 이를 구비한 이동 단말기 및 음성 명령 수행방법 | |
KR20190122457A (ko) | 음성 인식을 수행하는 전자 장치 및 전자 장치의 동작 방법 | |
KR102656521B1 (ko) | 디스플레이 장치 및 디스플레이 장치의 제어 방법 | |
EP3772732A1 (en) | Terminal and operating method thereof | |
EP2806364B1 (en) | Method and apparatus for managing audio data in electronic device | |
KR102456588B1 (ko) | 사용자 명령어 등록을 위한 디스플레이 장치 및 방법 | |
KR20220143801A (ko) | 사용자 명령어 등록을 위한 디스플레이 장치 및 방법 | |
JP2017199057A (ja) | 電子機器、電子機器の制御方法、電子機器の制御装置、制御プログラムおよび電子機器システム | |
WO2018033067A1 (en) | Mobile device and method for generating perceptible output based on textual code | |
KR20200053290A (ko) | 전자 장치 및 그 제어 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |