CN109792464A - 通信终端装置、程序和信息处理方法 - Google Patents
通信终端装置、程序和信息处理方法 Download PDFInfo
- Publication number
- CN109792464A CN109792464A CN201780058601.XA CN201780058601A CN109792464A CN 109792464 A CN109792464 A CN 109792464A CN 201780058601 A CN201780058601 A CN 201780058601A CN 109792464 A CN109792464 A CN 109792464A
- Authority
- CN
- China
- Prior art keywords
- communication terminal
- user
- call
- head
- close
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 144
- 230000010365 information processing Effects 0.000 title claims description 5
- 238000003672 processing method Methods 0.000 title claims description 5
- 230000015654 memory Effects 0.000 claims abstract description 43
- 238000012360 testing method Methods 0.000 claims description 23
- 238000005259 measurement Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 8
- 238000009434 installation Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 240000006409 Acacia auriculiformis Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005674 electromagnetic induction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
- H04M1/72454—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/12—Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Environmental & Geological Engineering (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
一种通信终端装置将表示在通话期间输入的语音的语音数据记录在存储器中(S2),并且如果在通话期间不再检测到用户头部的接近(S3和S4;是),则基于记录在存储器中的言语数据,识别在比不再检测到头部的接近的时刻早预定时间段的时刻之后输入的发话(S5)。如果识别出预定关键字(S6;是)并且保持未能检测到用户头部的接近的状态(S7、S8;是),则通信终端装置执行通话结束控制以结束通话(S9)。
Description
技术领域
本发明涉及在通信终端装置中终止通话。
背景技术
在专利文献1中描述了一种终止通话而无需用户操作的技术,由此移动终端在识别出说出诸如“再见”或“拜拜”的关键字时终止通话。在专利文献2中描述了一种在通话期间利用语音命令来控制终端并且仅在必要时间段中启用识别语音命令的语音识别功能的技术。
现有技术文献
专利文献
专利文献1:JP 2002-325279 A1
专利文献2:JP 5481058 B
发明内容
本发明要解决的问题
专利文献1中描述的移动终端在通话开始时启用语音识别功能,并在通话期间继续执行语音识别,结果移动终端消耗大量电力。根据专利文献2中描述的技术,用户需要利用按钮或触摸屏来启用语音识别功能以使得语音命令能够被识别。因此,启用语音命令对用户而言有些不方便。
鉴于上述问题,本发明的目的在于使得能够响应于用户为终止通话而做出的自然动作来终止通话,同时抑制语音识别所消耗的电力。
解决问题的手段
为了解决上述问题,本发明提供了一种为了通话执行通信的通信终端装置,该通信终端装置包括:接近检测部,其被配置为检测用户的头部接近通信终端装置;语音输入接受部,其被配置为接受用户的语音的输入;记录部,其被配置为将表示用户在通话期间输入的语音的语音数据记录在存储器中;语音识别部,其被配置为在不再检测到头部接近通信终端装置时,基于存储在存储器中的语音数据来识别用户在通话期间的预定时刻之后的发话;以及通话终止控制部,其被配置为在识别出预定关键字并且未检测到头部接近通信终端装置时,终止通话。
在该通信终端装置中,所述预定时刻可以是在不再检测到头部接近通信终端装置的时刻之前预定时间段的时刻。
该通信终端装置还可包括被配置为测量通信终端装置的姿态的测量部,并且通话终止控制部可被配置为在未检测到头部接近通信终端装置之后检测到通信终端装置的姿态变化时,终止通话。
该通信终端装置还可包括被配置为提取用户在终止通话时所说出的词语的提取部,并且通话终止控制部可被配置为使用在终止一个或更多个通话中提取的词语作为关键字。
本发明提供了一种程序,该程序使得通信终端装置的计算机为了通话执行通信,所述程序执行以下操作:检测用户的头部接近通信终端装置;接受用户的语音的输入;将表示用户在通话期间输入的语音的语音数据记录在存储器中;在不再检测到头部接近通信终端装置时,基于存储在存储器中的语音数据来识别用户在通话期间的预定时刻之后的发话;以及在识别出预定关键字并且未检测到头部接近通信终端装置时,终止通话。
本发明提供了一种信息处理方法,该信息处理方法包括:检测用户的头部接近通信终端装置;接受用户的语音的输入;将表示用户在通话期间输入的语音的语音数据记录在存储器中;在不再检测到头部接近通信终端装置时,基于存储在存储器中的语音数据来识别用户在通话期间的预定时刻之后的发话;以及在识别出预定关键字并且未检测到头部接近通信终端装置时,终止通话。
本发明的效果
本发明使得可响应于用户结束通话所做出的自然动作而终止通话,同时抑制语音识别功能的电力消耗。
附图说明
图1是根据本发明的第一实施方式的通信终端装置的正视图。
图2是示出根据第一实施方式的通信终端装置的硬件配置的示例的图。
图3是示出根据第一实施方式的通信终端装置的处理器的功能配置的示例的图。
图4是示出根据第一实施方式的通信终端装置在通话期间执行的处理的流程图。
图5是示出根据第一实施方式的通信终端装置在通话期间执行的处理的具体示例的图。
图6是示出根据第一实施方式的通信终端装置在通话期间执行的处理的具体示例的图。
图7是示出根据本发明的第二实施方式的通信终端装置的处理器的功能配置的示例的图。
图8是示出根据第二实施方式的通信终端装置在通话期间执行的处理的流程图。
图9是示出根据第二实施方式的通信终端装置在通话期间执行的处理的具体示例的图。
图10是示出根据本发明的变型1的通信终端装置的处理器的功能配置的示例的图。
图11是示出根据变型1的通信终端装置在通话期间执行的处理的流程图。
标号的描述
10、10A、10B···通信终端装置,11···处理器,111···接近检测部,112···语音输入接受部,113···记录部,114、114A···语音识别部,115、115A···通话终止控制部,116···测量部,117···提取部,12···存储器,13···存储装置,14···通信装置,15···输入装置,151···接近传感器,152···麦克风,16···输出装置,161···扬声器,162···显示区域,17···总线
具体实施方式
下面将参照附图描述本发明的实施方式。
[第一实施方式]
图1是根据本发明的第一实施方式的通信终端装置10的正视图。通信终端装置10是由用户持握在他/她的手中的便携式通信终端装置。在本实施方式中,通信终端装置10是智能电话。
通信终端装置10为了通话而进行通信。为了使得用户能够进行通话,通信终端装置10包括位于装置的正面的麦克风152和扬声器161。麦克风152是用于输入用户的语音的语音输入装置。麦克风152被布置为使得它可被定位在进行通话的用户的嘴旁边。扬声器161是用于输出语音的语音输出装置。扬声器161被布置为使得它可被定位在进行通话的用户的头部(具体地,耳朵)旁边。
通信终端装置10还包括在装置的正面的显示区域162和接近传感器151。显示区域162是显示图像(画面)的显示器的显示区域。接近传感器151与扬声器161相邻设置,并且是用于检测物体的接近的传感器。如本文所用,术语“接近”是指接触状态和非接触状态二者。例如,接近传感器151是红外光传感器、使用电磁感应的高频振荡传感器或者使用磁体的磁传感器。可使用任何类型的检测方法。
图2是示出通信终端装置10的硬件配置的示例的图。通信终端装置10物理上被配置为包括处理器11、存储器12、存储装置13、通信装置14、输入装置15、输出装置16和总线17的计算机装置。
在以下描述中,术语“装置”可指电路或单元。通信终端装置10可包括附图中所示的一个或更多个装置,或者可不包括附图中所示的一些装置。
处理器11例如通过运行操作系统来控制计算机。处理器11可包括中央处理单元(CPU),其包括到外围装置的接口、控制装置、算术装置和寄存器。
处理器11将程序(程序代码)、软件模块和数据从存储装置13和/或通信装置14读取到存储器12,以使得其基于读取的数据执行各种处理。使用使得计算机执行本实施方式的至少部分操作的程序作为程序。各种处理可由单个处理器11来执行,或者可由两个或更多个处理器11同时或顺序地执行。处理器11可包括一个或更多个芯片。程序可经由电子通信介质接收。
存储器12是计算机可读记录介质,并且例如包括只读存储器(ROM)、可擦除可编程ROM(EEPROM)和随机存取存储器(RAM)中的至少一种。存储器12可被称为寄存器、高速缓存或主存储器。
存储装置13是计算机可读记录介质,并且例如包括光盘(例如,紧凑盘ROM(CD-ROM))、硬盘驱动器、软磁盘、磁光盘(例如,紧凑盘、数字多功能盘、Blu-ray(注册商标)盘)、智能卡、闪存(例如,卡、棒、保密磁盘(key drive))、软(注册商标)盘和磁条中的至少一个。存储装置13可被称为辅助存储装置。
通信装置14是允许计算机之间经由无线网络的通信的硬件(发送和接收装置)。通信装置14可被称为网络装置、网络控制器、网卡或通信模块。通信装置14为了通话执行通信。
输入装置15是接受来自诸如键盘、鼠标、麦克风152、开关、按钮和传感器(包括接近传感器151)的外部源的输入的装置。输出装置16是向诸如显示器、扬声器161和LED灯的外部装置执行输出的装置。
诸如处理器11和存储器12的装置通过总线17连接以进行数据通信。总线17可包括单个总线,或者可包括多个总线以连接装置。
通信终端装置10可包括诸如微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、可编程逻辑装置(PLD)和现场可编程门阵列(FPGA)的硬件。硬件可用作部分或全部功能块。例如,处理器11可包括多项硬件中的至少一个。
通过使得诸如处理器11和存储器12的硬件读取软件(程序)以使得处理器11能够控制由通信装置14执行的通信以及在存储器12和存储装置13中执行的读取和/或写入来提供通信终端装置10的功能。
图3是示出通信终端装置10的处理器11的功能配置的示例的框图。处理器11包括接近检测部111、语音输入接受部112、记录部113、语音识别部114和通话终止控制部115。
基于接近传感器151输出的值,接近检测部111检测到用户的头部接近通信终端装置10。当接近检测部111在通话期间检测到物体的接近时,该物体被视为用户的头部。术语“在通话期间”是指建立起的通信路径可用于通话的时间段。接近检测部111向语音识别部114和通话终止控制部115通知用户的头部是否靠近通信终端装置10。
语音输入接受部112接受经由麦克风152输入的用户语音。语音输入接受部112将麦克风152提供的模拟语音信号转换为例如是表示语音波形的波形数据的数字语音数据。语音输入接受部112将语音数据提供给记录部113。
记录部113将表示在通话期间输入的用户语音的语音数据记录在存储器12中。换言之,记录部113记录用户语音。存储在存储器12中的语音数据将被称为“语音数据SD”。
当在通话期间不再检测到用户的头部接近通信终端装置10时,语音识别部114基于存储在存储器12中的语音数据SD识别通话期间的预定时刻之后输入的用户语音。术语“预定时刻”是指在不再检测到用户头部的接近时的时刻的预定时间段之前的时刻。作为语音识别的结果,用户语音被转换为字符串(文本代码)。
通话终止控制部115执行通话终止控制,这是终止通话的功能,或更具体地,断开用于通话的通信路径的功能。在未检测到用户的头部接近通信终端装置10的时间段语音识别部114识别出存储在存储器12中的关键字KW时,通话终止控制部115执行通话终止控制。例如,关键字KW是预定字符串。关键字KW可在通信终端装置10的设计阶段决定,或者可由用户指定。关键字KW是终止通话时说出的词语,例如“再见”或“回见”。
图4是示出通信终端装置10在通话期间执行的处理的流程图。图5和图6是示出通信终端装置10在通话期间执行的处理的具体示例的图。
记录部113确定通信终端装置10中是否正在进行通话(步骤S1)。当由通信装置14建立的通信路径可用于通话时,记录部113在步骤S1确定“是”。随后,记录部113将由语音输入接受部112基于来自麦克风152的输入而生成的语音数据记录在存储器12中(步骤S2)。如图5所示,在时间t1用户U开始使用通信终端装置10进行通话的情况下,记录部113从通话开始的时间开始记录语音数据。
随后,接近检测部111基于接近传感器151输出的值来检测用户的头部是否靠近通信终端装置10(步骤S3)。在图5中,自通话开始的时间t1起,通信终端装置10已被持握到用户U的右耳。在这种情况下,接近检测部111检测到用户U的头部靠近通信终端装置10。
随后,接近检测部111确定是否不再检测到用户头部的接近(步骤S4)。在步骤S4,确定之前靠近用户头部的通信终端装置10是否已从头部移开。当在步骤S4确定“否”时,通信终端装置10在维持通话的同时返回到步骤S1,因为认为通信终端装置10靠近用户的头部并且用户仍在说话。
记录部113在通话期间继续记录语音数据的步骤S2(例如,在图5所示的时间t2)。然而,没有必要将在通话期间记录的所有语音数据都保存在存储器12中。仅需要在存储器12中至少保存表示在当前时刻的预定时间段之前的时刻之后输入的语音的语音数据。换言之,可以删除在该较早时刻之前生成的语音数据。“预定时间段”例如在3至10秒的范围内。
随后,在时间t3,用户U说出词语“再见”。这种话语被包括在终止通话时自然地执行的动作中。表示该话语的语音数据被记录在存储器12中。随后,在时间t4,用户U将通信终端装置10从耳朵移开。此动作也被包括在终止通话时自然地执行的动作中。在此动作之后,接近检测部111检测到用户的头部没有接近通信终端装置10,由此接近检测部111确定不再检测到用户头部的接近(步骤S4;是)。
随后,语音识别部114基于存储在存储器12中的语音数据SD识别用户的语音(步骤S5)。在步骤S5,识别在不再检测到用户头部的接近的时刻的预定时间段之前的时刻之后输入的用户语音。在图5的示例中,识别在时间段T期间输入的用户语音,该时间段T从时间t4的预定时间之前的时间t23开始并在时间t4结束。当不再检测到用户的头部接近通信终端装置10时,语音识别部114识别用户的语音。
在图5的示例中,可以删除在时间t23之前记录的语音数据。通过删除对于语音识别而言不需要的语音数据,释放了存储器12的存储区域。
随后,通话终止控制部115确定语音识别部114是否识别出关键字KW(步骤S6)。具体地,通话终止控制部115确定用户U是否在从时间t23开始并在时间t4结束的时间段T期间说出关键字KW。
当在步骤S6确定“否”时,通信终端装置10在维持通话的同时返回到步骤S1。
在如图5所示,用户U在时间t3说出词语“再见”的情况下,通话终止控制部115在步骤S6确定“是”。在这种情况下,接近检测部111基于接近传感器151输出的值来检测用户的头部是否靠近通信终端装置10(步骤S7)。随后,接近检测部111检测用户的头部是否仍靠近通信终端装置10(步骤S8)。执行步骤S7和S8以确定在用户说出终止通话的关键字KW之后通信终端装置10是否保持远离用户的头部。
当在步骤S8确定“是”时,通话终止控制部115执行通话终止控制(步骤S9)。在图5的示例中,从时间t4到时间t5没有检测到用户头部的接近,由此通话终止控制部115执行通话终止控制。在执行通话终止控制之后,记录部113停止记录语音数据。
另一方面,当在步骤S8确定“否”时,即,当再次检测到用户头部的接近时,通信终端装置10在维持通话的同时返回到步骤S1。在如图6所示,在用户U在时间t3说出关键字KW“再见”并将通信终端装置10从耳朵移开的情况下,用户可能想起有事要说并重新开始交谈。在图6所示的示例中,用户U在时间t6再次将通信终端装置10放到耳边。为了在这种情况下不执行通话终止控制,当在步骤S8确定“否”时,通信终端装置10维持通话。
在以上所描述的通信终端装置10中,在通话期间没有连续地执行语音识别。相反,关于在通话期间输入的用户语音的语音数据被记录在存储器12中,并且当不再检测到用户头部的接近时,基于存储在存储器12中的语音数据SD来识别语音。因此,与在通话期间连续地执行语音识别的情况相比,在通信终端装置10中消耗较少量的电力。通信终端装置10还仅在识别出用户所说出的关键字KW并且没有检测到用户头部的接近时才执行通话终止控制。因此,与用户意图相反地终止通话的可能性低。
[第二实施方式]
现在,将描述本发明的第二实施方式。
根据本实施方式的通信终端装置10A基于当用户准备终止通话时所测量的装置的姿态变化来确定是否执行通话终止控制。在本实施方式中,与第一实施方式共享的组件由相同的标号表示。
图7是示出通信终端装置10A的处理器11的功能配置的示例的框图。处理器11包括接近检测部111、语音输入接受部112、记录部113、语音识别部114A、通话终止控制部115A和测量部116。输入装置15包括姿态传感器153(测量通信终端装置10A的姿态的传感器)。例如,姿态传感器153是三轴加速度传感器、角速度传感器或者能够测量根据通信终端装置10A的姿态变化(例如,旋转)而改变的物理量的任何其它传感器。
测量部116基于姿态传感器153所测量的值来测量通信终端装置10A的姿态。在本实施方式中,接近检测部111向语音识别部114A、通话终止控制部115A和测量部116通知用户的头部是否靠近通信终端装置10A。响应于该通知,测量部116确定通信终端装置10的姿态是否改变。
当满足与第一实施方式相同的条件,并且在接近检测部111未检测到用户头部的接近之后通信终端装置10A的姿态改变时,通话终止控制部115A执行通话终止控制。
图8是示出通信终端装置10A在通话期间执行的处理的流程图。图9是示出通信终端装置10A在通话期间执行的处理的具体示例的图。
在通话期间,在通信终端装置10A中,记录部113将由语音输入接受部112基于来自麦克风152的输入而生成的语音数据记录在存储器12中(步骤S1和S2)。随后,测量部116基于姿态传感器153测量的值来测量通信终端装置10A的姿态(步骤S11)。随后,接近检测部111基于接近传感器151输出的值来检测用户的头部是否靠近通信终端装置10A(步骤S3)。随后,接近检测部111确定是否不再检测到用户头部的接近(步骤S4)。
当在步骤S4确定“否”时,如第一实施方式的情况中一样,通信终端装置10A在维持通话的同时返回到步骤S1。
另一方面,当在步骤S4确定“是”时,执行不同于第一实施方式的步骤。具体地,当接近检测部111确定不再检测到用户头部的接近时,测量部116确定通信终端装置10A的姿态是否改变(步骤S12)。当在步骤S12确定“否”时,通信终端装置10A在维持通话的同时返回到步骤S1。
当在步骤S12确定“是”时,语音识别部114A基于存储在存储器12中的语音数据SD来识别用户的语音(步骤S5)。随后,当通话终止控制部115确定语音识别部114识别出了关键字KW(步骤S6;是),并且接近检测部111继续未检测到用户头部的接近(步骤S7和步骤S8;是)时,通话终止控制部115执行通话终止控制(步骤S9)。
当用户将通信终端装置10A从头部移开时,装置的姿态改变。通过比较图9所示的时间t3和t4处的通信终端装置10A的姿态可理解,当用户说出关键字KW时所测量的姿态与在用户已将通信终端装置10A从耳朵移开之后测量的姿态不同。根据通过姿态变化来触发通话终止控制的通信终端装置10A,在错误的时刻终止通话的可能性降低。另外,当在不再检测到用户头部的接近之后没有检测到通信终端装置10A的姿态变化时,不开始识别用户的语音。由于避免了不必要地识别用户语音,所以节省了电力。
[变型例]
本发明可按照不同于上述实施方式的实施方式实现。以下变型例中的两个或更多个可组合。
(变型例1)
根据本发明的通信终端装置可包括学习关键字的功能。根据本变型例的通信终端装置10B将用户在终止通话时说出的词语登记在存储器12中作为关键字。在本实施方式中,第一实施方式中所描述的“关键字KW”将被称为“关键字KW1”,而通过学习而登记的关键字将被称为“关键字KW2”。
图10是示出根据本变型例的通信终端装置10B的处理器11的功能配置的示例的框图。处理器11包括接近检测部111、语音输入接受部112、记录部113、语音识别部114、通话终止控制部115B和提取部117。
提取部117提取用户在终止通话时所说出的词语。例如,提取部117提取用户在终止通话之前刚刚说出的词语。提取部117将在终止一个或更多个通话中提取的词语登记为关键字KW2。当识别出关键字KW1或KW2时,通话终止控制部115B执行通话终止控制。
图11是示出通信终端装置10B在通话期间执行的处理的流程图。
提取部117提取用户在终止通话时说出的词语(步骤S21)。例如,提取部117提取每次通话由语音识别部114最后识别的词语。提取部117将所提取的词语记录在存储器12中。随后,提取部117将在终止一定次数的通话(该次数等于或大于阈值)时提取的词语登记在存储器12中作为关键字KW2(步骤S22)。这是因为用户在终止通话时所说出的词语很可能被反复使用。
在本变型例中,所登记的关键字KW2是在终止多次通话时提取的词语;然而,在终止单次通话时提取的词语也可被登记为关键字KW2。
通话终止控制部115B基于关键字KW2执行通话终止控制。通话终止控制部115B可在学习关键字KW2完成之前基于关键字KW1执行通话终止控制,并且在登记关键字KW2之后,可基于关键字KW1和KW2或仅基于关键字KW2来执行通话终止控制。
值得注意的是,本变型例可被应用于根据第二实施方式的通信终端装置10A。
根据本实施方式,如果用户在终止通话时所说出的词语是用户特定词语,可使得能够响应于用户终止通话所作出的自然动作而终止通话。
(变型例2)
通信终端装置10、10A或10B不限于智能电话,可以是能够为了通话而执行通信的通信终端装置,例如功能电话。另选地,根据本发明的通信终端装置可以是能够在用户的身体中生成表示所接收的语音的骨传导音的通信终端装置,即,包括能够输出骨传导音的扬声器的通信终端装置。通信终端装置使得用户能够在装置与用户头部的耳朵以外的部位接触时讲话。
根据本发明的通信终端装置可以不是在通话期间持握在用户的手中的通信终端装置。根据本发明的通信终端装置可以是可安装在用户头上的可穿戴终端的类型,例如头戴式耳机类型或耳机类型。
(变型例3)
本说明书中所描述的实施方式的处理次序、序列和流程图可改变,只要没有导致不一致即可。本说明书中所描述的方法包括按照示例性次序布置的步骤,这些步骤可按照另一次序布置。
(变型例4)
输入或输出信息可被存储在诸如存储器的地方,或者可在管理表中管理。输入或输出信息可被覆写、更新或另外写入。输出信息可被删除。输入信息可被发送到另一装置。
(变型例5)
可基于表示“0”或“1”的1比特值或者表示“真”或“假”的真伪(Boolean)值或者通过将值与预定值进行比较来进行确定。
(变型例6)
本说明书中所描述的实施方式可单独地使用或以具有较小改变的组合使用。可明确地或隐含地进行信息的通知(例如,“为X”的通知)。
以上详细描述了本发明;然而,对于本领域技术人员而言显而易见的是,本发明不限于本说明书中所描述的实施方式。在不脱离由权利要求的描述限定的本发明的精神和范围的情况下,可在修改或改变的实施方式中实现本发明。本说明书中的描述是出于例示性目的,而非旨在以任何方式限制本发明。
软件应该广义地解释为包括指令、指令集、代码、代码段、程序代码、程序、子程序、软件模块、应用、软件应用、软件包、例程、子例程、对象、可执行文件、执行线程、过程和函数,无论其被称为软件、固件、中间件、微码、硬件描述语言还是任何其它名称。软件和指令可经由传输介质来发送和接收。例如,可使用诸如同轴线缆、光纤线缆、双绞线或数字订户线(DSL)的有线介质和/或诸如红外线、无线或微波的无线介质从网站、服务器或另一远程源发送软件。有线介质和无线介质包括在传输介质的定义内。
本说明书中所描述的信息和信号可使用各种技术中的任何技术来表示。例如,以上所描述的数据、指令、命令、信息、信号、比特、符号和芯片可由电压、电流、电磁波、磁场或粒子、光场或光子、或者其任何组合来表示。
值得注意的是,本说明书中所描述的术语和/或理解本说明书所需的术语可由具有相同或相似含义的术语代替。
本说明书中所使用的术语“系统”和“网络”可互换使用。
本说明书中所描述的信息和参数可由绝对值、相对于预定值的值或其它对应信息表示。
本说明书中所使用的术语“确定”可指各种动作。例如,术语“确定”可指判断、计算、算出、处理、导出、调查、查找(例如,在表、数据库或数据结构中查找)和确认。术语“确定”还可指接收(例如,接收信息)、发送(例如,发送信息)、输入、输出和访问(例如,访问存储器中的数据)。术语“确定”还可指解决、选择、选定、确立和比较。
除非另外明确地说明,否则本说明书中所使用的描述“基于”并非意指“仅基于”。换言之,描述“基于”意指“仅基于”和“至少基于”二者。
如术语“包含”的情况一样,本说明书或权利要求中所使用的术语“包括”及其变体旨在为包含性的。本说明书或权利要求中所使用的术语“或”并非旨在为排他析取。
(变型例7)
用于描述上述实施方式的框图示出了功能单元的块。可使用硬件和/或软件项的任何组合来提供功能块。用于提供功能块的手段不受限制。可使用包括物理和/或逻辑组合的组件的单个装置、或者有线和/或无线地直接和/或间接连接的两个或更多个物理和/或逻辑分离的装置来提供功能块。
Claims (6)
1.一种为了通话而执行通信的通信终端装置,该通信终端装置包括:
接近检测部,该接近检测部被配置为检测用户的头部接近所述通信终端装置;
语音输入接受部,该语音输入接受部被配置为接受所述用户的语音的输入;
记录部,该记录部被配置为将表示所述用户在通话期间输入的语音的语音数据记录在存储器中;
语音识别部,该语音识别部被配置为在不再检测到头部接近所述通信终端装置时,基于存储在所述存储器中的语音数据来识别所述用户在所述通话期间的预定时刻之后的发话;以及
通话终止控制部,该通话终止控制部被配置为在识别出预定关键字并且未检测到头部接近所述通信终端装置时,终止所述通话。
2.根据权利要求1所述的通信终端装置,其中,所述预定时刻是在不再检测到头部接近所述通信终端装置的时刻的预定时间段之前的时刻。
3.根据权利要求1或2所述的通信终端装置,该通信终端装置还包括被配置为测量所述通信终端装置的姿态的测量部,其中,所述通话终止控制部被配置为在未检测到头部接近所述通信终端装置之后检测到所述通信终端装置的姿态变化时,终止通话。
4.根据权利要求1至3中任一项所述的通信终端装置,该通信终端装置还包括被配置为提取所述用户在终止通话时说出的词语的提取部,其中,所述通话终止控制部被配置为使用在终止一个或更多个通话时提取的词语作为所述关键字。
5.一种程序,该程序使得通信终端装置的计算机为了通话执行通信以:
检测用户的头部接近所述通信终端装置;
接受所述用户的语音的输入;
将表示所述用户在通话期间输入的语音的语音数据记录在存储器中;
在不再检测到头部接近所述通信终端装置时,基于存储在所述存储器中的语音数据来识别所述用户在所述通话期间的预定时刻之后的发话;以及
在识别出预定关键字并且未检测到头部接近所述通信终端装置时,终止所述通话。
6.一种信息处理方法,该信息处理方法包括:
检测用户的头部接近通信终端装置;
接受所述用户的语音的输入;
将表示所述用户在通话期间输入的语音的语音数据记录在存储器中;
在不再检测到头部接近所述通信终端装置时,基于存储在所述存储器中的语音数据来识别所述用户在所述通话期间的预定时刻之后的发话;以及
在识别出预定关键字并且未检测到头部接近所述通信终端装置时,终止所述通话。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016-210944 | 2016-10-27 | ||
JP2016210944 | 2016-10-27 | ||
PCT/JP2017/037702 WO2018079379A1 (ja) | 2016-10-27 | 2017-10-18 | 通信端末装置、プログラム及び情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109792464A true CN109792464A (zh) | 2019-05-21 |
CN109792464B CN109792464B (zh) | 2020-11-20 |
Family
ID=62024132
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780058601.XA Active CN109792464B (zh) | 2016-10-27 | 2017-10-18 | 通信终端装置、程序和信息处理方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11128749B2 (zh) |
EP (1) | EP3490232B1 (zh) |
JP (1) | JP6613382B2 (zh) |
CN (1) | CN109792464B (zh) |
WO (1) | WO2018079379A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110428806A (zh) * | 2019-06-03 | 2019-11-08 | 清华大学 | 基于麦克风信号的语音交互唤醒电子设备、方法和介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102666658B1 (ko) * | 2018-12-19 | 2024-05-20 | 현대자동차주식회사 | 차량 및 그 제어방법 |
US11462218B1 (en) * | 2020-04-29 | 2022-10-04 | Amazon Technologies, Inc. | Conserving battery while detecting for human voice |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020044636A1 (en) * | 1999-12-21 | 2002-04-18 | Bruno Richard Frank | Pay phone call completion method and apparatus |
CN1369165A (zh) * | 1999-06-07 | 2002-09-11 | 艾利森电话股份有限公司 | 控制语音控制的操作的装置和方法 |
US20100172345A1 (en) * | 2007-03-26 | 2010-07-08 | Digifonica (International) Limited | Emergency assistance calling for voice over ip communications systems |
CN102780815A (zh) * | 2012-06-29 | 2012-11-14 | 宇龙计算机通信科技(深圳)有限公司 | 自动挂断通话的方法及通信终端 |
JP2013201560A (ja) * | 2012-03-23 | 2013-10-03 | Sharp Corp | 携帯電話装置、制御方法、制御システム、制御プログラム、及び、プロセッサ |
TW201408036A (zh) * | 2012-08-09 | 2014-02-16 | Inventec Corp | 自動結束通話方法及通訊裝置 |
CN105530381A (zh) * | 2015-12-24 | 2016-04-27 | 小米科技有限责任公司 | 通话挂断方法及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002325279A (ja) * | 2001-04-26 | 2002-11-08 | Nec Corp | 無線携帯装置 |
KR20090107365A (ko) | 2008-04-08 | 2009-10-13 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 제어방법 |
JP5627342B2 (ja) * | 2010-08-27 | 2014-11-19 | 京セラ株式会社 | 携帯電話 |
JP5995405B2 (ja) * | 2011-03-28 | 2016-09-21 | 京セラ株式会社 | 携帯電子機器、表示切替方法及び表示切替プログラム |
JP2015012301A (ja) * | 2013-06-26 | 2015-01-19 | 京セラ株式会社 | 携帯電話機、携帯端末、音声操作プログラムおよび音声操作方法 |
EP3247091B1 (en) * | 2015-01-16 | 2020-02-26 | Ntt Docomo, Inc. | Communication terminal device, incoming-call control method, and program |
CN105072280A (zh) | 2015-08-27 | 2015-11-18 | 惠州Tcl移动通信有限公司 | 一种移动终端自动挂断电话的处理方法及系统 |
-
2017
- 2017-10-18 US US16/328,048 patent/US11128749B2/en active Active
- 2017-10-18 CN CN201780058601.XA patent/CN109792464B/zh active Active
- 2017-10-18 EP EP17865957.9A patent/EP3490232B1/en active Active
- 2017-10-18 JP JP2018547601A patent/JP6613382B2/ja active Active
- 2017-10-18 WO PCT/JP2017/037702 patent/WO2018079379A1/ja unknown
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1369165A (zh) * | 1999-06-07 | 2002-09-11 | 艾利森电话股份有限公司 | 控制语音控制的操作的装置和方法 |
US20020044636A1 (en) * | 1999-12-21 | 2002-04-18 | Bruno Richard Frank | Pay phone call completion method and apparatus |
US20100172345A1 (en) * | 2007-03-26 | 2010-07-08 | Digifonica (International) Limited | Emergency assistance calling for voice over ip communications systems |
JP2013201560A (ja) * | 2012-03-23 | 2013-10-03 | Sharp Corp | 携帯電話装置、制御方法、制御システム、制御プログラム、及び、プロセッサ |
CN102780815A (zh) * | 2012-06-29 | 2012-11-14 | 宇龙计算机通信科技(深圳)有限公司 | 自动挂断通话的方法及通信终端 |
TW201408036A (zh) * | 2012-08-09 | 2014-02-16 | Inventec Corp | 自動結束通話方法及通訊裝置 |
CN105530381A (zh) * | 2015-12-24 | 2016-04-27 | 小米科技有限责任公司 | 通话挂断方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110428806A (zh) * | 2019-06-03 | 2019-11-08 | 清华大学 | 基于麦克风信号的语音交互唤醒电子设备、方法和介质 |
CN110428806B (zh) * | 2019-06-03 | 2023-02-24 | 交互未来(北京)科技有限公司 | 基于麦克风信号的语音交互唤醒电子设备、方法和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109792464B (zh) | 2020-11-20 |
US20210075902A1 (en) | 2021-03-11 |
EP3490232A4 (en) | 2019-07-03 |
JPWO2018079379A1 (ja) | 2019-07-25 |
EP3490232A1 (en) | 2019-05-29 |
JP6613382B2 (ja) | 2019-11-27 |
US11128749B2 (en) | 2021-09-21 |
EP3490232B1 (en) | 2020-02-26 |
WO2018079379A1 (ja) | 2018-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10418027B2 (en) | Electronic device and method for controlling the same | |
CN103544143B (zh) | 用于推荐文本的方法和设备 | |
WO2019185003A1 (zh) | 一种显示控制方法及设备 | |
CN104717360B (zh) | 一种通话录音方法及终端 | |
CN109792464A (zh) | 通信终端装置、程序和信息处理方法 | |
EP3608906A1 (en) | System for processing user voice utterance and method for operating same | |
KR20150020997A (ko) | 액세서리 장치의 정보에 기반하여 디스플레이를 제어하는 전자 장치, 방법 및 관련된 액세서리 장치 | |
CN106851026A (zh) | 无效电话号码识别及清理方法、装置及移动终端 | |
CN106156583A (zh) | 一种语音解锁的方法及终端 | |
CN107835969A (zh) | 对电子设备的触摸感测模块进行控制的方法、电子设备、对设置在电子设备中的触摸感测模块进行操作的方法以及触摸感测模块 | |
CN107920162A (zh) | 控制闹钟的方法、移动终端及计算机可读存储介质 | |
CN107172258A (zh) | 一种保存联系人信息的方法、装置、终端及存储介质 | |
CN106126082A (zh) | 控制终端的方法、装置及终端 | |
EP2806332A2 (en) | Method for controlling state change and executing function and electronic device supporting the same | |
CN106339137A (zh) | 终端触控识别方法及装置 | |
CN107562356B (zh) | 指纹识别定位方法、装置、存储介质及电子设备 | |
CN108847243A (zh) | 声纹特征更新方法、装置、存储介质及电子设备 | |
CN106453910A (zh) | 通话录音的方法及装置 | |
CN107508979A (zh) | 音量调节方法、装置、终端及存储介质 | |
KR20150113572A (ko) | 영상데이터를 획득하는 전자장치 및 방법 | |
CN108833688A (zh) | 位置提醒方法、装置、存储介质及电子设备 | |
CN110958345B (zh) | 移动终端后盖检测方法、装置及计算机可读存储介质 | |
CN107301009A (zh) | 一种移除Toast消息框的方法、终端及计算机可读存储介质 | |
CN111027406A (zh) | 图片识别方法、装置、存储介质及电子设备 | |
CN107894869A (zh) | 一种分屏处理的方法、终端设备及计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |