CN110447067A - 发话装置、该发话装置的控制方法及该发话装置的控制程序 - Google Patents

发话装置、该发话装置的控制方法及该发话装置的控制程序 Download PDF

Info

Publication number
CN110447067A
CN110447067A CN201780088789.2A CN201780088789A CN110447067A CN 110447067 A CN110447067 A CN 110447067A CN 201780088789 A CN201780088789 A CN 201780088789A CN 110447067 A CN110447067 A CN 110447067A
Authority
CN
China
Prior art keywords
instructions
orders
people
giving
giving orders
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780088789.2A
Other languages
English (en)
Inventor
滨村博康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of CN110447067A publication Critical patent/CN110447067A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/06Decision making techniques; Pattern matching strategies

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)
  • Image Analysis (AREA)

Abstract

抑制个人信息等泄露给第三者。智能电话(1)具备:人情况确定部(13),其通过分析拍摄了本装置的周围的图像,执行确定存在于本装置的周围的人和其人数;可否发话决定部(14),其根据所述确定结果决定是否发话。

Description

发话装置、该发话装置的控制方法及该发话装置的控制程序
技术领域
本发明涉及一种具备语音发话功能的发话装置等。
背景技术
为了使设备与人进行对话,需要从周围环境检测出对话对象的技术和识别语音的技术。作为从周围环境检测出对话对象的方法,存在如下方法:配置多个麦克风,使用各麦克风的相位差推测声源方向的方法,或者使用照相机检测人脸,由此检测出发话者的位置的方法等。
专利文献1中公开了一种机器人,其使用语音信息和图像信息检测出对话对象,并进行对话。该机器人自发话者的语音中识别表示会话开始的特定的语音,并通过声源方向推测检测出发话者的方向,移动至检测出的发话者的方向,并在移动之后从照相机输入的图像中检测人脸,在检测出人脸的情况下,进行对话处理。
现有技术文献
专利文献
专利文献1:日本公开专利公报“特开2006-251266号公报(2006年9月21日公开)”
发明内容
发明要解决的问题
然而,上述现有技术中存在如下问题点:机器人发出与用户个人信息等的隐私相关的信息时,第三者在用户的附近的情况下,用户本身的个人信息等被第三者获知,因此存在机器人的会话损害用户的心情的可能性。
本发明鉴于以上问题点而做出,其目的在于提供一种能够抑制个人信息等被泄露给第三者的发话装置等。
用于解决问题的方案
为了解决上述课题,本发明的一方面涉及的发话装置是具有语音发话功能的发话装置,其特征在于,具备:人情况确定部,其通过分析拍摄了所述发话装置的周围的图像,执行确定存在于所述发话装置的周围的人的处理及确定存在于所述发话装置的周围的人数的处理中的至少一个;可否发话决定部,其根据所述确定结果决定是否发话。
为了解决上述课题,本发明的一方面涉及的发话装置的控制方法是具有语音发话功能的发话装置的控制方法,其特征在于,包括:人情况确定步骤,其通过分析拍摄了所述发话装置的周围的图像,执行确定存在于所述发话装置的周围的人的处理及确定存在于所述发话装置的周围的人数的处理中的至少一个;可否发话决定步骤,其根据所述确定结果决定是否发话。
发明效果
根据本发明的一方面涉及的发话装置或其控制方法,可获得如下效果:能够抑制个人信息等被泄露给第三者。
附图说明
图1是表示本发明的一个实施方式涉及的通信系统的构成的框图。
图2为表示构成所述通信系统的智能电话及充电座的外观的图。
图3为用于说明所述通信系统的人的图像的拍摄方法的图。
图4为表示所述通信系统的动作的流程的流程图。
图5的(a)及(b)分别表示隐私信息的有无和发话内容之间的关系的图,图5的(c)表示信息的种类和机密等级之间的关系的图。
具体实施方式
若基于图1至图5说明本发明的实施方式,则如下所示。以下,为了便于说明,有时对与在某一项目中说明的构成具有同一功能的构成,在其他项目中标注相同的附图标记,并省略其说明。
〔通信系统的概要〕
本实施方式涉及的通信系统500由智能电话(发话装置)1和用于搭载智能电话1的充电座2构成。以下,使用图2说明智能电话1及充电座2的外观的一个示例。
图2为表示本实施方式涉及的通知系统500所包含的智能电话1及充电座2的外观的图。图2的(a)表示智能电话1和搭载有智能电话1的状态下的充电座2。
智能电话1是具有语音发话功能的发话装置的一个例子。智能电话1中搭载有控制装置(后述的控制部10),其用于控制智能电话1的各种功能。本发明涉及的发话装置只要是具备发话功能的装置即可,并不限定于智能电话。例如,可以是便携电话或平板PC等的终端装置,也可以是具备发话功能的家电或机器人等。
充电座2是能够搭载智能电话1的托架。充电座2在搭载智能电话1的状态下能够旋转。稍后基于图3对旋转进行说明。充电座2具备固定部210和壳体200。此外,充电座2也可以具备用于与电源连接的电缆220。
固定部210是充电座2的底座部分,并且是将充电座2设置在地面、桌子等上时固定充电座2的部分。壳体200是智能电话1的台座部分。壳体200的形状并不特别限定,但优选在旋转时也能够可靠地保持智能电话1的形状。壳体200在保持智能电话1的状态下,通过内置的电动机(后述的电动机120)的动力来旋转。并且,壳体200的旋转方向并不特别限定。以下的说明中,假设壳体200以大致垂直于固定部210的设置面的轴为中心,左右旋转。由此,能够使智能电话1旋转,并拍摄智能电话1的周围的图像。
图2的(b)表示没有搭载智能电话1的状态下的充电座2的外观的图。壳体200具有用于与智能电话1连接的连接器100。充电座2经由连接器100接收来自智能电话1的各种指示(命令),并基于该命令进行动作。并且,也可以使用没有具备充电功能的托架,以代替充电座2,所述托架能够与充电座2相同地保持智能电话1,并使其旋转。
〔主要部分构成〕
图1表示通信系统500(智能电话1级充电座2)的主要部分构成的示例的框图。如图所示,智能电话1具备控制部10、通信部20、照相机30、存储器40、扬声器50、连接器60、电池70、麦克风80及重置开关90。
通信部20进行其他装置和智能电话1之间的信息的收发(通信)。例如,智能电话1能够经由通信网络与发话短语服务器600进行通信。
通信部20将从其他装置接收到的信息发送至控制部10。例如,智能电话1经由通信部20从发话短语服务器600接收固定文本的发话短语、以及用于生成发话短语的发话模板,并送给控制部10。照相机30是输入设备,其用于获取表示智能电话1周围的情况的信息。
照相机30以静态图像或动态图像拍摄智能电话1的周边。照相机30根据控制部10的控制进行拍摄,并将拍摄数据发送至控制部10的信息获取部12。
控制部10整体控制智能电话1。控制部10具备语音识别部11、信息获取部12、人情况确定部13、可否发话决定部14、发话内容决定部15、输出控制部16及命令创建部17。
语音识别部11对经由麦克风80收集的语音进行语音识别。此外,语音识别部11向信息获取部12通知表示识别了语音的信息,并向命令创建部17发送表示识别了语音的信息及语音识别的结果。
信息获取部12获取拍摄数据。当从语音识别部11通知表示识别了语音的信息,则获取照相机30拍摄了智能电话1的周围的拍摄数据。信息获取部12随时将拍摄数据发送至人情况确定部13。由此,在后述的人情况确定部13中,在照相机30的拍摄及信息获取部12的拍摄数据的获取大致相同的时机上随时进行人脸图像的检测,以及对所检测出的人脸图像和存储器40中预先存储的登记人脸图像进行比较。
信息获取部12还可以进行照相机30的启动及停止的控制。例如,信息获取部12在从语音识别部11通知了表示识别了语音的信息时,可以启动照相机30。此外,信息获取部12也可以在通过充电座2及搭载于该充电座2的智能电话1的旋转而完成智能电话1的周围360°拍摄时,停止照相机30。
人情况确定部13通过分析从信息获取部12获取的拍摄数据,自拍摄数据提取人脸图像,根据提取的人脸图像的个数,确定存在于通信系统500周围的人数。此外,人情况确定部13对自拍摄数据提取的人脸图像和存储器40中预先存储的登记人脸图像进行比较,并进行人识别(确定存在于通信系统500的周围的人的处理)。具体为,确定自拍摄数据提取的人脸图像的人是否为规定的人(例如,智能电话1的持有者)。拍摄数据的分析方法并不特别限定,例如,通过模式匹配判断自拍摄数据提取的人脸图像和存储于存储器40中的登记人脸图像,由此,能够确定拍摄数据中是否显示有人。
可否发话决定部14根据人情况确定部13所确定的、存在于智能电话1的周围的人数以及每个人的确定结果,决定是否发话。例如,可否发话决定部14在确定到仅有一个规定的人的情况下,可以决定为进行发话。周围存在的人数仅为一人的情况下,该人为智能电话1的持有者的可能性高。因此,即使发话内容中包含持有者的个人信息等,在该个人信息等被泄露给第三者的可能性低的情况下,也能够使智能电话1发话。
此外,可否发话决定部14在确定为存在两个人以上的情况下,可以决定为不进行发话。在周围存在的人数为两人以上的情况下,包括智能电话1的持有者以外的第三者的可能性高。因此,所确定的人为两人以上的情况下,不进行发话,由此,能够抑制智能电话1的持有者的个人信息等被泄露给第三者。
此外,可否发话决定部14也可以在确定了规定的人是规定人数(例如,一人)的情况下,决定为进行发话。根据上述构成,仅在周围存在的人数限定于规定人数(例如,一人)的情况下,使智能电话1进行发话。由此,能够抑制由于智能电话1的发话而导致个人信息等被泄露给第三者。
此外,可否发话决定部14也可以在所确定的人是规定的人数(例如,两人)以上的情况下,决定为不进行发话。在周围存在的人数为规定人数以上的情况下,包括智能电话1的持有者以外的第三者的可能性高。因此,在所确定的人为规定人数以上的情况下,不进行发话,由此,能够抑制智能电话1的持有者的个人信息等被泄露给第三者。
如上所述,根据周围人的确定结果或周围存在的人数的确定结果决定是否进行发话,因此,能够抑制由于智能电话1的发话而导致个人信息等被泄露给第三者。
此外,可否发话决定部14向发话内容决定部15通知可否发话的决定结果(表示进行发话/表示不进行发话)。当发话内容决定部15从可否发话决定部14接收到表示进行发话的信息的通知时,经由通信部20从发话短语服务器600接收发话短语、发话模板等的创建发话内容所需的数据,并决定发话内容。
发话内容决定部15在确定到仅有一个规定的人、且规定的人为智能电话1的持有者、并且可否发话决定部14决定为进行发话的情况下,在发话内容中包含持有者的个人信息。在确定到仅有一个规定的人、且规定的人为智能电话1的持有者的情况下,智能电话1的持有者的个人信息不会被泄露给第三者,因此,在发话内容中即使包含持有者的个人信息也没有问题。因此,在没有持有者以外的人的情况下,可以就广泛的话题展开讨论,包括含有个人信息等的私人话题。
此外,在确定到规定的人是规定人数、且规定的人是由智能电话1许可了包含个人信息的发话的人、可否发话决定部14决定为进行发话的情况下,可以在所述发话内容中包含所述许可的人的个人信息。在确定到规定人数的规定的人,且其规定的人是被智能电话1许可了包含个人信息的发话的人的情况下,许可了包含个人信息的发话的人的个人信息不会泄露给第三者,因此,在发话内容中即使包含个人信息也没有问题。因此,在不存在被许可了包含个人信息的发话的人以外的人的情况下,可以就广泛的话题展开讨论,包括含有个人信息等的私人话题。
在人情况确定部13确定了规定的人和其他的人,且可否发话决定部14决定为进行发话的情况下,发话内容决定部15可以从发话内容中排除规定的人的个人信息,或者将个人信息替换为非个人信息。由此,能够抑制规定的人的个人信息等泄露给第三者,并且能够使智能电话1与用户对话。此外,可否发话决定部14可以仅通过人数来决定可否发话,而无需确定人。
此外,发话内容决定部15预先对智能电话1发出的消息设定机密等级,在人情况确定部13确定了多个人且可否发话决定部14决定为进行发话的情况下,可以对应于所确定的人数的增加,发出机密等级更低的消息。由此,对应于所确定的人数增加而降低发出消息的机密等级,因此,能够防止机密等级高的消息传达给多个人,并且在周围存在多个人的情况下也可以使智能电话1进行发话。
此外,发话内容决定部15预先对智能电话1发出的消息设定机密等级,在人情况确定部13确定到规定的人和其他的人且可否发话决定部14决定为进行发话的情况下,可以发出对应于其他的人的身份的机密等级的消息。由此,能够对应于其他的人的身份而调整发出的消息的机密等级。
发话内容决定部15在决定了发话内容的情况下,将其发话内容的决定结果向输出控制部16发送。输出控制部16使扬声器50输出与由发话内容决定部15决定的发话内容相关的语音。
命令创建部17创建针对充电座2的指示(命令),并向充电座2发送。命令创建部17在从语音识别部11接收了表示识别了语音的通知的情况下,创建旋转指示,并经由连接器60向充电座2发送该指示,所述旋转指示是用于使充电座2的壳体200旋转的指示。
此处,对旋转进行更详细的说明。本实施方式中,如图3所示,“旋转”是指在水平面的360°范围内以顺时针或逆时针使智能电话1(上述的充电座2的壳体200)旋转的意思。并且,如同图所示,通信系统500的照相机30的可拍摄范围是X°,因此,通过以相互不重叠的方式滑动该X°范围,能够有效地拍摄周围的人。并且,壳体200的旋转范围可以小于360°。
进一步,命令创建部17也可以在人情况确定部13全部检测到周围360°以内的人的时机上发送停止指示,所述停止指示用于使充电座2停止根据旋转指示的旋转。由于在检测到人之后不需要充电座2的旋转,因此,可以通过发送停止指示来抑制充电座2的不必要的旋转。
存储器40用于存储在智能电话1中使用的各种数据。存储器40例如可以存储人情况确定部13用于模式匹配的人脸的模式图像、输出控制部16输出的语音数据以及命令创建部17创建的命令的模板等。扬声器50是接收输出控制部16的控制并输出语音的输出设备。
连接器60是用于将智能电话1和充电座2电连接的接口。电池70是智能电话1的电源。连接器60将从充电座2获取到的电力发送至电池70,由此,使电池70充电。并且,连接器60及后述的充电座2的连接器100的连接方法以及物理形状并不特别限定,这些连接器例如可以通过USB(Universal Serial Bus)等实现。
重置开关90是用于停止、重新开始智能手机1的动作的开关。并且,在上述实施方式中,用于开始壳体200的旋转动作的触发是语音识别部11的语音识别,但是用于开始壳体200的旋转动作的触发不限于此。例如,上述的重置开关90被按压的事件,或者具备计算时间的定时器并通过该计时器而计算出经过规定时间的事件也可以作为开始壳体200的旋转动作的触发。
〔充电座的主要部分构成〕
如图1所示,充电座2具备连接器100、微型计算机110及电动机120。并且,充电座2能够经由电缆220与家庭用插座或者电池等的电源(未图示)连接。
连接器100是用于将充电座2与智能电话1电连接的接口。在充电座2与电源连接的情况下,连接器100经由智能电话1的连接器60将充电座2从该电源获取到的电力发送至电池70,由此,使电池70充电。
微型计算机110用于整体地控制充电座2。微型计算机110经由连接器100接收来自智能电话1的命令。微型计算机110根据所接收的命令,控制电动机120的动作。具体为,微型计算机110在从智能电话1接收到旋转指示的情况下,控制电动机120以使壳体200旋转。
电动机120是用于使壳体200旋转的动力装置。电动机120根据微型计算机110的控制进行动作或停止,由此,使固定部210旋转或停止。
〔通信系统的动作〕
接下来,基于图4对上述通信系统500的动作进行说明。图4是表示通信系统的动作的流程的流程图。首先,当语音识别部11识别语音,则开始处理。
在S101中,信息获取部12启动用于检测人的照相机30。此时,人情况确定部13设定为人数N=0、Private(隐私)=假,并进行到S102。在S102中,通过照相机30拍摄前方X°的范围(参照图3),并进行到S103。在S103中,人情况确定部13从所拍摄的图像中提取人脸,并进行到S104。
在S104中,人情况确定部13计算所提取的人数,将计算出的数加到人数N,并进行到S105。在S105中,人情况确定部13判断人脸中是否包含持有者的脸,如果其结果为真,则设定为Private=真,并进行到S106。
在S106中,信息获取部12确认是否拍摄了周围360°的范围,当拍摄了周围360°的范围的情况下,进行到S107。例如,旋转角度X为60°的情况下,如果5次的旋转动作和6个方向的拍摄结束,则判断为拍摄了周围360°的范围。另一方面,在没有拍摄到周围360°的范围的情况下,进行到S108。在S108中,使壳体200以顺时针或逆时针旋转X°,并返回到S102。在S107中,信息获取部12使照相机30的动作结束,并进行到S109。
在S109中,可否发话决定部14确认人情况确定部13所确定的人数N是否为N=1,在人数=1的情况下,进行到S110。另一方面,在人数N≠1的情况下,进行到S112。在S110中,可否发话决定部14确认人情况确定部13所确定的Private是等于真还是假,在Private=真的情况下,进行到S111。另一方面,在Private=假的情况下,进行到S112。由于存在S111中进行发话,在S112中不进行发话的情况,因此,可以说是在S109及S110中,可否发话决定部114决定是否进行发话,其详情将后述。
S111中,发话内容决定部15决定为在发话内容中包含持有者的个人信息等(隐私信息),并根据其决定来确定发话内容(输出什么消息)。并且,输出控制部16使扬声器50输出所决定的发话内容,并“结束”。
在S112中,进行用于防止由于智能电话1的发话而泄露个人信息等的处理。具体为,在S112中进行如下处理中的任意一个:(1)在发话内容中不包括持有者的隐私信息并进行发话;(2)将隐私信息替换为非隐私信息而进行发话;以及(3)不进行发话。
在进行上述(1)或(2)的处理的情况下,由发话内容决定部15决定发话内容(输出什么消息)。并且,输出控制部16使扬声器50输出所决定的发话内容,并“结束”。另一方面,在进行上述(3)的处理的情况下,可否发话决定部14决定为不进行发话,并不进行发话而结束。
〔发话内容的决定方法的具体例〕
接下来,基于图5对发话内容的决定方法的具体例进行说明。图5的(a)及(b)是分别示出隐私信息(个人信息等)的有无和发话内容之间的关系的图。
在使用图5的(a)所示的发话模板([]先生有来电)来决定发话内容的情况下,[]内是隐私信息,例如,在发话内容中包含隐私信息的情况下(图4的S111),在[]内输入个人名字“佐藤”。另一方面,在发话内容中不包含隐私信息的情况下(图4的S112),删除“[]先生”,发话内容简单地成为“有来电”。
接下来,在使用发话模板([]先生有邮件)来决定发话内容的情况下,[]内是隐私信息,例如,发话内容包含隐私信息的情况下(图4的S111),在[]内输入个人名字“佐藤”。另一方面,发话内容不包含隐私信息的情况下(图4的S112),删除“[]先生”,发话内容简单地成为“有邮件”。
接下来,在使用发话模板(今天的天气是[])来决定发话内容的情况下,[]内是非隐私信息,在发话内容中包含或不包含隐私信息的情况下共用例如“今天的天气是晴天”等的发话内容。如上所述,在进行不包含隐私信息的发话的情况下,没有必要一定进行如图4所示的处理。
在使用如图5的(b)所示的发话模板([]先生有来电)来决定发话内容的情况下,[]内是隐私信息,例如,在发话内容中包含隐私信息的情况下(图4的S111),在[]内输入个人名字“佐藤”。另一方面,将隐私信息替换为非隐私信息的情况下(图4的S112),在[]内输入英文字母“X”。
接下来,在使用发话模板([]先生有邮件)来决定发话内容的情况下,[]内是隐私信息,例如,在发话内容中包含隐私信息的情况下(图4的S111),在[]内输入个人名字“佐藤”。另一方面,将隐私信息替换为非隐私信息的情况下(图4的S112),在[]内输入英文字母“X”。
接下来,在使用发话模板(今天的天气是[])来决定发话内容的情况下,[]内是非隐私信息,在发话内容中包含隐私信息的情况下以及将隐私信息替换为非隐私信息的情况下共用例如“今天的天气是晴天”等的发话内容。
接下来,基于图5的(c)对发话内容中包含的信息种类和机密等级之间的关系进行说明。如图5的(c)是示出信息种类和机密等级之间的关系的图。例如,如同图所示,电话号码、邮件地址是不想让第三者知道的个人信息,因此,将机密等级设置得高。另一方面,个人名字是第三者可以知道的个人信息,因此,机密等级设置得低。
如上所述,智能电话1可以对发话消息预先设定机密等级。并且,在人情况确定部13确定了多个人且可否发话决定部14决定为进行发话的情况下,对应于所确定的人数的增加,发话内容决定部15以发出机密等级更低的消息的方式决定发话内容。可以如上述图5的(c)所示地设定机密等级的高低。并且,图5的(c)的例子中,机密等级是高和低的两个阶段,但是,也可以增加更多阶段。由此例如,可以在智能电话1的周围检测出一个人时发出机密等级高的消息,检测出两个人时发出机密等级为中程度的消息,检测出三人以上的人时发出机密等级低的消息等。
此外,在人情况确定部13确定到规定的人和其他的人且可否发话决定部14决定为进行发话的情况下,发话内容决定部15可以发出对应于其他的人的身份的机密等级的消息。可以如上述图5的(c)所示的设定机密等级的高低。由此,能够防止关于规定的人的隐私信息被泄露给不想传达该信息的其他的人,同时,存在这样的人的情况下也可以发出适当的内容。
进一步,发话内容决定部15也可以发出与人情况确定部13确定的人和人数的组合相对应的机密等级的消息。例如,可以构成为,在仅检测出智能电话1的用户和规定的其他的人(例如用户的家族、亲友)这两个人的情况下,发出机密等级为中程度以下的消息。
〔变形例〕
上述的实施方式中,说明了智能电话1“发话”的例子,智能电话1的动作也可以是“会话”。即,智能电话1也可以对应于用户发话的语音识别的结果而决定应答文,并语音输出该应答文。该情况下,与发话的情况相同地,智能电话1分析拍摄了周围的图像,执行确定存在于的周围的人的处理及确定存在于周围的人数的处理中的至少一个,并根据确定结果决定是否进行发话。此外,优选在决定为进行发话的情况下,根据周围存在的人的身份以及周围存在的人数中的至少一个,智能电话1决定是否在应答文中包含个人信息等。在决定为不包含个人信息的情况下,可以输出排除了个人信息的应答文,也可以输出替换为非个人信息的应答文。
并且,作为决定与用户的发话内容相对应的应答文的方法,例如,列举如下方法等:利用将用户的发话内容和对应于该发话内容的应答文相关联的数据库。
〔通过软件的实现例〕
智能电话1的控制块(尤其是人情况确定部13、可否发话决定部14及发话内容决定部15)可以由形成在集成电路(IC芯片)等中的逻辑电路(硬件)实现,或者可以通过使用CPU(Central P rocessing Unit:中央处理单元)的软件来实现。
在后者的情况下,智能电话1包括:CPU,其执行作为用于实现各功能的软件的程序的命令;ROM(Read Only Memory:只读存储器)或者存储装置(这些被称为“存储介质”),其储存上述程序和各种数据以供计算机(或CPU)能够读取;RAM(Random Access:随机存取存储器),其用于展开所述程序等。然后,通过计算机(或CPU)从存储介质读取上述程序并执行程序来实现本发明的目的。作为存储介质,可以使用例如磁带、磁盘、卡、半导体存储器、可编程逻辑电路等的“非暂时性有形介质”。此外,上述程序可以经由能够发送该程序的任意传输介质(通信网络,广播波等)提供给计算机。并且,本发明的一个方面也可以以上述程序通过电子传输来具体化、并嵌入在载波中的数据信号的形式来实现。
〔总结〕
本发明的第一方面涉及的发话装置(智能电话1)是具备语音发话功能的发话装置,其特征在于,具备:人情况确定部(13),其通过分析拍摄了所述发话装置的周围的图像,执行确定存在于所述发话装置的周围的人的处理及确定存在于所述发话装置的周围的人数的处理中的至少一个;可否发话决定部(14),其根据所述确定结果决定是否发话。
根据上述构成,根据周围人的确定结果或周围存在的人的人数的确定结果决定是否进行发话,因此,能够抑制由于发话装置的发话而导致个人信息等被泄露给第三者。
本发明的第二方面涉及的发话装置是如第一方面所述的发话装置,其中,所述可否发话决定部可以在确定到规定的人是规定人数的情况下,决定为进行发话。根据上述构成,在周围存在的人数限定于规定的人数(例如,一人)的情况下,使发话装置进行发话。由此,能够抑制由于发话装置的发话而导致个人信息等被泄露给第三者。
本发明的第三方面涉及的发话装置是如第一方面所述的发话装置,其中,所述可否发话决定部可以在所确定的人数为规定人数以上的情况下,决定为不进行发话。周围存在的人数为规定人数(例如,两人)以上的情况下,包括发话装置的持有者以外的第三者的可能性高。因此,所确定的人为规定人数以上的情况下,不进行发话,由此,能够抑制发话装置的持有者的个人信息等被泄露给第三者。
本发明的第四方面涉及的发话装置是如第二方面所述的发话装置,其中,所述规定的人是被发话装置许可了包含个人信息的发话的人,还可以具备发话内容决定部(15),其在所述可否发话决定部决定为进行发话的情况下,在所述发话内容中包含所述许可的人的个人信息。在确定到规定的人是规定人数,且其规定的人是发话装置许可了包含个人信息的发话的人的情况下,许可了包含个人信息的发话的人的个人信息不会泄露给第三者,因此,在发话内容中包含个人信息也没有问题。因此,在没有许可了包含个人信息的发话的人以外的人的情况下,能够以广泛的话题展开会话,该广泛的话题包含个人信息等的私人话题。
本发明的第五方面涉及的发话装置是如第一方面所述的发话装置,其中,还可以具备发话内容决定部,其在所述人情况确定部确定了规定的人和其他的人、且所述可否发话决定部决定为进行发话的情况下,从发话内容中排除规定的人的个人信息,或者将所述个人信息替换为非个人信息。根据上述构成,能够抑制规定的人的个人信息等泄露给第三者,并且能够使发话装置与用户对话。
本发明的第六方面涉及的发话装置是如第一方面所述的发话装置,其中,可以对所述发话装置发出的消息预先设定机密等级,还具备发话内容决定部(15),其在所述人情况确定部确定多个人、且所述可否发话决定部决定为进行发话的情况下,根据所确定的人数的增加,发出机密等级更低的消息。根据上述构成,对应于所确定的人数而降低发出消息的机密等级,因此,能够防止机密等级高的消息传达给多个人,并且在周围存在多个人的情况下也可以使发话装置进行发话。
本发明的第七方面涉及的发话装置是如第一方面所述的发话装置,其中,可以对所述发话装置发出的消息预先设定机密等级,还具备发话内容决定部(15),其在所述人情况确定部确定到规定的人和其他的人、且所述可否发话决定部决定为进行发话的情况下,发出对应于所述其他的人的身份的机密等级的消息。根据上述构成,能够对应于其他的人的身份而调整发出的消息的机密等级。
本发明的第八方面涉及的发话装置的控制方法是具有语音发话功能的发话装置的控制方法,其包括:人情况确定步骤,其通过分析拍摄了所述发话装置的周围的图像,执行确定存在于所述发话装置的周围的人的处理及确定存在于所述发话装置的周围的人数的处理中的至少一个;可否发话决定步骤,其根据所述确定结果决定是否发话。根据上述构成,能够获得与第一方面相同的效果。
本发明的各方式的发话装置也可以由计算机实现,在这种情况下,通过使计算机作为所述发话装置所具备的各部分(软件要素)进行操作从而利用计算机实现所述发话装置的发话装置的控制程序以及储存有该程序的计算机可读取的存储介质也包含于本发明的范围之内。
〔附记事项〕
本发明不限于上述各实施方式,能在权利要求所示的范围中进行各种变更,将不同的实施方式中分别公开的技术手段适当组合得到的实施方式也包含于本发明的技术范围。而且,能够通过组合各实施方式分别公开的技术方法来形成新的技术特征。
附图标记说明
1 智能电话(发话装置)
13 人情况确定部
14 可否发话决定部
15 发话内容决定部

Claims (9)

1.一种具备语音发话功能的发话装置,其特征在于,具备:
人情况确定部,其通过分析拍摄了所述发话装置的周围的图像,执行确定存在于所述发话装置的周围的人的处理及确定存在于所述发话装置的周围的人数的处理中的至少一个;
可否发话决定部,其根据所述确定结果决定是否发话。
2.如权利要求1所述的发话装置,其特征在于,
所述可否发话决定部在确定到规定的人是规定人数的情况下,决定为进行发话。
3.如权利要求1所述的发话装置,其特征在于,
所述可否发话决定部在所确定的人为规定人数以上的情况下,决定为不进行发话。
4.如权利要求2所述的发话装置,其特征在于,
所述规定的人是被所述发话装置许可了包含个人信息的发话的人,
还具备发话内容决定部,其在所述可否发话决定部决定为进行发话的情况下,在所述发话内容中包含所述许可的人的个人信息。
5.如权利要求1所述的发话装置,其特征在于,
还具备发话内容决定部,其在所述人情况确定部确定了规定的人和其他的人、且所述可否发话决定部决定为进行发话的情况下,
从所述发话内容中排除所述规定的人的个人信息,或者将所述个人信息替换为非个人信息。
6.如权利要求1所述的发话装置,其特征在于,
对所述发话装置发出的消息预先设定机密等级,
还具备发话内容决定部,其在所述人情况确定部确定到多个人、且所述可否发话决定部决定为进行发话的情况下,对应于所确定的人数的增加,发出机密等级更低的消息。
7.如权利要求1所述的发话装置,其特征在于,
对所述发话装置发出的消息预先设定机密等级,
还具备发话内容决定部,其在所述人情况确定部确定到规定的人和其他的人、且所述可否发话决定部决定为进行发话的情况下,发出对应于所述其他的人的身份的机密等级的消息。
8.一种具有语音发话功能的发话装置的控制方法,其特征在于,包括:
人情况确定步骤,其通过分析拍摄了所述发话装置的周围的图像,执行确定存在于所述发话装置的周围的人的处理及确定存在于所述发话装置的周围的人数的处理中的至少一个;
可否发话决定步骤,其根据所述确定结果决定是否发话。
9.一种控制程序,其用于使计算机发挥如权利要求1所述的发话装置的功能,其特征在于,
使所述计算机发挥所述人情况确定部及所述可否发话决定部的功能。
CN201780088789.2A 2017-03-23 2017-12-21 发话装置、该发话装置的控制方法及该发话装置的控制程序 Pending CN110447067A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017057540 2017-03-23
JP2017-057540 2017-03-23
PCT/JP2017/045988 WO2018173396A1 (ja) 2017-03-23 2017-12-21 発話装置、該発話装置の制御方法、および該発話装置の制御プログラム

Publications (1)

Publication Number Publication Date
CN110447067A true CN110447067A (zh) 2019-11-12

Family

ID=63584376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780088789.2A Pending CN110447067A (zh) 2017-03-23 2017-12-21 发话装置、该发话装置的控制方法及该发话装置的控制程序

Country Status (4)

Country Link
US (1) US20200273465A1 (zh)
JP (1) JPWO2018173396A1 (zh)
CN (1) CN110447067A (zh)
WO (1) WO2018173396A1 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1561514A (zh) * 2001-09-27 2005-01-05 松下电器产业株式会社 对话装置、对话主机装置、对话子机装置、对话控制方法及对话控制程序
US20090019553A1 (en) * 2007-07-10 2009-01-15 International Business Machines Corporation Tagging private sections in text, audio, and video media
US20140172953A1 (en) * 2012-12-14 2014-06-19 Rawles Llc Response Endpoint Selection
JP2014153829A (ja) * 2013-02-06 2014-08-25 Ntt Docomo Inc 画像処理装置、画像処理システム、画像処理方法及びプログラム
CN105960674A (zh) * 2014-02-18 2016-09-21 夏普株式会社 信息处理装置
WO2016158792A1 (ja) * 2015-03-31 2016-10-06 ソニー株式会社 情報処理装置、制御方法、およびプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004178238A (ja) * 2002-11-27 2004-06-24 Fujitsu Ten Ltd 電子メ−ル装置及び端末装置
JP2006243133A (ja) * 2005-03-01 2006-09-14 Canon Inc 音声読上げ方法および装置
JP2007041443A (ja) * 2005-08-05 2007-02-15 Advanced Telecommunication Research Institute International 音声変換装置、音声変換プログラムおよび音声変換方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1561514A (zh) * 2001-09-27 2005-01-05 松下电器产业株式会社 对话装置、对话主机装置、对话子机装置、对话控制方法及对话控制程序
US20090019553A1 (en) * 2007-07-10 2009-01-15 International Business Machines Corporation Tagging private sections in text, audio, and video media
US20140172953A1 (en) * 2012-12-14 2014-06-19 Rawles Llc Response Endpoint Selection
JP2014153829A (ja) * 2013-02-06 2014-08-25 Ntt Docomo Inc 画像処理装置、画像処理システム、画像処理方法及びプログラム
CN105960674A (zh) * 2014-02-18 2016-09-21 夏普株式会社 信息处理装置
WO2016158792A1 (ja) * 2015-03-31 2016-10-06 ソニー株式会社 情報処理装置、制御方法、およびプログラム

Also Published As

Publication number Publication date
US20200273465A1 (en) 2020-08-27
WO2018173396A1 (ja) 2018-09-27
JPWO2018173396A1 (ja) 2019-12-26

Similar Documents

Publication Publication Date Title
CN105468950B (zh) 身份认证方法、装置、终端及服务器
CN105224838B (zh) 一种基于人脸识别的用户权限控制方法和系统
CN103401987B (zh) 一种移动终端来电接听隐私保护方法及系统
CN103167149A (zh) 基于人脸识别的手机安全系统及方法
CN105979035A (zh) 一种增强现实ar图像处理方法、装置及智能终端
JP4686619B2 (ja) 顔認証を利用した情報処理方法および情報表示装置
CN103210394A (zh) 在密码中利用设备动作的方法
TW201928820A (zh) 基於擴增實境的虛擬對象分配方法及裝置
EP3249570B1 (en) Method and device for providing prompt indicating loss of terminal
EP2605167A1 (en) Private/Public Gesture Security system and method of operation thereof
CN107622227A (zh) 一种3d人脸识别的方法、终端设备及可读存储介质
EP3472754A1 (en) Communication arrangement to electrically connect a slave to a host device
CN111131702A (zh) 获取图像的方法、装置、存储介质和电子设备
CN109858337A (zh) 一种基于瞳孔信息的人脸识别方法、系统和设备
CN107545163B (zh) 解锁控制方法及相关产品
JP2023033412A (ja) 情報処理装置、及び情報処理プログラム
CN105072335B (zh) 一种拍照方法及用户终端
JPWO2017208519A1 (ja) 生体認証装置、携帯端末装置、制御プログラム
CN105809002B (zh) 一种用户终端充电方法及用户终端
CN107832669B (zh) 人脸检测方法及相关产品
CN110447067A (zh) 发话装置、该发话装置的控制方法及该发话装置的控制程序
CN107493368B (zh) 解锁方法及相关产品
CN108133530A (zh) 一种网吧管理系统及管理方法
CN107463822B (zh) 生物识别模式控制方法及相关产品
JP2007249530A (ja) 認証装置、認証方法および認証プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191112