CN114631309A - 信息处理装置、信息处理方法和程序 - Google Patents
信息处理装置、信息处理方法和程序 Download PDFInfo
- Publication number
- CN114631309A CN114631309A CN202080076142.XA CN202080076142A CN114631309A CN 114631309 A CN114631309 A CN 114631309A CN 202080076142 A CN202080076142 A CN 202080076142A CN 114631309 A CN114631309 A CN 114631309A
- Authority
- CN
- China
- Prior art keywords
- user
- sound
- space
- output
- attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/323—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for loudspeakers
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B13/00—Burglar, theft or intruder alarms
- G08B13/18—Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength
- G08B13/189—Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems
- G08B13/194—Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems
- G08B13/196—Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems using television cameras
- G08B13/19639—Details of the system layout
- G08B13/19652—Systems using zones in a single scene defined for different treatment, e.g. outer zone gives pre-alarm, inner zone gives alarm
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B21/00—Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
- G08B21/18—Status alarms
- G08B21/22—Status alarms responsive to presence or absence of persons
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B3/00—Audible signalling systems; Audible personal calling systems
- G08B3/10—Audible signalling systems; Audible personal calling systems using electric transmission; using electromagnetic transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/69—Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/403—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers loud-speakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/15—Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Otolaryngology (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Emergency Management (AREA)
- Business, Economics & Management (AREA)
- Electromagnetism (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Abstract
本技术涉及信息处理装置、信息处理方法和程序,其能够使得观看远程位置的视频的用户以更适当的形式意识到视频的视角之外的人的存在。根据本技术的信息处理装置设置有处理单元,该处理单元用于:当在设置有第一成像装置和第一显示装置的第一空间与设置有第二成像装置和第二显示装置的第二空间之间,由一个空间中的成像装置捕获的捕获图像由另一空间中的显示装置实时显示的情况下,执行处理,以用于当在第二成像装置的视角之外的位置检测到第二用户时,向第一空间中的第一用户通知第二成像装置的视角之外的第二用户的存在。本技术可以应用于例如视频通信系统。
Description
技术领域
本技术涉及信息处理装置、信息处理方法和程序,并且更特别地涉及能够使得观看远程位置的视频的用户能够以更适当的形式意识到视频的视角之外的人的存在的信息处理装置、信息处理方法和程序。
背景技术
在相关技术中,远程位置处的用户可以利用视频通信系统在观看彼此的面部的同时交谈,并且因此可以实现更熟悉的通信。
例如,专利文献1公开了如下视频显示系统,在该视频显示系统中,可以在现场感中实现通信,就好像远程位置处的用户实际上看着彼此一样。
引用列表
专利文献
专利文献1:JP 2016-192686 A
发明内容
技术问题
顺便提及,在上述视频显示系统中,通过显示器观看远程位置的场景的用户有时不会意识到在用于捕获远程位置的视频的摄像装置的视角之外的人。
特别地,当有多个人观看远程位置的方面时,优选地只使得注意视角之外的视角的一些用户能够意识到视角之外的人。
本技术是鉴于这些情况而设计的,并且使得观看远程位置的视频的用户能够以更适当的形式意识到在视频的视角之外的人的存在。
问题的解决方案
根据本技术的一方面的信息处理装置是包括处理单元的信息处理装置。在安装有第一成像装置和第一显示装置的第一空间与安装有第二成像装置和第二显示装置的第二空间之间,当由一个空间中的成像装置捕获的捕获图像由另一空间中的显示装置实时显示时,处理单元执行处理,以在检测到处于第二成像装置的视角之外的位置的第二用户时,向第一空间中的第一用户通知第二用户处于第二成像装置的视角之外。
根据本技术的一方面的信息处理方法是信息处理装置的信息处理方法。在安装有第一成像装置和第一显示装置的第一空间与安装有第二成像装置和第二显示装置的第二空间之间,当由一个空间中的成像装置捕获的捕获图像由另一空间中的显示装置实时显示时,信息处理装置执行处理,以在检测到处于第二成像装置的视角之外的位置的第二用户时,向第一空间中的第一用户通知第二用户处于第二成像装置的视角之外。
根据本技术的又一方面的程序是使计算机执行以下操作的程序:当在安装有第一成像装置和第一显示装置的第一空间与安装有第二成像装置和第二显示装置的第二空间之间,由一个空间中的成像装置捕获的捕获图像由另一空间中的显示装置实时显示时,执行处理,以在检测到处于第二成像装置的视角之外的位置的第二用户时,向第一空间中的第一用户通知第二用户处于第二成像装置的视角之外。
根据本技术的一方面,在安装有第一成像装置和第一显示装置的第一空间与安装有第二成像装置和第二显示装置的第二空间之间,当由一个空间中的成像装置捕获的捕获图像由另一空间中的显示装置实时显示时,执行处理,以在检测到处于第二成像装置的视角之外的位置的第二用户时,向第一空间中的第一用户通知第二用户处于第二成像装置的视角之外。
附图说明
[图1]图1是示出根据本技术的实施例的视频通信系统的示例性配置的图。
[图2]图2是示出电信装置的外部的示例性配置的前视图。
[图3]图3是示出其中使用电信装置的情况的示例的图。
[图4]图4是示出电信装置的第一输出控制的概况的图。
[图5]图5是示出用户的关注度和点A侧的输出方法的组合的示例的图。
[图6]图6是示出电信装置的第一示例性配置的框图。
[图7]图7是示出电信装置的操作的流程图。
[图8]图8是示出电信装置的第二输出控制的概况的图。
[图9]图9是示出电信装置的第二输出控制的概况的图。
[图10]图10是示出B点的情况和点A侧的输出方法的组合的示例的图。
[图11]图11是示出电信装置的第二示例性配置的框图。
[图12]图12是示出电信装置的操作的流程图。
[图13]图13是示出电信装置的第三输出控制的概况的图。
[图14]图14是示出电信装置的第三输出控制的概况的图。
[图15]图15是示出电信装置的第四输出控制的概况的图。
[图16]图16是示出电信装置的第三示例性配置的框图。
[图17]图17是示出电信装置的操作的流程图。
[图18]图18是示出由电信装置执行的其他输出控制的概况的图。
[图19]图19是示出其中设置有发光体的电信装置的示例的前视图。
[图20]图20是示出光的强度与关注度之间的关系的示例的图。
[图21]图21是示意性地示出摄像装置和传感器的形式的示例的图。
[图22]图22是示出视频通信系统的另一示例性配置的图。
[图23]图23是示出视频通信系统的又一示例性配置的图。
[图24]图24是示出计算机的示例性硬件配置的框图。
具体实施方式
在下文中,将描述用于执行本技术的模式。将按以下顺序进行描述。
1.视频通信系统
2.第一输出控制
3.第二输出控制
4.第三输出控制
5.第四输出控制
6.修改示例
<1.视频通信系统>
图1是示出根据本技术的视频通信系统的示例性配置的图。
如图1所示,视频通信系统1被配置成使得作为两个信息处理装置的电信装置11a和电信装置11b经由诸如因特网的网络12连接。
电信装置11a和电信装置11b设置在不同的空间中,例如不同的建筑物或不同的房间中。如图1所示,电信装置11a附近的用户和电信装置11b附近的用户是彼此处于远程位置的用户。
电信装置11a和电信装置11b具有基本相同的配置。如下面将详细描述的,在电信装置11a和11b中,除了具有大尺寸的显示器之外,还设置了对周围方面进行成像的摄像装置、收集诸如环境声音的周围声音的麦克风、输出声音的扬声器等。
例如,在建立两侧的连接的情况下,在电信装置11a与电信装置11b之间实时地定期发送和接收由摄像装置捕获的视频、由麦克风收集的声音等。
电信装置11a显示由电信装置11b捕获的视频并且输出由电信装置11b收集的声音。
在由电信装置11b捕获的视频中,示出了安装有电信装置11b的空间的方面,包括电信装置11b的用户的方面。除了电信装置11b的用户的声音之外,由电信装置11b收集的声音还包括安装有电信装置11b的空间的环境声音。
因此,例如,电信装置11a的用户面对该用户附近的电信装置11a的远侧,并且感觉好像电信装置11b的用户在现场。
类似地,电信装置11b显示由电信装置11a捕获的视频并且输出由电信装置11a收集的声音。
在由电信装置11a捕获的视频中,示出了安装有电信装置11a的空间的方面,包括电信装置11a的用户的方面。除了电信装置11a的用户的声音之外,由电信装置11a收集的声音还包括安装有电信装置11a的空间的环境声音。
因此,例如,电信装置11b的用户面对该用户附近的电信装置11b的远侧,并且感觉好像电信装置11a的用户在现场。
电信装置11a的用户可以实现与电信装置11b的用户的自然通信,就好像电信装置11b的用户存在于相邻空间中一样。
类似地,电信装置11b的用户可以实现与电信装置11a的用户的自然通信,就好像电信装置11a的用户存在于相邻空间中一样。
也就是说,电信装置11a和11b的用户可以通过在没有主动意识的情况下进行通信而在感觉彼此接近的情况下实现更顺畅的通信。
在下文中,当不必将电信装置11a和11b彼此区分时,电信装置11a和11b统称为电信装置11。这同样适用于本说明书中的其他成对的配置。
图2是示出了电信装置11a的外部的示例性配置的前视图。
如图2所示,窄框21保留在电信装置11a的外壳的前表面上,并且设置了被配置为液晶显示器(LCD)、有机电致发光(EL)显示器等的纵向长矩形显示器22。
经由固定到例如显示器22前面的框21的指示构件(未示出)来设置传感器单元23。传感器单元23设置有摄像装置24和作为两个传感器的传感器25-1和25-2。
在框21的上边缘、下边缘、左边缘和右边缘中,麦克风26设置在上边缘上,并且扬声器27-1和扬声器27-2设置在左边缘和右边缘上。
显示器22基于从电信装置11b发送的视频信息,显示根据由电信装置11b捕获的捕获图像的视频。
摄像装置24对电信装置11a前面的空间成像。将指示根据由摄像装置24捕获的捕获图像的视频的视频信息发送至电信装置11b。
传感器25-1和25-2由各种类型的传感器如摄像装置或红外传感器进行配置。传感器25-1和25-2基于传感器的检测结果生成环境信息。
环境信息是包括下述各项的信息:根据由包括在传感器25中的摄像装置捕获的捕获图像的视频、以及由红外传感器获取的信息。在根据由包括在传感器25中的摄像装置捕获的捕获图像的视频中,还示出了摄像装置视角之外的方面,该方面是摄像装置24的成像视角之外的范围。
将包括摄像装置视角之外的信息的环境信息发送至电信装置11b。例如,在电信装置11b中,基于环境信息来分析从摄像装置视角之外听到的声音(摄像装置视角之外的位置是声源位置的声音)。
麦克风26收集安装有电信装置11a的空间的声音。将指示由麦克风26收集的声音的声音信息发送至电信装置11b。
扬声器27-1和27-2基于从电信装置11b发送的声音信息而输出安装有电信装置11b的空间的声音。
电信装置11b具有与图2所示的电信装置11a相同的配置。在下文中,图2所示的电信装置11a的配置用作本说明书中的电信装置11b的配置。
图2中安装摄像装置24、传感器25-1和25-2、麦克风26以及扬声器27-1和27-2的位置是示例性的,并且可以是其他位置,只要能够实现这些功能即可,并且所安装的传感器、麦克风和扬声器的数目是任意的。
图3是示出其中使用电信装置11的情况的示例的图。
例如,如图3所示,电信装置11a和11b安装在相互远离的空间的点A和点B处。图3中间所示的波浪线指示安装电信装置11a的空间远离安装电信装置11b的空间。
在图3的示例中,在点A处,假设作为两个用户的用户A1和A2在电信装置11a的前面。例如,用户A1是观看显示在电信装置11a上的视频并与处于点B处的用户B1交谈的用户。用户A2是从用户A1的后方位置观看电信装置11a的用户。
另一方面,在点B处,假设作为两个用户的用户B1和B2在电信装置11b的前面。例如,用户B1是观看显示在电信装置11b上的视频并与处于点A处的用户A1交谈的用户。用户B2是在摄像装置视角之外执行工作的用户。
作为点B的范围的由虚线指示的范围#1是电信装置11b(安装在电信装置11b中的摄像装置24)的摄像装置视角的范围。由虚线指示的范围#2和#3是在电信装置11b(安装在电信装置11b中的摄像装置24)的摄像装置视角之外的范围。
这样,在一些情况下,在周围有多个用户的情况下使用电信装置11a和11b。根据周围用户的动作来控制电信装置11a和11b的输出。
<2.第一输出控制>
·输出控制的概况
图4是示出电信装置11的第一输出控制的概况的图。
在图4的示例中,假设仅用户A2在点A处的电信装置11a的前面。另一方面,在点B处,假设仅有用户B2。用户B2是在范围#3内的用户,该范围#3是摄像装置视角之外的范围。
此时,由于在作为电信装置11b的摄像装置视角的范围的范围#1内不存在任何东西,所以在电信装置11a上显示的视频中没有示出任何东西。假设电信装置11a前面的用户A2关注摄像装置视角之外的人,并且执行看是否有人在那里的动作,如图4的气球所示。
在这种情况下,当检测到用户A2正在执行关注动作时,电信装置11a朝向用户A2输出强调的指示声音。指示声音是从摄像装置视角之外听到的声音,使得用户A2感觉到电信装置11b的摄像装置视角之外的人的指示。
关注动作是注意摄像装置视角之外的人的用户的动作。注意摄像装置视角之外的视角的用户的动作包括:指示关注电信装置11a的显示器22的左端和右端中的任一端的动作,以及看向电信装置11a并且注意摄像装置视角之外的人的动作。
根据用户A2对摄像装置视角之外的人的关注度的大小来控制指示声音的输出。电信装置11a基于用户A2的关注动作来分析关注度的大小,并且根据关注度的大小来控制指示声音的输出方法等。
图5是示出用户A2的关注度和点A侧的输出方法的组合的示例的图。
在图5的示例中,按照关注度的降序,示出了注视显示有点B的视频的显示器22的一端的动作、看向点B的方面的动作、通过说“有人吗?”来检查在点B处是否有人在摄像装置视角之外的动作、或将脸部转向点B的动作,作为用户A2的关注动作。
如图5的表的第一行中的项目的较低列的第二行所示,当用户A2执行注视显示有点B的视频的显示器22的一端的关注动作时,电信装置11a调整扬声器27-1和27-2的方向性,并且朝向用户A2输出强调的指示声音。此时,电信装置11a朝向用户A2调整扬声器27-1和27-2的方向性,并且执行提高指示声音的音量的处理。
如图5的表的第三行所示,当用户A2执行看向点B的方面的关注动作时,电信装置11a调整扬声器27-1和27-2的方向性,并且朝向用户A2输出指示声音。此时,电信装置11a执行用于朝向用户A2调整扬声器27-1和27-2的方向性的处理。
如图5的表的第四行所示,当用户A2执行通过说“有人吗?”来检查在B点中是否有人的摄像装置视角之外的关注动作时,电信装置11a通过响应于是否存在对用户A2的语音的响应的输出方法来输出指示声音。
例如,当用户B2响应时,电信装置11a在正常的视频通信系统中执行输出。作为正常的视频通信系统中的输出,例如,电信装置11a执行用于输出在点B处收集的环境声音而不是从摄像装置视角之外听到的指示声音的处理。
相反,当用户B2没有响应时,电信装置11a朝向整个点A输出强调的指示声音。此时,电信装置11a执行提高指示声音的音量的处理。
如图5的表的第五行所示,当用户A2观看电信装置11a的显示器并且执行将脸部转向点B的关注动作时,电信装置11a在正常的视频通信系统中执行输出。
这样,用户A2的关注动作的关注度越高,以越强调的形式朝向用户A2输出从摄像装置视角之外听到的指示声音。
因此,用户A2可以通过从电信装置11a输出的指示声音意识到连接目的地的电信装置11b(安装在电信装置11b中的摄像装置24)的摄像装置视角之外的人。
由于朝向执行关注动作的用户A2输出指示声音,所以电信装置11a可以只使得注意连接目的地的摄像装置视角之外的摄像装置视角的用户A2意识到处于摄像装置视角之外的人的存在。
例如,如在图3的用户A1中,不向不注意连接目的地的摄像装置视角之外的视角的、与用户B1交谈的用户A1输出指示声音。用户A1可以在不注意摄像装置视角之外的人的情况下继续与用户B1交谈。
以这种方式,由于仅向注意摄像装置视角之外的人的用户呈现指示声音,因此用户可以以更适当的形式意识到摄像装置视角之外的人的存在。
·电信配置11的配置
图6是示出电信装置11的第一示例性配置的框图。
如图6所示,电信装置11包括输入单元31、处理单元32、发送单元33、接收单元34和输出单元35。
输入单元31由诸如图2中的摄像装置24的成像装置、诸如传感器25-1和25-2的感测装置,或诸如麦克风26的声音收集装置来配置。例如,输入单元31根据由摄像装置24捕获的捕获图像、由传感器25-1和25-2生成的环境信息、以及由麦克风26收集的环境声音的声音信息,向处理单元32提供空间的视频信息。
在输入单元31中,可以包括收集摄像装置视角之外的声音的麦克风以及测量到由摄像装置24成像的对象的距离的深度传感器等作为传感器25-1和25-2。在这种情况下,环境信息还可以包括麦克风或深度传感器的检测结果。
处理单元32由中央处理单元(CPU)、只读存储器(ROM)、随机存取存储器(RAM)等来配置。处理单元32通过执行预定程序来控制整个电信装置11的操作。
如图6所示,处理单元32包括关注度分析单元41、环境信息分析单元42、指示声音输出方法选择单元43以及指示声音控制单元44。
关注度分析单元41向发送单元33提供从输入单元31提供的视频信息、环境信息和环境声音的声音信息。
关注度分析单元41基于从输入单元31提供的视频信息、环境信息和环境声音的声音信息来分析电信装置11前面的用户对连接目的地的摄像装置视角之外的人的关注度。
例如,关注度分析单元41基于电信装置11前面的用户注视的位置、视线朝向显示器22的时间长度、说出的声音以及用户的头部的朝向来分析用户的关注度的大小。作为分析对连接目的地的摄像装置视角之外的人的关注度的方法,可以使用各种方法中的任何一种。
将关注度信息提供给指示声音输出方法选择单元43,该关注度信息是指示由关注度分析单元41分析的用户的关注度的信息。
环境信息分析单元42为输出单元35提供从接收单元34提供的连接目的地的视频信息和环境声音的声音信息。
环境信息分析单元42基于从接收单元34提供的连接目的地的环境信息,分析连接目的地的环境声音中所包括的从摄像装置视角之外听到的声音和从摄像装置视角之内听到的声音。将从摄像装置视角之外听到的声音用作适当地呈现给用户的指示声音。
分析从摄像装置视角之外听到的声音和从摄像装置视角之内听到的声音的环境信息分析单元42还检测处于连接目的地的摄像装置视角之外的用户。
具体地,环境信息分析单元42通过使用其中示出了连接目的地的摄像装置视角之外的方面的视频执行骨骼估计来检测摄像装置视角之外的用户。骨骼估计是用于使用捕获图像来估计人的骨骼的技术。可以通过使用其中示出了摄像装置视角之外的方面的视频来执行背景差异的检测和面部识别,而检测处于连接目的地的摄像装置视角之外的用户。
用于检测处于摄像装置视角之外的用户的、其中示出了连接目的地的摄像装置视角之外的方面的视频是连接目的地的环境信息中所包括的信息。
指示环境信息分析单元42的分析结果的信息与连接目的地的环境声音的声音信息一起被提供给指示声音输出方法选择单元43。
指示声音输出方法选择单元43基于从环境信息分析单元42提供的信息和从关注度分析单元41提供的关注度信息来选择输出指示声音的方法。例如,指示声音输出方法选择单元43选择指示声音的音量大小或输出指示声音的扬声器27-1和27-2的方向性。
指示声音控制单元44被提供了连接目的地的环境声音的声音信息、指示环境信息分析单元42的分析结果的信息、以及指示指示声音的输出方法的信息。
指示声音控制单元44通过基于从指示声音输出方法选择单元43提供的信息对连接目的地的环境声音的声音信息进行处理,来生成指示声音的声音信息。例如,指示声音控制单元44通过从连接目的地的环境声音的声音信息中提取从连接目的地的摄像装置视角之外听到的指示声音的声音信息,来生成指示声音的声音信息。
指示声音控制单元44将指示声音的声音信息提供给输出单元35,并且使得指示声音通过指示声音输出方法选择单元43选择的输出方法输出。
发送单元33经由网络12将从处理单元32提供的视频信息、环境信息和环境声音的声音信息发送到连接目的地的电信装置11。
接收单元34经由网络12接收从连接目的地的电信装置11发送的连接目的地的视频信息、环境信息和环境声音的声音信息,并且将接收到的信息提供给环境信息分析单元42。
发送单元33和接收单元34由与诸如无线局域网(LAN)或蜂窝通信(例如,高级LTE或5G)的无线或有线通信相对应的通信模块等来配置。
输出单元35例如由诸如图2中的显示器22的显示装置的声音输出装置和诸如扬声器27-1和27-2的声音输出装置来配置。将连接目的地的视频信息和环境声音的声音信息从环境信息分析单元42提供给输出单元35。将指示声音的声音信息从指示声音控制单元44提供给输出单元35。
基于连接目的地的视频信息,输出单元35使显示器22显示安装有连接目的地的电信装置11的空间的视频。基于连接目的地的环境声音的声音信息,输出单元35从扬声器27-1和27-2输出安装有连接目的地的电信装置11的空间的环境声音。此外,输出单元35在指示声音控制单元44的控制下从扬声器27-1和27-2输出指示声音。
图6所示的电信装置11的配置是示例性的,并且可以使用另外的配置。例如,可以提供用作由半导体存储器、硬盘驱动器(HDD)等配置的辅助存储装置的存储单元等。在输出单元35中,可以使用诸如投影仪的显示装置来代替显示器22,或者可以使用诸如以有线或无线方式连接的耳机的声音输出装置来代替扬声器27-1和27-2。
指示声音控制单元44可以使用另外的方案向用户执行通知而不限于指示声音。即,除了指示声音(声音)之外,还可以使用下述方案:使诸如发光二极管(LED)的发光体发光,使显示器22显示图形用户界面(GUI),或者与用户携带的装置执行无线通信并使该装置振动。可以组合使用多个方案。这样,可以这样说,指示声音控制单元44作为输出控制单元控制具有各种输出功能的输出单元35,使得对用户进行通知。
·电信装置11的操作
此处,将参照图7的流程图描述具有上述配置的电信装置11的操作。
例如,当经由网络12从连接目的地的电信装置11发送视频信息和环境声音的声音信息时,开始要参照图7描述的处理。
与图7的处理并行地,适当地执行对用户对连接目的地的摄像装置视角之外的关注度进行分析的关注度分析单元41的处理。发送单元33经由网络12将由输入单元31获取的视频信息、环境信息和环境声音的声音信息发送到连接目的地的电信装置11。
在步骤S1中,接收单元34接收从连接目的地的电信装置11发送的连接目的地的视频信息、环境信息和环境声音的声音信息。
在步骤S2中,环境信息分析单元42基于连接目的地的环境信息,分析连接目的地的环境声音中所包括的从摄像装置视角之内听到的声音和从摄像装置视角之外听到的声音。
在步骤S3中,指示声音输出方法选择单元43根据由关注度分析单元41分析的关注度信息来选择指示声音的输出方法。
在步骤S4,指示声音控制单元44通过处理连接目的地的环境声音的声音信息来生成指示声音的声音信息。如上所述,指示声音的声音信息的生成是在存在执行注意摄像装置视角之外的人的关注动作的用户时执行的处理。
在步骤S5中,指示声音控制单元44使输出单元35将指示声音通过由指示声音输出方法选择单元43选择出的输出方法与连接目的地的环境声音和视频一起输出。
通过上述处理,电信装置11仅使注意连接目的地的摄像装置视角之外的人的用户意识到连接目的地的摄像装置视角之外的人的存在。
电信装置11的用户可以在用户执行关注连接目的地的摄像装置视角之外的人的动作时,接收指示连接目的地的摄像装置视角之外的人的存在的信息的通知。
<3.第二输出控制>
·输出控制的概况
图8和图9是示出电信装置11的第二输出控制的概况的图。
在该示例中,根据连接目的地的摄像装置视角之外的用户的关注度而不是观看连接目的地的视频的用户的关注度来控制指示声音的输出。
在图8的示例中,用户A2在点A的电信装置11a的前面,如参照图4所述的情况中那样。另一方面,假设用户B2在点B的范围#3内。如图8的气泡所示,用户B2不关注点A的视频。
这样,当作为摄像装置视角之外的用户的用户B2不关注点A的视频时,电信装置11a在正常的视频通信系统中执行输出。
如图9的气泡所示,当用户B2关注点A的视频时,电信装置11a朝向使用户B2关注的用户A2输出强调的指示声音。
图10是示出B点和点A侧的输出方法的情况的组合的示例的图。
在图10的示例中,按照用户B2的关注度的降序,示出了用户B2在摄像装置视角之外并且用户B2的关注度高的情况、用户B2在摄像装置视角之外并且用户B2的关注度尽管是关注但小于预定关注度的情况、用户B2在摄像装置视角之外但不关注的情况、以及用户B2不在摄像装置视角之外的情况,作为点B的情况。
如图10的表的第一行中的项的较低列的第二行所示,当点B的情况是用户B2在摄像装置视角之外并且用户B2的关注度高的情况时,电信装置11a调整扬声器27-1和27-2的方向性并且朝向用户A2输出强调的指示声音。
当用户B2注视电信装置11b附近的用户A2、视线朝向用户A2达预定时间或更长时间、视线朝向预定次数或更多次等时,电信装置11a确定用户B2的关注度高。
如图10的表的第三行所示,当点B的情况是用户B2在摄像装置视角之外并且注意用户A2但是关注度小于阈值的情况时,电信装置11a调整扬声器27-1和27-2的方向性并且朝向用户A2输出指示声音。
如图10的表的第四行所示,当点B的情况是用户B2在摄像装置视角之外但不关注点A的视频的情况时,电信装置11a在正常的视频通信系统中执行输出。
如图10的表的第五行所示,当点B的情况是用户不在摄像装置视角之外的情况时,电信装置11a在正常的视频通信系统中执行输出。
这样,用户B2的关注度越高,以越强调的形式朝向用户A2输出从摄像装置视角之外听到的指示声音。
因此,通过从电信装置11a输出的指示声音,用户A2可以意识到连接目的地的电信装置11b(安装在电信装置11b中的摄像装置24)的摄像装置视角之外的对用户A2自身关注的人。
·电信装置11的配置
图11是示出电信装置11的第二示例性配置的框图。
在图11中,对与图6的电信装置11的配置相同的配置给出相同的附图标记。将适当地省略重复的描述。这同样适用于下面将要描述的图16。
图11所示的处理单元32的配置与参照图6描述的配置的不同之处在于,在环境信息分析单元42的后级设置有连接目的地关注度分析单元51。
将指示环境信息分析单元42的分析结果的信息、连接目的地的视频信息、环境信息和环境声音的声音信息从环境信息分析单元42提供给连接目的地关注度分析单元51。
连接目的地关注度分析单元51向输出单元35提供从环境信息分析单元42提供的连接目的地的视频信息和环境声音的声音信息。
连接目的地关注度分析单元51基于从环境信息分析单元42提供的连接目的地的环境信息来分析连接目的地的摄像装置视角之外的用户的关注度。
连接目的地关注度分析单元51例如基于连接目的地的用户注视的位置、视线朝向显示器22的时间长度、视线朝向显示器22的次数以及连接目的地的用户的头部的朝向来分析连接目的地的用户的关注度的大小。
例如,基于由连接目的地的红外传感器获取的信息,通过眼睛跟踪来分析连接目的地的摄像装置视角之外的用户的关注度。基于其中示出了连接目的地的摄像装置视角之外的方面的视频,可以通过检测连接目的地的用户的面部的朝向的方法来分析连接目的地的摄像装置视角之外的用户的关注度。
用于分析连接目的地的用户的关注度的由红外传感器获取的信息和其中示出连接目的地的摄像装置视角之外的方面的视频是连接目的地的环境信息中所包括的信息。
连接目的地的用户的关注度信息与连接目的地的环境声音的声音信息和指示环境信息分析单元42的分析结果的信息一起被提供给指示声音输出方法选择单元43,其中,连接目的地的用户的关注度信息是指示由连接目的地关注度分析单元51分析的连接目的地的用户的关注度的信息。
指示声音输出方法选择单元43基于从连接目的地关注度分析单元51提供的连接目的地的用户的关注度信息来选择输出指示声音的方法。例如,基于阈值来确定连接目的地的用户的关注度,并且基于确定结果来选择指示声音的输出方法。
·电信装置11的操作
此处,将参照图12的流程图来描述具有图11的配置的电信装置11的操作。
例如,在经由网络12从连接目的地的电信装置11发送视频信息和环境声音的声音信息之后,开始要参照图12描述的处理。
与图12的处理并行地,适当地执行对连接目的地的摄像装置视角之外的用户的关注度进行分析的连接目的地关注度分析单元51的处理。发送单元33经由网络12将由输入单元31获取的视频信息、环境信息和环境声音的声音信息发送到连接目的地的电信装置11。
步骤S51和步骤S52的处理与图7的步骤S1和步骤S2的处理相同。即,对连接目的地的环境声音中所包括的从摄像装置视角之内听到的声音和从摄像装置视角之外听到的声音进行分析。
在步骤S53中,指示声音输出方法选择单元43根据由连接目的地关注度分析单元51分析的连接目的地的用户的关注度信息来选择指示声音的输出方法。
图7的步骤S54和步骤S55的处理与步骤S4和步骤S5的处理相同。即,生成指示声音的声音信息,并且与连接目的地的环境声音和视频一起输出指示声音。
通过上述处理,电信装置11仅使关注连接目的地的摄像装置视角之外的人的用户意识到摄像装置视角之外的人的存在。
<4.第三输出控制>
图13和图14是示出电信装置11的第三输出控制的概况的图。
在该示例中,根据连接目的地的摄像装置视角之外的用户的关注度来控制作为摄像装置视角之外的用户的周围声音的指示声音的输出。
在图13的示例中,用户A2在点A的电信装置11a的前面,如参照图9描述的情况中那样。另一方面,假设用户B2在点B的范围#3内。如图13的气泡所示,用户B2关注点A的视频。
这样,当作为连接目的地的摄像装置视角之外的用户的用户B2关注连接目的地的视频时,电信装置11a朝向被用户B2关注的用户A2输出强调的指示声音。在该示例中,输出从作为用户B2的周围范围的范围#11听到的声音作为指示声音。
如图14所示,当关注用户A2的用户B2在范围#1内时,电信装置11a输出从范围#11听到的声音作为指示声音。
由于第三输出控制中的处理流程和电信装置11的配置基本上与第二输出控制的处理流程和电信装置的配置——即图11所示的配置和图12所示的处理流程——类似,因此将省略其描述。
如上所述,通过从电信装置11a输出的指示声音,用户A2可以意识到对用户A2自己或他自己关注的人在摄像装置视角之外或在摄像装置视角之内。
<5.第四输出控制>
·输出控制的概况
图15是示出电信装置11的第四输出控制的概况的图。
在该示例中,根据处于安装有电信装置11a的空间中的用户的操作的保密性来控制电信装置11b中的声音的输出。
在图15的示例中,假设作为两个用户的用户A11和A12在点A的电信装置11a的前面。另一方面,在点B中,假设仅用户B2在范围#3内。如图15的气泡所示,在没有意识到点B的摄像装置视角之外的用户B2的存在的情况下,用户A11和A12正在谈论具有高保密性的内容,例如私人内容。
在这种情况下,当在点A中检测到用户A11与用户A12之间的具有高保密性的谈话时,电信装置11b基于用户A11与用户A12之间的谈话的保密性来处理在点A中收集的保密声音以使声音的质量劣化,并且输出劣化的声音。保密声音是环境声音中所包括的声音中的诸如保密谈话的声音。
用户B2听到由于声音质量劣化而难以听到的谈话内容的声音。
因此,电信装置11b可以向点B中的用户输出具有难以听到的声音的质量的、连接目的地的电信装置11a附近的用户之间的具有高保密性的谈话的声音。
在图15的示例中,已经描述了电信装置11b检测点A中的用户A11与用户A12之间具有高保密性的谈话的情况。然而,当检测到点B中的多个用户之间具有高保密性的谈话时,电信装置11a也可以执行类似的处理。
·电信装置11的配置
图16是示出电信装置11的第三示例性配置的框图。
图16中所示的处理单元32的配置与参照图6描述的配置的不同之处在于,设置了保密性分析单元71、连接目的地保密性获取单元72、保密声音输出方法选择单元73和保密声音控制单元74。
将视频信息、环境信息和环境声音的声音信息从输入单元31提供到保密性分析单元71。
保密性分析单元71基于从输入单元31提供的环境信息和环境声音的声音信息来分析安装有电信装置11的空间中的用户的声音的保密性。
保密性分析单元71确定例如具有未被世界所知的内容的谈话的声音或具有可能伤害其他人的内容的谈话的声音作为具有高保密性的声音。
在保密性的级别的分析中,可以使用通过根据诸如神经网络或深度学习的方案进行机器学习而生成的学习模型。
将作为指示由保密性分析单元71分析的用户的声音的保密性的信息的保密性信息与从输入单元31提供的视频信息、环境信息和环境声音的声音信息一起提供给发送单元33。
发送单元33经由网络12将从保密性分析单元71提供的视频信息、环境信息、环境声音的声音信息和保密性信息发送到连接目的地的电信装置11。
接收单元34接收经由网络12从连接目的地的电信装置11发送的连接目的地的视频信息、环境信息、环境声音的声音信息和保密性信息,并且将这些信息提供给处理单元32的环境信息分析单元42。
环境信息分析单元42将指示环境信息分析单元42的分析结果的信息与连接目的地的视频信息、连接目的地的声音信息和连接目的地的保密性信息一起提供给连接目的地保密性获取单元72。
连接目的地保密性获取单元72向输出单元35提供从环境信息分析单元42提供的连接目的地的视频信息和环境声音的声音信息。
连接目的地保密性获取单元72向保密声音输出方法选择单元73提供从环境信息分析单元42提供的连接目的地的保密性信息和环境声音的声音信息以及指示环境信息分析单元42的分析结果的信息。
保密声音输出方法选择单元73基于从连接目的地保密性获取单元72提供的保密性信息和指示环境信息分析单元42的分析结果的信息来选择输出保密声音的方法。例如,保密声音输出方法选择单元73选择使保密声音失真的方法或仅提高特定频率的水平的方法。
将指示输出保密声音的方法的信息与连接目的地的保密性信息和环境声音的声音信息一起提供给保密声音控制单元74。
保密声音控制单元74通过基于从保密声音输出方法选择单元73提供的连接目的地的保密性信息处理连接目的地的环境声音的声音信息,来生成保密声音的声音信息。例如,保密声音控制单元74通过从连接目的地的环境声音的声音信息中提取具有高保密性的谈话的声音的声音信息,来生成保密声音的声音信息。
保密声音控制单元74基于从保密声音输出方法选择单元73提供的指示输出保密声音的方法的信息来处理保密声音。保密声音控制单元74将经处理的保密声音的声音信息提供给输出单元35,以输出经处理的保密声音。
·电信装置11的操作
此处,将参照图17的流程图描述具有图16的配置的电信装置11的操作。
例如,当经由网络12从连接目的地的电信装置11发送视频信息、环境声音的声音信息和保密性信息时,开始要参照图17描述的处理。
发送单元33经由网络12将由输入单元31获取的视频、环境声音的声音信息和保密性信息发送到连接目的地的电信装置11。
在步骤S101中,接收单元34接收从连接目的地的电信装置11发送的连接目的地的视频信息、环境声音的声音信息和保密性信息。
在步骤S102中,环境信息分析单元42和连接目的地保密性获取单元72将连接目的地的环境声音的声音信息与保密性信息和指示环境信息分析单元42的分析结果的信息一起提供给保密声音输出方法选择单元73。
在步骤S103中,保密声音输出方法选择单元73基于连接目的地的保密性信息选择输出保密声音的方法。
在步骤S104中,保密声音控制单元74通过基于连接目的地的保密性信息处理连接目的地的环境声音的声音信息,来生成保密声音。保密声音控制单元74基于指示输出保密声音的方法的信息来处理保密声音。如上所述,保密声音的生成和保密声音的处理是当存在进行具有高保密性的谈话的用户时执行的处理。
在步骤S105中,保密声音控制单元74使输出单元35将经处理的保密声音与连接目的地的环境声音及视频一起输出。
通过上述处理,可以防止将具有高保密性的谈话的声音呈现给连接目的地的电信装置11的摄像装置视角之外的用户。
可以朝向正在执行具有高保密性的动作的用户输出连接目的地的摄像装置视角之外的用户的周围指示声音,使得用户可以意识到连接目的地的摄像装置视角之外的用户的存在。
图18是示出由电信装置11执行的另一输出控制的概况的图。
在图18的示例中,假设用户A11在点A的电信装置11a的前面。另一方面,假设仅用户B2在点B的范围#3内。用户A11是在没有意识到摄像装置视角之外的用户B2的情况下,正在执行具有高保密性的动作(例如私人动作)的用户。
当检测到用户A11正在执行具有高保密性的动作时,电信装置11a朝向用户A11输出强调的指示声音。根据处于点A中的用户A11所执行的动作的保密性的级别来控制连接目的地的摄像装置视角之外的指示声音的输出。可以根据另外的方案通知用户A11,而不限于指示声音。
由于朝向执行具有高保密性的动作的用户A11输出指示声音,所以电信装置11可以仅使用户A11意识到摄像装置视角之外的人的存在。
例如,意识到连接目的地的摄像装置视角之外的人的存在的用户A11可以停止具有高保密性的动作。
这样,通过仅向正执行具有高保密性的动作的用户呈现指示声音,用户可以以更适当的形式意识到摄像装置视角之外的人的存在。
<6.修改示例>
·发光体
可以使用电信装置11中设置的发光体的发光来呈现连接目的地的摄像装置视角之外的人的存在。
图19是示出其中设置有发光体的电信装置11a的示例的前视图。
例如,在电信装置11a的显示器22的上边缘、下边缘、左边缘或右边缘上设置发光体。
当用户B2在电信装置11b的摄像装置视角之外时,如图19所示,用户B2的视频没有示出在电信装置11a的显示器22上。在图19中,电信装置11a右侧的用户B2的虚线指示用户B2在点B中处于摄像装置视角之外。
在这种情况下,电信装置11a使设置在右边缘部分上的发光体发光,该发光体是用户B2所在方向上的那个边缘的发光体。在图19中,显示器22的右端被着色的部分指示发光体发光。
当在电信装置11a周围仅有一个用户或者摄像装置视角之外的人的存在被同时传递给电信装置11a周围的多个用户时,发射光以提示摄像装置视角之外的人的存在。发光体的光的强度可以指示用户B2对点A的视频的关注度。
图20是示出光的强度与关注度之间的关系的示例的图。
在图20中,横轴表示用户B2的关注度,并且纵轴表示光的强度。
如图20所示,例如,当连接目的地的摄像装置视角之外的用户B2的关注度较高时,电信装置11a使得发射强光。
电信装置11a的用户可以根据来自发光体的光的强度而知道连接目的地的摄像装置视角之外的用户的关注度。
通过使由电信装置11a的用户携带的诸如智能电话的便携式终端振动来通知连接目的地的摄像装置视角之外的用户的关注度。在这种情况下,电信装置11a的指示声音控制单元44控制由电信装置11a的用户携带的便携式终端,使得便携式终端根据连接目的地的摄像装置视角之外的用户B2的关注度而振动。
·摄像装置24和传感器25
上面已经描述了设置在传感器单元23中的摄像装置24和传感器25。然而,可以以另外的形式设置摄像装置24和传感器25。
图21是示意性地示出摄像装置24和传感器25的形式的示例的图。
如图21的A所示,可以分开设置摄像装置24和传感器25。在图21的A的示例中,被配置为摄像装置的传感器25-1和传感器25-2设置在框21的左端和右端。
在连接目的地的电信装置11的显示器22上显示具有范围#51的视频,该范围#51是摄像装置24的视角的范围。具有范围#52-1和#52-2的视频用于检测显示器的显示视角之外(摄像装置24的视角之外)的方面。
范围#52-1和#52-2是不包括与范围#51交叠的范围的、传感器25-1和23-2的视角的范围。
如图21的B所示,摄像装置24也可以用作传感器25。例如,摄像装置24由广角摄像装置配置并且设置在电信装置11的中间。
在连接目的地的电信装置11的显示器22上显示具有范围#61的视频,该范围#61指示摄像装置24的视角的范围的一部分的范围。具有范围#62的视频用于检测显示器的显示视角之外的方面。
范围#62是不包括范围#61的摄像装置24的视角的范围。
如图21的C所示,传感器25可以设置在电信装置11的外部。例如,被配置为传感器25的摄像装置设置在与安装有电信装置11的墙壁不同的墙壁上。
如图21的A所示,在连接目的地的电信装置11的显示器22上显示具有范围#51的视频,该范围#51是摄像装置24的视角的范围。具有范围#71的视频用于检测显示器的显示视角之外的方面。
范围#71是不包括与范围#51交叠的区域的、传感器25的视角的范围。
·系统配置
在图6等中,处理单元32设置在电信装置11中。处理单元32的一些或全部功能可以由连接到网络12的服务器来实现。
图22是示出视频通信系统的另一示例性配置的图。
图22所示的视频通信系统被配置成使得电信装置11a、电信装置11b和服务器101经由诸如因特网的网络12彼此连接。在服务器101中,提供了参照图6、图11或图16描述的处理单元32的一部分或全部的配置。
这样,处理单元32可以设置在电信装置11之外。
例如,将诸如视频信息、环境信息和声音信息(例如环境声音)的各种信息从电信装置11发送到服务器101。
例如,将连接目的地的诸如视频信息、环境信息和声音信息(例如环境声音)的各种信息从服务器101发送到电信装置11。
可以针对电信装置11设置用于控制电信装置11的家庭服务器。
图23是示出视频通信系统的又一示例性配置的图。
图23所示的视频通信系统被配置成使得电信装置11a和电信装置11b经由网络12连接。
电信装置11a包括输入/输出单元111a和家庭服务器112a。在输入/输出单元111a中,提供了输入单元31和输出单元35的配置。在家庭服务器112a中,提供了处理单元32、发送单元33和接收单元34的配置。家庭服务器112a经由网络12连接到电信装置11b的家庭服务器112b。
类似地,电信装置11b包括输入/输出单元111b和家庭服务器112b。在输入/输出单元111b中,提供了输入单元31和输出单元35的配置。在家庭服务器112b中,提供了处理单元32、发送单元33和接收单元34的配置。家庭服务器112b经由网络12连接到家庭服务器112a。
这样,可以在包括显示器22等的输入/输出单元111之外提供处理单元32等的配置。
可以在家庭服务器112a和112b中提供处理单元32的部分配置,并且可以在输入/输出单元111a和111b中提供处理单元32的剩余配置。
如上所述,在本技术中,当在安装有电信装置11a的点A的空间与安装有电信装置11b的点B的空间之间,由一个空间的摄像装置24捕获的捕获图像的视频由另一空间中的显示器22实时显示时,执行处理,以在检测到处于安装在点B处的摄像装置24的视角之外的位置的用户时,通知点A处的用户存在上述用户。
因此,可以使得在点A处观看点B的视频的用户能够以更适当的形式意识到点B的视频的视角之外的人的存在。
具体地,在本技术中,执行处理,以向点A处的用户中作为特定目标的用户通知由安装在点B处的麦克风26收集的声音中所包括的、安装在点B处的摄像装置24的视角之外的指示声音。
因此,当在点A处有多个用户观看点B的方面时,只有注意摄像装置视角之外的人的一些用户可以意识到摄像装置视角之外的人的存在。
·计算机的示例
参照上述流程图描述的每个处理可以不必按流程图中描述的顺序按时间顺序执行,并且包括并行或单独执行的处理(例如,并行处理或根据对象的处理)。程序可以由单个CPU来处理,或者可以由多个CPU来分布和处理。
上述电信装置11等的一系列处理步骤可以由硬件或软件来执行。当处理的一系列步骤由软件执行时,软件的程序从记录程序的程序记录介质安装到嵌入在专用硬件中的计算机,或例如能够通过安装各种程序来执行各种功能的通用个人计算机。
图24是示出根据程序执行上述一系列处理步骤的计算机的示例性硬件配置的框图。
在计算机中,CPU 201、ROM 202和RAM 203经由总线204彼此连接。
输入/输出接口205也连接到总线204。下述各项连接到输入/输出接口205:诸如键盘、鼠标或麦克风的输入单元206;诸如显示器或扬声器的输出单元207;诸如硬盘或非易失性存储器的存储单元208;诸如网络接口的通信单元209;以及驱动诸如磁盘、光盘、磁光盘或半导体存储器的可移除介质211的驱动器210。
在具有上述配置的计算机中,CPU 201例如通过经由输入/输出接口205和总线204将存储在存储单元208中的程序加载到RAM 203并且执行程序来执行上述一系列处理步骤。
例如,由计算机(CPU 201)执行的程序被记录在可移除介质211上,或者经由诸如局域网、因特网或数字卫星广播的有线或无线传输介质来提供,其中,可移除介质211是诸如磁盘(包括软盘)、光盘(致密盘只读存储器(CD-ROM)、数字通用盘(DVD)等)、磁光盘或半导体存储器的封装介质。
通过将可移除介质211安装在驱动器210上,可以经由输入/输出接口205将程序安装到存储单元208。程序可以由通信单元209经由有线或无线传输介质接收以安装在存储单元208中。此外,程序可以预先安装在ROM 202或存储单元208中。
·其他
在本说明书中,系统是指多个组成元件(装置、模块(部件)等)的集合,并且所有组成元件可以包括在同一外壳中或不包括在同一外壳中。因此,容纳在分开的外壳中并且经由网络连接的多个装置以及其中多个模块容纳在一个外壳中的一个装置都可以是系统。
在本说明书中描述的有利效果仅是示例性的,而不是限制性的,并且可以实现其他有益效果。
本技术的实施例不限于上述实施例,并且可以在不脱离本技术要旨的情况下在本技术的范围内以各种形式进行修改。
例如,本技术可以具有其中多个装置经由网络共享并且一起处理一个功能的云计算的配置。
<配置的组合示例>
本技术可以配置如下。
(1)
一种信息处理装置,包括处理单元,
其中,在安装有第一成像装置和第一显示装置的第一空间与安装有第二成像装置和第二显示装置的第二空间之间,当由一个空间中的成像装置捕获的捕获图像由另一空间中的显示装置实时显示时,
所述处理单元执行处理,以在检测到处于第二成像装置的视角之外的位置的第二用户时,向第一空间中的第一用户通知第二用户处于第二成像装置的视角之外。
(2)
根据(1)所述的信息处理装置,其中,所述处理单元执行处理,以向第一空间中的第一用户中作为特定目标的第一特定用户通知在第二空间中收集的声音中所包括的第二成像装置的视角之外的指示声音。
(3)
根据(2)所述的信息处理装置,
其中,所述处理单元包括:
输出控制单元,其使安装在第一空间中的第一声音输出装置实时输出在第二空间中收集的声音,以及
分析单元,其分析在第二空间中收集的声音中的第二成像装置的视角之外的所述指示声音,并且
其中,所述输出控制单元基于所述指示声音的分析结果使第一声音输出装置实时输出所述指示声音。
(4)
根据(3)所述的信息处理装置,
其中,所述处理单元还包括输出方法选择单元,所述输出方法选择单元基于所述指示声音的分析结果来选择所述指示声音的输出方法,并且
其中,所述输出控制单元使第一声音输出装置使用针对选择目标的输出方法来输出所述指示声音。
(5)
根据(4)所述的信息处理装置,
其中,所述处理单元还包括第一关注度分析单元,所述第一关注度分析单元分析存在于第一空间的、对第二成像装置的视角之外关注的第一关注用户关于第二成像装置的视角之外的关注度,并且
其中,所述输出方法选择单元根据所述第一关注用户的所述关注度来选择所述指示声音的输出方法。
(6)
根据(5)所述的信息处理装置,其中,所述输出控制单元使所述指示声音对第一空间中的第一用户中的所述第一关注用户输出。
(7)
根据(5)或(6)所述的信息处理装置,其中,所述第一关注度分析单元基于所述第一关注用户的视线所朝向的处于第二成像装置的视角之外的位置、所述第一关注用户的视线朝向第二成像装置的视角之外的时间长度、所述第一关注用户的头部的朝向、以及所述第一关注用户说出的声音,分析所述第一关注用户的所述关注度。
(8)
根据(6)所述的信息处理装置,
其中,所述输出方法选择单元选择调整和输出所述指示声音的方向性的方法,作为所述指示声音的输出方法,并且
其中,所述输出控制单元使方向性被调整的所述指示声音向所述第一关注用户输出。
(9)
根据(4)所述的信息处理装置,
其中,所述处理单元还包括第二关注度分析单元,所述第二关注度分析单元分析第二空间中的处于第二成像装置的视角之外的位置的第二用户关于第一空间的关注度,并且
其中,所述输出控制单元根据关注第一空间的第二关注用户的关注度来选择所述指示声音的输出方法。
(10)
根据(9)所述的信息处理装置,其中,所述输出控制单元使所述指示声音对第一空间中的第一用户中被所述第二关注用户关注的第一被关注用户输出。
(11)
根据(10)所述的信息处理装置,其中,所述第二关注度分析单元基于所述第二关注用户的视线所朝向的第一空间的位置、所述第二关注用户的视线朝向所述第一被关注用户的时间长度、所述第二关注用户的视线朝向所述第一被关注用户的次数、以及所述第二关注用户的头部的朝向,分析所述第二关注用户的所述关注度。
(12)
根据(10)所述的信息处理装置,
其中,所述输出方法选择单元选择调整和输出所述指示声音的方向性的方法,作为所述指示声音的输出方法,并且
其中,所述输出控制单元使方向性被调整的所述指示声音向第一被关注用户输出。
(13)
根据(9)至(12)中任一项所述的信息处理装置,其中,所述输出控制单元使第一声音输出装置输出所述第二关注用户的周围声音作为指示声音。
(14)
根据(9)所述的信息处理装置,其中,所述输出控制单元使安装在第一空间中的发光体根据所述第二关注用户的所述关注度发光。
(15)
根据(9)所述的信息处理装置,其中,所述输出控制单元使第一空间中的第一用户中被所述第二关注用户关注的所述第一被关注用户所携带的装置根据所述第二关注用户的所述关注度振动。
(16)
根据(1)所述的信息处理装置,
其中,所述处理单元包括:
输出控制单元,其使安装在第一空间中的第一声音输出装置实时输出在第二空间中收集的声音,以及
保密性获取单元,其获取由第二空间中的第二用户执行的动作的保密性,并且
其中,所述输出控制单元根据所述保密性使保密声音对第一空间中的第一用户输出。
(17)
根据(1)所述的信息处理装置,其中,所述处理单元包括:
输出控制单元,其使安装在第一空间中的第一声音输出装置实时输出在第二空间中收集的声音,以及
保密性分析单元,其分析由第一空间中的第一用户执行的动作的保密性,并且
其中,当第二用户在第二空间中处于第二成像装置的视角之外时,所述输出控制单元根据所述保密性使所述指示声音对第一空间中的第一用户输出。
(18)
根据(1)至(17)中任一项所述的信息处理装置,其中,所述信息处理装置与安装在第一空间中的第一成像装置和第一显示装置或者安装在第二空间中的第二成像装置和第二显示装置集成,并且经由网络连接至安装在另一空间中的信息处理装置。
(19)
一种信息处理方法,
其中,在安装有第一成像装置和第一显示装置的第一空间与安装有第二成像装置和第二显示装置的第二空间之间,当由一个空间中的成像装置捕获的捕获图像由另一空间中的显示装置实时显示时,
信息处理装置执行处理,以当在第二空间中收集的声音中检测到从第二成像装置的视角之外听到的声音时,向第一空间中的第一用户通知从第二成像装置的视角之外听到的声音。
(20)
一种程序,所述程序使计算机执行以下操作:
在安装有第一成像装置和第一显示装置的第一空间与安装有第二成像装置和第二显示装置的第二空间之间,当由一个空间中的成像装置捕获的捕获图像由另一空间中的显示装置实时显示时,
执行处理,以当在第二空间中收集的声音中检测到从第二成像装置的视角之外听到的声音时,向第一空间中的第一用户通知从第二成像装置的视角之外听到的声音。
附图标记列表
1 视频通信系统
11 电信装置
21 框
22 显示器
23 传感器单元
24 摄像装置
25-1,25-2 传感器
26 麦克风
27-1,27-2 扬声器
31 输入单元
32 处理单元
33 发送单元
34 接收单元
35 输出单元
41 关注度分析单元
42 环境信息分析单元
43 指示声音输出方法选择单元
44 指示声音控制单元
51 连接目的地关注度分析单元
71 保密性分析单元
72 连接目的地保密性获取单元
73 保密声音输出方法选择单元
74 保密声音控制单元
101 服务器
111a,111b 家庭服务器
112a,112b 输入/输出单元
Claims (20)
1.一种信息处理装置,包括处理单元,
其中,在安装有第一成像装置和第一显示装置的第一空间与安装有第二成像装置和第二显示装置的第二空间之间,当由一个空间中的成像装置捕获的捕获图像由另一空间中的显示装置实时显示时,
所述处理单元执行处理,以在检测到处于第二成像装置的视角之外的位置的第二用户时,向第一空间中的第一用户通知第二用户处于第二成像装置的视角之外。
2.根据权利要求1所述的信息处理装置,其中,所述处理单元执行处理,以向第一空间中的第一用户中作为特定目标的第一特定用户通知在第二空间中收集的声音中所包括的第二成像装置的视角之外的指示声音。
3.根据权利要求2所述的信息处理装置,
其中,所述处理单元包括:
输出控制单元,其使安装在第一空间中的第一声音输出装置实时输出在第二空间中收集的声音,以及
分析单元,其分析在第二空间中收集的声音中的第二成像装置的视角之外的所述指示声音,并且
其中,所述输出控制单元基于所述指示声音的分析结果使第一声音输出装置实时输出所述指示声音。
4.根据权利要求3所述的信息处理装置,
其中,所述处理单元还包括输出方法选择单元,所述输出方法选择单元基于所述指示声音的分析结果来选择所述指示声音的输出方法,并且
其中,所述输出控制单元使第一声音输出装置使用针对选择目标的输出方法来输出所述指示声音。
5.根据权利要求4所述的信息处理装置,
其中,所述处理单元还包括第一关注度分析单元,所述第一关注度分析单元分析存在于第一空间的、对第二成像装置的视角之外关注的第一关注用户关于第二成像装置的视角之外的关注度,并且
其中,所述输出方法选择单元根据所述第一关注用户的所述关注度来选择所述指示声音的输出方法。
6.根据权利要求5所述的信息处理装置,其中,所述输出控制单元使所述指示声音对第一空间中的第一用户中的所述第一关注用户输出。
7.根据权利要求5所述的信息处理装置,其中,所述第一关注度分析单元基于所述第一关注用户的视线所朝向的处于第二成像装置的视角之外的位置、所述第一关注用户的视线朝向第二成像装置的视角之外的时间长度、所述第一关注用户的头部的朝向、以及所述第一关注用户说出的声音,分析所述第一关注用户的所述关注度。
8.根据权利要求6所述的信息处理装置,
其中,所述输出方法选择单元选择调整和输出所述指示声音的方向性的方法,作为所述指示声音的输出方法,并且
其中,所述输出控制单元使方向性被调整的所述指示声音向所述第一关注用户输出。
9.根据权利要求4所述的信息处理装置,
其中,所述处理单元还包括第二关注度分析单元,所述第二关注度分析单元分析第二空间中的处于第二成像装置的视角之外的位置的第二用户关于第一空间的关注度,并且
其中,所述输出控制单元根据关注第一空间的第二关注用户的关注度来选择所述指示声音的输出方法。
10.根据权利要求9所述的信息处理装置,其中,所述输出控制单元使所述指示声音对第一空间中的第一用户中被所述第二关注用户关注的第一被关注用户输出。
11.根据权利要求10所述的信息处理装置,其中,所述第二关注度分析单元基于所述第二关注用户的视线所朝向的第一空间的位置、所述第二关注用户的视线朝向所述第一被关注用户的时间长度、所述第二关注用户的视线朝向所述第一被关注用户的次数、以及所述第二关注用户的头部的朝向,分析所述第二关注用户的所述关注度。
12.根据权利要求10所述的信息处理装置,
其中,所述输出方法选择单元选择调整和输出所述指示声音的方向性的方法,作为所述指示声音的输出方法,并且
其中,所述输出控制单元使方向性被调整的所述指示声音向第一被关注用户输出。
13.根据权利要求9所述的信息处理装置,其中,所述输出控制单元使第一声音输出装置输出所述第二关注用户的周围声音作为指示声音。
14.根据权利要求9所述的信息处理装置,其中,所述输出控制单元使安装在第一空间中的发光体根据所述第二关注用户的所述关注度发光。
15.根据权利要求9所述的信息处理装置,其中,所述输出控制单元使第一空间中的第一用户中被所述第二关注用户关注的所述第一被关注用户所携带的装置根据所述第二关注用户的所述关注度振动。
16.根据权利要求1所述的信息处理装置,
其中,所述处理单元包括:
输出控制单元,其使安装在第一空间中的第一声音输出装置实时输出在第二空间中收集的声音,以及
保密性获取单元,其获取由第二空间中的第二用户执行的动作的保密性,并且
其中,所述输出控制单元根据所述保密性使保密声音对第一空间中的第一用户输出。
17.根据权利要求1所述的信息处理装置,其中,所述处理单元包括:
输出控制单元,其使安装在第一空间中的第一声音输出装置实时输出在第二空间中收集的声音,以及
保密性分析单元,其分析由第一空间中的第一用户执行的动作的保密性,并且
其中,当第二用户在第二空间中处于第二成像装置的视角之外时,所述输出控制单元根据所述保密性使所述指示声音对第一空间中的第一用户输出。
18.根据权利要求1所述的信息处理装置,其中,所述信息处理装置与安装在第一空间中的第一成像装置和第一显示装置或者安装在第二空间中的第二成像装置和第二显示装置集成,并且经由网络连接至安装在另一空间中的信息处理装置。
19.一种信息处理方法,
其中,在安装有第一成像装置和第一显示装置的第一空间与安装有第二成像装置和第二显示装置的第二空间之间,当由一个空间中的成像装置捕获的捕获图像由另一空间中的显示装置实时显示时,
信息处理装置执行处理,以在检测到处于第二成像装置的视角之外的位置的第二用户时,向第一空间中的第一用户通知第二用户处于第二成像装置的视角之外。
20.一种程序,所述程序使计算机执行以下操作:
当在安装有第一成像装置和第一显示装置的第一空间与安装有第二成像装置和第二显示装置的第二空间之间,由一个空间中的成像装置捕获的捕获图像由另一空间中的显示装置实时显示时,
执行处理,以在检测到处于第二成像装置的视角之外的位置的第二用户时,向第一空间中的第一用户通知第二用户处于第二成像装置的视角之外。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019-202081 | 2019-11-07 | ||
JP2019202081 | 2019-11-07 | ||
PCT/JP2020/039843 WO2021090702A1 (ja) | 2019-11-07 | 2020-10-23 | 情報処理装置、情報処理方法、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114631309A true CN114631309A (zh) | 2022-06-14 |
Family
ID=75848388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080076142.XA Pending CN114631309A (zh) | 2019-11-07 | 2020-10-23 | 信息处理装置、信息处理方法和程序 |
Country Status (5)
Country | Link |
---|---|
US (1) | US12033490B2 (zh) |
JP (1) | JPWO2021090702A1 (zh) |
CN (1) | CN114631309A (zh) |
DE (1) | DE112020005475T5 (zh) |
WO (1) | WO2021090702A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023276700A1 (ja) * | 2021-06-28 | 2023-01-05 | パナソニックIpマネジメント株式会社 | 注力判定システム、コミュニケーション解析システム、及び、注力判定方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2947113B2 (ja) * | 1995-03-09 | 1999-09-13 | 日本電気株式会社 | 画像通信端末用ユーザインタフェース装置 |
JP6496172B2 (ja) | 2015-03-31 | 2019-04-03 | 大和ハウス工業株式会社 | 映像表示システム及び映像表示方法 |
JP6570290B2 (ja) | 2015-03-31 | 2019-09-04 | 大和ハウス工業株式会社 | 映像表示システム及び映像表示方法 |
US11392709B2 (en) * | 2019-01-08 | 2022-07-19 | Intel Corporation | Automatically enhancing privacy in live video streaming |
-
2020
- 2020-10-23 US US17/642,487 patent/US12033490B2/en active Active
- 2020-10-23 DE DE112020005475.6T patent/DE112020005475T5/de active Pending
- 2020-10-23 CN CN202080076142.XA patent/CN114631309A/zh active Pending
- 2020-10-23 JP JP2021554884A patent/JPWO2021090702A1/ja active Pending
- 2020-10-23 WO PCT/JP2020/039843 patent/WO2021090702A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US20220309900A1 (en) | 2022-09-29 |
US12033490B2 (en) | 2024-07-09 |
WO2021090702A1 (ja) | 2021-05-14 |
JPWO2021090702A1 (zh) | 2021-05-14 |
DE112020005475T5 (de) | 2022-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6143975B1 (ja) | 画像の取り込みを支援するためにハプティックフィードバックを提供するためのシステムおよび方法 | |
US9516241B2 (en) | Beamforming method and apparatus for sound signal | |
US10339913B2 (en) | Context-based cancellation and amplification of acoustical signals in acoustical environments | |
US9766057B1 (en) | Characterization of a scene with structured light | |
US11120797B2 (en) | Information processing terminal, information processing apparatus, and information processing method | |
WO2010011471A1 (en) | Speaker identification and representation for a phone | |
US10587979B2 (en) | Localization of sound in a speaker system | |
JP2019197550A (ja) | 音声入出力装置 | |
US20210191735A1 (en) | Adjusting settings on computing devices based on location | |
JP2017123505A (ja) | コンテンツ再生装置、コンテンツ再生方法及びプログラム | |
CN114631309A (zh) | 信息处理装置、信息处理方法和程序 | |
JP7105380B2 (ja) | 情報処理システム及び方法 | |
KR102348658B1 (ko) | 표시장치 및 그 구동 방법 | |
KR101976937B1 (ko) | 마이크로폰 어레이를 이용한 회의록 자동작성장치 | |
US11227423B2 (en) | Image and sound pickup device, sound pickup control system, method of controlling image and sound pickup device, and method of controlling sound pickup control system | |
US20110043598A1 (en) | Remote communication apparatus and method of estimating a distance between an imaging device and a user image-captured | |
US20200059748A1 (en) | Augmented reality for directional sound | |
US20230186654A1 (en) | Systems and methods for detection and display of whiteboard text and/or an active speaker | |
JP2016118816A (ja) | 表示システム、表示方法及びプログラム | |
JP6648776B2 (ja) | 運用管理装置、運用管理システム、運用管理方法、プログラム | |
JP2018196060A (ja) | 情報処理装置、情報処理システム、情報処理方法、およびプログラム | |
JP7111202B2 (ja) | 収音制御システム及び収音制御システムの制御方法 | |
KR102192265B1 (ko) | 화상전화용 마이크 | |
US11347462B2 (en) | Information processor, information processing method, and program | |
JP2018006822A (ja) | 音声出力システム及び音声出力方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |