CN117337434A - 信息处理装置、信息处理方法和信息处理系统 - Google Patents
信息处理装置、信息处理方法和信息处理系统 Download PDFInfo
- Publication number
- CN117337434A CN117337434A CN202180098260.5A CN202180098260A CN117337434A CN 117337434 A CN117337434 A CN 117337434A CN 202180098260 A CN202180098260 A CN 202180098260A CN 117337434 A CN117337434 A CN 117337434A
- Authority
- CN
- China
- Prior art keywords
- comment
- virtual
- commentator
- information processing
- viewer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 88
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000009877 rendering Methods 0.000 claims description 42
- 238000000605 extraction Methods 0.000 claims description 35
- 230000007423 decrease Effects 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 10
- 238000009826 distribution Methods 0.000 description 71
- 238000010586 diagram Methods 0.000 description 44
- 230000008451 emotion Effects 0.000 description 42
- 238000000034 method Methods 0.000 description 37
- 230000008569 process Effects 0.000 description 26
- 238000012545 processing Methods 0.000 description 20
- 230000008859 change Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 8
- 238000003860 storage Methods 0.000 description 8
- 230000007704 transition Effects 0.000 description 8
- 230000003247 decreasing effect Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 4
- 230000033001 locomotion Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010191 image analysis Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010411 cooking Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 241001122315 Polites Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000037007 arousal Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003090 exacerbative effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/4788—Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/131—Protocols for games, networked simulations or virtual reality
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/4302—Content synchronisation processes, e.g. decoder synchronisation
- H04N21/4307—Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
- H04N21/43076—Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of the same content streams on multiple devices, e.g. when family members are watching the same movie on different devices
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4882—Data services, e.g. news ticker for displaying messages, e.g. warnings, reminders
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明更容易地创建具有评论附加至其的视频内容。根据本发明的实施方式的信息处理装置设置有:获取单元(10,110,120),其获取关于内容的提供者与内容的观看者之间的关系的信息;以及评论生成单元(40),其基于关于所述关系的信息,生成由虚拟评论员做出的评论。
Description
技术领域
本公开涉及信息处理装置、信息处理方法和信息处理系统。
背景技术
近年来,随着诸如YouTube(注册商标)的动态图像分发服务的出现,诸如体育、游戏和教育的动态图像内容越来越多地与诸如解说和说明的评论一起分发。
引用列表
专利文献
专利文献1:JP 2018-187712 A
发明内容
技术问题
然而,通过语音、文本等将评论添加到动态图像内容的编辑工作通常由内容创建者手动执行,并且编辑所需的设备的引进成本和编辑所需的工作成本高,并且不是任何人都可以容易地创建具有评论的动态图像内容的情况。
因此,本公开提出了能够更容易地创建所评论的动态图像内容的信息处理装置、信息处理方法和程序。
问题的解决方案
为了解决上述问题,根据本公开的实施例的信息处理装置包括:获取单元,其获取关于内容的投稿者与内容的观看者之间的关系的信息;以及评论生成单元,其基于关于所述关系的信息生成将由虚拟评论员说出的评论。
附图说明
图1是用于描述根据本公开的实施方式的根据虚拟评论员的位置的评论的改变的示图。
图2A是示出根据本公开的实施方式的动态图像内容选择画面的示例的视图。
图2B是示出根据本公开的实施方式的虚拟评论员选择画面的示例的视图。
图2C是示出根据本公开的实施方式的用于选择虚拟评论员的位置的选择画面的示例的视图。
图2D是示出根据本公开的实施方式的用于选择由虚拟评论员说出的评论的听众的选择画面的示例的视图。
图2E是示出根据本公开的实施方式的用于评论的动态图像内容的再现画面的示例的视图。
图3A是示出根据本公开的实施方式的在投稿(上传)动态图像内容时添加评论的情况的示例的示图。
图3B是示出根据本公开的实施方式的在观看(下载)动态图像内容时添加评论的情况的示例的示图。
图4是示出根据本公开的实施方式的在投稿(上传)动态图像内容时添加评论的情况下的系统配置示例的框图。
图5A是示出根据本公开的实施方式的从应用的开始到虚拟评论员的设置的操作的示例的流程图。
图5B是示出根据本公开的实施方式的用于管理动态图像内容的动态图像内容管理表的示例的示图。
图5C是示出根据本公开的实施方式的用于管理虚拟评论员的角色的角色管理表的示例的示图。
图5D是示出根据本公开的实施方式的用于管理虚拟评论员的位置的位置管理表的示例的示图。
图5E是示出根据本公开的实施方式的用于管理虚拟评论员向其发出评论的对象(评论对象)的评论对象管理表的示例的示图。
图6A是示出根据本公开的实施方式的事件提取操作的示例的流程图。
图6B是示出根据本公开的实施方式的用于管理识别模型的模型管理表的示例的示图。
图6C是示出根据本公开的实施方式的用于管理事件的事件管理表的示例的示图。
图6D是示出根据本公开的实施方式的事件数据列表的示例的示图。
图7A是示出根据本公开的实施方式的评论生成操作的示例的流程图。
图7B是示出根据本公开的实施方式的位置评论列表的示例和使用过的评论历史的示例的示图。
图7C是示出根据本公开的实施方式的对象评论列表的示例的示图。
图8A是示出根据本公开的实施方式的修改示例的结尾转换操作的示例的流程图。
图8B是示出根据本公开的实施方式的层级关系管理表的示例的示图。
图9A是示出根据本公开的实施方式的用于评论的动态图像内容的生成操作和分发操作的示例的流程图。
图9B是示出根据本公开的实施方式的化身生成处理的操作流程的示例的流程图。
图9C是示出根据本公开的实施方式的编辑/渲染处理的操作流程的示例的流程图。
图10A是用于描述根据本公开的实施方式的改变动态图像内容中的评论对象的情况的示例的示图。
图10B是示出图10A中由虚拟评论员每次发出的评论的示例的示图。
图11A是示出根据本公开的实施方式的评论生成操作的示例的流程图。
图11B是示出图11A的步骤S220中的位置/对象调整操作的更详细操作流程的流程图。
图12A是用于描述根据本公开的实施方式的基于情感值生成评论的情况的示例的示图。
图12B是示出根据本公开的实施方式的关于每个事件的每个位置的情感值的变化量的表。
图12C是用于描述根据本公开的实施方式的与事件相关联的图12A中所示的情感值的变化的图。
图13是示出根据本公开的实施方式的在虚拟评论员的位置是“朋友”并且评论对象是“玩家”的情况下的评论生成的操作流程的示例的流程图。
图14是示出根据本公开的实施方式的在观看(下载)动态图像内容时添加评论的情况下的系统配置示例的框图。
图15A是示出根据本公开的实施方式的从应用的开始到虚拟评论员的设置的操作的另一示例的流程图。
图15B是示出根据本公开的实施方式的角色管理表的示例的示图。
图16A是示出根据本公开的实施方式的在生成两个虚拟评论员的会话评论以用于实时动态图像分发的情况下的系统配置示例的框图。
图16B是示出根据本公开的实施方式的在为实时动态图像分发生成两个虚拟评论员的会话评论的情况下的操作示例的流程图。
图16C是示出根据本公开的实施方式的在为实时动态图像分发生成两个虚拟评论员的会话评论的情况下的事件间隔的示例的示图。
图16D是示出根据本公开的实施方式的评论生成处理的操作流程的示例的流程图。
图16E是示出根据本公开的实施方式的发言控制处理的操作流程的示例的流程图。
图16F是示出根据本公开的实施方式的编辑/渲染处理的操作流程的示例的流程图。
图17A是示出根据本公开的实施方式的在实时动态图像分发期间根据来自观看者的反馈生成评论的情况下的操作示例的流程图。
图17B是示出根据本公开的实施方式的观看者反馈处理的操作流程的示例的流程图。
图18是示出根据本公开的实施方式的在实况分发期间虚拟评论员的数目增加或减少的情况下的操作流程的示例的流程图。
图19A是示出根据本公开的实施方式的在虚拟评论员的位置是“一起观看的朋友”并且谈论动态图像内容的情况下的虚拟位置的示例的视图。
图19B是示出根据本公开的实施方式的虚拟评论员的位置是“一起观看的朋友”并与观看者交谈的情况的视图。
图19C是示出根据本公开的实施方式的虚拟评论员的位置是“讲解者”并且与观看者交谈的情况的视图。
图20A是示出根据本公开的实施方式的语音评论的字幕被布置在基本位置(例如,画面中心的下方)的情况的示例的视图。
图20B是示出根据本公开的实施方式的基于投稿者的视线信息来调整语音评论的字幕的位置的情况的示例的视图。
图20C是示出根据本公开的实施方式的基于观看者的视线信息生成位置评论并且调整语音评论的字幕的显示位置的情况的示例的视图。
图21是示出根据本公开的实施方式的在通过应用机器学习针对虚拟评论员的每个位置生成评论的情况下的系统配置示例的框图。
图22是示出根据本公开执行各种类型的处理的信息处理装置的示例的硬件配置图。
具体实施方式
在下文中,将参考附图详细描述本公开的实施方式。注意,在下面的实施方式中,相同的部件用相同的附图标记表示,并且将省略重叠的描述。
此外,将根据以下项顺序描述本公开内容。
1.实施方式
1.1根据虚拟评论员位置和对象的评论
1.2应用画面示例
1.3添加评论的人的示例
1.4在投稿(上传)时添加评论的情况下的系统配置示例
1.5在投稿(上传)时添加评论的情况下的操作流程示例
1.5.1从应用启动到虚拟评论员设置的操作示例
1.5.2事件提取操作的示例
1.5.3评论生成操作的示例
1.5.3.1结尾转换的修改示例
1.5.4评论的动态图像内容的生成操作和分发操作的示例
1.5.4.1化身生成处理的示例
1.5.4.2编辑/渲染处理的示例
1.6动态地改变位置/评论对象的示例
1.6.1操作流程示例
1.7基于情感值生成评论的示例
1.7.1操作流程示例
1.8在观看(下载)时添加评论的情况下的系统配置示例
1.9在观看(下载)时添加评论的情况下的操作流程示例
1.10生成用于实时动态图像分发的两个虚拟评论员的会话评论的示例
1.10.1评论生成处理的示例
1.10.2发言控制处理的示例
1.10.3编辑/渲染处理的示例
1.11在实时动态图像分发期间根据来自观看者的反馈生成评论的示例
1.11.1观看者反馈示例
1.12在实时动态图像观看期间虚拟评论员增加或减少的示例
1.13根据虚拟评论员的位置调整显示位置的示例
1.14存在多个虚拟评论员的情况下的评论规则的示例
1.15使用视线信息的评论示例
1.16字幕显示位置示例
1.17通过应用机器学习为虚拟评论员的每个位置生成评论的示例
2.系统配置示例
3.硬件配置
1.实施方式
以下,将参照附图详细描述根据本公开的实施方式例的信息处理装置、信息处理方法和信息处理系统。在本实施方式中,根据“在什么位置以及向谁给出评论”为体育、游戏等的视频自动生成最佳评论。用于向视频添加评论的服务的代表性示例包括在电视等上广播的体育节目的实况广播,诸如棒球广播或足球广播。然而,近来,随着诸如YouTube(注册商标)的使用因特网的动态图像分发服务的出现,该服务的应用也扩展到诸如实况游戏广播或产品介绍的动态图像内容。结果,虽然电视节目的传统解说是针对未指定的大量观看者的广播,但是在使用因特网的动态图像分发服务中,已经开发了考虑到特定观看者来进行解说的风格,例如对诸如朋友或家庭的特定群的投稿/分发,或者在实况分发期间交互地响应来自观看者的聊天。
1.1取决于虚拟评论员的位置和对象的评论
在此,将参考图1描述根据本实施方式的“在什么位置以及向谁给出评论”的含义。图1示出了在各种位置虚拟评论员C1给出关于动态图像内容G0的评论的情况,在动态图像内容G0中玩家(他自己/她自己:乔治)U1正玩足球游戏。
图1的(1)示出了作为玩足球游戏的玩家U1的虚拟评论员C1评论的情况。图1的(2)示出了虚拟评论员C1作为玩家U1的团队成员进行评论的情况。团队成员可以是通过网络玩相同足球游戏的另一个玩家,或者可以是非玩家角色(NPC)。图1的(3)示出了虚拟评论员C1作为观看足球游戏的观看者(例如,朋友)之一进行评论的情况。
在(1)中,虚拟评论员C1通过说例如“我们一起试一试吧!”来表示玩家U1的热情。在(2)中,虚拟评论员C1作为玩家U1的队员说“让我们一起跑吧!”。在(3)中,虚拟评论员C1作为观看者支持“振作起来!让我们扭转局面吧!”。这样,可以看出,如果虚拟评论员C1的位置对于一个视频场景是不同的,则适当的评论是不同的。
此外,关于(3),在要被给予评论的对象是(3-1)中的玩家U1并以及是(3-2)中的观看者(朋友)A1的情况下,在(3-1)中将呼喊玩家U1的名字并且鼓励玩家U1,例如“坚持下去,乔治!”,但是在(3-2)中将在朋友之间进行表达诚实意见的会话,例如“乔治做出判断不是很慢吗?”。
如上所述,与电视节目的广播解说不同,当考虑投稿者和观看者生成评论时,需要通过澄清虚拟评论员的位置和评论的对象来生成适当的评论。此外,“位置”具有两个含义。第一种是人站立的位置,第二种是某人在人类关系或社会中所采取的角色或观点。因此,在本实施方式中,例示了主要根据具有第二含义的位置生成评论的情况。然而,本公开不限于此,并且还可以根据3D虚拟空间中的观看者或虚拟评论员的位置来改变要生成的评论,该位置具有第一含义。
1.2应用画面的示例
接下来,将描述自动将评论添加到动态图像内容(在下文中,也简称为视频)的应用的画面的示例。在描述中,将举例说明用户利用其在将游戏记录在智能电话或游戏控制台上的同时玩游戏,然后向朋友分享所评论的游戏视频(动态图像内容)的应用。该应用可以是由各种信息处理设备执行的应用,诸如智能电话的应用、游戏控制台中的应用或个人计算机的应用。此外,将评论自动添加到动态图像内容的应用可以是仅具有评论添加功能的应用,或者可以被实现为游戏应用、记录应用、动态图像再现应用、动态图像分发应用或能够处理动态图像内容的社交网络服务(SNS)应用的一个功能。
图2A至2E是示出根据本实施方式的向动态图像内容自动添加评论的应用的画面的示例的视图。在该示例中,示出了由用户操作的输入设备是布置在屏幕上的触摸面板的情况,但是本公开不限于此,并且可以使用诸如鼠标、键盘或触摸板的输入设备。
图2A是示出作为文本添加对象的动态图像内容选择画面的示例的视图。如图2A所示,例如,在动态图像内容选择画面G10上,向用户呈现作为文本添加对象的候选的动态图像内容的缩略图B11至B13。当用户选择显示在动态图像内容选择画面G10上的缩略图B11、缩略图B12或缩略图B13时,选择作为文本添加对象的动态图像内容。图2A示出了选择足球游戏的解说动态图像作为动态图像内容的情况。例如,在记录所玩游戏的视频的情况下,可以通过显示用于询问用户是否分发内容以及是否添加评论的指示符来选择作为文本添加对象的动态图像内容。
图2B是示出用于对所选择的动态图像内容发出评论的虚拟评论员的选择画面的示例的视图。如图2B所示,例如,在评论员选择画面G20上,向用户呈现作为虚拟评论员的候选的角色B21至B23,该虚拟评论员对动态图像内容发表评论。图2B示出了女性角色B21、男性角色B22和男性角色B23。可以使用为其设置个人姓名的更具体的角色来代替抽象角色,例如女孩、男孩、男性或女性。在这种情况下,可以给予每个虚拟评论员更有特色的个性,因此,可以通过增加虚拟评论员的变化来选择适合于用户偏好的虚拟评论员。
图2C是示出用于选择所选虚拟评论员的位置的选择画面的示例的视图。如图2C所示,在位置选择画面G30上,例如,向用户呈现个人本人(玩家)B31、团队成员B32和朋友B33。例如,在用户想要虚拟评论员代表他/她来评论的情况下,用户可以选择“他自己”,在用户想要虚拟评论员作为一起玩游戏的团队成员来评论的情况下,用户可以选择“团队成员”,或者在用户想要虚拟评论员作为观看游戏的朋友来评论的情况下,用户可以选择“朋友”。在位置选择画面G30上呈现给用户的位置不限于上述,并且可以根据在图2A中选择的动态图像内容或在图2B中选择的虚拟评论员来适当地改变。例如,在选择用于教育的动态图像内容的情况下,可以将自己(老师或学生)、同学、老师(在用户不是老师的情况下)、监护人等作为虚拟评论员的位置呈现给用户。
图2D是示出用于选择评论的对象人(即,由虚拟评论员发出的评论的听众(评论对象))的选择画面的示例的视图。如图2D所示,在评论对象(听众)选择画面G40上,例如,向用户呈现人他/她自己(玩家)B41、团队成员B42和朋友B43。例如,在用户希望处于所选位置的虚拟评论员对他/她自己(玩家)进行评论的情况下,用户选择“自己”,在用户希望虚拟评论员对团队成员进行评论的情况下,用户选择“团队成员”,在用户希望虚拟评论员对朋友进行评论的情况下(例如,在希望在朋友之间进行会话的情况下),用户选择“朋友”。类似于位置选择画面G30,要在评论对象(听众)选择画面G40上呈现给用户的位置不限于上述,并且可以根据在图2A中选择的动态图像内容或在图2B中选择的虚拟评论员来适当地改变。
图2E是示出具有基于图2B至2D中选择的虚拟评论员的类型、位置和评论对象而自动添加到图2A中选择的动态图像内容的评论的动态图像内容的再现画面的示例的视图。在本实施方式中,分析所选择的动态图像内容,并且根据类似地选择的位置和评论对象为动态图像中的每个场景自动生成要由所选择的虚拟评论员说出的评论。例如,在选择足球游戏的解说的动态图像的情况下,通过分析游戏解说动态图像来提取游戏中的玩家和球的位置、技能的类型等作为事件,并且基于所选择的角色、其位置和评论对象来生成对应于每个事件的解说评论。然后,如图2E所示的评论动态图像内容G50中那样,所生成的解说评论T1以与虚拟评论员C1的角色相对应的语音或文本(字体)的形式叠加在游戏解说视频上。除了分析动态图像内容的方法之外,还可以通过利用游戏的开放应用编程接口(API)来执行从动态图像内容中提取事件。
1.3添加评论的人的示例
向动态图像内容添加评论的主题的示例包括动态图像内容的创建者、动态图像内容的投稿者、动态图像内容的分发者和动态图像内容的观看者。图3A是示出动态图像内容的创建者、动态图像内容的投稿者或动态图像内容的分发者将评论添加到动态图像内容的情况的示例的示图,即,在投稿(上传)动态图像内容时添加评论的情况。图3B是示出动态图像内容的每个观看者(包括自己)单独地将评论添加到动态图像内容的情况的示例的示图,即,在观看(下载)动态图像内容时添加评论的情况。在说明书中,将评论添加到动态图像内容的主题是指例如决定添加评论的人,包括虚拟评论员和评论对象的位置。
图3A和3B示出了在由作为动态图像内容的分发者的动态图像分发服务的服务提供商管理的云100中将评论自动添加到动态图像内容G0的情况。然而,本公开不限于此,并且评论可以在作为动态图像内容的创建者或投稿者的用户侧U100的信息处理设备(个人计算机、智能手机、游戏控制台等)中自动添加到动态图像内容G0,或者可以在动态图像内容的观看者侧A100的信息处理设备(个人计算机、智能手机、游戏控制台等)中将评论自动添加到动态图像内容。
如图3A所示,在动态图像内容的创建者、动态图像内容的投稿者或动态图像内容的投稿者通过使用用户终端M1将评论添加到动态图像内容G0的情况下,相同动态图像内容的创建者和/或投稿者(在该示例中为用户U1)以及动态图像内容的观看者A11至A13观看由相同虚拟评论员添加了相同评论的所评论的动态图像内容G1。然而,例如,在添加的评论是文本的情况下,根据动态图像内容的观看者A11至A13中的每一个的观看环境,显示评论的位置和大小可以不同。
另一方面,如图3B所示,在动态图像内容的每个观看者(包括他/她自己的人)U1和A11至A13单独将评论添加到公共动态图像内容G0的情况下,虚拟评论员的选择以及位置和评论对象的选择由每个观看者(包括他/她自己的人)U1和A11至A13执行。在这种情况下,添加到由观看者(包括他/她自己的人)U1和A11至A13观看的动态图像内容G1至G4的评论不一定相同。这样,在评论被单独添加到观看者侧的情况下,每个观看者可以根据他/她的品味或状况来选择虚拟评论员、位置和评论对象。因此,每个观看者可以观看具有适合于他/她的品味或状况的评论的动态图像内容。
也可以采用这样的配置,其中观看者(包括他/她自己的人)U1和A11至A13可以基于他自己/她自己在观看时选择的虚拟评论员、位置和评论对象,将评论附加地添加到动态图像内容的创建者、动态图像内容的投稿者或动态图像内容的分发者已经添加了评论的动态图像内容G1。
1.4在投稿(上传)时添加评论的情况下的系统配置示例
首先,下面将描述在投稿(上传)动态图像内容时添加评论的情况(见图3A)。图4是示出在投稿(上传)动态图像内容时添加评论的情况下的系统配置示例的框图。在描述中,举例说明了将语音评论添加到动态图像内容的情况。
如图4所示,在投稿(上传)时添加评论的情况下的信息处理系统1的系统配置包括用户终端10、用户信息保持单元20、事件提取单元30、评论生成单元40、发言控制单元50、化身生成单元60、编辑/渲染单元70和分发单元80。
用户终端10例如是用户U1侧的信息处理装置,例如智能电话、个人计算机或游戏控制台,并且执行用于生成(记录等)动态图像内容、自动添加评论等的应用。
用户信息保持单元20例如是在动态图像分发服务的提供者侧管理的数据库,并且保持关于用户U1的信息,关于与用户U1相关的其他用户(包括观看者)的信息,以及关于用户U1与其他用户(观看者等)之间的关系的信息。在说明书中,这些信息被统称为用户信息。
在此,关于用户U1与其他用户(观看者等)之间的关系的信息可以包括,例如,作为投稿者的用户U1与其他用户(观看者等)之间的亲密程度(例如帐户的关注关系)中的至少一种,动态图像内容中的用户U1与其他用户(观看者或类似人)之间的关系;用户U1过去投稿的动态图像内容的其他用户(观看者等)的历史信息。然而,本公开不限于此,并且可以包括关于用户U1和其他用户(观看者等)之间的关系的各种类型的信息。
事件提取单元30包括例如图像分析单元31和语音分析单元32,并且通过分析由用户终端10生成的动态图像内容中的图像和语音来从动态图像内容中提取事件。稍后将详细描述事件的提取。
评论生成单元40包括位置/对象控制单元41,并且基于用户终端10选择的虚拟评论员、位置和评论对象来生成关于由事件提取单元30提取的事件的评论(文本数据)。换言之,评论生成单元40基于关于用户U1与其他用户(观看者等)之间的关系的信息来生成要由虚拟评论员说出的评论。稍后将详细描述评论的生成。
发言控制单元50例如通过使用文本到语音(TTS)将由评论生成单元40生成的评论(文本数据)转换成声音数据。
例如,化身生成单元60基于由用户终端10选择的虚拟评论员来生成所选择的虚拟评论员的化身,然后,基于所选择的虚拟评论员的位置和评论对象以及由发言控制单元50生成的声音数据来生成用于操作化身的运动数据。
编辑/渲染单元70呈现由化身生成单元60生成的移动化身,并且叠加由对动态图像内容的视频数据的渲染所生成的视频数据(在下文中,也称为化身动画)。此外,编辑/渲染单元70将发言控制单元50产生的声音数据叠加在动态图像内容的声音数据上。编辑/渲染单元70例如可以通过基于由事件提取单元30提取的事件编辑动态图像内容来对动态图像内容进行摘要。动态图像内容可以在化身动画和声音数据叠加之前或之后被进行摘要。
分发单元80经由预定网络90将由编辑/渲染单元70生成的所评论的动态图像内容分发到观看者的终端。预定网络可以是各种网络,诸如因特网、局域网(LAN)、广域网(WAN)和移动通信系统(包括第四代移动通信系统(4G))、4G长期演进(LTE)、第五代移动通信系统(5G)等)。
1.5在投稿(上传)时添加评论的情况下的操作流程示例
图5A至9C是示出在投稿(上传)动态图像内容时添加评论的情况下的操作流程的示例的示图(见图3A)。该操作流程的一系列流程在图5A、6A、7A和9A中示出。此外,在说明书中,举例说明了将语音评论添加到动态图像内容的情况。
1.5.1从应用启动到虚拟评论员设置的操作示例
首先,将描述直到用户U1在用户终端10上启动应用并设置虚拟评论员为止的操作。图5A是示出直到用户U1在用户终端10上启动应用并设置虚拟评论员为止的操作的示例的流程图。此外,图5B至5E是示出在经由应用程序提供自动评论添加服务的提供者侧管理的管理表的示例的图,图5B示出了管理动态图像内容的动态图像内容管理表的示例,图5C示出了管理虚拟评论员的角色的角色管理表的示例,图5D示出了管理虚拟评论员的位置的位置管理表的示例,以及图5E示出了管理虚拟评论员向其发出评论的对象(评论对象)的评论对象管理表的示例。在描述中,假设提供动态图像分发服务的提供者和提供自动评论添加服务的提供者是相同的。
如图5A所示,当作为动态图像投稿者的用户U1启动用户终端10上的应用时,用户终端10(以下简称为用户终端10)的应用从用户信息保持单元20获取关于用户U1的用户信息(步骤S101)。换言之,在该示例中,用户终端10可用作获取关于作为动态图像内容的投稿者的用户U1与动态图像内容的观看者之间的关系的信息的获取单元。除了如上所述的关于用户U1自身的信息,关于与用户U1相关的其他用户(包括观看者)的信息,以及关于用户U1与其他用户之间的关系的信息之外,用户信息可以包括历史信息,诸如关于由用户U1上传的动态图像内容的信息,关于用户U1过去已经使用该应用添加了评论的动态图像内容的信息,及其类型。
当获取到用户信息时,用户终端10基于所获取的用户信息获取诸如用户U1拍摄的真人视频或游戏视频的动态图像内容的列表(也称为视频列表),通过使用所获取的视频列表创建图2A所示的动态图像内容选择画面G10,并且为用户U1显示动态图像内容选择画面G10(步骤S102)。在动态图像内容选择画面G10上的视频列表中,可以基于包括在用户信息中的历史信息来优先显示倾向于接收大量评论的类型的动态图像内容。
在用户U1基于显示在用户终端10上的动态图像内容选择画面G10选择要添加评论的动态图像内容的情况下(步骤S103),用户终端10从给予所选动态图像内容的元信息(以下称为视频信息)中获取所选动态图像内容的类型(视频类型)。视频信息可以是例如标签信息,诸如动态图像内容的标题和类型、游戏名称或盘名。随后,用户终端10通过使用所获取的视频类型,通过参考图5B中所示的动态图像内容管理表,来获取所选动态图像内容的类型ID。然后,用户终端10通过使用所获取的类型ID来参考图5C中所示的角色管理表,来获取用于所选择的动态图像内容的虚拟评论员的列表及其优先级。然后,用户终端10基于所获取的虚拟评论员的列表及其优先级来创建用户U1可选择的虚拟评论员列表,并通过使用所创建的虚拟评论员列表来创建图2B所示的评论员选择画面G20,并显示评论员选择画面20(步骤S104)。
例如,在用户U1选择足球游戏的动态图像内容的情况下,类型ID是G03,在用户U1选择烹饪的动态图像内容的情况下,类型ID是G04。用户终端10通过使用基于图5B所示的动态图像内容管理表指定的类型ID来参考图5C所示的角色管理表,获取每个类型ID的评论员列表和每个虚拟评论员的优先级,创建其中根据优先级列出了虚拟评论员的图标(选项)的评论员选择画面G20并且为用户U1显示评论员选择画面G20。
在此,优先级可以是例如为每个视频类型区分优先级的虚拟评论员的顺序。例如,在图5C所示的示例中,在“游戏”的视频类型(类型ID=G03)的情况下,将角色符ID=C01的角色“女孩”的优先级设置为最高,将C02的角色“男孩”的优先级设置为第二高,并且将C03的角色“男性”的优先级设置为第三高。因此,角色以此顺序显示在评论员选择画面G20上。
作为优先级设置规则,例如,可以使用各种方法,诸如基于规则设置适合于每个视频类型的角色(例如,喜欢体育的角色)的方法,基于用户的偏好历史设置每个角色的优先级的方法等。
当用户U1通过使用评论员选择画面G20选择虚拟评论员的角色时(步骤S105),用户终端10通过使用类型ID来参考图5D所示的位置管理表,以获取可以为虚拟评论员设置的位置的列表,通过使用所获取的位置的列表生成图2C所示的位置选择画面G30并为用户U1显示位置选择画面G30(步骤S106)。例如,在类型ID=G03的情况下,位置ID=S01是“玩家”,S02是“团队成员”,S03是“朋友”。此外,在类型ID=G04的情况下,位置ID=S01是说明菜肴的“主持人”,S02是进行品尝等的“客人”,而S03是“观众”。
当用户U1通过使用位置选择画面G30选择虚拟评论员的位置时(步骤S107),用户终端10通过使用类型ID来参考图5E所示的评论对象管理表,以获取作为评论的对象的评论对象的列表,通过使用所获取的评论对象的列表来生成图2D所示的评论对象选择画面G40并且为用户U1显示评论对象选择画面G40(步骤S108)。例如,在类型ID=G03的情况下,对象ID=T01是“玩家”,T02是“团队成员”,T03是“朋友”。
这样,用户终端10设置虚拟评论员的位置和虚拟评论员发出的评论的评论对象,并将设置内容通知给事件提取单元30。在步骤S103、S105和S107中,例示了用户U1选择每个项的情况,但本公开不限于此。例如,用户终端10可以被配置为基于服务定义、用户偏好等自动选择每个项。
1.5.2事件提取操作的示例
如上所述,当虚拟评论员的设置完成时,接下来,事件提取单元30执行从由用户U1选择的动态图像内容中提取事件的操作。图6A是示出由事件提取单元30执行的事件提取操作的示例的流程图。此外,图6B和6C是示出由事件提取单元30管理的管理表的示例的图,图6B示出了用于管理在每个视频类型的事件提取时使用的识别模型的模型管理表的示例,以及图6C示出了用于管理从每个识别模型的动态图像内容中提取的事件的事件管理表的示例。此外,图6D是示出由识别模型从动态图像内容以时间序列提取的事件数据的列表的示例的图。
如图6A所示,当从用户终端10获取在图5A的步骤S104中指定的视频类型(类型ID)时,事件提取单元30通过使用类型ID参考图6B中所示的模型管理表来指定用于识别与每个视频类型相关联的识别模型的识别模型ID,并且通过使用指定的识别模型ID来获取用于提取事件所使用的识别模型(步骤S111)。例如,可以基于规则或通过机器学习预先构建每个类型的识别模型,并将其保留在事件提取单元30中。例如,在类型ID=G03的情况下,事件提取单元30选择模型ID=M03的识别模型。通常可用于每个视频类型的识别模型可以是覆盖整个视频类型的识别模型,或者可以是覆盖比视频类型的分类更具体地分类的范围的识别模型。例如,对于“体育1”的视频类型,可以准备专门用于更具体分类的识别模型,例如“用于棒球”、“用于橄榄球”和“用于足球”。
接下来,事件提取单元30通过将动态图像内容输入到所获取的识别模型来从动态图像内容中提取事件(步骤S112)。更具体地,事件提取单元30通过分析视频的特征、由识别模型识别的人或球的运动、从图像数据中提取的特征点(诸如画面中的数据指示符(分数等))、从声音数据识别的关键字等来提取事件。根据本实施方式的事件可以针对诸如“棒球”或“足球”的每个小类型或针对每个特定游戏名称来定义,而不是针对诸如“体育”的大类型来定义。例如,在足球游戏的情况下,事件ID=E001是“进球”,事件ID=E002是“射门”,即,代表性技术、得分、文件等可以被定义为事件。此外,所提取的事件可以包括指示所提取的事件是自己队的事件还是对手队的事件的参数。此外,可以获取诸如已经引起每个事件的玩家的姓名和队服号码、球位置以及总分的信息作为事件的一部分。
当如上所述提取事件时,事件提取单元30生成事件数据以及指示事件在动态图像内容中发生的时间的时间码,并将生成的事件数据添加到图6D所示的事件数据列表(步骤S113)。
然后,事件提取单元30重复执行如上所述的事件提取操作直到动态图像内容结束(步骤S114中的否)。
1.5.3评论生成操作的示例
如上所述,当基于动态图像内容创建事件数据列表时,接下来,评论生成单元40基于由用户U1选择的虚拟评论员、虚拟评论员的位置和评论对象来执行针对每个事件生成评论(文本数据)的操作。图7A是示出由评论生成单元40执行的评论生成操作的示例的流程图。此外,图7B是示出由评论生成单元40管理的管理表的示例的示图,并且示出虚拟评论员的各位置相对于各事件的评论的列表(位置评论列表)的示例,以及用于管理过去使用过的评论历史针对各位置相对于各事件的所使用的评论历史的示例。此外,图7C是示出由评论生成单元40生成的每个事件的评论列表(对象评论列表)的示例的示图。
如图7A所示,当从事件提取单元30获取在图6A的步骤S113中创建的事件数据列表时,评论生成单元40按时间顺序从事件数据列表获取事件数据(步骤S121)。例如,可以基于时间码执行按时间顺序的事件数据的获取。
在此,在事件连续发生的情况下,可能难以向所有事件添加评论。在这种情况下,如在步骤S122中,评论生成单元40可以对事件数据列表执行过滤。例如,评论生成单元40可以基于事件数据列表的时间码获得事件之间的时间间隔,并且对于在预定时间间隔(例如,15秒)内发生的事件(步骤S122中为否),评论生成单元40返回到步骤S121而不生成评论,并且获取下一个时间码的事件。此时,可以将优先级(例如,进球优先于犯规)分发给事件,并且可以优选排除具有低优先级的事件。然而,本公开不限于此,并且可以采用这样的配置,其中事件被分发到多个虚拟评论员而不进行过滤,并且各个虚拟评论员对所分发的事件发出评论。
接下来,评论生成单元40基于在步骤S121中获取的事件数据中的事件ID和为虚拟评论员设置的位置,通过参考图7B所示的位置评论列表,获取与每个事件的虚拟评论员的位置相对应的评论列表(步骤S123)。例如,在事件ID=E001(进球(对手队))的情况下,如图7B所示的位置评论列表,列出了当进球得分时在该位置处的人可以想到的评论的一个或多个变体。位置评论列表可以基于规则来创建,或者可以使用机器学习等来创建。此外,每个评论可以被设计为通用于事件。例如,每个评论可以附加有清楚地指示内容的标签,诸如如果评论为“沮丧的”则为“失望”标签,如果评论为“你可以扭转局面”则为“鼓励”标签。例如,当向评论添加变体时,可以使用标签,并且可以将多个标签附加到一个评论。在图7B中,根据事件要替换的文本被“<>”包围。例如,可以通过在<事件>中插入事件名称来重新使用评论W1001,所述<事件>如“由于对手队进球而沮丧”或“由于对手队射门而沮丧”。
此外,评论生成单元40通过参考在步骤S123中获取的评论列表的使用过的评论历史来提取过去针对同一用户U1使用的n次(n是1或更大的整数)的评论(步骤S124)。过去用于同一用户U1的评论可以是用于与当前正处理的动态图像内容不同的动态图像内容的评论和用于同一动态图像内容的评论中的任一个或两者。
接下来,评论生成单元40从在步骤S123中获取的评论列表中选择通过排除在步骤S124中获取的n次评论而获得的评论之一(在下文中,对应于该位置的评论被称为位置评论)(步骤S125)。例如,在步骤S125中,可以使用伪随机数等随机地选择位置评论,或者可以根据从中排除n次过去评论的评论列表的顺序来选择位置评论。这样,通过基于过去使用的评论的历史以不重叠或不频繁使用的方式控制相同的评论,可以抑制用户U1或观看者对虚拟评论员的评论感到厌烦。在步骤S124中,事件和评论中的每一个可以被矢量化并从最接近的候选中选择。
接下来,评论生成单元40通过执行形态分析等来分析在步骤S125中选择的位置评论(步骤S126)。随后,评论生成单元40省略包括在位置评论中的事件名称(步骤S127)。这是因为,在假设观看者从视频中识别事件的发生的情况下,可以通过省略事件名称来做出具有更好节奏的评论。然而,在虚拟评论员是诸如需要正确讲话的播音员的角色的情况下,可以跳过事件名称的省略(步骤S127)。
接下来,评论生成单元40将感叹词添加到位置评论(步骤S128)。例如,表示期望的感叹词,诸如“它来了!”被添加到本队的射门场景,并且指示失望的感叹词,诸如“哦...”添加到对手队的进球场景中,从而可以激发对评论对象的同情。
接下来,评论生成单元40从动态图像内容或用户信息保持单元20获取诸如选手名、队名或昵称、代词等的专有名词,并将所获取的专有名词或代词添加到位置评论(步骤S129)。这使得能够给出与评论对象接近的感觉。
接下来,评论生成单元40将位置评论的结尾转换为适合于对对象的称呼的结束(步骤S130)。例如,将“位置评论”的“尽管<事件>,但我将为你加油”转换成“让我们为乔治加油!”。结果,可以对评论对象人进行更自然的称呼。在用户之间的关系的表达(例如,“请”的存在或不存在)出现在诸如英语的句子的结尾之外的位置的语言的情况下,可以执行步骤S130的处理作为对结尾之外的部分的转换。
如上所述,在步骤S127至S130中,评论生成单元40基于关于用户U1与其他用户(观看者等)之间的关系的信息来校正所生成的位置评论。
接下来,评论生成单元40将事件ID、参数和时间码添加到位置评论,并将结果位置评论登记在图7C(步骤S131)所示的对象评论列表中。所添加的时间码可以是包括在相应事件数据中的时间码。
然后,评论生成单元40重复执行该操作(步骤S132中的“否”),直到完成对所有事件数据的评论的生成(步骤S132中的“是”)。
在该示例中,在基于整个动态图像内容创建事件数据列表之后为每个事件生成位置评论,但是本公开不限于此,并且例如,可以在每次从动态图像内容中提取事件时生成位置评论。
1.5.3.1结尾转换的修改示例
在此,将描述在图7A的步骤S130中描述的结尾转换的修改示例。在步骤S130的结尾转换中,例如,基于用户U1(玩家)与社区中的观看者之间的关系、层级关系等来转换位置评论的结尾,使得评论对象可以感觉更熟悉,或者措辞可以适应于用户U1(玩家)与观看者之间的关系,在存在多个虚拟评论员的情况下虚拟评论员之间的关系等。图8A是示出根据本修改的结尾转换操作的示例的流程图。图8B是示出由评论生成单元40管理的管理表的示例的图,并且示出用于管理虚拟评论员的位置之间的层级关系的层级关系管理表的示例。在此,描述了其中用户之间的关系的表达出现在句子末尾的语言的结尾转换。然而,在用户之间的关系的表达(例如,“请”的存在或不存在)出现在诸如英语的句子的结尾之外的位置的语言的情况下,可以执行步骤S130的处理作为对结尾之外的部分的转换。
如图8A所示,评论生成单元40首先从用户U1所使用的服务的特性和用户信息中检查所选择的位置和评论对象的属性,并且确定所选择的位置和评论对象的属性是否相同(步骤S1301)。相同的属性表示这样的情况,其中服务具有受限的观看者年龄(仅女性高中生等)、职业是受限的,仅例如医生或教师,或者社区例如用户信息所指示的特定游戏。在所选择的位置和评论对象具有相同属性的情况下(步骤S1301中为是),评论生成单元40前进到步骤S1302。另一方面,在所选择的位置和评论对象具有不同属性的情况下(步骤S1301中为否),评论生成单元40前进到步骤S1304。
在步骤S1302中,评论生成单元40获取对应于在步骤S1301中指定的属性的词典。这是因为,在所选择的位置和评论对象具有相同属性的情况下,希望使用对应于该属性的词典,因为希望使用在社区中频繁使用的流行单词、评论中的技术术语等。该词典可以是流行语、时髦词汇、技术术语等,或从社区社交网络服务(SNS)等收集的语料库。此外,词典可以由评论生成单元40预先保存,或者可以通过在诸如因特网的网络上实时搜索信息而用作词典。
接下来,如果存在对应于社区语言的单词,则评论生成单元40用对应于社区语言的单词替换位置评论中的单词(步骤S1303)。
接下来,评论生成单元40通过参考图8B所示的层级关系管理表来检查所选位置和评论对象之间的层级关系(步骤S1304)。在层级关系管理表中,层级关系被定义为位置设置参数。例如,在视频类型属于“喜好”的烹调动态图像内容中,层级关系中的展示者的级别是“2(中间)”,客人的级别是最高级别的“1”,观众的级别是与展示者相同的“2”。
在虚拟评论员的位置的级别高于评论对象的位置级别(步骤S1304中的“位置>对象”)的情况下,评论生成单元40将位置评论的结尾转换为命令音的结尾(步骤S1305),在位置和评论对象的级别彼此相同的情况下(步骤S1304中的“位置=对象”),评论生成单元40将位置评论的结尾转换为熟悉音调的结束,将位置评论的结尾转换为熟悉单词的结束(步骤S1306),并且在位置的级别低于评论对象的级别的情况下(步骤S1304中的“位置<对象”),评论生成单元40将位置评论的结尾转换为礼貌词(步骤S1307)。此后,评论生成单元40返回到图7A所示的操作。
1.5.4用于所评论的动态图像内容的生成操作和分发操作的示例
接下来,将描述通过使用如上所述生成的位置评论来生成评论的动态图像内容的操作和分发所生成的评论的动态图像内容的操作的示例。图9A是示出所评论的动态图像内容的生成操作和分发操作的示例的流程图。评论数据和化身动画可以作为与动态图像内容不同的数据分发到用户U1和观看者。在这种情况下,例如,可以省略步骤S160。
如图9A所示,当从评论生成单元40获取在图7A的步骤S131中创建的对象评论列表时(步骤S141),发言控制单元50通过对对象评论列表中的每个位置评论的文本数据执行使用TTS的语音合成处理来将位置评论转换成声音数据(也称为评论语音)(步骤S142),并存储所生成的每个位置评论的评论语音(步骤S143)。
此外,化身生成单元60执行生成虚拟评论员的化身动画的化身生成处理(步骤S150)。
接下来,编辑/渲染单元70执行基于动态图像内容、评论语音和化身动画生成所评论的动态图像内容的编辑/渲染处理(步骤S160)。
以这种方式产生的评论动态图像内容经由预定网络90从分发单元80分发到用户U1和观看者(步骤S171),然后该操作结束。
1.5.4.1化身生成处理的示例
在此,将更详细地描述在图9A的步骤S150中描述的化身生成处理。图9B是示出化身生成处理的操作流程的示例的流程图。
如图9B所示,化身生成单元60从用户U1在图5A的步骤S105中选择的虚拟评论员的角色中选择相应的化身(步骤S1501)。此外,化身生成单元60获取由发言控制单元50生成的评论语音(步骤S1502)。
然后,化身生成单元60根据评论语音的发言部分创建移动在步骤S1501中选择的化身的动画(步骤S1503),并返回到图9A所示的操作。在步骤S1503中,可以通过学习如何根据发言张嘴来生成逼真的化身动画。
1.5.4.2编辑/渲染处理的示例
此外,将更详细地描述在图9A的步骤S160中描述的编辑/渲染处理。图9C是示出编辑/渲染处理的操作流程的示例的流程图。
如图9C所示,编辑/渲染单元70首先获取在图5A的步骤S103中由用户U1选择的动态图像内容,在图9A的步骤S143中存储的评论语音,以及在图9A的步骤S150中创建的虚拟化身动画(步骤S1601)。
接下来,编辑/渲染单元70根据时间码在动态图像内容上布置评论语音和化身动画(步骤S1602),并且通过渲染在其上布置评论语音和化身动画的动态图像内容来生成所评论的动态图像内容(步骤S1603)。位置评论的文本数据可被布置为动态图像内容中的字幕。
以这种方式生成的评论动态图像内容可以经由分发单元80提前分发到用户U1,以便在分发到观看者之前由用户U1(玩家)确认(步骤S164)。因此,当经由通信单元(未示出)等获得用户U1的确认(分发批准)时(步骤S165),该操作返回到图9A所示的操作。
1.6动态改变位置/评论对象的示例
在图5A中的步骤S107中选择的位置和在步骤S109中选择的评论对象可以在动态图像内容中改变。图10A是用于描述在动态图像内容中改变评论对象的情况的示例的示图。图10A示出了虚拟评论员的位置和/或评论对象基于足球游戏中随着时间流逝本队的控球率的变化而动态改变的情况。此外,图10B是示出图10A中由虚拟评论员每次发出的评论的示例的示图。
在图10A中,(a)示出了本队的控球率的图,(b)示出了虚拟评论员的位置的转变,以及(c)示出了评论对象的转变。可以通过例如动态图像内容的图像分析、游戏的开放API等来获取控球率。选择“朋友”作为虚拟评论员的初始位置,也选择“朋友”作为初始评论对象。
在时间T1,本队已经得分并且球队的控球率也高,使得评论对象保持为“朋友”。因此,如图10B所示,在时间T1,虚拟评论员对一个朋友评论“耶!你今天状态不错啊!”。
在时间T2,控球率低于预设阈值(例如,50%)。评论生成单元40的位置/对象控制单元41在控球率低于阈值的时间(时间T2)时,对朋友给出评论“哦,不,情况不是越来越糟了吗?我会去给他们一些鼓励”之后,将评论对象从“朋友”切换为“团队成员”。因此,评论生成单元40操作以在评论对象是“团队成员”的时段期间向团队成员给出评论。
当在T3时刻丢球时,虚拟评论员会给团队成员一个鼓励的评论:“A队(队名),别担心!你的动作一点也不差”。
此后,当在时间T5控球率超过阈值时,位置/对象控制单元41将评论对象从“团队成员”切换到“朋友”。因此,在时间T5之后评论生成单元40操作以生成要给予朋友的评论。
1.6.1操作流程的示例
图11A是示出在位置/评论对象动态改变的情况下由评论生成单元40执行的评论生成操作的示例的流程图。图11A示出了在图7A所示的操作中结合了动态改变位置/评论对象的步骤的情况下的操作示例。此外,在该示例中,假设由事件提取单元30提取的事件包括控球率超过阈值以及低于阈值。
如图11A所示,在位置/评论对象被动态改变的情况下,当在图7A所示的操作中以预定顺序从事件数据列表获取事件数据时(步骤S121),评论生成单元40的位置/对象控制单元41执行调整虚拟评论员的位置和/或评论对象的处理(步骤S220)。
图11B是示出图11A的步骤S220中所示的位置/对象调整操作的更详细操作流程的流程图。如图11B所示,在图11A的步骤S220中,位置/对象控制单元41首先设定控球率的阈值(步骤S2201)。接下来,位置/对象控制单元41基于例如在步骤S121中获取的事件数据中的事件ID和参数来获取本队的控球率(步骤S2202)。
接下来,在步骤S2202中获取的本队的控球率低于步骤S2201中设置的阈值(步骤S2203中的“低”)的情况下,位置/对象控制单元41将评论对象切换到“团队成员”并返回到图11A所示的操作。另一方面,在本队的控球率超过阈值(步骤S2203中的“高”)的情况下,位置/对象控制单元41将评论对象切换为“朋友”并返回到图11A所示的操作。此后,评论生成单元40执行与图7A的步骤S122之后的操作相同的操作。
在附图10A至11B中,例示了主要改变评论对象的情况,但是类似地,可以改变虚拟评论员的位置或者改变位置和评论对象两者。例如,在活动学习工作室视频中,具有最低活跃度的团队的团队成员的位置可以基于每个团队的活跃度(例如会话量)被设置为虚拟评论员的位置,并且可以使虚拟评论员对团队成员进行评论以便活跃团队。这种位置和/或评论对象的改变不仅对存档内容有效,而且对实时在线课堂等也有效。
1.7基于情感值生成评论的示例
例如,除了事件和位置之外,根据本实施方式的评论生成单元40还可以基于情感值来改变要生成的评论。图12A是用于描述基于情感值生成评论的情况的示例的示图。图12B是示出针对每个事件的每个位置的情感值的变化量的表,并且图12C是用于描述图12A中所示的与该事件相关联的情感值变化的图。
作为情感的分类,存在诸如拉塞尔模型和普鲁士模型的各种模型,但是在本实施方式中,应用简单的正/负情感。在本实施方式中,情感值被映射到0和1的数值,1被定义为最积极的情感而0被定义为最消极的情感。
如图12B所示,例如,在位置是“玩家”的情况下,情感值由于本队的进球而增加0.15(变为正),并且由于对手队的进球而减少0.15(变为负)。此外,在位置是“朋友”的情况下,情感值由于本队的进球而增加0.1,但是当由于游戏变得有趣对手团队进球得分时,情感值也增加0.05。此外,在任一团队的进球持续三次或更多次的情况下,游戏变得单调且不有趣。因此,在位置是“朋友”的情况下,情感值减小0.1。
图12B所示的情感值的变化量可以基于规则根据一般情感来定义,或者可以是通过感测用户U1等获取的值。
图12A和12C示出了一个示例,其中本队在时间T2处犯规,对手队在时间T3和T4处进球得分,对手队在时间T4处犯规,并且本队在时间T6到T9处进球得分。在作为开始时间点的时间T0,“玩家”和“朋友”的初始情感值被设置为0.5。
如图12A和12C所示,可以看出,作为由于本队或对手队的进球或犯规而改变每个位置的情感值的结果,出现情感值匹配的时刻和情感值出现差异的时刻。
1.7.1操作流程的示例
图13示出了在虚拟评论员的位置是“朋友”并且评论对象是“玩家”的情况下的评论生成的操作流程。在图13中,与图7A中的操作相同的操作由相同的附图标记表示,并且将省略其详细描述。
如图13所示,在基于情感值生成评论的情况下,当在图7A所示的操作中以预定顺序从事件数据列表获取事件数据时(步骤S121),评论生成单元40获取作为包括在事件数据中的评论对象的“玩家”的情感值a(步骤S301),并且还获取作为虚拟评论员的位置的“朋友”的情感值b(步骤S302)。
接下来,评论生成单元40确定评论对象的情感值a是否小于负状态的阈值(例如,被定义为0.3)(步骤S303),并且在情感值a小于阈值的情况下(步骤S303中为是),评论生成单元40将“鼓励”设置为用于图7B所示的位置评论列表的搜索标签(步骤S305),并进行到步骤S122。
此外,在评论对象的情感值a等于或大于负状态的阈值的情况下(步骤S303中的否),评论生成单元40确定评论对象和虚拟评论员的情感值之间的差的绝对值(|a-b|)是否大于阈值(例如,被定义为0.3)(步骤S304)。在情感值之间的差的绝对值大于阈值的情况下(步骤S304中的是),评论生成单元40将“同情”和“讽刺”设置为搜索标签(步骤S306),并前进到步骤S122。
另一方面,在情感值之间的差的绝对值等于或小于阈值的情况下(步骤S304中的否),评论生成单元40将“同情”设置为搜索标签(步骤S307),并前进到步骤S122。
接下来,在执行步骤S122至S124之后,评论生成单元40在通过从在步骤S123中获取的评论列表中排除在步骤S124中获取的n次评论而获得的位置评论中选择附加有在步骤S305、S306或S307中设置的搜索标签的位置评论之一(步骤S325)。在步骤S325中,类似于步骤S125,例如,可以使用伪随机数等随机地选择位置评论,或者可以根据从中排除n次过去评论的评论列表的顺序来选择位置评论。
此后,评论生成单元40通过执行与图7A所示的步骤S126至S132相同的操作来创建对象评论列表。
这样,通过基于情感值限制位置评论的选择范围,换言之,通过使用基于情感值设置的搜索标签缩小位置评论的候选,可以产生更好地反映玩家、朋友等的情感的评论。例如,通过将“鼓励”设置为搜索标签,可以产生鼓励由于负状态而失望的玩家的评论,如“别担心,这只是开始。你可以扭转局面!”。此外,通过将“同情”设置为搜索标签,有可能产生同情失望的玩家的评论,如“这很困难,我知道你的感受!”。此外,通过将“同情”和“嘲讽”设置为搜索标签,还可以生成表示复杂心理状态的评论。例如,从一个因为单调的比赛而感到无聊的朋友的角度来看,可以对一个有把握连续进球的玩家表达讽刺,比如“很棒。或许是因为电脑规格的不同吗?”,尽管评论是赞扬,但评论也意味着这可能是因为机器的不同。这样,可以通过基于情感之间的关系生成评论来生成更多的人类评论。
图12B中所示的事件的情感值的定义可以改变。例如,即使当用简单的技术进行评分时,初学者也可能有快乐的倾向,但是只有当用困难的技术进行评分时,技术人员才会快乐。因此,可以从诸如用户的使用时间和游戏中奖杯的数目的信息中获取技能熟练程度,并且可以创建情感估计模型,其中用于简单技术的情感值(上升率)逐渐减小,而用于复杂技术的情感值逐渐增大。
1.8观看(下载)时添加评论的系统配置示例
接下来,下面将描述在观看(下载)动态图像内容(见图3B)时添加评论的情况。
在观看(下载)动态图像内容时添加评论的情况下,与在投稿(上传)动态图像内容时添加评论的情况相比,可以生成更好地反映观看者的品味和状况的评论。观看者要观看的动态图像内容的选择可以例如通过观看者在终端上启动应用程序并使用由应用程序显示的动态图像属性选择画面G10(参见图2A)来执行。类似于在投稿(上传)动态图像内容时添加评论的情况,观看者可以选择虚拟评论员的角色、位置和评论对象(参见2B至2D)。然而,在说明书中,将举例说明从关于观看者和动态图像投稿者(说明书中的用户U1)的信息中识别亲密程度,并且自动设置虚拟评论员的角色、位置和评论对象的情况。
图14是示出在观看(下载)动态图像内容时添加评论的情况下的系统配置示例的框图。在描述中,如图4所示例示了将语音评论添加到动态图像内容的情况。
如图14所示,在信息处理系统1的系统配置示例中,在观看(下载)动态图像内容时添加评论的情况下,添加设置单元120,省略分发单元80,并且用户终端10被替换为观看者A10的用户终端110,其配置类似于参考图4描述的在投稿(上传)动态图像内容时添加评论的情况下的系统配置示例。
类似于用户终端10,用户终端110例如是在观看者A10侧的信息处理设备,诸如智能电话、个人计算机或游戏控制台,以及用于再现动态图像内容、自动添加评论等的应用。此外,用户终端110包括通信单元(未示出),并且经由通信单元获取由用户信息保持单元20保持的用户信息和要添加评论的动态图像内容。
当接收到从用户终端110发送的要添加评论的动态图像内容的选择时,设置单元120基于从用户信息保持单元20获取的用户U1和观看者A10的用户信息以及所选动态图像内容的视频信息来设置虚拟评论员的位置和评论对象。换言之,在该示例中,设置单元120可用作获取关于作为动态图像内容的投稿者的用户U1与动态图像内容的观看者之间的关系的信息的获取单元。此外,设置单元120设置虚拟评论员的位置和虚拟评论员发出的评论的评论对象,并将设置内容通知给事件提取单元30。如图2B至2D所示,在观看者A10手动设置虚拟评论员的角色、位置和评论对象的情况下,可以省略设置单元120。
其他配置可以类似于图4所示的信息处理系统1的系统配置示例,因此,在此将省略其详细描述。
1.9在观看(下载)时添加评论的情况下的操作流程的示例
在观看(下载)时添加评论的情况下的操作流程可以基本上类似于以上参考图5A至9C描述的在投稿(上传)动态图像内容时添加评论的情况下的操作流程。然而,在观看(下载)时添加评论的情况下,图9C的步骤S164和S165被省略,并且图9A的步骤S171被替换为评论的动态图像内容的再现。
此外,在说明书中,如上所述,例示了从关于观看者A10和动态图像投稿者(说明书中的用户U1)的信息中识别亲密程度,并且自动设置虚拟评论员的角色、位置和评论对象的情况。因此,图5A中所示的操作被图15A中所示出的操作所代替。此外,图15B是示出在经由应用提供自动评论添加服务的提供者侧管理的管理表的示例的示图,并且示出用于管理虚拟评论员的角色的角色管理表的示例。在描述中,类似于以上描述,假定提供动态图像分发服务的提供者和提供自动评论添加服务的提供者是相同的。
如图15A所示,当用户(观看者)A10启动用户终端110上的应用时,用户终端110(以下简称为用户终端110)的应用从用户信息保持单元20获取关于观看者A10的用户信息(步骤S401)。类似于用户U1的用户信息,除了关于观看者A10自己的信息,关于与观看者A10相关的其他用户(包括用户U1)的信息以及关于观看者A10与其他用户之间的关系的信息之外,用户信息可以包括历史信息,诸如观看者A10的观看历史以及关于观看者A10偏爱的视频类型或游戏类型等的信息。
当获取到用户信息时,用户终端110基于所获取的用户信息获取观看者A10可以观看的动态图像内容的列表(视频列表),通过使用所获取的视频列表创建图2A所示的动态图像内容选择画面G10,并为观看者A10显示动态图像元素选择画面G10(步骤S402)。在动态图像内容选择画面G10上的视频列表中,可以基于包括在用户信息中的历史信息来优先显示倾向于接收实质性评论的类型的视频。在评论添加功能被实现为能够处理动态图像内容的游戏应用、动态图像再现应用、动态图像分发应用或社交网络服务(SNS)应用的一个功能的情况下,可以通过显示用于询问用户是否将评论添加到正被再现或显示的动态图像内容的指示符而不是动态图像内容选择画面G10来选择要添加文本的动态图像内容。
当观看者A10基于显示在用户终端110上的动态图像内容选择画面G10选择要添加评论的动态图像内容时(步骤S403),用户终端110将所选择的动态图像内容通知给设置单元120。设置单元120从给予从用户终端110发送的动态图像内容的元信息(视频信息)中获取所选动态图像内容的类型(视频类型),并通过使用所获取的视频类型参考图5B所示的动态图像内容管理表来获取所选动态图像内容的类型ID。随后,设置单元120从在步骤S401中获取的用户信息中获取观看者A10的历史信息,并且将所获取的历史信息与在图15B所示的角色管理表中管理的虚拟评论员的角色信息相匹配,从而自动选择与观看者A10的偏好和动态图像内容相匹配的虚拟评论员(步骤S404)。例如,如果观看者A10喜欢动画,则设置单元120选择具有角色ID=C11的动画角色(角色Y)。
接下来,设置单元120获取已经将在步骤S403中选择的动态图像内容上载到云100的用户U1的用户信息(参见图3B)(步骤S405)。
接下来,设置单元120从用户U1的用户信息所包含的用户U1的名称、服务ID等取得与观看者A10的亲密程度(步骤S406)。例如,可以基于诸如用户U1是否一起玩了在线游戏、用户U1是否被注册为朋友、观看者A10过去是否观看了由用户U1投稿的动态图像内容,以及观看者A10和用户U1是否在SNS上进行了会话等信息来设置亲密度。例如,在用户U1被设置为一起玩在线游戏的朋友的情况下,或者在用户U11和观看者A10在一个月内已经在SNS上进行了会话的情况中,亲密度可以被设置为最高级别的3,并且在不存在直接会话但是观看者A10在过去已经观看了由投稿者(用户U1)上传的动态图像内容三次或更多次的情况下,亲密度可以被设置为2,这是第二高级别,并且在其他情况下,亲密度可以被设置为1,这是最低级别。
设置单元120基于在步骤S406中获取的亲密度来设置基于规则等定义的位置和评论对象。具体地,在观看者和投稿者之间的亲密程度是等级3的情况下(步骤S406中的“3”),设置单元120确定观看者和投稿者彼此熟悉,将虚拟评论员的位置设置为团队成员,并将评论对象设置为投稿者(玩家=用户U1)(步骤S407)。此外,在观看者和投稿者之间的亲密程度是等级2的情况下(步骤S406中的“2”),设置单元120确定观看者和投稿者不如团队成员熟悉,将虚拟评论员的位置设置为朋友,并将评论对象设置为投稿者(玩家=用户U1)(步骤S408)。另一方面,在观看者和投稿人之间的亲密程度是等级1的情况下(步骤S406中的“1”),设置单元120将虚拟评论员的位置设置为朋友,并将评论对象设置为朋友(步骤S408),从而选择观察者的风格。
可以从观看者A10的观看历史获得动态图像内容的识别程度,并且在动态图像内容是第一次观看的动态图像内容的情况下,可以优先提供初学者的说明、基本规则等作为评论,并且当观看者习惯于动态图像内容时可以包括更高级的内容。此外,可以根据感测到的观看者A10情感唤醒水平来改变评论。例如,在观看者A10放松的情况下,可以产生具有平静内容和音调的评论或评论语音,而在观看者A10兴奋的情况下,可以产生具有更加强内容和音调的评论或评论语音。此外,可以学习观看者A10的感觉情感的舒适程度和不舒适程度,并且该结果可以用于生成评论或评论语音。
如上所述,可以根据每个观看的情况生成评论。例如,在第一次观看本队遭遇惨败的游戏视频时,位置为“玩家”的虚拟评论员会针对评论对象“朋友”生成的评论“太令人沮丧了,我会多练习!”,但在半年后的第二次观看中,会从玩家的活动信息中检测到随后获胜的次数、获得的奖杯数目并且检测到进步,并且可以生成包括诸如“我把现在的自己归功于挫折之后的强化练习”之类的评价的评论。
1.10生成用于实时动态图像分发的两个虚拟评论员的会话评论的示例
接下来,将描述生成用于实时动态图像分发(在下文中,也称为实况分发)的两个虚拟评论员的会话评论的示例。在说明书中,假设两个虚拟评论员之间的会话方式是,例如,评论员首先响应于事件的发生而评论“发生了什么事件”,然后讲解者说明该事件。
图16A是示出在生成两个虚拟评论员的会话评论以用于实时动态图像分发的情况下的系统配置示例的框图。如图16A所示,在生成用于实时动态图像分发的两个虚拟评论员的会话评论的情况下的信息处理系统1的系统配置示例包括,例如,将图14所示的系统配置实例中的设置单元120添加到图4所例示的系统配置示例中的配置。
接下来,将描述在生成用于实时动态图像分发的两个虚拟评论员的会话评论的情况下的操作示例。图16B是示出在生成两个虚拟评论员的会话评论用于实时动态图像分发的情况下的操作示例的流程图。
如图16B所示,在该操作中,当用户U1启动用户终端10上的应用以开始准备实况视频分发时,将实况分发请求通知给设置单元120。接收到该请求的设置单元120首先从用户信息保持单元20取得与用户U1有关的用户信息(步骤S501)。
同时,在用户终端10上显示用于选择要实况分发的视频类型的画面。当用户U1基于该选择画面选择视频类型时(步骤S502),从用户终端10向设置单元120通知所选择的视频类型。选择画面可以具有各种模式,例如图标模式和菜单模式。
接下来,设置单元120基于例如从用户终端10发送的视频类型、从用户信息保持单元20获取的用户U1的用户信息等自动选择两个虚拟评论员的角色和位置(步骤S503)。在该示例中,由于假设图5B中的“体育1”被选择为视频类型,因此设置单元120自动选择两个虚拟评论员,这两个虚拟评论员的位置是“评论员”和“讲解者”。
此外,设置单元120类似地基于视频类型、用户信息等自动选择评论对象(步骤S504)。在假定“体育1”作为视频类型的这个示例中,例如,“观看者”被自主地设置为评论对象。
接下来,与图6A的步骤S111中一样,事件提取单元30基于动态图像内容的视频类型获取识别模型(步骤S505)。
当以此方式完成实况分发的准备时,接下来,用户U1通过操作用户终端10或与其连接的成像设备来开始动态图像内容的实况分发(步骤S506)。当开始实况分发时,从用户终端10顺序地输出所捕获或拍摄的视频数据(以下称为动态图像内容)。此时,可以通过流方法发送动态图像内容。
从用户终端10发送的动态图像内容被直接或经由设置单元120输入到事件提取单元30。与图6A中的步骤S112类似,事件提取单元30通过将动态图像内容输入到在步骤S505中获取的识别模型来从动态图像内容中提取事件(步骤S507)。以此方式生成的事件数据被顺序地输入到评论生成单元40。
同时,评论生成单元40周期性地确认事件数据是否已被输入(步骤S508)。在没有输入事件数据的情况下(步骤S508中为否),该操作进行到步骤S540。另一方面,在输入了事件数据的情况下(步骤S508中为是),评论生成单元40判定从输入了前一次的事件数据的时刻起是否经过了预定时间(例如30秒)以上(步骤S509)。在经过了预定时间以上的情况下(步骤S509中为是),评论生成单元40进入步骤S520。在图7A的步骤S122等中,最小事件间隔的示例是15秒,但是在该示例中,由于这是在两个虚拟评论员之间的会话,所以事件间隔是30秒,其如图16C所示更长。
另一方面,在预定时间过去之前已经输入了下一个事件数据的情况下(步骤S509中为否),评论生成单元40确定该事件数据是否是具有高优先级的事件的事件数据(步骤S510),并且在该事件数据是具有高优先级的事件的情况下(步骤S510中为是),为了中断先前事件的发言,评论生成单元40向编辑/渲染单元70通知中断或停止当前正在执行的发言或将由虚拟评论员之一执行的发言的请求(发言中断/停止请求)(步骤S511),并且前进到步骤S520。此外,在事件数据不是具有高优先级的事件的事件数据的情况下(步骤S510中的否),评论生成单元40丢弃输入的事件数据,并且该操作进行到步骤S540。例如,在动态图像内容是足球游戏视频的情况下,诸如“传球”的事件的优先级低,但是诸如“进球”的事件的优先级高。例如,每个事件的优先级可以在图6C所示的事件管理表中的参数中设置。
在步骤S520中,评论生成单元40基于输入事件数据生成将由虚拟评论员之一说出的位置评论。
在步骤S530中,发言控制单元50将由评论生成单元40生成的位置评论的文本数据转换为声音数据。
在步骤S540中,化身生成单元60根据发言控制单元50生成的声音数据生成虚拟评论员的化身在其中移动的化身动画。化身生成处理的操作示例可以类似于上面参考图9B描述的操作示例。
在步骤S550,编辑/渲染单元70从选择的动态图像内容、声音数据和化身动画生成评论的动态图像内容。
当以这种方式生成所评论的动态图像内容时,所生成的评论的动态图像内容经由预定网络90从分发单元80实况分发(步骤S512)。
此后,例如,云100中的控制单元(未示出)确定是否结束分发(步骤S513),并且在控制单元确定不结束分发的情况下(步骤S513中为否),操作返回到步骤S507。另一方面,在控制单元确定结束分发的情况下(步骤S513中为是),该操作结束。
1.10.1评论生成处理的示例
在此,将更详细地描述在图16B的步骤S520中描述的评论生成处理。图16D是示出评论生成处理的操作流程的示例的流程图。
如图16D所示,评论生成单元40首先针对从事件提取单元30顺序输入的评论数据,从图7B所示的位置评论列表中获取针对“评论员”的位置的评论列表(步骤S5201)。
接下来,评论生成单元40参考在步骤S5201中获取的评论列表的使用过的评论历史,并且从在步骤S5201中获取的评论列表中选择通过排除n次过去评论而获得的位置评论之一(步骤S5202)。在步骤S5202中,类似于图7A或图11A的步骤S125,例如,可以使用伪随机数等来随机选择位置评论,或者可以根据排除了n次的过去评论的评论列表的顺序来选择位置评论。可替换地,可以选择通过排除在当前实况分发期间使用的位置评论而获得的评论列表中的一个评论。
类似地,评论生成单元40首先获取“评论员”相对于从事件提取单元30顺序输入的评论数据的位置的评论列表(步骤S5203),并且基于用于所获取的评论列表的评论历史来选择通过排除n次过去评论而获得的位置评论之一(步骤S5204)。
接下来,如在图7A的步骤S126至S131中一样,评论生成单元40通过形态分析等分析在步骤S5202和S5204中选择的位置评论(步骤S5206),省略位置评论中包括的事件名称(步骤S5207),向位置评论添加感叹词(步骤S5208),向位置评论添加专有名词、代词等(步骤S5209),将结尾转换为适合于对对象的称呼(步骤S5210),然后向位置评论添加事件ID、参数和时间码,在对象评论列表中登记结果位置评论(步骤S5211),并返回到图16B所示的操作。
1.10.2发言控制处理的示例
此外,将更详细地描述在图16B的步骤S540中描述的发言控制处理。图16E是示出发言控制处理的操作流程的示例的流程图。
如图16E所示,当从评论生成单元40获取对象评论列表时(步骤S5301),发言控制单元50从获取的对象评论列表中单独提取位置“评论员”和“讲解者”的位置评论(步骤S5302)。
接下来,发言控制单元50通过使用TTS对“评论员”和“讲解者”的每个位置评论的文本数据执行语音合成处理,将每个位置评论转换为声音数据(评论语音)(步骤S5303)。
接下来,发言控制单元50获取“评论员”的评论语音和“讲解者”的评论语音中的每一个的发言时间(步骤S5304)。
接下来,发言控制单元50将讲解者的发言开始时间(时间码)设置为从评论员的发言开始时间(时间码)起经过评论员的发言时间之后的时间点(步骤S5305),并且在讲解者的更新后的发言开始时间处更新对象评论列表(步骤S5306),使得在评论员的虚拟评论员的发言结束之后开始讲解者的虚拟评论员的发言,如图16C所示。
此后,发言控制单元50存储“评论员”的评论语音和“讲解者”的评论语音的语音文件(步骤S5307),并返回到图16B所示的操作。
1.10.3编辑/渲染处理的示例
此外,将更详细地描述图16B的步骤S550中所示的编辑/渲染处理。图16F是示出编辑/渲染处理的操作流程的示例的流程图。
如图16F所示,编辑/渲染单元70首先确定是否已经从评论生成单元40发送了发言中断请求(步骤S5501),并且在没有发送发言中断请求的情况下(步骤S5501中的否),进行到步骤S5503。另一方面,在已经发送了发言中断请求的情况下(步骤S5501中的是),丢弃存储在用于编辑和渲染的缓冲器中的评论语音和化身动画(步骤S5502),并且处理进行到步骤S5503。在分发之前评论的动态图像内容被存储在分发单元80或编辑/渲染单元70中的情况下,评论的动态图像内容可被丢弃。
在步骤S5503中,编辑/渲染单元70从发言控制单元50获取评论语音,并从化身生成单元60获取化身动画。随后,类似于图9C的步骤S1602和S1603,编辑/渲染单元70根据时间码在动态图像内容上布置评论语音和化身动画(步骤S5504),并通过呈现布置有评论语音和化身动画的动态图像内容来生成所评论的动态图像内容(步骤S5505)。此后,该操作返回到图16B。
1.11在实时动态图像分发期间根据来自观看者的反馈生成评论的示例
接下来,将描述在实时动态图像分发期间根据来自观看者的反馈生成评论的示例。图17A是示出在实时动态图像分发期间根据来自观看者的反馈生成评论的情况下的操作示例的流程图。在说明书中,基于上面参考图16B描述的操作示例,在实况分发期间的事件识别中在预定时间(在该示例中为90秒)或更长时间内没有检测到事件的情况下,结合基于来自观看者的反馈生成的评论以给出暂停。
如图17A所示,在该操作中,在步骤S508中确定在与图16B所示的操作相同的操作中没有输入事件数据(步骤S508中为否)的情况下,或者在步骤S510中确定事件数据不是具有高优先级的事件的事件数据的情况下(步骤S510中为否),执行步骤S601。
在步骤S601中,评论生成单元40判定从输入了前一次的事件数据的时刻起是否经过了预定时间(例如90秒)以上。在未经过预定时间以上的情况下(步骤S601中为否),评论生成单元40直接前进到步骤S530。另一方面,在经过了预定时间以上的情况下(步骤S601中为是),评论生成单元40执行观看者反馈(步骤S610),然后前进到步骤S530。
1.11.1观看者反馈的示例
在此,在该示例中,假设了其中每个观看者(其可以包括投稿人(玩家他/她自己))可以在分发服务的聊天等中发送评论作为来自观看者的反馈的功能。图17B是示出观看者反馈处理的操作流程的示例的流程图。
如图17B所示,评论生成单元40首先获取在过去的预定时间(在该示例中为90秒)内从每个观看者发送的诸如聊天的反馈(步骤S6101)。随后,评论生成单元40通过使用机器学习等的识别器来识别所获取的反馈的关键词、内容等,将诸如“欢呼”、“失望”或“嘲笑”的标签添加到所获取的反馈中(步骤S6102),并基于识别结果来识别反馈对象(步骤S6103)。例如,如果来自观看者的反馈是“别担心,尽力而为!”,则评论生成单元40识别出要添加的标签是“欢呼”,并且对象(反馈对象)是玩家,如果来自观看者的反馈为“是!我很高兴!”,并且识别出要添加的标签是“失望”,并且如果来自观看者的反馈是“你不再观看了吗?”,则对象是另一个观看者。
接下来,评论生成单元40确定是否存在与被设置为评论对象的对象(他/她自己、团队成员、朋友等)匹配的反馈对象(步骤S6104),并且在不存在匹配对象的情况下(步骤S6104中为否),评论生成单元40返回到图17A所示的操作。另一方面,在存在匹配对象的情况下(步骤S6104中为是),评论生成单元40从所获取的反馈中提取其反馈对象与评论对象匹配的反馈,并且在添加到所提取的反馈的标签中指定最频繁使用的标签(步骤S6105)。
接下来,评论生成单元40从图7B所示的位置评论列表获取位置为“讲解者”的评论列表,例如,从所获取的评论列表中提取添加了在步骤S6105中指定的标签的评论,以创建列表(评论列表)(步骤S6106)。通过将虚拟评论员的评论缩小到与来自观看者的反馈相同的标签的评论,可以使虚拟评论员说出与观看者共鸣的评论。
接下来,评论生成单元40通过执行类似于图16D的步骤S5204至S5209的操作来生成虚拟评论员实际要说出的位置评论(步骤S6107至S6113),然后将正在实况分发的动态图像中的当前时间码添加到位置评论,并将得到的位置评论登记在对象评论列表中(步骤S6114)。
接下来,为了在步骤S510和S601中控制事件间隔,评论生成单元40将在步骤S6114中登记在对象评论列表中的位置评论计数为事件之一(步骤S6115),并返回到图17A所示的操作。
1.12在实时动态图像观看期间虚拟评论员增加或减少的示例
图16A至16F示出了生成用于实况分发的两个虚拟评论员的会话评论的示例。另一方面,在该示例中,将描述在观看实况分发(以下称为实况观看)期间虚拟评论员的数目增加或减少的示例。在此,虚拟评论员数目的增加或减少意味着假定玩家和观看者实时改变的环境,例如在线战斗游戏,并且不仅为他们自己设置的虚拟评论员而且为其他观看者设置的虚拟评论员都显示在每个观看者的用户终端上,从而根据其他观看者的增加或减少或改变,虚拟评论员的数目增加或减少或者虚拟评论员被替换。利用这种配置,可以产生战斗激烈的感觉,并且可以产生虚拟评论员之间的互动。此外,在不仅显示观看者的虚拟评论员而且显示玩家的虚拟评论员的情况下,可以根据玩家的增加或减少或改变,虚拟评论员的数目可以增加或减少,或者虚拟评论员可以被改变。
图18是示出在实况分发期间虚拟评论员的数目增加或减少的情况下的操作流程的示例的流程图。在替换虚拟评论员的情况下,可以执行与虚拟评论员的减少和增加同时发生的情况相同的处理,因此这里将省略其详细描述。
如图18所示,在该操作中,首先,当观看者A10启动用户终端110上的应用并开始视频的实况观看时,实况观看请求被发送到设置单元120。接收到该请求的设置单元120首先从用户信息保持单元20获取关于观看者A10的用户信息(步骤S701)。
同时,在用户终端110上显示用于选择要实况观看的视频类型的画面。当观看者A10基于该选择画面选择视频类型时(步骤S702),从用户终端110向设置单元120通知所选择的视频类型。选择画面可以具有各种模式,例如图标模式和菜单模式。
接下来,设置单元120基于例如从用户终端110发送的视频类型,从用户信息保持单元20获取的观看者A10的用户信息等自动选择虚拟评论员的角色,并将“观看者”设置为位置(步骤S703)。
接下来,与图6A的步骤S111中一样,事件提取单元30基于动态图像内容的视频类型获取识别模型(步骤S704)。
当以此方式完成实况观看的准备时,接下来,分发单元80开始向用户终端110分发实时视频(步骤S705)。当开始实况观看时,将实时视频(动态图像内容)从分发单元80顺序地输出到用户终端110。此时,可以通过流方法发送动态图像内容。
例如,设置单元120管理参与实况分发的观看者的数目、玩家和观看者的用户信息等。设置单元120管理当前正在观看实况分发的观看者的数目,确定观看者的数目是否增加或减少(步骤S706),并且在观看者的数目没有增加或减少的情况下(步骤S706中为否),动态图像前进到步骤S709。
在观看者数目增加或减少的情况下(步骤S706中为是),设置单元120对虚拟评论员执行显示调整(步骤S707)。具体地,在添加新观看者的情况下,设置单元120以这样的方式调整设置,即,新添加的观看者的虚拟评论员被附加地显示在分发到观看者A10的实时视频(动态图像内容)中。此外,在观看者离开实况分发的情况下,设置单元120以这样的方式调整设置,即,已经离开的观看者的虚拟评论员不显示在观看者A10的实时视频中。此时,可以显示特定的动画,例如已经离开的观看者的虚拟评论员从画面上出现的门进入或出去。例如,支持对手球队B的虚拟评论员在观看者A10为球队A欢呼的状态下出现,这导致了激烈的欢呼竞争,从而加剧了战斗。此外,当观看者A10的朋友新加入实况分发时,该朋友的虚拟评论员出现,这可以加剧欢呼或战斗。
接下来,设置单元120基于虚拟评论员数目的增加或减少来调整与观看者A10相关的虚拟评论员的评论对象(步骤S708)。例如,在虚拟评论员的数目增加的情况下,增加的虚拟评论员被添加作为评论对象,而在虚拟评论员的数目减少的情况下,减少的虚拟评论员被从评论对象中删除。然后,设置单元120将调整后的虚拟评论员及其评论对象顺序地输入到事件提取单元30和化身生成单元60。
接下来,评论生成单元40获取为另一观看者的虚拟评论员(在下文中,为了便于描述,称为虚拟评论员B)生成的位置评论(步骤S709),并确定位置评论的对象(听众)是否是观看者A10的虚拟评论员(在下文中,为了便于描述,称为虚拟评论员A)(步骤S710)。
在虚拟评论员A是对象的情况下(步骤S710中为是),评论生成单元40通过将虚拟评论员A要发出的评论的对象(听众)设置为已经与之交谈的虚拟评论员B(步骤S711)来生成虚拟评论员B的位置评论(步骤S712),并且前进到步骤S715。另一方面,在虚拟评论员A不是对象的情况下(步骤S710中为否),评论生成单元40将评论的对象设置为观看者(步骤S713),基于事件为观看者生成位置评论(步骤S714),并前进到步骤S715。
如在图16B的步骤S530至S550和S512中,在步骤S715至S718中,执行发言控制处理(S715)、化身生成处理(S716)和编辑/渲染处理(S717),并将由此生成的评论动态图像内容实况分发给观看者A10和其他观看者(步骤S718)。
此后,例如,云100中的控制单元(未示出)确定是否结束分发(步骤S719),并且在控制单元确定不结束分发的情况下(步骤S719中为否),操作返回到步骤S706。另一方面,在控制单元确定结束分发的情况下(步骤S719中为是),该操作结束。
在该示例中,例如,在预定时间段(例如,90秒)内没有发生事件的情况下,虚拟评论员A可以主动地与另一评论员交谈,例如,以虚拟评论员生成并插入评论用于与另一虚拟评论员B交谈的方式。此外,在图16B所示的示例中,关于多个虚拟评论员的发言定时,已经描述了这样的规则,其中作为评论员的虚拟评论员发言,然后作为讲解者的虚拟评论员发言。然而,在该示例中,为了鼓励兴奋,可以允许多个虚拟评论员同时发言。此时,为了使观看者容易听到每个虚拟评论员的发言内容,可以采取措施,诸如相对降低虚拟评论员A以外的虚拟评论员的语音音量或者分离声音的定位。
1.13根据虚拟评论员的位置调整显示位置的示例
此外,虚拟评论员在用户终端10/110上的显示位置可以根据该位置进行调整。换句话说,可以根据位置为虚拟评论员设置虚拟位置。
例如,当动态图像内容是二维图像时,虚拟位置可以在图像的区域内或者可以在该区域外。此外,在三维视频的情况下,虚拟位置可以在3D空间中或在叠加在三维视频上的二维视频的区域中。此外,虚拟评论员不必被可视地显示。在这种情况下,观看者(包括用户)可以在渲染虚拟评论员的语音时通过声源定位等感觉到虚拟评论员的存在。
例如,在虚拟评论员的位置是“一起观看的朋友”等的情况下,假设虚拟评论员的虚拟位置在观看者旁边。在这种情况下,可以将虚拟位置设置到观看者的右侧或左侧,与动态图像内容(具体地,用户终端10/110)的距离等于观看者的距离,方向基本上朝向内容,并且可以在向观看者讲话时设置朝向观看者的位置和方向。
此外,在虚拟评论员的位置是他/她自己的情况下,可以考虑将虚拟位置定位在观看者旁边以便给出与观看者一起体验的感觉,从作为展示者的内容侧面向观看者的虚拟位置等。
在确定这种虚拟位置的情况下,可以通过虚拟评论员的2D/3D绘图或将虚拟评论员的声源定位在三维空间中,使观看者感觉到包括位置和方位、其时间序列变化等的虚拟位置。例如,可以表达在朝向观看者的方向上的说话和在与朝向观看者的方向相差90度的方向上的说话之间的声音差异、从远处说话和耳朵附近说话之间的声音差异、虚拟评论员接近/离开的状态等。
根据虚拟评论员的位置对显示位置(虚拟位置)的这种调整可以例如通过化身生成单元60根据虚拟评论员的位置调整所生成的化身动画在动态图像内容中的显示位置来实现。此外,根据虚拟评论员的位置对虚拟评论员的方位的调整可以例如通过化身生成单元60在根据虚拟评论员位置生成化身动画时调整虚拟评论员的方位来实现。
图19A至19C是用于描述根据虚拟评论员的位置来调整显示位置的情况的示例的示图。图19A示出了在虚拟评论员的位置是“一起观看的朋友”并且对动态图像内容进行发言的情况下的虚拟位置的示例。图19B示出了虚拟评论员的位置是“一起观看的朋友”,并且对观看者进行发言的情况。图19C示出了虚拟评论员的位置是“讲解者”并且为观看者进行发言的情况。
如图19A所示,例如,在虚拟评论员的位置是“一起观看的朋友”并且对动态图像内容进行发言的情况下,虚拟评论员C1可以被安排在动态图像内容G50中靠近观看者的一侧(前侧),并且虚拟评论员C1的方位可以朝向动态图像内容G50中的事件(在该示例中,由用户U1操作的角色)。
此外,如图19B所示,例如,在虚拟评论员的位置是“一起观看的朋友”并且为观看者进行发言的情况下,虚拟评论员C1可以被安排在动态图像内容G50中靠近观看者的一侧(前侧),并且虚拟评论员C1的方位可以朝向观看者。
如图19C所示,例如,在虚拟评论员的位置是“讲解者”并且为观看者进行发言的情况下,虚拟评论员C1可以被安排在动态图像内容G50中远离观看者的一侧(在背面),并且虚拟评论员C1的方位可以朝向事件或观看者。
如上所述,通过根据虚拟评论员的位置和评论对象来控制虚拟评论员的显示位置和方位,可以在内容体验中提升观看者的真实感。
1.14在存在多个虚拟评论员的情况下的评论规则的示例
此外,假设虚拟评论员的评论内容指示动态图像帧中的特定点,诸如“这个玩家的动作很棒”。另一方面,由于与动态图像帧相比,人能够注视的区域是有限的,因此当观看者的视线大幅度移动时,存在观看者的易理解性降低的可能性。对于这样的问题,例如,可以想到设置这样的规则:在存在多个虚拟评论员的情况下,如果某个虚拟评论员对动态图像帧中的特定点进行评论,则不对在某个时间内未落入另一虚拟评论员的中心视角内的点进行评论。
1.15使用视线信息进行评论的示例
此外,通过从投稿者的视线信息检测画面上的凝视点并使虚拟评论员对该部分进行评论,可以在投稿者期望的方向上引导观看者的注意力,或者相反地,通过从观看者的视线信息检测画面上的凝视点并使虚拟评论员对该部分进行评论等。
1.16字幕显示位置的示例
此外,由虚拟评论员发出的语音评论的字幕可被叠加并显示在动态图像内容上。此时,例如,通过基于投稿者或观看者的视线信息调整字幕的显示位置,可以减少观看者的视线移动并提高理解的容易性。具体地,通过在观看者或观看者所注视的动态图像内容中的区域附近显示字幕,可以可视地链接评论和评论所针对的区域。因此,可以减少观察者的视线移动,并且可以提高理解的容易性。
图20A示出了语音评论的字幕布置在基本位置(例如,画面的中心下方)的情况的示例,图20B示出了基于投稿者的视线信息来调整语音评论的字幕的位置的情况的示例,以及图20C示出了基于观看者的视线信息生成位置评论并且调整语音评论的字幕的显示位置的情况的示例。
如图20A所示,在不考虑投稿者或观看者正在观看的地方而将字幕显示在预定位置的情况下,不可能容易地指定虚拟评论员已经向画面上的哪个玩家发出评论,从而降低了理解的容易性。
另一方面,如图20B所示,例如,在基于投稿者(或观看者)的视线信息调整字幕的显示位置的情况下,可以在虚拟评论员向其发出评论的对象附近显示字幕,因此,能够使观看者容易地识别虚拟解说者对画面上的哪个部分(图20B的示例中的玩家)发出了评论。
此外,如图20C所示,通过基于观看者在画面上观看的位置(即,在动态图像内容上)生成位置评论,可以使虚拟评论员及时地为观看者所注视的事件发言。此外,通过基于观看者的视线信息调整语音评论的字幕的显示位置,可以使观看者能够容易地识别虚拟评论员已经对画面上的哪个部分(图20C的示例中的玩家)发出了评论。
为了获取投稿者或观看者的视线信息,例如,可以使用设置在用户终端10/110中的视线检测传感器或相机。也就是说,用户终端10/110还可以用作获取投稿者或观看者的视线信息的获取单元。
1.17通过应用机器学习为虚拟评论员的每个位置生成评论的示例
接下来,将描述应用机器学习来为虚拟评论员的每个位置生成评论的情况的示例。近年来,动态图像分发已经变得普遍,并且分发的数目已经迅速增加,特别是对于游戏视频。在主分发平台中,在动态图像分发期间实时交换游戏玩家的评论、动态图像观看者的评论、电子竞技(e-SPORTS)(注册商标)比赛的评论员/讲解者的评论等,并且预期将来将进一步开发主分发平台,其包括除了游戏之外的类别作为用于交互地享受动态图像的手段。
这种评论发送者的多样化对应于虚拟评论员的位置。例如,在游戏解说的情况下,图1中的位置“他/她自己”的评论是玩家他/她自己的评论,位置“团队成员”的评论则是与该玩家一起玩的另一玩家的评论,并且位置“观看者(朋友)”的评论可以被视为不直接参与游戏的观看者的评论,并且可以基于麦克风和评论ID的差异来独立地获取每个评论。另外,可以类似地独立地获取诸如“敌人(对手)”、“评论员”、“讲解者”和“主持人”的各种位置的评论。
即,添加了来自各种虚拟评论员的位置的评论的分发式动态图像的数目迅速增加,结果,对于每个位置独立地获取来自各种位置的大量评论。结果,可以为虚拟评论员的每个位置创建大规模的评论数据集(例如,图7B中的位置评论列表)。
大规模评论数据集在评论量上劣于基于另一个超大规模数据集的通用语言模型,但是可以通过对使用每个位置的数据集训练的通用语言模型执行诸如微调和N-Shot学习的优化,来使用通用语言模型和大规模位置数据集来构建每个位置的语言模型。
图21是示出在通过应用机器学习针对虚拟评论员的每个位置生成评论的情况下的系统配置示例的框图。如图21所示,由作为游戏参与者的玩家1至3中的每一个,评论员和讲解者发出的内容通过语音识别211至213、215和216被转换成文本数据,并被存储在相应位置的位置评论组221至226中。在观看者的聊天204中,输入文本数据被存储在观看者(朋友)位置评论组224中。
使用登记在各个位置的位置评论组221至226中的评论数据集作为训练数据来训练为玩家1至3、观看者的聊天204、评论员和讲解者准备的通用语言模型231至236。结果,创建各个位置的语言模型(位置评论列表)241至246。
根据本实施方式的信息处理系统1中的评论生成单元40可以通过使用各个位置的语言模型(位置评论列表)241至246来根据虚拟评论员的各种位置生成适当的位置评论。
虽然到目前为止主要描述了在动态图像内容中布置评论语音和化身动画的示例,但是基于每个流程图描述的处理可以被执行以用于生成和添加文本(字幕)评论,或者可以被执行以用于语音评论和文本评论。此外,可以仅添加文本评论和/或语音评论而不将化身动画添加到动态图像内容。
2.系统配置示例
根据上述实施方式的设置单元120、事件提取单元30、评论生成单元40、发言控制单元50、化身生成单元60、编辑/渲染单元70和分发单元80中的至少一些可以在用户终端10/110中实现,其余的可以在诸如网络上的云服务器的一个或多个信息处理设备中实现,或者全部可以在网络上的云服务器中实现。例如,设置单元120可以由用户终端10/110实现,并且事件提取单元30、评论生成单元40、发言控制单元50、化身生成单元60、编辑/渲染单元70和分发单元80可以在网络上的云服务器等中实现。
3.硬件配置
执行根据上述实施例的用户终端10/110、设置单元120、事件提取单元30、评论生成单元40、发言控制单元50、化身生成单元60、编辑/渲染单元70或分发单元80中的至少一个的一个或多个信息处理设备可由具有例如如图22所示的配置的计算机1000来实现。图22是示出实现用户终端10/110和信息处理装置的功能的计算机1000的示例的硬件配置图。
如图22所示,计算机1000包括中央处理单元(CPU)1001、只读存储器(ROM)1002、随机存取存储器(RAM)1003、传感器输入单元1101、操作单元1102、显示单元1103、声音输出单元1104、存储单元1105和通信单元1106。CPU 1001、ROM 1002和RAM 1003经由内部总线1010彼此连接。传感器输入单元1101、操作单元1102、显示单元1103、声音输出单元1104、存储单元1105和通信单元1106经由输入/输出接口1100连接到内部总线1010。
CPU 1001基于存储在ROM 1002或存储单元1105中的程序进行操作,并控制每个单元。例如,CPU 1001将存储在ROM 1002或存储单元1105中的程序加载到RAM 1003中,并执行对应于各种程序的处理。
ROM 1002存储启动程序,诸如当启动计算机1000时由CPU 1001执行的基本输入输出系统(BIOS),取决于计算机1000的硬件的程序等。
存储单元1105是计算机可读记录介质,其非临时性地记录CPU 1001执行的程序、程序使用的数据等。具体地,存储单元1105是记录用于执行根据本公开的每个操作的程序的记录介质。
通信单元1106是用于将计算机1000连接到外部网络(例如,因特网)的接口。例如,CPU 1001经由通信单元1106从另一设备接收数据或将由CPU 1001生成的数据发送到另一设备。
传感器输入单元1101包括例如视线检测传感器或相机,其检测投稿者、观看者等的视线,并基于所获取的传感器信息生成投稿者、观看者等的视线信息。此外,例如,在用户终端10/110是游戏控制台等的情况下,可以包括包含在游戏控制台或其控制器中的惯性测量单元(IMU)、麦克风、相机等。
操作单元1102是输入设备,诸如键盘、鼠标、触摸板、触摸面板,或者供投稿者或观看者输入操作信息的控制器。
显示单元1103是显示游戏画面或动态图像内容的显示器。例如,可以在显示单元1103上显示如图2A至2D所示的各种选择画面。
声音输出单元1104例如包括扬声器等,并且输出游戏或动态图像内容的声音、由在动态图像内容中的虚拟评论员发出的语音评论等。
例如,在计算机1000用作根据上述实施例的用户终端10/110、设置单元120、事件提取单元30、评论生成单元40、发言控制单元50、化身生成单元60、编辑/渲染单元70和分发单元80中的任何一个或多个的情况下,计算机1000的CPU 1001通过执行加载到RAM 1003中的程序来实现每个相应单元的功能。此外,存储单元1105存储根据本公开的程序等。CPU1001从存储单元1105读取程序并执行程序,但是作为另一示例,这些程序可以经由通信单元1106从网络上的另一设备获取。
虽然上面已经描述了本公开的实施方式,但是本公开的技术范围不限于上述实施方式,并且在不脱离本公开的要旨的情况下可以进行各种修改。此外,可以适当地组合不同实施方式和修改示例的组件。
此外,在本说明书中描述的每个实施方式的效果仅仅是示例而不是限制性的,并且可以提供其他效果。
此外,每个上述实施方式可以单独使用,或者可以与另一实施方式组合使用。
注意,本技术还可以具有以下配置。
(1)
一种信息处理装置,包括:
获取单元,其获取关于内容的投稿者与内容的观看者之间的关系的信息;以及
评论生成单元,其基于关于所述关系的信息生成将由虚拟评论员说出的评论。
(2)
根据(1)所述的信息处理装置,其中,关于所述关系的信息包括所述投稿者与所述观看者之间的亲密程度、所述内容中的所述投稿者与所述观看者之间的关系,或所述观看者过去对所述投稿者投稿的内容的历史信息中的至少一个。
(3)
根据(1)或(2)所述的信息处理装置,其中,关于所述关系的信息包括所述投稿者与所述观看者之间的亲密程度、所述内容中的所述投稿者与所述观看者之间的关系,或所述观看者过去对由所述投稿者投稿的内容的历史信息中的至少一个。
(4)
根据(1)至(3)中任一项所述的信息处理装置,其中,所述获取单元设置所述虚拟评论员的位置,以及
所述评论生成单元根据所述位置生成所述评论。
(5)
根据(4)所述的信息处理装置,其中,所述评论生成单元基于位置评论列表来生成所述评论,在所述位置评论列表中列出了所述虚拟评论员针对每个位置发出的评论的候选。
(6)
根据(5)所述的信息处理装置,其中,所述评论生成单元基于通过从所述位置评论列表中排除所述虚拟评论员先前发出的评论中预定次数的评论而获得的评论列表来生成所述评论。
(7)
根据(4)至(6)中任一项所述的信息处理装置,其中,所述获取单元使所述投稿者或所述观看者选择所述虚拟评论员的位置的对象。
(8)
根据(4)至(6)中任一项所述的信息处理装置,其中,所述获取单元基于关于所述关系的信息来自动设置所述虚拟评论员的位置。
(9)
根据(1)至(8)中任一项所述的信息处理装置,其中,所述获取单元设置要由所述虚拟评论员说出的评论的对象,以及
所述评论生成单元根据所述评论的对象生成所述评论。
(10)
根据(9)所述的信息处理装置,其中,所述获取单元使所述投稿者或所述观看者选择所述评论的对象。
(11)
根据(9)所述的信息处理装置,其中,所述获取单元基于关于所述关系的信息自动设置所述评论的对象。
(12)
根据(1)至(11)中任一项所述的信息处理装置,其中,所述评论生成单元根据所述内容所属的类型来生成所述评论。
(13)
根据(1)至(12)中任一项所述的信息处理装置,其中,所述评论生成单元基于关于所述关系的信息来校正所生成的评论。
(14)
根据(13)所述的信息处理装置,其中,所述评论生成单元基于所述投稿者与所述观看者之间的层级关系来校正所生成的评论的结尾。
(15)
根据(1)至(14)中任一项所述的信息处理装置,还包括提取所述内容的事件的提取单元,
其中,所述评论生成单元生成针对所述事件的评论。
(16)
根据(15)所述的信息处理装置,其中,在所述内容中从前一事件发生的时间到下一事件发生的时间的时间差小于预定时间的情况下,所述评论生成单元跳过对所述下一事件的评论的生成。
(17)
根据(15)所述的信息处理装置,其中,在所述内容中的从前一事件发生的时间到下一事件发生的时间的时间差小于预定时间,并且所述下一事件的优先级高于所述前一事件的优先级的情况下,所述评论生成单元生成针对所述下一事件的评论,并请求停止对针对所述前一事件生成的所述评论的发言。
(18)
根据(1)至(17)中任一项所述的信息处理装置,其中,所述评论生成单元生成要由两个或更多个虚拟评论员中的每一个说出的评论。
(19)
根据(18)所述的信息处理装置,其中,所述评论生成单元以如下方式生成所述评论:在所述两个或更多个虚拟评论员中的第一虚拟评论员的发言完成之后,所述两个或更多个虚拟评论员中的第二虚拟评论员进行发言。
(20)
根据(18)或(19)所述的信息处理装置,其中,所述评论生成单元生成要由所述两个或更多个虚拟评论员中的一个向所述两个或更多个虚拟评论员中的另一个发出的评论。
(21)
根据(1)至(20)中任一项所述的信息处理装置,其中,所述获取单元获取当前正在观看所述内容的观看者的数目,以及
评论生成单元生成由其数目对应于观看者数目的每个虚拟评论员说出的评论,并且根据观看者数目的增加或减少来增加或减少虚拟评论员的数目。
(22)
根据(1)至(21)中任一项所述的信息处理装置,其中,所述评论生成单元获取来自所述观看者的反馈,并根据所述反馈生成所述评论。
(23)
根据(1)至(22)中任一项所述的信息处理装置,还包括:
编辑/渲染单元,其将对应于所述评论的文本数据或声音数据中的至少一者并入所述内容中,并将所述虚拟评论员的动画叠加在所述内容上。
(24)
根据(23)所述的信息处理装置,还包括动画生成单元,所述动画生成单元生成所述虚拟评论员的动画;
其中,编辑/渲染单元将虚拟评论员的动画叠加在内容上。
(25)
根据(24)所述的信息处理装置,其中,所述编辑/渲染单元根据所述虚拟评论员的位置调整所述动画在所述内容中的位置。
(26)
根据(23)至(25)中任一项所述的信息处理装置,还包括将所述评论转换为所述声音数据的发言控制单元。
(27)
根据(9)至(11)中任一项所述的信息处理装置,还包括:
发言控制单元,其将所述评论转换为声音数据;
编辑/渲染单元,其将所述声音数据并入到所述内容中;以及
动画生成单元,其生成所述虚拟评论员的动画;
其中,所述获取单元设置所述评论的对象以由所述虚拟评论员说出,以及
动画生成单元生成根据评论的对象调整虚拟评论员的方向的动画,以及
编辑/渲染单元将虚拟评论员的动画叠加在内容上。
(28)
根据(1)至(27)中任一项所述的信息处理装置,其中,所述获取单元获取所述投稿者或所述观看者的视线信息,以及
所述评论生成单元基于所述视线信息生成所述评论。
(29)
根据(28)所述的信息处理装置,其中,所述评论生成单元基于所述视线信息调整所述评论在所述内容中的显示位置。
(30)
一种信息处理方法,包括:
获取关于内容的投稿者和内容的观看者之间的关系的信息;以及
基于关于所述关系的信息生成将由虚拟评论员说出的评论。
(31)
一种信息处理系统,其中第一用户终端、信息处理装置和第二用户终端经由预定网络连接,
所述信息处理装置包括:
获取单元,其获取关于从所述第一用户终端向所述信息处理装置投稿内容的投稿者与经由所述第二用户终端观看所述内容的观看者之间的关系的信息;以及
评论生成单元,其基于关于所述关系的信息生成将由虚拟评论员说出的评论。
附图标记列表
1 信息处理系统
10、110,M1 用户终端
20 用户信息保持单元
30 事件提取单元
31 图像分析单元
32 语音分析单元
40 评论生成单元
41 位置/对象控制单元
50 发言控制单元
60 化身生成单元
70 编辑/渲染单元
80 分发单元
90 网络
100 云
120 设置单元
1001 CPU
1002 ROM
1003 RAM
1010 内部总线
1100 输入/输出接口
1101 传感器输入单元
1102 操作单元
1103 显示单元
1104 声音输出单元
1105 存储单元
1106 通信单元
A10、A11、A12、A13 观看者
A100 观看者侧
U1 用户
U100 用户侧。
Claims (20)
1.一种信息处理装置,包括:
获取单元,获取关于内容的投稿者与所述内容的观看者之间的关系的信息;以及
评论生成单元,基于关于所述关系的所述信息生成将由虚拟评论员说出的评论。
2.根据权利要求1所述的信息处理装置,其中,关于所述关系的所述信息包括以下各项中的至少一项:所述投稿者与所述观看者之间的亲密程度、在所述内容中所述投稿者与所述观看者之间的关系、针对由所述投稿者过去投稿的所述内容的所述观看者的历史信息。
3.根据权利要求2所述的信息处理装置,其中,所述评论生成单元基于位置评论列表生成所述评论,其中,在所述位置评论列表中列出针对每个位置将由所述虚拟评论员说出的评论的候选。
4.根据权利要求1所述的信息处理装置,其中,所述获取单元设置所述虚拟评论员的位置,以及
所述评论生成单元根据所述位置生成所述评论。
5.根据权利要求1所述的信息处理装置,其中,所述获取单元设置将由所述虚拟评论员说出的评论的对象,以及
所述评论生成单元根据所述评论的所述对象生成所述评论。
6.根据权利要求1所述的信息处理装置,其中,所述评论生成单元根据所述内容所属的类型生成所述评论。
7.根据权利要求1所述的信息处理装置,其中,所述评论生成单元基于关于所述关系的所述信息校正所生成的评论。
8.根据权利要求1所述的信息处理装置,进一步包括提取单元,所述提取单元提取所述内容的事件,
其中,所述评论生成单元生成针对所述事件的所述评论。
9.根据权利要求8所述的信息处理装置,其中,在所述内容中从前一事件发生的时间到下一事件发生的时间的时间差小于预定时间的情况下,所述评论生成单元跳过针对所述下一事件的评论的生成。
10.根据权利要求1所述的信息处理装置,其中,所述评论生成单元生成要由两个或更多个虚拟评论员中的每一者说出的评论。
11.根据权利要求10所述的信息处理装置,其中,所述评论生成单元以在所述两个或更多个虚拟评论员中的第一虚拟评论员的发言完成之后,所述两个或更多个虚拟评论员中的第二虚拟评论员进行发言的方式生成所述评论。
12.根据权利要求10所述的信息处理装置,其中,所述评论生成单元生成要由所述两个或更多个虚拟评论员中的一者向所述两个或更多个虚拟评论员中的另一者说出的评论。
13.根据权利要求1所述的信息处理装置,其中,所述获取单元获取当前正在观看所述内容的观看者的数目,以及
所述评论生成单元生成由数目对应于所述观看者的数目的每个所述虚拟评论员说出的评论,并且根据观看者的数目的增加或减少来增加或减少虚拟评论员的数目。
14.根据权利要求1所述的信息处理装置,其中,所述评论生成单元获取来自所述观看者的反馈,并根据所述反馈生成所述评论。
15.根据权利要求1所述的信息处理装置,还包括:
动画生成单元,生成所述虚拟评论员的动画;以及
编辑/渲染单元,将对应于所述评论的文本数据或声音数据中的至少一者并入所述内容中,并将所述虚拟评论员的所述动画叠加在所述内容上。
16.根据权利要求15所述的信息处理装置,其中,所述编辑/渲染单元根据所述虚拟评论员的位置调整所述动画在所述内容中的位置。
17.根据权利要求1所述的信息处理装置,其中,所述获取单元获取所述投稿者或所述观看者的视线信息,以及
所述评论生成单元基于所述视线信息生成所述评论。
18.根据权利要求17所述的信息处理装置,其中,所述评论生成单元基于所述视线信息调整所述评论在所述内容中的显示位置。
19.一种信息处理方法,包括:
获取关于内容的投稿者和所述内容的观看者之间的关系的信息;以及
基于关于所述关系的所述信息生成将由虚拟评论员说出的评论。
20.一种信息处理系统,在所述信息处理系统中,第一用户终端、信息处理装置和第二用户终端经由预定网络连接,
所述信息处理装置包括:
获取单元,获取关于从所述第一用户终端向所述信息处理装置投稿内容的投稿者与经由所述第二用户终端观看所述内容的观看者之间的关系的信息;以及
评论生成单元,基于关于所述关系的所述信息生成将由虚拟评论员说出的评论。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021086935 | 2021-05-24 | ||
JP2021-086935 | 2021-05-24 | ||
PCT/JP2021/048460 WO2022249522A1 (ja) | 2021-05-24 | 2021-12-27 | 情報処理装置、情報処理方法及び情報処理システム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117337434A true CN117337434A (zh) | 2024-01-02 |
Family
ID=84229726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180098260.5A Pending CN117337434A (zh) | 2021-05-24 | 2021-12-27 | 信息处理装置、信息处理方法和信息处理系统 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP4325376A1 (zh) |
JP (1) | JPWO2022249522A1 (zh) |
CN (1) | CN117337434A (zh) |
WO (1) | WO2022249522A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7314387B1 (ja) | 2022-12-26 | 2023-07-25 | 株式会社ドワンゴ | コンテンツ生成装置、コンテンツ生成方法、およびプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5891909B2 (ja) * | 2012-03-30 | 2016-03-23 | 大日本印刷株式会社 | サーバ装置、プログラム及び通信システム |
JP6219548B1 (ja) * | 2017-03-31 | 2017-10-25 | 株式会社ドワンゴ | 仮想処理サーバ、仮想処理サーバの制御方法、コンテンツ配信システム、および端末装置のアプリケーションプログラム |
JP6814089B2 (ja) | 2017-05-02 | 2021-01-13 | 株式会社ソニー・インタラクティブエンタテインメント | オブジェクト制御システムおよびオブジェクト制御方法 |
JP7271885B2 (ja) * | 2018-09-20 | 2023-05-12 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
-
2021
- 2021-12-27 CN CN202180098260.5A patent/CN117337434A/zh active Pending
- 2021-12-27 EP EP21943155.8A patent/EP4325376A1/en active Pending
- 2021-12-27 JP JP2023523954A patent/JPWO2022249522A1/ja active Pending
- 2021-12-27 WO PCT/JP2021/048460 patent/WO2022249522A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
EP4325376A1 (en) | 2024-02-21 |
JPWO2022249522A1 (zh) | 2022-12-01 |
WO2022249522A1 (ja) | 2022-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10225608B2 (en) | Generating a representation of a user's reaction to media content | |
US10987596B2 (en) | Spectator audio analysis in online gaming environments | |
CN107801101B (zh) | 用于优化和高效的交互式体验的系统和方法 | |
CN110505491B (zh) | 一种直播的处理方法、装置、电子设备及存储介质 | |
US10293260B1 (en) | Player audio analysis in online gaming environments | |
US9898850B2 (en) | Support and complement device, support and complement method, and recording medium for specifying character motion or animation | |
US11610092B2 (en) | Information processing system, information processing apparatus, information processing method, and recording medium | |
US10864447B1 (en) | Highlight presentation interface in a game spectating system | |
US10363488B1 (en) | Determining highlights in a game spectating system | |
JP6730392B2 (ja) | ゲームプログラムならびにゲームシステム | |
CN113301358B (zh) | 内容提供及展示方法、装置、电子设备、存储介质 | |
JP7278307B2 (ja) | コンピュータプログラム、サーバ装置、端末装置及び表示方法 | |
US20230254449A1 (en) | Information processing system, information processing method, information processing program | |
WO2022251077A1 (en) | Simulating crowd noise for live events through emotional analysis of distributed inputs | |
EP4325376A1 (en) | Information processing device, information processing method, and information processing system | |
KR102384182B1 (ko) | 시청자 참여형 양방향 인터랙션 방송 서비스 제공 방법, 장치 및 컴퓨터프로그램 | |
US11975268B2 (en) | User input method and apparatus | |
CN115292548B (zh) | 一种基于虚拟技术的戏曲宣传方法、系统和宣传平台 | |
WO2024101001A1 (en) | Information processing system, information processing method, and program for communication points regarding events | |
KR102624164B1 (ko) | 영상 플레이어 상에서의 콘텐츠 변환 장치 및 방법 | |
JP7430014B1 (ja) | 制御装置、制御方法及びコンピュータープログラム | |
JP2024070696A (ja) | 情報処理システム、情報処理方法、およびプログラム | |
Kaisto | Interaction in immersive virtual reality: Breakdowns as trouble-sources in co-present VR interaction | |
JP2023181568A (ja) | 情報処理装置及び情報処理方法 | |
Moore | MAKING THINGS PERFECTLY SKETCH |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |