CN109416816B - 支持交流的人工智能系统 - Google Patents

支持交流的人工智能系统 Download PDF

Info

Publication number
CN109416816B
CN109416816B CN201780037483.4A CN201780037483A CN109416816B CN 109416816 B CN109416816 B CN 109416816B CN 201780037483 A CN201780037483 A CN 201780037483A CN 109416816 B CN109416816 B CN 109416816B
Authority
CN
China
Prior art keywords
user
database
data
artificial intelligence
intelligence system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780037483.4A
Other languages
English (en)
Other versions
CN109416816A (zh
Inventor
米仓千贵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alt Inc
Original Assignee
Alt Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alt Inc filed Critical Alt Inc
Publication of CN109416816A publication Critical patent/CN109416816A/zh
Application granted granted Critical
Publication of CN109416816B publication Critical patent/CN109416816B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种人工智能系统,所述人工智能系统具有:第一信息处理模块,所述第一信息处理模块基于登录到一个或多个社交网络服务的第一用户的社交数据,生成语言相关的数据;以及第二信息处理模块,所述第二信息处理模块基于登录到一个或多个社交网络服务的第一用户的社交数据,生成图像相关的数据;所述人工智能系统利用第一信息处理模块和第二信息处理模块在计算机上生成相对于第一用户的虚拟第一用户。

Description

支持交流的人工智能系统
技术领域
本发明涉及一种使用人工智能的系统,涉及生成虚拟个人并实现和自然人的交流的技术。
背景技术
随着社交网络服务的普及,多个用户彼此之间能使用智能手机、平板终端、个人计算机等装置来发送信息并共享。由此,个人可获取或可发送的信息的量增加,其范围显著扩大。通过操作安装在终端装置的应用软件,也能容易地和数人同时共享信息。交流的内容并不仅限于声音或文字,还能借助于静态图像或动画进行交流,可以说信息的数量和质量都在不断增加。
这些社交网络服务让人和人的交流通过计算机直接进行。另一方面,模仿人的容姿、动作,依据人和自然语言不断进行着机器人的开发(比如参考专利文献1)。而且,还公开了在计算机上生成虚拟宠物或拟人化的化身并进行交流的技术(例如参考专利文献2)。
现有技术文献
专利文献
专利文献1:日本专利特开2012-076162号公报;
专利文献2:日本专利特开2005-092540号公报。
发明内容
[发明要解决的问题]
不过,这类交流技术的问题是标准统一化,不能发挥个性。此外,自然人之间对话时,比如“苹果”这一文本数据,尽管大家都会想到水果的苹果,但实际情况是:听到“苹果”这个词,A想到的苹果是红苹果,B想到的苹果是青苹果,并不一定是一致的。即,问题在于,计算机生成的虚拟交流主体、或拟人化主体并不能充分地发挥并反映出本人的个性。进一步来讲,问题是即使在计算机上生成化身(成为自己分身的人物),也不能沿袭本人的人格,无法发挥个性。
[用于解决问题的方案]
根据本发明的一个实施方式,提供一种人工智能系统,所述人工智能系统具有:第一信息处理模块,所述第一信息处理模块基于登录到一个或多个社交网络服务的第一用户的社交数据,生成语言相关数据;及第二信息处理模块,所述第二信息处理模块基于登录到一个或多个社交网络服务的第一用户的社交数据,生成图像相关数据;所述人工智能系统利用第一信息处理模块和第二信息处理模块,在计算机上生成相对于第一用户的虚拟第一用户。
[发明效果]
根据本发明的一个实施方式,通过人工智能生成的虚拟用户在代替用户本人进行对话时,能够将该用户对事物或事件想到的印象以图像的形式显示。
附图说明
图1是表示本发明的一个实施方式涉及的人工智能系统、社交网络服务、以及属于利用该人工智能系统的用户侧的终端装置的关系的图。
图2是表示在本发明的一个实施方式涉及的人工智能系统中,第一用户和第二用户均是登录到社交网络服务的用户时的信息公开范围的图。
图3是表示本发明的一个实施方式涉及的人工智能系统的功能构成的图。
图4是对本发明的一个实施方式涉及的人工智能系统执行的处理的流程进行说明的流程图。
图5是表示本发明的一个实施方式涉及的人工智能系统中的第一数据库及第二数据库的构成的图。
图6是对本发明的一个实施方式涉及的人工智能系统执行的处理的流程进行说明的流程图,表示检索第一数据库及第二数据库来创建针对提问的回答的步骤的一个例子。
图7A是表示本发明的一个实施方式涉及的人工智能系统中的类似数据库的构成的图。
图7B是表示本发明的一个实施方式涉及的人工智能系统中的类似数据库的构成的图。
图8是表示本发明的一个实施方式涉及的人工智能系统中包含的评价及编辑模块的功能构成的图。
图9A是表示由本发明的一个实施方式涉及的人工智能系统显示在终端装置的画面显示的一个例子的图。
图9B是表示由本发明的一个实施方式涉及的人工智能系统显示在终端装置的画面显示的一个例子的图。
图10是对本发明的一个实施方式涉及的人工智能系统执行的处理的流程进行说明的流程图,表示针对提问的回答的评价及编辑处理的流程。
图11是表示本发明的一个实施方式涉及的人工智能系统和用户之间的对话流程的图。
图12是表示本发明的一个实施方式涉及的人工智能系统和用户之间的对话流程的图。
图13是表示本发明的一个实施方式涉及的人工智能系统和用户之间的对话流程的图。
具体实施方式
以下,在参考附图等的同时说明本发明的实施方式。不过,本发明能以多种不同的形态实施,不能限于下面例示的实施方式的记载内容进行解释。此外,为了更明确地进行说明,和实际形态相比,附图中有时候会示意性地表示各部分的宽度、厚度、形状等,但这只是举例,并不限定本发明的解释。而且,在本说明书和各图中,针对和前图中已经叙述过的要素相同的要素,有时会附加相同的符号并适当地省略详细的说明。
1.人工智能系统的概要
图1表示本发明的一个实施方式涉及的人工智能系统100、社交网络服务300(下面也称为“SNS”)、及属于利用该人工智能系统100的用户侧的终端装置200的关系。本实施方式涉及的人工智能系统100具有从用户利用的各种SNS300获取社交数据并进行学习的功能。
另外,在本说明书中,“社交数据”是指用户通过一个或多个SNS向特定的人(比如作为好友登录的其他用户)或公众发送的文字(包括颜文字)、记号、声音、静态图像或动态图像、或者它们组合而成的信息。且,“个人社交数据”是指属于多个用户中的特定个人的社交数据。
人工智能系统100具有累积功能,从多个用户202利用的各种SNS300获取数据并累积到数据库104中。人工智能系统100还包括信息处理模块102,所述信息处理模块102基于数据库104中累积的信息,让运算处理装置推理用户的思考并进行学习。信息处理模块102具有机器学习功能(作为人工智能的功能)。人工智能系统100通过机器学习在计算机系统上生成反映各用户个性的虚拟用户,和作为自然人的用户本人或者其他用户进行各种各样的交流。
这里所谓的人工智能是指使用硬件资源和软件资源实现推理、判断等智能功能,此概念还可以认为包含存储作为知识的数据的数据库。此外,人工智能包括学习功能,所以还可以具有图像识别能力、自然语言理解能力。
人工智能系统100通过对从SNS300获取的社交数据进行机器学习,将自然人针对各种事物和事件想到的印象图像化,并作为一般化模型生成。比如,将登录到一个或多个SNS300的多个用户202的社交数据用作学习素材,通过深度学习(Deep Learning)将多人对特定事物想到共通观念的形态作为一般化模型来图像化。比如以“苹果”为对象事物,人工智能系统100对从SNS300获取的社交数据进行机器学习,从该社交数据中提取多个用户都能共通识别为“苹果”的模型(图像),或者使用该社交数据生成恰当的图像。另外,所谓深度学习(Deep Learning),是指由计算机实施信息处理,使用多层结构的神经网络进行机器学习。
另外,人工智能系统100具有适配功能,基于多个用户中特定个人的个人社交数据,使一般化模型适配和该特定人的个性匹配的模型。比如,当“苹果”的一般化模型为“红苹果”时,根据该特定人的个人社交数据的内容,判断其对苹果的观念(印象)更趋向“青苹果”时,便生成或提取“青苹果”的图像作为个性化模型。
如图1所示,人工智能系统100处于可通过电通信线路访问分别属于多个用户202的终端装置200的状态。多个用户202可利用人工智能系统100提供的服务,直接地以及间接地和本计算机系统上生成的虚拟用户进行交流。
多个用户202优选地是为了要接受通过人工智能系统100提供的服务而预先登录的用户的集合。由于利用通过人工智能系统100提供的服务是登录制的,可以提高交流的安全性及可靠性。
另外,并非多个用户202所有人都必须预先登录才能接受通过人工智能系统100提供的服务。比如,多个用户202中也可以至少有一人能够作为匿名用户来利用人工智能系统100。
人工智能系统100处于可以和面向公众提供的一个或多个SNS300通信,能获取社交数据的状态。作为SNS300,比如是个人或多人小组运营的主要按时间顺序显示投稿的照片和报导的博客、Twitter(注册商标)、Facebook(注册商标)、MSN、LINE等可以投稿文字及图像的网站,此外还包括因特网上提供的各种交流服务。另外,SNS300提供的交流形态多种多样,并不限定于所述例示的服务。本实施方式中,和人工智能系统100合作的SNS300只要能提供其用户的社交数据即可,优选为多个用户之间能共享信息的形态。
人工智能系统100从至少一个或多个SNS300获取社交数据。人工智能系统100实施的社交数据的获取可以是实时的,也可以每隔一定时间或一定期间适时地获取。人工智能系统100将获取到的社交数据累积在数据库104中。为了提高数据库中累积的信息的量及质,人工智能系统100优选地和大量SNS300合作以获取大量社交数据。
例示如下形态,作为从一个或多个SNS300获取社交数据、以及将获取到的社交数据累积到数据库104中的过程的一个例子。首先,第一用户204使用个人计算机、或被称为智能手机的多功能移动电话等终端装置,向人工智能系统100登录第一用户204的属性。这时,第一用户204要向人工智能系统100提供并登录自己所属的SNS的信息。
第一用户204的属性被存储到人工智能系统100的数据库104中。人工智能系统100访问第一用户204已登录的SNS,获取该第一用户204相关的个人社交数据。第一用户204相关的个人社交数据包括第一用户204在此SNS中自己发送的信息、和其他用户对话的信息。也就是说,个人社交数据包括文本数据、图像数据(静态图像及动态图像)、声音数据。
人工智能系统100按同样的方式针对其他用户从SNS300获取社交数据。另外,从SNS300获取的社交数据可以是所有用户的社交数据,也可以是任意提取的社交数据。
人工智能系统100利用具有人工智能功能的信息处理模块102,对多个用户202的社交数据进行机器学习,生成被一般化了的模型。具体来说,对各种事件进行深度学习(Deep Learning)来识别图像。由此,生成或提取作为多个用户的共通识别显示的一般模型作为图像数据。比如“苹果”,生成或提取让多个用户都能共通识别为“苹果”的图像数据。此外,关于多个用户202包括的多人分组之中作为共通识别被特定的个人特征,生成指代其个人的一般模型。比如多人分组中的“田中”,提取相符的田中的面容作为图像数据。人工智能系统100将这样的图像数据作为一般化模型登录到数据库104。针对“猫”、“狗”等动物、“橘子”、“卷心菜”、“牛肉(肉)”等食物、“楼”、“桥”等建筑物、特定个人的“面容”或“身姿”等各种事件来完成一般化模型。
人工智能系统100使用从一个或多个SNS获取的个人社交数据,对特定的用户(比如第一用户204)进行深度学习(Deep Learning),生成个性化模型。针对某个事物或事件创建的个性化模型和一般化模型可以相同也可以不同。比如“苹果”,当一般化模型中特定为“红苹果”时,个性化模型也可以在反映个人社交数据的内容后将“青苹果”的图像作为个性化模型登录到数据库104中。当个人社交数据中包括大量“青苹果”相关的图像、对话数据时,且整体来看近期的个人社交数据中“青苹果”的图像、对话相对较多时进行加权。此外,多人分组中针对“田中”,提取相符的田中的面容作为图像数据,但当特定的用户对个人社交数据的观念(印象)是田中整个家族时,将田中家族的合影等作为个性化模型登录到数据库104中。
有时,将第一用户204的属性存储到人工智能系统100的数据库104中。第一用户204的属性包括:用于特定从SNS300中的哪个SNS获取社交数据的信息(SNS特定信息)、以及获取社交数据的SNS中的第一用户204的认证信息。人工智能系统100使用SNS特定信息及SNS的认证信息,访问以SNS特定信息特定的SNS,并使用第一用户204的认证信息访问SNS,代替第一用户204进行登录等处理。然后,人工智能系统100获取此SNS中存储的第一用户204相关的信息即个人社交数据。第一用户204相关的信息中包括第一用户204和所述的SNS中的特定用户交换的消息、第一用户204向所述SNS投稿的报导、照片、声音信息、动画(包括声音信息)。
人工智能系统100将从SNS300获取的第一用户204相关的信息存储到数据库104中。这时,人工智能系统100可以将从SNS300获取的第一用户204相关的信息原样存储到数据库104中。或者,人工智能系统100也可以根据获取到的信息的属性或内容对第一用户204相关的信息进行加工,然后存储到数据库104中,并随时累积。
比如,当第一用户204利用SNS300中的某个网站和其他用户对话时,若获取了针对其他用户的提问的回答信息,就将其他用户的提问、和第一用户204对之作出的回答相互关联后存储到数据库104中。提问和对之作出的回答的信息中不仅包括文本数据,还可以也包括照片、动画、声音等数据。这种情况下,数据库104也可以由多个区域(子数据库、或者表等)构成,包括提问存储区域及回答存储区域。因此,向提问存储区域中存储来自其他用户的提问,向回答存储区域中存储第一用户204的回答。还可将来自其他用户的提问和第一用户204的回答相互关联,比如向第三区域中存储关联用信息。比如,将针对提问的主关键词和针对回答的主关键词的组存储到第三区域中。
另外,人工智能系统100在并未从利用SNS特定信息来特定的SNS中获取第一用户204相关的所有信息并累积在数据库中的情况下,也可以向第一用户204提示数据库中累积的信息相对于第一用户204相关的所有信息的比例。由此,第一用户204可以获知信息的累积程度,比如可以决定是否由人工智能系统100代替第一用户204回答来自多个用户202中某个人的提问。而且,通过向多个用户202提示此种信息累积程度,还能预测针对提问的回答适合度。
图1表示第一用户204以外的第二用户206通过人工智能系统100和第一用户204对话的形态。通过人工智能系统100进行的交流并非第一用户204和第二用户206直接交换消息,而是采用由人工智能系统100在计算机上生成的虚拟第一用户204b和实际存在的第二用户206对话的形式。这种情况下,会在第二用户206的终端装置200上,根据对话内容显示第一用户204印象中的图像。比如,当第二用户206和虚拟第一用户204b讨论“苹果”时,在终端装置200的画面上显示第一用户204应会印象深刻的“青苹果”的图像。这时,存在第二用户206有“红苹果”印象的情况,在对话过程中获知第一用户204的印象是“青苹果”,那么从新的观点开始推进对话,可实现更紧密的交流。
另外,从SNS300提供的社交数据应确保用户的隐私。本实施方式涉及的人工智能系统100能反映用户在各SNS300中个别设置的信息。比如,利用某个SNS300的用户将个人资料设置为不公开,在SNS投稿的消息设置为公开时,进一步针对每个消息设置是否公开、公开范围时,人工智能系统100能够继续沿用其设置。
人工智能系统100获取第一用户204相关的信息并存储到数据库104时,所述信息的公开范围也会存储到数据库104中。图2表示第一用户204和第二用户206均是登录到SNS300a的用户时的信息公开范围。第二用户206通过人工智能系统100来与虚拟第一用户204b进行一对一对话时,在第二用户206的终端装置200的画面上,会显示基于第一用户204的个人社交数据生成的个性化模型而得到的图像。比如,第二用户206和虚拟第一用户204b进行有关日本民间故事“桃太郎”相关的对话时,在第二用户206的终端装置200上,会显示第一用户204对“桃太郎”的印象“桃子”的图像。由此,第二用户206在对话过程中除了自己想到的“桃太郎”印象,还能知道对话对象关于“桃太郎”的印象,通过理解对方来实现和对方更亲密的交流。这种情况下,一对一交换消息时,所述消息交换的对话内容只对第二用户206公开。
当第一用户204和属于SNS300a的特定分组203之间进行对话时,会在属于所述特定分组203的多个用户各自的终端装置200的画面上,和上述同样地根据对话内容显示第一用户204想到的图像。另一方面,即使不属于SNS300a的第三者登录到人工智能系统100访问人工智能系统100,所述对话内容也不会向该第三者提供。
另一方面,当第一用户204设置任何人都能通过SNS300a浏览的状态后进行交流时,对于SNS300a的无论哪个用户都能从人工智能系统100被提供对话内容。比如,第一用户204设置SNS300a所属的任何用户都能浏览的状态,并和其他用户之间进行对话时,访问人工智能系统100的多个用户202的终端装置200的画面上,和上述同样地会根据对话内容显示第一用户204想到的图像。
总之,利用人工智能系统100提供的服务的多个用户202优选地同时为一个或多个SNS300的用户。这是因为人工智能系统100是从面向公众提供的SNS300获取多个用户202各自的社交数据。即,多个用户202可以通过参加SNS300的社区,来接受通过人工智能系统100的服务的提供。
本实施方式中,基于第一用户204的个人社交数据生成的虚拟第一用户204b可以认为是通过人工智能系统100而具现化的。从另一观点来看,也可以认为虚拟第一用户204b是存在于通过人工智能系统100实施的计算机程序或应用程序中的。或者,还可以将虚拟第一用户204b看作是通过构成人工智能系统100的硬件资源以及在硬件资源上实施的软件资源来具现化而存在的。
图3表示本实施方式涉及的人工智能系统100的功能构成。人工智能系统100包含具有作为人工智能的功能的信息处理模块102及数据库104。信息处理模块102中内含第一信息处理模块102a及第二信息处理模块102b。第一信息处理模块102a具有根据登录到一个或多个SNS300的社交数据来生成语言相关的数据的功能。第二信息处理模块102b具有基于登录到一个或多个SNS300的用户的社交数据来生成图像相关的数据的功能。此外,数据库104包括第一数据库104a及第二数据库104b。第一数据库104a中主要存储社交数据(包括第一用户的个人社交数据及其他用户的社交数据),第二数据库104b中存储通过机器学习生成或提取的图像数据。
另外,图3所示的人工智能系统100是利用硬盘、半导体存储器及磁性存储器等存储器模块或存储装置来实现数据库104,利用由中央处理装置(CPU)或具有同等功能的运算处理装置实现的计算机来实现信息处理模块102。于此,所谓信息处理模块也可以认为是利用硬件资源、或硬件资源和软件资源而由计算机实现的功能块,有时候也被称为信息处理部或信息处理手段。以下,本说明书中标记为模块时也是一样的。
人工智能系统100处于可以和多个用户(图3例示的终端装置200a、200b)双向通信的状态。换句话说,终端装置200a、200b可以和人工智能系统100及SNS300通信,另一方面从人工智能系统100来说可以和多个终端装置200a、200b通信,且处于可以从SNS300获取社交数据的状态。
人工智能系统100中,第一数据库104a至少具有存储社交数据的区域。第一数据库104a从功能上被配置成进一步包括第一子数据库105a、第二子数据库105b、第三子数据库105c。第一子数据库105a中存储个人社交数据相关的信息,第二子数据库105b中存储社交数据相关的信息,第三子数据库105c中可同样包含社交数据,也可以存储从因特网爬取得到的各种信息。存储在第三子数据库105c的信息包括交流用单词、语汇、定型文作为词典数据。
第一子数据库105a、第二子数据库105b及第三子数据库105c中存储提问和回答(或者询问和回复)之类的将社交数据所含的对话内容关联而成的信息。此外,还存储像个人推特(Twitter)那样单向发送的社交数据。
不过,一般来说推特(Twitter)很多情况下并不是用来回答提问的。在这种情况下,可进行推特(Twitter)的语法分析等,分解成主语、宾语、表示场所、时间、形态的副词短语等,生成寻求主语、宾语、表示场所、时间、形态的副词短语等的提问以及对其的回答,并向数据库中累积第一用户204相关的信息。比如,第一用户204在Twitter上发表“我的妹妹昨天签了汽车购买合同。”。这时,主语是“我的妹妹”,宾语是“汽车”及“合同”,表示时间的副词短语是“昨天”。因此,可生成“是谁签的?”的提问并生成“我的妹妹。”的回答,生成“何时?”的提问并生成“昨天。”的回答,生成“签了购买什么的合同?”的提问并生成“汽车。”的回答,生成“签了什么?”的提问并生成“购买汽车的合同。”的回答,然后将这些累积到数据库中。
第一数据库104a包括类似数据库106。类似数据库106将类似提问分成一个组,关联对该组的回答并存储。类似数据库106也可以对应于所述第一至第三子数据库而分成第一类似子数据库107a、第二类似子数据库107b、第三类似子数据库107c。这种情况下,分别地,第一子数据库105a和第一类似子数据库107a建立对应,第二子数据库105b和第二类似子数据库107b建立对应,第三子数据库105c和第三类似子数据库107c建立对应。
第一信息处理模块102a和第一数据库104a协作,发挥作为人工智能的功能。第一信息处理模块102a还包括对虚拟第一用户204b的回答进行编辑的编辑功能、评价该回答的评价功能、评价结果的通知功能、用于再现用户的声音的音素生成功能、生成新提问的提问生成功能、生成用户的三维影像的三维影像化功能。
第二信息处理模块102b将SNS300中存在的社交数据作为学习数据来输入。所述学习数据可以从SNS300直接获取,也可以从第一数据库104a(具体来说是第一子数据库105a、第二子数据库105b)中获取。第二信息处理模块102b通过深度学习(Deep Learning)对社交数据所含的特定事件或多个事件进行学习。第二信息处理模块102b被配置成使得由神经网络形成多个层。深度学习(Deep Learning)是从神经网络的第一层开始按顺序进行,一个层的学习完成后转移到下一层的学习。比如,深度学习(Deep Learning)中,识别图像时在神经网络的第一层提取边缘等局部特征,层级越往上就能识别更全局的特征(概念)。
此外,第二信息处理模块102b可以将社交数据所含的图像数据、和文本数据及/或声音数据组合起来学习。比如,若和“苹果”图像共同包含“红苹果”这一文本数据,就能学习到苹果具有红色这一特征(观念)。像这样,不仅学习图像数据,还学习图像数据中附带的文本数据,可提高图像识别的准确度。
第二信息处理模块102b包括个性化模块108及一般化模块109。一般化模块109以登录到一个或多个SNS300的用户的社交数据作为学习材料进行学习,生成一般化模型或者从社交数据中提取一般化模型。一般化模型是指大多数自然人对某个事物持有相同观念的印象数据,包括以图像形式显示的数据。一般化模型是指比如可将“苹果”识别为“苹果”的图像,可将“猫”识别为“猫”的图像。第二信息处理模块102b将通过学习社交数据得到的一般化模型,存储到第二数据库104b的一般化模型数据库110b中。像这样,第二信息处理模块包括:个性化模块,所述个性化模块基于第一用户的社交数据,将一般模型个性化为适合第一用户的模型;以及一般化模块,所述一般化模块中将其他用户的社交数据作为学习数据输入,生成通过机器学习来建模的一般模型。
在第二信息处理模块102b中,个性化模块108获取登录到一个或多个SNS300的第一用户204的个人社交数据作为学习材料。关于深度学习(Deep Learning),个性化模块108具有和一般化模块109相同的功能。个性化模块108组合个人社交数据所含的图像数据、或图像数据和文本数据及/或声音数据来进行学习。此外,个性化模块108还可以具有向从一般化模型数据库110b获取的一般化模型反映个人社交数据的学习结果并生成个性化模型的功能。个性化模块108以从SNS300获取的个人社交数据作为学习材料进行学习,生成个性化模型或者从社交数据中提取个性化模型。所谓个性化模型,是指个人如何看待某个事物的印象数据,包括以图像形式显示的数据。也就是说,第二信息处理模块具有使用第二数据库中存储的数据、将虚拟用户对事物或事件想到的印象图像化的功能。第二信息处理模块102b将通过学习个人社交数据得到的个性化模型,存储到第二数据库104b的个性化模型数据库110a中。
第二信息处理模块102b生成的一般化模型、和个性化模型可以相同也可以不同。比如,列举一个例子:关于“苹果”,可以在一般化模型中创建“红苹果”的印象,相对于此,在个性化模型中反映个人社交数据的内容而创建“青苹果”的印象。这是通过当个人社交数据中包括大量“青苹果”相关的图像、对话数据、且整体来看近期的个人社交数据中“青苹果”的图像或对话相对较多时进行加权而创建的。
另外,第二数据库104b除了包括个性化模型数据库110a及一般化模型数据库110b以外,还可以包括一般图像数据库110c,所述一般图像数据库110c中存储从因特网爬取而得到的图像数据。
图4表示对人工智能系统100的处理流程进行说明的流程图。人工智能系统100从SNS300获取个人社交数据(S400)。并且,获取本人以外的其他用户的社交数据(S402)。人工智能系统100对获取到的个人社交数据及社交数据进行机器学习(S404)。机器学习包括深度学习。通过所述处理,基于个人社交数据生成个性化模型(S406),并用本人以外的多人的社交数据生成一般化模型(S408)。
人工智能系统100使用个性化数据在计算机上生成虚拟用户(S410)。计算机系统上生成的虚拟用户进行和实际用户的对话(S412)。实际用户包括用户本人或其他用户。虚拟用户代替本人,基于个性化数据和访问者对话。人工智能系统100收集对话数据(S414)。然后,将对话数据作为学习材料进行机器学习(S404)。通过重复进行这种例程,虚拟用户反复学习,从而学会更接近本人的自然对话。
人工智能系统100具有对虚拟用户回答的对话内容进行编辑的功能。当判断用户本人想要编辑对话内容时(S416),针对提问的回答进行编辑(S418)。然后,将编辑后的对话内容作为更新数据更新个人社交数据(S420),并进行机器学习(S404)。由此,可准确地反映本人的意图。
像这样,本发明涉及的人工智能系统可以基于从SNS获取的信息,在计算机系统上生成虚拟个人,和本人及本人以外的其他人实现交流。也就是说,利用第一信息处理模块和第二信息处理模块在计算机上生成的虚拟第一用户可以和第一用户及第一用户以外的其他用户对话。这种情况下,不仅可交流文本、声音的数据,还能将对话中出现的对某个事物或事件的个人印象,通过该虚拟个人以图像形式显示给对话对象。换句话说,人工智能系统100不仅交流文本、声音,还提供视觉(非语言)信息(或者只通过视觉提供交流),可以向对话对象展示前所未有的冲击力。
2.数据库
图5表示人工智能系统100中的第一数据库104a及第二数据库104b的构成。第一数据库104a及第二数据库104b被分别层级化。
第一数据库104a中,第一子数据库105a是对应个人的数据库,其中存储个人社交数据。所述第一子数据库105a中存储的个人社交数据在人工智能系统100中还被用作生成虚拟用户数据时的基础数据。将个人社交数据及据此生成的信息按每个用户分别存储到第一子数据库105a中。此外,依据个人社交数据生成的信息中,包括按关键词分析个人社交数据得到的向量、按概念分析个人社交数据得到的向量、按类型分析个人社交数据得到的向量、以及按分组分析个人社交数据得到的向量中的任一个以上。
第一子数据库105a中存储的数据包括从多个SNS300获取的个人社交数据。比如,向第一子数据库105a中存储某个用户在SNS300投稿的评论、该用户和其他用户之间在SNS300上相互交流的内容、该用户的推特(Twitter)等信息。如上所述,还生成提问和回答并存储。
第二子数据库105b中存储多个用户的社交数据。第二子数据库105b中存储的数据包括从SNS300获取的各用户的社交数据。第二子数据库105b中存储的数据量比第一子数据库105a多。所述第二子数据库105b从层级上来说位于第一子数据库105a的下位。
此外,第三子数据库105c中预先存储比如从因特网爬取得到的信息、交流中使用的单词、语汇、定型文作为词典数据。也就是说,第三子数据库105c中存储着多个文本数据。第三子数据库105c中存储的数据可以是预先设置的任意文本数据,或者可以是SNS上出现的文本中收集出现频率高的文本而得到的数据。比如,可以收集在SNS中交互的被称为聊天的实时交流中出现频率高的文本。
第三子数据库105c中也可以存储比如从声音数据及影像数据所含的声音数据转换过来的文本数据。此外,当用户向SNS300上传照片或动画时,有时会同时附上评论,而且有时还会有其他用户对其评论作出的评论。而且,照片、动画、声音中有时还会附带拍摄地点、内容的标签。因此,从照片数据及影像数据生成文本数据时,可以将附带的标签、评论等数据变成文本数据并存储到数据库中。还可以将获取照片数据及影像数据时的位置信息(国名、地名等)、日期信息变成文本数据后存储到数据库中。换句话说,可以基于声音数据、照片数据及影像数据的任一个以上,生成文本数据并存储到数据库中。这样的第三子数据库105c从层级上来说位于第一子数据库105a的下位。
第二数据库104b中,个性化模型数据库110a中存储将从SNS300获取的个人社交数据作为学习材料进行学习得到的个性化模型。个性化模型主要是图像数据,除此以外也可以是图像和文字及/或声音的组合数据。作为个性化模型存储的数据用于虚拟用户和本人或其他用户对话时。
第二数据库104b中,一般化模型数据库110b中存储将从SNS300获取的社交数据作为学习材料进行学习得到的一般化模型。一般化模型也主要是图像数据,除此以外也可以是图像和文字及/或声音的组合数据。所述一般化模型数据库110b的层级配置在个性化模型数据库110a的下位。
一般图像数据库110c中包括从因特网爬取到的图像信息、各种网站上刊登的照片等图像数据。这些图像数据是和事物或事件建立对应而存储的。比如说“苹果”,将苹果的图像数据和“苹果”这一文本数据或表示其的符号建立对应而存储。所述一般图像数据库110c的层级配置在一般化模型数据库110b的下位。
3.信息处理模块
在图5所示的构成中,第一数据库104a及第二数据库104b会和具有人工智能功能的第一信息处理模块102a协作,协同运作。第一信息处理模块102a也可以层级化为第一信息处理子模块103a、第二信息处理子模块103b、第三信息处理子模块103c。这种情况下,第一信息处理子模块103a和存储个人社交数据的第一子数据库105a及个性化模型数据库110a位于相同层级(最高层级),具有反映个人的个性的、作为人工智能的功能。第一信息处理子模块103a也可以表现为“私人AI”或者“个人(personalized)AI”。第二信息处理子模块103b和存储社交数据的第二子数据库105b及一般化模型数据库110b位于相同层级,作为反映作为用户全体的集体的特性的作为人工智能的运作。第二信息处理子模块103b也可以表现为“人人AI”或者“常识AI”。此外,第三信息处理子模块103c和第三子数据库105c及一般图像数据库110c一起运作,也可以被看成是所谓的聊天机器人。
这种第一信息处理模块102a使用第一数据库104a中存储的社交数据在计算机上生成虚拟个人,并和实际用户交流。具有人工智能功能的第一信息处理模块102a具有比如识别第一子数据库105a中存储的文本数据,创建或生成针对提问的回答的功能。此时,第一信息处理模块102a具有根据第一子数据库105a中存储的文本数据,利用运算处理装置进行推理或学习来决定针对提问的恰当回答的功能。而且,第一信息处理模块102a从个性化模型数据库110a中,读取与对话中出现的事物或事件相对应的图像,并在对话对象的终端装置的画面上显示该图像。像这样,第一信息处理模块102a不仅向对话对象显示对话内容的文本或声音数据,还显示对话中的一个主体即第一用户根据对话内容想到的图像,因此能够增加提供给对话对象的信息量。
第一信息处理模块102a受理第二用户对虚拟第一用户的提问,并创建或生成针对该提问的回答。第一信息处理模块102a在判断第一子数据库105a、个性化模型数据库110a中没有恰当的数据的情况下,转向在下位层级的第二子数据库105b、一般化模型数据库110b搜索针对提问的回答及关联图像。进一步地,当判定也没有恰当的回答时,就再转向更下位的第三子数据库105c、一般图像数据库110c搜索针对该提问的回答。
用流程图来表示检索第一数据库104a及第二数据库104b创建针对提问的回答的步骤的一个例子。以下,在参考图6的同时来说明处理的流程。
首先,第一信息处理模块102a创建或生成针对某个提问的回答时,先从第一子数据库105a中检索针对该提问的恰当回答,且从个性化模型数据库110a中检索能根据提问或回答想起的图像数据(S430)。如果能从第一子数据库105a、个性化模型数据库110a得到回答,就创建最准确地反映第一用户的思考、思想感情及观念等的回答(S440)。
从第一子数据库105a中检索针对该提问的恰当回答时,可以从第一数据库104a累积的提问中,检索和该提问字符串一致的提问,并检索和检索到的提问关联的回答。或者,在第一子数据库105a累积的提问中,和该提问字符串不完全一致时,也可以考虑一定程度的在表述上的波动后再判定是否一致而进行检索。此外,也可以检索第一子数据库105a累积的提问中的包含于该提问的单词数最多的提问。这种情况下,除了考虑单词数还可以考虑单词排列顺序来检索。而且,也可以解析第一子数据库105a累积的提问和该提问的意思,检索意思最接近的。意思解析比如可包括,基于所定的逻辑体系从回答中导出逻辑结果作为结论、或者导出以回答为前提的条件。像这样,检测到回答时,当字符串不完全一致时会有“对回答进行推理来决定”的情况。此外,当字符串完全一致时也有“对回答进行学习来决定”的情况。
此外,从个性化模型数据库110a中选择恰当的个性化模型时,是提取所述从第一子数据库105a检测到的回答所含的名词(普通名词、固有名词)或名词句,检索并选择和名词或名词句对应的个性化模型。比如,提问“喜欢什么水果”,回答“喜欢草莓”时,从个性化模型数据库110a存储的个性化模型中,选择第一用户想到的草莓的图像数据。
第一信息处理模块102a不能从第一子数据库105a、个性化模型数据库11a中得到恰当的回答时(S432),就检索处于下位层级的第二子数据库105b及一般化模型数据库110b(S434)。从第二子数据库105b得到的回答能够知道大多数用户对特定提问是如何回答的倾向,就可以得到平均且妥当的回答。比如,提问“喜欢什么水果”而大多数回答“喜欢甜瓜”时,第一信息处理模块102a可以从第二子数据库105b中选择同样的回答作为对提问的回答,并从一般化模型数据库11b中选择通常想到的甜瓜的图像来回答。上述的是一个简单的提问例子,第二子数据库105b基于一般化模型数据库110b反映多数用户的回答倾向,所以能得到符合潮流的回答(S440)。
第一信息处理模块102a不能从第二子数据库105b、一般化模型数据库11b找到回答时(S436),就检索第三子数据库105c、一般图像数据库110c(S438)。第三子数据库105c、一般图像数据库110c中存储着庞大数量的数据,可以从中选择回答。然后,将选择的回答作为回答(S440)。
4.类似提问的判断
第一数据库104a中关联存储着提问和针对提问的回应。不过,人类社会交流时的提问(询问)、和对此作出的回答(回应)通常并非是统一不变的。比如,想要询问初次见面的人的姓名时,有时会询问“你是谁?”,有时会询问“你叫什么名字”。
本发明的一个实施方式中设置的结构是,有这样的类似提问时选择针对相符提问的回应。比如,对于所述“你是谁?”、和“你叫什么名字”的提问,都回应“我叫安妮。”是没有违和感的。此结构也可以构建为比如图3说明的类似数据库106。类似数据库106将类似的提问作为类似提问进行分组,并和对应于针对类似提问的回答建立对应。第一信息处理模块102a可以从类似数据库106中选择提问的回答。利用这种构成可以恰当地选择针对提问的回答。
图7A表示类似数据库106的一个例子。类似数据库106包括存储提问的类似提问数据库112、及存储回答的类似回答数据库113。作为其它形态,也可以在类似数据库106中设置存储提问的区域、及存储回应的区域。
类似提问数据库112中将多个提问作为数据而存储着。多个提问是将类似的提问关联后作为一个组来存储。比如,将所述“你是谁?”和“你叫什么名字”作为类似的提问关联并存储。类似回答数据库113中存储着针对提问的回复内容,即多个回应被作为数据而存储着。比如,存储所述“我叫安妮。”这一回应。类似回答数据库113中,回应数据关联特定的提问。根据所述示例,“你是谁?”和“你叫什么名字”的提问分在一个组,作为回应关联“我叫安妮。”这一回应。
图7B表示类似数据库106的其它形态。图7B中类似数据库106比如也可以层级化为:和第一子数据库105a对应的第一类似子数据库107a、和第二子数据库105b对应的第二类似子数据库107b、和第三子数据库105c对应的第三类似子数据库107c。
第一类似子数据库107a是对应于用户个人基于个人社交数据创建的。根据个人社交数据所含的聊天等的文本数据、文本化的对话内容,存储和疑问句对应的文本数据、以及和回应句对应的文本数据。这种情况下,如图7A说明的那样,将和疑问句对应的文本数据中类似的疑问句数据进行分组再存储到提问数据库,将对应的回应句数据存储到回应数据库并进行关联。
第二类似子数据库107b是基于多个用户的社交数据创建的。根据多个用户的社交数据所含的聊天等的文本数据、或文本化的对话内容,存储和疑问句对应的文本数据、以及和回应句对应的文本数据。第二类似子数据库107b也如图7A说明的那样,将和疑问句对应的文本数据中类似的疑问句数据进行分组再存储到提问数据库,将对应的回应句数据存储到回应数据库并进行关联。
另外,还可以基于第一类似子数据库107a中存储的社交数据的变化,来变更第二类似子数据库107b中存储的数据。比如,提问“你好,最近怎么样”,回应“你好,挺好的”时,即使以提问和回应的组进行了设置,但大多数用户会回应“还行”时,可以基于社交数据来变更第二类似子数据库107b中存储的数据。这种情况下,也可以对照用户的特性(性格),分为容易受到其他用户影响的情况、和不容易受到影响的情况。此种功能可以通过向第一信息处理子模块103a附加用户属性分析功能来实现。
第三类似子数据库107c中存储着多个文本数据。多个文本数据可以是预先准备的疑问句和对应的回应句的文本数据。这些文本数据可以是收集SNS上出现的文本数据中出现频率高的文本数据而得的数据。第三类似子数据库103c也如图7A说明的那样,将和疑问句对应的文本数据中类似的疑问句数据进行分组再存储到提问数据库,对应的回应句数据存储到回应数据库并进行关联。
像这样,类似数据库106优选层级化为:第一类似子数据库107a,所述第一类似子数据库107a中存储将第一用户的个人社交数据中提问和回答的内容类型化的数据;第二类似子数据库107b,所述第二类似子数据库107b中存储将多个用户的社交数据中提问和回答的内容类型化的数据;以及第三类似子数据库107c,所述第三类似子数据库107c中存储将文本数据中提问和回答的内容类型化的数据。
根据本实施方式,判断出多个提问可用相同回应回答时,将它们作为提问和回应的组合进行关联。这样的处理能节省存储容量,没有必要将提问和对应回应的所有组合都存储。还能快速地存取针对提问的回应。
进一步地,本实施方式涉及的人工智能系统100还可以具有以下功能,第一信息处理模块102a参考第二子数据库105b,判断多个用户的回答中相同内容多的情况下,就将针对此回答的提问事项自动追加到类似数据库106并进行更新。像这样,通过参考多个用户的社交数据来更新类似数据库,判断为类似的提问和回答的组合变得更恰当且更准确,可提高交流准确度。
5.评价系统创建的回答
人工智能系统100还可以具有评价模块,所述评价模块可以让作为本人的第一用户204及本人以外的第二用户206,评价并编辑人工智能系统100输出的针对提问的回答的内容、以及虚拟本人对事物的想到的图像。
图8表示人工智能系统100所含的评价及编辑模块114的功能构成。评价及编辑模块114是作为第一信息处理模块102a具有的部分功能而实现的。评价及编辑模块114包括评价模块115、编辑模块116和更新模块117。
评价模块115接受第一信息处理模块102a通过终端装置200a创建的发送给对话对象的回答的评价。评价模块115向第二用户206的终端装置200a提供评价信息。图9A表示终端装置200a的画面显示的一个例子。在评价用的画面上,会显示针对提问的回答的语言信息118、以及虚拟第一用户根据提问或回答的内容想到的图像信息120的其中一个或者两个的内容,还显示评价用按钮122。用户操作评价用按钮122进行评价。图9A表示评价用按钮122为“满意”、“不满意”二选一的形态,其它例子也可以是用户评分的形式。评价模块115从终端装置200a接收评价信息,并将评价结果关联回答后存储到第一子数据库105a。包括本人在内的所有用户都可以评价针对提问的回答。
第一用户204可以通过评价模块115获知回答的评价结果。评价模块115将评价结果显示在第一用户204的终端装置200b上。第一用户204可以参考评价结果,编辑针对提问的回答(虚拟第一用户204b作出的回答)的内容。比如,当回答评价低时或者作为本人的第一用户204不满意回答而想要修正时,可以使用所述编辑模式。
编辑模块116将编辑信息提供给第一用户204的终端装置200b。图9B中表示终端装置200b的画面显示的一个例子,此状态下显示虚拟第一用户204根据提问或回答的内容想到的图像信息120、修正候补的缩略图图像124、以及选择按钮126。第一用户204可以参考缩略图图像124选择其它图像,并操作选择按钮126,将编辑信息发送给编辑模块116。比如,针对当前设置的“苹果”图像,可以从作为其它候补显示的缩略图图像124中进行选择。更新模块117基于编辑信息,更新个性化模型数据库110a中存储的相应数据。本人可以编辑针对提问的回答。
图10表示人工智能系统100执行针对提问的回答的评价及编辑处理的流程。评价及编辑模块114将针对提问的回答显示在第一用户的终端装置200b上(S450)。评价及编辑模块114接收用户的评价结果(S452),并统计评价结果(S454)。也可以进行加权,将评价值正常或评价值高、或者评价值高于一定水准的回答设为优秀回答(S456、S458)。得到加权的回答有很高概率在下一次检索时被选择。
当回答评价值低时,会向第一用户204发出通知(S460),并将编辑画面提供给终端装置200b(S462)。收到通知的第一用户204对回答的内容进行编辑。评价及编辑模块114从第一用户的终端装置202b接收编辑数据(S464)。然后,评价及编辑模块114更新第一子数据库105a或个性化模型数据库110a中存储的数据(S468)。
对针对提问的回答的评价,示出了本人以外的其他用户对针对提问的回答进行评价、第一用户对针对提问的回答进行编辑这样的对立关系。不过,本发明的一个实施方式并不限定于此,第一用户也可以和人工智能系统100上生成的虚拟第一用户204b对话,执行自己提问、自己评价及编辑的处理。
通过这样的处理,第一用户204可以获知针对提问的回答的内容,对回答进行评价并编辑,从而能够而得到优秀回答。也就是说,可以让人工智能系统100上生成的虚拟第一用户204b进行学习。另外,第一用户204也可以浏览本人以外的其他用户评价针对提问的回答的结果,可以为了让评价值更高而进行编辑。
像这样,人工智能系统100可以供用户编辑提问和回复的关联数据,创建新的回复语句。这种情况下,用户可以和人工智能系统100上生成的虚拟自己对话,同时让人工智能功能进行学习,从而恰当地对提问进行回复。这种情况下,第一用户204可以和人工智能系统100上生成的虚拟第一用户204b对话,同时编辑针对提问的回答,让具有作为人工智能的功能的第一信息处理模块102a进行学习。
6.对话流程
图11表示人工智能系统100和用户的对话流程。用户(第一用户204或第二用户206)和人工智能系统100上生成的虚拟第一用户204b对话。此时,用户用某句话语向虚拟第一用户204b提问。询问时除了话语以外还可以组合图像。虚拟第一用户204b针对提问生成回答,向用户(第一用户204或第二用户206)作出回答。像这样反复进行,推进对话。此外,收到回答的用户(第一用户204或第二用户206)对回答的内容进行编辑。回答被编辑后,虚拟第一用户204b学习编辑内容。将学习结果累积到数据库104中。虚拟第一用户204b通过反复的学习,可以作出更恰当的回答,且回答的变化性也增加。
作为其它形态,如图12所示,可以从虚拟第一用户204b一侧发起对话。这种情况下,生成虚拟第一用户204b的主体即第一信息处理模块102a如图3及图5所示,按照第一子数据库105a、第二子数据库105b、第三子数据库105c的顺序,从过去的对话数据中按照优先顺序提取相当于“打招呼”的数据,作为发言的话语。虚拟第一用户204b的发言作为推送通知而显示在用户(第一用户204或第二用户206)的终端装置的显示画面上。这种情况下,终端装置200除了显示画面外还可以组合声音及/或振动。用户(第一用户204或第二用户206)回复虚拟第一用户204b的发话。收到回复的虚拟第一用户204b学习回复内容。将学习结果累积到数据库104中。虚拟第一用户204b通过这种反复的学习,可以作出更恰当的回答,且回答的变化性也增加。
图13表示虚拟第一用户204b和作为本人的第一用户204对话,并通过对话进行学习的一个例子。比如,虚拟第一用户204b向作为本人的第一用户204提问“喜欢什么运动”。相对于此,作为本人的第一用户204回答“虽然也喜欢棒球不过不管怎么说更喜欢篮球”时,虚拟第一用户204b对回答的内容进行学习。其它机会下,虚拟第一用户204b和作为其他人的第二用户206对话时,第二用户206提问“喜欢什么运动”,虚拟第一用户204b会回答“虽然也喜欢棒球不过不管怎么说更喜欢篮球”。通过这种反复的学习,虚拟第一用户204b变得更像本人,可以匹配本人个性地进行对话。
进一步地,根据本发明的一个实施方式,如果让创建人工智能系统100生成的虚拟用户的数据库104学习专业知识,就能通过该虚拟用户提供各种服务。这样的专业知识也可以是由相应用户从利用的SNS学到的知识。
比如,如果将自然科学、人文学、心理学、法律、金融、工学等各领域的专业知识的至少一个专业知识存储到生成虚拟用户的数据库中,虚拟用户就能在相应领域使用专业知识。另外,这种情况下,专业知识不仅仅是通过书籍等累积的统一化专业知识,优选包括社交网络上自然人对话中使用的专业知识的信息。通过包括这种对话型专业知识相关的信息,人工智能系统100在回答提问时就可以有益地活用各种专业知识。
另外,比如当第一用户希望掌握这样的专业知识时,可以让人工智能生成的虚拟第一用户掌握这些知识。这种情况下,虚拟第一用户并非仅仅是获取特定的专业知识,而是可以结合该第一用户的个性来灵活运用。比如,当第一用户具有医学领域的知识时,虚拟第一用户因其才能也具有医学领域的专业知识,若是虚拟第一用户还获取法律领域的专业知识,就能在法医学领域发挥能力。
这种情况下,如图3及图5所示,第一子数据库105a中存储的专业知识也可以用提问和回答(即Q&A)的形式存储。第一子数据库105a中存储的社交数据(知识)可以适时更新,且数据不会消失,因此,能不断增加知识量。
进一步地,若向存储着这种专业知识的第一子数据库105a反映存储着所有用户的社交数据的第二子数据库105b的信息以提高学习效果,就能输出更恰当的回答。
作为专业知识,可以对应司法、行政、医疗、环境、经济等匹配用户属性的各种领域的知识。也就是说,根据本发明的一个实施方式,可以匹配用户属性在交流提供系统上展现具有高级专业知识的虚拟个人,并向其他用户提供服务。
符号的说明
100 人工智能系统
102 信息处理模块
103 信息处理子模块
104 数据库
105 子数据库
106 类似数据库
107 类似子数据库
108 个性化模块
109 一般化模块
110a 个性化模型数据库
110b 一般化模型数据库
110c 一般图像数据库
112 类似提问数据库
113 类似回答数据库
114 评价及编辑模块
115 评价模块
116 编辑模块
117 更新模块
118 语言信息
120 图像信息
122 评价用按钮
124 缩略图图像
126 选择按钮
200 终端装置
202 多个用户
204 第一用户
206 第二用户
300 社交网络服务(SNS)

Claims (12)

1.一种人工智能系统,所述人工智能系统具有:
第一信息处理模块,所述第一信息处理模块基于登录到一个或多个社交网络服务的第一用户的社交数据,生成语言相关的数据;
第二信息处理模块,所述第二信息处理模块基于登录到一个或多个社交网络服务的所述第一用户的社交数据,生成图像相关的数据;
第一数据库,所述第一数据库中存储所述第一用户的社交数据、以及登录到所述一个或多个社交网络服务的其他用户的社交数据;
其中所述第二信息处理模块包括:个性化模块,所述个性化模块基于第一用户的社交数据,由运算处理装置通过机器学习来生成适合所述第一用户的个性化模型;以及一般化模块,所述一般化模块中输入所述其他用户的社交数据作为学习数据,由运算处理装置生成通过机器学习来建模的一般化模型;
第二数据库,所述第二数据库中存储由所述个性化模块创建的个性化模型、由所述一般化模块创建的一般化模型、以及存储着从因特网爬取到的图像数据的一般图像数据库;
所述人工智能系统利用所述第一信息处理模块和所述第二信息处理模块,在计算机上生成相对于所述第一用户的虚拟第一用户。
2.根据权利要求1所述的人工智能系统,其中所述第一数据库包括:第一子数据库,所述第一子数据库中存储所述第一用户的社交数据;第二子数据库,所述第二子数据库中存储所述其他用户的社交数据;以及第三子数据库,所述第三子数据库中存储所述第一信息处理模块从因特网爬取到的数据。
3.根据权利要求2所述的人工智能系统,其中所述第一信息处理模块读取数据库中记录的至少一部分信息,由运算处理装置从所述第一数据库中存储的数据中推理并生成针对提问的恰当的回答。
4.根据权利要求1所述的人工智能系统,其中所述第二信息处理模块读取所述第二数据库中存储的数据,将所述虚拟第一 用户对事物或事件想到的印象图像化。
5.根据权利要求3所述的人工智能系统,其包括类似数据库,所述类似数据库将类似的提问作为类似提问进行分组,并和所述类似提问对应的回答建立对应后存储,所述第一信息处理模块从所述类似数据库中选择所述提问的回答。
6.根据权利要求5所述的人工智能系统,其中所述类似数据库包括:类似提问数据库,所述类似提问数据库对类似提问内容进行分组并记录;及类似回答数据库,所述类似回答数据库中存储所述类似提问对应的回答。
7.根据权利要求6所述的人工智能系统,其中所述类似数据库层级化为:第一类似子数据库,所述第一类似子数据库中存储从所述第一用户的社交数据中将提问和回答的内容类型化的数据;第二类似子数据库,所述第二类似子数据库中存储从多个用户的社交数据中将提问和回答的内容类型化的数据;及第三类似子数据库,所述第三类似子数据库中存储从文本数据中将提问和回答的内容类型化的数据。
8.根据权利要求1所述的人工智能系统,其中所述第二信息处理模块通过深度学习而生成所述个性化模型和所述一般化模型。
9.根据权利要求1所述的人工智能系统,其利用所述第一信息处理模块和所述第二信息处理模块在计算机上生成的所述虚拟第一用户,与所述第一用户及所述第一用户以外的其他用户对话。
10.根据权利要求9所述的人工智能系统,其包括评价模块,所述评价模块由所述第一用户及所述其他用户评价所述虚拟第一用户的回答的内容。
11.根据权利要求10所述的人工智能系统,其中所述评价模块将所述虚拟第一用户的回答的内容的评价结果通知给所述第一用户。
12.根据权利要求11所述的人工智能系统,其包括:编辑模块,所述编辑模块由收到所述评价模块通知的第一用户编辑所述虚拟第一用户的回答的内容;及更新模块,所述更新模块基于用所述编辑模块编辑的内容,来更新所述虚拟第一用户的回答的内容。
CN201780037483.4A 2016-06-16 2017-06-15 支持交流的人工智能系统 Active CN109416816B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016-119697 2016-06-16
JP2016119697A JP6753707B2 (ja) 2016-06-16 2016-06-16 コミュニケーションを支援する人工知能システム
PCT/JP2017/022185 WO2017217507A1 (ja) 2016-06-16 2017-06-15 コミュニケーションを支援する人工知能システム

Publications (2)

Publication Number Publication Date
CN109416816A CN109416816A (zh) 2019-03-01
CN109416816B true CN109416816B (zh) 2022-03-08

Family

ID=60663765

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780037483.4A Active CN109416816B (zh) 2016-06-16 2017-06-15 支持交流的人工智能系统

Country Status (4)

Country Link
US (1) US11526720B2 (zh)
JP (1) JP6753707B2 (zh)
CN (1) CN109416816B (zh)
WO (1) WO2017217507A1 (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019056970A (ja) * 2017-09-19 2019-04-11 カシオ計算機株式会社 情報処理装置、人工知能選択方法及び人工知能選択プログラム
WO2019160152A1 (ja) * 2018-02-19 2019-08-22 Arithmer株式会社 対話管理サーバ、対話管理方法、及びプログラム
KR102185369B1 (ko) * 2018-03-28 2020-12-01 삼성전자주식회사 사용자와의 대화를 위한 정보를 생성하는 시스템 및 방법
JP6429347B1 (ja) * 2018-05-18 2018-11-28 豊 川口 視界表示システムおよび移動体
JP7026032B2 (ja) * 2018-10-19 2022-02-25 Kddi株式会社 レコメンドシステム及びレコメンド方法
JP7321704B2 (ja) * 2018-12-27 2023-08-07 キヤノンメディカルシステムズ株式会社 医用情報処理装置、医用情報処理システムおよびx線診断装置
BR112021010468A2 (pt) * 2018-12-31 2021-08-24 Intel Corporation Sistemas de segurança que empregam inteligência artificial
CN109918525B (zh) * 2019-03-12 2023-07-04 同济大学 基于微信小程序的食物图片美学分析标签数据收集系统
JP2020154378A (ja) * 2019-03-18 2020-09-24 本田技研工業株式会社 自己との対話装置、チャットボット、およびロボット
JP7290977B2 (ja) * 2019-03-28 2023-06-14 株式会社日本総合研究所 プログラム及び情報処理装置
JP7307576B2 (ja) * 2019-03-28 2023-07-12 株式会社日本総合研究所 プログラム及び情報処理装置
JP7418975B2 (ja) * 2019-06-07 2024-01-22 株式会社日本総合研究所 情報処理装置
US11841867B2 (en) 2019-08-09 2023-12-12 International Business Machines Corporation Query relaxation using external domain knowledge for query answering
JP6967041B2 (ja) * 2019-08-20 2021-11-17 株式会社Cygames 画像認識モデルを用いた識別子情報推論のための電子装置、方法、プログラム及びシステム
CN112669177A (zh) * 2019-10-16 2021-04-16 北京三好互动教育科技有限公司 一种提问人数统计方法和装置
JP2021096711A (ja) 2019-12-18 2021-06-24 富士通株式会社 情報処理プログラム、情報処理方法および情報処理装置
KR102449948B1 (ko) * 2020-02-12 2022-10-05 한국과학기술원 지능형 에이전트에서 이종의 멘탈 모델에 기반한 대화형 메시지 제공 방법 및 그 시스템
CN111696180A (zh) * 2020-05-06 2020-09-22 广东康云科技有限公司 一种虚拟仿真人的生成方法、系统、装置和存储介质
KR102493280B1 (ko) * 2020-10-15 2023-02-01 (주)에픽랩 사용자 데이터를 이용한 인공지능 캐릭터 생성 서버 및 방법과 이를 이용한 헬스케어 방법
JP2021086618A (ja) * 2020-10-26 2021-06-03 有限会社クロマニヨン 仮想人物対話システム、映像生成方法、映像生成プログラム
JP2022093814A (ja) * 2020-12-14 2022-06-24 株式会社サイシード チャットシステムおよびチャットプログラム
KR102548641B1 (ko) * 2021-01-04 2023-06-27 주식회사 카카오 대화형 게임에서 대화셋을 제공하는 방법
US20220301250A1 (en) * 2021-03-17 2022-09-22 DMLab. CO., LTD Avatar-based interaction service method and apparatus
JP7462368B1 (ja) 2023-11-21 2024-04-05 Spiral.AI株式会社 プログラム、コンピュータ、システムおよび情報処理方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005196356A (ja) * 2004-01-05 2005-07-21 Nec Corp 擬似人格対話システム、方法、およびプログラム
CN100423420C (zh) * 2002-07-08 2008-10-01 皇家飞利浦电子股份有限公司 电子电路,用于存储和读取信息的介质及相应的设备
JP2013210792A (ja) * 2012-03-30 2013-10-10 Hitachi Solutions Ltd 授業質問回答システム
JP2013214127A (ja) * 2012-03-30 2013-10-17 Dainippon Printing Co Ltd サーバ装置、プログラム及び通信システム
JP2014137706A (ja) * 2013-01-16 2014-07-28 Dainippon Printing Co Ltd サーバ装置、プログラム及び通信システム
CN104270348A (zh) * 2014-09-17 2015-01-07 深圳市多彩人生技术有限公司 社交网络同一账号的多角色实现方法、切换方法及系统
CN105144286A (zh) * 2013-03-14 2015-12-09 托伊托克有限公司 用于交互的虚拟人物对话的系统和方法
CN105229687A (zh) * 2013-03-15 2016-01-06 格林伊登美国控股有限责任公司 用于呼叫中心的智能自动代理

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4266144B2 (ja) 2003-09-17 2009-05-20 株式会社リコー 電子コミュニケーション装置、電子コミュニケーションシステム、電子コミュニケーション方法、その方法をコンピュータに実行させるプログラム、およびそのプログラムを格納した記憶媒体
JP5751610B2 (ja) 2010-09-30 2015-07-22 学校法人早稲田大学 会話ロボット
US20130080287A1 (en) * 2011-09-19 2013-03-28 Sdi Technologies, Inc. Virtual doll builder
US20140019443A1 (en) * 2012-07-10 2014-01-16 Venor, Inc. Systems and methods for discovering content of predicted interest to a user
US20150058417A1 (en) * 2013-08-20 2015-02-26 Salesforce.Com, Inc. Systems and methods of presenting personalized personas in online social networks
JP6200392B2 (ja) * 2014-09-05 2017-09-20 日本電信電話株式会社 情報提示装置および情報提示プログラム
US9563659B2 (en) * 2014-10-06 2017-02-07 International Business Machines Corporation Generating question and answer pairs to assess understanding of key concepts in social learning playlist
JP6502965B2 (ja) * 2014-12-26 2019-04-17 株式会社オルツ コミュニケーション提供システム及びコミュニケーション提供方法
JP6239558B2 (ja) * 2015-06-22 2017-11-29 任天堂株式会社 情報処理システム、情報処理装置、プログラムおよび情報処理装置の制御方法
US10002292B2 (en) * 2015-09-30 2018-06-19 Microsoft Technology Licensing, Llc Organizational logo enrichment
US20180018562A1 (en) * 2016-07-14 2018-01-18 Cside Japan Inc. Platform for providing task based on deep learning
US10782986B2 (en) * 2018-04-20 2020-09-22 Facebook, Inc. Assisting users with personalized and contextual communication content
US11176472B2 (en) * 2018-05-22 2021-11-16 International Business Machines Corporation Chat delta prediction and cognitive opportunity system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100423420C (zh) * 2002-07-08 2008-10-01 皇家飞利浦电子股份有限公司 电子电路,用于存储和读取信息的介质及相应的设备
JP2005196356A (ja) * 2004-01-05 2005-07-21 Nec Corp 擬似人格対話システム、方法、およびプログラム
JP2013210792A (ja) * 2012-03-30 2013-10-10 Hitachi Solutions Ltd 授業質問回答システム
JP2013214127A (ja) * 2012-03-30 2013-10-17 Dainippon Printing Co Ltd サーバ装置、プログラム及び通信システム
JP2014137706A (ja) * 2013-01-16 2014-07-28 Dainippon Printing Co Ltd サーバ装置、プログラム及び通信システム
CN105144286A (zh) * 2013-03-14 2015-12-09 托伊托克有限公司 用于交互的虚拟人物对话的系统和方法
CN105229687A (zh) * 2013-03-15 2016-01-06 格林伊登美国控股有限责任公司 用于呼叫中心的智能自动代理
CN104270348A (zh) * 2014-09-17 2015-01-07 深圳市多彩人生技术有限公司 社交网络同一账号的多角色实现方法、切换方法及系统

Also Published As

Publication number Publication date
JP2017224190A (ja) 2017-12-21
CN109416816A (zh) 2019-03-01
US11526720B2 (en) 2022-12-13
JP6753707B2 (ja) 2020-09-09
WO2017217507A1 (ja) 2017-12-21
US20190122093A1 (en) 2019-04-25

Similar Documents

Publication Publication Date Title
CN109416816B (zh) 支持交流的人工智能系统
JP6502965B2 (ja) コミュニケーション提供システム及びコミュニケーション提供方法
US10585901B2 (en) Tailoring question answer results to personality traits
CN112328849B (zh) 用户画像的构建方法、基于用户画像的对话方法及装置
CN110476169B (zh) 在会话中提供情感关怀
US20200035227A1 (en) Dynamically generated dialog
Batliner et al. Ethics and good practice in computational paralinguistics
US10770072B2 (en) Cognitive triggering of human interaction strategies to facilitate collaboration, productivity, and learning
Joseph et al. When do word embeddings accurately reflect surveys on our beliefs about people?
US20220351716A1 (en) System and method for a personalized dialogue system using knowledge-based entity services
CN112364234A (zh) 一种在线讨论的自动分组系统
CN111857343B (zh) 一种能部分实现数字永生并可与用户交互的系统
JP6831522B2 (ja) コミュニケーションシステム
Sharif et al. Vision to language: Methods, metrics and datasets
Elvir et al. Remembering a conversation–a conversational memory architecture for embodied conversational agents
Breuing et al. Let’s Talk Topically with Artificial Agents!-Providing Agents with Humanlike Topic Awareness in Everyday Dialog Situations
Lawson et al. Saying more than we know: How language provides a window into the human psyche.
CN112115231A (zh) 一种数据处理方法及装置
US20240037339A1 (en) Domain-specific named entity recognition via graph neural networks
US20230094459A1 (en) Data modeling for virtual collaboration environment
Lai et al. Cultural Differences Demonstrated by TV Series: A Cross-Cultural Analysis of Multimodal Features
Kelcher Anonymity and Imitation in Linguistic Identity Disguise
Tigunova Extracting personal information from conversations
Xueming et al. Application of Emotional Voice user Interface in Securities Industry
Orujova et al. Personalizing Human-Robot Dialogue Interactions using Face and Name Recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40003637

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant