CN107292696B - 一种汽车智能导购系统以及实现方法 - Google Patents
一种汽车智能导购系统以及实现方法 Download PDFInfo
- Publication number
- CN107292696B CN107292696B CN201710289245.4A CN201710289245A CN107292696B CN 107292696 B CN107292696 B CN 107292696B CN 201710289245 A CN201710289245 A CN 201710289245A CN 107292696 B CN107292696 B CN 107292696B
- Authority
- CN
- China
- Prior art keywords
- scene
- module
- data
- processing module
- shopping guide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- User Interface Of Digital Computer (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种汽车智能导购系统以及实现方法,系统包括:语义分析模块和人工处理模块,所述语义分析模块,用以对输入内容进行意图识别和实体抽取,所述意图识别用以识别输入内容是否满足预置意图,所述实体抽取用以获取输入内容中的关联信息,所述场景处理模块,用以建立一可触发嵌套场景,并在所述可触发嵌套场景中根据不同意图切换场景。采用本发明中的方法,能够主动保存该场景中的数据,直接切换到新的场景。这样一来使得用户获取信息的效率更高,同时也使得对话更加自然、对话更加拟人。此外,本发明通过场景切换的方式,能够使得对话更加流畅,在导购时能够最大化地获取用户的偏好,从而更好地做出更加令人满意的推荐。
Description
技术领域
本发明涉及人工智能技术领域和计算机领域,特别涉及一种汽车智能导购系统以及实现方法。
背景技术
智能导购系统是指基于WEB平台的个性化导购系统,以客户的需求为基础,使系统能够模拟和识别用户的情绪和感觉为目标所行的人机情感交互实践,系统通过特定的后台智能算法抓住顾客个性化的思维方式、喜好特点和生理特征,并以此为依据模拟顾客身份进行商品的自动选购,推荐到前台,从而实现个性化的导购服务。
聊天机器人,聊天机器人(chatbot)是一个用来模拟人类对话或聊天的程序。此外,研发者通过将大量网络流行的俏皮语言加入词库,当用户发送的词组和句子被词库识别后,程序将通过算法把预先设定好的回答回复给用户。
现有技术中有如下的缺陷:
针对市场上有众多不同品牌、用途各异的汽车,而汽车本身又有众多复杂参数和功能,一般消费者无法全面地了解到汽车的性能、汽车购买需求以及在接收价位内的汽车都可以包括哪些,比如,四驱、是否为手动挡/自动挡、是否为一家人使用、价位是否在10万-20万范围内。现有技术中没有针对汽车的智能导购系统。
针对现有的聊天机器人大多是闲聊机器人,采用一问一答的方式,无法解决一些需要上下文联系以及针对性、专业性等的复杂问题。同时,经过调研发现,基于该种聊天机器人的智能导购,通常会在没有获取到足够的用户偏好的情况下就做出推荐,结果并不能令人满意。此外,现有的聊天机器人往往无法很好的处理场景切换问题,比如针对如下的对话:
用户A:帮我选个20万左右车。
导购系统:请问您要轿车还是SUV。
用户A:什么是SUV?
针对上述的场景,一般导购系统或者聊天机器人系统,无法识别新的问题,或者,在识别出新问题后,丢弃之前场景保存的数据(上面例子中的20万左右车)直接切换到新的场景。造成了很多不方便。现有技术中有一些解决的方式,比如,中国专利申请CN201510541053.9专柜商品在线交易系统及交易方法,专柜商品线上交易系统包括找店模块、有货模块、优惠模块、聊天模块、订单管理模块、个人中心模块和云服务模块;通过有货模块和找店模块选择和查看感兴趣的待购商品,并通过优惠模块获取所述待购商品的优惠信息,通过聊天模块与导购沟通获取新品和促销信息并进一步确定待购商品的商品信息;通过订单管理模块创建待购买商品的订单并选择支付方式进行付款、收货确认和评价;通过个人中心模块对所创建的待购商品的购买订单和收获地址进行管理和对收获后的商品进行评价;云服务模块用于提供在待购商品交易过程中的数据存储和交互。缺点明显:聊天模块仅仅能够满足简单的咨询,无法进行场景的切换。又比如,中国专利申请CN201510359363.9基于人工智能的人机智能聊天的方法和装置,方法包括:接收多模态的输入信号,所述多模态的输入信号包括语音信号、图像信号、传感器信号和/或事件驱动信号;对所述多模态的输入信号进行处理,获得文本数据,并根据所述文本数据获得用户的意图;获得所述用户的意图对应的答案,将所述答案转化为多模态的输出信号;输出所述多模态的输出信号。发明中可以对用户需求进行精确匹配,给出更精确更个性化的回复,可以更自然地进行人机智能聊天。缺点在于:缺少对于对话场景的处理和语义的关联。
发明内容
本发明要解决的技术问题是,提供使得用户获取信息的效率更高,同时也使得对话更加自然、对话更加拟人的汽车智能导购系统。
解决上述技术问题,本发明提供了一种汽车智能导购系统,包括:语义分析模块和场景处理模块,
所述语义分析模块,用以对输入内容进行意图识别和实体抽取,所述意图识别用以识别输入内容是否满足预置意图,所述实体抽取用以获取输入内容中的关联信息,
所述场景处理模块,用以建立一可触发嵌套场景,并在所述可触发嵌套场景中根据不同意图切换场景。
更进一步,所述场景处理模块包括:场景嵌套处理模块和场景上下文处理模块,
所述场景上下文处理模块,用以判断当前输入内容否触发新的场景,若触发新场景,则将判断结果输入所述场景嵌套处理模块,
所述场景嵌套处理模块,用以保存当前场景嵌套结构以及场景的上下文数据作为外层场景,同时建立新场景并将所述新场景作为当前场景直到在所述新场景中完成目标后退出当前场景返回至上一层的外层场景,
以及,当前场景为可退出状态并且外层有场景未处理结束,则将外层场景作为当前场景继续处理。
更进一步,系统还包括:人工处理模块,用以作为人工处理的接口,通过人工定义意图和/或实体数据,并作为初始训练数据保存后台数据库。
更进一步,系统还包括:检索推荐模块,用以根据不同的场景,使用对应场景中收集的数据进行回答的检索和/或推荐,
所述检索推荐模块至少包括:选择收敛场景和/或常识问答场景。
更进一步,系统还包括:数据支持模块,所述数据支持模块至少包括:业务数据支持模块,领域知识数据支持模块以及AI训练数据模块,
所述业务数据支持模块,用以作为根据业务逻辑设定的数据接口,
所述领域知识数据支持模块,用以作为领域知识数据的第三方API接口,
所述AI训练数据模块,用以作为AI训练数据的第三方API接口。
更进一步,系统还包括:输入输出模块,用以接收用户的输入信息/接收输出反馈。
优选地,所述实体抽取进一步包括:中文分词、词性标注、依存句法分析、word2vec、正则匹配、情感分析中的一种或者多种方式。
更进一步,所述意图识别进一步包括:
将TF-IDF、word2vec扩展词或者sentence2vec作为训练特征,
训练一个基于迭代的决策树算法的softmax互斥多分类模型,
通过所述互斥多分类模型判断识别输入内容是否满足预置意图。
基于上述本发明还提供了一种汽车智能导购方法,包括如下步骤:
对用户的输入内容进行意图识别和实体抽取,所述意图识别用以识别输入内容是否满足预置意图,所述实体抽取用以获取输入内容中的关联信息,
建立一可触发嵌套场景,并在所述可触发嵌套场景中根据不同意图切换场景,
根据不同的场景,使用对应场景中收集的数据为用户检索和/或推荐,输出导购结果。
更进一步,在所述可触发嵌套场景至少包括:当前场景或外层场景,
从当前场景开始当接收到用户输入时,在所述可触发嵌套场景中判断所述用户输入的意图是否会触发新的场景,若没有触发新场景,则按照当前场景处理;
若触发了新的场景,则保存当前场景嵌套结构以及场景的上下文数据,同时将新场景成为当前场景;
若当前场景为可退出状态,并且有外层场景未处理结束,则将外层场景作为当前场景继续处理;
上述每一个场景中在目标达成时则退出当前场景。
本发明的有益效果:
1)本发明中的语义分析模块,能够对用户的输入内容进行意图识别和实体抽取,根据分析得到的语义进行场景归纳,通过场景处理模块,建立可触发嵌套场景,并且可以在所述可触发嵌套场景中根据不同意图切换场景。通过嵌套场景能够识别用户在问答过程中的新问题同时在识别出新问题后,能够主动保存该场景中的数据,直接切换到新的场景。这样一来使得用户获取信息的效率更高,同时也使得对话更加自然、对话更加拟人。
2)在本发明中通过嵌套场景和全面的语义分析方式,通过场景切换的方式,能够使得对话更加流畅,在导购时能够最大化地获取用户的偏好,从而更好地做出更加令人满意的推荐。
附图说明
图1是本发明一实施例中的系统结构示意图;
图2是本发明一优选实施例中的系统结构示意图;
图3是图1中的嵌套场景原理示意图;
图4是图1中的嵌套场景逻辑处理关系示意图;
图5是本发明一实施例中的方法流程示意图;
图6是本发明一优选实施例中的方法流程示意图。
具体实施方式
现在将参考一些示例实施例描述本公开的原理。可以理解,这些实施例仅出于说明并且帮助本领域的技术人员理解和实施例本公开的目的而描述,而非建议对本公开的范围的任何限制。在此描述的本公开的内容可以以下文描述的方式之外的各种方式实施。
如本文中所述,术语“包括”及其各种变体可以被理解为开放式术语,其意味着“包括但不限于”。术语“基于”可以被理解为“至少部分地基于”。术语“一个实施例”可以被理解为“至少一个实施例”。术语“另一实施例”可以被理解为“至少一个其它实施例”。
图1是本发明一实施例中的系统结构示意图,一种汽车智能导购系统,包括:语义分析模块100和场景处理模块300,所述语义分析模块100,用以对输入内容进行意图识别和实体抽取,所述意图识别用以识别输入内容是否满足预置意图,所述实体抽取用以获取输入内容中的关联信息,所述场景处理模块300,用以建立一可触发嵌套场景,并在所述可触发嵌套场景中根据不同意图切换场景。在本实施例中的核心模块在于语义分析模块100和场景处理模块300,在本实施例中的所述语义分析模块100主要用以做意图识别和/或实体抽取工作。其中,意图是指针对预先定义好的意图,每个意图可以对应多个语句,根据当前语句推断出当前用户的意图。实体抽取是指从用户的输入内容中获得相应的信息,比如,价位、品牌、颜色、外观、类型等等。上述用户的输入内容包括但不限于,文字输入和语音输入,若为语音输入,则还包括语义分析环节。本领域技术人员能够明了,文字输入包括但不限于,中文、英文以及繁体中文。语义分析可包括但不限于,分词词性、情感分析、实体识别、依存文法、关键词提取、新闻分类、语义联想、文本聚类以及典型意见。此外,针对汽车导购中的特殊场景,上述情感分析包括:正面和负面两类,从而提高对情感分析的准确度,并提供对话长度级别的分析能力。所述场景处理模块300,对于在聊天过程中多个输入语句很可能都是同一个目的,故将这些在同一个目的下的对话设定为在一个场景中。在本实施例中的场景处理模块300中可触发嵌套场景包括但不限于一个场景可以被多种意图触发。同时,在同一场景下,所有的对话都是为了达成场景目的,如果用户给的信息不足以达成目的则所述场景处理模块300会进行询问以获取数据,之后再判断场景信息是否充足。在本实施例中场景处理模块300中的嵌套系统能够很好的解决丢弃对话场景的问题,比如:
用户:帮我选个20万左右车。
本智能导购系统:请问您要轿车还是SUV。
用户:什么是SUV?
本智能导购系统:SUV就是一种XXX。
用户:哦,那我想要SUV
本智能导购系统:【给出推荐】(20万左右SUV)
由上可见场景处理模块300能够保留当前的上下文数据和当前场景嵌套结构,同时在新场景中完成目标后会退出当前场景并返回至上一层的外层场景(也即保留的当前场景嵌套结构)。
通过所述场景处理模块300的嵌套场景和所述语义分析模块100的全面的语义分析方式:通过场景切换的方式,能够使得对话更加流畅,在进行汽车导购时能够最大化地获取用户的偏好,从而更好地做出更加令人满意的推荐。
如图2所示,作为本实施例中的优选,所述场景处理模块300包括:场景嵌套处理模块3001和场景上下文处理模块3002,所述场景上下文处理模块3002,用以判断当前输入内容否触发新的场景,若触发新场景,则将判断结果输入所述场景嵌套处理模块,所述场景嵌套处理模块3001,用以保存当前场景嵌套结构以及场景的上下文数据作为外层场景,同时建立新场景并将所述新场景作为当前场景直到在所述新场景中完成目标后退出当前场景返回至上一层的外层场景,以及,当前场景为可退出状态并且外层有场景未处理结束,则将外层场景作为当前场景继续处理。具体而言,如图3所示,为本实施例中的一种类型的场景嵌套结构的示意图,场景上下文处理模块3002能够将判断的结果输入至所述场景嵌套处理模块3001,在所述场景嵌套处理模块3001中将保存当前场景嵌套结构以及场景的上下文数据作为外层场景,同步建立新的对话场景。
划分场景之后,场景之间的切换,嵌套关系就需要一个处理方式,具体的逻辑处理关系可参考图4,具体包括如下步骤:
步骤S401保存场景数据作为外层场景,将新场景成为当前场景进入步骤S407,
步骤S402判断当前场景可推出?若否则返回步骤S401,若是则进入步骤S407;
步骤S403判断输入,若为一般输入,则进入步骤S405,若为推出场景命令,则进入步骤S404;
步骤S404判断有无外层场景?若无则进入步骤S406,若有则进入步骤S408;
步骤S405处理当前场景,
步骤S406不处理,
步骤S407当前场景,
步骤S408替换场景数据,并输入至步骤S407;完成后进入步骤S409;
步骤S409场景可退回,
步骤S410有无外层场景,若有则进入步骤S408,若无则进入步骤S411;
步骤S411不处理。
综上,操作步骤为从当前场景开始,当接收到用户输入时,首先判断这个输入的意图是否会触发新的场景,如果没有触发新场景,则按照当前场景处理。如果触发了新的场景,则保存当前场景嵌套结构以及场景的上下文数据,新场景成为当前场景。每一个场景在目标达成时则可以退出当前场景。如果当前场景为可退出状态,并且外层有场景未处理结束,则会将外层场景作为当前场景,继续处理。
请参考图2,作为本实施例中的优选,智能推荐系统还包括:人工处理模块200,用以作为人工处理的接口,通过人工定义意图和/或实体数据,并作为初始训练数据保存后台数据库。由于人工智能需要大量的训练数据,所以初期在训练数据不足的情况下意图识别与实体抽取有一定的几率不正确,对于这种情况在本实施例中增加了人工处理模块200,能够对于每一次的意图识别和实体抽取,都可以选择人工干预,将人工给出的意图和实体数据输送到下一个步骤,同时作为训练数据保存到数据库,更好的优化人工智能的准确性。
在一些实施例中,人工处理模块200可以是第三方的API接口。
在一些实施例中,人工处理模块200可以是人工查询窗口。
在一些实施例中,人工处理模块200可以是人工上传窗口。
在一些实施例中,人工处理模块200可以是专家数据库API接口。
在一些实施例中,人工处理模块200可以是汽车资讯数据API接口。
请参考图2,作为本实施例中的优选,智能推荐系统还包括:检索推荐模块500,用以根据不同的场景,使用对应场景中收集的数据进行回答的检索和/或推荐,所述检索推荐模块至少包括:选择收敛场景和/或常识问答场景。在本实施例中的检索推荐模块500能够根据不同的场景,使用场景中收集的数据进行回答的检索和推荐符合条件的内容。优选地,检索推荐模块分为有两类场景,分别称为选择收敛场景与常识问答场景。还可以根据业务的细分程度扩充场景的种类。
在本实施例中选择收敛场景定义为一个场景,其中“选车”意图可以触发该场景,比如:
●用户:我想买车(此时识别为“选车”意图,并进入选择收敛场景)
●本智能导购系统:请问您想要什么价位的车呢?(进入场景后收集场景所需信息)
●用户:15万左右
●本智能导购系统:请问您想要什么类型的车呢?
●用户:轿车吧
●本智能导购系统:【给出推荐】(收集到足够信息,给出推荐结果)
使用场景来处理用户需求还有如下好处:用户可以通过仅仅改变场景信息中的某个信息就可以获取不同的结果,又比如:
●用户:15万的suv有哪些?
●本智能导购系统:【给出推荐】(此时推荐了一款日系车)。
●用户:不想要日本车
●本智能导购系统:【给出推荐】(推荐了一款其它国别的15万左右的suv)
采用上述的选择收敛场景,使得用户获取信息的效率更高,同时也使得对话更加自然,拟人。
作为本实施例中的优选,采用选择收敛场景中的推荐方法,具体而言,在用户在选购汽车的过程中,有一些要求是确定的:例如价格范围,变速箱类型等。还有一些很难界定的需求,比如外观好看,动力强等需求。根据不同的需求类型,在本实施例中将汽车属性分为硬属性和感性条件两种,硬属性对应用户确定的要求,感性条件对应用户的感性需求。
其中,硬属性包括但不限于:{品牌,价格,车级别,品牌国别,厂商类型,能源类型,变速箱类型,排量,车身类型,以及高级配置等。感性条件总结为:外观,内饰,动力,操控,舒适度}等数个维度。
首先根据用户的确定需求进行数据检索,然后将检索出的数据按照以下方式处理:
本实施例中的导购系统在与用户聊天的过程中,根据用户的反馈,会给用户对于感性条件的要求一个预期值(权重),取值范围为0-5,例如:
外观 | 内饰 | 动力 | 操控 | 舒适度 | |
User(用户) | 4.5 | 3.5 | 5.0 | 3.8 | 2.6 |
而对于车来说,系统的口碑库中保存着基于大量用户评分得出的口碑数据,评分取值范围为0-5例如:
外观 | 内饰 | 动力 | 操控 | 舒适度 | |
Car(车) | 4.3 | 3.5 | 3.9 | 4.2 | 2.8 |
此外,由于消费者的跟风心理,同时将车的流行程度P也加入考虑因素。
得出购买意愿W=S+kP,其中k为权重值。将检索出的数据按照W由大到小进行排序,并将前n条记录推荐给用户。
在一些实施例中,所述预期值/口碑数据包括但不限于,外观、内饰、动力、操控以及舒适度。
在一些实施例中,流行程度P的权重可调节,调节方式包括但不限于,互联网推荐(热搜)内容。
请参考图2,作为本实施例中的优选,智能推荐系统还包括:数据支持模块400,所述数据支持模块400至少包括:业务数据支持模块,领域知识数据支持模块以及AI训练数据模块,
所述业务数据支持模块,用以作为根据业务逻辑设定的数据接口,
所述领域知识数据支持模块,用以作为领域知识数据的第三方API接口,
所述AI训练数据模块,用以作为AI训练数据的第三方API接口。
在本实施例中的数据支持模块400包括但不限于:含业务数据支持,领域知识数据支持,和AI训练数据。其中业务数据用来支撑系统业务流程所需数据。
优选地,在本实施例中的领域知识数据支持模块的领域知识数据包括但不限于如下数据:
{汽车基础数据}包括但不限于,每一个车款的参数配置,车型,品牌,制造地,排量等基本信息。
{汽车百科数据},包括但不限于,包含汽车常用知识,汽车相关定义等。
{汽车资讯数据},包括但不限于,存储行业资讯。
{汽车口碑数据},包括但不限于,获得用户对于每个具体车型的综合评价和空间、动力、外观、内饰和操控等某一项的具体评价,以及汽车使用感受等。
优选地,在本实施例中的AI训练数据模块的AI训练数据包括但不限于,{来自互联网的汽车领域相关文本数据}、{来自搜索引擎的点击日志数据}、{领域知识数据}。
在一些实施例中,所述AI训练数据模块包括但不限于,最小二乘法(OrdinaryLeast Square),逻辑回归(Logistic Regression),决策树(Decision Tree),神经网络(Neural Networks),k-近邻(kNN)算法。
请参考图2,作为本实施例中的优选,智能推荐系统还包括:输入输出模块,用以接收用户的输入信息/接收输出反馈,其中用户的输入信息可以是语音或者文字,其中语音会被解释成文字作进一步处理。
在一些实施例中,通过第三方SDK,识别语音。
作为本实施例中的优选,所述语义分析模块100中的实体抽取进一步包括:中文分词、词性标注、依存句法分析、word2vec、正则匹配、情感分析中的一种或者多种方式。实体抽取是指从用户的输入中获得相应的信息。例如,
●用户输入,我想看看15万到20万的车。
●则可以抽取信息:价格区间为15-20万。
在一些实施例中,上述的中文分词,包括但不限于将一个汉字序列切分成一个个单独的词。
在一些实施例中,上述的词性标注,包括但不限于对分词结果中的每个单词标注一个正确的词性,也即确定每个词是名词、动词、形容词或其他词性。
在一些实施例中,上述的依存句法分析,包括但不限于通过分析语言单位内成分之间的依存关系揭示其句法结构。所述依存句法分析识别句子中的“主谓宾”、“定状补”这些语法成分,并分析各成分之间的关系。
在一些实施例中,上述的Word2vec是Google在2013年年中开源的一款将词表征为实数值向量的高效工具,其利用了深度学习的思想。优选地,本实施例中的Word2vec模型自收集的各类汽车资讯7GB,包含11.9+亿词,145+万不同词训练自定义word2vec模型,模型可进行不断更新。
在一些实施例中,上述的正则匹配,包括但不限于可以用来找出符合某个模式的文本。
在一些实施例中,上述的情感分析,包括但不限于通过大量的聊天样本以及描述语言样本,总结出了一份汽车描述词的感情强烈度表。优选地,描述外观的语句以及对应的外观得分:
表1
外观描述 | 对应得分 |
普通 | 3.5 |
酷炫 | 4.5 |
无所谓 | 2.5 |
在一些实施例中,上述的中文分词,包括但不限于词性标注以及依存句法分析,优选地采用开源的HanLP语言处理工具包,结合自定义的词库以及规则。
作为本实施例中的优选,所述实体抽取的流程如下:
当收到一条用户的query语句时,首先进行中文分词处理,然后对得到的词利用word2vec模型获取意义相近的词;
然后,利用词性标注和依存句法分析可以识别各个词之间的关系;
最后,利用情感分析表进行匹配打分,得出目标实体。
比如:
Query语句:不要日本和韩国车
分词得到:不要,日本,和,韩国,车
依存句法以及词性标注分析得到:不要修饰日本和韩国
最终得到:实体“国别”的值是{{“日本”,-1},{“韩国”,-1}}
再比如:
Query语句:外观要大气
分词得到:外形,要,大气
World2vec模型处理得到,外形近义词:外观
依存句法以及词性标注分析得到:大气修饰外观。
情感分析得出,大气的情感强度为4.0
最终得到:实体“外观”的值是4.0
在本实施例中语义分析模块100中的实体抽取方式,能够最大化地得到匹配信息或者对应信息,从而作为建立场景或者切换新场景的识别基础。
作为本实施例中的优选,所述语义分析模块100中的意图识别进一步包括:
将TF-IDF、word2vec扩展词或者sentence2vec作为训练特征,
训练一个基于迭代的决策树算法的softmax互斥多分类模型,
通过所述互斥多分类模型判断识别输入内容是否满足预置意图。
每个意图可以对应多个语句。比如,若定义“选车”为一个意图,为其定义如下对应的语句:
●推荐个车
●有什么车值得买的
●最近想买辆车,有什么推荐
具体而言,可将TF-IDF、word2vec扩展词、sentence2vec作为特征,训练一个基于GBDT的softmax互斥多分类模型。
具体步骤为:
将query用TF-IDF表达成一个向量u,维度n1
将query中的实体提取出后,用word2vec表达后得到向量v,维度n2
将query用sent2vec表达为一个向量w,维度n3
将u,v,w连成1个向量X,维度为n1+n2+n3
通过上述方法,将数据集中query全部变成向量X,使用X为特征,训练GBDT。
上述TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。
上述GBDT(Gradient Boost Decision Tree)是一个应用很广泛的算法,可以用来做分类、回归。
请参考图5是本发明一实施例中的方法流程示意图,本实施例中的一种汽车智能导购方法,包括如下步骤:
步骤S500对用户的输入内容进行意图识别和实体抽取,所述意图识别用以识别输入内容是否满足预置意图,所述实体抽取用以获取输入内容中的关联信息,
步骤S501建立一可触发嵌套场景,并在所述可触发嵌套场景中根据不同意图切换场景,
步骤S502根据不同的场景,使用对应场景中收集的数据为用户检索和/或推荐,输出导购结果。
在所述步骤S501中的在所述可触发嵌套场景至少包括:当前场景或外层场景,
从当前场景开始当接收到用户输入时,在所述可触发嵌套场景中判断所述用户输入的意图是否会触发新的场景,若没有触发新场景,则按照当前场景处理;
若触发了新的场景,则保存当前场景嵌套结构以及场景的上下文数据,同时将新场景成为当前场景;
若当前场景为可退出状态,并且有外层场景未处理结束,则将外层场景作为当前场景继续处理;
上述每一个场景中在目标达成时则退出当前场景。
在一些实施例中,上述方法还包括:人工处理过程,作为人工处理的接口,通过人工定义意图和/或实体数据,并作为初始训练数据保存后台数据库。
在一些实施例中,上述方法还包括:检索推荐过程,根据不同的场景,使用对应场景中收集的数据进行回答的检索和/或推荐,
所述检索推荐模块至少包括:选择收敛场景和/或常识问答场景。
在一些实施例中,上述方法还包括:数据支持过程,所述数据支持过程中的数据至少包括:业务数据支持,领域知识数据支持以及AI训练数据,
所述业务数据支持,用以作为根据业务逻辑设定的数据接口,
所述领域知识数据支持,用以作为领域知识数据的第三方API接口,
所述AI训练数据,用以作为AI训练数据的第三方API接口。
在一些实施例中,上述方法还包括:输入输出过程,用以接收用户的输入信息/接收输出反馈。
在一些实施例中,上述方法中实体抽取操作进一步包括:中文分词、词性标注、依存句法分析、word2vec、正则匹配、情感分析中的一种或者多种方式。
在一些实施例中,上述方法中意图识别进一步包括:
将TF-IDF、word2vec扩展词或者sentence2vec作为训练特征,
训练一个基于迭代的决策树算法的softmax互斥多分类模型,
通过所述互斥多分类模型判断识别输入内容是否满足预置意图。
请参考图6是本发明一优选实施例中的方法流程示意图,主要包括如下步骤:
步骤S601用户输入,
步骤S602语义分析,
步骤S603是否进行人工服务,若是则进入步骤S604,提供人工处理的接口,通过人工定义意图和/或实体数据,并作为初始训练数据保存后台数据库,若否则进入步骤S610;
步骤S604人工筛选,转接至客服坐席或者WEB端上的客服,
步骤S605直接回复,人工通过文字或者电话致电的方式进行回复,
步骤S606场景归类,基于选择收敛场景,将“选车”作为触发该场景的意图,
步骤S607场景信息是否充足,若是则进入步骤S608,
步骤S608检索推荐系统,能够根据不同的场景,使用场景中收集的数据进行回答的检索和推荐符合条件的内容,
步骤S609回复结果,回复结果是置信度最高或者购买意愿最大的结果作为推荐的项目;
步骤S610场景数据,建立一可触发嵌套场景,并在所述可触发嵌套场景中根据不同意图切换场景;
步骤S611提问用户,若场景信息不充足,则继续提问用户;
步骤S612支持数据库,反馈至步骤S608,所述数据支持至少包括:业务数据支持,领域知识数据支持以及AI训练数据。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
总体而言,本公开的各种实施例可以以硬件或专用电路、软件、逻辑或其任意组合实施。一些方面可以以硬件实施,而其它一些方面可以以固件或软件实施,该固件或软件可以由控制器、微处理器或其它计算设备执行。虽然本公开的各种方面被示出和描述为框图、流程图或使用其它一些绘图表示,但是可以理解本文描述的框、设备、系统、技术或方法可以以非限制性的方式以硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其它计算设备或其一些组合实施。
此外,虽然操作以特定顺序描述,但是这不应被理解为要求这类操作以所示的顺序执行或是以顺序序列执行,或是要求所有所示的操作被执行以实现期望结果。在一些情形下,多任务或并行处理可以是有利的。类似地,虽然若干具体实现方式的细节在上面的讨论中被包含,但是这些不应被解释为对本公开的范围的任何限制,而是特征的描述仅是针对具体实施例。在分离的一些实施例中描述的某些特征也可以在单个实施例中组合地执行。相反对,在单个实施例中描述的各种特征也可以在多个实施例中分离地实施或是以任何合适的子组合的方式实施。
Claims (6)
1.一种汽车智能导购系统,其特征在于,包括:语义分析模块和场景处理模块,
所述语义分析模块,用以对输入内容进行意图识别和实体抽取,所述意图识别用以识别输入内容是否满足预置意图,所述实体抽取用以获取输入内容中的关联信息;所述实体抽取进一步包括:中文分词、词性标注、依存句法分析、word2vec、正则匹配、情感分析中的一种或者多种方式;
所述场景处理模块,用以建立一可触发嵌套场景,并在所述可触发嵌套场景中根据不同意图切换场景;包括:场景嵌套处理模块和场景上下文处理模块,
所述场景上下文处理模块,用以判断当前输入内容否触发新的场景,若触发新场景,则将判断结果输入所述场景嵌套处理模块,
所述场景嵌套处理模块,用以保存当前场景嵌套结构以及场景的上下文数据作为外层场景,同时建立新场景并将所述新场景作为当前场景直到在所述新场景中完成目标后退出当前场景返回至上一层的外层场景,以及,当前场景为可退出状态并且外层有场景未处理结束,则将外层场景作为当前场景继续处理。
2.根据权利要求1所述的汽车智能导购系统,其特征在于,还包括:人工处理模块,用以作为人工处理的接口,通过人工定义意图和/或实体数据,并作为初始训练数据保存后台数据库。
3.根据权利要求1所述的汽车智能导购系统,其特征在于,还包括:检索推荐模块,用以根据不同的场景,使用对应场景中收集的数据进行回答的检索和/或推荐,
所述检索推荐模块至少包括:选择收敛场景和/或常识问答场景。
4.根据权利要求1所述的汽车智能导购系统,其特征在于,还包括:数据支持模块,所述数据支持模块至少包括:业务数据支持模块,领域知识数据支持模块以及AI训练数据模块,
所述业务数据支持模块,用以作为根据业务逻辑设定的数据接口,
所述领域知识数据支持模块,用以作为领域知识数据的第三方API接口,
所述AI训练数据模块,用以作为AI训练数据的第三方API接口。
5.根据权利要求1所述的汽车智能导购系统,其特征在于,还包括:输入输出模块,用以接收用户的输入信息/接收输出反馈。
6.根据权利要求1所述的汽车智能导购系统,其特征在于,所述意图识别进一步包括:
将TF-IDF、word2vec扩展词或者sentence2vec作为训练特征,
训练一个基于迭代的决策树算法的softmax互斥多分类模型,
通过所述互斥多分类模型判断识别输入内容是否满足预置意图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710289245.4A CN107292696B (zh) | 2017-04-27 | 2017-04-27 | 一种汽车智能导购系统以及实现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710289245.4A CN107292696B (zh) | 2017-04-27 | 2017-04-27 | 一种汽车智能导购系统以及实现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107292696A CN107292696A (zh) | 2017-10-24 |
CN107292696B true CN107292696B (zh) | 2020-12-22 |
Family
ID=60093812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710289245.4A Active CN107292696B (zh) | 2017-04-27 | 2017-04-27 | 一种汽车智能导购系统以及实现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107292696B (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977866A (zh) * | 2017-12-14 | 2018-05-01 | 北京木业邦科技有限公司 | 木材产品推荐方法、装置及计算机可读存储介质 |
CN108319640B (zh) * | 2017-12-22 | 2021-01-29 | 金瓜子科技发展(北京)有限公司 | 根据用户偏好进行车源展现的方法及装置 |
CN108566287A (zh) * | 2018-01-08 | 2018-09-21 | 福建星瑞格软件有限公司 | 一种基于深度学习的集群服务器运维优化方法 |
CN108595423A (zh) * | 2018-04-16 | 2018-09-28 | 苏州英特雷真智能科技有限公司 | 一种基于属性区间变化的动态本体结构的语义分析方法 |
CN109326286A (zh) * | 2018-10-23 | 2019-02-12 | 出门问问信息科技有限公司 | 语音信息处理方法、装置及电子设备 |
CN109493166B (zh) * | 2018-10-23 | 2021-12-28 | 深圳智能思创科技有限公司 | 一种针对电子商务导购场景任务型对话系统的构建方法 |
CN109636524A (zh) * | 2018-12-11 | 2019-04-16 | 优估(上海)信息科技有限公司 | 一种车辆信息获取方法、装置及系统 |
CN111382236A (zh) * | 2018-12-27 | 2020-07-07 | 上海智臻智能网络科技股份有限公司 | 一种交互流程间的切换方法及其装置 |
CN111382241A (zh) * | 2018-12-28 | 2020-07-07 | 上海汽车集团股份有限公司 | 会话场景切换方法及装置 |
US11195220B2 (en) | 2019-03-29 | 2021-12-07 | Capital One Services, Llc | Systems and methods for artificial intelligence-based personalized purchase recommendations |
CN110070395A (zh) * | 2019-04-19 | 2019-07-30 | 优估(上海)信息科技有限公司 | 一种辅助车辆销售的系统、方法及装置 |
CN110377812A (zh) * | 2019-06-14 | 2019-10-25 | 平安科技(深圳)有限公司 | 自助购物方法、装置、设备及计算机可读存储介质 |
CN110321564B (zh) * | 2019-07-05 | 2023-07-14 | 浙江工业大学 | 一种多轮对话意图识别方法 |
CN112347309A (zh) * | 2019-08-09 | 2021-02-09 | 上海红星美凯龙悦家互联网科技有限公司 | 数据处理方法、装置、终端、云端和存储介质 |
CN112380875A (zh) * | 2020-11-18 | 2021-02-19 | 杭州大搜车汽车服务有限公司 | 对话标签跟踪方法、装置、电子装置及存储介质 |
CN113392466A (zh) * | 2021-06-11 | 2021-09-14 | 南斗六星系统集成有限公司 | 一种汽车展示联动系统及方法 |
CN116662503B (zh) * | 2023-05-22 | 2023-12-29 | 深圳市新美网络科技有限公司 | 私域用户场景话术推荐方法及其系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101071418B (zh) * | 2007-03-29 | 2010-06-23 | 腾讯科技(深圳)有限公司 | 聊天方法与系统 |
CN104464733B (zh) * | 2014-10-28 | 2019-09-20 | 百度在线网络技术(北京)有限公司 | 一种语音对话的多场景管理方法及装置 |
-
2017
- 2017-04-27 CN CN201710289245.4A patent/CN107292696B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107292696A (zh) | 2017-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107292696B (zh) | 一种汽车智能导购系统以及实现方法 | |
CN108153876B (zh) | 智能问答方法及系统 | |
US11315560B2 (en) | Method for conducting dialog between human and computer | |
US11481422B2 (en) | Method and system for sentiment analysis of information | |
CN109829039B (zh) | 智能聊天方法、装置、计算机设备及存储介质 | |
CN110083693B (zh) | 机器人对话回复方法及装置 | |
CN107391575B (zh) | 一种基于词向量模型的隐式特征识别方法 | |
Aleedy et al. | Generating and analyzing chatbot responses using natural language processing | |
CN110059182A (zh) | 面向客服的话术推荐方法和装置 | |
CN110362753B (zh) | 一种基于用户隐式反馈的个性化神经网络推荐方法及系统 | |
CN110168535A (zh) | 一种信息处理方法及终端、计算机存储介质 | |
CN109033156B (zh) | 一种信息处理方法、装置及终端 | |
CN111191450A (zh) | 语料清洗方法、语料录入设备及计算机可读存储介质 | |
CN111339284A (zh) | 产品智能匹配方法、装置、设备及可读存储介质 | |
CN111078856B (zh) | 一种群聊对话处理方法、装置及电子设备 | |
CN111708869A (zh) | 人机对话的处理方法及装置 | |
CN109325780A (zh) | 一种面向电子政务领域的智能客服系统的交互方法 | |
CN112507139B (zh) | 基于知识图谱的问答方法、系统、设备及存储介质 | |
CN111797202A (zh) | 一种基于人工智能的客服对话方法 | |
CN112364622A (zh) | 对话文本分析方法、装置、电子装置及存储介质 | |
CN106776557B (zh) | 情感机器人的情感状态记忆识别方法及装置 | |
CN117592489A (zh) | 一种利用大语言模型实现电商商品信息交互的方法及系统 | |
CN115658875B (zh) | 基于聊天服务的数据处理方法及相关产品 | |
CN112527983A (zh) | 一种个性化政务人机自然交互服务系统 | |
CN117235213A (zh) | 一种交互式客服方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Room 1008, No. 1, Yunfeng Road, No. 1, Guangdong New District, Longhua New District, Guangdong Applicant after: Shenzhen car package Intelligent Technology Co., Ltd. Address before: 518000 Nanshan District software industry base in Shenzhen, Guangdong Province, 4 A nebulae incubators insect gate technology Applicant before: Shenzhen door Technology Co., Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |