CN112784156A - 基于意图识别的搜索反馈方法、系统、设备及存储介质 - Google Patents

基于意图识别的搜索反馈方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN112784156A
CN112784156A CN202110043734.8A CN202110043734A CN112784156A CN 112784156 A CN112784156 A CN 112784156A CN 202110043734 A CN202110043734 A CN 202110043734A CN 112784156 A CN112784156 A CN 112784156A
Authority
CN
China
Prior art keywords
picture
merchant
alternative
search
intention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110043734.8A
Other languages
English (en)
Inventor
刘洋
孙玉霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Travel Information Technology Shanghai Co Ltd
Original Assignee
Ctrip Travel Information Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Travel Information Technology Shanghai Co Ltd filed Critical Ctrip Travel Information Technology Shanghai Co Ltd
Priority to CN202110043734.8A priority Critical patent/CN112784156A/zh
Publication of CN112784156A publication Critical patent/CN112784156A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/535Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了基于意图识别的搜索反馈方法、系统、设备及存储介质,该方法包括:通过经过训练的旅游产品分类网络对各个商家的图片集中的图片进行预设分类标签的分类;当接收搜索关键词,根据搜索关键词第一次搜索匹配搜索关键词的商家作为备选商家;当搜索关键词匹配分类标签,根据搜索关键词第二次搜索具有该分类标签的图片作为该商家的备选图片集合;显示备选商家信息,备选商家信息包括备选商家的预设介绍文本和当前意图图片,当前意图图片为自备选图片集合中挑选出的至少一图片。本发明能够灵活匹配用户的检索意图,使得推荐更个性化,目的性更强,根据用户意图更直接第反馈搜索结果,提高旅游场景推介的转化效率。

Description

基于意图识别的搜索反馈方法、系统、设备及存储介质
技术领域
本发明涉及个性化搜索领域,具体地说,涉及基于意图识别的搜索反馈方法、系统、设备及存储介质。
背景技术
随着互联网和时代的发展,人们在旅游的途中,经常会使用手机或相机随手拍下值得纪念的美景,并上传分享自己的生活,从而云端图片图库越来越大,也拥有了来自不同人、不同时间、地点的各种图片,日积月累,杂乱无章。这些海量图片若能够加以分析并应用,能够从各方面很好的提升用户体验。
深度学习的兴起使得数据智能化处理成为可能,图像AI技术、自然语言处理技术广泛应用于互联网、金融、医疗等领域,如何将该技术应用于OTA领域,是一个新的AI+课题。图文结合推荐是一种直观的和消费者交流的方式。图像是向用户展示吃喝玩乐住等旅游场景的重要手段之一,将用户的搜索信息配上合适的商品展示图片是最为高效的推荐方式。深度学习的兴起使得图像、文字的智能化处理成为可能。
通常,用户通过搜索来寻找喜欢的目标旅游产品,但是目前的旅游产品反馈方式主要还是限制于只提供该旅游产品的多家商家的固定的图片和商家介绍,用户通过关键词搜索后得到商家列表反馈后用户点击任何一家商家都会跳转到商家的官方页面,然后用户还需要在商家中第二次去寻找自己的目标旅游产品的下单页面,这是一种典型的基于为商家全面介绍的搜索反馈方法,这种方法虽然对商家有利,但是浪费了用户的搜索的时间,又降低了用户体验,有悖于当前更趋向于快速高效的消费心理,无法根据用户意图更直接地反馈搜索结果,延缓了下单过程,限制了旅游产品的推荐转化率。
因此,本发明提供了一种基于意图识别的搜索反馈方法、系统、设备及存储介质。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
针对现有技术中的问题,本发明的目的在于提供基于意图识别的搜索反馈方法、系统、设备及存储介质,克服了现有技术的困难,能够利用深度学习的机器视觉和自然语言处理技术改进OTA旅游场景中吃喝玩乐场景图片展示的方式,灵活匹配用户的检索意图,使得推荐更个性化,目的性更强,根据用户意图更直接第反馈搜索结果,提高旅游场景推介的转化效率。
本发明的实施例提供一种基于意图识别的搜索反馈方法,包括以下步骤:
S110、通过经过训练的旅游产品分类网络对各个商家的图片集中的图片进行预设分类标签的分类,赋予每个所述图片至少一分类标签;
S120、当接收搜索关键词,根据所述搜索关键词第一次搜索匹配所述搜索关键词的商家作为备选商家;
S130、当所述搜索关键词匹配所述分类标签,根据所述搜索关键词第二次搜索每个所述备选商家的图片集中具有该分类标签的图片作为该商家的备选图片集合;
S140、反馈备选商家信息,所述备选商家信息包括备选商家的预设介绍文本和当前意图图片,所述当前意图图片为自所述备选图片集合中挑选出的至少一图片。
优选地,所述步骤S110中包括建立每个商家、所述图片、所述图片的分类标签的映射关系表。
优选地,所述步骤S110之前还包括以下步骤:
S100、预设每个所述商家的关键词。
优选地,所述步骤S110之前还包括以下步骤:
S105、通过分词模型自所述商家的预设介绍文本中提取关键词。
优选地,所述步骤S120中,当所述商家的至少一个关键词命中所述搜索关键词,则将所述商家作为备选商家。
优选地,所述步骤S130之前还包括以下步骤:
S131、判断所述搜索关键词是否命中至少一个所述分类标签,若是,则执行步骤S132,若否,则执行步骤S150;
S132、根据所述搜索关键词第二次筛选每个所述备选商家的图片集中所有具有该分类标签的图片作为该商家的备选图片集合;
所述步骤S140之后还包括以下步骤:
S150、显示备选商家信息,所述备选商家信息包括备选商家的预设介绍文本和预设图片。
优选地,所述步骤S140中还包括以下步骤:
根据所述当前意图图片生成一个对应所述当前意图图片的旅游产品的下单页面;
生成两个触控操作区域,第一触控操作区域覆盖所述当前意图图片,所述第一触控操作区域与所述下单页面链接;第二触控操作区域覆盖所述备选商家的预设介绍文本,所述第二触控操作区域与所述酒店官网页面链接;
当第一触控操作区域被点击,则跳转到所述下单页面;
当第二触控操作区域被点击,则跳转到所述酒店官网页面。
优选地,所述步骤S140中,所述当前意图图片为所述备选图片集合中点赞数最高或评论数最高的一张图片。
优选地,所述步骤S140中,所述当前意图图片为根据用户的历史消费数据匹配所述备选图片集合中各个图片对应的旅游产品的匹配值最高的旅游产品对应一张图片。
本发明的实施例还提供一种基于意图识别的搜索反馈系统,用于实现上述的基于意图识别的搜索反馈方法,所述基于意图识别的搜索反馈系统包括:
图片分类模块,通过经过训练的旅游产品分类网络对各个商家的图片集中的图片进行预设分类标签的分类,赋予每个所述图片至少一分类标签;
备选商家模块,当接收搜索关键词,根据所述搜索关键词第一次搜索匹配所述搜索关键词的商家作为备选商家;
备选图片模块,当所述搜索关键词匹配所述分类标签,根据所述搜索关键词第二次搜索每个所述备选商家的图片集中具有该分类标签的图片作为该商家的备选图片集合;
搜索反馈模块,显示备选商家信息,所述备选商家信息包括备选商家的预设介绍文本和当前意图图片,所述当前意图图片为自所述备选图片集合中挑选出的至少一图片。
本发明的实施例还提供一种基于意图识别的搜索反馈设备,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述基于意图识别的搜索反馈方法的步骤。
本发明的实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述基于意图识别的搜索反馈方法的步骤。
本发明的目的在于提供基于意图识别的搜索反馈方法、系统、设备及存储介质,能够利用深度学习的机器视觉和自然语言处理技术改进OTA 旅游场景中吃喝玩乐场景图片展示的方式,灵活匹配用户的检索意图,使得推荐更个性化,目的性更强,根据用户意图更直接第反馈搜索结果,提高旅游场景推介的转化效率。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
图1是本发明的基于意图识别的搜索反馈方法的流程示意图。
图2至6是实施本发明的基于意图识别的搜索反馈方法的实施过程示意图。
图7是本发明的基于意图识别的搜索反馈系统的结构示意图。
图8是本发明的基于意图识别的搜索反馈设备的结构示意图。
图9是本发明一实施例的计算机可读存储介质的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。
图1是本发明的基于意图识别的搜索反馈方法的第一种流程示意图。如图1所示,本发明的实施例提供一种基于意图识别的搜索反馈方法,包括以下步骤:
S110、通过经过训练的旅游产品分类网络对各个商家的图片集中的图片进行预设分类标签的分类,赋予每个图片至少一分类标签。
S120、当接收搜索关键词,根据搜索关键词第一次搜索匹配搜索关键词的商家作为备选商家。
S130、当搜索关键词匹配分类标签,根据搜索关键词第二次搜索每个备选商家的图片集中具有该分类标签的图片作为该商家的备选图片集合。
S140、反馈备选商家信息,备选商家信息包括备选商家的预设介绍文本和当前意图图片,当前意图图片为自备选图片集合中挑选出的至少一图片。
本发明通过利用深度学习技术自动地将图片分类到所属的标签体系中;利用深度学习技术,自动地将用户搜索的文本内容做用户意图识别,并映射到内部标签体系内;根据识别到的用户意图和商品对应的图片和标签,动态地将主题相关的图片展示给用户。
在一个优选方案中,步骤S110中包括建立每个商家、图片、图片的分类标签的映射关系表。
在一个优选方案中,步骤S110之前还包括以下步骤:
S100、预设每个商家的关键词。
在一个优选方案中,步骤S110之前还包括以下步骤:
S105、通过分词模型自商家的预设介绍文本中提取关键词。
在一个优选方案中,步骤S120中,当商家的至少一个关键词命中搜索关键词,则将商家作为备选商家。
在一个优选方案中,步骤S130之前还包括以下步骤:
S131、判断搜索关键词是否命中至少一个分类标签,若是,则执行步骤S132,若否,则执行步骤S150。
S132、根据搜索关键词第二次筛选每个备选商家的图片集中所有具有该分类标签的图片作为该商家的备选图片集合。
步骤S140之后还包括以下步骤:
S150、显示备选商家信息,备选商家信息包括备选商家的预设介绍文本和预设图片。
在一个优选方案中,步骤S140中还包括以下步骤:
根据当前意图图片生成一个对应当前意图图片的旅游产品的下单页面。
生成两个触控操作区域,第一触控操作区域覆盖当前意图图片,第一触控操作区域与下单页面链接。第二触控操作区域覆盖备选商家的预设介绍文本,第二触控操作区域与酒店官网页面链接。
当第一触控操作区域被点击,则跳转到下单页面。
当第二触控操作区域被点击,则跳转到酒店官网页面。
在一个优选方案中,步骤S140中,当前意图图片为备选图片集合中点赞数最高或评论数最高的一张图片。
在一个优选方案中,步骤S140中,当前意图图片为根据用户的历史消费数据匹配备选图片集合中各个图片对应的旅游产品的匹配值最高的旅游产品对应一张图片。
本发明的基于意图识别的搜索反馈方法能够利用深度学习的机器视觉和自然语言处理技术改进OTA旅游场景中吃喝玩乐场景图片展示的方式,灵活匹配用户的检索意图,使得推荐更个性化,目的性更强,根据用户意图更直接第反馈搜索结果,提高旅游场景推介的转化效率。
图2至6是实施本发明的基于意图识别的搜索反馈方法的实施过程示意图。以下通过图2至6来详细介绍本发明的实施过程:
如图2所示,在服务器1中预存三家旅游产品供应商:商家X、商家 Y、商家Z的文本信息和图片,通过分词模型自商家的预设介绍文本中提取关键词来,预设每个商家的旅游产品关键词。其中,商家X的关键词为A(潜水)、B(冲浪)、C(酒店)。商家Y的关键词为B(冲浪)、 C(酒店)。商家Z的关键词为A(潜水)、B(冲浪)、E(帆船)。
如图3所示,通过经过训练的旅游产品分类网络对各个商家的图片集中的图片进行预设分类标签的分类,本实施例中的预设分类标签包括潜水、冲浪、酒店和帆船等等。
赋予每个图片至少一分类标签。本实施例中,采用现有的经过训练的旅游产品分类网络(现有的机器视觉的神经网络模型)将商家X、商家Y、商家Z的图片进行识别分类,建立每个商家、图片、图片的分类标签的映射关系表:
商家X的图片被分类为:基于关键词为A(潜水)的照片A1、A2;基于关键词为B(冲浪)的照片B1、B2、B3;基于关键词为C(酒店) 的照片C1、C2
商家Y的图片被分类为:基于关键词为B(冲浪)的照片B1、B2;基于关键词为C(酒店)的照片C1、C2、C3、C4
商家Z的图片被分类为:基于关键词为A(潜水)的照片A1、A2、 A3、A4;基于关键词为B(冲浪)的照片B1、B2
当接收到用户通过手机2发来的搜索关键词“冲浪”,根据搜索关键词“冲浪”第一次搜索匹配搜索关键词的商家,当商家的至少一个关键词命中搜索关键词,则将商家作为备选商家,则商家X、商家Y、商家Z都是备选商家。
然后,由于用户提供的搜索关键词“冲浪”也匹配预设分类标“冲浪”,则根据搜索关键词第二次搜索每个备选商家的图片集中具有该分类标签的图片作为该商家的备选图片集合,则商家X的备选图片集合包括了商家X的图片集中的B1、B2、B3;商家Y的备选图片集合包括了商家Y的图片集中的B1、B2;商家Z的备选图片集合包括了商家Z的图片集中的 B1、B2
服务器1向用户的手机2反馈备选商家信息,备选商家信息包括备选商家的预设介绍文本22和当前意图图片21,当前意图图片为自备选图片集合中挑选出的至少一图片。本实施例中,将当前意图图片为备选图片集合中点赞数最高的一张图片。则自商家X的备选图片中选择点赞数最高的图片B1作为商家X的当前意图图片。自商家Y的备选图片中选择点赞数最高的图片B2作为商家Y的当前意图图片。自商家Z的备选图片中选择点赞数最高的图片B2作为商家Z的当前意图图片。
如图4所示,显示备选商家信息,备选商家信息包括备选商家的预设介绍文本和预设图片,并且,根据当前意图图片生成一个对应当前意图图片的旅游产品的下单页面。生成两个触控操作区域,第一触控操作区域覆盖当前意图图片21,第一触控操作区域与下单页面链接。第二触控操作区域覆盖备选商家的预设介绍文本22,第二触控操作区域与酒店官网页面链接。
如图5所示,当第一触控操作区域被点击,则跳转到下单页面,以便用户可以通过检索后,不必进入商家主页直接向自己中意的旅游产品进行下单,在这个过程中,用户只需要直接选择自己喜欢的商家的旅游产品,避免了进度商家官网后还要从新寻找自己中意的旅游产品的过程,大大节约了用户的时间,目的性更强,根据用户意图更直接第反馈搜索结果,可以明显提高旅游场景推介的转化效率。
如图6所示,当第二触控操作区域被点击,则跳转到酒店官网页面,用户可以进行非常的下单模式,此处不再赘述。
本发明通过利用深度学习技术自动地将图片分类到所属的标签体系中;利用深度学习技术,自动地将用户搜索的文本内容做用户意图识别,并映射到内部标签体系内;根据识别到的用户意图和商品对应的图片和标签,动态地将主题相关的图片展示给用户。
本发明可以利用大量已经标注好类别的主题场景图片,训练一个卷积网络,就可以将海量图片分类到不同的标签下,建立好旅游场景识别的训练库,在每类样本数量不多的情况下,为防止过拟合并获得较为理想的分类效果,采用迁移学习的方式来训练网络,使用一个在Place365数据集上训练好的分类精度和速度都较好的CNN模型,抽取某一中间层作为新图像的提取器(extractor),利用提取的特征,学习新加入到原网络结构中的新的层级,完成整个迁移学习,得到分类效果较好的场景分类模型,如图2所示;将用户搜索文本数据按照图像的标签体系做好标注,如给文本打上类别信息,如食物类,风景,人物活动类等,建立用户搜索意图识别的训练库。设计网络训练文本分类识别模型,用于识别用户搜索意图;利用图像标签模型将商品的展示图打上标签入库,此操作为离线运行模式;用户搜索商品时,将用户搜索文本信息打上标签,展示召回商品的展示图时,根据文本标签搜索商品相应标签的图片展示。
在一个优选方案中,标注了一个主题场景数据集和一个意图分类数据集用于训练深度模型,这两个自建数据集贴合实际应用场景,训练得到的模型效果更优;
在一个优选方案中,在训练分类模型和优美度模型前,在公开数据集 Place365数据集上训练好一个分类精度和速度都较好的CNN模型用作预训练模型,预训练模型对分类模型和优美度模型的拟合有较大帮助,能大幅度提高模型收敛速度;
在一个优选方案中,在训练分类模型的时候,在网络中加入L2 norm 层,解决了样本分布不均衡引起的网络不收敛或者是收敛慢的问题。加入 Triplet Loss用于压缩类别与类别之间的差异,使cnn网络能够学习到场景类别的更多细节,从而得到更加准确的类别信息,如图1;
在一个优选方案中,在训练分类模型的时候,在网络中加入L2 norm 层,解决了样本分布不均衡引起的网络不收敛或者是收敛慢的问题。加入 Triplet Loss用于压缩类别与类别之间的差异,使cnn网络能够学习到场景类别的更多细节,从而得到更加准确的类别信息;
在一个优选方案中,在训练分类模型的时候,在网络中加入L2 norm 层,解决了样本分布不均衡引起的网络不收敛或者是收敛慢的问题。加入Triplet Loss用于压缩类别与类别之间的差异,使cnn网络能够学习到场景类别的更多细节,从而得到更加准确的类别信息;
在一个优选方案中,在训练用户意图分类模型的时候,建立的标签体系与图片的标签体系一致;
在一个优选方案中,为保证用户搜索的时效性和高并发性,使用精度和速度相对较好的textcnn模型来做用户搜索文本的分类模型,使用三层卷积层和两层全连接层,前向计算速度快,精度能达到要求;
在一个优选方案中,一般商品推荐的头图1成不变,不能根据用户的搜索意图进行切换,本发明利用图像和文本分类模型,将推荐商品的展示头图设计成为动态地根据用户搜索标签进行切换的模式,使得推荐更个性化。
在一个优选方案中,标签体系可以扩充,标签体系覆盖的范围越广,适用的推荐商品更多,可广泛推广至其他电商平台;
本发明利用学习好的模型对图片进行标签化入库,当用户搜索商品时,对用户的搜索信息和个人偏好进行用户意图识别,根据召回的目的产品,对产品的头图进行智能切换,将用户可能感兴趣的图片展示在头部;本发明利用深度学习技术,结合计算机视觉和自然语言处理领域的知识,对 OTA产品进行个性化推荐,使机器代替人工进行操作,提高旅游推荐的转化效率。
在一个本发明的实施例中,可以将商品的样本图片按照类别属性做好标注,如冲浪、雪山、牛排、火锅、等按多个属性、类别做好描述文本,如图片名,属性A,B,。。。F。建立商品类别识别的训练库。利用开源的深度学习平台,采用迁移学习的方式来训练网络,使用一个在 Place365数据集上训练好的分类精度和速度都较好的CNN模型,作为预训练模型。抽取2中预训练模型的某一中间层作为图像的提取器 (extractor),应用到步骤1中的数据集上,提取训练所需的特征库,利用提取的特征,学习如图1所示的网络结构,完成迁移学习,得到如图2 所示功能的场景分类模型A。将用户搜索的文本信息按商品图片的类别体系做好标注,如食物类别,运动类别,其他商品类别等,做好描述文本,如文本详情,类别。建立用户意图识别的训练库。构建3层卷积层,两层全连接层的textcnn模型,应用到步骤4中的数据集上,学习训练用户意图分类模型B。对于数据库中所有的图片,由步骤3中的分类模型得到其标签L,根据商品信息得到其展示图的描述信息 Pi={pic1:L1,pic2:L2-picN:LN}存入数据库中。用户在搜索商品时,根据用户搜索的文本,利用5中的模型B对用户的意图进行分类,得到标签 Ls,展示召回商品的时候,根据Ls取每个商品标签为Ls的展示图作为展示,提升推荐效率。
本发明利用深度学习的机器视觉和自然语言处理技术改进OTA旅游场景中吃喝玩乐场景图片展示的方式,使得推荐更个性化,目的性更强,提高旅游场景推介的转化效率。
图7是本发明的基于意图识别的搜索反馈系统的结构示意图。如图7 所示,本发明实施例还提供一种基于意图识别的搜索反馈系统5,包括:
图片分类模块51,通过经过训练的旅游产品分类网络对各个商家的图片集中的图片进行预设分类标签的分类,赋予每个图片至少一分类标签;
备选商家模块52,当接收搜索关键词,根据搜索关键词第一次搜索匹配搜索关键词的商家作为备选商家;
备选图片模块53,当搜索关键词匹配分类标签,根据搜索关键词第二次搜索每个备选商家的图片集中具有该分类标签的图片作为该商家的备选图片集合;
搜索反馈模块54,显示备选商家信息,备选商家信息包括备选商家的预设介绍文本和当前意图图片,当前意图图片为自备选图片集合中挑选出的至少一图片。
本发明的基于意图识别的搜索反馈系统能够利用深度学习的机器视觉和自然语言处理技术改进OTA旅游场景中吃喝玩乐场景图片展示的方式,灵活匹配用户的检索意图,使得推荐更个性化,目的性更强,根据用户意图更直接第反馈搜索结果,提高旅游场景推介的转化效率。
本发明实施例还提供一种基于意图识别的搜索反馈设备,包括处理器。存储器,其中存储有处理器的可执行指令。其中,处理器配置为经由执行可执行指令来执行的基于意图识别的搜索反馈方法的步骤。
如上所示,该实施例本发明的基于意图识别的搜索反馈系统能够利用深度学习的机器视觉和自然语言处理技术改进OTA旅游场景中吃喝玩乐场景图片展示的方式,灵活匹配用户的检索意图,使得推荐更个性化,目的性更强,根据用户意图更直接第反馈搜索结果,提高旅游场景推介的转化效率。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
图8是本发明的基于意图识别的搜索反馈设备的结构示意图。下面参照图8来描述根据本发明的这种实施方式的电子设备600。图8显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,电子设备600以通用计算设备的形式表现。电子设备 600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线 630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备 600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的基于意图识别的搜索反馈方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。
如上所示,该实施例本发明的基于意图识别的搜索反馈系统能够利用深度学习的机器视觉和自然语言处理技术改进OTA旅游场景中吃喝玩乐场景图片展示的方式,灵活匹配用户的检索意图,使得推荐更个性化,目的性更强,根据用户意图更直接第反馈搜索结果,提高旅游场景推介的转化效率。
图9是本发明的计算机可读存储介质的结构示意图。参考图9所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如 Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上,本发明的目的在于提供基于意图识别的搜索反馈方法、系统、设备及存储介质,本发明的基于意图识别的搜索反馈系统能够利用深度学习的机器视觉和自然语言处理技术改进OTA旅游场景中吃喝玩乐场景图片展示的方式,灵活匹配用户的检索意图,使得推荐更个性化,目的性更强,根据用户意图更直接第反馈搜索结果,提高旅游场景推介的转化效率。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (12)

1.一种基于意图识别的搜索反馈方法,其特征在于,包括以下步骤:
S110、通过经过训练的旅游产品分类网络对各个商家的图片集中的图片进行预设分类标签的分类,赋予每个所述图片至少一分类标签;
S120、当接收搜索关键词,根据所述搜索关键词第一次搜索匹配所述搜索关键词的商家作为备选商家;
S130、当所述搜索关键词匹配所述分类标签,根据所述搜索关键词第二次搜索每个所述备选商家的图片集中具有该分类标签的图片作为该商家的备选图片集合;
S140、反馈备选商家信息,所述备选商家信息包括备选商家的预设介绍文本和当前意图图片,所述当前意图图片为自所述备选图片集合中挑选出的至少一图片。
2.根据权利要求1所述的基于意图识别的搜索反馈方法,其特征在于,所述步骤S110中包括建立每个商家、所述图片、所述图片的分类标签的映射关系表。
3.根据权利要求1所述的基于意图识别的搜索反馈方法,其特征在于,所述步骤S110之前还包括以下步骤:
S100、预设每个所述商家的关键词。
4.根据权利要求1所述的基于意图识别的搜索反馈方法,其特征在于,所述步骤S110之前还包括以下步骤:
S105、通过分词模型自所述商家的预设介绍文本中提取关键词。
5.根据权利要求3或4所述的基于意图识别的搜索反馈方法,其特征在于,所述步骤S120中,当所述商家的至少一个关键词命中所述搜索关键词,则将所述商家作为备选商家。
6.根据权利要求3所述的基于意图识别的搜索反馈方法,其特征在于,所述步骤S130之前还包括以下步骤:
S131、判断所述搜索关键词是否命中至少一个所述分类标签,若是,则执行步骤S132,若否,则执行步骤S150;
S132、根据所述搜索关键词第二次筛选每个所述备选商家的图片集中所有具有该分类标签的图片作为该商家的备选图片集合;
所述步骤S140之后还包括以下步骤:
S150、显示备选商家信息,所述备选商家信息包括备选商家的预设介绍文本和预设图片。
7.根据权利要求3所述的基于意图识别的搜索反馈方法,其特征在于,所述步骤S140中还包括以下步骤:
根据所述当前意图图片生成一个对应所述当前意图图片的旅游产品的下单页面;
生成两个触控操作区域,第一触控操作区域覆盖所述当前意图图片,所述第一触控操作区域与所述下单页面链接;第二触控操作区域覆盖所述备选商家的预设介绍文本,所述第二触控操作区域与所述酒店官网页面链接;
当第一触控操作区域被点击,则跳转到所述下单页面;
当第二触控操作区域被点击,则跳转到所述酒店官网页面。
8.根据权利要求3所述的基于意图识别的搜索反馈方法,其特征在于,所述步骤S140中,所述当前意图图片为所述备选图片集合中点赞数最高或评论数最高的一张图片。
9.根据权利要求3所述的基于意图识别的搜索反馈方法,其特征在于,所述步骤S140中,所述当前意图图片为根据用户的历史消费数据匹配所述备选图片集合中各个图片对应的旅游产品的匹配值最高的旅游产品对应一张图片。
10.一种基于意图识别的搜索反馈系统,用于实现权利要求1所述的基于意图识别的搜索反馈方法,其特征在于,包括:
图片分类模块,通过经过训练的旅游产品分类网络对各个商家的图片集中的图片进行预设分类标签的分类,赋予每个所述图片至少一分类标签;
备选商家模块,当接收搜索关键词,根据所述搜索关键词第一次搜索匹配所述搜索关键词的商家作为备选商家;
备选图片模块,当所述搜索关键词匹配所述分类标签,根据所述搜索关键词第二次搜索每个所述备选商家的图片集中具有该分类标签的图片作为该商家的备选图片集合;
搜索反馈模块,显示备选商家信息,所述备选商家信息包括备选商家的预设介绍文本和当前意图图片,所述当前意图图片为自所述备选图片集合中挑选出的至少一图片。
11.一种基于意图识别的搜索反馈设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至9任意一项所述基于意图识别的搜索反馈方法的步骤。
12.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1至9任意一项所述基于意图识别的搜索反馈方法的步骤。
CN202110043734.8A 2021-01-13 2021-01-13 基于意图识别的搜索反馈方法、系统、设备及存储介质 Pending CN112784156A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110043734.8A CN112784156A (zh) 2021-01-13 2021-01-13 基于意图识别的搜索反馈方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110043734.8A CN112784156A (zh) 2021-01-13 2021-01-13 基于意图识别的搜索反馈方法、系统、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112784156A true CN112784156A (zh) 2021-05-11

Family

ID=75755751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110043734.8A Pending CN112784156A (zh) 2021-01-13 2021-01-13 基于意图识别的搜索反馈方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112784156A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115689810A (zh) * 2023-01-04 2023-02-03 深圳市人马互动科技有限公司 基于人机对话的数据处理方法及相关装置
CN117522533A (zh) * 2024-01-08 2024-02-06 江西求是高等研究院 一种酒店智能搜索方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034663A (zh) * 2011-09-29 2013-04-10 阿里巴巴集团控股有限公司 一种信息搜索方法和设备
CN108280098A (zh) * 2017-01-06 2018-07-13 北京京东尚科信息技术有限公司 信息推荐方法及装置
CN110209858A (zh) * 2018-02-28 2019-09-06 阿里巴巴集团控股有限公司 展示图片确定、对象搜索、展示方法、装置、设备和介质
US20200019628A1 (en) * 2018-07-16 2020-01-16 Microsoft Technology Licensing, Llc Visual intent triggering for visual search
CN110929139A (zh) * 2018-09-04 2020-03-27 阿里巴巴集团控股有限公司 搜索推荐方法及装置
CN111737544A (zh) * 2020-05-13 2020-10-02 北京三快在线科技有限公司 搜索意图识别方法、装置、电子设备和存储介质
US20200320609A1 (en) * 2019-04-08 2020-10-08 Toshiba Tec Kabushiki Kaisha Method and system for providing personalized recommendations in real-time

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034663A (zh) * 2011-09-29 2013-04-10 阿里巴巴集团控股有限公司 一种信息搜索方法和设备
CN108280098A (zh) * 2017-01-06 2018-07-13 北京京东尚科信息技术有限公司 信息推荐方法及装置
CN110209858A (zh) * 2018-02-28 2019-09-06 阿里巴巴集团控股有限公司 展示图片确定、对象搜索、展示方法、装置、设备和介质
US20200019628A1 (en) * 2018-07-16 2020-01-16 Microsoft Technology Licensing, Llc Visual intent triggering for visual search
CN110929139A (zh) * 2018-09-04 2020-03-27 阿里巴巴集团控股有限公司 搜索推荐方法及装置
US20200320609A1 (en) * 2019-04-08 2020-10-08 Toshiba Tec Kabushiki Kaisha Method and system for providing personalized recommendations in real-time
CN111737544A (zh) * 2020-05-13 2020-10-02 北京三快在线科技有限公司 搜索意图识别方法、装置、电子设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115689810A (zh) * 2023-01-04 2023-02-03 深圳市人马互动科技有限公司 基于人机对话的数据处理方法及相关装置
CN117522533A (zh) * 2024-01-08 2024-02-06 江西求是高等研究院 一种酒店智能搜索方法及系统

Similar Documents

Publication Publication Date Title
CN110717017B (zh) 一种处理语料的方法
US20210004402A1 (en) Method for making music recommendations and related computing device, and medium thereof
US10642887B2 (en) Multi-modal image ranking using neural networks
CN110209774B (zh) 处理会话信息的方法、装置及终端设备
CN112948708B (zh) 一种短视频推荐方法
CN113536793A (zh) 一种实体识别方法、装置、设备以及存储介质
CN110083729B (zh) 一种图像搜索的方法及系统
CN113010702B (zh) 多媒体信息的互动处理方法、装置、电子设备及存储介质
CN113011186B (zh) 命名实体识别方法、装置、设备及计算机可读存储介质
CN114390217B (zh) 视频合成方法、装置、计算机设备和存储介质
CN118103834A (zh) 一种信息获取方法以及装置
CN110489649B (zh) 标签关联内容的方法及装置
US20230237093A1 (en) Video recommender system by knowledge based multi-modal graph neural networks
CN111797622B (zh) 用于生成属性信息的方法和装置
CN113704507B (zh) 数据处理方法、计算机设备以及可读存储介质
CN115564469A (zh) 广告创意选取和模型训练方法、装置、设备及存储介质
CN116975615A (zh) 基于视频多模态信息的任务预测方法和装置
CN112784156A (zh) 基于意图识别的搜索反馈方法、系统、设备及存储介质
CN116977701A (zh) 视频分类模型训练的方法、视频分类的方法和装置
CN115018549A (zh) 广告文案生成方法及其装置、设备、介质、产品
CN111522979B (zh) 图片排序推荐方法、装置、电子设备、存储介质
CN116955591A (zh) 用于内容推荐的推荐语生成方法、相关装置和介质
CN115759293A (zh) 模型训练方法、图像检索方法、装置及电子设备
CN117131155A (zh) 多类目识别方法、装置、电子设备及储存介质
CN116978028A (zh) 视频处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination