CN117609433A - 信息推荐方法、装置、电子设备和计算机可读存储介质 - Google Patents

信息推荐方法、装置、电子设备和计算机可读存储介质 Download PDF

Info

Publication number
CN117609433A
CN117609433A CN202410082270.5A CN202410082270A CN117609433A CN 117609433 A CN117609433 A CN 117609433A CN 202410082270 A CN202410082270 A CN 202410082270A CN 117609433 A CN117609433 A CN 117609433A
Authority
CN
China
Prior art keywords
information
reasoning
summarized
recommendation
knowledge base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410082270.5A
Other languages
English (en)
Inventor
宋子豪
邹延迪
李尚锦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Huoli Tianhui Technology Co ltd
Original Assignee
Shenzhen Huoli Tianhui Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Huoli Tianhui Technology Co ltd filed Critical Shenzhen Huoli Tianhui Technology Co ltd
Priority to CN202410082270.5A priority Critical patent/CN117609433A/zh
Publication of CN117609433A publication Critical patent/CN117609433A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/387Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0475Generative networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/094Adversarial learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及智能推荐技术领域,具体涉及一种信息推荐方法、装置、电子设备和计算机可读存储介质,本发明的技术方案通过使用大语言模型结合动态词汇扩展机制对用户请求推荐的输入信息进行处理,从而能够准确的理解和识别用户的需求,保障后续依据该用户需求信息查询知识库时能够获取到更贴近于用户意图的推荐信息。另外,通过查询符合当前业务的实时知识库和向量知识库,能够实时查询和预定相关的服务和建议,从而满足了用户个性化的需求以及对实时数据的展示,提高了用户体验。

Description

信息推荐方法、装置、电子设备和计算机可读存储介质
技术领域
本发明涉及智能推荐技术领域,特别涉及一种信息推荐方法、装置、电子设备和计算机可读存储介质。
背景技术
近年来,越来越多的人选择自由行,但是对于目的地不熟悉的人来说,如何规划行程是一个头疼的问题。智能旅行助手可以根据用户输入的出发地、时间等信息,为用户推荐相关的景点和活动。通过这种方式,智能旅行助手可以帮助用户节省大量时间和精力,并且让他们更加轻松愉快地享受旅行。但是,传统的旅行规划和推荐服务往往基于静态的规则和简单的关键词匹配,无法满足用户个性化的需求以及对实时数据的展示。因此,如何更好地满足用户个性化的需求以及对实时数据的展示,是一个亟待解决的问题。
发明内容
有鉴于此,本发明实施例提供一种信息推荐方法、装置、电子设备和计算机可读存储介质,本发明的技术方案通过使用大语言模型结合动态词汇扩展机制对用户请求推荐的输入信息进行处理,从而能够准确的理解和识别用户的需求,保障后续依据该用户需求信息查询知识库时能够获取到更贴近于用户意图的推荐信息。另外,通过查询符合当前业务的实时知识库和向量知识库,能够实时查询和预定相关的服务和建议,从而满足了用户个性化的需求以及对实时数据的展示,提高了用户体验。
第一方面,本发明实施例提供了一种信息推荐方法,所述方法包括:
获取用户请求推荐的输入信息;
基于大语言模型并结合动态词汇扩展工具对所述输入信息进行处理,得到汇总推理信息;
根据所述汇总推理信息查询预设的知识库以获取与所述汇总推理信息对应的查询结果;
基于大语言模型对所述查询结果进行总结以生成推荐信息;
向用户输出所述推荐信息。
优选地,所述基于大语言模型并结合动态词汇扩展工具对所述输入信息进行处理,得到汇总推理信息,具体包括:
基于大语言模型对所述输入信息进行语义分析,生成语义分析信息;
通过所述动态词汇扩展工具对所述语义分析信息进行语义扩展,生成语义扩展信息;
基于大语言模型对所述语义扩展信息进行汇总推理,生成所述汇总推理信息。
优选地,所述基于大语言模型并结合动态词汇扩展工具对所述输入信息进行处理,得到汇总推理信息,具体包括:
通过所述动态词汇扩展工具对所述输入信息进行语义扩展,生成语义扩展信息;
基于大语言模型对所述语义扩展信息进行汇总推理,生成所述汇总推理信息。
优选地,其中,所述动态词汇扩展工具包括以下工具的其中一种:命名实体识别NER模型,ELK-动态扩展分词器。
优选地,所述根据所述汇总推理信息查询预设的知识库以获取与所述汇总推理信息对应的查询结果,具体包括:
基于大语言模型并根据所述汇总推理信息生成与所述汇总推理信息对应的并发请求;
根据所述并发请求调用所述预设的知识库的查询接口用以获取与所述汇总推理信息对应的查询结果。
优选地,所述方法应用于旅游业务领域,其中,所述预设的知识库至少包括以下其中一种:机票业务实时知识库,酒店业务实时知识库,火车票业务实时知识库,旅游专业向量知识库。
优选地,所述向用户输出所述推荐信息,具体包括:对所述推荐信息进行生成式对抗网络GAN对抗训练处理,向用户输出训练处理后的推荐信息。
第二方面,本发明实施例提供了一种推荐设备,所述设备包括:
用户输入信息获取模块,设置为获取用户请求推荐的输入信息;
汇总推理信息获取模块,设置为基于大语言模型并结合动态词汇扩展工具对所述输入信息进行处理,得到汇总推理信息;
查询结果获取模块,设置为根据所述汇总推理信息查询预设的知识库以获取与所述汇总推理信息对应的查询结果;
推荐信息生成模块,设置为基于大语言模型对所述查询结果进行总结以生成推荐信息;
推荐信息输出模块,设置为向用户输出所述推荐信息。
第三方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述处理器执行所述存储器中的程序指令,用于实现第一方面所述的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于实现第一方面所述的方法。
附图说明
通过以下参照附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1是本发明实施例的信息推荐方法流程图;
图2是本发明实施例的信息推荐装置结构示意图;
图3为本发明实施例的电子设备的硬件结构示意图。
具体实施方式
以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。
此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。
同时,应当理解,在以下的描述中,“电路”是指由至少一个元件或子电路通过电气连接或电磁连接构成的导电回路。当称元件或电路“连接到”另一元件或称元件/电路“连接在”两个节点之间时,它可以是直接耦接或连接到另一元件或者可以存在中间元件,元件之间的连接可以是物理上的、逻辑上的、或者其结合。相反,当称元件“直接耦接到”或“直接连接到”另一元件时,意味着两者不存在中间元件。
除非上下文明确要求,否则在说明书的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
随着人工智能技术的不断发展和进步,大语言模型((LLM,Large LanguageModel)逐渐成为人们关注的热点,它是指基于深度学习技术构建的能够生成人类语言的模型,具备强大的语义理解和推理能力,能够从用户的自然语言输入中抽取关键信息,从而可以自动生成文章、回答问题、进行对话等,具有广泛的应用场景。在此形势下,大语言模型的出现为旅行智能助手系统的发展提供了新的机遇。
本发明首次将大语言模型结合动态词汇扩展机制对用户请求推荐的输入信息进行处理,从而能够准确的理解和识别用户的需求,保障后续依据该用户需求信息查询知识库时能够获取到更贴近于用户意图的推荐信息。另外,通过查询符合当前业务的实时知识库和向量知识库,能够实时查询和预定相关的服务和建议,从而提高用户体验。
本发明还针对传统的大语言模型不能一次提问多次处理的问题,对该问题进行解决和完善。
图1是本发明实施例的信息推荐方法流程图,具体如图1所示,该信息推荐方法包括以下步骤:
步骤S110:获取用户请求推荐的输入信息。
在本发明实施例中,描述用户推荐请求的输入信息可以由执行该信息推荐方法的执行主体从用户终端直接获取,也可以是通过各种方式预先存储在执行主体本地从而间接获取。另外,用户可以通过自然语言或者多模态方式提出推荐请求,例如:关键词、图片、语音、文本、视频等。
其中,自然语言输入是指用户将其推荐请求以自然语言的方式进行描述,表示为文本形式的自然语言文本或语音形式的自然语言语音。为便于后续处理,原始传入的非文本形式的自然语言输入以及其他模态形式输入可以借助相应的转换技术将其转换为便于处理的自然语言文本。
步骤S120:基于大语言模型并结合动态词汇扩展工具对所述输入信息进行处理,得到汇总推理信息。
本步骤旨在将在步骤S110执行后所获取到的用户请求推荐的输入信息作为大语言模型和动态词汇扩展工具的输入,通过将两者的优势进行结合,进而输出更符合用户意图的汇总推理信息。
具体地,本步骤可通过如下两种方式实现:
第一种方式,具体可通过如下步骤实现:
步骤一:通过动态词汇扩展工具对用户请求推荐的输入信息进行语义扩展,生成语义扩展信息。具体地,动态词汇扩展工具是动态词汇扩展机制的具体体现,目前动态词汇扩展工具包括但不限于:命名实体识别(Named Entity Recognition,NER)模型以及ELK-动态扩展分词器。NER模型是指从给定的一个非结构化的文本中识别出其中的命名实体,并对实体进行分类,比如时间、人名、地名、机构名等类型的实体。ELK-动态扩展分词器属于动态扩展分词器的一种。具体采用哪种动态词汇扩展机制,可根据项目情况进行选择。例如:如使用NER模型,则可调用NER模型的相关接口对用户请求推荐的输入信息进行语义扩展。
在一具体示例中,本步骤一可以通过调用具体动态词汇扩展工具的语义扩展接口使用如下公式实现:
L1 =NER(input)
其中,接口输入参数input为用户请求推荐的输入信息,L1为接口返回的语义扩展信息。
例如:对于用户的自然语言输入文本“明天父母从上海来北京”,经NER模型处理后可以识别出“明天”、“父亲”、“母亲”、“上海”、“来到”、“北京”。
需要说明的是:执行该操作时所输入的用户请求推荐的输入信息需为文本格式。
步骤二:基于大语言模型对该语义扩展信息进行汇总推理,生成汇总推理信息。该操作对于由上述步骤一生成的语义扩展信息进行进一步处理,目的在于从语义扩展信息的各个信息中推理出可以反映用户意图的关键信息。
在一具体示例中,本步骤二可以通过调用具体大语言模型的汇总推理接口使用如下公式实现:
L2 = LLM.reasoning(L1)
其中,接口输入参数L1为经上述步骤一所得到的语义扩展信息,L2为接口返回的汇总推理信息。
例如:对于上述例子中由NER模型识别出的“明天”、“父亲”、“母亲”、“上海”、“来到”、“北京”,大语言模型对其分析后可以推理出:“出发地:上海”、“到达地:北京”、“人数:2人”、“出发时间:2023-12-12”。
第二种方式,具体可通过如下步骤实现:
步骤一:基于大语言模型对用户请求推荐的输入信息进行语义分析,生成语义分析信息。
该步骤一的操作是上述第一种方式不需要进行的,也就是说,第二种方式在结合动态词汇扩展工具进行语义扩展之前,需要先基于大语言模型对用户请求推荐的输入信息进行语义分析,然后将该语义分析信息作为动态词汇扩展工具的输入进行后续的处理。该操作在具体实现时,可调用NER模型的相关接口对用户请求推荐的输入信息进行语义分析。需要说明的是:该步骤的执行旨在可以对用户的意图进行进一步的挖掘,相比之下在用户意图识别方面效果会更好。
在一具体示例中,本步骤一可以通过调用具体大语言模型的语义分析接口使用如下公式实现:
L0 = LLM.analyse(input)
其中,接口输入参数input为用户请求推荐的输入信息,L0为接口返回的语义分析信息。
步骤二:通过动态词汇扩展工具对该语义分析信息进行语义扩展,生成语义扩展信息。
在一具体示例中,本步骤二可以通过调用具体动态词汇扩展工具—命名实体识别NER的语义扩展接口使用如下公式实现:
L1 =NER(L0)
其中,接口输入参数L0为经上述第二种方式中步骤一所得到的语义分析信息,L1为接口返回的语义扩展信息。
步骤三:基于大语言模型对该语义扩展信息进行汇总推理,生成汇总推理信息。
在一具体示例中,本步骤三可以通过调用具体大语言模型的汇总推理接口使用如下公式实现:
L2 = LLM.reasoning(L1)
其中,接口输入参数L1为经上述第二种方式中步骤二所得到的语义扩展信息,L2为接口返回的汇总推理信息。
需要说明的是:仅使用大语言模型对于用户请求推荐的输入信息进行语义分析,对于简单的需求或许也可以实现,但是不够精准,也不够专业,可能会识别偏差,所以需要用到动态词扩展。在本步骤S120中,通过将大语言模型结合动态词汇扩展机制对用户请求推荐的输入信息进行处理,从而能够准确的理解和识别用户的需求,保障后续依据该用户需求信息查询知识库时能够获取到更贴近于用户意图的推荐信息。
步骤S130:根据所述汇总推理信息查询预设的知识库以获取与所述汇总推理信息对应的查询结果。
本步骤旨在基于步骤S120中所生成的汇总推理信息,通过查询执行主体上与执行该信息推荐方法业务相关的知识库,获取与该汇总推理信息对应的信息。同时,为了克服传统的大语言模型不能在一次问答中一次性获取到需要多次问题才能获取到的信息的问题,在查询知识库时通过并发查询的方式(即:将该汇总推理信息作为输入参数同时调用多个知识库的查询接口),将用户的一次提问通过语义扩展和推理后的汇总推理信息同时进行多个查询知识库的操作,从而使用户通过一次提问就可以获得所能得到的多个信息。
本步骤在具体实现时,首先对大语言模型设置prompt,即:给大语言模型设置一个角色,比如在旅游业务领域具体实现时,就是:你是一个出色的旅行助手,了解关于旅游行业的知识。这时在prompt里边写入接口的识别,比如:识别到北京到上海的机票,就会调用hbgj_flight接口。当识别到需查询多种信息(如:机票、酒店和火车等),则触发调用多个接口,比如包含机票、酒店、火车票的三个接口,此时就会组装成一个请求参数,然后在接口后台并发请求这三个请求,这三个接口如果包含旅游景点信息,就调用并查询对应的知识库,并返回查询结果数据。
在发送并发请求时,执行主体可调用多线程处理模块,在各线程里分别就各知识库进行查询,从而实现并发处理。具体操作包括:基于大语言模型并根据该汇总推理信息生成与该汇总推理信息对应的并发请求;根据所述并发请求调用预设的知识库的查询接口用以获取与汇总推理信息对应的查询结果。
在一具体示例中,当该信息推荐方法应用于旅游业务领域时,该预设的知识库包括但不限于:机票业务实时知识库,酒店业务实时知识库,火车票业务实时知识库,旅游专业向量知识库。在此应用场景下,本步骤S130操作可通过在多线程调用模块中利用如下公式实现:
V=Vector(L2)
T=Train(L2)
F=Flight(L2)
H=Hotel(L2)
其中,Vector接口为旅游专业向量实时知识库查询接口,V为通过Vector接口查询到的旅游专业知识;Train接口为火车票业务实时知识库查询接口,T为通过Train接口查询到的火车票业务实时信息;Flight接口为机票业务实时知识库查询接口,F为通过Flight接口查询到的飞机票业务实时信息;Hotel接口为酒店业务实时知识库查询接口,H为通过Hotel接口查询到的酒店业务实时信息知识;输入参数L2为在基于步骤S120中所生成的汇总推理信息。
例如:对于上述例子中由大语言模型对其分析后所推理出的“出发地:上海”、“到达地:北京”、“人数:2人”、“出发时间:2023-12-12”。
通过本步骤S130并发查询机票业务实时知识库、酒店业务实时知识库、火车票业务实时知识库和旅游专业向量知识库之后,可查询到关于包含2023-12-12当日的机票、火车票、当日北京可入住的酒店以及北京的旅游景点等内容。
步骤S140:基于大语言模型对所述查询结果进行总结以生成推荐信息。
基于从知识库中查询到的有些数据可能会特别专业,甚至是英文或其他语言的,如果直接将这些生涩难懂的查询结果信息推送给用户,用户有可能看不懂,所以需要大语言模型对查询到的各个内容根据其特点按需进行处理,比如:将其他语言转换为中文等。另外,直接从知识库中查询到的实时数据是没有经过润色的,返回的话术很生硬,不如大语言模型总结之后的更加通俗易懂。本发明基于上述原因考虑,在本步骤中基于大语言模型对该查询结果进行总结,从而生成更易理解更有逻辑性的推荐信息。
步骤S150:向用户输出所述推荐信息。
本步骤旨在将生成的推荐信息推荐给用户,以便用户可以依据该推荐信息规划安排后续操作。具体推荐信息以何种形式(包括文本、图像或其他形式)输出给用户,可根据具体实现需要而定。
具体地,可直接将在步骤S140中基于大语言模型生成的推荐信息输出给用户,也可以先对该推荐信息通过生成式对抗网络(GAN,Generative Adversarial Nets)进行对抗训练处理,然后再将训练处理后的推荐信息输出给用户。推荐信息经GAN对抗训练处理后,可以使推荐内容更加专业更加准确。
在基于上述步骤S130所提及的具体示例中,在对经步骤S140所生成的推荐信息进行GAN对抗训练处理时,可通过如下公式实现:
其中,V为调用查询旅游专业向量知识库接口的返回结果,T为调用查询火车票业务实时知识库接口的返回结果,F为调用机票业务实时知识库接口的返回结果,H为调用查询酒店业务实时知识库接口的返回结果,K1为与V相关的推荐系数,K2为与T相关的推荐系数,K3为与F相关的推荐系数,K4为与H相关的推荐系数。例如:在一具体实现中,假设火车票返回10条数据,如果推荐1趟车次,那K2就是0.1,如果推荐2趟车次,K2就是0.2。
为了加深对于上述信息推荐方法的执行步骤的理解,下面通过一个具体实施例分别展开阐述:
对于用户请求推荐的输入信息“孩子寒假想去乌鲁木齐玩”,该具体实施例对应的步骤包括:
步骤一:调用相关接口用以获取用户请求推荐的输入信息“孩子寒假想去乌鲁木齐玩”。
步骤二:调用大语言模型相关接口对上述输入信息进行语义分析,生成语义分析信息。
该语义分析信息具体内容如下:
根据用户输入的提问:“孩子寒假想去乌鲁木齐玩”,可以进行如下思考和回答:1、首先,提供乌鲁木齐的旅游景点。2、我们还可以提供一些去乌鲁木齐的交通方式。3、提供乌鲁木齐的住宿酒店信息作为参考。
步骤三:调用动态词汇扩展工具接口对上述语义分析信息进行语义扩展,生成语义扩展信息。
该语义扩展信息具体内容如下:
"寒假从北京到乌鲁木齐的火车,寒假从北京到乌鲁木齐,寒假乌鲁木齐的旅游景点,寒假乌鲁木齐的景点”。
步骤四:调用大语言模型相关接口对上述语义扩展信息进行汇总推理,生成汇总推理信息。
该汇总推理信息具体内容如下:
"综上所述,我们可以回答用户的提问:“孩子寒假想去乌鲁木齐玩”的回答如下:根据您的提问,我们可以提供如下信息:
- 乌鲁木齐的旅游景点
- 北京去乌鲁木齐的机票
- 北京去乌鲁木齐的火车票
- 乌鲁木齐的酒店
请注意,具体的景点和活动信息可能会因季节、天气等因素而有所变化,建议您在出行前查询最新的信息以获取准确的推荐。"
步骤五:同时调用train_result、flight_result、hotel_result、vector_result接口,以便并发查询机票业务实时知识库、酒店业务实时知识库、火车票业务实时知识库和旅游专业向量知识库以获取与上述汇总推理信息对应的查询结果。
该查询结果具体内容如下:
train_result:为您查询:北京 - 乌鲁木齐 2023-11-15的列车信息如下:
很抱歉,我找不到与您提供的日期和路线相匹配的火车票信息。建议您提前预订火车票,或者考虑其他交通方式前往目的地。如有其他问题,我将尽力帮助您解答
flight_result:为您查询:为您查询:北京 - 乌鲁木齐 2024-01-15的航班信息如下:
1.{"航班号":"JD5219","到达时间":"20:10","是否共享":"N","到达机场":"URC","舱位":"Y","耗时":"275.0","儿童价":1010,"成人价":1010,"机型大小":"中","起飞时间":"15:35","餐食":"晚餐","机型":"空客320(中)","起飞机场":"PKX"}
2.{"航班号":"CZ6910","到达时间":"23:55","是否共享":"N","到达机场":"URC","舱位":"Y","耗时":"265.0","儿童价":1147,"成人价":1147,"机型大小":"中","起飞时间":"19:30","餐食":"晚餐","机型":"波音738(中)","起飞机场":"PKX"}
3.{"航班号":"CZ6904","到达时间":"13:20","是否共享":"N","到达机场":"URC","舱位":"Y","耗时":"260.0","儿童价":1197,"成人价":1197,"机型大小":"大","起飞时间":"09:00","餐食":"晚餐","机型":"波音788(大)","起飞机场":"PKX"}
4.{"航班号":"CZ6908","到达时间":"16:30","是否共享":"N","到达机场":"URC","舱位":"Y","耗时":"270.0","儿童价":1197,"成人价":1197,"机型大小":"中","起飞时间":"12:00","餐食":"晚餐","机型":"空客321(中)","起飞机场":"PKX"}
5.{"航班号":"CZ6912","到达时间":"18:20","是否共享":"N","到达机场":"URC","舱位":"Y","耗时":"260.0","儿童价":1197,"成人价":1197,"机型大小":"中","起飞时间":"14:00","餐食":"晚餐","机型":"波音73N(中)","起飞机场":"PKX"}
- hotel_result:为您查询:为您查询:- 乌鲁木齐 2024-01-15的酒店信息如下:
{"msg": "success", "total": 20, "note": "根据价格由高到低,有20个符合条件,只展示前10条",
"data": [
{"hotelName": "乌鲁木齐希尔顿酒店", "address": "红光山路1237号", "commentNum": 1280, "price": 2537, "type": "豪华型", "starNum": 5, "landmark":"国际会展中心"},
{"hotelName": "乌鲁木齐县名苑雅墅", "address": "水西沟镇南溪南路194号", "commentNum": 0, "price": 2234, "type": "经济型", "starNum": 2, "landmark": None},
{"hotelName": "乌鲁木齐康莱德酒店", "address": "友好北路669号", "commentNum": 74, "price": 1031, "type": "豪华型", "starNum": 5, "landmark": "友好路商业区"},
{"hotelName": "乌鲁木齐县云水·檀心客栈", "address": "水西沟镇水西沟村112号", "commentNum": 8, "price": 825, "type": "经济型", "starNum": 2, "landmark": None},
{"hotelName": "乌鲁木齐富力万达文华酒店", "address": "玄武湖路567号","commentNum": 1215, "price": 793, "type": "豪华型", "starNum": 5, "landmark":"乌鲁木齐高铁站地区"},
{"hotelName": "乌鲁木齐锦江国际酒店", "address": "安居南路802号", "commentNum": 2147, "price": 680, "type": "豪华型", "starNum": 5, "landmark":"南湖"},
{"hotelName": "乌鲁木齐陈陈家民宿", "address": "玄武湖路433号万达广场12号公寓楼0819-0825室", "commentNum": 10, "price": 658, "type": "经济型", "starNum": 2, "landmark": "乌鲁木齐高铁站地区"},
{"hotelName": "乌鲁木齐县自由之山民宿", "address": "板房沟镇南庄大道合胜村4队119号", "commentNum": 0, "price": 654, "type": "舒适型", "starNum":3, "landmark": None},
{"hotelName": "乌鲁木齐县山上见民宿", "address": "水西沟镇平西梁村2号", "commentNum": 1, "price": 646, "type": "舒适型", "starNum": 3, "landmark": None},
{"hotelName": "乌鲁木齐县萨慕迩森民宿", "address": "水西沟方家庄村委会对面", "commentNum": 2, "price": 617, "type": "经济型", "starNum": 1, "landmark": None}], "HbgjHotel_cost": 6511}
vector_result:为您查询:乌鲁木齐的简介如下:
乌鲁木齐有许多著名的旅游景点,包括天山天池、红山公园、大巴扎、南湖公园等。您可以根据自己的兴趣和时间安排选择适合您的景点参观。- 特色活动和体验:除了景点,乌鲁木齐还有许多特色的活动和体验,例如品尝新疆美食、体验乌鲁木齐的民俗文化、探索自然风光等。您可以根据自己的喜好选择参与这些活动,感受乌鲁木齐的独特魅力。
步骤六:调用大语言模型相关接口对上述查询结果进行总结以生成推荐信息。
具体推荐信息如下:
总结:您可以选择乘坐价格最低的JD5219航班,北京大兴机场到乌鲁木齐机场,15:35出发,20:10到达,票价1010元。因为火车票提前预定时间仅为15天放票,所以没查到对应的火车票信息,您可以选择到火车票开售日在进行预定因为到达时间比较晚,建议您提前预定五星级乌鲁木齐锦江国际酒店,价格也比较优惠,您可以去天山天池、红山公园、大巴扎、南湖公园等。您可以根据自己的兴趣和时间安排选择适合您的景点参观。
步骤七:相关接口对上述推荐信息进行生成式对抗网络GAN对抗训练处理。
其中,训练处理后的推荐信息具体内容如下:
GAN总结:
1. 航班选择:您可以选择乘坐价格最低的JD5219航班,从北京大兴机场到乌鲁木齐机场,15:35出发,20:10到达,票价为1010元。
2. 火车票预定:由于火车票提前预定时间仅为15天放票,所以当前查询不到对应的火车票信息。建议您在火车票开售日进行预定。
3. 酒店预定:由于到达时间较晚,建议您提前预定五星级乌鲁木齐锦江国际酒店,可以享受较优惠的价格。
4. 景点推荐:乌鲁木齐有许多著名的旅游景点,如天山天池、红山公园、大巴扎、南湖公园等。
请注意,具体的航班、火车票和酒店信息可能会因季节、天气等因素而有所变化,建议您提前查询和预订以确保顺利出行和住宿。
步骤八:向用户输出该训练处理后的推荐信息。
由上述步骤可知,本发明实施例中通过将大语言模型结合动态词汇扩展机制对用户请求推荐的输入信息进行处理,从而能够准确的理解和识别用户的需求,保障后续依据该用户需求信息查询知识库时能够获取到更贴近于用户意图的推荐信息。另外,通过查询符合当前业务的实时知识库和向量知识库,能够实时查询和预定相关的服务和建议,从而提高用户体验。本发明实施例还针对传统的大语言模型不能一次提问多次处理的问题,通过在查询知识库时通过并发查询的方式,将用户的一次提问通过语义扩展和推理后的汇总推理信息同时进行多个查询知识库的操作,从而使用户通过一次提问就可以获得所能得到的多个信息,以此对该问题进行解决和完善。
图2是本发明实施例的信息推荐装置结构示意图,包括如下模块:
用户输入信息获取模块210,设置为获取用户请求推荐的输入信息;
汇总推理信息获取模块220,设置为基于大语言模型并结合动态词汇扩展工具对所述输入信息进行处理,得到汇总推理信息;
查询结果获取模块230,设置为根据所述汇总推理信息查询预设的知识库以获取与所述汇总推理信息对应的查询结果;
推荐信息生成模块240,设置为基于大语言模型对所述查询结果进行总结以生成推荐信息;
推荐信息输出模块250,设置为向用户输出所述推荐信息。
图3为本发明实施例的电子设备的硬件结构示意图。如图3所示,该电子设备包括:存储器310和处理器320,其中,存储器310和处理器320通信;示例性的,存储器310和处理器320通过通信总线330通信,所述存储器310用于存储计算机程序,所述处理器320执行所述计算机程序实现上述实施例所示的信息推荐方法。
可选地,电子设备还可以包括发送器和/或接收器。
可选地,上述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、PLC(Programmable Logic Controller,可编程逻辑控制器)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、DSP(Digital SignalProcessor,数字信号处理器)或ASIC(Application Specific Integrated Circuit,专用集成电路)来实现。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于实现上述任意方法实施例所述的信息推荐方法。
本发明实施例提供一种芯片,该芯片用于支持接收设备(例如终端设备、网络设备等)实现本发明实施例所示的功能,该芯片具体用于芯片系统,该芯片系统可以由芯片构成,也可以包括芯片和其他分立器件。当实现上述方法的为接收设备内的芯片时,芯片包括处理单元,进一步的,芯片还可以包括通信单元,所述处理单元例如可以是处理器,当芯片包括通信单元时,所述通信单元例如可以是输入/输出接口、管脚或电路等。处理单元执行本发明实施例中各个处理模块所执行的全部或部分动作,通信单元可执行相应的接收或发送动作。在另一个具体的实施例中,本发明实施例中的接收设备的处理模块可以是芯片的处理单元,控制设备的接收模块或发送模块是芯片的通信单元。
本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品。
本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图来描述的。应理解可由计算机程序指令实现流程图中的每一流程。
这些计算机程序指令可以存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现流程图一个流程或多个流程中指定的功能。
也可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程中指定的功能的装置。
本发明的另一实施例涉及一种非易失性存储介质,用于存储计算机可读程序,所述计算机可读程序用于供计算机执行上述部分或全部的方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指定相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种信息推荐方法,其特征在于,所述方法包括:
获取用户请求推荐的输入信息;
基于大语言模型并结合动态词汇扩展工具对所述输入信息进行处理,得到汇总推理信息;
根据所述汇总推理信息查询预设的知识库以获取与所述汇总推理信息对应的查询结果;
基于大语言模型对所述查询结果进行总结以生成推荐信息;
向用户输出所述推荐信息。
2.根据权利要求1所述的方法,其特征在于,所述基于大语言模型并结合动态词汇扩展工具对所述输入信息进行处理,得到汇总推理信息,具体包括:
基于大语言模型对所述输入信息进行语义分析,生成语义分析信息;
通过所述动态词汇扩展工具对所述语义分析信息进行语义扩展,生成语义扩展信息;
基于大语言模型对所述语义扩展信息进行汇总推理,生成所述汇总推理信息。
3.根据权利要求1所述的方法,其特征在于,所述基于大语言模型并结合动态词汇扩展工具对所述输入信息进行处理,得到汇总推理信息,具体包括:
通过所述动态词汇扩展工具对所述输入信息进行语义扩展,生成语义扩展信息;
基于大语言模型对所述语义扩展信息进行汇总推理,生成所述汇总推理信息。
4.根据权利要求1~3中任一所述的方法,其特征在于,其中,所述动态词汇扩展工具包括以下工具的其中一种:命名实体识别NER模型,ELK-动态扩展分词器。
5.根据权利要求1所述的方法,其特征在于,所述根据所述汇总推理信息查询预设的知识库以获取与所述汇总推理信息对应的查询结果,具体包括:
基于大语言模型并根据所述汇总推理信息生成与所述汇总推理信息对应的并发请求;
根据所述并发请求调用所述预设的知识库的查询接口用以获取与所述汇总推理信息对应的查询结果。
6.根据权利要求1或5所述的方法,其特征在于,所述方法应用于旅游业务领域,其中,所述预设的知识库至少包括以下其中一种:机票业务实时知识库,酒店业务实时知识库,火车票业务实时知识库,旅游专业向量知识库。
7.根据权利要求1所述的方法,其特征在于,所述向用户输出所述推荐信息,具体包括:对所述推荐信息进行生成式对抗网络GAN对抗训练处理,向用户输出训练处理后的推荐信息。
8.一种推荐设备,其特征在于,所述设备包括:
用户输入信息获取模块,设置为获取用户请求推荐的输入信息;
汇总推理信息获取模块,设置为基于大语言模型并结合动态词汇扩展工具对所述输入信息进行处理,得到汇总推理信息;
查询结果获取模块,设置为根据所述汇总推理信息查询预设的知识库以获取与所述汇总推理信息对应的查询结果;
推荐信息生成模块,设置为基于大语言模型对所述查询结果进行总结以生成推荐信息;
推荐信息输出模块,设置为向用户输出所述推荐信息。
9.一种电子设备,其特征在于,包括存储器和处理器,所述处理器执行所述存储器中的程序指令,用于实现权利要求1~7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于实现权利要求1~7任一项所述的方法。
CN202410082270.5A 2024-01-19 2024-01-19 信息推荐方法、装置、电子设备和计算机可读存储介质 Pending CN117609433A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410082270.5A CN117609433A (zh) 2024-01-19 2024-01-19 信息推荐方法、装置、电子设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410082270.5A CN117609433A (zh) 2024-01-19 2024-01-19 信息推荐方法、装置、电子设备和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN117609433A true CN117609433A (zh) 2024-02-27

Family

ID=89960177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410082270.5A Pending CN117609433A (zh) 2024-01-19 2024-01-19 信息推荐方法、装置、电子设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN117609433A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190205301A1 (en) * 2016-10-10 2019-07-04 Microsoft Technology Licensing, Llc Combo of Language Understanding and Infomation Retrieval
CN116821318A (zh) * 2023-08-29 2023-09-29 中船奥蓝托无锡软件技术有限公司 基于大语言模型的业务知识推荐方法、装置及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190205301A1 (en) * 2016-10-10 2019-07-04 Microsoft Technology Licensing, Llc Combo of Language Understanding and Infomation Retrieval
CN116821318A (zh) * 2023-08-29 2023-09-29 中船奥蓝托无锡软件技术有限公司 基于大语言模型的业务知识推荐方法、装置及存储介质

Similar Documents

Publication Publication Date Title
US20220231985A1 (en) Contextually-based automatic service offerings to users of machine system
Bennardo Language, space, and social relationships: A foundational cultural model in Polynesia
CN105190607B (zh) 通过智能数字助理的用户培训
KR102513999B1 (ko) 컴퓨팅 디바이스간의 액세스 제어 동기화
Cabrero et al. A hermeneutic inquiry into user-created personas in different Namibian locales
CN106384167A (zh) 一种乡村旅游路线规划系统
CN106202260A (zh) 搜索方法、装置和搜索引擎
Finley et al. Language, education and Uyghur identity in urban Xinjiang
CN114969282B (zh) 基于富媒体知识图谱多模态情感分析模型的智能交互方法
Felski Modernist studies and cultural studies: reflections on method
CN109584113A (zh) 基于gps定位的乡村旅游景点推送系统及其实现方法
Xiang 5G era
Hom Chinese women traversing diaspora: memoirs, essays, and poetry
Jialiang et al. Research on the auxiliary treatment system of childhood autism based on virtual reality
CN117609433A (zh) 信息推荐方法、装置、电子设备和计算机可读存储介质
Hailong The Change and Construction of Chinese National Image in 1949-2019.
Chi Cross-cultural experiences of Chinese immigrant mothers in Canada: Challenges and opportunities for schooling
Leokhin et al. Research of the Influence of the Semantics and Syntax of a Text Request on the Image Quality Generated by Neural Network Techniques
Yamini Krishna The neo-liberal city and cinema: Deccani films
Duan et al. Media’s Role in the AI Era?
Ito et al. A cognitive model of sightseeing for mobile support system
Huynh “Dear Friends”: From People’s Cultural Exchange to People’s Cultural Production
FitzGerald Negotiating the national and transnational in Glen Goei’s films: The Confucian patriarch and the return of the prodigal son
Cozen Mediating energy: Rhetoric and the future of energy resources
Chi Negotiating two worlds: A cross-cultural narrative of Chinese immigrant parents' encounter with Canadian schooling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination