CN107590166A - 一种基于查询内容的数据生成方法及装置 - Google Patents

一种基于查询内容的数据生成方法及装置 Download PDF

Info

Publication number
CN107590166A
CN107590166A CN201611188247.6A CN201611188247A CN107590166A CN 107590166 A CN107590166 A CN 107590166A CN 201611188247 A CN201611188247 A CN 201611188247A CN 107590166 A CN107590166 A CN 107590166A
Authority
CN
China
Prior art keywords
corresponding relation
data
tentation data
functional attributes
back ground
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611188247.6A
Other languages
English (en)
Other versions
CN107590166B (zh
Inventor
刘勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201611188247.6A priority Critical patent/CN107590166B/zh
Priority to US15/617,628 priority patent/US11301515B2/en
Priority to JP2017114246A priority patent/JP6621444B2/ja
Publication of CN107590166A publication Critical patent/CN107590166A/zh
Application granted granted Critical
Publication of CN107590166B publication Critical patent/CN107590166B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying

Abstract

本发明提出了一种基于查询内容的数据生成方法及装置,其中的方法包括:将所述查询内容与数据库中预定数据的基础信息建立第一对应关系;将所述预定数据的功能属性与所述查询内容的目的属性建立第二对应关系;根据所述第一对应关系和所述第二对应关系生成目标数据。本发明根据查询内容与预定数据的基础信息和功能属性分别建立对应关系,并根据该对应关系生成目标数据,从而以较高的准确性根据用户的需求为用户提供数据不仅能够提高数据提供的效率,而且能够增加用户使用体验。

Description

一种基于查询内容的数据生成方法及装置
技术领域
本发明涉及计算机领域,尤其涉及一种基于查询内容的数据生成方法及装置。
背景技术
随着电子商务的发展,数据提供商在根据客户的需求向客户提供数据时更多的依赖行业大数据。而目前各行业普遍存在无法提供统一标准化的行业数据的问题,导致为用户提供的数据的准确性无法满足需求。
发明内容
本发明解决的技术问题之一是目前各行业普遍存在无法提供统一标准化的行业数据,导致为用户提供的数据的准确性无法满足需求。
根据本发明一方面的一个实施例,提供了一种基于查询内容的数据生成方法,包括:
将所述查询内容与数据库中预定数据的基础信息建立第一对应关系;
将所述预定数据的功能属性与所述查询内容的目的属性建立第二对应关系;
根据所述第一对应关系和所述第二对应关系生成目标数据。
根据本发明另一方面的一个实施例,提供了一种基于查询内容的数据生成装置,包括:
用于将所述查询内容与数据库中预定数据的基础信息建立第一对应关系的装置;
用于将所述预定数据的功能属性与所述查询内容的目的属性建立第二对应关系的装置;
用于根据所述第一对应关系和所述第二对应关系生成目标数据的装置。
由于本实施例根据查询内容与预定数据的基础信息和功能属性分别建立对应关系,并根据该对应关系生成目标数据,从而以较高的准确性根据用户的需求为用户提供数据不仅能够提高数据提供的效率,而且能够增加用户使用体验。
本领域普通技术人员将了解,虽然下面的详细说明将参考图示实施例、附图进行,但本发明并不仅限于这些实施例。而是,本发明的范围是广泛的,且意在仅通过后附的权利要求限定本发明的范围。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出了根据本发明提出的基于查询内容的数据生成方法的流程图。
图2示出了本发明的确定所述预定数据的基础信息的流程图。
图3示出了本发明的生成目标数据的过程的流程示意图。
图4示出了本发明的一种基于查询内容的数据生成方法的流程图。
图5示出了本发明的又一种基于查询内容的数据生成方法的流程图。
图6示出了根据本发明提出的基于查询内容的数据生成装置的框图。
图7示出了本发明的第一对应关系建立装置的框图。
图8示出了本发明的数据生成装置的框图。
图9示出了本发明的实施例三提出的又一基于查询内容的数据生成装置的框图。
图10示出了本发明的实施例四提出的又一基于查询内容的数据生成装置的框图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。
所述计算机设备包括用户设备与网络设备。其中,所述用户设备包括但不限于电脑、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
需要说明的是,所述用户设备、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。
这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本发明的示例性实施例的目的。但是本发明可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
应当理解的是,当一个单元被称为“连接”或“耦合”到另一单元时,其可以直接连接或耦合到所述另一单元,或者可以存在中间单元。与此相对,当一个单元被称为“直接连接”或“直接耦合”到另一单元时,则不存在中间单元。应当按照类似的方式来解释被用于描述单元之间的关系的其他词语(例如“处于...之间”相比于“直接处于...之间”,“与...邻近”相比于“与...直接邻近”等等)。
这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。
还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。
下面结合附图对本发明作进一步详细描述。
图1是根据本发明一个实施例的基于查询内容的数据生成方法的流程图。
结合图1中所示,本实施例所述的基于查询内容的数据生成方法,包括如下步骤:
S110、将所述查询内容与数据库中预定数据的基础信息建立第一对应关系;
S120、将所述预定数据的功能属性与所述查询内容的目的属性建立第二对应关系;
S130、根据所述第一对应关系和所述第二对应关系生成目标数据。
下面对各步骤做进一步详细介绍。
步骤S110中,可首先获取用户提交的查询内容,然后解析出该查询内容包括的功能属性,再根据该功能属性从预定的数据库中确定相关的预定数据的基础信息。
其中,在建立所述第一对应关系之前,所述方法还可以将所述预定数据进行结构化处理,然后确定经过所述结构化处理的所述预定数据的基础信息。所述预定数据的基础信息可以包括:名称、身份标识、使用属性、授权码和/或成分。
可选的,在建立第一对应关系的过程中,可将所述与的数据的搜索次数和获取次数作为参数增加到所述第一对应关系中。
可选的,结合图2所示,确定所述预定数据的基础信息的步骤包括:
步骤S210、将所述预定数据按照功能属性拆分成预定数量的条目;
步骤S220、将所述条目建立正则表达式;
步骤S230、根据所述正则表达式抽取结构化信息;
步骤S240、将所述结构化信息存储为所述预定数据的基础信息。
步骤S120中,可首先确定所述查询内容的目的属性,然后根据所述预定数据的功能属性建立所述查询内容的目的属性与所述与的数据的功能属性之间的第二对应关系。
可选的,确定所述预定数据的功能属性的步骤包括:通过网络爬虫抓取或从所述数据库中提取所述预定数据的功能属性信息。
步骤S130中,可根据所述第一对应关系和所述第二对应关系生成目标数据。
可选的,结合图3所示,生成目标数据的过程可以包括:
S310、建立所述预定数据的功能属性与预定表现形式的对应关系;
S320、建立所述预定数据的功能属性与预定诊断结果的对应关系;
S330、根据所述与预定表现形式的对应关系和所述与预定诊断结果的对应关系生成所述目标数据。
其中,建立所述预定数据的功能属性与预定表现形式的对应关系的过程可以包括:确定所述预定数据的身份标识和使用数量与所述预定表现形式的名称之间的对应关系。
其中,建立所述预定数据的功能属性与预定诊断结果的对应关系的步骤可以包括:确定所述预定数据的身份标识和使用数量与所述预定诊断结果的名称之间的对应关系。
采用本实施例提出的技术方案,根据查询内容与预定数据的基础信息和功能属性分别建立对应关系,并根据该对应关系生成目标数据,从而以较高的准确性根据用户的需求为用户提供数据不仅能够提高数据提供的效率,而且能够增加用户使用体验。
实施例一
在本实施例中提出了又一基于查询内容的数据生成方法,结合图4中所示,包括如下步骤:
S410、确定经过结构化处理的预定数据的基础信息。
该基础信息可以包括名称、身份标识、使用属性、授权码和/或成分等。
本实施例以药品说作为预定数据,首先可对该药品的说明书进行结构化处理,该结构化处理的过程可以是将该药品的说明书的内容按照数据名称、数据类型和数据描述进行分类。
例如:在数据名称中包括的基础信息为:药品名称、授权码、生产商、功效、剂量、禁忌、使用方法、适用人群以及成分;与该数据名称对应的数据类型可以包括字符串和数值;与该数据名称对应的数据描述可以包括有关部门为该药品颁发的授权码、服用的剂量及其单位、适用人群的类型及药品配方等。
在对药品说明书进行结构化处理后,即可将数据名称、数据类型和数据描述包括的信息作为该药品说明书的基础信息。
S420、将查询内容与数据库中预定数据的基础信息建立第一对应关系。
在药品数据库中通常存储有每个药品的基础信息,当用户输入查询内容时,可首先分析该查询内容与该药品的基础信息之间的关联。该关联可以包括查询内容与药品名称的基础信息之间是否有相同或相近似的文字、该药品被浏览或购买的次数等。若该查询内容与药品名称的基础信息中的关键字相同(例如感冒、发炎等)或相近似(例如头痛与头疼等),则可将该查询内容与该药品名称的基础信息建立第一对应关系。该第一对应关系可以是一对一,也可以是一对多。
例如当用户输入的查询内容是治疗感冒时,则可将该查询内容与某感冒胶囊和某感冒冲剂建立第一对应关系。另外,在该第一对应关系中,还可包括对药品名称的排序,例如按照该药品被浏览的次数从多到少或被购买的次数从多到少的顺序排序。
S430、将所述预定数据的功能属性与预定表现形式建立第二对应关系。
针对药品,当用户无法对疾病进行确诊时,查询内容的目的属性可以为某种疾病的表现形式,例如发烧、头痛、鼻塞等,而药品的功效中通常也包括对应疾病的表现形式。因此可将药品与疾病的症状之间建立第二对应关系。其中,可通过网络爬虫抓取或从所述数据库中提取药品的功能属性。
例如当用户输入的查询内容是治疗发热时,则可将能够治疗发热的药品名称与发热建立第二对应关系。另外,在该第二对应关系中,还可包括药品标识、对该症状的描述以及有效使用药品治愈症状的信息数量。
S440、根据所述第一对应关系和所述第二对应关系生成目标数据。
根据所述第一对应关系和所述第二对应关系生产的目标数据可以包括根据查询内容与该药品名称的基础信息建立的第一对应关系和根据该药品的功能属性与所述查询内容中包括的症状建立的第二对应关系。
例如,该目标数据可以包括三个部分的内容,第一部分为药品的基本信息,第二部分为查询内容与药品之间的关系,第三部分为药品与症状之间的关系。
实施例二
在本实施例中提出了又一基于查询内容的数据生成方法,结合图5中所示,包括如下步骤:
S510、确定经过结构化处理的预定数据的基础信息。
该基础信息可以包括名称、身份标识、使用属性、授权码和/或成分等。
本实施例以药品说作为预定数据,首先可对该药品的说明书进行结构化处理,该结构化处理的过程可以是将该药品的说明书的内容按照数据名称、数据类型和数据描述进行分类。
例如:在数据名称中包括的基础信息为:药品名称、授权码、生产商、功效、剂量、禁忌、使用方法、适用人群以及成分;与该数据名称对应的数据类型可以包括字符串和数值;与该数据名称对应的数据描述可以包括有关部门为该药品颁发的授权码、服用的剂量及其单位、适用人群的类型及药品配方等。
在对药品说明书进行结构化处理后,即可将数据名称、数据类型和数据描述包括的信息作为该药品说明书的基础信息。
S520、将查询内容与数据库中预定数据的基础信息建立第一对应关系。
在药品数据库中通常存储有每个药品的基础信息,当用户输入查询内容时,可首先分析该查询内容与该药品的基础信息之间的关联。该关联可以包括查询内容与药品名称的基础信息之间是否有相同或相近似的文字、该药品被浏览或购买的次数等。若该查询内容与药品名称的基础信息中的关键字相同(例如感冒、发炎等)或相近似(例如头痛与头疼等),则可将该查询内容与该药品名称的基础信息建立第一对应关系。该第一对应关系可以是一对一,也可以是一对多。
例如当用户输入的查询内容是治疗感冒时,则可将该查询内容与某感冒胶囊和某感冒冲剂建立第一对应关系。另外,在该第一对应关系中,还可包括对药品名称的排序,例如按照该药品被浏览的次数从多到少或被购买的次数从多到少的顺序排序。
S530、将所述预定数据的功能属性与预定诊断结果建立第二对应关系。
针对药品,当用户已经获得对某种疾病的诊断结果时,查询内容的目的属性可以为某种疾病的名称,例如扁桃体炎、血管性偏头痛等,而药品的功效中通常也包括能够有效治疗的疾病名单。因此可将药品与疾病的名称之间建立第二对应关系。其中,可通过网络爬虫抓取或从所述数据库中提取药品的功能属性。
例如当用户输入的查询内容是治疗扁桃体炎时,则可将能够治疗扁桃体炎的药品名称与扁桃体炎建立第二对应关系。另外,在该第二对应关系中,还可包括药品标识、疾病名称以及有效使用药品治愈该疾病的信息数量。
S540、根据所述第一对应关系和所述第二对应关系生成目标数据。
根据所述第一对应关系和所述第二对应关系生产的目标数据可以包括根据查询内容与该药品名称的基础信息建立的第一对应关系和根据该药品的功能属性与所述查询内容中包括的疾病名称建立的第二对应关系。
例如,该目标数据可以包括三个部分的内容,第一部分为药品的基本信息,第二部分为查询内容与药品之间的关系,第三部分为药品与症状之间的关系。
结合图6中所示,本实施例所述的基于查询内容的数据生成装置可以包括如下的装置:
用于将所述查询内容与数据库中预定数据的基础信息建立第一对应关系的装置(以下简称“第一对应关系建立装置”)610;
用于将所述预定数据的功能属性与所述查询内容的目的属性建立第二对应关系的装置(以下简称“第二对应关系建立装置”)620;
用于根据所述第一对应关系和所述第二对应关系生成目标数据的装置(以下简称“数据生成装置”)630。
下面对各装置做进一步详细介绍。
本实施例可首先通过第一对应关系建立装置610获取用户提交的查询内容,然后解析出该查询内容包括的功能属性,再根据该功能属性从预定的数据库中确定相关的预定数据的基础信息。
其中,在通过第一对应关系建立装置610建立所述第一对应关系之前,本实施例所述的基于查询内容的数据生成装置还可以通过结构化装置将所述预定数据进行结构化处理,然后确定经过所述结构化处理的所述预定数据的基础信息。所述预定数据的基础信息可以包括:名称、身份标识、使用属性、授权码和/或成分。
可选的,在通过第一对应关系建立装置610建立第一对应关系的过程中,可将所述与的数据的搜索次数和获取次数作为参数增加到所述第一对应关系中。
可选的,结合图7所示,第一对应关系建立装置610包括:
用于将所述预定数据按照功能属性拆分成预定数量的条目的装置(简称“拆分装置”)710;
用于将所述条目建立正则表达式的装置(简称“正则表达装置”)720;
用于根据所述正则表达式抽取结构化信息的装置(简称“抽取装置”)730;
用于将所述结构化信息存储为所述预定数据的基础信息的装置(简称“信息存储装置”)740。
在通过第一对应关系建立装置610建立第一对应关系之后,还可通过第二对应关系建立装置620确定所述查询内容的目的属性,然后根据所述预定数据的功能属性建立所述查询内容的目的属性与所述与的数据的功能属性之间的第二对应关系。
可选的,通过第二对应关系建立装置620确定所述预定数据的功能属性的步骤包括:通过网络爬虫抓取或从所述数据库中提取所述预定数据的功能属性信息。
在通过第二对应关系建立装置620建立第一对应关系之后,可通过数据生成装置630根据所述第一对应关系和所述第二对应关系生成目标数据。
可选的,结合图8所示,在数据生成装置630中包括:
用于建立所述预定数据的功能属性与预定表现形式的对应关系的装置(简称“表现对应装置”)810;
用于建立所述预定数据的功能属性与预定诊断结果的对应关系的装置(简称“症状对应装置”)820;
用于根据所述与预定表现形式的对应关系和所述与预定诊断结果的对应关系生成所述目标数据的装置(简称“生成装置”)830。
其中,通过表现对应装置810建立所述预定数据的功能属性与预定表现形式的对应关系的过程可以通过用于确定所述预定数据的身份标识和使用数量与所述预定表现形式的名称之间的对应关系的装置实现。
其中,通过症状对应装置820建立所述预定数据的功能属性与预定诊断结果的对应关系的过程可以通过用于确定所述预定数据的身份标识和使用数量与所述预定诊断结果的名称之间的对应关系的装置实现。
采用本实施例提出的技术方案,根据查询内容与预定数据的基础信息和功能属性分别建立对应关系,并根据该对应关系生成目标数据,从而以较高的准确性根据用户的需求为用户提供数据不仅能够提高数据提供的效率,而且能够增加用户使用体验。
实施例三
在本实施例中提出了又一基于查询内容的数据生成装置,结合图9中所示,包括如下装置:
用于确定经过结构化处理的预定数据的基础信息的装置(以下简称“结构化处理装置”)910。
用于将查询内容与数据库中预定数据的基础信息建立第一对应关系的装置(以下简称“第一对应关系装置”)920。
用于将所述预定数据的功能属性与预定表现形式建立第二对应关系(以下简称“第二对应关系装置”)930。
用于根据所述第一对应关系和所述第二对应关系生成目标数据(以下简称“数据生成装置”)940。
本实施例以药品说作为预定数据,则该基础信息可以包括名称、身份标识、使用属性、授权码和/或成分等。首先可通过结构化处理装置910对该药品的说明书进行结构化处理,该结构化处理的过程可以是将该药品的说明书的内容按照数据名称、数据类型和数据描述进行分类。
例如:在数据名称中包括的基础信息为:药品名称、授权码、生产商、功效、剂量、禁忌、使用方法、适用人群以及成分;与该数据名称对应的数据类型可以包括字符串和数值;与该数据名称对应的数据描述可以包括有关部门为该药品颁发的授权码、服用的剂量及其单位、适用人群的类型及药品配方等。
在通过结构化处理装置910对药品说明书进行结构化处理后,即可将数据名称、数据类型和数据描述包括的信息作为该药品说明书的基础信息。
在药品数据库中通常存储有每个药品的基础信息,当用户输入查询内容时,可首先通过第一对应关系装置920分析该查询内容与该药品的基础信息之间的关联。该关联可以包括查询内容与药品名称的基础信息之间是否有相同或相近似的文字、该药品被浏览或购买的次数等。若该查询内容与药品名称的基础信息中的关键字相同(例如感冒、发炎等)或相近似(例如头痛与头疼等),则可通过第一对应关系装置920将该查询内容与该药品名称的基础信息建立第一对应关系。该第一对应关系可以是一对一,也可以是一对多。
例如当用户输入的查询内容是治疗感冒时,则可通过第一对应关系装置920将该查询内容与某感冒胶囊和某感冒冲剂建立第一对应关系。另外,在该第一对应关系中,还可包括对药品名称的排序,例如按照该药品被浏览的次数从多到少或被购买的次数从多到少的顺序排序。
针对药品,当用户无法对疾病进行确诊时,查询内容的目的属性可以为某种疾病的表现形式,例如发烧、头痛、鼻塞等,而药品的功效中通常也包括对应疾病的表现形式。因此可通过第二对应关系装置930将药品与疾病的症状之间建立第二对应关系。其中,可通过网络爬虫抓取或从所述数据库中提取药品的功能属性。
例如当用户输入的查询内容是治疗发热时,则可通过第二对应关系装置930将能够治疗发热的药品名称与发热建立第二对应关系。另外,在该第二对应关系中,还可包括药品标识、对该症状的描述以及有效使用药品治愈症状的信息数量。
通过数据生成装置940根据所述第一对应关系和所述第二对应关系生产的目标数据可以包括根据查询内容与该药品名称的基础信息建立的第一对应关系和根据该药品的功能属性与所述查询内容中包括的症状建立的第二对应关系。
例如,该目标数据可以包括三个部分的内容,第一部分为药品的基本信息,第二部分为查询内容与药品之间的关系,第三部分为药品与症状之间的关系。
实施例四
在本实施例中提出了又一基于查询内容的数据生成装置,结合图10中所示,包括如下装置:
用于确定经过结构化处理的预定数据的基础信息的装置(以下简称“结构化处理装置”)910。
用于将查询内容与数据库中预定数据的基础信息建立第一对应关系的装置(以下简称“第一对应关系装置”)920。
用于将所述预定数据的功能属性与预定诊断结果建立第二对应关系(以下简称“第二对应关系装置”)950。
用于根据所述第一对应关系和所述第二对应关系生成目标数据(以下简称“数据生成装置”)940。
本实施例以药品说作为预定数据,则该基础信息可以包括名称、身份标识、使用属性、授权码和/或成分等。首先可通过结构化处理装置910对该药品的说明书进行结构化处理,该结构化处理的过程可以是将该药品的说明书的内容按照数据名称、数据类型和数据描述进行分类。
例如:在数据名称中包括的基础信息为:药品名称、授权码、生产商、功效、剂量、禁忌、使用方法、适用人群以及成分;与该数据名称对应的数据类型可以包括字符串和数值;与该数据名称对应的数据描述可以包括有关部门为该药品颁发的授权码、服用的剂量及其单位、适用人群的类型及药品配方等。
在通过结构化处理装置910对药品说明书进行结构化处理后,即可将数据名称、数据类型和数据描述包括的信息作为该药品说明书的基础信息。
在药品数据库中通常存储有每个药品的基础信息,当用户输入查询内容时,可首先通过第一对应关系装置920分析该查询内容与该药品的基础信息之间的关联。该关联可以包括查询内容与药品名称的基础信息之间是否有相同或相近似的文字、该药品被浏览或购买的次数等。若该查询内容与药品名称的基础信息中的关键字相同(例如感冒、发炎等)或相近似(例如头痛与头疼等),则可通过第一对应关系装置920将该查询内容与该药品名称的基础信息建立第一对应关系。该第一对应关系可以是一对一,也可以是一对多。
例如当用户输入的查询内容是治疗感冒时,则可通过第一对应关系装置920将该查询内容与某感冒胶囊和某感冒冲剂建立第一对应关系。另外,在该第一对应关系中,还可包括对药品名称的排序,例如按照该药品被浏览的次数从多到少或被购买的次数从多到少的顺序排序。
针对药品,当用户已经获得对某种疾病的诊断结果时,查询内容的目的属性可以为某种疾病的名称,例如扁桃体炎、血管性偏头痛等,而药品的功效中通常也包括能够有效治疗的疾病名单。因此可通过第二对应关系装置950将药品与疾病的症状之间建立第二对应关系。其中,可通过网络爬虫抓取或从所述数据库中提取药品的功能属性。
例如当用户输入的查询内容是治疗扁桃体炎时,则可通过第二对应关系装置950将能够治疗扁桃体炎的药品名称与扁桃体炎建立第二对应关系。另外,在该第二对应关系中,还可包括药品标识、疾病名称以及有效使用药品治愈该疾病的信息数量。
通过数据生成装置940根据所述第一对应关系和所述第二对应关系生产的目标数据可以包括根据查询内容与该药品名称的基础信息建立的第一对应关系和根据该药品的功能属性与所述查询内容中包括的症状建立的第二对应关系。
例如,该目标数据可以包括三个部分的内容,第一部分为药品的基本信息,第二部分为查询内容与药品之间的关系,第三部分为药品与症状之间的关系。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
虽然前面特别示出并且描述了示例性实施例,但是本领域技术人员将会理解的是,在不背离权利要求书的精神和范围的情况下,在其形式和细节方面可以有所变化。这里所寻求的保护在所附权利要求书中做了阐述。

Claims (18)

1.一种基于查询内容的数据生成方法,包括:
将所述查询内容与数据库中预定数据的基础信息建立第一对应关系;
将所述预定数据的功能属性与所述查询内容的目的属性建立第二对应关系;
根据所述第一对应关系和所述第二对应关系生成目标数据。
2.根据权利要求1所述的方法,其中,所述方法还包括:
将所述预定数据进行结构化处理;
确定经过所述结构化处理的所述预定数据的基础信息。
3.根据权利要求2所述的方法,其中,确定所述预定数据的基础信息的步骤包括:
将所述预定数据按照功能属性拆分成预定数量的条目;
将所述条目建立正则表达式;
根据所述正则表达式抽取结构化信息;
将所述结构化信息存储为所述预定数据的基础信息。
4.根据权利要求3所述的方法,其中,所述预定数据的基础信息包括:名称、身份标识、使用属性、授权码和/或成分。
5.根据权利要求1所述的方法,其中,所述建立第一对应关系的步骤包括:
将所述预定数据的搜索次数和获取次数作为参数增加到所述第一对应关系中。
6.根据权利要求1所述的方法,其中,确定所述预定数据的功能属性的步骤包括:
通过网络爬虫抓取或从所述数据库中提取所述预定数据的功能属性信息。
7.根据权利要求1所述的方法,其中,根据所述第一对应关系和所述第二对应关系生成目标数据的步骤包括:
建立所述预定数据的功能属性与预定表现形式的对应关系;
建立所述预定数据的功能属性与预定诊断结果的对应关系;
根据所述与预定表现形式的对应关系和所述与预定诊断结果的对应关系生成所述目标数据。
8.根据权利要求7所述的方法,其中,建立所述预定数据的功能属性与预定表现形式的对应关系的步骤包括:
确定所述预定数据的身份标识和使用数量与所述预定表现形式的名称之间的对应关系。
9.根据权利要求7所述的方法,其中,建立所述预定数据的功能属性与预定诊断结果的对应关系的步骤包括:
确定所述预定数据的身份标识和使用数量与所述预定诊断结果的名称之间的对应关系。
10.一种基于查询内容的数据生成装置,包括:
用于将所述查询内容与数据库中预定数据的基础信息建立第一对应关系的装置;
用于将所述预定数据的功能属性与所述查询内容的目的属性建立第二对应关系的装置;
用于根据所述第一对应关系和所述第二对应关系生成目标数据的装置。
11.根据权利要求10所述的装置,其中,所述装置还包括:
用于将所述预定数据进行结构化处理的装置;
用于确定经过所述结构化处理的所述预定数据的基础信息的装置。
12.根据权利要求11所述的装置,其中,所述用于确定经过所述结构化处理的所述预定数据的基础信息的装置包括:
用于将所述预定数据按照功能属性拆分成预定数量的条目的装置;
用于将所述条目建立正则表达式的装置;
用于根据所述正则表达式抽取结构化信息的装置;
用于将所述结构化信息存储为所述预定数据的基础信息的装置。
13.根据权利要求12所述的装置,其中,在所述用于确定经过所述结构化处理的所述预定数据的基础信息的装置中,所述预定数据的基础信息包括:名称、身份标识、使用属性、授权码和/或成分。
14.根据权利要求10所述的装置,其中,所述用于将所述查询内容与数据库中预定数据的基础信息建立第一对应关系的装置包括:
用于将所述预定数据的搜索次数和获取次数作为参数增加到所述第一对应关系中的装置;
用于确定所述徽标信息所属的商标类别的装置。
15.根据权利要求10所述的装置,其中,所述用于建立所述查询内容的目的属性与所述预定数据的功能属性建立第二对应关系的装置包括:
用于通过网络爬虫抓取或从所述数据库中提取所述预定数据的功能属性信息的装置。
16.根据权利要求10所述的装置,其中,所述用于根据所述第一对应关系和所述第二对应关系生成目标数据的装置包括:
用于建立所述预定数据的功能属性与预定表现形式的对应关系的装置;
用于建立所述预定数据的功能属性与预定诊断结果的对应关系的装置;
用于根据所述与预定表现形式的对应关系和所述与预定诊断结果的对应关系生成所述目标数据的装置。
17.根据权利要求16所述的装置,其中,所述用于建立所述预定数据的功能属性与预定表现形式的对应关系的装置包括:
用于确定所述预定数据的身份标识和使用数量与所述预定表现形式的名称之间的对应关系的装置。
18.根据权利要求16所述的装置,其中,所述用于建立所述预定数据的功能属性与预定诊断结果的对应关系的装置包括:
用于确定所述预定数据的身份标识和使用数量与所述预定诊断结果的名称之间的对应关系的装置。
CN201611188247.6A 2016-12-20 2016-12-20 一种基于查询内容的数据生成方法及装置 Active CN107590166B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201611188247.6A CN107590166B (zh) 2016-12-20 2016-12-20 一种基于查询内容的数据生成方法及装置
US15/617,628 US11301515B2 (en) 2016-12-20 2017-06-08 Method and apparatus for generating data based on query content
JP2017114246A JP6621444B2 (ja) 2016-12-20 2017-06-09 問い合わせ内容に基づくデータ生成方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611188247.6A CN107590166B (zh) 2016-12-20 2016-12-20 一种基于查询内容的数据生成方法及装置

Publications (2)

Publication Number Publication Date
CN107590166A true CN107590166A (zh) 2018-01-16
CN107590166B CN107590166B (zh) 2019-02-12

Family

ID=61045489

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611188247.6A Active CN107590166B (zh) 2016-12-20 2016-12-20 一种基于查询内容的数据生成方法及装置

Country Status (3)

Country Link
US (1) US11301515B2 (zh)
JP (1) JP6621444B2 (zh)
CN (1) CN107590166B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110310739A (zh) * 2018-03-20 2019-10-08 贺丽君 信息处理系统及方法、健康信息专家系统
CN111078906A (zh) * 2018-10-18 2020-04-28 杭州海康威视数字技术股份有限公司 图像查询、信息同步方法及装置
CN117556790A (zh) * 2024-01-02 2024-02-13 四川大学华西医院 医疗信息处理方法、装置、设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050182764A1 (en) * 2004-02-13 2005-08-18 Evans Lynne M. System and method for arranging concept clusters in thematic neighborhood relationships in a two-dimensional visual display space
CN101169780A (zh) * 2006-10-25 2008-04-30 华为技术有限公司 一种基于语义本体的检索系统和方法
CN101452463A (zh) * 2007-12-05 2009-06-10 浙江大学 定向抓取页面资源的方法和装置
CN101859304A (zh) * 2009-04-13 2010-10-13 北京市疾病预防控制中心 常见毒物数据检索系统
CN104887527A (zh) * 2015-06-26 2015-09-09 青岛永乐互联网技术有限公司 一种基于医嘱的药物服用提示反馈方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10301943A (ja) * 1997-04-24 1998-11-13 Canon Inc 画像処理装置及びその制御方法
US6247009B1 (en) 1997-03-10 2001-06-12 Canon Kabushiki Kaisha Image processing with searching of image data
US6917922B1 (en) * 2001-07-06 2005-07-12 Amazon.Com, Inc. Contextual presentation of information about related orders during browsing of an electronic catalog
JP3934616B2 (ja) 2004-02-13 2007-06-20 埼玉日本電気株式会社 携帯電話機のメニュー検索システム及び方法
WO2009032287A1 (en) * 2007-09-07 2009-03-12 Enhanced Medical Decisions, Inc. Management and processing of information
US9262513B2 (en) * 2011-06-24 2016-02-16 Alibaba Group Holding Limited Search method and apparatus
US20130085781A1 (en) * 2011-09-29 2013-04-04 Eclinicalworks, Llc Systems and methods for generating and updating electronic medical records
JP6011180B2 (ja) 2012-03-28 2016-10-19 日本電気株式会社 ファセット生成装置、ファセット生成方法及びファセット生成プログラム
US9613125B2 (en) * 2012-10-11 2017-04-04 Nuance Communications, Inc. Data store organizing data using semantic classification
JP5658842B1 (ja) * 2014-06-06 2015-01-28 楽天株式会社 情報システム及び情報処理方法
US20170140118A1 (en) * 2015-11-18 2017-05-18 Ucb Biopharma Sprl Method and system for generating and visually displaying inter-relativity between topics of a healthcare treatment taxonomy

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050182764A1 (en) * 2004-02-13 2005-08-18 Evans Lynne M. System and method for arranging concept clusters in thematic neighborhood relationships in a two-dimensional visual display space
CN101169780A (zh) * 2006-10-25 2008-04-30 华为技术有限公司 一种基于语义本体的检索系统和方法
CN101452463A (zh) * 2007-12-05 2009-06-10 浙江大学 定向抓取页面资源的方法和装置
CN101859304A (zh) * 2009-04-13 2010-10-13 北京市疾病预防控制中心 常见毒物数据检索系统
CN104887527A (zh) * 2015-06-26 2015-09-09 青岛永乐互联网技术有限公司 一种基于医嘱的药物服用提示反馈方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
朱敏: "《面向多领域大规模知识库的自然语言自动问答研究》", 《中国优秀硕士论文全文数据库 信息科技辑》 *
米晨: "《SA民营医院搜索引擎营销策略研究》", 《中国优秀硕士论文全文数据库 医药卫生科技辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110310739A (zh) * 2018-03-20 2019-10-08 贺丽君 信息处理系统及方法、健康信息专家系统
CN111078906A (zh) * 2018-10-18 2020-04-28 杭州海康威视数字技术股份有限公司 图像查询、信息同步方法及装置
CN111078906B (zh) * 2018-10-18 2023-05-19 杭州海康威视数字技术股份有限公司 图像查询、信息同步方法及装置
CN117556790A (zh) * 2024-01-02 2024-02-13 四川大学华西医院 医疗信息处理方法、装置、设备和存储介质
CN117556790B (zh) * 2024-01-02 2024-04-16 四川大学华西医院 医疗信息处理方法、装置、设备和存储介质

Also Published As

Publication number Publication date
US20180173764A1 (en) 2018-06-21
JP2018101393A (ja) 2018-06-28
US11301515B2 (en) 2022-04-12
CN107590166B (zh) 2019-02-12
JP6621444B2 (ja) 2019-12-18

Similar Documents

Publication Publication Date Title
Prajapati et al. Interesting association rule mining with consistent and inconsistent rule detection from big sales data in distributed environment
Xue et al. Feature location in a collection of product variants
TWI524284B (zh) Related product information display method and system
CN106156194B (zh) 一种形成用户操作路径的方法及装置
WO2014000576A1 (zh) 一种网络搜索方法及网络搜索系统
TW201331873A (zh) 電子商務網站導航方法及系統
CN106611037A (zh) 用于分布式图计算的方法与设备
WO2017121272A1 (zh) 用户行为数据的处理方法及装置
CN107590166A (zh) 一种基于查询内容的数据生成方法及装置
CN104077337B (zh) 搜索方法及装置
Zhu et al. Mining user-aware rare sequential topic patterns in document streams
Kim et al. A study on the method for extracting the purpose-specific customized information from online product reviews based on text mining
Zhuge et al. Basic operations, completeness and dynamicity of cyber physical socio semantic link network CPSocio‐SLN
CN103425678A (zh) 一种业务对象的推荐信息的选择方法及装置
CN106951254B (zh) 支付系统中相似业务功能模块复用的方法及装置
US10909733B2 (en) Graph transformation
CN109118379A (zh) 基于社交网络的推荐方法和装置
CN103780592B (zh) 一种用户账号被盗确定方法及装置
CN107798558A (zh) 用户行为数据分析方法及服务器
Chui et al. S-OLAP: an OLAP system for analyzing sequence data
TW201346820A (zh) 推薦用戶的方法及裝置
Zhang et al. Inferring continuous dynamic social influence and personal preference for temporal behavior prediction
CN103793390B (zh) 查询条件相似度确定方法、对象查询方法及相关装置
CN106484747A (zh) 一种基于交互事件的网页项目推荐方法和装置
CN107798249A (zh) 行为模式数据的发布方法及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant