CN105956168A - 一种信息检索方法及信息检索装置 - Google Patents
一种信息检索方法及信息检索装置 Download PDFInfo
- Publication number
- CN105956168A CN105956168A CN201610341353.7A CN201610341353A CN105956168A CN 105956168 A CN105956168 A CN 105956168A CN 201610341353 A CN201610341353 A CN 201610341353A CN 105956168 A CN105956168 A CN 105956168A
- Authority
- CN
- China
- Prior art keywords
- user
- statement
- feature words
- question
- pair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000003860 storage Methods 0.000 claims abstract description 16
- 239000000203 mixture Substances 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 description 10
- 241000219109 Citrullus Species 0.000 description 9
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 9
- 244000270200 Citrullus vulgaris Species 0.000 description 6
- 235000012840 Citrullus vulgaris Nutrition 0.000 description 6
- 241000607479 Yersinia pestis Species 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000000151 deposition Methods 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 241000219112 Cucumis Species 0.000 description 2
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 2
- 238000009360 aquaculture Methods 0.000 description 2
- 244000144974 aquaculture Species 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000009223 counseling Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Marine Sciences & Fisheries (AREA)
- Animal Husbandry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mining & Mineral Resources (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Agronomy & Crop Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
Abstract
本发明提供一种信息检索方法及信息检索装置,包括服务器接收用户设备UE发送的第一用户提问语句;若判断知预设咨询主题列表的对象属性包括第一用户提问语句,将目标对象属性以及咨询主题列表中与目标对象属性对应的实例名结果对发送给UE,以使UE展示目标对象属性,在UE选择目标对象属性时,展示目标实例名结果对的实例名,在UE选择目标实例名结果对的实例名时,在与实例名对应的问题答案对的存储地址中获取目标问题答案对;目标对象属性为包括所述第一用户提问语句的对象属性;咨询主题列表包括对象属性和与对象属性对应的实例名结果对(包括实例名和与实例名对应的问题答案对的存储地址)。本发明可快速获取更精确的相关问题及答案,提高检索效率。
Description
技术领域
本发明涉及一种信息处理领域,尤其涉及一种信息检索方法及信息检索装置。
背景技术
农业技术是农业科技生产的重要支撑。在农业技术咨询指导方面,当前我国具有实践经验的农业专家数量难以满足解决众多生产问题的实际需求。因此,对农业专家服务过程中多年积累的常见咨询问题,进行梳理和特点分析,利用有效的输入检索引导和自动问答方法,帮助农业生产者在移动鼠标的过程中,快捷获取专家技术经验指导,能有效提高专家智力资源利用率的同时,为农户提供实时技术解答服务。
许多通用检索引擎,如Google、百度等在一定程度上为信息资源的获取提供了解决方案。但是,通用检索引擎面向的是所有行业,针对特定行业和特定信息反馈的准确性和相关性都较差,特别是针对具有生产地域和季节特点的信息服务,效果不理想;当前农业领域问答系统采用的是基于关键词的检索技术,主要存在两大大问题:(1)在方法上,是在问答库中进行机械词语匹配(即关键词匹配),即只能获取包括用户输入的关键词的问题答案对,而无法正确理解和处理用户检索语义和意图,存在着反馈结果不准确、无关信息过多等问题,检索精度低。(2)在操作上,需要“键入—提交—查看—键入—提交—查看”的不断往复循环,步骤较多且无法直达咨询主题的技术信息,因此检索效率不高。
同样,除上述农业领域外的其他一些特定领域,也存在上述问题。
发明内容
本发明提供一种克服上述问题或者至少部分地解决上述问题的一种信息检索方法及信息检索装置。
第一方面,本发明提供一种信息检索方法,包括:
服务器接收用户设备UE发送的第一用户提问语句;
判断预设咨询主题列表的对象属性是否包括所述第一用户提问语句;所述咨询主题列表中包括对象属性列表,所述对象属性列表包括对象属性和与所述对象属性对应的实例名结果对,所述实例名结果对包括实例名和与所述实例名对应的问题答案对的存储地址;
若包括,则将目标对象属性以及所述咨询主题列表中与所述目标对象属性对应的实例名结果对发送给UE,以使UE展示所述目标对象属性,并在UE选择所述目标对象属性时,展示所述目标实例名结果对的实例名,以及在UE选择所述目标实例名结果对的实例名时,在与所述实例名对应的问题答案对的存储地址中获取目标问题答案对;
所述目标对象属性为包括所述第一用户提问语句的对象属性。
优选的,将目标对象属性以及所述咨询主题列表中与所述目标对象属性对应的实例名结果对发送给UE之前,所述方法还包括:
为目标对象属性添加用以提示级联的级联提示符号;
相应地,将目标对象属性以及所述咨询主题列表中与所述目标对象属性对应的实例名结果对发送给UE,包括:
将添加了级联提示符号的目标对象属性以及所述咨询主题列表中与所述添加了级联提示符号的目标对象属性对应的实例名结果对发送给UE。
优选的,所述方法还包括:
判断预设的常用问题答案对数据库中是否包括所述第一用户提问语句;所述预设的常用问题答案对数据库中包括多个常用问题答案对;
若包括,将包括所述第一用户提问语句的常用问题答案对发送给UE,以使UE展示所述包括所述第一用户提问语句的常用问题答案对。
优选的,所述方法还包括:
在接收到所述UE发送的关于第二用户提问语句的查询指令时,获取所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词,所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词共同组成用户提问特征词序列;
在预先建立的常用问题答案对数据库中查找包括所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词的常用问题答案对,所述包括所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词的常用问题答案对形成候选常用问题答案对;所述预设的常用问题答案对数据库中包括多个常用问题答案对;
获取所述候选常用问题答案对中每个问题所包含的特征词,所述候选常用问题答案对中每个问题所包含的特征词组成候选特征词序列;
根据所述用户提问特征词序列、所述候选特征词序列和候选常用问题答案对,获取目标问题答案对;
将所述目标问题答案对发送给所述UE,以使所述UE显示所述目标问题答案对。
优选的,根据所述用户提问特征词序列、所述候选特征词序列和候选常用问题答案对,获取目标问题答案对,包括:
计算所述用户提问特征词序列和每个所述候选特征词序列的相似度;
将所述相似度由大到小排序;
确定与目标候选特征词序列对应的候选常用问题答案对中的常用问题答案对为目标问题答案对;所述目标候选特征词序列为与排序结果中大于预设阈值的相似度对应的候选特征词序列。
优选的,计算所述用户提问特征词序列和每个所述候选特征词序列的相似度,包括:
通过公式(一)计算所述用户提问特征词序列和每个所述候选特 征词序列的相似度:
其中,为所述用户提问特征词序列和每个所述候选特征词序列的相似度,为用户提问特征词序列, 为候选特征词序列,
其中,
xi=max(vsim(wai,wq1),vsim(wai,wq2),...,vsim(wai,wqn));
其中,xi是中每个特征词与中所有特征词的词相似度最大取值,wai为中第i个特征词,vsim(wa,wq)为wa和wq的相似度,wa为候选特征词序列中的特征词,wq为第一特征词序列中的特征词,vsim(wai,wq1)为wai和wq1的相似度,vsim(wai,wq2)为wai和wq2的相似度,vsim(wai,wqn)为wai和wqn的相似度;
其中,
其中,h为中特征词的数量,k为预设同义词表中的相似度编码中wa和wq的编码不同的功能位的位数,所述预设同义词表中包括多个特征词以及与所述特征词对应的相似度编码,每个相似度编码包括p个相似度功能位,p≥k,h=p+a,k、p、h、a均为正整数,且a为常数。
第二方面,本发明还提供一种信息检索装置,包括:
接收单元,服务器接收用户设备UE发送的第一用户提问语句;
第一判断单元,用于判断预设咨询主题列表的对象属性是否包括所述第一用户提问语句;所述咨询主题列表中包括对象属性列表,所述对象属性列表包括对象属性和与所述对象属性对应的实例名结果对,所述实例名结果对包括实例名和与所述实例名对应的问题答案对的存储地址;
第一发送单元,用于若包括,则将目标对象属性以及所述咨询主题列表中与所述目标对象属性对应的实例名结果对发送给UE,以使UE展示所述目标对象属性,并在UE选择所述目标对象属性时,展示所述目标实例名结果对的实例名,以及在UE选择所述目标实例名结果对的实例名时,在与所述实例名对应的问题答案对的存储地址中获取目标问题答案对;
所述目标对象属性为包括所述第一用户提问语句的对象属性。
优选的,所述装置还包括:
添加单元,用于将目标对象属性以及所述咨询主题列表中与所述目标对象属性对应的实例名结果对发送给UE之前,为目标对象属性添加用以提示级联的级联提示符号;
相应地,第一发送单元,包括:
将添加了级联提示符号的目标对象属性以及所述咨询主题列表中与所述添加了级联提示符号的目标对象属性对应的实例名结果对发送给UE。
优选的,所述装置还包括:
第二判断单元,用于判断预设的常用问题答案对数据库中是否包括所述第一用户提问语句;所述预设的常用问题答案对数据库中包括多个常用问题答案对;
第二发送单元,用于若包括,将包括所述第一用户提问语句的常用问题答案对发送给UE,以使UE展示所述包括所述第一用户提问语句的常用问题答案对。
优选的,所述装置还包括:
第一获取单元,用于在接收到所述UE发送的关于第二用户提问语句的查询指令时,获取所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词,所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词共同组成用户提问特征词序列;
查找单元,用于在预先建立的常用问题答案对数据库中查找包括所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词的常用问题答案对,所述包括所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词的常用问题答案对形成候选常用问题答案对;所述预设的常用问题答案对数据库中包括多个常用问题答案对;
第二获取单元,用于获取所述候选常用问题答案对中每个问题所包含的特征词,所述候选常用问题答案对中每个问题所包含的特征词组成候选特征词序列;
第三获取单元,用于根据所述用户提问特征词序列、所述候选特征词序列和候选常用问题答案对,获取目标问题答案对;
第三发送单元,用于将所述目标问题答案对发送给所述UE,以使所述UE显示所述目标问题答案对。
本发明一种信息检索方法及信息检索装置根据UE输入的第一用户提问语句,可以实时获取更多更准确的相关检索主题词(即实例名)和相关常用问题答案对,因此可以快速获取更精确的相关问题,提高检索效率。
附图说明
图1为本发明一实施例提供的一种信息检索方法的流程图;
图2为本发明一实施例提供的一种信息检索装置的结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
图1为本发明一实施例提供的一种信息检索方法的流程图。
如图1所示,本实施例的一种信息检索方法,包括:
S101、服务器接收用户设备UE发送的第一用户提问语句;
可以理解的是,第一用户提问语句一般为单个字或由2—7个多字词。
S102、判断预设咨询主题列表的对象属性是否包括所述第一用户提问语句;所述咨询主题列表中包括对象属性列表,所述对象属性列表包括对象属性和与所述对象属性对应的实例名结果对,所述实例名结果对包括实例名和与所述实例名对应的问题答案对的存储地址;若包括,则执行步骤S103;若不包括,则不显示任何结果。
可以理解的是,所述存储地址一般为URL。
S103、将目标对象属性以及所述咨询主题列表中与所述目标对象属性对应的实例名结果对发送给UE,以使UE展示所述目标对象属性,并在UE选择所述目标对象属性时,展示所述目标实例名结果对的实例名,以及在UE选择所述目标实例名结果对的实例名时,在与所述实例名对应的问题答案对的存储地址中获取目标问题答案对;
所述目标对象属性为包括所述第一用户提问语句的对象属性。
下面举例说明本发明的方法。
表1为一种预设咨询主题列表。
表1
参见表1,预设咨询主题列表中包括多个表项,每个表项包括对象实体(Entity)以及与所述对象实体对应的对象属性列表(所述对象属性列表包括对象属性和与所述对象属性对应的实例名结果对,所述实例名结果对实例名和与所述实例名对应的问题答案对的存储地址)。也可以不包括对象实体。
参照表1,可以理解的是,对象实体、对象属性和实例名是类别由大到小的关系,如:对象实体为西瓜、对象属性一般包括对象实体的一个具体类别,如:对象品种,如:西瓜和该对象品种的属性,如西瓜品种、西瓜病虫害防治、西瓜栽培技术);实例名一般包括属性的一个具体类别,如属性类的具体内容,如:西瓜品种—京欣1号,番茄栽培技术—秋延后栽培等。
下面基于上述表1举例说明本发明的方法:
若UE输入“西瓜”,则将“西瓜品种”以及“京欣1号—..//qa.apsx?id=637…”;“西瓜病虫害防治”以及“枯萎病—..//qa.apsx?id=431…”;“西瓜栽培技术”以及“春早熟西瓜双膜覆盖技术—..//qa.apsx?id=15…”发送给UE,以使UE展示“西瓜品种”、“西瓜病虫害防治”以及“西瓜栽培技术”,并在UE选择展示的“西瓜品种”时,展示京欣1号,在UE选择京欣1号时,在..//qa.apsx?id=637…中获取目标问题答案对;在UE选择展示的“西瓜病虫害防治”时,展示枯萎病、在UE选择枯萎病时, 在..//qa.apsx?id=431…中获取目标问题答案对;在UE选择春早熟西瓜双膜覆盖技术时,在..//qa.apsx?id=15…中获取目标问题答案对。
对于养殖业领域,对象属性包括良种,繁育技术,疫病防治,屠宰加工等等。
可见,本发明根据UE输入的第一用户提问语句,可以获取更多更准确的相关检索主题词(即实例名),因此可以快速获取更精确的相关问题,提高检索效率。
本发明主要适合应用在一些具体的专业技术领域,如农业或养殖业领域,可对存储有问题答案对的这些技术领域的数据库进行归纳整理,提取涉及所述领域的问题答案对中的问题规律,建立咨询主题列表,这样再采用本发明的方法检索效率将会高很多。
作为一种优选实施例,所述步骤S103之前,所述方法还包括:
为目标对象属性添加用以提示级联的级联提示符号;
可以理解的是,所述级联提示符号可以是比如一个箭头,还可以为其他形状的符号。
相应地,所述步骤S103,包括:
将添加了级联提示符号的目标对象属性以及所述咨询主题列表中与所述添加了级联提示符号的目标对象属性对应的实例名结果对发送给UE。
可以理解的是,为目标对象属性添加级联提示符号,便于提示用户该目标对象属性还包括下一级内容,从而便于用户快速查找到实例名结果对。
为了便于查找到更多的问题答案对,作为一种优选实施例,所述方法还包括:
判断预设的常用问题答案对数据库中是否包括所述第一用户提问语句;所述预设的常用问题答案对数据库中包括多个常用问题答案对;
若包括,将包括所述第一用户提问语句的常用问题答案对发送给UE,以使UE展示所述包括所述第一用户提问语句的常用问题答案对。
本实施例可以保证除显示与所述第一用户提问语句对应的目标对象属性以及所述咨询主题列表中与所述目标对象属性对应的实例名结果对外,还可展示包括所述第一用户提问语句的常用问题答案对,从而可以得到更多的检索结果,进而提高用户得到答案的可能性。
作为一种优选实施例,所述方法还包括:
在接收到所述UE发送的关于第二用户提问语句的查询指令时,获取所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词,所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词共同组成用户提问特征词序列;
可以理解的是,所述第二用户提问语句可以为与第一用户提问语句不同的语句,事实上,也可以为第一用户提问语句。
所述接收到所述UE发送的关于第二用户提问语句的查询指令一般指用户通过点击检索按键触发的事件。
实际操作中,所述第二用户提问语句一般指一句话,而非字或词。
可以理解的是,可以采用对所述第二用户提问语句分词、去停用此、去标点符号的方式获取所述第二用户提问语句中的特征词,可采用现有方法获取所述第二用户提问语句中的特征词的同义词,在此不再详述。
在预先建立的常用问题答案对数据库中查找包括所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词的常用问题答案对,所述包括所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词的常用问题答案对形成候选常用问题答案对;所述预设的常用问题答案对数据库中包括多个常用问题答案对;
获取所述候选常用问题答案对中每个问题所包含的特征词,所述候选常用问题答案对中每个问题所包含的特征词组成候选特征词序列;
根据所述用户提问特征词序列、所述候选特征词序列和候选常用 问题答案对,获取目标问题答案对;
将所述目标问题答案对发送给所述UE,以使所述UE显示所述目标问题答案对。
本实施例中通过采用所述第二用户提问语句中的特征词、所述第二用户提问语句中的特征词的同义词以及预先建立的常用问题答案对数据库获取目标问题答案对,便于查找更符合所述第二用户提问语句的问题答案对,本实施例相对于上述实施例可以获得更多的且更准确的检索结果。
作为一种优选实施例,根据所述用户提问特征词序列、所述候选特征词序列和候选常用问题答案对,获取目标问题答案对,包括:
计算所述用户提问特征词序列和每个所述候选特征词序列的相似度;
在本实施例中,计算所述用户提问特征词序列和每个所述候选特征词序列的相似度,包括:
通过公式(1)计算所述用户提问特征词序列和每个所述候选特征词序列的相似度:
其中,为所述用户提问特征词序列和每个所述候选特征词序列的相似度,为用户提问特征词序列, 为候选特征词序列,
其中,
xi=max(vsim(wai,wq1),vsim(wai,wq2),...,vsim(wai,wqn));
其中,xi是中每个特征词与中所有特征词的词相似度最大取值,wai为中第i个特征词,vsim(wa,wq)为wa和wq的相似度,wa为候选特征词序列中的特征词,wq为第一特征词序列中的特征词,vsim(wai,wq1)为wai和wq1的相似度,vsim(wai,wq2)为wai和wq2的相似 度,vsim(wai,wqn)为wai和wqn的相似度;
其中,
其中,h为中特征词的数量,k为预设同义词表中的相似度编码中wa和wq的编码不同的相似度功能位的位数,所述预设同义词表中包括多个特征词以及与所述特征词对应的相似度编码,每个相似度编码包括p个相似度功能位,p≥k,h=p+a,k、p、h、a均为正整数,且a为常数。
下面解释:k为预设同义词表中的相似度编码中wa和wq的编码不同的相似度功能位的位数:
如:相似度编码共有五位,则p=5,若a=3,则h=5+3=8,如wa的编码为12345,wq的编码为12339,则k=4,wa和wq的相似度为1/(8-4),即为0.25;如wa的编码为12345,wq的编码为12445,则k=3,wa和wq的相似度为1/(8-3),即为0.2。
将所述相似度由大到小排序;
确定与目标候选特征词序列对应的候选常用问题答案对中的常用问题答案对为目标问题答案对;所述目标候选特征词序列为与排序结果中大于预设阈值的相似度对应的候选特征词序列。
可以理解的是,所述预设阈值可以根据需要具体设定,设定所述目标候选特征词序列为与排序结果中大于预设阈值的相似度对应的候选特征词序列,可以保证获取的目标问题答案对为更符合检索的所述第二用户提问语句的答案,从而保证检索结果的准确性。
图2为本发明一实施例提供的一种信息检索装置的结构示意图。
如图2所示的一种信息检索装置,包括:
接收单元201,服务器接收用户设备UE发送的第一用户提问语句;
第一判断单元202,用于判断预设咨询主题列表的对象属性是否包括所述第一用户提问语句;所述咨询主题列表中包括对象属性列表,所述对象属性列表包括对象属性和与所述对象属性对应的实例名结果对,所述实例名结果对包括实例名和与所述实例名对应的问题答案对的存储地址;
第一发送单元203,用于若包括,则将目标对象属性以及所述咨询主题列表中与所述目标对象属性对应的实例名结果对发送给UE,以使UE展示所述目标对象属性,并在UE选择所述目标对象属性时,展示所述目标实例名结果对的实例名,以及在UE选择所述目标实例名结果对的实例名时,在与所述实例名对应的问题答案对的存储地址中获取目标问题答案对;
所述目标对象属性为包括所述第一用户提问语句的对象属性。
作为一种优选实施例,所述装置还包括:
添加单元,用于将目标对象属性以及所述咨询主题列表中与所述目标对象属性对应的实例名结果对发送给UE之前,为目标对象属性添加用以提示级联的级联提示符号;
相应地,第一发送单元203,包括:
将添加了级联提示符号的目标对象属性以及所述咨询主题列表中与所述添加了级联提示符号的目标对象属性对应的实例名结果对发送给UE。
作为一种优选实施例,所述装置还包括:
第二判断单元,用于判断预设的常用问题答案对数据库中是否包括所述第一用户提问语句;所述预设的常用问题答案对数据库中包括多个常用问题答案对;
第二发送单元,用于若包括,将包括所述第一用户提问语句的常 用问题答案对发送给UE,以使UE展示所述包括所述第一用户提问语句的常用问题答案对。
作为一种优选实施例,所述装置还包括:
第一获取单元,用于在接收到所述UE发送的关于第二用户提问语句的查询指令时,获取所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词,所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词共同组成用户提问特征词序列;
查找单元,用于在预先建立的常用问题答案对数据库中查找包括所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词的常用问题答案对,所述包括所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词的常用问题答案对形成候选常用问题答案对;所述预设的常用问题答案对数据库中包括多个常用问题答案对;
第二获取单元,用于获取所述候选常用问题答案对中每个问题所包含的特征词,所述候选常用问题答案对中每个问题所包含的特征词组成候选特征词序列;
第三获取单元,用于根据所述用户提问特征词序列、所述候选特征词序列和候选常用问题答案对,获取目标问题答案对;
第三发送单元,用于将所述目标问题答案对发送给所述UE,以使所述UE显示所述目标问题答案对。
所述一种信息检索装置可以用在服务器中。
由于本发明中的信息检索装置和信息检索方法是一一对应的,故在此不再详述该系统。
本领域普通技术人员可以理解:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特 征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。
Claims (10)
1.一种信息检索方法,其特征在于,包括:
服务器接收用户设备UE发送的第一用户提问语句;
判断预设咨询主题列表的对象属性是否包括所述第一用户提问语句;所述咨询主题列表中包括对象属性列表,所述对象属性列表包括对象属性和与所述对象属性对应的实例名结果对,所述实例名结果对包括实例名和与所述实例名对应的问题答案对的存储地址;
若包括,则将目标对象属性以及所述咨询主题列表中与所述目标对象属性对应的实例名结果对发送给UE,以使UE展示所述目标对象属性,并在UE选择所述目标对象属性时,展示所述目标实例名结果对的实例名,以及在UE选择所述目标实例名结果对的实例名时,在与所述实例名对应的问题答案对的存储地址中获取目标问题答案对;
所述目标对象属性为包括所述第一用户提问语句的对象属性。
2.根据权利要求1所述的方法,其特征在于,将目标对象属性以及所述咨询主题列表中与所述目标对象属性对应的实例名结果对发送给UE之前,所述方法还包括:
为目标对象属性添加用以提示级联的级联提示符号;
相应地,将目标对象属性以及所述咨询主题列表中与所述目标对象属性对应的实例名结果对发送给UE,包括:
将添加了级联提示符号的目标对象属性以及所述咨询主题列表中与所述添加了级联提示符号的目标对象属性对应的实例名结果对发送给UE。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
判断预设的常用问题答案对数据库中是否包括所述第一用户提问语句;所述预设的常用问题答案对数据库中包括多个常用问题答案对;
若包括,将包括所述第一用户提问语句的常用问题答案对发送给UE,以使UE展示所述包括所述第一用户提问语句的常用问题答案对。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在接收到所述UE发送的关于第二用户提问语句的查询指令时,获取所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词,所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词共同组成用户提问特征词序列;
在预先建立的常用问题答案对数据库中查找包括所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词的常用问题答案对,所述包括所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词的常用问题答案对形成候选常用问题答案对;所述预设的常用问题答案对数据库中包括多个常用问题答案对;
获取所述候选常用问题答案对中每个问题所包含的特征词,所述候选常用问题答案对中每个问题所包含的特征词组成候选特征词序列;
根据所述用户提问特征词序列、所述候选特征词序列和候选常用问题答案对,获取目标问题答案对;
将所述目标问题答案对发送给所述UE,以使所述UE显示所述目标问题答案对。
5.根据权利要求4所述的方法,其特征在于,根据所述用户提问特征词序列、所述候选特征词序列和候选常用问题答案对,获取目标问题答案对,包括:
计算所述用户提问特征词序列和每个所述候选特征词序列的相似度;
将所述相似度由大到小排序;
确定与目标候选特征词序列对应的候选常用问题答案对中的常用问题答案对为目标问题答案对;所述目标候选特征词序列为与排序结果中大于预设阈值的相似度对应的候选特征词序列。
6.根据权利要求5所述的方法,其特征在于,计算所述用户提问 特征词序列和每个所述候选特征词序列的相似度,包括:
通过公式(一)计算所述用户提问特征词序列和每个所述候选特征词序列的相似度:
其中,为所述用户提问特征词序列和每个所述候选特征词序列的相似度,为用户提问特征词序列, 为候选特征词序列,
其中,
xi=max(vsim(wai,wq1),vsim(wai,wq2),...,vsim(wai,wqn));
其中,xi是中每个特征词与中所有特征词的词相似度最大取值,wai为中第i个特征词,vsim(wa,wq)为wa和wq的相似度,wa为候选特征词序列中的特征词,wq为第一特征词序列中的特征词,vsim(wai,wq1)为wai和wq1的相似度,vsim(wai,wq2)为wai和wq2的相似度,vsim(wai,wqn)为wai和wqn的相似度;
其中,
其中,h为中特征词的数量,k为预设同义词表中的相似度编码中wa和wq的编码不同的相似度功能位的位数,所述预设同义词表中包括多个特征词以及与所述特征词对应的相似度编码,每个相似度编码包括p个相似度功能位,p≥k,h=p+a,k、p、h、a均为正整数, 且a为常数。
7.一种信息检索装置,其特征在于,包括:
接收单元,服务器接收用户设备UE发送的第一用户提问语句;
第一判断单元,用于判断预设咨询主题列表的对象属性是否包括所述第一用户提问语句;所述咨询主题列表中包括对象属性列表,所述对象属性列表包括对象属性和与所述对象属性对应的实例名结果对,所述实例名结果对包括实例名和与所述实例名对应的问题答案对的存储地址;
第一发送单元,用于若包括,则将目标对象属性以及所述咨询主题列表中与所述目标对象属性对应的实例名结果对发送给UE,以使UE展示所述目标对象属性,并在UE选择所述目标对象属性时,展示所述目标实例名结果对的实例名,以及在UE选择所述目标实例名结果对的实例名时,在与所述实例名对应的问题答案对的存储地址中获取目标问题答案对;
所述目标对象属性为包括所述第一用户提问语句的对象属性。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
添加单元,用于将目标对象属性以及所述咨询主题列表中与所述目标对象属性对应的实例名结果对发送给UE之前,为目标对象属性添加用以提示级联的级联提示符号;
相应地,第一发送单元,包括:
将添加了级联提示符号的目标对象属性以及所述咨询主题列表中与所述添加了级联提示符号的目标对象属性对应的实例名结果对发送给UE。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二判断单元,用于判断预设的常用问题答案对数据库中是否包括所述第一用户提问语句;所述预设的常用问题答案对数据库中包括多个常用问题答案对;
第二发送单元,用于若包括,将包括所述第一用户提问语句的常用问题答案对发送给UE,以使UE展示所述包括所述第一用户提问语句的常用问题答案对。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第一获取单元,用于在接收到所述UE发送的关于第二用户提问语句的查询指令时,获取所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词,所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词共同组成用户提问特征词序列;
查找单元,用于在预先建立的常用问题答案对数据库中查找包括所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词的常用问题答案对,所述包括所述第二用户提问语句中的特征词以及所述第二用户提问语句中的特征词的同义词的常用问题答案对形成候选常用问题答案对;所述预设的常用问题答案对数据库中包括多个常用问题答案对;
第二获取单元,用于获取所述候选常用问题答案对中每个问题所包含的特征词,所述候选常用问题答案对中每个问题所包含的特征词组成候选特征词序列;
第三获取单元,用于根据所述用户提问特征词序列、所述候选特征词序列和候选常用问题答案对,获取目标问题答案对;
第三发送单元,用于将所述目标问题答案对发送给所述UE,以使所述UE显示所述目标问题答案对。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610341353.7A CN105956168B (zh) | 2016-05-20 | 2016-05-20 | 一种信息检索方法及信息检索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610341353.7A CN105956168B (zh) | 2016-05-20 | 2016-05-20 | 一种信息检索方法及信息检索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105956168A true CN105956168A (zh) | 2016-09-21 |
CN105956168B CN105956168B (zh) | 2019-05-28 |
Family
ID=56910350
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610341353.7A Active CN105956168B (zh) | 2016-05-20 | 2016-05-20 | 一种信息检索方法及信息检索装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105956168B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109427000A (zh) * | 2017-08-30 | 2019-03-05 | 阿里巴巴集团控股有限公司 | 问题数据处理方法、装置及计算机系统 |
CN110674272A (zh) * | 2019-09-05 | 2020-01-10 | 科大讯飞股份有限公司 | 一种问题答案确定方法及相关装置 |
WO2021121020A1 (zh) * | 2019-12-18 | 2021-06-24 | 华为技术有限公司 | 问答方法、装置及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102054114A (zh) * | 2009-10-30 | 2011-05-11 | 上海市农业科学院 | 一种蔬菜病虫害诊断专家系统构建和服务方法 |
CN102142973A (zh) * | 2010-02-03 | 2011-08-03 | 湖南城市学院 | 农村信息服务与综合管理的系统及方法 |
CN103425687A (zh) * | 2012-05-21 | 2013-12-04 | 阿里巴巴集团控股有限公司 | 一种基于关键词的检索方法和系统 |
CN104484408A (zh) * | 2014-12-16 | 2015-04-01 | 百度在线网络技术(北京)有限公司 | 植物信息的搜索处理方法和系统 |
CN104615672A (zh) * | 2015-01-16 | 2015-05-13 | 中国农业大学 | 一种农业科技成果检索、展示方法及客户端和服务器 |
CN105335487A (zh) * | 2015-10-16 | 2016-02-17 | 北京农业信息技术研究中心 | 基于农业技术信息本体库的农业专家信息检索系统及方法 |
-
2016
- 2016-05-20 CN CN201610341353.7A patent/CN105956168B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102054114A (zh) * | 2009-10-30 | 2011-05-11 | 上海市农业科学院 | 一种蔬菜病虫害诊断专家系统构建和服务方法 |
CN102142973A (zh) * | 2010-02-03 | 2011-08-03 | 湖南城市学院 | 农村信息服务与综合管理的系统及方法 |
CN103425687A (zh) * | 2012-05-21 | 2013-12-04 | 阿里巴巴集团控股有限公司 | 一种基于关键词的检索方法和系统 |
CN104484408A (zh) * | 2014-12-16 | 2015-04-01 | 百度在线网络技术(北京)有限公司 | 植物信息的搜索处理方法和系统 |
CN104615672A (zh) * | 2015-01-16 | 2015-05-13 | 中国农业大学 | 一种农业科技成果检索、展示方法及客户端和服务器 |
CN105335487A (zh) * | 2015-10-16 | 2016-02-17 | 北京农业信息技术研究中心 | 基于农业技术信息本体库的农业专家信息检索系统及方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109427000A (zh) * | 2017-08-30 | 2019-03-05 | 阿里巴巴集团控股有限公司 | 问题数据处理方法、装置及计算机系统 |
CN110674272A (zh) * | 2019-09-05 | 2020-01-10 | 科大讯飞股份有限公司 | 一种问题答案确定方法及相关装置 |
WO2021121020A1 (zh) * | 2019-12-18 | 2021-06-24 | 华为技术有限公司 | 问答方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN105956168B (zh) | 2019-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5612731B2 (ja) | 関心領域についての関連情報の決定 | |
US8719179B2 (en) | Recruiting service graphical user interface | |
US8407215B2 (en) | Text analysis to identify relevant entities | |
CN110837550A (zh) | 基于知识图谱的问答方法、装置、电子设备及存储介质 | |
CN105808590B (zh) | 搜索引擎实现方法、搜索方法以及装置 | |
CA2805391A1 (en) | Determining relevant information for domains of interest | |
CN108717433A (zh) | 一种面向程序设计领域问答系统的知识库构建方法及装置 | |
CN105868267B (zh) | 一种移动社交网络用户兴趣的建模方法 | |
CN106095842B (zh) | 在线课程搜索方法和装置 | |
WO2021139343A1 (zh) | 基于自然语言处理的数据分析方法、装置和计算机设备 | |
US20030212663A1 (en) | Neural network feedback for enhancing text search | |
KR20200137601A (ko) | 챗봇을 이용한 질의응답 처리 장치 및 방법 | |
CN105893390A (zh) | 一种应用程序的处理方法及电子设备 | |
CN105956168A (zh) | 一种信息检索方法及信息检索装置 | |
Jain et al. | AgriBot: agriculture-specific question answer system | |
CN112418656A (zh) | 智能坐席分派方法、装置、计算机设备和存储介质 | |
CN108764324A (zh) | 一种基于K-Means算法和共现词的文本数据快速处理方法 | |
CN110929169A (zh) | 基于改进Canopy聚类协同过滤算法的职位推荐方法 | |
WO2021000400A1 (zh) | 导诊相似问题对生成方法、系统及计算机设备 | |
CN109033428B (zh) | 一种智能客服方法及系统 | |
US20170109411A1 (en) | Assisted creation of a search query | |
US20170364815A1 (en) | Inference-Based Assignment of Data Type to Data | |
CN107092665A (zh) | 一种数据检索系统及检索方法 | |
JP2019139746A (ja) | 情報検索システムおよび方法 | |
CN105975508B (zh) | 个性化元搜索引擎检索结果合成排序方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |