CN102779163A - 量化检索方法及量化检索系统 - Google Patents
量化检索方法及量化检索系统 Download PDFInfo
- Publication number
- CN102779163A CN102779163A CN2012102018405A CN201210201840A CN102779163A CN 102779163 A CN102779163 A CN 102779163A CN 2012102018405 A CN2012102018405 A CN 2012102018405A CN 201210201840 A CN201210201840 A CN 201210201840A CN 102779163 A CN102779163 A CN 102779163A
- Authority
- CN
- China
- Prior art keywords
- searching
- quantization
- keyword
- specialized vocabulary
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及检索技术领域,具体涉及一种量化检索方法及量化检索系统,所述量化检索方法包括如下步骤:1)接收用户检索指令;2)从用户检索指令中提取检索字段;3)提取数字;4)从检索字段中分析专业词汇,获得专业词汇关键词;5)从检索字段中分析常规语句,获得常规语句关键词;6)将步骤3-5)提取的数字和/或专业词汇关键词和/或常规语句关键词提交数据库进行查询,获得检索结果;7)输出检索结果。本发明的量化检索方法及量化检索系统,可方便用户的使用,用户按自己的意思直接按自然语言即可查询,不需要用以往严格的数学公式法查询,同时,本发明流程简单,检索速度和准确性高,可节约服务器资源。
Description
技术领域
本发明涉及检索技术领域,具体涉及一种量化检索方法及量化检索系统。
背景技术
目前的检索引擎是对使用者输入的查询串进行文字分析,得到其中的一系列关键词,根据这些词的权重在数据库中进行查找,返回最接近的一组结果。因为这种方法是文字拆词性质的分析,对其中的数字及专业术语也作为文字处理,就会产生歧义,如10会匹配100,而101不会。同时,现有的检索引擎文字分析流程复杂,耗时长,消耗服务器资源较大。
发明内容
有鉴于此,本发明的目的是提供一种量化检索方法,流程简单,检索速度和准确性高。
本发明的目的是通过以下技术方案来实现的:量化检索方法,包括如下步骤:
1)接收用户检索指令;
2)从用户检索指令中提取检索字段;
3)提取数字;
4)从检索字段中分析专业词汇,获得专业词汇关键词;
5)从检索字段中分析常规语句,获得常规语句关键词;
6)将步骤3-5)提取的数字和/或专业词汇关键词和/或常规语句关键词提交数据库进行查询,获得检索结果;
7)输出检索结果。
本发明的量化检索系统,包括
输入模块,用于从获取用户提交的用户检索指令;
分析模块,分析用户检索指令,获取其中的数字和/或专业词汇关键词和/或常规语句关键词;
检索模块,将分析模块获得的数字和/或专业词汇关键词和/或常规语句关键词提交数据库进行检索,并将检索结果通过输出模块输出;
输出模块,输出检索结果。
本发明的量化检索方法及量化检索系统,可方便用户的使用,用户按自己的意思直接按自然语言即可查询,不需要用以往严格的数学公式法查询,同时,本发明流程简单,检索速度和准确性高,可节约服务器资源。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书和权利要求书来实现和获得。
附图说明
图1示出了量化检索方法的流程示意图;
图2示出了量化检索系统的结构示意图。
具体实施方式
以下将对本发明的优选实施例进行详细的描述。应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。
参见图1,本实施例的量化检索方法,主要用于房地产领域,包括如下步骤:
1)接收用户检索指令;
2)从用户检索指令中提取检索字段;
3)提取数字;
4)从检索字段中分析专业词汇,获得专业词汇关键词;
5)从检索字段中分析常规语句,获得常规语句关键词;
6)将步骤3-5)提取的数字和/或专业词汇关键词和/或常规语句关键词提交数据库进行查询,获得检索结果;
7)输出检索结果。
例如,用户发出检索指令,提交的检索字段为“青岛市二十五中附近60平米以上低于100万元”,那么量化检索的步骤如下:
1)接收用户检索指令;
2)从用户检索指令中提取检索字段:“二十五中附近60平米以上低于100万元”;
3)查找“单价”、“总价”、“租金”、“元”、“万元”、“面积”、“平米”等关键字,提取出价格相关的数字,本例中为100万元和60平米;
4)从检索字段中分析专业词汇,获得专业词汇关键词,本例中的专业词汇为地名关键字“青岛市”、“二十五中”,并进一步分析青岛市二十五中所在路段为市南区江西路,南京路,闽江路附近;
5)从检索字段中分析常规语句,获得常规语句关键词“以上”、“低于”;
6)将步骤3-5)提取的数字和/或专业词汇关键词和/或常规语句关键词经过逻辑组合后,获得检索要素:市南区,江西路、南京路、闽江路、60平方米以上,总价在100万元以下的房子,不限楼层,不限新旧,不限高层还是多层,提交数据库进行查询,获得检索结果;
7)输出检索结果。
参见图2,量化检索系统,包括
输入模块,用于从获取用户提交的用户检索指令;所述输入模块
分析模块,分析用户检索指令,获取其中的数字和/或专业词汇关键词和/或常规语句关键词;
检索模块,将分析模块获得的数字和/或专业词汇关键词和/或常规语句关键词提交数据库进行检索,并将检索结果通过输出模块输出;
输出模块,输出检索结果。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (2)
1.量化检索方法,其特征在于:包括如下步骤:
1)接收用户检索指令;
2)从用户检索指令中提取检索字段;
3)提取数字;
4)从检索字段中分析专业词汇,获得专业词汇关键词;
5)从检索字段中分析常规语句,获得常规语句关键词;
6)将步骤3-5)提取的数字和/或专业词汇关键词和/或常规语句关键词提交数据库进行查询,获得检索结果;
7)输出检索结果。
2.量化检索系统,其特征在于:包括
输入模块,用于从获取用户提交的用户检索指令;
分析模块,分析用户检索指令,获取其中的数字和/或专业词汇关键词和/或常规语句关键词;
检索模块,将分析模块获得的数字和/或专业词汇关键词和/或常规语句关键词提交数据库进行检索,并将检索结果通过输出模块输出;
输出模块,输出检索结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012102018405A CN102779163A (zh) | 2012-06-18 | 2012-06-18 | 量化检索方法及量化检索系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012102018405A CN102779163A (zh) | 2012-06-18 | 2012-06-18 | 量化检索方法及量化检索系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102779163A true CN102779163A (zh) | 2012-11-14 |
Family
ID=47124075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012102018405A Pending CN102779163A (zh) | 2012-06-18 | 2012-06-18 | 量化检索方法及量化检索系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102779163A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886093A (zh) * | 2014-04-03 | 2014-06-25 | 江苏物联网研究发展中心 | 电子商务搜索引擎同义词的处理方法 |
WO2014177118A1 (zh) * | 2013-04-28 | 2014-11-06 | 浙江核新同花顺网络信息股份有限公司 | 查询选取方法及系统 |
CN109542956A (zh) * | 2018-10-17 | 2019-03-29 | 深圳壹账通智能科技有限公司 | 报表生成方法、装置、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101071420A (zh) * | 2007-06-22 | 2007-11-14 | 腾讯科技(深圳)有限公司 | 一种切分索引分词的方法及系统 |
CN101136014A (zh) * | 2006-09-01 | 2008-03-05 | 北大方正集团有限公司 | 一种支持全文检索系统同时检索数值类型数据域的方法 |
CN101149758A (zh) * | 2007-10-18 | 2008-03-26 | 中兴通讯股份有限公司 | 搜索系统及搜索方法 |
CN101916294A (zh) * | 2010-08-27 | 2010-12-15 | 黄斌 | 一种利用语义分析实现精确搜索的方法 |
-
2012
- 2012-06-18 CN CN2012102018405A patent/CN102779163A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101136014A (zh) * | 2006-09-01 | 2008-03-05 | 北大方正集团有限公司 | 一种支持全文检索系统同时检索数值类型数据域的方法 |
CN101071420A (zh) * | 2007-06-22 | 2007-11-14 | 腾讯科技(深圳)有限公司 | 一种切分索引分词的方法及系统 |
CN101149758A (zh) * | 2007-10-18 | 2008-03-26 | 中兴通讯股份有限公司 | 搜索系统及搜索方法 |
CN101916294A (zh) * | 2010-08-27 | 2010-12-15 | 黄斌 | 一种利用语义分析实现精确搜索的方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014177118A1 (zh) * | 2013-04-28 | 2014-11-06 | 浙江核新同花顺网络信息股份有限公司 | 查询选取方法及系统 |
US10185772B2 (en) | 2013-04-28 | 2019-01-22 | Hithink Royalflush Information Network Co., Ltd. | Query selection method and system |
US10922371B2 (en) | 2013-04-28 | 2021-02-16 | Hithink Royalflush Information Network Co., Ltd. | Query selection method and system |
US11714861B2 (en) | 2013-04-28 | 2023-08-01 | Hithink Royalflush Information Network Co., Ltd. | Query selection method and system |
CN103886093A (zh) * | 2014-04-03 | 2014-06-25 | 江苏物联网研究发展中心 | 电子商务搜索引擎同义词的处理方法 |
CN109542956A (zh) * | 2018-10-17 | 2019-03-29 | 深圳壹账通智能科技有限公司 | 报表生成方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105488024B (zh) | 网页主题句的抽取方法及装置 | |
Zeroual et al. | OSIAN: Open source international Arabic news corpus-preparation and integration into the CLARIN-infrastructure | |
CN106598944B (zh) | 一种民航安保舆情情感分析方法 | |
CN102902806B (zh) | 一种利用搜索引擎进行查询扩展的方法及系统 | |
CN103605665B (zh) | 一种基于关键词的评审专家智能检索与推荐方法 | |
CN101231661B (zh) | 对象级知识挖掘的方法和系统 | |
CN103324700B (zh) | 一种基于Web信息的本体概念属性学习方法 | |
CN102200975B (zh) | 一种利用语义分析的垂直搜索引擎系统 | |
CN103353894A (zh) | 一种基于语义分析的数据搜索方法和系统 | |
CN103678576A (zh) | 基于动态语义分析的全文检索系统 | |
JP2013529805A (ja) | 検索方法、記憶媒体、同定方法、広告方法、処理方法及びシステム | |
CN106055623A (zh) | 一种跨语言推荐方法和系统 | |
CN104991943A (zh) | 音乐搜索方法及装置 | |
CN103294820B (zh) | 基于语义扩展的web页面归类方法和系统 | |
CN103838732A (zh) | 一种生活服务领域垂直搜索引擎 | |
CN101751439A (zh) | 基于层次聚类的图像检索方法 | |
CN102779163A (zh) | 量化检索方法及量化检索系统 | |
CN102567537A (zh) | 一种基于检索结果数量的短文本相似度计算方法 | |
CN113515939B (zh) | 一种勘察报告文本关键信息提取系统和提取方法 | |
CN109189820A (zh) | 一种煤矿安全事故本体概念抽取方法 | |
CN103020311A (zh) | 一种用户检索词的处理方法及系统 | |
Kettouch et al. | An interlinking approach based on domain recognition for linked data | |
CN102999569B (zh) | 用户需求分析定位器和分析及定位方法 | |
CN105354321A (zh) | 一种查询数据处理方法和装置 | |
CN109101591A (zh) | 基于知识库的拼音词义检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20121114 |