CN101894166A - 网络智能搜索引擎系统 - Google Patents

网络智能搜索引擎系统 Download PDF

Info

Publication number
CN101894166A
CN101894166A CN2010102386022A CN201010238602A CN101894166A CN 101894166 A CN101894166 A CN 101894166A CN 2010102386022 A CN2010102386022 A CN 2010102386022A CN 201010238602 A CN201010238602 A CN 201010238602A CN 101894166 A CN101894166 A CN 101894166A
Authority
CN
China
Prior art keywords
search
user
natural language
engine system
search engine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102386022A
Other languages
English (en)
Inventor
郑琪心
郑茂
郑琪文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN2010102386022A priority Critical patent/CN101894166A/zh
Publication of CN101894166A publication Critical patent/CN101894166A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种网络智能搜索引擎系统,通过语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元,建立多角形复合数据统计语言模型。首先依据多个单元进行独立网络搜索,获得多个类别的索引模板;其次使用多角形复合数据统计语言模型对用户自然语言提出的搜索问题分析,获得多个类别的标本模板。通过相似单元的索引模板和标本模板比对,获得搜索逻辑模板,并形成一项或多项自然语言描述的搜索界定范围选项,在用户提出搜索问题的同一界面呈现。用户对界定范围的再次选择,实质修正和减小自然语言问题的误差,缩小逻辑搜索的范围。用户选择后形成搜索逻辑模块,而后通过搜索数据库的查询,得到用户答案模块。

Description

网络智能搜索引擎系统
所属技术领域
本发明涉及一种网络智能搜索引擎系统,尤其是能对用户自然语言问题进行分析,对用户的搜索问题推荐提出一项或多项搜索范围的自然语言描述供用户选择,减小自然语言问题的误差,避免了搜索引擎信息量大、查询不准确、深度不够等问题,辅助用户精准地获得搜索答案。本发明直接应用于移动通讯搜索和互联网搜索等领域,对于终端显示信息容量相对有限制的网络终端设备非常适用。
背景技术
搜索引擎的使命是整合网络的信息,如何让机器对信息、语言做最好的理解和处理,人类的思维、行为对机器的影响是至关重要的。目前,公知的网络搜索引擎仅提供用户一个搜索输入框及一些限定的搜索条件范围,搜索引擎完全依赖自身的搜索算法、检索公式、网络信息检索技术等等脱离用户感知、参与、互动的系统和技术这是有所缺陷的。
网络信息搜索是“问与答”的模式,如果检索的用户没有准确的“问”问题,搜索引擎的“答案”肯定容易造成错误判断。
所有的问题都有解决的方法,关键是有没有问对问题。因此本发明解决的就是高效率修正问题,获得答案。
发明内容
为了解决现有搜索引擎信息量大、查询不准确、深度精度不够等不足,本发明提供一种网络智能搜索引擎系统,本搜索引擎不仅能为用户提供网络搜索信息服务,而且能理解用户用自然语言和关键字词提出各种问题,并能在用户的简单协作下,给用户提供希望得到的问题答案。
本发明解决其技术问题所采用的技术方案是:本发明根据用户查询请求的自然语言问题形式,建立了多角形复合数据统计语言模型,按照一定算法比对和分析用户的搜索问题,从而生成一项或多项以模拟自然语言形式来描述的搜索界定范围选项。通过用户的再次选择,搜索引擎从搜索数据库中查找出相对精准的信息返回给用户。
网络智能搜索引擎系统主要由多角形复合数据统计语言模型和搜索数据库等部分组成。
多角形复合数据统计语言模型是由语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元数据库、网络索引模板库、用户问题标本模板库、搜索逻辑模板库、搜索器、分析器、自然语言生成器等部分构成。
多角形复合数据统计语言模型主要是推测用户的需求目标、问题诉求目标。
多个独立单元中的语义指搜索引擎的工作不拘泥于用户所输入请求语句的字面本身,而是透过现象看本质,准确地捕捉到用户所输入语句后面的真正意图,并以此来进行搜索。
多个独立单元中的垂直专业标识指针对某一特定领域、某一特定需求做出的专、精、深的信息分类标识。
多个独立单元中的关联信息标识指自然语言处理中的语言现象的相关性联系标识;也对多音多义字词进行关联性标识。
首先依据语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元数据库定义网络索引模板库使用搜索器在网络上开始搜索网络信息,建立基于语义、关键词、关键字、垂直专业标识、关联信息标识的索引模板;而后依据语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元数据库定义用户问题标本模板库使用分析器对用户自然语言问题开始分析,建立基于语义、关键词、关键字、垂直专业标识、关联信息标识的标本模板;当网络信息索引模板和用户自然语言标本模板建立后,整个多角形复合数据统计语言模型就开始海量采集、积累、存储、维护、更新,以海量信息填充语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元数据库。
当用户开始搜索查询时,搜索逻辑模板库将索引模板和标本模板比对,依据语义、关键词、关键字、垂直专业标识、关联信息标识等独立单元中任一或多个相似单元的要素,形成搜索逻辑范围。
而后自然语言生成器模拟用户问题标本模板库中存储的自然语言形式,生成一项或多项自然语言描述形式的搜索界定范围选项,在用户提出搜索问题的同一界面呈现,并提供用户再次选择。提供用户对界定范围的选择,是修正和减小用户自然语言问题的误差,使用人工干预的形式缩小搜索逻辑模板的范围。搜索必定是用户发起的,用户对即将获得的答案是有唯一的、独立的思维界定,搜索引擎纯机器算法和智能模拟是基于搜索引擎覆盖的整个网络为基础出发点的,用户的搜索问题很大程度上是基于很小、很狭窄的信息空间提出的。因此,用户辅助选择后最终形成语言逻辑模块,而后通过对后台搜索数据库的查询,返回得到用户的答案模块。
网络智能搜索引擎系统索引方法
为了加快信息检索的速度,本发明对信息库建立单元并列索引。语义、关键词、关键字、垂直专业标识、关联信息标识等独立单元完全以同等并列级别存在,对每一网路信息建立多单元索引。过滤非单元以外的无用信息,对不能明确表达网络信息归属的信息不对它们进行索引。
本发明的有益效果是:通过本发明索引的网络信息和用户问题的比对,在本发明形成的搜索界定范围的引导下,用户通过自然语言的形式修正和缩小搜索问题的范围,减小了网络资源的负载,精准地获得了希望的答案。本发明使用简单,符合用户使用习惯易于使用。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明实例显示图
图中1.搜索引擎用户搜索框,2.搜索执行按键,3.本发明提供用户再次选择的搜索界定范围第一项,4.本发明提供用户再次选择的搜索界定范围第四项
图2是本发明体系结构图
图中1.独立单元(语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元),2.索引模板,3.标本模板,4.搜索逻辑,5.搜索界定范围,6.用户
具体实施方式
图1是本发明一种网络智能搜索引擎系统的实例显示图。在同一界面呈现是用户提出搜索的问题和再次提供用户选择的搜索界定范围选项均在同一个显示界面中呈现,不分页呈现;搜索界定范围可以是一项或多项,其内容是以模拟自然语言形式来描述的文字或数据。
图2是本发明一种网络智能搜索引擎系统的体系结构图。通过语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元(1),建立多角形复合数据统计语言模型。首先依据多个单元进行独立网络搜索,获得多个类别的索引模板(2);其次使用多角形复合数据统计语言模型对用户自然语言提出的搜索问题分析,获得多个类别的标本模板(3)。通过相似单元的索引模板和标本模板比对,获得搜索逻辑模板(4),并形成一项或多项自然语言描述的搜索界定范围选项(5),在用户提出搜索问题的同一界面呈现。用户对界定范围的再次选择,实质修正和减小自然语言问题的误差,缩小逻辑搜索的范围。用户选择后形成搜索逻辑模块,而后通过搜索数据库的查询,得到用户的答案模块(6)。

Claims (6)

1.一种网络智能搜索引擎系统,其特征在于包括:通过语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元,建立多角形复合数据统计语言模型。依据多个单元进行独立网络搜索,获得多个类别的索引模板(1)。依据语义、关键词、关键字、垂直专业标识、关联信息标识等多个单元对用户自然语言提出的搜索问题分析,获得多个类别的标本模板(2)。通过相似单元的索引模板和标本模板比对,获得搜索逻辑模板,并形成一项或多项自然语言描述的搜索界定范围选项,在用户提出搜索问题的同一界面呈现(3)。用户对界定范围的再次选择,形成搜索逻辑模块,而后通过搜索数据库的查询,得到用户的希望的答案模块(4)。
2.根据权利要求1所述的网络智能搜索引擎系统,其特征是:在步骤(1)中所述的网络搜索到的任一网络信息依据语义、关键词、关键字、垂直专业标识、关联信息标识等附加索引并以数据形式存储。
3.根据权利要求1所述的网络智能搜索引擎系统,其特征是:在步骤(2)中所述的对用户自然语言提出的搜索问题分析依据语义、关键词、关键字、垂直专业标识、关联信息标识等附加索引并以数据形式存储。
4.根据权利要求1所述的网络智能搜索引擎系统,其特征是:在步骤(3)中所述的同一界面呈现是用户提出搜索问题和再次选择搜索界定范围均在同一个显示界面中呈现,不分页呈现;搜索界定范围可以是一项或多项以模拟自然语言形式来描述的文字或数据。
5.根据权利要求1所述的网络智能搜索引擎系统,其特征是:在步骤(4)中所述的用户的希望的答案可以是自然语言或是数据。
6.根据权利要求1所述的网络智能搜索引擎系统,其特征是:本发明所涉及的自然语言可以是中文或其它语言。
CN2010102386022A 2010-07-28 2010-07-28 网络智能搜索引擎系统 Pending CN101894166A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102386022A CN101894166A (zh) 2010-07-28 2010-07-28 网络智能搜索引擎系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102386022A CN101894166A (zh) 2010-07-28 2010-07-28 网络智能搜索引擎系统

Publications (1)

Publication Number Publication Date
CN101894166A true CN101894166A (zh) 2010-11-24

Family

ID=43103358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102386022A Pending CN101894166A (zh) 2010-07-28 2010-07-28 网络智能搜索引擎系统

Country Status (1)

Country Link
CN (1) CN101894166A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103139256A (zh) * 2011-11-30 2013-06-05 北大方正集团有限公司 一种多租户网络舆情监控方法及系统
CN109684376A (zh) * 2018-12-11 2019-04-26 孙炜 启发式精准知识数据搜索引擎及数据自学习自诊断方法
CN111382226A (zh) * 2018-12-29 2020-07-07 北京神州泰岳软件股份有限公司 一种数据库查询检索方法、装置和电子设备
CN112445894A (zh) * 2019-09-05 2021-03-05 美商讯能集思智能科技股份有限公司台湾分公司 基于人工智能的商务智能系统及其分析方法
CN112970014A (zh) * 2018-11-15 2021-06-15 微软技术许可有限责任公司 使用共享的ai模型的搜索引擎功能性
CN116737777A (zh) * 2023-08-16 2023-09-12 北京壁仞科技开发有限公司 对目标算子进行搜索的方法、计算设备和计算机可读存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103139256A (zh) * 2011-11-30 2013-06-05 北大方正集团有限公司 一种多租户网络舆情监控方法及系统
CN103139256B (zh) * 2011-11-30 2016-05-04 北大方正集团有限公司 一种多租户网络舆情监控方法及系统
CN112970014A (zh) * 2018-11-15 2021-06-15 微软技术许可有限责任公司 使用共享的ai模型的搜索引擎功能性
CN109684376A (zh) * 2018-12-11 2019-04-26 孙炜 启发式精准知识数据搜索引擎及数据自学习自诊断方法
CN111382226A (zh) * 2018-12-29 2020-07-07 北京神州泰岳软件股份有限公司 一种数据库查询检索方法、装置和电子设备
CN111382226B (zh) * 2018-12-29 2023-09-19 北京神州泰岳软件股份有限公司 一种数据库查询检索方法、装置和电子设备
CN112445894A (zh) * 2019-09-05 2021-03-05 美商讯能集思智能科技股份有限公司台湾分公司 基于人工智能的商务智能系统及其分析方法
CN116737777A (zh) * 2023-08-16 2023-09-12 北京壁仞科技开发有限公司 对目标算子进行搜索的方法、计算设备和计算机可读存储介质
CN116737777B (zh) * 2023-08-16 2023-11-28 北京壁仞科技开发有限公司 对目标算子进行搜索的方法、计算设备和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN102087669B (zh) 基于语义关联的智能搜索引擎系统
US11899681B2 (en) Knowledge graph building method, electronic apparatus and non-transitory computer readable storage medium
CN107844565B (zh) 商品搜索方法和装置
CN102968465B (zh) 网络信息服务平台及其基于该平台的搜索服务方法
CN106933833B (zh) 一种基于空间索引技术的位置信息快速查询方法
CN102270232B (zh) 一种存储优化的语义数据查询系统
CN106447346A (zh) 一种智能电力客服系统的构建方法及系统
Delen et al. A holistic framework for knowledge discovery and management
CN101894166A (zh) 网络智能搜索引擎系统
CN104375992A (zh) 一种地址匹配的方法和装置
CN109902087B (zh) 用于问答的数据处理方法及装置、服务器
CN103294815A (zh) 基于关键字分类并有多种呈现方式的搜索引擎装置与方法
CN104850601A (zh) 基于图数据库的警务实时分析应用平台及其构建方法
CN105721944A (zh) 智能电视的新闻资讯推荐方法
CN104298785A (zh) 一种众搜资源搜索方法
CN103646079A (zh) 一种用于图数据库搜索的分布式索引及其并行生成方法
CN104615734B (zh) 一种社区管理服务大数据处理系统及其处理方法
CN103384883A (zh) 利用Top-K处理使语义丰富
CN103309869A (zh) 数据对象的展示关键词推荐方法及系统
CN105975609A (zh) 一种工业设计产品智能推荐方法及系统
CN103927339B (zh) 知识重组系统和知识重组方法
CN102508901A (zh) 基于内容的海量图像检索方法和系统
CN102722528A (zh) 基于移动设备的实时海量图像检索方法
CN113254630A (zh) 一种面向全球综合观测成果的领域知识图谱推荐方法
CN104933143A (zh) 获取推荐对象的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20101124