CN201114128Y - 企业搜索引擎装置 - Google Patents
企业搜索引擎装置 Download PDFInfo
- Publication number
- CN201114128Y CN201114128Y CNU2007200082153U CN200720008215U CN201114128Y CN 201114128 Y CN201114128 Y CN 201114128Y CN U2007200082153 U CNU2007200082153 U CN U2007200082153U CN 200720008215 U CN200720008215 U CN 200720008215U CN 201114128 Y CN201114128 Y CN 201114128Y
- Authority
- CN
- China
- Prior art keywords
- server
- search
- engine device
- search engine
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种企业搜索引擎装置,包括用户机、应用服务器、负载均衡服务器、管理服务器、目录服务器、至少一台搜索服务器、至少一台索引服务器,所述用户机连接到所述应用服务器上,所述应用服务器连接到所述负载均衡服务器上,所述负载均衡服务器分别连接到所述至少一台搜索服务器,所述搜索服务器分别连接一索引服务器。本实用新型企业搜索引擎装置的优点在于:该企业搜索引擎装置构建了一个企业搜索的平台,企业用户通过该企业搜索引擎装置,可以处理各种数据源,包括各种结构化数据和非结构化数据。
Description
【技术领域】
本实用新型是关于一种互联网装置,特别是指一种企业搜索引擎装置。
【背景技术】
搜索改变了人们的生活,计算机使用者若想要找资料,比如,找酒店或者饭店,首先想到去网上进行搜索,目前最常用的搜索引擎为百度、Google等几家大的搜索引擎。但是对于公司员工,若要找一篇公司的发文或者规章制度,则无法用百度或者Google去搜。即,百度、Google这些搜索是互联网搜索,无法满足企业内部的搜索需求。
企业内部数据分别存放在数据库,以及以邮件、网页,以及各种格式的文档的方式存放。其中,企业中有15%的数据是存放在数据库中的数据,称之为结构化的数据,这部分数据可以用数据库进行管理,处理。另外有85%的数据没有存放在数据库中,而是以邮件、网页,以及各种格式的文档的方式存放,称之为非结构化的数据,数据库对这些数据的处理则无能为力。因为这些数据不能用数据库进行管理,企业的员工只能手动去搜索,去管理,也因此占用了大量的工作时间。
因此,企业需要一个同时可以处理结构化数据和非结构化数据的企业搜索引擎装置。
【实用新型内容】
本实用新型所要解决的技术问题在于提供一种可以同时处理结构化数据和非结构化数据的企业搜索引擎装置。
本实用新型是通过以下技术方案解决上述技术问题的:一种企业搜索引擎装置,包括用户机、应用服务器、负载均衡服务器、管理服务器、目录服务器、至少一台搜索服务器、至少一台索引服务器,所述用户机连接到所述应用服务器上,所述应用服务器连接到所述负载均衡服务器上,所述负载均衡服务器分别连接到所述至少一台搜索服务器,所述搜索服务器分别连接一索引服务器。
所述用户机是便携式计算机、个人电脑,或者移动设备。
本实用新型企业搜索引擎装置的优点在于:该企业搜索引擎装置构建了一个企业搜索的平台,企业用户通过该企业搜索引擎装置,可以处理各种数据源,包括各种结构化数据和非结构化数据。
【附图说明】
下面参照附图结合实施例对本实用新型作进一步的描述。
图1是本实用新型企业搜索引擎装置连接图。
【具体实施方式】
请参阅图1所示,企业搜索引擎装置包括用户机、应用服务器、负载均衡服务器、管理服务器、目录服务器、第一搜索服务器、第一索引服务器、第二搜索服务器、第二索引服务器、第三搜索服务器、第三索引服务器。
其中用户机可以是便携式计算机、个人电脑,或者移动设备,用户机连接到所述应用服务器上。
所述管理服务器分别与应用服务器及目录服务器相连,应用服务器连接到所述负载均衡服务器上,所述负载均衡服务器分别连接到所述第一搜索服务器、第二搜索服务器,以及第三搜索服务器。第一搜索服务器连接一第一索引服务器,第二搜索服务器连接一第二索引服务器,第三搜索服务器连接一第三索引服务器。
所述应用服务器提供用户管理服务和搜索服务的应用。
所述目录服务器用来和现有的一些应用系统进行同步,并且提供整个搜索系统的安全保证机制。
所述管理服务器提供应用服务器以及目录服务器的管理,包括对系统运行状态、系统硬件资源的使用情况、对服务器进程的启、停等进行监控,以及授权管理,授权管理包括用户管理、权限管理和访问控制。
所述负载均衡服务器用来均衡各用户机,通过软件技术将所有用户机的请求平均分配给第一搜索服务器、第二搜索服务器,以及第三搜索服务器。
所述搜索服务器是整个企业搜索引擎装置的的数据中心,存储经过采集、分析加工和建立索引后的数据。
索引服务器根据预先设置的索引策略对采集的数据进行索引,以便在后续提供高效、准确的全文检索服务。建立数据索引的步骤包括:对采集以后的数据进行数据整合、对整合后的数据进行中文分词、然后建立索引。
采集的企业内数据包括各种企业应用系统的数据源,如公司内部网(Web页面)、门户系统、员工论坛、企业OA(办公自动化)、OA订票票务系统(Domino数据库)、文件系统(PDF、Word、Excel等)等应用系统。
可以将所需处理的数据归纳为结构化数据(各种关系型数据库)和非结构化数据(Domino文件系统、Web网页、邮件系统、TXT文本、OFFICE文档、PDF文档等)。
使用时,首先索引服务器对采集的数据进行索引,建立索引后的数据存储在搜索服务器中。用户机的请求通过应用服务器发给搜索服务器,并返回搜索结果。
Claims (2)
1.一种企业搜索引擎装置,其特征在于:包括用户机、应用服务器、负载均衡服务器、管理服务器、目录服务器、至少一台搜索服务器、至少一台索引服务器,所述用户机连接到所述应用服务器上,所述应用服务器连接到所述负载均衡服务器上,所述负载均衡服务器分别连接到所述至少一台搜索服务器,所述搜索服务器分别连接一索引服务器。
2.如权利要求1所述的企业搜索引擎装置,其特征在于:所述用户机是便携式计算机、个人电脑,或者移动设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNU2007200082153U CN201114128Y (zh) | 2007-09-12 | 2007-09-12 | 企业搜索引擎装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNU2007200082153U CN201114128Y (zh) | 2007-09-12 | 2007-09-12 | 企业搜索引擎装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN201114128Y true CN201114128Y (zh) | 2008-09-10 |
Family
ID=39965877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNU2007200082153U Expired - Fee Related CN201114128Y (zh) | 2007-09-12 | 2007-09-12 | 企业搜索引擎装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN201114128Y (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011035608A1 (zh) * | 2009-09-23 | 2011-03-31 | 中兴通讯股份有限公司 | 一种数据查询系统及其构建方法与相应的数据查询方法 |
CN102033910A (zh) * | 2010-11-19 | 2011-04-27 | 福建富士通信息软件有限公司 | 一种基于多数据源的企业搜索引擎技术 |
CN102075560A (zh) * | 2010-11-19 | 2011-05-25 | 福建富士通信息软件有限公司 | 一种基于系统耦合的福富企业搜索引擎技术 |
CN103927379A (zh) * | 2014-04-28 | 2014-07-16 | 太仓红码软件技术有限公司 | 一种企业搜索系统 |
CN104216966A (zh) * | 2014-08-25 | 2014-12-17 | 浪潮软件股份有限公司 | 一种支持多种方式创建索引的方法 |
CN109359087A (zh) * | 2018-06-15 | 2019-02-19 | 深圳市木浪云数据有限公司 | 即时文件索引和搜索方法、装置及系统 |
-
2007
- 2007-09-12 CN CNU2007200082153U patent/CN201114128Y/zh not_active Expired - Fee Related
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011035608A1 (zh) * | 2009-09-23 | 2011-03-31 | 中兴通讯股份有限公司 | 一种数据查询系统及其构建方法与相应的数据查询方法 |
CN102023997B (zh) * | 2009-09-23 | 2013-03-20 | 中兴通讯股份有限公司 | 一种数据查询系统及其构建方法与相应的数据查询方法 |
US8909666B2 (en) | 2009-09-23 | 2014-12-09 | Zte Corporation | Data query system and constructing method thereof and corresponding data query method |
CN102033910A (zh) * | 2010-11-19 | 2011-04-27 | 福建富士通信息软件有限公司 | 一种基于多数据源的企业搜索引擎技术 |
CN102075560A (zh) * | 2010-11-19 | 2011-05-25 | 福建富士通信息软件有限公司 | 一种基于系统耦合的福富企业搜索引擎技术 |
CN103927379A (zh) * | 2014-04-28 | 2014-07-16 | 太仓红码软件技术有限公司 | 一种企业搜索系统 |
CN104216966A (zh) * | 2014-08-25 | 2014-12-17 | 浪潮软件股份有限公司 | 一种支持多种方式创建索引的方法 |
CN109359087A (zh) * | 2018-06-15 | 2019-02-19 | 深圳市木浪云数据有限公司 | 即时文件索引和搜索方法、装置及系统 |
CN109359087B (zh) * | 2018-06-15 | 2020-11-17 | 深圳市木浪云数据有限公司 | 即时文件索引和搜索方法、装置及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8862458B2 (en) | Natural language interface | |
US10146878B2 (en) | Method and system for creating filters for social data topic creation | |
CN201114128Y (zh) | 企业搜索引擎装置 | |
US20170060856A1 (en) | Efficient search and analysis based on a range index | |
US20140095505A1 (en) | Performance and scalability in an intelligent data operating layer system | |
CN103942268B (zh) | 搜索与应用相结合的方法、设备以及应用接口 | |
US11170031B2 (en) | Extraction and normalization of mutant genes from unstructured text for cognitive search and analytics | |
US20180089193A1 (en) | Category-based data analysis system for processing stored data-units and calculating their relevance to a subject domain with exemplary precision, and a computer-implemented method for identifying from a broad range of data sources, social entities that perform the function of Social Influencers | |
CN107748748A (zh) | 水利水电技术标准全文检索系统 | |
US10803106B1 (en) | System with methodology for dynamic modular ontology | |
CN201114172Y (zh) | 企业统一门户装置 | |
CN103092574B (zh) | 一种基于递归自主式复杂任务分解系统及方法 | |
Huang et al. | Research and application of integration solution for enterprise-level heterogeneous document management systems | |
Zhou et al. | A distributed text mining system for online web textual data analysis | |
Wu et al. | Cluster based detection and analysis of internet topics | |
Li et al. | Discovering associations between news and contents in social network sites with the D-Miner service framework | |
Chan et al. | System design of cloud search engine based on rich text content | |
Ling-ping et al. | Application of Three-dimensional Digital Model in Digital Archive Ubiquitous Intelligent Service | |
Tikhomirov et al. | News timeline generation: Accounting for structural aspects and temporal nature of news stream | |
de Souza et al. | Robust ranking of brazilian supreme court decisions | |
Bortnikov et al. | Modeling transactional queries via templates | |
KR102429625B1 (ko) | 의안정보제공방법 및 시스템 | |
JP5559725B2 (ja) | 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供方法 | |
RU2698916C1 (ru) | Способ и система поиска релевантных новостей | |
Qu et al. | Efficient file accessing techniques on hadoop distributed file systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080910 Termination date: 20160912 |
|
CF01 | Termination of patent right due to non-payment of annual fee |