CN110968648A - 基于SphinxMySQL的高效人脉索引方法 - Google Patents
基于SphinxMySQL的高效人脉索引方法 Download PDFInfo
- Publication number
- CN110968648A CN110968648A CN201811143302.9A CN201811143302A CN110968648A CN 110968648 A CN110968648 A CN 110968648A CN 201811143302 A CN201811143302 A CN 201811143302A CN 110968648 A CN110968648 A CN 110968648A
- Authority
- CN
- China
- Prior art keywords
- sphinx
- index
- updating
- creating
- sphinxmysql
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 14
- 210000003462 vein Anatomy 0.000 title claims abstract description 13
- 241000252794 Sphinx Species 0.000 claims abstract description 31
- 238000013515 script Methods 0.000 claims abstract description 7
- 238000011056 performance test Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims 1
- 230000011218 segmentation Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
- G06F8/61—Installation
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Devices For Executing Special Programs (AREA)
Abstract
本发明公开了一种基于SphinxMySQL的高效人脉索引方法,其包括步骤一,首先需要在MySQL上创建Sphinx的索引文件,然后创建Sphinx配置文件,完成文件创建后,需要初始化Sphinx中配置的全部索引,步骤二,创建两个shell脚本,然后更新增量索引并赋予可执行权限,最后启动Sphinx的守护进程,步骤三,下载编译并安装SCWS,下载词库并移动到SCWS进行配置,步骤四,更新完成过后需要连通用户所在人才库,并且完成用户所在人才库信息的更新,步骤五,最后需要更新用户索引。综上所述,本发明易于维护、更新,能够同时支持多个用人单位在自己的人才库中搜索,并且基本不存在数据冗余,搜索响应速度快,搜索效率高。
Description
技术领域
本发明涉及一种人脉索引方法,特别是涉及一种基于SphinxMySQL的高效人脉索引方法。
背景技术
Sphinx是一个全文检索引擎,索引和搜索性能优异,易于集成MySQL数据源,并提供有多种形式的搜索接口,现有技术对每个候选人的信息多次索引,索引数据过分冗余,占用过多的存储资源,同时造成搜索速度变慢。
发明内容
本发明所要解决的技术问题是提供一种基于SphinxMySQL的高效人脉索引方法,其易于维护、更新,能够同时支持多个用人单位在自己的人才库中搜索,并且基本不存在数据冗余,搜索响应速度快,搜索效率高。
本发明是通过下述技术方案来解决上述技术问题的:一种基于SphinxMySQL的高效人脉索引方法,其特征在于,其包括如下步骤:
步骤一,首先需要在MySQL上创建Sphinx的索引文件,然后创建Sphinx配置文件,完成文件创建后,需要初始化Sphinx中配置的全部索引;
步骤二,创建两个shell脚本,一个用来创建主索引,一个用来创建增量索引,设置好每天凌晨定时重建主索引,然后更新增量索引并赋予可执行权限,设置没三分钟自动重建一次搜索引擎的增量索引,最后启动Sphinx的守护进程;
步骤三,下载编译并安装SCWS,下载词库并移动到SCWS进行配置,然后安装httpscws系统,接着编写httpscws启动脚本,最后通过PHP代码对Sphinx进行性能测试;
步骤四,完成测试后需要更新Sphinx人才库的信息,更新完成过后需要连通用户所在人才库,并且完成用户所在人才库信息的更新;
步骤五,最后需要更新用户索引,完成信息更新后,需要重新启动Sphinx才能进行索引工作。
优选地,所述步骤二中Sphinx能够支持单字节编码与UTF-8编码。
优选地,所述步骤三中的PHP的语法混合了C、Java、Perl以及PHP自创新的语法。
本发明的积极进步效果在于:基于SphinxMySQL的高效人脉索引方法易于维护、更新,能够同时支持多个用人单位在自己的人才库中搜索,并且基本不存在数据冗余,搜索响应速度快,搜索效率高。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图给出本发明较佳实施例,以详细说明本发明的技术方案。
如图1所示,本发明基于SphinxMySQL的高效人脉索引方法包括如下步骤:
步骤一,首先需要在MySQL(关系型数据库管理系统)上创建Sphinx(全文检索引擎)的索引文件,然后创建Sphinx配置文件,完成文件创建后,需要初始化Sphinx中配置的全部索引;
步骤二,创建两个shell(系统的用户界面)脚本,一个用来创建主索引,一个用来创建增量索引,设置好每天凌晨定时重建主索引,然后更新增量索引并赋予可执行权限,设置没三分钟自动重建一次搜索引擎的增量索引,最后启动Sphinx的守护进程;
步骤三,下载编译并安装SCWS(简易中文分词系统),下载词库并移动到SCWS进行配置,然后安装httpscws(基于scws的http协议中文分词)系统,接着编写httpscws启动脚本,最后通过PHP(超级文本预处理语言)代码对Sphinx进行性能测试;
步骤四,完成测试后需要更新Sphinx人才库的信息,更新完成过后需要连通用户所在人才库,并且完成用户所在人才库信息的更新;
步骤五,最后需要更新用户索引,完成信息更新后,需要重新启动Sphinx才能进行索引工作。
所述步骤二中Sphinx能够支持单字节编码与UTF-8编码,这样便于对其进行编程,便于创建新的Sphinx索引文件。
所述步骤三中的PHP的语法混合了C、Java、Perl以及PHP自创新的语法,它可以比CGI或者Perl更快速的执行动态网页。
综上所述,本发明基于SphinxMySQL的高效人脉索引方法易于维护、更新,能够同时支持多个用人单位在自己的人才库中搜索,并且基本不存在数据冗余,搜索响应速度快,搜索效率高。
以上所述的具体实施例,对本发明的解决的技术问题、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (3)
1.一种基于SphinxMySQL的高效人脉索引方法,其特征在于,其包括如下步骤:
步骤一,首先需要在MySQL上创建Sphinx的索引文件,然后创建Sphinx配置文件,完成文件创建后,需要初始化Sphinx中配置的全部索引;
步骤二,创建两个shell脚本,一个用来创建主索引,一个用来创建增量索引,设置好每天凌晨定时重建主索引,然后更新增量索引并赋予可执行权限,设置没三分钟自动重建一次搜索引擎的增量索引,最后启动Sphinx的守护进程;
步骤三,下载编译并安装SCWS,下载词库并移动到SCWS进行配置,然后安装httpscws系统,接着编写httpscws启动脚本,最后通过PHP代码对Sphinx进行性能测试;
步骤四,完成测试后需要更新Sphinx人才库的信息,更新完成过后需要连通用户所在人才库,并且完成用户所在人才库信息的更新;
步骤五,最后需要更新用户索引,完成信息更新后,需要重新启动Sphinx才能进行索引工作。
2.如权利要求1所述的基于SphinxMySQL的高效人脉索引方法,其特征在于,所述步骤二中Sphinx能够支持单字节编码与UTF-8编码。
3.如权利要求1所述的基于SphinxMySQL的高效人脉索引方法,其特征在于,所述步骤三中的PHP的语法混合了C、Java、Perl以及PHP自创新的语法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811143302.9A CN110968648A (zh) | 2018-09-28 | 2018-09-28 | 基于SphinxMySQL的高效人脉索引方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811143302.9A CN110968648A (zh) | 2018-09-28 | 2018-09-28 | 基于SphinxMySQL的高效人脉索引方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110968648A true CN110968648A (zh) | 2020-04-07 |
Family
ID=70027969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811143302.9A Pending CN110968648A (zh) | 2018-09-28 | 2018-09-28 | 基于SphinxMySQL的高效人脉索引方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110968648A (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103455637A (zh) * | 2013-09-25 | 2013-12-18 | 浙江宇视科技有限公司 | 一种车牌检索的方法和装置 |
-
2018
- 2018-09-28 CN CN201811143302.9A patent/CN110968648A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103455637A (zh) * | 2013-09-25 | 2013-12-18 | 浙江宇视科技有限公司 | 一种车牌检索的方法和装置 |
Non-Patent Citations (2)
Title |
---|
PHP日记: "《php sphinx 高效率搜索引擎搭建(一)》", Retrieved from the Internet <URL:https://mp.weixin.qq.com/s/bHc3brlw-O3OrSqT0D38Yw> * |
稳平的日记: "《sphinx续5-主索引增量索引和实时索引》", Retrieved from the Internet <URL:https://mp.weixin. qq.com/s/3FHey64X4_6O4 Tml6nx7OA> * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107918666B (zh) | 一种区块链上的数据同步方法和系统 | |
CN101334728B (zh) | 一种基于xml文档描述的界面生成方法和装置 | |
US9489189B2 (en) | Dynamically generate and execute a context-specific patch installation procedure on a computing system | |
CN102750356B (zh) | 一种键值库辅助索引的构建与管理方法 | |
CN111324610A (zh) | 一种数据同步的方法及装置 | |
JPH05505050A (ja) | 変更ファイルから情報を検索するためにデータベースコンポーネントファイルを探索する方法及び装置 | |
CN104331285A (zh) | 一种代码自动生成方法及系统 | |
CN107766130B (zh) | 虚拟机向容器迁移的方法和装置 | |
CN110334326B (zh) | 一种识别配方文件并转化为xml文件的方法及系统 | |
CN103530427A (zh) | 一种基于多数据库的动态切换方法和装置 | |
KR20210060897A (ko) | 음성 처리 방법 및 장치 | |
CN110502520A (zh) | 一种数据入库的方法、系统、设备及计算机可读存储介质 | |
CN109284125A (zh) | 大数据平台中的依赖包配置方法、装置、设备及介质 | |
CN110968648A (zh) | 基于SphinxMySQL的高效人脉索引方法 | |
CN106570152B (zh) | 一种手机号码的海量提取方法及系统 | |
JP2022054389A (ja) | 検索モデルの訓練方法、装置、デバイス、コンピュータ記憶媒体、及びコンピュータプログラム | |
CN111913704A (zh) | 一种基于VSCode快速开发GSP7脚本的方法及插件工具 | |
CN111258595A (zh) | 一种基于PyInstaller的python源代码封装方法 | |
CN115437640A (zh) | 快速编译工程代码的方法 | |
CN111984673A (zh) | 一种电网电能量计量系统树形结构模糊检索方法和装置 | |
CN108090034B (zh) | 基于集群的单证代码统一编码生成方法和系统 | |
CN109491904B (zh) | 一种SparkSQL应用程序的自动化测试方法和装置 | |
CN111259003B (zh) | 一种数据库建立方法及装置 | |
CN110555185A (zh) | 基于pc客户端的页面定制方法及系统 | |
CN105824976A (zh) | 一种优化分词库的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |