CN110968648A - 基于SphinxMySQL的高效人脉索引方法 - Google Patents

基于SphinxMySQL的高效人脉索引方法 Download PDF

Info

Publication number
CN110968648A
CN110968648A CN201811143302.9A CN201811143302A CN110968648A CN 110968648 A CN110968648 A CN 110968648A CN 201811143302 A CN201811143302 A CN 201811143302A CN 110968648 A CN110968648 A CN 110968648A
Authority
CN
China
Prior art keywords
sphinx
index
updating
creating
sphinxmysql
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811143302.9A
Other languages
English (en)
Inventor
刘峰斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Taoyoutianxia Technology Co Ltd
Original Assignee
Beijing Taoyoutianxia Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Taoyoutianxia Technology Co Ltd filed Critical Beijing Taoyoutianxia Technology Co Ltd
Priority to CN201811143302.9A priority Critical patent/CN110968648A/zh
Publication of CN110968648A publication Critical patent/CN110968648A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/61Installation

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Devices For Executing Special Programs (AREA)

Abstract

本发明公开了一种基于SphinxMySQL的高效人脉索引方法,其包括步骤一,首先需要在MySQL上创建Sphinx的索引文件,然后创建Sphinx配置文件,完成文件创建后,需要初始化Sphinx中配置的全部索引,步骤二,创建两个shell脚本,然后更新增量索引并赋予可执行权限,最后启动Sphinx的守护进程,步骤三,下载编译并安装SCWS,下载词库并移动到SCWS进行配置,步骤四,更新完成过后需要连通用户所在人才库,并且完成用户所在人才库信息的更新,步骤五,最后需要更新用户索引。综上所述,本发明易于维护、更新,能够同时支持多个用人单位在自己的人才库中搜索,并且基本不存在数据冗余,搜索响应速度快,搜索效率高。

Description

基于SphinxMySQL的高效人脉索引方法
技术领域
本发明涉及一种人脉索引方法,特别是涉及一种基于SphinxMySQL的高效人脉索引方法。
背景技术
Sphinx是一个全文检索引擎,索引和搜索性能优异,易于集成MySQL数据源,并提供有多种形式的搜索接口,现有技术对每个候选人的信息多次索引,索引数据过分冗余,占用过多的存储资源,同时造成搜索速度变慢。
发明内容
本发明所要解决的技术问题是提供一种基于SphinxMySQL的高效人脉索引方法,其易于维护、更新,能够同时支持多个用人单位在自己的人才库中搜索,并且基本不存在数据冗余,搜索响应速度快,搜索效率高。
本发明是通过下述技术方案来解决上述技术问题的:一种基于SphinxMySQL的高效人脉索引方法,其特征在于,其包括如下步骤:
步骤一,首先需要在MySQL上创建Sphinx的索引文件,然后创建Sphinx配置文件,完成文件创建后,需要初始化Sphinx中配置的全部索引;
步骤二,创建两个shell脚本,一个用来创建主索引,一个用来创建增量索引,设置好每天凌晨定时重建主索引,然后更新增量索引并赋予可执行权限,设置没三分钟自动重建一次搜索引擎的增量索引,最后启动Sphinx的守护进程;
步骤三,下载编译并安装SCWS,下载词库并移动到SCWS进行配置,然后安装httpscws系统,接着编写httpscws启动脚本,最后通过PHP代码对Sphinx进行性能测试;
步骤四,完成测试后需要更新Sphinx人才库的信息,更新完成过后需要连通用户所在人才库,并且完成用户所在人才库信息的更新;
步骤五,最后需要更新用户索引,完成信息更新后,需要重新启动Sphinx才能进行索引工作。
优选地,所述步骤二中Sphinx能够支持单字节编码与UTF-8编码。
优选地,所述步骤三中的PHP的语法混合了C、Java、Perl以及PHP自创新的语法。
本发明的积极进步效果在于:基于SphinxMySQL的高效人脉索引方法易于维护、更新,能够同时支持多个用人单位在自己的人才库中搜索,并且基本不存在数据冗余,搜索响应速度快,搜索效率高。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图给出本发明较佳实施例,以详细说明本发明的技术方案。
如图1所示,本发明基于SphinxMySQL的高效人脉索引方法包括如下步骤:
步骤一,首先需要在MySQL(关系型数据库管理系统)上创建Sphinx(全文检索引擎)的索引文件,然后创建Sphinx配置文件,完成文件创建后,需要初始化Sphinx中配置的全部索引;
步骤二,创建两个shell(系统的用户界面)脚本,一个用来创建主索引,一个用来创建增量索引,设置好每天凌晨定时重建主索引,然后更新增量索引并赋予可执行权限,设置没三分钟自动重建一次搜索引擎的增量索引,最后启动Sphinx的守护进程;
步骤三,下载编译并安装SCWS(简易中文分词系统),下载词库并移动到SCWS进行配置,然后安装httpscws(基于scws的http协议中文分词)系统,接着编写httpscws启动脚本,最后通过PHP(超级文本预处理语言)代码对Sphinx进行性能测试;
步骤四,完成测试后需要更新Sphinx人才库的信息,更新完成过后需要连通用户所在人才库,并且完成用户所在人才库信息的更新;
步骤五,最后需要更新用户索引,完成信息更新后,需要重新启动Sphinx才能进行索引工作。
所述步骤二中Sphinx能够支持单字节编码与UTF-8编码,这样便于对其进行编程,便于创建新的Sphinx索引文件。
所述步骤三中的PHP的语法混合了C、Java、Perl以及PHP自创新的语法,它可以比CGI或者Perl更快速的执行动态网页。
综上所述,本发明基于SphinxMySQL的高效人脉索引方法易于维护、更新,能够同时支持多个用人单位在自己的人才库中搜索,并且基本不存在数据冗余,搜索响应速度快,搜索效率高。
以上所述的具体实施例,对本发明的解决的技术问题、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于SphinxMySQL的高效人脉索引方法,其特征在于,其包括如下步骤:
步骤一,首先需要在MySQL上创建Sphinx的索引文件,然后创建Sphinx配置文件,完成文件创建后,需要初始化Sphinx中配置的全部索引;
步骤二,创建两个shell脚本,一个用来创建主索引,一个用来创建增量索引,设置好每天凌晨定时重建主索引,然后更新增量索引并赋予可执行权限,设置没三分钟自动重建一次搜索引擎的增量索引,最后启动Sphinx的守护进程;
步骤三,下载编译并安装SCWS,下载词库并移动到SCWS进行配置,然后安装httpscws系统,接着编写httpscws启动脚本,最后通过PHP代码对Sphinx进行性能测试;
步骤四,完成测试后需要更新Sphinx人才库的信息,更新完成过后需要连通用户所在人才库,并且完成用户所在人才库信息的更新;
步骤五,最后需要更新用户索引,完成信息更新后,需要重新启动Sphinx才能进行索引工作。
2.如权利要求1所述的基于SphinxMySQL的高效人脉索引方法,其特征在于,所述步骤二中Sphinx能够支持单字节编码与UTF-8编码。
3.如权利要求1所述的基于SphinxMySQL的高效人脉索引方法,其特征在于,所述步骤三中的PHP的语法混合了C、Java、Perl以及PHP自创新的语法。
CN201811143302.9A 2018-09-28 2018-09-28 基于SphinxMySQL的高效人脉索引方法 Pending CN110968648A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811143302.9A CN110968648A (zh) 2018-09-28 2018-09-28 基于SphinxMySQL的高效人脉索引方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811143302.9A CN110968648A (zh) 2018-09-28 2018-09-28 基于SphinxMySQL的高效人脉索引方法

Publications (1)

Publication Number Publication Date
CN110968648A true CN110968648A (zh) 2020-04-07

Family

ID=70027969

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811143302.9A Pending CN110968648A (zh) 2018-09-28 2018-09-28 基于SphinxMySQL的高效人脉索引方法

Country Status (1)

Country Link
CN (1) CN110968648A (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455637A (zh) * 2013-09-25 2013-12-18 浙江宇视科技有限公司 一种车牌检索的方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455637A (zh) * 2013-09-25 2013-12-18 浙江宇视科技有限公司 一种车牌检索的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PHP日记: "《php sphinx 高效率搜索引擎搭建(一)》", Retrieved from the Internet <URL:https://mp.weixin.qq.com/s/bHc3brlw-O3OrSqT0D38Yw> *
稳平的日记: "《sphinx续5-主索引增量索引和实时索引》", Retrieved from the Internet <URL:https://mp.weixin. qq.com/s/3FHey64X4_6O4 Tml6nx7OA> *

Similar Documents

Publication Publication Date Title
CN107918666B (zh) 一种区块链上的数据同步方法和系统
CN101334728B (zh) 一种基于xml文档描述的界面生成方法和装置
US9489189B2 (en) Dynamically generate and execute a context-specific patch installation procedure on a computing system
CN102750356B (zh) 一种键值库辅助索引的构建与管理方法
CN111324610A (zh) 一种数据同步的方法及装置
JPH05505050A (ja) 変更ファイルから情報を検索するためにデータベースコンポーネントファイルを探索する方法及び装置
CN104331285A (zh) 一种代码自动生成方法及系统
CN107766130B (zh) 虚拟机向容器迁移的方法和装置
CN110334326B (zh) 一种识别配方文件并转化为xml文件的方法及系统
CN103530427A (zh) 一种基于多数据库的动态切换方法和装置
KR20210060897A (ko) 음성 처리 방법 및 장치
CN110502520A (zh) 一种数据入库的方法、系统、设备及计算机可读存储介质
CN109284125A (zh) 大数据平台中的依赖包配置方法、装置、设备及介质
CN110968648A (zh) 基于SphinxMySQL的高效人脉索引方法
CN106570152B (zh) 一种手机号码的海量提取方法及系统
JP2022054389A (ja) 検索モデルの訓練方法、装置、デバイス、コンピュータ記憶媒体、及びコンピュータプログラム
CN111913704A (zh) 一种基于VSCode快速开发GSP7脚本的方法及插件工具
CN111258595A (zh) 一种基于PyInstaller的python源代码封装方法
CN115437640A (zh) 快速编译工程代码的方法
CN111984673A (zh) 一种电网电能量计量系统树形结构模糊检索方法和装置
CN108090034B (zh) 基于集群的单证代码统一编码生成方法和系统
CN109491904B (zh) 一种SparkSQL应用程序的自动化测试方法和装置
CN111259003B (zh) 一种数据库建立方法及装置
CN110555185A (zh) 基于pc客户端的页面定制方法及系统
CN105824976A (zh) 一种优化分词库的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination