CN101448048A - 大容量电话簿智能检索方法 - Google Patents

大容量电话簿智能检索方法 Download PDF

Info

Publication number
CN101448048A
CN101448048A CNA2007101710027A CN200710171002A CN101448048A CN 101448048 A CN101448048 A CN 101448048A CN A2007101710027 A CNA2007101710027 A CN A2007101710027A CN 200710171002 A CN200710171002 A CN 200710171002A CN 101448048 A CN101448048 A CN 101448048A
Authority
CN
China
Prior art keywords
telephone directory
layer
high capacity
retrieval
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007101710027A
Other languages
English (en)
Inventor
曾垂喜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Simcom Ltd
Original Assignee
Shanghai Simcom Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Simcom Ltd filed Critical Shanghai Simcom Ltd
Priority to CNA2007101710027A priority Critical patent/CN101448048A/zh
Publication of CN101448048A publication Critical patent/CN101448048A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明是在农讯通大容量电话簿检索中采用误差修正、记录数据量化及变换归一化处理、带动量项、自适应调节步长等方式的神经网络智能检索技术,从电话簿中直接提取记录对象的特征码,然后根据这些特征码的线索从大量存储在ROM中的电话簿记录进行查找,检索出用户所要的有用信息。本发明方法应用在中移动的终端产品农讯通上,可以大大提高检索速度。当电话簿容量达到1万条记录以上,分组测试多次,每组连续检索100次,应用传统的二分法检索时,平均需要检索时间为5~20秒,而本发明方法单次检索时间不会超过1秒,每组平均检索时间为0.4秒左右。

Description

大容量电话簿智能检索方法
技术领域
本发明涉及通信技术领域,尤其涉及一种大容量电话簿智能检索方法。
背景技术
农讯通,是为适应信息新时代,使农民定期获取到有关农业生产和农业科技等相关农业资讯包括政策法规、农情预测、病虫害预报、农村热点、农业气象、农产品市场每日报价、农产品流通信息、劳动用工信息、农产品供求信息、农技资讯信息、品种广告信息等的一种移动终端产品。
传统上的农讯通大容量电话簿检索,采用顺序检索,二分法检索,字典检索等方法,检索速度非常慢,效率极其低,低到用户无法接受。
神经网络智能检索技术已经成为有效的大容量信息搜索和信息浏览的一项具有实用价值的技术。它在数据库、信息检索和计算机搜索等领域受到广泛地关注。但目前为止该技术很少应用在嵌入式终端设备中。
发明内容
本发明的目的是提供一种大容量电话簿智能检索方法,采用神经网络智能检索技术,提高农讯通大容量电话簿的检索速度。
为了实现上述目的,本发明采用了如下的技术方案:
大容量电话簿智能检索方法包括如下步骤:
步骤一:设置网络结构参数及初始化,给各连接权及阈值赋予0.1~0.8之间的随机数;
步骤二:将预参加训练的电话簿记录数据进行量化并数据变换归一化处理,形成训练样本集;
步骤三:将电话簿中记录的特征码向量的分量随机输入给输入层对应的神经元,分别计算输出层与隐含层各单元的输出;
步骤四:通过导师信号,计算输出层与隐含层各单元的一般化误差;
步骤五:计算各层各单元的局部梯度;
步骤六:用一般化误差修正输出层与隐含层各单元的连接权和阈值;
步骤七:顺次选取下一个样本,返回步骤三直到训练集样本全部学习一遍;
步骤八:如果没有满足设定误差、设定次数,则修正误差并用带动量的自适应调节步长重新返回步骤三直到网络的总误差函数小于预先设定的值,即网络收敛或学习次数大于预先给定值;
步骤九:记录电话簿的智能检索训练网络的连接权值和阈值,保存并结束网络学习。
本发明就是在农讯通大容量电话簿检索中采用误差修正、记录数据量化及变换归一化处理、带动量项、自适应调节步长等方式的神经网络智能检索技术,从电话簿中直接提取记录对象的特征码(如名字、号码或其他),然后根据这些特征码的线索从大量存储在ROM中的电话簿记录进行查找,检索出用户所要的有用信息。特别地由于神经网络的自学习、自适应、并行处理等特点,该方法会根据用户对检索结果的评价满意度,动态构造下一个神经网络,有效地缩小记录的搜索空间,进一步描述记录之间的相似性和相关性,记录间的这种相似性以及本次检索结果可以作为以后检索的历史信息保存在神经网络中,从而提高下一次检索的命中率,因而提高检索效率,加快检索速度。
本发明方法应用在中移动的终端产品农讯通上,可以大大提高检索速度。当电话簿容量达到1万条记录以上,分组测试多次,每组连续检索100次,应用传统的二分法检索(速度上比顺序检索要快,但是要求记录有序)时,平均需要检索时间为5~20秒,而本发明方法单次检索时间不会超过1秒,每组平均检索时间为0.4秒左右。
附图说明
图1是本发明神经网络智能检索网络结构图。
图2是本发明神经网络智能检索算法程序设计流程图。
图3是本发明农讯通大容量电话簿检索过程图。
具体实施方式
如图1所示,该图为神经网络智能检索网络结构图,它由输入层、隐含层和输出层组成,各层之间实行全连接,层内神经元之间无连接,对网络进行训练学习的过程亦即是对权重和阀值的调整过程。输入层的神经元节点对应于输入变量(参数)即电话簿记录的姓名,号码和其他特征码;输出层的神经元节点对应于输出变量(参数)即用户需要检索的信息如特定的姓名或号码。
如图2所示,该图为神经网络智能检索算法的程序设计流程图。具体程序设计的检索步骤如下:
(1)设置网络结构参数及初始化,给各连接权及阈值赋予(0.1~0.8)之间的随机数;
(2)将预参加训练的电话簿记录数据进行量化并数据变换归一化处理,形成训练样本集;
(3)将电话簿中记录的特征码向量Xk=(Xk1,Xk2,...,Xkh,...,Xkn)的n个分量随机输入给输入层对应的n个神经元,用 Y j = f ( U j ) = 2 1 + e U j - 1 O i = f ( I i ) = 2 1 + e I i - 1 分别计算输出层与隐含层各单元的输出Yj、Oi
(4)通过导师信号,用 δ j = - ( Y j ′ - Y j ) . f ′ ( U j ) = - 1 2 ( Y j ′ - Y j ) ( 1 - Y j 2 ) e i = 1 2 ( 1 - O 2 i ) Σ j = 1 m δ j V ij 分别计算输出层与隐含层各单元的一般化误差δj、ei
(5)计算各层各单元的局部梯度
Figure A200710171002D00065
(6)一般化误差δj、ei用Whi(t+1)=Whi(t)+βeiXh+aΔWhi(t),θi(t+1)=θi(t)+βei+aΔθi(t),Vij(t+1)=Vij(t)+βδjOi+aΔVij(t),γj(t+1)=γj(t)+βδj+aΔγj(t)四式修正输出层与隐含层各单元的连接权Whi、Vij,阈值γj、θi
(7)顺次选取下一个样本,返回步骤3直到训练集样本全部学习一遍;
(8)如果没有满足设定误差E、设定次数N,则用式
Δ W hi ( t ) = β ( ∂ E ∂ W hi ) + αΔ W hi ( t - 1 ) 修正误差并用Whi(t+1)=Whi(t)-η(t)Z(t), Z ( t ) = ∂ E ∂ W hi ( t ) + αZ ( t - 1 ) 式带动量项的自适应调节步长从新返回3直到网络的总误差函数小于预先设定的值,即网络收敛或学习次数大于预先给定值;
(9)记录电话簿的智能检索训练网络的连接权值和阈值,保存并结束网络学习。
如图3所示,该图为农讯通大容量电话簿检索过程图,用户输入特征值之后,网络读取或修正训练好的网络参数并执行检索,找到用户的所要信息。如果检索结果不满意,则再次执行网络智能检索,直到用户满意为止。

Claims (9)

1、一种大容量电话簿智能检索方法,其特征在于,所述方法包括如下步骤:
步骤一:设置网络结构参数及初始化,给各连接权及阈值赋予随机数;
步骤二:将预参加训练的电话簿记录数据进行量化并数据变换归一化处理,形成训练样本集;
步骤三:将电话簿中记录的特征码向量的分量随机输入给输入层对应的神经元,分别计算输出层与隐含层各单元的输出;
步骤四:通过导师信号,计算输出层与隐含层各单元的一般化误差;
步骤五:计算各层各单元的局部梯度;
步骤六:用一般化误差修正输出层与隐含层各单元的连接权和阈值;
步骤七:顺次选取下一个样本,返回步骤三直到训练集样本全部学习一遍;
步骤八:如果没有满足设定误差、设定次数,则修正误差并带动量项的自适应调节步长重新返回步骤三直到网络的总误差函数小于预先设定的值,即网络收敛或学习次数大于预先给定值;
步骤九:记录电话簿的智能检索训练网络的连接权值和阈值,保存并结束网络学习。
2、如权利要求1所述的大容量电话簿智能检索方法,其特征是,所述步骤三中,将电话簿中记录的特征码向量Xk=(Xk1,Xk2,...,Xkh,...,Xkn)的n个分量随机输入给输入层对应的n个神经元,用 Y j = f ( U j ) = 2 1 + e U j - 1 O i = f ( I i ) = 2 1 + e I i - 1 分别计算输出层与隐含层各单元的输出Yj、Oi
3、如权利要求2所述的大容量电话簿智能检索方法,其特征是,所述步骤四中,通过导师信号,用 δ j = - ( Y j ′ - Y j ) . f ′ ( U j ) = - 1 2 ( Y j ′ - Y j ) ( 1 - Y j 2 ) e i = 1 2 ( 1 - O 2 i ) Σ j = 1 m δ j V ij 分别计算输出层与隐含层各单元的一般化误差δj、ei
4、如权利要求3所述的大容量电话簿智能检索方法,其特征是,所述步骤五中,计算各层各单元的局部梯度公式为
Figure A200710171002C00025
5、如权利要求4所述的大容量电话簿智能检索方法,其特征是,所述步骤六中,一般化误差δj、ei用Whi(t+1)=Whi(t)+βeiXh+aΔWhi(t),θi(t+1)=θi(t)+βei+aΔθi(t),Vij(t+1)=Vij(t)+βδjOi+aΔVij(t),γj(t+1)=γj(t)+βδj+aΔγj(t)四式修正输出层与隐含层各单元的连接权Whi、Vij,阈值γj、θi
6、如权利要求5所述的大容量电话簿智能检索方法,其特征是,所述步骤八中,如果没有满足设定误差E、设定次数N,则用式 ΔW hi ( t ) = β ( ∂ E ∂ W hi ) + αΔ W hi ( t - 1 ) 修正误差并用Whi(t+1)=Whi(t)-η(t)Z(t), Z ( t ) = ∂ E ∂ W hi ( t ) + αZ ( t - 1 ) 式带动量项的自适应调节步长重新返回步骤三直到网络的总误差函数小于预先设定的值。
7、如权利要求1所述的大容量电话簿智能检索方法,其特征是,所述网络为神经网络智能检索网络,神经网络智能检索网络结构由输入层、隐含层和输出层组成,各层之间实行全连接,层内神经元之间无连接,对网络进行训练学习的过程亦即是对权重和阀值的调整过程。
8、如权利要求7所述的大容量电话簿智能检索方法,其特征是,输入层的神经元节点对应于输入变量即电话簿记录的姓名,号码和其他特征码,输出层的神经元节点对应于输出变量即用户需要检索的信息如特定的姓名或号码。
9、如权利要求1所述的大容量电话簿智能检索方法,其特征是,步骤一中给各连接权及阈值赋予0.1~0.8之间的随机数。
CNA2007101710027A 2007-11-27 2007-11-27 大容量电话簿智能检索方法 Pending CN101448048A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2007101710027A CN101448048A (zh) 2007-11-27 2007-11-27 大容量电话簿智能检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2007101710027A CN101448048A (zh) 2007-11-27 2007-11-27 大容量电话簿智能检索方法

Publications (1)

Publication Number Publication Date
CN101448048A true CN101448048A (zh) 2009-06-03

Family

ID=40743433

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007101710027A Pending CN101448048A (zh) 2007-11-27 2007-11-27 大容量电话簿智能检索方法

Country Status (1)

Country Link
CN (1) CN101448048A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016037351A1 (en) * 2014-09-12 2016-03-17 Microsoft Corporation Computing system for training neural networks

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016037351A1 (en) * 2014-09-12 2016-03-17 Microsoft Corporation Computing system for training neural networks
CN106062786A (zh) * 2014-09-12 2016-10-26 微软技术许可有限责任公司 用于训练神经网络的计算系统
CN106062786B (zh) * 2014-09-12 2019-12-31 微软技术许可有限责任公司 用于训练神经网络的计算系统
US11049006B2 (en) 2014-09-12 2021-06-29 Microsoft Technology Licensing, Llc Computing system for training neural networks

Similar Documents

Publication Publication Date Title
CN103064945B (zh) 基于本体的情境搜索方法
CN110188227A (zh) 一种基于深度学习与低秩矩阵优化的哈希图像检索方法
CN105654200A (zh) 一种基于深度学习的广告点击率预测方法及装置
CN106933996A (zh) 一种采用深度特征匹配的推荐方法
CN107480815A (zh) 一种电力系统台区负荷预测方法
CN106776930A (zh) 一种融入时间和地理位置信息的地点推荐方法
CN107644036A (zh) 一种数据对象推送的方法、装置及系统
CN106157156A (zh) 一种基于用户社区的协作推荐系统
CN107480227A (zh) 一种基于大数据的信息推送方法
US11797624B2 (en) Personalized ranking using deep attribute extraction and attentive user interest embeddings
Thao MOORA models based on new score function of interval-valued intuitionistic sets and apply to select materials for mushroom cultivation
CN112612948B (zh) 一种基于深度强化学习的推荐系统构建方法
CN113379188B (zh) 基于物联网的烟草轮作种植方法和系统
Chaudhary et al. Prediction of crop yield using machine learning
Timmer et al. Evaluation of a model for prediction of postbloom fruit drop of citrus.
CN110391010A (zh) 基于个人健康感知的食品推荐方法及系统
CN101448048A (zh) 大容量电话簿智能检索方法
CN111177411A (zh) 一种基于nlp的知识图谱构建方法
CN116485210A (zh) 基于神经网络的农业管理活动的减排策略生成方法及装置
CN116911178A (zh) 一种基于气象预报的中小型水库容量预测方法及系统
CN108021645A (zh) 一种基于择友偏好和矩阵分解的潜在好友推荐方法
CN114996566A (zh) 一种面向工业互联网平台的智能推荐系统及方法
CN113052379A (zh) 一种基于bas-rbf的番茄需水预测方法
Munaganuri et al. Cap-DiBiL: an automated model for crop water requirement prediction and suitable crop recommendation in agriculture
CN110276448A (zh) 一种模型压缩方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20090603