CN101436203B - 一种记录索引方法及装置 - Google Patents

一种记录索引方法及装置 Download PDF

Info

Publication number
CN101436203B
CN101436203B CN2008102183641A CN200810218364A CN101436203B CN 101436203 B CN101436203 B CN 101436203B CN 2008102183641 A CN2008102183641 A CN 2008102183641A CN 200810218364 A CN200810218364 A CN 200810218364A CN 101436203 B CN101436203 B CN 101436203B
Authority
CN
China
Prior art keywords
field
name
record
surname
english alphabet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008102183641A
Other languages
English (en)
Other versions
CN101436203A (zh
Inventor
房增华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Device Co Ltd
Original Assignee
Huawei Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Device Co Ltd filed Critical Huawei Device Co Ltd
Priority to CN2008102183641A priority Critical patent/CN101436203B/zh
Publication of CN101436203A publication Critical patent/CN101436203A/zh
Application granted granted Critical
Publication of CN101436203B publication Critical patent/CN101436203B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明实施例公开了一种记录索引方法及装置,方法包括:对数据库中各记录的名字段或姓字段的unicode码进行判断,确定所述名字段或姓字段的语言机制;根据所述名字段或姓字段的语言机制,结合所述名字段或姓字段的语言机制的语言习惯,对数据库中的记录重新排序;在重新排序后的记录中索引所需记录。可以实现在包括不同语言记录的数据库中快速查找到所需记录。

Description

一种记录索引方法及装置
技术领域
本发明涉及数据通讯领域,具体地说,涉及一种记录索引方法及装置。
背景技术
在手机软件领域,电话簿已经成为用户最常用的功能。为了提高用户查找电话簿记录的速度,出现了很多电话簿查找方法,包括全字符或部分字符匹配、或拼音首字母排序后进行索引。同时,在计算机数据库领域,为加速查找到所需记录,已经有字段全内容和部分内容匹配、字段组合匹配等查找方法。  但是,发明人在实现本发明的过程中发现,由于现在的电话簿或计算机数据库中常常存在不同语言的记录,现有的记录索引方法都没有考虑不同语言习惯下的记录的排列顺序不同,例如采用中文的姓名记录一般是姓在前、名在后,而采用英文的姓名记录一般是名(First name)在前、姓(Last name)在后,对于电话簿等数据库中的混合多种语言的名称姓名,不能按照不同国家语言习惯快速的查找到所需记录,有时甚至由于造成混淆以致查找不到所需记录。
发明内容
本发明实施例提供一种记录索引方法及装置,可以在包括不同语言记录的数据库中快速查找到所需记录。
本发明实施例提供的一种记录索引方法,包括:
对数据库中各记录的名字段或姓字段的unicode码进行判断,确定所述名字段或姓字段的语言机制;根据所述名字段或姓字段的语言机制,结合所述名字段或姓字段的语言机制的语言习惯,对数据库中的记录重新排序;在重新排序后的记录中索引所需记录;
所述根据名字段或姓字段的语言机制,结合所述名字段或姓字段的语言机制的语言习惯,对数据库中的记录重新排序包括:
当名字段或姓字段是与中文相似,姓在前、名在后的语言习惯,则按照姓字段在前、名字段在后的规则拼接出姓名,当是与英文相似,名在前、姓在后的语言习惯,则按照名字段在前、姓字段在后的规则拼接出姓名;
将拼接后的姓名,按照中文拼音或英文字母A-Z的字母顺序进行重新排列。
一种记录索引装置,包括:
判断模块,用于对数据库中的名字段或姓字段的unicode码进行判断,确定所述名字段的语言机制;排序模块,用于根据所述名字段或姓字段的语言机制,结合所述名字段或姓字段的的语言机制的语言习惯,对数据库中的记录重新排序;索引模块,用于在重新排序后的记录中索引所需记录;
所述排序模块包括:
姓名拼接模块,用于当名字段或姓字段是与中文相似,姓在前、名在后的语言习惯,则按照姓字段在前、名字段在后的规则拼接出姓名,当是与英文相似,名在前、姓在后的语言习惯,则按照名字段在前、姓字段在后的规则拼接出姓名;
排序子模块,用于将拼接后的姓名,按照中文拼音或英文字母A-Z的字母顺序进行重新排列。
本发明实施例通过对数据库中的名(First name)字段的unicode(统一的字符编码标准,采用双字节对字符进行编码)码的判断,确定该字段的语言机制,再根据相应语言机制的语言习惯,对数据库中的记录重新排序,在重新排序后的记录中索引所需的记录,可以实现在包括不同语言记录的数据库中快速查找到所需记录。
附图说明
图1为本发明方法实施例的流程示意图;
图2为本发明装置实施例的结构示意图。
具体实施方式
下面结合附图详细说明本发明实施例的技术方案。
本发明提供的记录索引方法的实施例,如图1所示,包括:
步骤101、对数据库中各记录的名(First name)字段的unicode码进行判断,确定所述名字段的语言机制。
步骤102、根据所述名字段的语言机制,结合所述名字段的语言机制的语言习惯,对数据库中的记录重新排序。
例如,数据库中有名(First name)字段和姓(Last name)字段,根据名字段的unicode码判断该名字段中的内容是什么语言,如果是与中文相似,姓在前、名在后的语言习惯,则按照姓字段在前、名字段在后的规则拼接出姓名,如果是与英文相似,名在前、姓在后的语言习惯,则按照名字段在前、姓字段在后的规则拼接出姓名。然后将拼接后姓名重新排序,例如,中文按拼音,英文按字母,按照A-Z的字母顺序进行排列。
当然,也可以根据姓(Last name)字段的的unicode码进行判断确定所述姓字段的语言机制。
步骤103、在重新排序后的记录中索引所需记录。
具体在重新排序后的记录中索引的方式,可以采用二分查找,或者以及逐级筛选的方法来索引所需记录。
在混合了中文和英文的数据库中,用户只需要根据中文姓在前、名在后,英文名在前、姓在后的语言习惯进行全字符匹配或首字母匹配,就可以快速的查找到所需记录。对那些仅姓字段匹配或仅名字段匹配的记录可以显示在最后。
下面以电话簿为例,进一步说明本发明方法实施例的技术方案。
例如,电话簿中有以下几条混合不同语言的记录:
First Name         Last Name
Georg              Ford
Frank              Goethe
峰国          高
高河          付
Fred          范
Edward        熊
首先,对名(First Name)字段的unicode码进行判断,确定各名字段属于哪种语言。然后按照所属语言相应的语言习惯对电话簿中的记录,按照中文拼音和英文A-Z字母顺序,进行重新排序如下:
Edward        熊
Frank Goethe
Fred          范
付            高河
高            峰国
GeorgFord
再在重新排序后的记录中索引所需记录。例如,当输入F时,按照F的二分查找方法先查找到第一个字段的首中文拼音或首英文字母为F的记录,如下:
Frank Goethe
Fred          范
付            高河
如果还想进一步精确查找的话,例如,查找第一个字段的首中文拼音或首英文字母为F,第二个字段的首中文拼音或首英文字母为G的记录,则可以再输入G,即输入“FG”,在已经筛选出的第一个字段的首中文拼音或首英文字母为F的记录中,匹配第二个字段的首中文拼音或首英文字母是否为G,查找到记录如下:
Frank Goethe
付        高河
在现实情况中,还可能存在一种情况,用户只记得名,或只记得姓,为了进一步提供精确、人性化的快速索引记录的方法,在查找到的第一个字段首中文拼音或首英文字母为F的记录后,追加第二个字段首中文拼音或首英文字母为F的记录。例如,用户输入F时,按照F的二分查找方法先查找到第一个字段或者第二个字段的首中文拼音或首英文字母为F的记录,如下:
Frank Goethe
Fred        范
付          高河
+
高          峰国
GeorgFord
以上“+”符合表示以下为追加的记录,当然也可以采用其他符号表示。
如果还想进一步精确查找的话,例如,查找第一个字段的首中文拼音或首英文字母为F,第二个字段的首中文拼音或首英文字母为G的记录,或者第二个字段的首中文拼音或首英文字母为F,第一个字段的首中文拼音或首英文字母为G的记录,则可以再输入G,即输入“FG”,在已经筛选出的第一个字段或者第二个字段的首中文拼音或首英文字母为F的记录中,匹配第二个字段或者第一个字段的首中文拼音或首英文字母是否为G,查找到记录如下:
Frank Goethe
付        高河
+
高        峰国
通过以上方法,可以进一步精确、快速,并且人性化的查找记录。
相应地,本发明实施例还提供了一种记录索引装置,包括:
判断模块21,用于对数据库中的名(First name)字段或姓(Last name)字段的unicode码进行判断,确定所述名字段的语言机制。
排序模块22,用于根据所述名字段或姓字段的语言机制,结合所述名字段或姓字段的的语言机制的语言习惯,对数据库中的记录重新排序。
索引模块23,用于在重新排序后的记录中索引所需记录。
其中,排序模块22包括:姓名拼接模块221,用于当名字段或姓字段是与中文相似,姓在前、名在后的语言习惯,则按照姓字段在前、名字段在后的规则拼接出姓名,当是与英文相似,名在前、姓在后的语言习惯,则按照名字段在前、姓字段在后的规则拼接出姓名;排序子模块222,用于将拼接后的姓名,按照中文拼音或英文字母A-Z的字母顺序进行重新排列。
索引模块23包括:第一索引子模块,用于采用二分查找方法,或者以及逐级筛选方法,在重新排序后的记录中查找所需记录。
所述第一索引子模块可以包括第二索引子模块,用于按照二分查找方法查找到第一个字段的首中文拼音或首英文字母符合要求的记录。所述第二索引子模块,还可以用于按照二分查找方法查找到第一个字段的首中文拼音或首英文字母符合要求,并且第二个字段的首中文拼音或首英文字母符合要求的记录。
所述第一索引子模块也可以包括第三索引子模块,用于按照二分查找方法查找到第一个字段或者第二个字段的首中文拼音或首英文字母符合要求的记录。所述第三索引子模块,还可以用于按照二分查找方法查找到第一个字段的首中文拼音或首英文字母符合要求,并且第二个字段的首中文拼音或首英文字母符合要求的记录,以及,或者第二个字段的首中文拼音或首英文字母符合要求,并且第一个字段的首中文拼音或首英文字母符合要求的记录。
本发明实施例通过对数据库中的名(First name)字段的unicode(统一的字符编码标准,采用双字节对字符进行编码)码的判断,确定该字段的语言机制,再根据相应语言机制的语言习惯,对数据库中的记录重新排序,在重新排序后的记录中索引所需的记录,可以实现在包括不同语言记录的数据库中快速查找到所需记录。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台设备执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (8)

1.一种记录索引方法,其特征在于,包括:
对数据库中各记录的名字段或姓字段的unicode码进行判断,确定所述名字段或姓字段的语言机制;
根据所述名字段或姓字段的语言机制,结合所述名字段或姓字段的语言机制的语言习惯,对数据库中的记录重新排序;
在重新排序后的记录中索引所需记录;
所述根据名字段或姓字段的语言机制,结合所述名字段或姓字段的语言机制的语言习惯,对数据库中的记录重新排序包括:
当名字段或姓字段是与中文相似,姓在前、名在后的语言习惯,则按照姓字段在前、名字段在后的规则拼接出姓名,当是与英文相似,名在前、姓在后的语言习惯,则按照名字段在前、姓字段在后的规则拼接出姓名;
将拼接后的姓名,按照中文拼音或英文字母A-Z的字母顺序进行重新排列。
2.根据权利要求1所述的方法,其特征在于,在重新排序后的记录中索引所需记录包括:
采用二分查找方法,或者以及逐级筛选方法,在重新排序后的记录中查找所需记录。
3.根据权利要求2所述的方法,其特征在于,所述采用二分查找方法,或者以及逐级筛选方法,在重新排序后的记录中查找所需记录包括:
按照二分查找方法查找到第一个字段的首中文拼音或首英文字母符合要求的记录;或者,按照二分查找方法查找到第一个字段的首中文拼音或首英文字母符合要求,并且第二个字段的首中文拼音或首英文字母符合要求的记录。
4.根据权利要求2所述的方法,其特征在于,所述采用二分查找方法,或者以及逐级筛选方法,在重新排序后的记录中查找所需记录包括:
按照二分查找方法查找到第一个字段或者第二个字段的首中文拼音或首英文字母符合要求的记录;或者,按照二分查找方法查找到第一个字段的首中文拼音或首英文字母符合要求,并且第二个字段的首中文拼音或首英文字母符合要求的记录,以及,或者第二个字段的首中文拼音或首英文字母符合要求,并且第一个字段的首中文拼音或首英文字母符合要求的记录。
5.一种记录索引装置,其特征在于,包括:
判断模块,用于对数据库中的名字段或姓字段的unicode码进行判断,确定所述名字段的语言机制;
排序模块,用于根据所述名字段或姓字段的语言机制,结合所述名字段或姓字段的的语言机制的语言习惯,对数据库中的记录重新排序;
索引模块,用于在重新排序后的记录中索引所需记录;
所述排序模块包括:
姓名拼接模块,用于当名字段或姓字段是与中文相似,姓在前、名在后的语言习惯,则按照姓字段在前、名字段在后的规则拼接出姓名,当是与英文相似,名在前、姓在后的语言习惯,则按照名字段在前、姓字段在后的规则拼接出姓名;
排序子模块,用于将拼接后的姓名,按照中文拼音或英文字母A-Z的字母顺序进行重新排列。
6.根据权利要求5所述的装置,其特征在于,所述索引模块包括:第一索引子模块,用于采用二分查找方法,或者以及逐级筛选方法,在重新排序后的记录中查找所需记录。
7.根据权利要求6所述的装置,其特征在于,所述第一索引子模块包括:第二索引子模块,用于按照二分查找方法查找到第一个字段的首中文拼音或首英文字母符合要求的记录;或者,按照二分查找方法查找到第一个字段的首中文拼音或首英文字母符合要求,并且第二个字段的首中文拼音或首英文字母符合要求的记录。
8.根据权利要求6所述的装置,其特征在于,所述第一索引子模块包括:第三索引子模块,用于按照二分查找方法查找到第一个字段或者第二个字段的首中文拼音或首英文字母符合要求的记录;或者,按照二分查找方法查找到第一个字段的首中文拼音或首英文字母符合要求,并且第二个字段的首中文拼音或首英文字母符合要求的记录,以及,或者第二个字段的首中文拼音或首英文字母符合要求,并且第一个字段的首中文拼音或首英文字母符合要求的记录。
CN2008102183641A 2008-12-10 2008-12-10 一种记录索引方法及装置 Expired - Fee Related CN101436203B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008102183641A CN101436203B (zh) 2008-12-10 2008-12-10 一种记录索引方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008102183641A CN101436203B (zh) 2008-12-10 2008-12-10 一种记录索引方法及装置

Publications (2)

Publication Number Publication Date
CN101436203A CN101436203A (zh) 2009-05-20
CN101436203B true CN101436203B (zh) 2011-01-05

Family

ID=40710641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102183641A Expired - Fee Related CN101436203B (zh) 2008-12-10 2008-12-10 一种记录索引方法及装置

Country Status (1)

Country Link
CN (1) CN101436203B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101944117B (zh) * 2010-09-20 2013-04-24 宇龙计算机通信科技(深圳)有限公司 基于数据库的排序和检索方法和系统
CN102141916B (zh) * 2011-01-19 2013-11-06 深圳创维数字技术股份有限公司 嵌入式设备及其在osd界面显示语言文字的方法
CN102647503A (zh) * 2011-02-18 2012-08-22 中兴通讯股份有限公司 一种联系人信息处理方法及移动终端
CN102281345A (zh) * 2011-06-10 2011-12-14 深圳桑菲消费通信有限公司 一种手机电话簿联系人的排序方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1728735A (zh) * 2004-07-27 2006-02-01 夏新电子股份有限公司 手持设备的电话本的排序方法及查找方法
CN101127798A (zh) * 2007-09-14 2008-02-20 深圳华为通信技术有限公司 电话簿的排序和搜索方法及装置以及移动终端

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1728735A (zh) * 2004-07-27 2006-02-01 夏新电子股份有限公司 手持设备的电话本的排序方法及查找方法
CN101127798A (zh) * 2007-09-14 2008-02-20 深圳华为通信技术有限公司 电话簿的排序和搜索方法及装置以及移动终端

Also Published As

Publication number Publication date
CN101436203A (zh) 2009-05-20

Similar Documents

Publication Publication Date Title
JP5241828B2 (ja) 辞書の単語及び熟語の判定
CN101167075B (zh) 专有表现抽取装置、方法以及程序
US8412517B2 (en) Dictionary word and phrase determination
CN101315639A (zh) 搜索方法及系统
CN101099129A (zh) 组织指向对象的指针
CN107545044A (zh) 一种数据表建立方法、电子设备及存储介质
KR20070098252A (ko) 자동완성 추천어를 정정하여 노출하는 자동완성 추천어제공 방법 및 시스템
US20120054170A1 (en) Method of providing by-viewpoint patent map and system thereof
CN102831224B (zh) 一种数据索引库的建立方法、搜索建议生成方法和装置
CA2664962A1 (en) Method and system for database query term suggestion
CN101620607A (zh) 全文检索方法及系统
CN101436203B (zh) 一种记录索引方法及装置
CN104035993A (zh) 电子书的存储检索方法、电子书管理系统、阅读系统
US20120109994A1 (en) Robust auto-correction for data retrieval
CN103235789B (zh) 一种汉字转换为拼音及首字母的方法
CN114297143A (zh) 一种搜索文件的方法、显示文件的方法、装置及移动终端
CN101493824A (zh) 数据库的数据检索方法和装置
CN101944117B (zh) 基于数据库的排序和检索方法和系统
CN103167087A (zh) 一种手机联系人搜索方法及系统
CN103220387A (zh) 一种触摸屏手机用搜索方法及装置
CN1464430A (zh) 区分亚洲语言写入系统中组织名称的系统
CN101446975B (zh) 一种文件定位方法、装置
CN101331483A (zh) 用于操纵数据文件的方法和设备
FI118867B (fi) Menetelmä ja laite tiedon hallinnoimiseen
CN106126048B (zh) 一种移动设备的联系人信息的查询方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20171128

Address after: Metro Songshan Lake high tech Industrial Development Zone, Guangdong Province, Dongguan City Road 523808 No. 2 South Factory (1) project B2 -5 production workshop

Patentee after: Huawei terminal (Dongguan) Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI DEVICE Co.,Ltd.

TR01 Transfer of patent right
CP01 Change in the name or title of a patent holder

Address after: 523808 Southern Factory Building (Phase I) Project B2 Production Plant-5, New Town Avenue, Songshan Lake High-tech Industrial Development Zone, Dongguan City, Guangdong Province

Patentee after: HUAWEI DEVICE Co.,Ltd.

Address before: 523808 Southern Factory Building (Phase I) Project B2 Production Plant-5, New Town Avenue, Songshan Lake High-tech Industrial Development Zone, Dongguan City, Guangdong Province

Patentee before: Huawei terminal (Dongguan) Co.,Ltd.

CP01 Change in the name or title of a patent holder
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110105

CF01 Termination of patent right due to non-payment of annual fee