CN113722480A - 一种日文联系人混合检索方法 - Google Patents
一种日文联系人混合检索方法 Download PDFInfo
- Publication number
- CN113722480A CN113722480A CN202110919008.8A CN202110919008A CN113722480A CN 113722480 A CN113722480 A CN 113722480A CN 202110919008 A CN202110919008 A CN 202110919008A CN 113722480 A CN113722480 A CN 113722480A
- Authority
- CN
- China
- Prior art keywords
- japanese
- retrieval
- character
- classification
- classification table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000011218 segmentation Effects 0.000 claims description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明揭示了一种日文联系人混合检索方法,包括如下步骤:S100、对用户输入的日语字进行字符的准确分割;S200、将分割出的第一个字符与预缓存字符分类表对比,提取出该字符同义不同写法的字符,并对提取的字符依次进行数据库OR检索;S300、对OR检索结果进行字符的重分割,并按照预缓存字符分类表的分类标准重新组成分类表存在数据库中;S400、将用户输入的日文检索字分割出的剩下的字符依次分别与重新组成的分类表里的每一项进行对比,对不匹配的项从分类表中剔除;S500、输出最终分类表,对剩下的项进行游标,解析获得检索的联系人列表。本发明实现了一个同义的不同日语写法混合存储联系人在手机中时的精准联系人检索。
Description
技术领域
本发明涉及联系人检索技术领域,特别是涉及一种日文联系人混合检索方法。
背景技术
目前,智能终端,例如手机已经成为人们生活的必需品。在智能终端中快速输入、搜索特定信息的需求越来越强烈,如在手机中通过拨号键盘快速搜索联系人。一般情况下用户需要输入完整的手机号码才可以拨号,实际上记忆联系人姓名更加简单,在拨号键盘通过输入姓名来搜索电话号码则更加方便。联系人数量越多,这种需求越强烈。
日语在某些手机上的写法非常多,可能有的字符一个意思多的有七八种写法,少的只有一两种写法,有可能是两种字符表示一个字,当在这样的手机里使用混合写法的日语联系人如何进行精准的名字检索是一个问题。
发明内容
本发明的目的在于,提供一种日文联系人混合检索方法,实现手机里使用混合写法的日语联系人的精准检索。
为解决上述技术问题,本发明提供一种日文联系人混合检索方法,包括如下步骤:
S100、对用户输入的日语字句进行准确分割;
S200、将分割出的第一个日语字与预缓存字符分类表对比,提取出该字符同义不同写法的字体,并对提取的字体依次进行数据库OR检索;
S300、对OR检索结果进行字句的重分割,并按照预缓存字符分类表的分类标准重新组成分类表存在数据库中;
S400、将用户输入的日文检索字句分割出的剩下的字依次分别与重新组成的分类表里的每一项进行对比,对不匹配的项从分类表中剔除;
S500、输出最终分类表,对剩下的项进行游标,解析获得检索的联系人列表。
进一步,在步骤S100中,日语字句分割后的第一个字符区分大小写,其他字符不区分大小写。
进一步的,在步骤S200中,所述预缓存字符分类表根据联系人立项进行分类,并预先存储在数据库内。
进一步的,所述预缓存字符分类表每项的分类规则为:将联系人每个日语的同义写法分为一类,并对每个同义写法根据大小写进行子类别划分,同时对所有的双字符的日语写法分为一类。
进一步的,在步骤S100中,所述日语字句分割的具体操作为:对单个字符构成的日语字进行单独分割,并对有两个字符构成的日语字进行整体分割。
进一步的,在步骤S200中,若用户输入的日语分割后只有一个字,则在进行数据库OR检索后,直接进行检索结果的输出。
通过上述技术方案,本发明具有如下有益效果:
本发明提供日文联系人混合检索方法,不管通过哪种写法都可以搜索到其他写法的联系人,实现了一个同义的不同日语写法混合存储联系人在手机中时的精准联系人检索。
附图说明
图1为本发明的日文联系人混合检索方法流程示意图。
具体实施方式
下面将结合示意图对本发明的日文联系人混合检索方法进行更详细的描述,其中表示了本发明的优选实施例,应该理解本领域技术人员可以修改在此描述的本发明,而仍然实现本发明的有利效果。因此,下列描述应当被理解为对于本领域技术人员的广泛知道,而并不作为对本发明的限制。
在下列段落中参照附图以举例方式更具体地描述本发明。根据下面说明和权利要求书,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施例的目的。
如图1所示,本发明实施例提出了一种日文联系人混合检索方法,包括如下步骤:
S100、S100、对用户输入的日语字句进行准确分割;
具体的,日语字句的分割具体操作为:对单个字符构成的日语进行单独分割,并对有两个字符构成的日语进行整体分割,如用户输入“アハ”,分割为“ア”和“ハ”,如输入“アバ”,分割为“ア”和“バ”。其中日语字句分割后的第一个字符区分大小写,其他字符不区分大小写。通过区分大小写,能够筛选出不匹配的字符,从而提高日语检索的效率。
S200、分割出的第一个日语字与预缓存字符分类表对比,提取出该字符同义不同写法的字体,并对提取的字体依次进行数据库OR检索;
具体的,缓存字符分类表根据联系人立项进行分类,并预先存储在数据库内,预缓存字符分类表每项的分类规则为:将联系人每个日语的同义写法分为一类,并对每个同义写法根据大小写进行子类别划分,同时对所有的双字符的日语写法分为一类,通过该种分类方式,可实现数据库内包含一个日语的所有写法,如联系人为“あハ”,则缓存字符分类表包含“あ”的全部写法(あ、ア、ア、ぁ、ァ、ア)和“ハ”的全部写法(は、ハ、ハ、ば、ぱ、バ、パ、バ、パ)。
S300、对OR检索结果进行字句的重分割,并按照预缓存字符分类表的分类标准重新组成分类表存在数据库中;
具体的,若用户输入的日语分割后只有一个字,则在进行数据库OR检索后,直接进行检索结果的输出,若用户输入的日语分割后大于两个字,对OR检索结果中的各项分别按照步骤S100进行字符分割,并按照预缓存字符分类表的分类标准重新组成分类表。
S400、将用户输入的日文检索字句分割出的剩下的字依次分别与重新组成的分类表里的每一项进行对比,对不匹配的项从分类表中剔除。
具体的,将S100中分割出来的第二个字符和新组成的分类表里的每一项进行对比,对比后对不匹配的相剔除,一直对比直到对比到最后一个字符,所剩下来的列表项就是最终结果。
S500、输出最终分类表,对剩下的项进行游标,解析获得检索的联系人列表。
具体的,游标是处理数据的一种方法,为了查看或者处理结果集中的数据,游标提供了在结果集中一次一行或者多行前进或向后浏览数据的能力。通过游标与解析相结合的方式,能够快速地获取检索的联系人列表。
以下列举所述日文联系人混合检索方法的较优实施例,以清楚的说明本发明的内容,应当明确的是,本发明的内容并不限制于以下实施例,其他通过本领域普通技术人员的常规技术手段的改进亦在本发明的思想范围之内。
本发明实施例提出了一种日文联系人混合检索方法的使用方法:。
综上所述,本发明相对于现有技术,具有如下有益效果:
本发明提供日文联系人混合检索方法,不管通过哪种写法都可以搜索到其他写法的联系人,实现了一个同义的不同日语写法混合存储联系人在手机中时的精准联系人检索。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (6)
1.一种日文联系人混合检索方法,其特征在于,包括如下步骤:
S100、对用户输入的日语字句进行准确分割;
S200、将分割出的第一个日语字与预缓存字符分类表对比,提取出该字符同义不同写法的字体,并对提取的字体依次进行数据库OR检索;
S300、对OR检索结果进行字句的重分割,并按照预缓存字符分类表的分类标准重新组成分类表存在数据库中;
S400、将用户输入的日文检索字句分割出的剩下的字依次分别与重新组成的分类表里的每一项进行对比,对不匹配的项从分类表中剔除;
S500、输出最终分类表,对剩下的项进行游标,解析获得检索的联系人列表。
2.如权利要求1所述的日文联系人混合检索方法,其特征在于,日语字句分割后的第一个字符区分大小写,其他字符不区分大小写。
3.如权利要求1所述的日文联系人混合检索方法,其特征在于,在步骤S200中,所述预缓存字符分类表根据联系人立项进行分类,并预先存储在数据库内。
4.如权利要求3所述的日文联系人混合检索方法,其特征在于,所述预缓存字符分类表每项的分类规则为:将联系人每个日语的同义写法分为一类,并对每个同义写法根据大小写进行子类别划分,同时对所有的双字符的日语写法分为一类。
5.如权利要求1所述的日文联系人混合检索方法,其特征在于,在步骤S100中,所述日语字句分割的具体操作为:对单个字符构成的日语字进行单独分割,并对有两个字符构成的日语字进行整体分割。
6.如权利要求1所述的日文联系人混合检索方法,其特征在于,在步骤S200中,若用户输入的日语分割后只有一个字,则在进行数据库OR检索后,直接进行检索结果的输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110919008.8A CN113722480A (zh) | 2021-08-11 | 2021-08-11 | 一种日文联系人混合检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110919008.8A CN113722480A (zh) | 2021-08-11 | 2021-08-11 | 一种日文联系人混合检索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113722480A true CN113722480A (zh) | 2021-11-30 |
Family
ID=78675522
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110919008.8A Pending CN113722480A (zh) | 2021-08-11 | 2021-08-11 | 一种日文联系人混合检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113722480A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1492354A (zh) * | 2000-06-02 | 2004-04-28 | 钧 顾 | 多国文字信息搜索方法和多国文字信息搜索引擎系统 |
JP2008262324A (ja) * | 2007-04-11 | 2008-10-30 | Mitsubishi Electric Corp | 情報処理装置及び情報処理方法及びプログラム |
CN101944117A (zh) * | 2010-09-20 | 2011-01-12 | 宇龙计算机通信科技(深圳)有限公司 | 基于数据库的排序和检索方法、系统和移动终端 |
CN102165437A (zh) * | 2008-07-25 | 2011-08-24 | 夏普株式会社 | 信息处理装置及信息处理方法 |
CN107332962A (zh) * | 2017-06-21 | 2017-11-07 | 努比亚技术有限公司 | 一种基于边缘触控的快速查找联系人的方法及终端 |
CN110134855A (zh) * | 2019-03-28 | 2019-08-16 | 视联动力信息技术股份有限公司 | 一种联系人检索方法和装置 |
CN111506704A (zh) * | 2020-04-10 | 2020-08-07 | 上海携程商务有限公司 | 日语关键词组生成方法、装置、电子设备、存储介质 |
-
2021
- 2021-08-11 CN CN202110919008.8A patent/CN113722480A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1492354A (zh) * | 2000-06-02 | 2004-04-28 | 钧 顾 | 多国文字信息搜索方法和多国文字信息搜索引擎系统 |
JP2008262324A (ja) * | 2007-04-11 | 2008-10-30 | Mitsubishi Electric Corp | 情報処理装置及び情報処理方法及びプログラム |
CN102165437A (zh) * | 2008-07-25 | 2011-08-24 | 夏普株式会社 | 信息处理装置及信息处理方法 |
CN101944117A (zh) * | 2010-09-20 | 2011-01-12 | 宇龙计算机通信科技(深圳)有限公司 | 基于数据库的排序和检索方法、系统和移动终端 |
CN107332962A (zh) * | 2017-06-21 | 2017-11-07 | 努比亚技术有限公司 | 一种基于边缘触控的快速查找联系人的方法及终端 |
CN110134855A (zh) * | 2019-03-28 | 2019-08-16 | 视联动力信息技术股份有限公司 | 一种联系人检索方法和装置 |
CN111506704A (zh) * | 2020-04-10 | 2020-08-07 | 上海携程商务有限公司 | 日语关键词组生成方法、装置、电子设备、存储介质 |
Non-Patent Citations (2)
Title |
---|
职场参考书: "上手な検索方法のコツ|你不知道的搜索技巧", Retrieved from the Internet <URL:https://zhuanlan.zhihu.com/p/140903730?utm_id=0> * |
董鑫, 吴桐: "语料库NLT检索系统在近义词辨析教学中的应用研究", 开封教育学院学报, vol. 38, no. 10 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9396178B2 (en) | Systems and methods for an automated personalized dictionary generator for portable devices | |
CN102063482B (zh) | 一种手持设备高效联系人查找方法 | |
KR101226336B1 (ko) | 휴대 전화 | |
US20150293975A1 (en) | Method and device for searching for contact object, and storage medium | |
EP1480420A1 (en) | Language information related keypad input mode control | |
US20040006460A1 (en) | System and method for problem solution support, and medium storing a program therefor | |
JP2010140475A (ja) | 入力順非依存式文字入力機構を提供するための方法、装置、およびコンピュータプログラム | |
CN113326363A (zh) | 搜索方法及装置、预测模型训练方法及装置、电子设备 | |
CN107679122A (zh) | 一种模糊搜索方法及终端 | |
CN113722480A (zh) | 一种日文联系人混合检索方法 | |
JP7403571B2 (ja) | 音声検索方法、装置、電子機器、コンピュータ読み取り可能な媒体及びコンピュータプログラム | |
JPH06325092A (ja) | 顧客情報検索方式 | |
CN113742291A (zh) | 一种文件保存方法、装置以及计算机存储介质 | |
CN111309884A (zh) | 机器人对话方法、装置、介质及电子设备 | |
JP2007026116A (ja) | 概念検索システム及び概念検索方法 | |
CN101324878B (zh) | 新单词自动学习方法及装置和文字输入系统 | |
JPH06259479A (ja) | 文献検索支援方式 | |
JP2005222244A (ja) | 単語検索装置、単語検索方法、およびその単語検索装置を備える情報提供システム | |
CN113345430A (zh) | 基于语音固定条件下多字段的查询方法 | |
KR19980020385A (ko) | 점수를 이용한 유사 단어 검색 방법 | |
JP3446866B2 (ja) | データベース作成装置および方法 | |
CN1404289A (zh) | 手机中的名字和号码查找方法 | |
CN114528379A (zh) | 专利句对语料库检索系统及方法 | |
CN114385905A (zh) | 搜索引擎优化方法、装置、设备及存储介质 | |
JP2000222432A (ja) | 文書検索装置、文書検索方法及び文書検索プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |