CN1450476A - 数据检索和数据编码处理的系统及方法 - Google Patents
数据检索和数据编码处理的系统及方法 Download PDFInfo
- Publication number
- CN1450476A CN1450476A CN 02105866 CN02105866A CN1450476A CN 1450476 A CN1450476 A CN 1450476A CN 02105866 CN02105866 CN 02105866 CN 02105866 A CN02105866 A CN 02105866A CN 1450476 A CN1450476 A CN 1450476A
- Authority
- CN
- China
- Prior art keywords
- data
- retrieval
- phonetic alphabet
- character
- chinese phonetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明为一种使用汉语拼音首字进行数据检索和数据编码处理的系统及方法,特别是指一种应用在数据检索环境中的系统及方法,本发明使用一种“汉语拼音首字符法”,以达到让数据处理及数据检索变得简单,增加检索结果准确度,提升检索执行效率,同时具有模糊对比以及动态显示检索结果的目的,另外本发明更提供数据编码处理上的机制,并且通过数据编码转换通用程序来实现对数据的编码处理。
Description
技术领域
本发明涉及一种使用汉语拼音首字进行数据检索和数据编码处理的系统及方法,特别是指一种应用在数据检索环境中的系统及方法。
背景技术
随着企业与企业之间的竞争环境日益复杂且国际化,企业在不断扩张经营版图的同时,同样的也面临到如何整合企业内部与外部多元化的知识及资源之问题与挑战。现在的决策者在进行决策思考的时候,已经不能够再像过去一样以自我为中心从一个角度进行决策思考,而是必须以符合企业组织整体的利益作为前提来作多面向的全面性思考,然而并不是每一位决策者都能够对于企业中各部门领域的专业知识有所精通,所以如何能够通过有效的方法协助其方便取得、整合、管理各部门专业的知识信息,使其发挥决策时最大的功效是一个刻不容缓的重要课题,对于组织来说,充分有效促进组织中各种知识的分享,是获得竞争优势的最重要因素,也就是所谓的知识管理核心之所在。
在知识管理课题中最重要的部分之一就是信息的取得,也就是数据检索系统如何能够从诸多庞杂的数据中快速地取得正确有用的知识信息,提供给使用者利用,这也就成为评估执行效率上的一个重要指针。特别是在中文的检索环境下,由于中文并不像英文是属于拼音文字只需要依照字母的顺序排列组合就能够将词轻易地检索出来;反观中文,就之前所现有的数据检索和数据编码处理的技术来看,主要不外乎是以下几种数据检索和数据编码处理方法:
(1)部首检索法:依照中文字的部首来进行检索,但由于中文字的部首太多变化且在字中的位置不定,很难整理出一套适用的精简通用规则,检索规则以及使用上的复杂性造成了在效率上相对慢了许多。
(2)笔划数检索法:依照中文字的笔划来进行检索,由于必须先将中文字依照笔划数一一组合排序建立对应字库造成硬件资源或是内存上的耗费,进行检索时还必须使用大量时间计算输入检索字的笔划,造成效率上的不彰。
(3)注音排序检索法:依照中文字的注音发音,配合套用26个英文字母来进行实际的排列组合,这种方法虽然使用起来简单易学易懂但却面临到中文字一字多音、一音多字的问题,造成在检索到多音字、同音字时查询准确率上面的缺点。
综上所述,现有的几种主要数据检索和数据编码处理的方法,不论是在数据编码的处理上、检索执行的效率上或者是检索结果的准确性上面皆有其美中不足、不能够尽如人意的地方。因此,在面对当前环境对于数据检索和数据编码处理方法的需求日渐殷切的时候,我们正需要提供一种应用在数据检索环境中,可以用来提高数据检索的准确性及增加数据检索效率的方法,来解决前述现有技术上所欠缺不足的地方。
发明内容
有鉴于此,本发明为解决现有数据检索和数据编码处理的技术方法上过于繁杂难懂、使用效率低、检索结果准确性低、检索执行速度差、无法进行模糊对比等问题,而提供一种使用汉语拼音首字进行数据检索和数据编码处理的系统及方法。主要是以一种应用于数据检索环境下的数据检索和数据编码处理的方法,即“汉语拼音首字符法”在数据处理及数据检索的环境使用上达到以简单易学的方式,进一步增加检索结果的准确性、提升检索执行效率,并且可以进行模糊对比,同时还提供动态显示检索结果的功能;另外,还提供数据编码处理上的一般机制,当面对处理的数据单位不同时,借助本发明的数据编码转换的通用程序来实现不同数据单位的数据编码处理。
本发明提供一种使用汉语拼音首字进行数据检索和数据编码处理的系统,其至少包含:
一数据编码模块,用以接受一数据建立者由一输入设备输入的一原始文字数据,进行一汉语拼音首字符编码转换,该转换过程利用了系统中一汉字首字符编码表,该表中保存有标准汉字库的汉字与拼音首字符的对应关系,若此时需作转换的为英文字符,则只取该英文单词的首字符即可,并将转换结果储存至一对应编码表中;
一输入对比模块,用以接受一检索查询者输入的字符,将该检索查询者输入的字符和该对应编码表做对比,最后将一汉语拼音首字符字符串转换为该原始文字数据;及
一动态显示模块,用以将检索出的该原始文字数据以一动态显示方式呈现。
该拼音首字符编码转换可以使用一数据转换通用程序。
该数据转换通用程序可以接受并处理任何字符。
该编码对照表中储存的是该汉语拼音首字符字符串与由输入设备输入的原始文字数据匹配组合。
该输入设备可以从键盘、鼠标、数字触碰式面板及声音识别系统的组合中任意择一。
该动态显示的呈现方式指的是在一系统程序执行过程中以实时的方式将检索结果呈现出来。
本发明提供一种使用汉语拼音首字进行数据检索和数据编码处理的方法,该方法至少包含下列步骤:
呼叫一数据编码模块,接受一数据建立者由一输入设备输入一原始文字数据并转换产生一对应汉语拼音首字字符串,储存该原始文字数据及该对应拼音首字字符串至一对应编码表中;
呼叫一输入对比模块,接受一检索查询者由该输入设备输入一检索查询数据并将该汉语拼音首字字符串转换为对应的该原始文字数据;及
呼叫一动态显示模块,接收该原始文字数据并动态显示。
该输入设备可以从键盘、鼠标、数字触碰式面板及声音识别系统的组合中任意择一。
该对应编码表所储存的是该汉语拼音首字符字符串与其对应的该原始文字数据对应组合。
所述的使用汉语拼音首字进行数据检索和数据编码处理的方法,其呼叫该数据编码模块的方法更包含下列步骤:
判断该原始文字数据是否属于汉字字符串;及
使用一数据转换通用程序进行汉语拼音首字编码。
该数据转换通用程序可以接受处理任何字符。
所述使用汉语拼音首字进行数据检索和数据编码处理的方法,其呼叫该输入对比模块的方法更包含下列步骤:
决定该检索查询者的输入一检索字符串动作是否结束;
继续接受该检查询者输入该检索字符串的动作;
将该检索字符串与该对应编码表做对比;
判断该检索查询者输入的一字符是否为“*”或是“?”;
根据输入的该字符为“*”或“?”进行模糊对比;及
判断该检索查询者输入结束。
所述决定该检索查询者的输入动作是否结束,可在一系统程序执行过程中以实时的方式来进行。
所述呼叫该动态显示是指在该系统程序执行过程中可以实时的方式进行。
本发明的有益效果为,其在数据处理及数据检索的环境使用上达到以简单易学的方式,进一步增加检索结果的准确性、提升检索执行效率,并且可以进行模糊对比,同时还提供动态显示检索结果的功能;另外,还提供数据编码处理上的一般机制,当面对处理的数据单位不同时,借由本发明的数据编码转换的通用程序来实现不同数据单位的数据编码处理。
附图说明
图1是本发明的使用汉语拼音首字进行数据检索和数据编码处理的系统及方法的功能模块图;
图2是本发明的使用汉语拼音首字进行数据检索和数据编码处理的系统及方法的数据编码处理流程图;
图3是本发明的使用汉语拼音首字进行数据检索和数据编码处理的系统及方法的数据检索整体流程图;
图4是本发明的使用汉语拼音首字进行数据检索和数据编码处理的系统及方法的具体实施例画面一;
图5是本发明的使用汉语拼音首字进行数据检索和数据编码处理的系统及方法的具体实施例画面二;
图6是本发明的使用汉语拼音首字进行数据检索和数据编码处理的系统及方法的具体实施例画面三;以及
图7是本发明的使用汉语拼音首字进行数据检索和数据编码处理的系统及方法的具体实施例画面四。
具体实施方式
本发明为一种使用汉语拼音首字进行数据检索和数据编码处理的系统及方法,特别是指一种应用在数据检索环境中可以用来提高数据检索的准确性及增加数据检索效率的方法。
本发明以一较佳实施例说明本方法的具体可行性,图1是本发明使用汉语拼音首字进行数据检索和数据编码处理方法的功能模块图,主要的功能模块包含:数据编码模块10;输入对比模块20;及动态显示模块30;分述如下:
数据编码模块10,用以接受输入原始文字数据(步骤101),使用数据转换通用程序进行汉语拼音首字符编码(步骤103),并将结果储存至对应编码表中(步骤104)。
输入对比模块20,接受检索查询者输入(步骤201),将检索查询者输入的字符和对应编码表做对比(步骤203),将汉语拼音首字符字符串转换为原始文字数据(步骤206)。
动态显示模块30,用以将检索出的原始文字数据以动态的方式显示(步骤207)。
请参阅图2,本图为本发明的使用汉语拼音首字进行数据检索和数据编码处理的系统及方法的数据编码处理流程图,首先接受数据建立者输入欲进行编码的原始文字数据(步骤101),通过判断输入的数据是否属于汉字字符串(步骤102),如果是的话,则使用数据转换通用程序进行汉语拼音首字字符编码转换(步骤103),然后将原始文字数据及其对应的汉语拼音首字字符串储存至对应编码表中(步骤104);若判断输入的数据不是属于汉字字符串(步骤102),则直接将原始文字数据及其对应的拼音首字字符串储存至对应编码表中(步骤104)。
请参阅图3,本图是本发明的使用汉语拼音首字进行数据检索和数据编码处理的系统及方法的数据检索整体流程图,首先当检索查询者开始输入字符也就是在系统程序执行的过程中持续判断检索查询者输入是否结束(步骤201),如果输入尚未结束则继续接受输入(步骤202),将检索查询者输入的字符拿来和先前(步骤104)所建立的对应编码表进行逐一对比(步骤203)。首先,判断输入的字符是否为进行模糊对比的特殊符号“*”及“?”两者其中之一,若是则进行模糊对比(步骤205),若不是则继续接受检索查询者输入字符(步骤202),当确认检索查询的输入结束后,便将对比出的汉语拼音首字字符串转换为对应的原始文字数据(步骤206),最后以动态的方式将检索出来的原始文字数据显示出来(步骤207)。
图4至图7是本发明的一具体实施例,以图式的方式说明本发明的实际检索过程,图式所展示的画面为一人事管理系统中检索查询者进行人员检索的功能部分,说明由“预备输入”到“输入SJQ”到“系统识别出苏景勤”的过程:
(1)人事管理系统中人员检索功能的系统程序执行画面,预备让检索查询输入检索字符串,请参阅图4。
(2)人事管理系统中人员检索功能的系统执行画面,当检索查询者输入检索字符“s”,在系统画面上动态显示出所有符合输入检索字符串的数据,请参阅图5。
(3)人事管理系统中人员检索功能的系统执行画面,当检索查询者继续输入检索字符“j”,使检索字符串变为“sj”,系统画面上动态显示出所有符合输入检索字符串的数据,请参阅图6。
(4)人事管理系统中人员检索功能的系统执行画面,当检索查询者继续输入检索字符“q”,使检索字符串变为“sjq”并结束输入之动作,此时系统画面上动态显示出最后符合输入检索字符串的数据“苏景勤”,请参阅图7。
Claims (14)
1.一种使用汉语拼音首字进行数据检索和数据编码处理的系统,其特征在于至少包含:
一数据编码模块,用以接受一数据建立者由一输入设备输入的一原始文字数据,进行一汉语拼音首字符编码转换,并将转换结果储存至一对应编码表中;
一输入对比模块,用以接受一检索查询者输入的字符,将该检索查询者输入的字符和该对应编码表做对比,最后将一汉语拼音首字符字符串转换为该原始文字数据;及
一动态显示模块,用以将检索出的该原始文字数据以一动态显示方式呈现。
2.如权利要求1所述的使用汉语拼音首字进行数据检索和数据编码处理的系统,其特征在于该拼音首字符编码转换是使用一数据转换通用程序。
3.如权利要求2所述的使用汉语拼音首字进行数据检索和数据编码处理的系统,其特征在于该数据转换通用程序可以接受处理任何字符。
4.如权利要求1所述的使用汉语拼音首字进行数据检索和数据编码处理的系统,其特征在于该对应编码表中储存的是该汉语拼音首字符字符串与其对应的该输入的原始文字数据对应组合。
5.如权利要求1所述的使用汉语拼音首字进行数据检索和数据编码处理的系统,其特征在于该输入设备可以从键盘、鼠标、数字触碰式面板及声音识别系统的组合中任意择一。
6.如权利要求1所述的使用汉语拼音首字进行数据检索和数据编码处理的系统,其特征在于该动态显示的呈现方式指的是在一系统程序执行过程中以实时的方式将检索结果呈现出来。
7.一种使用汉语拼音首字进行数据检索和数据编码处理的方法,其特征在于该方法至少包含下列步骤:
呼叫一数据编码模块,接受一数据建立者由一输入设备输入一原始文字数据并转换产生一对应汉语拼音首字字符串,储存该原始文字数据及该对应拼音首字字符串至一对应编码表中;
呼叫一输入对比模块,接受一检索查询者由该输入设备输入一检索查询数据并将该汉语拼音首字字符串转换为对应的该原始文字数据;及
呼叫一动态显示模块,接收该原始文字数据并动态显示。
8.如权利要求7所述的使用汉语拼音首字进行数据检索和数据编码处理的方法,其特征在于该输入设备可以从键盘、鼠标、数字触碰式面板及声音识别系统的组合中任意择一。
9.如权利要求7所述的使用汉语拼音首字进行数据检索和数据编码处理的方法,其特征在于该对应编码表所储存的是该汉语拼音首字符字符串与其对应的该原始文字数据对应组合。
10.如权利要求7所述的使用汉语拼音首字进行数据检索和数据编码处理的方法,其特征在于呼叫该数据编码模块的方法更包含下列步骤:
判断该原始文字数据是否属于汉字字符串;及
使用一数据转换通用程序进行汉语拼音首字编码。
11.如权利要求10所述的使用汉语拼音首字进行数据检索和数据编码处理的方法,其特征在于该数据转换通用程序可以接受处理任何字符。
12.如权利要求7所述的使用汉语拼音首字进行数据检索和数据编码处理的方法,其特征在于呼叫该输入对比模块的方法更包含下列步骤:
决定该检索查询者的输入一检索字符串动作是否结束;
继续接受该检查询者输入该检索字符串的动作;
将该检索字符串与该对应编码表做对比;
判断该检索查询者输入的一字符是否为“*”或是“?”;
根据输入的该字符为“*”或“?”进行模糊对比;及
判断该检索查询者输入结束。
13.如权利要求12所述的使用汉语拼音首字进行数据检索和数据编码处理的方法,其特征在于决定该检索查询者的输入动作是否结束,是在一系统程序执行过程中以实时的方式来进行。
14.如权利要求7所述的使用汉语拼音首字进行数据检索和数据编码处理的方法,其特征在于呼叫该动态显示是指在该系统程序执行过程中以实时的方式进行。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 02105866 CN1450476A (zh) | 2002-04-11 | 2002-04-11 | 数据检索和数据编码处理的系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 02105866 CN1450476A (zh) | 2002-04-11 | 2002-04-11 | 数据检索和数据编码处理的系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1450476A true CN1450476A (zh) | 2003-10-22 |
Family
ID=28680084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 02105866 Pending CN1450476A (zh) | 2002-04-11 | 2002-04-11 | 数据检索和数据编码处理的系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1450476A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101202886B (zh) * | 2006-12-28 | 2011-08-10 | 深圳市同洲电子股份有限公司 | 一种电视节目的查找方法、装置及设备 |
CN112133309A (zh) * | 2020-09-22 | 2020-12-25 | 掌阅科技股份有限公司 | 音频和文本的同步方法、计算设备及存储介质 |
-
2002
- 2002-04-11 CN CN 02105866 patent/CN1450476A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101202886B (zh) * | 2006-12-28 | 2011-08-10 | 深圳市同洲电子股份有限公司 | 一种电视节目的查找方法、装置及设备 |
CN112133309A (zh) * | 2020-09-22 | 2020-12-25 | 掌阅科技股份有限公司 | 音频和文本的同步方法、计算设备及存储介质 |
CN112133309B (zh) * | 2020-09-22 | 2021-08-24 | 掌阅科技股份有限公司 | 音频和文本的同步方法、计算设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8812300B2 (en) | Identifying related names | |
CN1146777C (zh) | 利用数字键垫的汉语拼音输入方法及其装置 | |
CN103294776B (zh) | 一种智能手机通讯录模糊搜索的方法 | |
CN1008016B (zh) | 输入处理系统 | |
CN1871607A (zh) | 标识相关名称 | |
CN112100326A (zh) | 一种抗干扰的融合检索和机器阅读理解的知识库问答方法及系统 | |
CN1929655A (zh) | 一种可实现文本与语音转换的手机 | |
CN111190920A (zh) | 一种基于自然语言的数据交互查询方法及其系统 | |
CN102867049A (zh) | 一种基于单词查找树实现的汉语拼音快速分词方法 | |
CN112328773A (zh) | 基于知识图谱的问答实现方法和系统 | |
CN1359514A (zh) | 多模式数据输入设备 | |
CN1704879A (zh) | 用于输入中文汉字短语的方法和设备 | |
CN1710561A (zh) | 用于索引和检索文档的方法、计算机程序及数据载体 | |
CN1450476A (zh) | 数据检索和数据编码处理的系统及方法 | |
CN1504927A (zh) | 用于电子地图查询系统的智能检索方法 | |
CN108292307A (zh) | 具有对压缩数据的快速操作的前缀Burrow-Wheeler变换 | |
CN1510554A (zh) | 一种可嵌入应用的汉字输入法 | |
CN1496062A (zh) | 网络中智能信息处理的方法和系统 | |
CN1219700A (zh) | 多重汉字输入法及其实现方法 | |
CN100337503C (zh) | 移动通信终端进行网络数据搜索的方法及其系统 | |
CN1186708C (zh) | 一种汉字输入方法及其装置 | |
CN100538703C (zh) | 利用输入部分音标及片段字符检索单词系统及其方法 | |
KR20100091579A (ko) | 초성 검색용 인덱스 데이터베이스 구조, 이를 이용한 문자열 검색 시스템 및 방법 | |
CN1144142C (zh) | 双语辞典中重复关键字的处理方法 | |
CN2788495Y (zh) | 移动通信终端网络数据搜索系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |