CN1851707A - 在手持式数据处理装置中进行全文查询的方法 - Google Patents

在手持式数据处理装置中进行全文查询的方法 Download PDF

Info

Publication number
CN1851707A
CN1851707A CN 200610042850 CN200610042850A CN1851707A CN 1851707 A CN1851707 A CN 1851707A CN 200610042850 CN200610042850 CN 200610042850 CN 200610042850 A CN200610042850 A CN 200610042850A CN 1851707 A CN1851707 A CN 1851707A
Authority
CN
China
Prior art keywords
data
words
found
word frequency
hand held
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200610042850
Other languages
English (en)
Inventor
陈淮琰
蒋阳安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Besta Xian Co Ltd
Original Assignee
Inventec Besta Xian Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Besta Xian Co Ltd filed Critical Inventec Besta Xian Co Ltd
Priority to CN 200610042850 priority Critical patent/CN1851707A/zh
Publication of CN1851707A publication Critical patent/CN1851707A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明涉及一种全文查询的方法,尤其是一种在手持式数据处理装置中的辞典数据库进行全文查询的方法。该方法包括以下步骤:1)预建数据库;2)读取数据;3)字词拆解;4)拆解生成待查找字词数据;5)确认索引地址参数;6)将待查找字词数据进行排序;7)确认待查找字词数据;8)从索引地址参数中获得字词说明内容;9)对其它的待查找字词数据进行查询;10)生成查询结果;11)显示说明数据。本发明可高速有效地在运算处理性能较低的手持式数据处理装置上运作,给现有技术中的手持式数据处理装置受限于运算性能,提供其不具备的全文查询功能。

Description

在手持式数据处理装置中进行全文查询的方法
一、技术领域
本发明涉及一种全文查询的方法,尤其是一种在手持式数据处理装置中的辞典数据库进行全文查询的方法。
二、背景技术
半导体制程的进步与消费性电子产业的兴盛,各类数据处理设备如今已深入大众的日常生活。如个人桌上型计算机(Desktop Computer)、笔记型计算机(Note book)、个人数字助理机(Personal Digital Assist)、智能型行动电话(Smart Phone)与电子辞典翻译机等等,带给人们丰富的数字多媒体休闲娱乐生活。
上述的各类产品中,个人数字助理机、智能型行动电话与电子辞典翻译机等类的手持式数据处理装置,最为社会大众所喜爱。手持式数据处理装置的优势在于体积小,不占收藏空间而便于携带,虽说此类产品的扩充性与运算功能无法与传统的个人桌上型计算机等大型产品一较高下,然而其所配备的功能,已足以应付出差在外的商务人士等使用者的一般需求。使用者在学习语言或阅读外文数据时,常会使用到电子产品中的单字查询等功能,此时手持式数据处理装置便于携带使用的优势就更为明显。
虽然手持式数据处理装置能够取代个人桌上型计算机的部分功能,然而手持式数据处理装置大多配备运算处理性能较低的处理器,否则体积将显得庞大沉重,且内藏电池也无法提供长时间的操作使用。当前的手持式数据处理装置,有提供语言翻译的功能,以让使用者随时进行语言学习或者进行单字查询。然而,受限于手持式数据处理装置的运算处理性能,现有的产品大多只能进行单字查询,而无法对使用者所输入的短句进行查询;此外,现有的产品也欠缺对辞典数据库中进行全文查询的功能,使用者仅能得知单字的含意,而无法对含有单字其他例句进行查找,若全文查询的相关查询作业强制执行的话,那么使用者将陷入相当漫长的等待。
三、发明内容
本发明为解决背景技术存在的上述技术问题,而提供一种在手持式数据处理装置中的辞典数据库进行全文查询的方法及其接口,可大幅提升查询的效率。
本发明的技术解决方案是:本发明为一种在手持式数据处理装置中进行全文查询的方法,其特殊之处在于:该方法包括以下步骤:
1)预建含有字词词频列表的数据库;
2)读取使用者所输入的短句数据;
3)根据字词词频列表,以二分法进行字词拆解;
4)将短句数据拆解生成为一个以上的待查找字词数据;
5)确认待查找字词数据所对应的索引地址参数;
6)然后根据词频参数值的大小将待查找字词数据进行排序;
7)确认具有最小词频参数值的待查找字词数据;
8)接着,从具有最小词频参数值的待查找字词数据的索引地址参数中获得其所记载的字词说明内容;
9)根据该字词说明内容,将字词词频参数值由小至大,对其它的待查找字词数据进行查询;
10)生成查询结果字词说明数据;
11)显示该查询结果字词说明数据。
上述索引地址参数包括对应辞典数据库的数据库代码值以及数据行数值。
本发明的在手持式数据处理装置中的辞典数据库进行全文查询的方法,是将短句数据拆解成数个待查找字词数据后,从最小的词频参数值进行查询作业,再根据对对应的索引地址参数的提取,生成最后的查询结果字词说明数据,即可得到符合使用者所欲查找的短句数据。因此本发明可高速有效地在运算处理性能较低的手持式数据处理装置上运作,给现有技术中的手持式数据处理装置受限于运算性能,提供其不具备的全文查询功能;即便是运算性能较低的手持式数据处理装置也可轻松应付全文查询的相关处理作业。
四、附图说明
图1-3为本发明在手持式数据处理装置中的辞典数据库进行全文查询的使用示意图。
五、具体实施方式
本发明提供的手持式数据处理装置中的辞典数据库进行全文查询的方法及其接口,适用于个人数字助理、行动电话与电子辞典翻译机等类的手持式数据处理装置。
本发明的方法的具体流程如下:
1)预建含有字词词频列表的数据库;
2)读取使用者所输入的短句数据;
3)根据字词词频列表,以二分法进行字词拆解;
4)将短句数据拆解生成为一个以上的待查找字词数据;
5)确认待查找字词数据所对应的索引地址参数;
6)然后根据词频参数值的大小将待查找字词数据进行排序;
7)确认具有最小词频参数值的待查找字词数据;
8)接着,从具有最小词频参数值的待查找字词数据的索引地址参数中获得其所记载的字词说明内容;
9)根据该字词说明内容,将字词词频参数值由小至大,对其它的待查找字词数据进行查询;
10)生成查询结果字词说明数据;
11)显示该查询结果字词说明数据。
其中索引地址参数包括对应辞典数据库的数据库代码值以及数据行数值。
参见图1,显示界面上包含有使用者输入字段100,可让使用者输入任意的短句数据,假设输入图标中的“talk about family matters”。
字词拆解显示窗口200包含有字词拆解显示字段201,用来显示待查找字词数据。此待查找字词数据是依据字词词频列表,以二分法进行拆解所产生的,如图标中的“talk about”,“matters”以及“family”。而图标中的“11,36,256等”则为词频显示字段202,此字段用来显示对应待查找字词数据的词频参数值。字词拆解显示窗口200中所显示的数据,是从最小的词频参数值开始依序排列。
参见图2、3,当系统进行运算查询后,将会显示对应的待查找字词数据的字词说明内容,而在字词拆解显示窗口200中,将显示对应待查找字词数据的字词说明内容,并显示对应字词说明内容的索引地址参数203,如图标中的“Ec/Ln471114”。其中的“Ec”为辞典数据库的数据库代码值,而“Ln471114”是辞典数据库中的具体所在行数。“talk about”这个待查找字词数据的词频参数值是最低的,因此就依据“talk about”所对应的索引地址参数,找到对应的字词说明内容204。并在字词说明内容204中,再根据字词词频参数值由小至大,如先对“matters”,再对“family”进行查找。接着在查询结果字词说明显示窗口300中显示筛选过后所生成的查询结果字词说明数据,以及其它关连的说明内容。如此,查询结果中字词说明数据囊括了所有使用者所输入的短句组成。另外,有些单字的变形形式(如talking,talks),这种词在单字全文检索时不参与检索,在短语中参与全文检索。
名词解释:
1、索引地址参数:将字词数据在整个字典的数据库中检索,建立与字词数据对应的索引地址参数,表示字词数据在全文中所在的位置。
2、词频参数值:待查找字词数据在数据中出现的次数,由PC在全文检索之前作预处理,得到字词出现的频率值。

Claims (2)

1、一种在手持式数据处理装置中进行全文查询的方法,其特征在于:该方法包括以下步骤:
1)预建含有字词词频列表的数据库;
2)读取使用者所输入的短句数据;
3)根据字词词频列表,以二分法进行字词拆解;
4)将短句数据拆解生成为一个以上的待查找字词数据;
5)确认待查找字词数据所对应的索引地址参数;
6)然后根据词频参数值的大小将待查找字词数据进行排序;
7)确认具有最小词频参数值的待查找字词数据;
8)接着,从具有最小词频参数值的待查找字词数据的索引地址参数中获得其所记载的字词说明内容;
9)根据该字词说明内容,将字词词频参数值由小至大,对其它的待查找字词数据进行查询;
10)生成查询结果字词说明数据;
11)显示该查询结果字词说明数据。
2、根据权利要求1所述的在手持式数据处理装置中进行全文查询的方法,其特征在于:所述索引地址参数包括对应辞典数据库的数据库代码值以及数据行数值。
CN 200610042850 2006-05-22 2006-05-22 在手持式数据处理装置中进行全文查询的方法 Pending CN1851707A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200610042850 CN1851707A (zh) 2006-05-22 2006-05-22 在手持式数据处理装置中进行全文查询的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200610042850 CN1851707A (zh) 2006-05-22 2006-05-22 在手持式数据处理装置中进行全文查询的方法

Publications (1)

Publication Number Publication Date
CN1851707A true CN1851707A (zh) 2006-10-25

Family

ID=37133186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200610042850 Pending CN1851707A (zh) 2006-05-22 2006-05-22 在手持式数据处理装置中进行全文查询的方法

Country Status (1)

Country Link
CN (1) CN1851707A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101727871B (zh) * 2008-10-31 2011-11-30 英业达股份有限公司 显示模式判断方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101727871B (zh) * 2008-10-31 2011-11-30 英业达股份有限公司 显示模式判断方法

Similar Documents

Publication Publication Date Title
CN109101479B (zh) 一种用于中文语句的聚类方法及装置
CN103914513B (zh) 一种实体输入方法和装置
CN101779200A (zh) 词典词和短语确定
US9251248B2 (en) Using context to extract entities from a document collection
CN102124459A (zh) 词典词和短语确定
CN1618064A (zh) 翻译方法、已翻译句子的输入方法、记录介质、程序与计算机设备
CN1335574A (zh) 智能语义搜索方法
CN110879834B (zh) 一种基于循环卷积网络的观点检索系统及其观点检索方法
CN101079025A (zh) 一种文档相关度计算系统和方法
WO2012159558A1 (zh) 基于语意识别的自然语言处理方法、装置和系统
CN109299272B (zh) 一种用于神经网络输入的大信息量文本表示方法
CN1495641A (zh) 自适应上下文敏感分析有限版权弃权声明
CN111090994A (zh) 一种面向中文网络论坛文本的事件地点归属省份识别方法
CN110727769A (zh) 语料库生成方法及装置、人机交互处理方法及装置
CN113806483A (zh) 数据处理方法、装置、电子设备及计算机程序产品
US20060184523A1 (en) Search methods and associated systems
CN1851707A (zh) 在手持式数据处理装置中进行全文查询的方法
Gao et al. An automatic extraction method based on synonym dictionary for web reptile question and answer
CN102508920B (zh) 一种基于Boosting分类算法的信息检索方法
CN102207947B (zh) 一种直接引语素材库的生成方法
JP5286298B2 (ja) 評判分析装置、評判分析方法及び評判分析プログラム
CN1822001A (zh) 一种应用于手持式数据处理装置的单字查询方法
CN1755669A (zh) 人名输入处理方法及系统
CN2643402Y (zh) 多国语言汉字查询装置
CN1889072A (zh) 语言转换系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication