CN100517329C - 一种电子辞典释义内容查找方法 - Google Patents

一种电子辞典释义内容查找方法 Download PDF

Info

Publication number
CN100517329C
CN100517329C CN 200710018230 CN200710018230A CN100517329C CN 100517329 C CN100517329 C CN 100517329C CN 200710018230 CN200710018230 CN 200710018230 CN 200710018230 A CN200710018230 A CN 200710018230A CN 100517329 C CN100517329 C CN 100517329C
Authority
CN
China
Prior art keywords
phrase
content
term group
subject term
paraphrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 200710018230
Other languages
English (en)
Other versions
CN101082921A (zh
Inventor
陈淮琰
严晓龙
文泾涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Besta Xian Co Ltd
Original Assignee
Inventec Besta Xian Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Besta Xian Co Ltd filed Critical Inventec Besta Xian Co Ltd
Priority to CN 200710018230 priority Critical patent/CN100517329C/zh
Publication of CN101082921A publication Critical patent/CN101082921A/zh
Application granted granted Critical
Publication of CN100517329C publication Critical patent/CN100517329C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种可将输入词组进行拆解重组后在释义内容中完成查找的方法。本发明为一种电子辞典释义内容查找方法,该方法包括以下步骤:1)建立内容定位索引表;2)接收输入词组;3)拆解组成输入词组的单词,并重新组合为多个不同的词组组合;4)依序将各词组组合所包含的词组到内容定位索引表中进行查找;5)判断当前查找的词组组合中各词组之一属于主词组,其余词组之一属于次词组;6)根据内容定位索引表中各次词组的释义内容定位,获取各次词组释义内容进行显示。本发明解决了电子辞典在查找功能上无法或者以效果不佳的方式提供对主词组的释义内容中的次词组及其对应释义内容进行查找的技术问题。

Description

一种电子辞典释义内容查找方法
技术领域
本发明涉及一种电子辞典查找方法,尤其是一种可将输入词组进行拆解重组后在释义内容中完成查找的方法。
背景技术
随着厂商对于电子辞典的开发不断进步,现今电子辞典的体积已经越来越短小轻薄而且外型也越来越精致,加上一些热门的消费性电子产品功能附加在其上,使得电子辞典又再一次重新受到广大消费者的青睐。
虽然如此,各家厂商仍无不致力于在电子辞典最根本的查找功能上提升,然而电子辞典查找功能的提升不外乎从查找效率和查找命中率两方面来进行。为了改善查找效率和查找命中率,厂商除了不断在硬件执行效能上面作加强,另外则是在数据库内部索引技巧上或是在使用者查找接口上提供改善。
但是,有一种查找情况是目前所有电子辞典厂商所无法有效解决的就是:释义内容的查找。所谓的释义内容,就是指当电子辞典查找到符合使用者输入的输入词组时所传回显示的内容,我们以查找英-汉辞典为例,当使用者输入“default”作为输入词组的时候,经过电子辞典的查找可以马上找到主词组“default”对应的释义内容而加以显示,如图1中所示,在显示接口200中除了使用者所输入之输入词组210外,还有包括:主词组“default”的音标、主词组例句以及主词组搭配其它次词组时的应用范例...在内的主词组释义内容240。这些主词组释义内容240通常是预先被建立在电子辞典的数据库中,在数据库里以主词组为索引键值(Key)建立好与这些主词组释义内容240的索引关系,于是当使用者输入的输入词组210正好与主词组完全符合时,这些主词组释义内容240就会被查找到提供给使用者。
然而,几乎所有的电子辞典都系采取上述的方式以主词组作为查找索引键值的依据,因此往往当使用者所输入的输入词组210涉及到主词组释义内容240中其它次词组的时候,电子辞典因为无法查找到与输入词组210完全相符合的结果,而出现无法查找的状况。如图2中所示,当使用者输入“defaulton sth”作为输入词组210,此时由于电子辞典中并不具有完全相符的查找结果,而仅能够呈现“查无结果”的显示讯息250给使用者,造成影响使用者在电子辞典上进行查找的效率和命中率都不佳。造成此一问题的原因,就在于电子辞典对于使用者的输入词组210和数据库中主词组释义内容240的处理不够完善,导致使用者只有在输入数据库中所定义的主词组时才有可能获得到主词组释义内容240,对于使用者的查找使用上确实造成许多的不方便。
虽然,目前有些电子辞典能够对使用者所输入的输入词组210进行全数据库的全文比对查找,但是不仅查找起来非常耗时而且对于不连续的词组根本无法有效查找,即使查找到相符合的结果也往往会包含许多非使用者真正所需求的内容。
发明内容
本发明的目的是解决背景技术中存在的电子辞典在查找功能上往往仅能够提供对数据库中主词组的释义内容的查找,无法或者以效果不佳的方式提供对主词组的释义内容中的次词组及其对应释义内容进行查找的技术问题。
本发明的技术解决方案:本发明为一种电子辞典释义内容查找方法,其特殊之处在于:该方法包括以下步骤:
1)建立包含主词组、主词组释义内容中对应的次词组,以及次词组释义内容定位的内容定位索引表;
2)电子辞典接收使用者输入的输入词组;
3)拆解组成输入词组的单词,并依各单词顺序重新组合为多个不同的词组组合;
4)依序将各词组组合所包含的词组到内容定位索引表中进行查找;
5)判断当前查找的词组组合中各词组之一属于主词组,其余词组之一属于次词组;
6)根据内容定位索引表中各次词组的释义内容定位,获取各次词组释义内容进行显示。
上述步骤5)中的具体步骤如下:
5.1)判断当前查找的词组组合中的词组是否为主词组,否则返回步骤4),是则进至5.2)
5.2)判断当前查找的词组组合中的词组是否为次词组,否则返回步骤4),是则进至步骤6)。
通过本发明的电子辞典释义内容查找方法,利用建立电子辞典中主词组及其释义内容中次词组间的内容索引以及对使用者输入的输入词组的拆解组合处理,许多使用者输入包含次词组中的释义内容也能够精准的被查找到,而不至于如同现有电子辞典般无法进行查找,提高了电子辞典在释义内容中查找的效率,也提升了电子辞典查找的命中率。
附图说明
图1、2是现有技术的电子辞典查找结果示意图;
图3是本发明的方法流程图;
图4是本发明内容定位索引表生成及其数据结构示意图;
图5是本发明电子辞典输入词组拆解重组示意图;
图6是本发明的电子辞典查找结果示意图。
具体实施方式
本发明所称的主词组,是指一般电子辞典数据库中所建立的索引词组,可以通过输入主词组来查找完整的释义内容;而次词组所指的是隐含在主词组的释义内容中的其它词组,这些词组也会有其对应的释义内容,而这些次词组的释义内容则被包含在主词组释义内容中的一部分。
下面结合具体实施例对本发明做进一步的详细描述:
参见图3、4、5,本发明的具体方法流程如下:1)首先,在电子辞典中建立主词组、主词组释义内容中对应的次词组、及次词组释义内容定位的内容定位索引表30;通常在现有电子辞典中会设置有主词组数据库10的部分,此主词组数据库10设置有一个主词组索引表11,里面包含所有主词组12、主词组12的释义内容13及其释义内容定位的索引关联,用来在使用者输入主词组12时可以根据此主词组索引表11直接获取对应的释义内容13回复给使用者。
需要特别说明的是,为了节省储存空间,通常在电子辞典数据库中都会将主词组的释义内容13已连续方式纪录,然后在前述的主词组索引表11中通过纪录释义内容定位的方式来作为撷取释义内容13的依据。释义内容定位是指其对应的主词组12的释义内容13在主词组数据库10中的绝对起始位置,以图4中的主词组索引表11为例,对应于主词组12的释义内容定位是位于主词组数据库10中位置“8325”的绝对起始位置上,因此在显示时仅需要从主词组数据库10中的“8325”位置开始显示即可。
本发明的技术内容,在于进一步对于主词组12的释义内容13进行解析,以找出包含在主词组12的释义内容13中的次词组、次词组的释义内容及其释义内容定位的索引关联,索引关联系被设置在次词组索引表21中,为了方便说明所以图4中特别将次词组索引表21建置在次词组数据库20中,但实际实现上电子辞典可以将两个数据库合而为一(即仅剩下主词组数据库10,此时就不需要再重复纪录次词组的释义内容),而有关由主词组12中解析出次词组的部分可以通过现有的词组定义规则来处理,至于次词组、次词组释义内容及其释义内容定位的索引关联则同样属于现有技术,在此不多作说明。图4中词组A的释义内容定位在相对于主词组12的释义内容13位置“476”的地方,而次词组b的释义内容定位则在相对于主词组12的释义内容13位置“598”的地方。有关次词组的释义内容定位也是以相对位置来作纪录的,也就是相对于主词组12的释义内容13的位置来作纪录的,因此在查找上必须先得到主词组12的释义内容13的所在位置后才能够进一步得到次词组释义内容定位,也才能够得到对应次词组的释义内容,但是在具体实现上当主词组数据库10与次词组数据库20两者合而为一时,也可以采取在次词组索引表21中直接纪录次词组释义内容在主词组数据库10中的绝对起始位置作为释义内容定位,如此便可不需通过主词组释义内容定位即可直接得到次词组释义内容。
根据主词组索引表11及次词组索引表21的内容,本发明在电子辞典中进一步将两者结合为内容定位索引表30,参见图4,记载了每个主词组、对应次词组及其次词祖释义内容定位。通过此内容定位索引表30,可以直接确定使用者所输入的输入词组210中各词组所对应的属性为主词组或者是次词组,进而依照内容定位索引表30中的次词组释义内容定位,找到存放在主词组数据库10中的次词组释义内容。图中显示,主词组12“default”具有两个次词组,一是“on sth”其释义内容位于主词组12的释义内容13相对位置“476”的地方,而另一是“to sth”其释义内容位于主词组12的释义内容13相对位置“598”处。
有了上述的内容定位索引表30之后,本发明开始进行步骤2)电子辞典接收使用者所输入的输入词组,
3)输入词组被接收到之后,电子辞典首先拆解组成输入词组210的单词220,并依各单词220顺序重新组合成为一种以上词组组合230(步骤120);以图5为例,假设使用者输入的输入词组210为“default on sth”,由于此输入词组210并非单纯的主词组12,因此电子辞典无法在主词组数据库10中直接查找到符合的释义内容13,于是电子辞典将会先进行输入词组210的拆解,亦即将组成输入词组210的各个单词220给找出来,将输入词组210“default on sth”拆解成“default”、“on”及“sth”,接着依照设定的语法规则对这些单词220进行重新组合,组合后的单词220将可产生三种不同的词组组合230,其中包括:第一词组组合231“default on sth”、第二词组组合232“default on”及“sth”,以及第三词组组合233“default”及“on sth”三种。然后将这三种可能的词组组合230逐一与内容定位索引表30进行查找。
4)依序传递各词组组合230中所包含的词组至内容定位索引表30中进行查找;查找的目的是希望可以确认当前查找的词组组合230中各个词组是否可以满足同时存在于主词组120(步骤5.1)及对应的次词组(步骤5.1)中的条件?6)如果存在,表示找到符合使用者输入词组210的释义内容13,于是可以依据内容定位索引表30中各个次词组释义内容定位,依照前述对主词组数据库10及次词组数据库20定义实现的方式不同,自主词组数据库10或次词组数据库20中撷取各次词组释义内容进行显示。如果当前所处理的词组组合230无法满足步骤5.1及步骤5.2的条件同时成立的话,则会返回步骤4)获取下一个词组组合230至内容定位索引表30中继续进行查找,重复执行步骤4)至步骤5)的部分,直到找到符合者或者完成所有词组组合230查找时结束。
我们以前面提到的第一词组组合231“default on sth”、第二词组组合232“default on”及“sth”,以及第三词组组合233“default”及“on sth”三种词组组合230为例,可知第三词组组合233“default”及“on sth”符合步骤4)至步骤5)的判断条件可在内容定位索引表30中查找到,于是直接依照所纪录的次词组释义内容定位获取各次词组释义内容进行显示,可以从“default”主词组12的释义内容13中的相对起始位置“476”处开始进行显示,或者也可如前所述直接纪录次词组释义内容所在的绝对起始位置,而不需要参考主词组12的释义内容定位即可显示。
参见图6,显示接口中所呈现的内容基本上包含使用者所输入的输入词组210、所查找到的主词组12以及次词组释义内容260。由于上述在内容定位索引表30中所纪录的次词组释义内容定位都仅有“起始位置”的部分,因此在显示上会将词组组合230中符合懂得次词组之后的内容全部显示出来,显示时会将“default”主词组12的释义内容13中的相对起始位置“476”处之后的释义内容13全部显示出来,事实上亦可以通过在内容定位索引表30中纪录每个次词组的“起始/终止位置”,来控制对次词组释义内容的显示范围,使显示结果更为精确。

Claims (1)

1、一种电子辞典释义内容查找方法,其特征在于:该方法包括以下步骤:
1)建立包含主词组、主词组释义内容中对应的次词组、以及次词组释义内容定位的内容定位索引表;
2)电子辞典接收使用者输入的输入词组;
3)拆解组成输入词组的单词,并依各单词顺序重新组合为多个不同的词组组合;
4)依序将各词组组合所包含的词组到内容定位索引表中进行查找;
5)判断当前查找的词组组合中的词组是否为主词组,否则返回步骤4),是则进至6);
6)判断当前查找的词组组合中的词组是否为次词组,否则返回步骤4),是则进至步骤7);
7)根据内容定位索引表中各次词组的释义内容定位,获取各次词组释义内容进行显示。
CN 200710018230 2007-07-10 2007-07-10 一种电子辞典释义内容查找方法 Expired - Fee Related CN100517329C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200710018230 CN100517329C (zh) 2007-07-10 2007-07-10 一种电子辞典释义内容查找方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200710018230 CN100517329C (zh) 2007-07-10 2007-07-10 一种电子辞典释义内容查找方法

Publications (2)

Publication Number Publication Date
CN101082921A CN101082921A (zh) 2007-12-05
CN100517329C true CN100517329C (zh) 2009-07-22

Family

ID=38912494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200710018230 Expired - Fee Related CN100517329C (zh) 2007-07-10 2007-07-10 一种电子辞典释义内容查找方法

Country Status (1)

Country Link
CN (1) CN100517329C (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4636078B2 (ja) * 2007-12-14 2011-02-23 カシオ計算機株式会社 電子辞書装置

Also Published As

Publication number Publication date
CN101082921A (zh) 2007-12-05

Similar Documents

Publication Publication Date Title
US7979425B2 (en) Server-side match
CN100565515C (zh) 一种中文自动应答方法及系统
CN103365925B (zh) 获取多音字拼音、基于拼音检索的方法及其相应装置
WO2018014341A1 (zh) 展示候选项的方法和终端设备
CN102629160B (zh) 一种输入法、输入装置及终端
WO2021057250A1 (zh) 一种商品搜索的查询策略的生成方法及装置
CN104011712A (zh) 对跨语言查询建议的查询翻译进行评价
CN102760142A (zh) 一种针对搜索请求抽取搜索结果主题标签的方法和装置
CN103187052A (zh) 一种建立用于语音识别的语言模型的方法及装置
CN102750629B (zh) 日程关联方法及装置
CN102654866A (zh) 例句索引创建方法和装置以及例句检索方法和装置
CN110276010B (zh) 一种权重模型训练方法和相关装置
CN102063195A (zh) 一种用于供用户进行中英文混合输入的方法与设备
CN104375663A (zh) 一种联想输入方法及装置
CN106708814B (zh) 一种基于关系型数据库的检索方法及装置
CN103927339B (zh) 知识重组系统和知识重组方法
CN101359339A (zh) 一种关键词自动扩展查询方法及其装置
CN101236566A (zh) 一种名称查询的方法及系统
CN102567365B (zh) 一种针对于关键词进行标注的输入方法及系统
CN102314464B (zh) 歌词搜索方法及搜索引擎
CN106371711A (zh) 一种信息输入方法及电子设备
CN104035955A (zh) 搜索方法和装置
CN101995963B (zh) 词汇自适应中文输入方法
CN100517329C (zh) 一种电子辞典释义内容查找方法
CN107679122B (zh) 一种模糊搜索方法及终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090722

Termination date: 20130710