CN101436205A - 通过释义查询单字的方法与装置 - Google Patents
通过释义查询单字的方法与装置 Download PDFInfo
- Publication number
- CN101436205A CN101436205A CN 200810232477 CN200810232477A CN101436205A CN 101436205 A CN101436205 A CN 101436205A CN 200810232477 CN200810232477 CN 200810232477 CN 200810232477 A CN200810232477 A CN 200810232477A CN 101436205 A CN101436205 A CN 101436205A
- Authority
- CN
- China
- Prior art keywords
- lexical
- textual analysis
- vocabulary
- candidate
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种通过释义查询单字的方法及装置,该方法包含下列步骤:1)提供多个词汇释义及多个词汇,词汇释义对应于词汇;2)接收关键词;3)根据关键词从词汇释义查询得到候选释义;4)从候选释义中选取目标释义;5)输出对应于目标释义的词汇。本发明的方法及装置可达成使用者通过释义查询单字的目的。
Description
技术领域
本发明涉及一种查询单字的方法与装置,尤其是一种通过释义查询单字的方法与装置。
背景技术
综观辞典中查询单字方法,都必须根据正确的单字拼字来查询单字详细的解释,因此,当使用者理解某个单字的基本意思,且仅能够根据零星单字来形容单字的意思,却无法正确地拼字,此时便无法查询单字;例如:欲表达大象的鼻子“trunk”,但一时却想不起来如何拼写此单字;在此情况下,无论传统的纸本辞典或是电子辞典都无法查询目标单字“trunk”。另外,当使用者欲查寻关于“第二次世界大战”中的著名将领其相关资料,但又无正确表达将领的姓名,这种状况下,传统的查询单字方式是无法协助使用者获得解答。由此可知传统的单字查询方式其语言理解能力仍有很大的改进空间,且不能满足使用者个人化需求。
发明内容
本发明为解决背景技术中存在的上述技术问题,而提出一种通过释义查询单字的方法与装置。
本发明的技术解决方案是:本发明是一种通过释义查询单字的方法,其特殊之处在于:该方法包含下列步骤:
1)提供多个词汇释义及多个词汇,词汇释义对应于词汇;
2)接收关键词;
3)根据关键词从词汇释义查询得到候选释义;
4)从候选释义中选取目标释义;
5)输出对应于目标释义的词汇。
上述步骤3)中对比关键词与词汇释义的相关性而得到候选释义。
上述步骤3)中比对方法包含对比关键词的拼字与词汇释义的相似度、关键词的拼音与词汇释义的相似度、关键词的字形与词汇释义的相似度、关键词的意涵与词汇释义的相似度。
上述步骤3)中还包括对查询得到的候选释义进行排序的步骤。
上述步骤3)中是根据关键词位于候选释义的位置或词汇和候选释义的使用频率而决定候选释义的次序。
一种实现上述的通过释义查询单字的方法的装置,其特殊之处在于:该装置包括:储存模块,用来储存多个词汇及多个词汇释义,词汇对应于词汇释义;输入模块,用来输入关键词;查询模块,根据关键词从词汇释义查询候选释义;选取模块,在候选释义中选取目标释义;输出模块,用来输出对应于目标释义的词汇,输入模块接入查询模块,储存模块与查询模块相接,查询模块接入选取模块,选取模块接入输出模块。
上述查询模块包含对比模块,用来对比关键词与词汇释义的相关性而得到候选释义。
上述查询模块包含排序模块,用来排序候选释义。
上述排序模块包含位置侦测单元,根据关键词在候选释义的位置决定候选释义的次序。
上述排序模块包含频率侦测单元,根据词汇和候选释义的使用频率决定候选释义的次序。
本发明提供的通过释义查询单字的方法与装置,可以通过词汇释义查询单字,能满足使用者个人化的需求。
附图说明
图1为通过释义查询单字的方法;
图2为通过释义查询单字的装置;
图3.1为本发明应用于相同语言时“输入关键词”的示意图;
图3.2为本发明应用于相同语言时“输出候选释义”的示意图;
图3.3为本发明应用于相同语言时“选取目标释义”的示意图;
图3.4为本发明应用于相同语言时“输出目标释义”的示意图;
图4.1为本发明应用于不同语言时“输入关键词”的示意图;
图4.2为本发明应用于不同语言时“输出候选释义”的示意图;
图4.3为本发明应用于不同语言时“选取目标释义”的示意图;
图4.4为本发明应用于不同语言时“输出目标释义”的示意图。
其中,1-储存模块,2-输入模块,3-查询模块,4-选取模块,5-输出模块,12-词汇数据库,14-词汇释义数据库,32-对比模块,34-排序模块,322-拼字单元,324-拼音单元,326-字形单元,328-同义单元,342-位置侦测单元,344-频率侦测单元,201-关键词,301-候选释义,303-候选释义的次序,401-目标词汇,403-目标释义,501-目标词汇的详细数据。
具体实施方式
参见图1,首先,提供词汇释义及词汇(步骤110),词汇释义对应于词汇。其中词汇及词汇释义属于相同语言或不同语言,举例来说,相同语言为输入关键词可为英文,欲获得目标词汇为英文;不同语言为输入关键词可为中文,欲获得目标词汇为英文,可根据需求运用在相同或不相同的语言查询。
然后,接收关键词(步骤120);即接收字母、单字、多个单字为关键词,参见图3.1,输入关键词“long”和“nose”,或参见图4.1,输入关键词“最大的动物”,然后进行智能查询查询。
再根据关键词从词汇释义查询候选释义(步骤130),参见图3.2,输入关键词“long”后,出现三组候选释义“the long nose of an elephant”、“small animallike a mouse with a long nose”、“the long nose and area around the mouth”,或参见图4.2,出现二组候选释义“哺乳动物,是陆地上现存最大的动物”、“世界上最大的动物,前肢形成鳍,后肢完……”;包含对比关键词与词汇释义的相关性而得到候选释义及排序候选释义。而对比方法包含对比关键词的拼字与词汇释义的相似度、关键词的拼音与词汇释义的相似度、关键词的字形与词汇释义的相似度、关键词的意涵与词汇释义的相似度。此后,排序候选释义根据关键词位于候选释义的位置、词汇和候选释义的使用频率而决定候选释义的次序。
因此,即可从候选释义中选取目标释义(步骤140),参见图3.3,在上方选取的目标释义“1.the long nose of an elephant”,且在下方显示目标词汇“trunk”与目标释义“the long nose of an elephant”,或参见图4.3所示,在上方选取目标释义“1.哺乳动物,是陆地上现存最大的动物”,且在下方显示目标词汇“elephant”与目标释义“a mammal,the largest animal in the world”。
最后,输出对应于目标释义的词汇(步骤150),参见图3.4,显示目标词汇“trunk”的音标、词性、例句和中文,或参见图4.4,显示目标词汇“elephant”的罗马拼音和英英释义。
参见图2,本发明装置包含:储存模块1、输入模块2、查询模块3、选取模块4、输出模块5。
储存模块1,用来储存词汇数据库12及词汇释数据库义14,词汇对应于词汇释义。本发明应用于词汇及词汇释义属于相同语言,例如:输入英文关键词“long”和“nose”后得到英文候选释义“the long nose of an elephant”、“smallanimal like a mouse with a long nose”、“the long nose and area around the mouth”,最后目标释义“the long nose of an elephant”和目标词汇“trunk”为英文(参见图3.1、图3.2、图3.3和图3.4);或是不同语言,例如输入中文关键词“最大的动物”后得到中文候选释义“哺乳动物,是陆地上现存最大的动物”、“世界上最大的动物,前肢形成鳍,后肢完……”,最后目标释义“the long nose of anelephant”和目标词汇“elephant”为英文(参见图4.1、图4.2、图4.3和图4.4)。
输入模块2,用来输入关键词201,以提供使用者输入仅得知的大概涵义,其中关键词为字母、单字、多个单字,例如:“long”和“nose”(参见图3.1),或是“最大的动物”(参见图4.1)。
查询模块3,根据关键词201从词汇释义14查询候选释义301,例如:候选释义“the long nose of an elephant”、“small animal like a mouse with a longnose”、“the long nose and area around the mouth”(参见图3.2),或者如:“哺乳动物,是陆地上现存最大的动物”、“世界上最大的动物,前肢形成鳍,后肢完……”(参见图4.2)。查询模块3包含对比模块32、排序模块34。其中对比模块32,用来对比关键词201与词汇释义14的相关性而得到候选释义301。
对比模块32包含:拼字单元322、拼音单元324、字形单元326、同义单元328。拼字单元322,用来对比关键词201的拼字与释义的相似度,拼音单元322,用来对比关键词201的拼音与释义的相似度。字形单元326,用来对比关键词201的字形与释义的相似度。同义单元328,用来对比关键词201的涵义与释义的相似度。
排序模块34用来排序候选释义,包含位置侦测单元342、频率侦测单元344。位置侦测单元342,根据关键词201在候选释义的位置而决定候选释义的次序303。频率侦测单元344,根据词汇和候选释义的使用频率而决定候选释义的次序303。
选取模块4,在候选释义301中选取目标释义403,例如:从三组释义中选取一个为候选释义“the long nose of an elephant”(参见图3.3)、“哺乳动物,是陆地上现存最大的动物”、“世界上最大的动物,前肢形成鳍,后肢完……”(参见图4.3)。
输出模块5,用来输出对应于目标词汇401,获得目标词汇的详细解释数据501,例如:显示目标词汇“trunk”的音标、词性、例句和中文(参见图3.4),显示目标词汇“elephant”的罗马拼音和英英释义参见图4.4。
Claims (10)
1、一种通过释义查询单字的方法,其特征在于:该方法包含下列步骤:
1)提供多个词汇释义及多个词汇,词汇释义对应于词汇;
2)接收关键词;
3)根据关键词从词汇释义查询得到候选释义;
4)从候选释义中选取目标释义;
5)输出对应于目标释义的词汇。
2、根据权利要求1所述的通过释义查询单字的方法,其特征在于:所述步骤3)中对比关键词与词汇释义的相关性而得到候选释义。
3、根据权利要求2所述的通过释义查询单字的方法,其特征在于:所述步骤3)中比对方法包含对比关键词的拼字与词汇释义的相似度、关键词的拼音与词汇释义的相似度、关键词的字形与词汇释义的相似度、关键词的意涵与词汇释义的相似度。
4、根据权利要求1或2或3所述的通过释义查询单字的方法,其特征在于:所述步骤3)中还包括对查询得到的候选释义进行排序的步骤。
5、根据权利要求4所述的通过释义查询单字的方法,其特征在于:所述步骤3)中是根据关键词位于候选释义的位置或词汇和候选释义的使用频率而决定候选释义的次序。
6、一种实现权利要求1所述的通过释义查询单字的方法的装置,其特征在于:该装置包括:储存模块,用来储存多个词汇及多个词汇释义,词汇对应于词汇释义;输入模块,用来输入关键词;查询模块,根据关键词从词汇释义查询候选释义;选取模块,在候选释义中选取目标释义;输出模块,用来输出对应于目标释义的词汇,所述输入模块接入查询模块,所述储存模块与查询模块相接,所述查询模块接入选取模块,所述选取模块接入输出模块。
7、根据权利要求6所述的通过释义查询单字的装置,其特征在于:所述查询模块包含对比模块,用来对比关键词与词汇释义的相关性而得到候选释义。
8、根据权利要求6所述的通过释义查询单字的装置,其特征在于:所述查询模块包含排序模块,用来排序候选释义。
9、根据权利要求8所述的通过释义查询单字的装置,其特征在于:所述排序模块包含位置侦测单元,根据关键词在候选释义的位置决定候选释义的次序。
10、根据权利要求8所述的通过释义查询单字的装置,其特征在于:所述排序模块包含频率侦测单元,根据词汇和候选释义的使用频率决定候选释义的次序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810232477 CN101436205A (zh) | 2008-11-28 | 2008-11-28 | 通过释义查询单字的方法与装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810232477 CN101436205A (zh) | 2008-11-28 | 2008-11-28 | 通过释义查询单字的方法与装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101436205A true CN101436205A (zh) | 2009-05-20 |
Family
ID=40710643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200810232477 Pending CN101436205A (zh) | 2008-11-28 | 2008-11-28 | 通过释义查询单字的方法与装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101436205A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101996238A (zh) * | 2010-10-15 | 2011-03-30 | 无敌科技(西安)有限公司 | 运用多种语言输入提高搜寻匹配度的方法及其装置 |
CN102456006A (zh) * | 2010-10-14 | 2012-05-16 | 英业达股份有限公司 | 依据字词类别筛选相近字词的查找系统及其查找方法 |
CN107861927A (zh) * | 2017-09-21 | 2018-03-30 | 广州视源电子科技股份有限公司 | 文档注释方法、装置、可读存储介质及计算机设备 |
CN111859013A (zh) * | 2020-07-17 | 2020-10-30 | 腾讯音乐娱乐科技(深圳)有限公司 | 数据处理方法、装置、终端和存储介质 |
-
2008
- 2008-11-28 CN CN 200810232477 patent/CN101436205A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102456006A (zh) * | 2010-10-14 | 2012-05-16 | 英业达股份有限公司 | 依据字词类别筛选相近字词的查找系统及其查找方法 |
CN101996238A (zh) * | 2010-10-15 | 2011-03-30 | 无敌科技(西安)有限公司 | 运用多种语言输入提高搜寻匹配度的方法及其装置 |
CN107861927A (zh) * | 2017-09-21 | 2018-03-30 | 广州视源电子科技股份有限公司 | 文档注释方法、装置、可读存储介质及计算机设备 |
CN111859013A (zh) * | 2020-07-17 | 2020-10-30 | 腾讯音乐娱乐科技(深圳)有限公司 | 数据处理方法、装置、终端和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106537370B (zh) | 在存在来源和翻译错误的情况下对命名实体鲁棒标记的方法和系统 | |
Huang et al. | Mining key phrase translations from web corpora | |
CN101840406B (zh) | 地名搜索装置和系统 | |
CN109637537B (zh) | 一种自动获取标注数据优化自定义唤醒模型的方法 | |
CN103309926A (zh) | 基于条件随机场的中英文混合命名实体识别方法及系统 | |
CN102982021A (zh) | 用于消除语言转换中的多个读法的歧义的方法 | |
CN103294776A (zh) | 一种智能手机通讯录模糊搜索的方法 | |
RU2004129675A (ru) | Система для идентификации перефразирования с использованием технологии машинного перевода | |
CN102479191A (zh) | 提供多粒度分词结果的方法及其装置 | |
CN105760359B (zh) | 问句处理系统及其方法 | |
CN102023972A (zh) | 基于结构化的翻译记忆的自动翻译系统及其自动翻译方法 | |
CN106383814A (zh) | 一种英文社交媒体短文本分词方法 | |
CN104252542A (zh) | 一种基于词库的动态规划中文分词方法 | |
CN112328773A (zh) | 基于知识图谱的问答实现方法和系统 | |
CN101436205A (zh) | 通过释义查询单字的方法与装置 | |
CN101470701A (zh) | 支持基于有限状态机的语义规则的文本分析器及其方法 | |
Rosso et al. | On the voice-activated question answering | |
CN101539433A (zh) | 导航系统中拼音首字母加声调检索的方法及装置 | |
CN101655846A (zh) | 中文输入法标点关联方法及装置 | |
Srithirath et al. | A hybrid approach to lao word segmentation using longest syllable level matching with named entities recognition | |
Randhawa et al. | Study of spell checking techniques and available spell checkers in regional languages: a survey | |
CN111814433B (zh) | 一种维吾尔语实体识别的方法、装置和电子设备 | |
CN101707020B (zh) | 汉字学习系统及其方法 | |
CN101770478A (zh) | 数据检索方法、数据检索引擎及嵌入式终端 | |
Al-Zyoud et al. | Arabic stemming techniques: comparisons and new vision |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Open date: 20090520 |