CN1135482C - 中文近似语音搜寻方法 - Google Patents

中文近似语音搜寻方法 Download PDF

Info

Publication number
CN1135482C
CN1135482C CNB991231074A CN99123107A CN1135482C CN 1135482 C CN1135482 C CN 1135482C CN B991231074 A CNB991231074 A CN B991231074A CN 99123107 A CN99123107 A CN 99123107A CN 1135482 C CN1135482 C CN 1135482C
Authority
CN
China
Prior art keywords
phonetic
approximate
vocabulary
voice
pinyin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB991231074A
Other languages
English (en)
Other versions
CN1294358A (zh
Inventor
陈淮琰
何王合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yingyeda Co Ltd (Shanghai)
Original Assignee
Inventec Besta Xian Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Besta Xian Co Ltd filed Critical Inventec Besta Xian Co Ltd
Priority to CNB991231074A priority Critical patent/CN1135482C/zh
Publication of CN1294358A publication Critical patent/CN1294358A/zh
Application granted granted Critical
Publication of CN1135482C publication Critical patent/CN1135482C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明是提供一种可利用近似语音来搜寻词汇的近似语音搜寻方法。该近似语音搜寻方法是利用近似语音来搜寻存储于电脑的词汇。该电脑包含有一存储器,一处理器,一显示器,以及一输入装置。该存储器内存有一词汇表,一词汇语音表,以及一近似语音字母表。该词汇表内存有复数个词汇,每一词汇为复数个文字所组成的文字序列。该词汇语音表内含有该词汇表内每一词汇相对应的拼音序列,每一词汇的拼音序列依序含有该词汇的各个文字语音拼音,每一文字的语音拼音包含有复数个依排列的语音字母。该近似语音字母表内含有复数个近似语音字母集,每一近似语音字母集内含有至少一个语音字母,每一近似语音字母集内的所有语音字母的发音均近似。该方法包含有下列步骤:(1)利用该输入装置来输入一预定拼音序列,或是输入一预定词汇并将该预定词汇转换成一预定拼音序列;(2)利用该近似语音字母表来产生复数个该预定拼音序列的近似拼音序列,其中每一近似拼音序列的各个语音拼音的各个语音字母与该预定拼音序列的各个相对应的语音拼音的各个相对应的语音字母均属同一近似语音字母集;(3)利用该词汇语音表及词汇表来找出与该复数个近似拼音序列相对应的词汇并将其显示于该显示器上以供该使用者选择。

Description

中文近似语音搜寻方法
本发明提供一种近似语音搜寻方法,尤指一种可利用近似语音来搜寻词汇的近似语音搜寻方法。
当使用者利用注音符号或罗马拼音来输入一中文词汇时,如果使用者所输入的语音拼音不正确时,就无法输入该中文词汇。例如,使用者可能会混淆Zh(ㄓ)、ch(ㄔ)、sh(ㄕ)、z(ㄗ)、c(ㄘ)、s(ㄙ),而将词汇“造成”的拼音序列“ㄗㄠ
Figure C9912310700041
ㄔㄥノ”输入为“ㄓㄠ
Figure C9912310700043
ㄥㄘノ”,而无法输入词汇(造成)。
因此,本发明的主要目的在于提供一种近似语音搜寻方法,其可利用近似语音来搜寻存储在电脑的词汇,即使使用者所输入音序列不正确,本发明近似语音搜寻方法会将使用者所欲输入的所有可能词汇找出,供使用者选择以输入该词汇。
图1为一用来执行本发明近似语音搜寻方法的电脑的示意图。
图2为本发明近似语音搜寻方法的流程图。
图3为产生图2的该预定拼音序列的复数个近似拼音序列的流程图。
图4为本发明近似语音搜寻方法的一实施例。
图5为本发明近似语音搜寻方法的另一实施例。
其中图示的符号说明
12电脑                    14存储器
16处理器                  18显示器
20输入装置                22词汇表
24词汇语音表              26词汇
30近似语音字母表          32近似语音字母集
34有效语音拼音表          36有效语音拼音
本发明是提供一种近似语音搜寻方法,其可利用一近似语音搜寻一个存储于电脑中的词汇。请参考图1。图1为一用来执行本发明近似语音搜寻方法10的电脑12的示意图。电脑12包含有一存储器14用来存储程序与资料,一处理器16用来执行存储器14内的程序,一显示器18电连接于处理器16,用来显示一影像图面,以及一输入装置20电连接于处理器16,用来供一使用者输入文字或语音字母。存储器14内存有一词汇表11,一词汇语音表24,一近似语音字母表30,以及一有效语音拼音表34。词汇表22内存有复数个词汇26,每一词汇26是复数个文字所组成的文字序列。词汇语音表24内含有与词汇表22内每一词汇26相对应的拼音序列28,每一词汇26的拼音序列28依序含有词汇26的各个文字的语音拼音,而每一文字的语音拼音包含有复数个依排列的语音字母。近似语音字母表30内含有复数个近似语音字母集32。每一近似语音字母集32内含有至少一个语音字母,每一近似语音字母集32内的所有语音字母的发音均近似。例如,zh(ㄓ)、ch(ㄔ)、sh(ㄕ)、z(ㄗ)、c(ㄘ)、s(ㄙ)是属于同一个近似语音字母集32。有效语音拼音表34包含复数个有效语音拼音36,每一个有效语音拼音36可对应于词汇表22中的一或多个词汇26。
其中,每一中文文字的语音拼音所使用的语音字母可为注音符号字母或罗马拼音字母。
请参考图2。图2为本发明近似语音搜寻方法10的流程图。近似语音搜寻方法10包含有下列步骤:
步骤40:使用者利用输入装置20来输入一预定拼音序列,或是输入一预定词汇,并将该预定词汇转换成一预定拼音序列;
步骤42:利用近似语音字母表30来产生复数个该预定拼音序列的近似拼音序列,其中每一近似拼音序列的各个语音拼音的各个语音字母与该预定拼音序列的各个相对应的语音拼音的各个相对应的语音字母均属于同一近似语音字母集32。
步骤44:利用词汇语音表24以及词汇表22来找出与该复数个近似拼音序列相对应的词汇26,并将其显示于显示器18上以供该使用者选择。
请参考图3。图3为产生图2该预定拼音序列的复数个近似拼音序列的流程图。其包含有下列步骤:
步骤70:利用近似语音字母表30来产生该预定拼音序列的各个语音拼音的所有近似语音拼音,其中每一近似语音拼音的各个语音字母与该预定拼音序列的相对应的语音拼音的各个相对应的语音字母均属于同一近似语音字母集32;
步骤72:利用有效语音拼音表34来找出该预定拼音序列的各个语音拼音的所有近似语音拼音中的有效语音拼音以产生该预定拼音序列的各个语音拼音的所有有效的近似语音拼音;
步骤74:利用该预定拼音序列的各个语音拼音的所有有效的近似语音拼音来做排列组合产生该预定拼音序列的所有近似拼音序列。
举例而言,当使用者使用注音符号想要输入一词汇“城市”,却错误地将其拼音序列输入为“ㄘㄥノㄕ ”而无法产生正确的词汇“城市”时,近似语音搜寻方法10会利用近似语音字母表30来产生拼音序列“ㄘㄥノㄕ ”的各个语音拼音的所有近似语音拼音。例如,与语音字母“ㄘ”属于同一个近似语音字母集32的语音字母有“ㄓ、ㄔ、ㄕ、ㄗ、ㄙ”。再利用有效语音拼音表34来产生拼音序列“ㄘㄥノㄕ
Figure C9912310700066
”的各个语音拼音的所有有效的近似语音拼音。例如,“ㄘㄥノ”有效的近似语音拼音有“ㄔㄥノ”、“ㄓㄥ”、“ㄙㄣ”、“ㄗㄥ ”…等等。接着,再利用对拼音序列的“ㄘㄥノㄕ ”各个语音拼音的所有有效的近似语音拼音进行排列组合以产生拼音序列“ㄘㄥノㄕ
Figure C99123107000613
的所有近似拼音序列。例如,近似拼音序列可为“ㄕㄣㄕ “ㄔㄣノㄙ”、“ㄗㄥㄗ”、“ㄔㄥノㄕ ”…等等。最后,再利用词汇语音表24及词汇表22来将所有近似拼音序列所对应的词汇26显示在显示器18上。例如,“绅士”、“身世”、“沈思”、“增资”、“城市”、“程式”…等等。因此,使用者可以选择并且输入词汇“城市”。
请参考图4。图4为本发明近似语音搜寻方法10的一实施例。当使用者使用注音符号想要输入一词汇“里约热内卢”,但是却只知道“里”与“热”的发音时,使用者可以输入拼音序列“ㄌ一
Figure C99123107000618
*ㄖㄜ *”。近似语音搜寻方法10会利用近似语音字母表30来产生拼音序列“ㄌ一 *ㄖㄜ *”的第一及第三个语音拼音的所有近似语音拼音。再利用有效语音拼音表34来产生拼音序列“ㄌ一
Figure C99123107000622
*ㄖㄜ *”的第一及第三个语音拼音的所有有效的近似语音拼音。接着,再利用对拼音序列的“ㄌ一
Figure C99123107000624
*ㄖㄜ *”的第一及第三时拼音的所有有效的近似语音拼音进行排列组合以产生拼音序列“ㄌ一
Figure C99123107000626
*ㄖㄜ
Figure C99123107000627
*”的所有近似拼音序列。最后,再利用词汇语音表24及词汇表22来将所有近似拼音序列所对应的词汇26显示器18上。因此,使用者可以选择并且输入词汇“里约热内卢”。
请参考图5。图5为本发明近似语音搜寻方法10的另一实施例。当使用者使用注音符号想要输入一词汇“胰”,但是却不知道“胰”的正确发音时,使用者可以输入拼音序列“一”近似时搜寻方法10会利用近似语音字母表30来产生拼音序列“一”的语音拼音的所有近似语音拼音。再利用有效语音拼音表34来产生拼音序列“一”的语音拼音的所有有效的近似语音拼音。接着,再利用对拼音序列的“一”的语音拼音的所有有效的近似语音拼音进行排列组合以产生拼音序列“一”的所有近似拼音序列。最后,再利用词汇语音表24及词汇表22来将所有近似拼音序列所对应的词汇26显示在显示器18上。因此,使用者可以选择并且输入词汇“胰”。
由于本发明近似语音搜寻方法10具有近似语音字母表30可以用来产生一预定拼音序列的所有近似拼音序列,因此,当使用者所输入的语音拼音不正确而无法输入一预定词汇时,近似语音搜寻方法10会将相对应于该近似拼音序列的所有词汇显示在显示器18上以供使用者选择,使得使用者可以顺利输入该预定词汇。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的等效变化与修正,皆应属本发明专利的范围。

Claims (3)

1.一种近似语音搜寻方法,它可利用一近似语音来搜寻一存储于一电脑的词汇,该电脑包含有一存储器用来存储程序与资料,一处理器用来执行该存储器内的程序,一显示器电连接于该处理器,用来显示一影像画面,以及一输入装置电连接于该处理器,用来供一使用者输入文字或语音字母,该存储器内存有一词汇表、一词汇语音表、一近似语音字母表以及一有效语音拼音表,该词汇表内存有复数个词汇,每一词汇为复数个文字所组成的文字序列,该词汇语音表内含有该词汇表内每一词汇相对应的拼音序列,每一词汇的拼音序列依序含有该词汇的各个文字的语音拼音,每一文字的语音拼音包含有复数个依排列的语音字母,该近似语音字母表内含有复数个近似语音字母集,每一近似语音字母集内含有至少一个语音字母,每一近似语音字母集内的所有语音字母的发音均近似,而该有效语音拼音表内存有所有有效的语音拼音,每一有效的语音拼音为至少一文字的语音拼音,该方法包含有下列步骤:
利用该输入装置来输入一预定拼音序列,或是输入一预定词汇并将该预定词汇转换成一预定拼音序列;
利用该近似语音字母表来产生复数个该预定拼音序列的近似拼音序列,其中每一近似拼音序列的各个语音拼音的各个语音字母与该预定拼音序列的各个相对应的语音拼音的各个相对应的语音字母均属同一近似语音字母集;以及
利用该词汇语音表及词汇表来找出与该复数个近似拼音序列相对应的词汇并将其显示于该显示器上以供该使用者选择。
2.如权利要求1所述的近似语音搜寻方法,其中,该预定拼音序列的复数个近似拼音序列是以下列步骤产生:
利用该近似语音字母表来产生该预定拼音序列的各个语音拼音的所有近似语音拼音,其中每一近似语音拼音的各个语音字母与该预定拼音序列的相对应的语音拼音的各个相对应的语音字母均属同一近似语音字母集;
利用该有效语音拼音表来找出该预定拼音序列的各个语音拼音的所有近似语音拼音中的有效语音拼音以产生该预定拼音序列的各个语音拼音的所有有效的近似语音拼音;以及
利用该预定拼音序列的各个语音拼音的所有有效的近似语音拼音来做排列组合产生该预定拼音序列的所有近似拼音序列。
3.如权利要求1所述的近似语音搜寻方法,其中每一词汇是由至少一个中文文字所组成,而每一个中文文字的语音拼音所使用的语音字母可为注音符号字母或罗马拼音字母。
CNB991231074A 1999-10-20 1999-10-20 中文近似语音搜寻方法 Expired - Fee Related CN1135482C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB991231074A CN1135482C (zh) 1999-10-20 1999-10-20 中文近似语音搜寻方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB991231074A CN1135482C (zh) 1999-10-20 1999-10-20 中文近似语音搜寻方法

Publications (2)

Publication Number Publication Date
CN1294358A CN1294358A (zh) 2001-05-09
CN1135482C true CN1135482C (zh) 2004-01-21

Family

ID=5282804

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB991231074A Expired - Fee Related CN1135482C (zh) 1999-10-20 1999-10-20 中文近似语音搜寻方法

Country Status (1)

Country Link
CN (1) CN1135482C (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100386759C (zh) * 2003-04-15 2008-05-07 李琳山 以语音为基础的中文信息检索方法
CN103577548B (zh) * 2013-10-12 2017-02-08 优视科技有限公司 近音文字匹配方法及装置
CN113706938B (zh) * 2021-07-15 2023-08-18 都建彬 基于汉语拼音的快速学习八门外语的方法、装置

Also Published As

Publication number Publication date
CN1294358A (zh) 2001-05-09

Similar Documents

Publication Publication Date Title
CN1079967C (zh) 电子翻译机
CN102449579B (zh) 一体式中文字输入方法
JP4829901B2 (ja) マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置
CN1260704C (zh) 语音合成方法
US8077974B2 (en) Compact stylus-based input technique for indic scripts
JP2005202917A (ja) 表音入力の曖昧さを除くためのシステムおよび方法
CN102272827B (zh) 利用语音输入解决模糊的手工输入文本输入的方法和装置
CN101639734A (zh) 中文输入方法和装置
CN101187915A (zh) 汉字学习系统及其方法
CN102460538A (zh) 第二语言发音和拼写
CN1359514A (zh) 多模式数据输入设备
Luu et al. A pointwise approach for Vietnamese diacritics restoration
CN1135482C (zh) 中文近似语音搜寻方法
CN1963753A (zh) 多维汉宇通中文学习应用系统与方法
JP2008059389A (ja) 語彙候補出力システム、語彙候補出力方法及び語彙候補出力プログラム
CN1841277A (zh) 一种在手写输入法中显示汉字拼音的方法
JP2002207728A (ja) 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
KR101243754B1 (ko) 한글 자모를 활용한 중국 문자의 발음 표기 시스템
CN201383228Y (zh) 一种汉语拼音学习装置
CN1679023A (zh) 创建和使用中文语言数据和用户自纠正数据的方法和系统
CN201138475Y (zh) 汉字学习系统
CN100399245C (zh) 中文拼音声调笔划组合输入法
KR20070024386A (ko) 한자 후속글자의 입력방법
CN1808354A (zh) 移动信息终端使用词组联想和语音提示的汉字输入方法
CN1510554A (zh) 一种可嵌入应用的汉字输入法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
BB1A Publication of application
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: YINGYEDA( SHANGHAI ) CO., LTD.

Free format text: FORMER OWNER: NONE WUDI TECHNOLOGY (XI AN) CO., LTD.

Effective date: 20040310

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20040310

Address after: 200233 No. 1295, Shanghai, Yishan Road, China

Patentee after: Yingyeda Co Ltd (Shanghai)

Address before: Xi'an city of Shaanxi Province

Patentee before: Wudi Science and Technology Co., Ltd. (Xian)

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040121

Termination date: 20111020