CN1494026A - 具有语音辨识辅助功能的中文输入方法及其系统 - Google Patents

具有语音辨识辅助功能的中文输入方法及其系统 Download PDF

Info

Publication number
CN1494026A
CN1494026A CNA021481830A CN02148183A CN1494026A CN 1494026 A CN1494026 A CN 1494026A CN A021481830 A CNA021481830 A CN A021481830A CN 02148183 A CN02148183 A CN 02148183A CN 1494026 A CN1494026 A CN 1494026A
Authority
CN
China
Prior art keywords
phrases
words
speech recognition
input
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA021481830A
Other languages
English (en)
Other versions
CN1275174C (zh
Inventor
温世仁
张东华
吴俭
张红兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Corp
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CNB021481830A priority Critical patent/CN1275174C/zh
Publication of CN1494026A publication Critical patent/CN1494026A/zh
Application granted granted Critical
Publication of CN1275174C publication Critical patent/CN1275174C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)
  • Machine Translation (AREA)

Abstract

一种具有语音辨识辅助功能的中文输入方法及其系统,运用语音辨识技术供使用者进行候选词句及类别的选取输入上的辅助,让使用者可以利用语音的方式去选取要输入的候选词句,以减少手动输入的次数和错误的发生,提高整体输入的速度。

Description

具有语音辨识辅助功能的中文输入方法及其系统
技术领域
本发明涉及一种输入方法及其系统,特别涉及一种利用语音辨识技术来辅助使用者进行输入时对于候选词句和候选类别的选取,进而提高使用者整体输入速度的输入方法和系统。
背景技术
输入法,一直以来最为人们所不希望有的也是最难有效解决的问题,不外乎就是输入速度和使用便利这两个。一般大部分的输入法都是偏重在输入速度的解决问题上,利用其自行开发的独特拆字输入方式来达到增加输入速度的目的,面对这些输入法使用者往往必须经过一段不算短的时间来自我训练及背诵其特殊的拆字输入方式,才能够真正的享受到输入速度增加的成就感,但是这对于一般大多数的普通使用者来说进入使用的门槛相当高,而且在输入使用上也显得相当不便利,无法吸引一般使用者使用。
有些输入法便通过提供内建词库的方式,希望能够同时解决输入速度和使用便利上的问题,利用这种方式使用者在进行输入的时候遇到内建词库中所具有的文句时,便可以省去再输入的时间直接通过选取的方式来达到快速输入的目的,但是由于这些输入法的实际运作方式大多都是在接受使用者的输入之后,由词库中找出可能的词句并且利用候选清单的方式将项目一一条列出来让使用者进行选择,而选择的方式往往都必须要使用者通过手动的方式以键盘输入或者是鼠标点选之后才能够完成最后选取输入的动作,这对于那些必须经常使用词库中词句的使用者来说,频繁的手动选取输入动作造成他们在使用词库意愿上的一大阻碍,同时利用手动的方式来进行候选词句的选取还可能会很容易因为一时的不专心或者是疏忽而发生选取上的错误,到头来用来删除错误输入词句的时间可能更多,反而可能会影响到整体输入的速度效率。
目前语音辨识科技已经发展的相当发达,虽然全面性的语音辨识仍有某些技术上暂时无法克服的困难点,距离实现全语音的辨识上似乎还有一段差距,但是对于应用在少数固定的基本元素上的语音辨识技术却早已不成问题,因此要如何通过计算机程序的设计与执行,发展出一种可以在输入法系统中结合语音辨识技术的优点,辅助使用者进行候选词句的选取输入,用以减少使用者反复手动输入的程序,降低手动输入的错误发生率,进而提高使用者在整体词句输入上的速度,这才是目前许多输入法使用者所极为期盼的。
发明内容
有鉴于此,本发明为解决上述问题而提出一种具有语音辨识辅助功能的中文输入方法及其系统,主要目的在于运用语音辨识技术,在使用者进行候选词句或者是候选类别的选取动作上,提供以语音输入的方式来达到减少手动输入的次数、避免错误的发生以及提高整体输入速度的目的。
所以为达上述目的,本发明所提供的具有语音辨识辅助功能的中文输入系统,包含:词句数据库、接收辨识模块、数据撷取模块、及输出显示模块。
另外,本发明所提供的具有语音辨识辅助功能的中文输入方法,包含下列步骤:先在可编辑文档中激活输入法起始界面,然后显示分类类别清单,利用语音输入候选词句编号进行分类类别的选取动作,显示其中的类别项目词句,利用语音选择候选词句编号并撷取对应的类别项目词句,及将类别项目词句输出到可编辑文档中。
有关本发明的详细内容及技术,现结合附图说明如下:
附图说明
图1为本发明所提供的具有语音辨识辅助功能的中文输入方法及其系统的系统结构图;
图2为本发明所提供的具有语音辨识辅助功能的中文输入方法及其系统的语音输入流程图;
图3为本发明所提供的具有语音辨识辅助功能的中文输入方法及其系统的数据撷取流程图;及
图4a、图4b、图4c为本发明所提供的具有语音辨识辅助功能的中文输入方法及其系统的语音输入画面示意图。
具体实施方式
本发明涉及一种具有语音辨识辅助功能的中文输入方法及其系统,通过图1来说明本发明的系统结构,该图为本发明所提供的具有语音辨识辅助功能的中文输入方法及其系统的系统结构图,说明如下:
(1)词句数据库210,负责储存所有的分类类别内容以及类别项目词句。该词句数据库210为一种关系型数据库,建立各个分类类别与各个类别项目词句之间的关联索引,在数据查找上可以更加精确而快速。
(2)数据撷取模块220,主要根据接收辨识模块230所传送过来的语音转换结果,在词句数据库210中将对应的数据项给撷取出来。在该数据撷取模块220中会记录目前所显示的分类类别清单的状态,当取得语音转换结果时,该模块220会对比出数据库中实际的对应数据项,然后再到词句数据库210中撷取。
(3)接收辨识模块230,通过语音输入外围装置(如:麦克风、收音机…)接收使用者所输入的语音,然后进行辨识以及转换的工作。其中辨识的程序主要在于找出使用者输入语音所代表的实际候选词句编号是什么?是否为合理范围内可以辨识的实际候选词句编号?若使用者的输入语音超出候选词句编号的范围,或者是因为语音模糊不清导致无法进行辨识的话,则该接收辨识模块230会进行错误信息的提示,并且要求使用者再重新进行语音的输入。至于转换的部分,则是在确认使用者的输入语音为合理范围可辨识的实际候选词句编号后,将模拟信号内容通过转换使之成为计算机可处理的数字信号。
(4)输出显示模块240,主要用来显示分类类别清单(其中分类类别清单包含语音输入区以及项目显示区两部分),另外,当使用者已经选定最后所要输入的类别项目词句时,该输出显示模块240将会自动把对应的词句输出到使用者所正在使用的文档中,可以减少使用者真正的输入时间。
图2的部分,则说明本发明的语音输入流程,该图为本发明所提供的具有语音辨识辅助功能的中文输入方法及其系统的语音输入流程图,说明如下:
首先,使用者可以在所使用的可编辑文档(如:WORD、Notepad…)中,将本发明的输入法起始界面100开启(步骤300);之后本发明输入法系统200会显示出一个分类类别清单的画面(步骤310),此画面中包含一个语音输入区以及一个项目显示区,可供使用者开始进行语音输入的动作;此时使用者可以利用语音依照分类类别清单上所显示的候选词句编号来进行类别的选取动作(步骤320);然后本发明输入法系统便会判断在使用者所选取的项目之外是否仍有其它的分类类别?(步骤330)如果有的话,则流程再度回到步骤310的地方,继续显示更进一步的分类类别清单,否则的话,表示已经进入到了该类别最后的类别项目词句的部分,便接着进行类别项目词句的显示工作(步骤340);此时使用者可以再通过语音来选择自己想要输入的类别项目词句的候选词句编号(步骤350);最后,本发明便将该类别项目词句给自动输出到使用者所使用的可编辑文档中(步骤360),完成利用语音输入来选取词句的流程。
接着,以图3来说明本发明如何利用语音的输入来进行数据的撷取,该图为本发明所提供的具有语音辨识辅助功能的中文输入方法及其系统的数据撷取流程图,进一步说明如下:
首先,本发明输入法系统200必须先通过语音输入外围装置来接收使用者所输入的语音内容(步骤400);接着开始进行语音辨识的程序(步骤410),其中辨识的程序主要在于找出使用者输入的语音是否为合理范围内可以辨识的实际候选词句编号?(步骤420)若使用者的输入语音超出候选词句编号的范围,或者是因为语音模糊不清导致无法进行辨识的话,则进行错误信息的提示(步骤470),并且回到步骤400的部分,要求使用者再重新进行语音的输入,否则的话便继续进行语音转换的动作,将模拟信号内容通过转换使之成为计算机可处理的数字信号;产生出计算机可执行处理的数字信号(步骤430),之后便根据数字信号所表示的内容将对应到分类类别清单上的数据项自词句数据库210中撷取出来(步骤440);然后通过输出显示模块240进行显示动作(步骤450);此时,本发明的输入法系统200会判断如果显示的内容已到达最后的类别项目词句时,使用者是否已经选定其中一项并且将该类别项目词句输出?(步骤460)如果不是的话,表示所显示的分类类别清单还有更进一步的分类类别存在,则流程会再度回到步骤400的部分,继续接收使用者的语音输入,否则的话,表示已经完成这次的数据撷取流程,结束整个流程。
最后,下面通过图4a、图4b及图4c来进行本发明的具体实施例的说明:
开始时,使用者会见到如图4a所呈现的分类类别清单,其中在项目显示区的部分显示出词句数据库210中所有词句的最基本分类项目(如:生活、自然、人生、生命…),此时使用者可以利用语音的方式进行输入,举例来说,若使用者想要输入有关“生活”类别下的词句时,使用者可以以语音的方式来输入“生活”类别的候选词句编号(即“1”);接着出现的画面将如图4b所示,在项目显示区中会显示出所有“生活”类别下的各个类别项目(包括:饮食、工作、家庭、娱乐、爱情…),而在语音输入区中则显示出目前使用者所处的词句分类类别状态;此时,若使用者希望能够输入的是“工作”方面的词句时,使用者可以通过语音的方式输入代表“工作”类别的候选词句编号(即“2”);同样地,系统会将在“工作”类别下的各个类别项目给显示出来,假使在“工作”类别下并没有其它更细部的分类类别时,系统便会将“工作”类别下所有的类别项目词句给显示出来(如图4c中所示),这时候使用者同样可以利用语音输入对应的候选词句编号把自己所想要的词句给选取出来,系统会自动将对应的类别项目词句给撷取出来,然后自动输出到使用者所正在使用编辑的文档中。
虽然本发明的较佳实施例揭露如上,然而并非用以限制本发明的范围,任何熟悉该技艺的技术人员,在不脱离本发明的精神和范围内,所作的些许更改和修饰,均应包含在本发明的权利要求书所保护的范围之内。

Claims (9)

1.一种具有语音辨识辅助功能的中文输入系统,提供语音辨识技术来辅助使用者在候选词句关键词上的输入以减少错误发生及提高输入效率,其特征在于,该系统包含:
词句数据库,储存所有的分类类别内容以及类别项目词句;
接收辨识模块,通过语音输入外围装置接收使用者的候选词句编号的语音,加以辨识并且进行语音转换;
数据撷取模块,根据该语音转换的结果,撷取分类类别清单中对应的数据项;及
输出显示模块,显示该分类类别清单及将类别项目词句输出到可编辑文档中。
2.如权利要求1所述的具有语音辨识辅助功能的中文输入系统,其特征在于,该词句数据库为一种关系型数据库,提供该分类类别及该类别项目词句间的关联索引。
3.如权利要求1所述的具有语音辨识辅助功能的中文输入系统,其特征在于,该接收辨识模块还包含提示错误信息的功能。
4.如权利要求1所述的具有语音辨识辅助功能的中文输入系统,其特征在于,该语音转换是将模拟信号转换成为计算机可处理的数字信号。
5.如权利要求1所述的具有语音辨识辅助功能的中文输入系统,其特征在于,该分类类别清单包含语音输入区及项目显示区。
6.一种具有语音辨识辅助功能的中文输入方法,提供语音辨识技术来辅助使用者在候选词句关键词上的输入以减少错误发生及提高输入效率,其特征在于,该方法包含下列步骤:
在可编辑文档中激活输入法起始界面;
显示分类类别清单;
利用语音输入一候选词句编号进行该分类类别的选取动作;
显示类别项目词句;
利用语音选择该候选词句编号并撷取对应的该类别项目词句;及
将该类别项目词句输出到该可编辑文档中。
7.如权利要求6所述的具有语音辨识辅助功能的中文输入方法,其特征在于,该分类类别清单包含语音输入区及项目显示区。
8.如权利要求6所述的具有语音辨识辅助功能的中文输入方法,其特征在于,该利用语音输入该候选词句编号进行该分类类别的选取动作及利用语音选择该候选词句编号并撷取对应的该类别项目词句的步骤,还包含下列步骤:
通过语音输入外围装置接收语音;
进行语音辨识程序;
将语音模拟信号转换成为计算机可处理的数字信号;及
进行对应的数据项显示。
9.如权利要求8所述的具有语音辨识辅助功能的中文输入方法,其特征在于,该进行语音辨识程序还包含进行提示错误信息的步骤。
CNB021481830A 2002-10-31 2002-10-31 具有语音辨识辅助功能的中文输入方法及其系统 Expired - Fee Related CN1275174C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB021481830A CN1275174C (zh) 2002-10-31 2002-10-31 具有语音辨识辅助功能的中文输入方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB021481830A CN1275174C (zh) 2002-10-31 2002-10-31 具有语音辨识辅助功能的中文输入方法及其系统

Publications (2)

Publication Number Publication Date
CN1494026A true CN1494026A (zh) 2004-05-05
CN1275174C CN1275174C (zh) 2006-09-13

Family

ID=34233108

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB021481830A Expired - Fee Related CN1275174C (zh) 2002-10-31 2002-10-31 具有语音辨识辅助功能的中文输入方法及其系统

Country Status (1)

Country Link
CN (1) CN1275174C (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008071120A1 (fr) * 2006-12-12 2008-06-19 Beijing Sogou Technology Development Co., Ltd. Procédé et système d'émission d'information relative de mots-clés sur internet
CN102117115A (zh) * 2009-12-31 2011-07-06 上海量科电子科技有限公司 一种利用唇语进行文字输入选择的系统及实现方法
CN102541252A (zh) * 2010-12-26 2012-07-04 上海量明科技发展有限公司 一种语音协助字符输入的方法及系统
CN104216676A (zh) * 2013-06-05 2014-12-17 瀚宇彩晶股份有限公司 平面显示器的输入控制方法
CN105117195A (zh) * 2015-09-09 2015-12-02 百度在线网络技术(北京)有限公司 语音输入的引导方法和装置
CN105426357A (zh) * 2015-11-06 2016-03-23 武汉卡比特信息有限公司 语音快速选择方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008071120A1 (fr) * 2006-12-12 2008-06-19 Beijing Sogou Technology Development Co., Ltd. Procédé et système d'émission d'information relative de mots-clés sur internet
CN102117115A (zh) * 2009-12-31 2011-07-06 上海量科电子科技有限公司 一种利用唇语进行文字输入选择的系统及实现方法
CN102541252A (zh) * 2010-12-26 2012-07-04 上海量明科技发展有限公司 一种语音协助字符输入的方法及系统
CN104216676A (zh) * 2013-06-05 2014-12-17 瀚宇彩晶股份有限公司 平面显示器的输入控制方法
CN105117195A (zh) * 2015-09-09 2015-12-02 百度在线网络技术(北京)有限公司 语音输入的引导方法和装置
CN105117195B (zh) * 2015-09-09 2018-05-08 百度在线网络技术(北京)有限公司 语音输入的引导方法和装置
CN105426357A (zh) * 2015-11-06 2016-03-23 武汉卡比特信息有限公司 语音快速选择方法

Also Published As

Publication number Publication date
CN1275174C (zh) 2006-09-13

Similar Documents

Publication Publication Date Title
Raman Auditory user interfaces: toward the speaking computer
JP3363283B2 (ja) 入力装置、入力方法、情報処理システムおよび入力情報の管理方法
US8150699B2 (en) Systems and methods of a structured grammar for a speech recognition command system
US8249879B2 (en) System and method of providing a spoken dialog interface to a website
US7962842B2 (en) Method and systems for accessing data by spelling discrimination letters of link names
CN108847241A (zh) 将会议语音识别为文本的方法、电子设备及存储介质
CN102272827B (zh) 利用语音输入解决模糊的手工输入文本输入的方法和装置
US20020077832A1 (en) Computer based integrated text/graphic document analysis
JP5703491B2 (ja) 言語モデル・音声認識辞書作成装置及びそれらにより作成された言語モデル・音声認識辞書を用いた情報処理装置
CN1742273A (zh) 多模态语音-语音语言翻译和显示
CN1238051A (zh) 用于语音间翻译的方法和设备
US20070016420A1 (en) Dictionary lookup for mobile devices using spelling recognition
JP2017016296A (ja) 画像表示装置
Panda Automated speech recognition system in advancement of human-computer interaction
CA2488961C (en) Systems and methods for semantic stenography
CN102541252A (zh) 一种语音协助字符输入的方法及系统
CN1275174C (zh) 具有语音辨识辅助功能的中文输入方法及其系统
Callejas et al. Implementing modular dialogue systems: A case of study
Suhm Multimodal interactive error recovery for non-conversational speech user interfaces
CN1121015C (zh) 盲人用的汉语智能计算机系统
CN1965349A (zh) 多形式的非歧意性语音识别
CN111429886B (zh) 一种语音识别方法及系统
KR19990047859A (ko) 도서 문헌 데이터베이스 검색을 위한 자연언어 대화 시스템
Shih et al. Improved Rapid Automatic Keyword Extraction for Voice-based Mechanical Arm Control.
Song et al. Overview of natural language processing technologies and rationales in application

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1061090

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Assignee: Inventec Hi-Tech Corporation

Assignor: Inventec Corporation

Contract fulfillment period: 2006.10.1 to 2012.9.30 contract change

Contract record no.: 2008990000345

Denomination of invention: Chinese language input method possessing speech sound identification auxiliary function and its system

Granted publication date: 20060913

License type: Exclusive license

Record date: 2008.9.2

LIC Patent licence contract for exploitation submitted for record

Free format text: EXCLUSIVE LICENCE; TIME LIMIT OF IMPLEMENTING CONTACT: 2006.10.1 TO 2012.9.30

Name of requester: YINGYUANDA TECHNOLOGY CO., LTD.

Effective date: 20080902

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060913

Termination date: 20101031