CN105549757A - 一种普通话拼音输入方言词汇输出的输入法 - Google Patents

一种普通话拼音输入方言词汇输出的输入法 Download PDF

Info

Publication number
CN105549757A
CN105549757A CN201510956183.9A CN201510956183A CN105549757A CN 105549757 A CN105549757 A CN 105549757A CN 201510956183 A CN201510956183 A CN 201510956183A CN 105549757 A CN105549757 A CN 105549757A
Authority
CN
China
Prior art keywords
input
user
input method
dialect
dialectism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510956183.9A
Other languages
English (en)
Inventor
刘海亮
谭伟权
苏航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Research Institute of Sun Yat Sen University
Original Assignee
Shenzhen Research Institute of Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Research Institute of Sun Yat Sen University filed Critical Shenzhen Research Institute of Sun Yat Sen University
Priority to CN201510956183.9A priority Critical patent/CN105549757A/zh
Publication of CN105549757A publication Critical patent/CN105549757A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了一种在Windows系统下根据用户输入显示候选词为方言词汇的输入法,用于降低人们学习地方方言的成本,同时提高方言使用者的输入效率。与别的方言输入法需要使用方言拼音来进行输入不同,本发明使用大众熟悉的普通话拼音输入,将输入内容自动转化为地方方言词汇。普通话拼音输入与方言词汇输出的输入法的工作流程如下:第一步,输入模块利用Windows提供的输入法编辑器组件(IME)从输入法管理器中接收用户键盘输入信息;第二步,码表匹配模块根据输入法的码表,将输入模块中用户通过键盘输入的标准ASCII字符串(英文字符)匹配所对应的方言词汇;第三步,输出模块将用户输入的普通话拼音所对应的全部方言词汇,根据一定的权值作为候选词显示出来,让用户选取。

Description

一种普通话拼音输入方言词汇输出的输入法
技术领域
本发明涉及一种实现普通话拼音输入与方言词汇输出的输入法,是属于自然语言处理领域。
背景技术
在现代社会,越来越多语言爱好者或职场工作人员,喜欢学习多门语言。特别是到别的城市工作或学习的人员,对于当地文化都会产生非常浓厚的兴趣。而地方方言作为地方文化的标志,更是让外来人员非常有学习的欲望。但系统学习一个地方的方言,达到口头与文本上熟练表达,不仅花费时间长,还需要有合适的语言环境来练习,学习成本非常高。随着国家经济发展与交通建设得日益便利,人们的生活工作范围不在仅限于自己家乡之内,接触或使用到另外一个地区方言的情况越来越普遍,但地方方言的学习成本确成为了人们学习了解当地文化的巨大障碍。外来人员学习地方方言一般都请教身边的本地朋友或同事,这种学习方式只能让外来人员学习到一两句地方常用方言,并不能达到使用地方方言来进行日常交流所需的程度。而且这种学习方式只能习得地方方言的发音,但文字的使用方面却存在缺陷,也无法满足外来人员在文本上使用地方方言来进行交流的需求。
发明内容
针对目前人们在方言学习上的困难,解决人们想要深入了解地方文化,学习地方语言,但学习成本高昂的问题。本发明通过利用输入法,提供普通话拼音输入自动转换为地方方言词汇的功能,来实现用户使用自己熟悉的语言,将其转换为用户所需的地方方言。
本发明提供了一种在Windows系统下根据用户输入显示候选词为方言词汇的输入法,用于降低人们学习地方方言的成本,同时提高方言使用者的输入效率。与别的方言输入法需要使用方言拼音来进行输入不同,本发明使用大众熟悉的普通话拼音输入,将输入内容自动转化为地方方言词汇。
附图1表示出了本发明实施例中的普通话拼音输入方言词汇输出的输入法结构示意图,这个输入法主要由输入模块、码表匹配、输出模块3大模块组成。各部分功能如下:
输入模块主要是电脑键盘输入,利用Windows提供的输入法编辑器组件(IME)从输入法管理器中接收用户键盘输入信息。
码表匹配模块主要是根据输入法制作的码表,将用户输入模块中用户通过键盘输入的标准ASCII字符串(英文字符)匹配为所对应的方言词汇。其中码表的编码规则为“普通话拼音方言词汇”。例如“dage大佬”(dage为普通话“大哥”拼音,大佬为对应的粤语方言词汇)。
输出模块主要是将用户输入的普通话拼音所对应的全部方言词汇,根据一定的权值作为候选词显示出来,让用户选取。
这里的权值根据用户的选词频率进行统计,用户选择次数越高的字词权值越高,在候选词中的排位越靠前。
下面将进一步说明普通话拼音输入方言词汇输出的输入法的工作流程:
第一步,输入模块收集用户通过敲击键盘输入普通话拼音的ASCII字符串;
第二步,码表匹配模块根据输入模块中用户输入的ASCII字符串到后台与码表进行匹配;
第三步,输出模块将码表匹配模块的结果,根据词汇权值大小按顺序排列,作为候选词显示,让用户选择。
有益效果
本发明可以通过让用户使用熟悉的普通话拼音输入,将所需的方言词汇输出到文本。基于Windows操作系统的输入法开发技术已经非常成熟,码表的制作也能够实现。通过标准普通话输入法的码表,将普通话拼音对应的词汇修改为地方方言词汇,从而达到普通话拼音输入,方言词汇输出的目的。
附图说明
为了更清楚说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中的普通话拼音输入与方言词汇输出的输入法结构示意图。
图2是本发明实施例中基于Windows操作系统的汉字输入法原理图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实例仅仅是本发明的一部分实施例,而不是全部的是实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的重点在于:将用户键盘输入的ASCII字符串,利用码表进行匹配,根据权值将匹配结果作为候选词显示给用户。要实现普通话拼音输入与方言词汇输出的目的,将码表中的编码规则定义如下:
ASCII字符串汉字
其中ASCII字符串为普通话拼音,汉字为普通话拼音所表示的普通话词汇对应的方言词汇。
例:zhe呢
zhe咁
zhege呢个
zheyang咁啊
本发明中,输入法的键盘监听与汉字反馈由Windows系统来实现。
步骤一:系统监听用户键盘事件,将用户产生的键盘事件传递到Windows的user.exe进程;
步骤二:user.exe将用户产生的键盘事件传到输入法管理器(InputMethodManager,简称IMM)中;
步骤三:IMM将键盘事件传到输入法中;
步骤四:输入法根据用户编码字典,翻译键盘事件为对应的汉字(或汉字串),然后再反传到user.exe进程中;
步骤五:user.exe进程将翻译后的键盘事件传给当前正运行的应用程序,完成汉字输入。

Claims (5)

1.本发明提供了一种在Windows操作系统下根据用户输入显示候选词为方言词汇的输入法,用于降低人们学习地方方言的成本,同时提高方言使用者的输入效率。与别的方言输入法需要使用方言拼音来进行输入不同,本发明使用大众熟悉的普通话拼音输入,将输入内容自动转化为地方方言词汇。
普通话拼音输入与方言词汇输出的输入法的工作流程如下:
第一步,输入模块利用Windows提供的输入法编辑器组件(IME)从输入法管理器中接收用户键盘输入信息;
第二步,码表匹配模块根据输入法的码表,将输入模块中用户通过键盘输入的标准ASCII字符串(英文字符)匹配所对应的方言词汇;
第三步,输出模块将用户输入的普通话拼音所对应的全部方言词汇,根据一定的权值作为候选词显示出来,让用户选取。
2.根据权利要求1所述的普通话拼音输入与方言词汇输出的输入法,其特征在于输入法的输入为普通话拼音字符。
3.根据权利要求1所述的普通话拼音输入与方言词汇输出的输入法,其特征在于输入法的输出为方言词汇。
4.根据权利要求1所述的普通话拼音输入与方言词汇输出的输入法,其特征在于根据用户键盘输入的ASCII字符串,利用码表进行匹配,按照权值将匹配结果作为候选词显示给用户。要实现普通话拼音输入与方言词汇输出的目的,将码表中的编码规则定义如下:
ASCII字符串汉字
其中ASCII字符串为普通话拼音,汉字为普通话拼音所表示的普通话词汇对应的方言词汇。
例:zhe呢
zhe咁
zhege呢个
zheyang咁啊。
5.根据权利要求1所述的普通话拼音输入与方言词汇输出的输入法,其特征在于输入法的实现基于Windows操作系统。
步骤一:系统监听用户键盘事件,将用户产生的键盘事件传递到Windows的user.exe进程;
步骤二:user.exe将用户产生的键盘事件传到输入法管理器(InputMethodManager,简称IMM)中;
步骤三:IMM将键盘事件传到输入法中;
步骤四:输入法根据用户编码字典,翻译键盘事件为对应的汉字(或汉字串),然后再反传到user.exe进程中;
步骤五:user.exe进程将翻译后的键盘事件传给当前正运行的应用程序,完成汉字输入。
CN201510956183.9A 2015-12-18 2015-12-18 一种普通话拼音输入方言词汇输出的输入法 Pending CN105549757A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510956183.9A CN105549757A (zh) 2015-12-18 2015-12-18 一种普通话拼音输入方言词汇输出的输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510956183.9A CN105549757A (zh) 2015-12-18 2015-12-18 一种普通话拼音输入方言词汇输出的输入法

Publications (1)

Publication Number Publication Date
CN105549757A true CN105549757A (zh) 2016-05-04

Family

ID=55828978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510956183.9A Pending CN105549757A (zh) 2015-12-18 2015-12-18 一种普通话拼音输入方言词汇输出的输入法

Country Status (1)

Country Link
CN (1) CN105549757A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110851638A (zh) * 2019-11-06 2020-02-28 杭州睿琪软件有限公司 获取物种识别名称的方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102023711A (zh) * 2009-09-23 2011-04-20 王雅弟 方言输入法
US20130275119A1 (en) * 2012-03-16 2013-10-17 Huawei Device Co., Ltd. Input method, input apparatus, and terminal
CN104345899A (zh) * 2013-08-08 2015-02-11 阿里巴巴集团控股有限公司 用于输入法的字段转换方法及客户端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102023711A (zh) * 2009-09-23 2011-04-20 王雅弟 方言输入法
US20130275119A1 (en) * 2012-03-16 2013-10-17 Huawei Device Co., Ltd. Input method, input apparatus, and terminal
CN104345899A (zh) * 2013-08-08 2015-02-11 阿里巴巴集团控股有限公司 用于输入法的字段转换方法及客户端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DENGTING: "Windows输入法编程(上)", 《CSDN博客,URL:HTTP://BLOG.CSDN.NET/DENGTING/ARTICLE/DETAILS/14638#COMMENTS》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110851638A (zh) * 2019-11-06 2020-02-28 杭州睿琪软件有限公司 获取物种识别名称的方法及装置

Similar Documents

Publication Publication Date Title
CN104584003B (zh) 词检测和域字典推荐
CN107729326B (zh) 基于Multi-BiRNN编码的神经机器翻译方法
Nair et al. Conversion of Malayalam text to Indian sign language using synthetic animation
EP4075430A2 (en) Method and apparatus for speech generation
CN104239289B (zh) 音节划分方法和音节划分设备
CN107133198A (zh) 一种文档的排版和格式转换方法
Kaur et al. HamNoSys generation system for sign language
CN105225659A (zh) 一种指令式语音控制发音词典辅助生成方法
CN101576909A (zh) 一种蒙古语数字化知识库系统构建方法
Samardžić et al. Automatic interlinear glossing as two-level sequence classification
CN112289305B (zh) 韵律预测方法、装置、设备以及存储介质
CN112309368B (zh) 韵律预测方法、装置、设备以及存储介质
Upadhyay et al. Transish: translator from Sanskrit to English-a rule based machine translation
Prasad et al. Mining Training Data for Language Modeling Across the World's Languages.
CN105549757A (zh) 一种普通话拼音输入方言词汇输出的输入法
CN103164395A (zh) 汉柯电子辞典及其自动转译汉柯语的方法
AU2015305397A1 (en) Lexical dialect analysis system
CN112100335B (zh) 问题生成方法、模型训练方法、装置、设备和存储介质
CN1949148A (zh) 一种汉字输入方法及装置
CN114020918A (zh) 分类模型训练方法、翻译方法、装置及电子设备
JP2014191484A (ja) 文末表現変換装置、方法、及びプログラム
JP6934848B2 (ja) 学習データ作成装置並びに分類モデル学習装置及びカテゴリ付与装置
Troelsgård et al. An electronic dictionary of danish sign language
Vandeghinste et al. Report on Europe's Sign Languages. ELE Project Deliverable 1.40
CN114282530B (zh) 一种基于语法结构与连接信息触发的复杂句情感分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160504