CN1283937A - 一种使汉语数字化的技术 - Google Patents

一种使汉语数字化的技术 Download PDF

Info

Publication number
CN1283937A
CN1283937A CN 99109976 CN99109976A CN1283937A CN 1283937 A CN1283937 A CN 1283937A CN 99109976 CN99109976 CN 99109976 CN 99109976 A CN99109976 A CN 99109976A CN 1283937 A CN1283937 A CN 1283937A
Authority
CN
China
Prior art keywords
chinese
syllable
code
tone
compound vowel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 99109976
Other languages
English (en)
Inventor
陈有垦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 99109976 priority Critical patent/CN1283937A/zh
Publication of CN1283937A publication Critical patent/CN1283937A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

用一组五位数的数码代替一个汉字的音节,开头两位数(由0—4组成)代替声母,接着两位数(第一位数5—8,第二位数是0—9)代替韵母,末尾一位(是0—4)代替声调。只要稍懂拼音、按声母、韵母、声调代码表,都可以用数码输出或据数码译成语音、汉字。本技术适用于电讯通讯传呼领域。本技术可使现有的数字BP机变成“汉语数字BP机”,可了解对方所输出的汉语。

Description

一种使汉语数字化的技术
一个汉字是一个音节,一个音节一般由三部分组成:声母、韵母、声调。
我用一组五位数的数码代替一个汉字的音节,开头两位数代替声母,中间两位数代替韵母,末尾一位数代替声调。声母的两位数由0-4组合而成,韵母两位数第一位是5-8,第二位是0-9,声调由0-4代替(0为轻声)。例如:“您” (12692),12代替声母n,69代替韵母in,2代替阳平声(第二声)。这样,每个汉字(音节)都可以用一组五位数的数码代替。只要懂得拼音,凭声母、韵母、声调代码表,便可以写出每个语音的数码;同样,也可以把每一组数码译成语音(汉字)。本技术可用于电讯通讯传呼领域。
用数码代替汉字语音后,只要使用1230多组数字(语音),便可以囊括几千、上万个汉字。这是有很大的实用价值的。
汉语数字化。使现有的BP机变成“汉语数字BP机”或“接收电报机”了。对带数字BP机到偏僻无电话之处的另一方,不必回电话,便可译懂汉语了(只需要持有一张名片大小的代码卡就行了)。
为汉字写代码,要先定准该字的拼音,再查声母代码表、韵母代码表、声调代码表,并按声母代码、韵母代码、声调代码的顺序连接写出它们的代码,便是该汉字的数码了。例如:货已收到要先定拼音: 再查各个音节的代码,
Figure 9910997600033
声母h代码21,韵母uo代码75,(去声)代码4,
Figure 9910997600034
的数码是21754。已
Figure 9910997600035
属零声母,y代码42,韵母i代码63,已
Figure 9910997600036
数码是42633。同样可查出 代码32571、
Figure 9910997600038
代码10564,它们的数码是21754 42633 3257110564。
把数码译成汉字,得先译成音节,再确定汉字。例如:03511 42633 1056422641
03511中的03是声母,查表是m,51是韵母,查表是a,末尾1是声调,阴平声,这个音节是
Figure 9910997600041
汉字该是妈,42633的音节是 (已),10564中的10是声母d,56是韵母ao,第四声,它的音节是 汉字应是“到”,22641中的22是声母j,64是韵母ia,第一声,即
Figure 9910997600044
(家)。这四个汉字是:妈已到家。y、w打头的音节,y的代码42,w的代码43。例如:拥 的数码42621,我 数码43523。附y、w打头的音节:
ya yan yang yao ye yi ying yong you yu yuan
yue yun wa wai wang wei wen weng wo wu
a、e(er)、ai、ao、an、ang、en独自成音节时,属零声母,声母代码00,例如:安 00581,二 饿 的数码同是00534(韵母都取e的代码)。
如果表达事物数量时,就每位数隔开着写(隔开的长度为1个阿拉伯数字的位置)。例如:
25      日      到      10000元
25    33634    10564    1000042842
壹      万      元    (汉字数字可用数码表达)43631  43584    42842
对接收到的数码,如果是每个数字间隔开的,便是表示数量的数字,其后必有一组量词的数码。
对连继输出或另页另行的数码,辨别的方法是:韵母代码的第一位数(也即这组数码的中间一位数)必是5-8,它的前面两位数(每位数是0-4)便是声母代码;它与后面第一位数(0-9)合成为韵母代码;韵母代码后一位(0-4)便是声调代码。确定了第一组,便可确定第二、三……组。
图1为数码表;图2为声母代码表;图3为韵母代码表;图4为声调代码表。

Claims (1)

  1. “一种使汉语数字化的技术”是以数字代替音节的声母、韵母和声调,进而形成代替一个音节的一组数码。其特征是先传达语音,再理解汉字。因此,使用数码少(1230多组数码)、容量大(表达上万个汉字)。
CN 99109976 1999-07-07 1999-07-07 一种使汉语数字化的技术 Pending CN1283937A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 99109976 CN1283937A (zh) 1999-07-07 1999-07-07 一种使汉语数字化的技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 99109976 CN1283937A (zh) 1999-07-07 1999-07-07 一种使汉语数字化的技术

Publications (1)

Publication Number Publication Date
CN1283937A true CN1283937A (zh) 2001-02-14

Family

ID=5274289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 99109976 Pending CN1283937A (zh) 1999-07-07 1999-07-07 一种使汉语数字化的技术

Country Status (1)

Country Link
CN (1) CN1283937A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271610A (zh) * 2018-07-27 2019-01-25 昆明理工大学 一种汉字的向量表达方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271610A (zh) * 2018-07-27 2019-01-25 昆明理工大学 一种汉字的向量表达方法

Similar Documents

Publication Publication Date Title
US7801727B2 (en) System and methods for acoustic and language modeling for automatic speech recognition with large vocabularies
CN109522546A (zh) 基于上下文相关的医学命名实体识别方法
JP2006504173A (ja) 規模調整可能なニューラルネットワーク・ベースの、文書テキストからの言語同定
US20040267785A1 (en) Low memory decision tree
CN103294959B (zh) 一种抗统计分析的文本信息隐藏方法
CN102737105A (zh) 一种字典树生成方法及搜索方法
CN112800769A (zh) 命名实体识别方法、装置、计算机设备和存储介质
CN101833381A (zh) 一种手持设备通讯录的拼音反查方法
CN1283937A (zh) 一种使汉语数字化的技术
CN101517573A (zh) 表意文字数据库系统及其处理方法
CN100371987C (zh) 使汉字自动发音的方法及使手机朗读短消息的方法
Nuttall et al. Bias of the estimate of magnitude-squared coherence
Zahedi et al. Definiteness in sorani kurdish and english
CN114595665A (zh) 一种二进制极短码字符词编码集的构建方法
Park et al. Named entity recognition model based on neural networks using parts of speech probability and gazetteer features
CN100561469C (zh) 创建和使用中文语言数据和用户自纠正数据的方法和系统
Liang et al. An efficient algorithm to select phonetically balanced scripts for constructing a speech corpus
CN111428509A (zh) 一种基于拉丁字母的维吾尔语处理方法和系统
CN105511636A (zh) 全部汉字汉词简易无重码统一输入法改进
Zhou et al. A three-stage text normalization strategy for mandarin text-to-speech systems
GB1596411A (en) Translation system
Bashir et al. A word stemming algorithm for Hausa language
Kondraske et al. Character pattern recognition for a telecommunication aid for the deaf
JPH0334058A (ja) 漢字を使用する言語の音節入力語音逐次区切漢字逐次変換方式
CN201732370U (zh) 汉语语音数字化装置

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication