CN109086275A - 实现机器智能的方法和装置 - Google Patents
实现机器智能的方法和装置 Download PDFInfo
- Publication number
- CN109086275A CN109086275A CN201810635875.7A CN201810635875A CN109086275A CN 109086275 A CN109086275 A CN 109086275A CN 201810635875 A CN201810635875 A CN 201810635875A CN 109086275 A CN109086275 A CN 109086275A
- Authority
- CN
- China
- Prior art keywords
- byte
- bit
- code
- market bit
- overstaffs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title abstract description 18
- 238000012545 processing Methods 0.000 claims description 13
- 238000013518 transcription Methods 0.000 claims description 11
- 230000035897 transcription Effects 0.000 claims description 11
- 238000003672 processing method Methods 0.000 claims description 10
- 238000011017 operating method Methods 0.000 claims description 8
- 238000002372 labelling Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract 1
- 230000003340 mental effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 20
- 239000000284 extract Substances 0.000 description 18
- 238000013473 artificial intelligence Methods 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 11
- 230000001351 cycling effect Effects 0.000 description 5
- 230000004069 differentiation Effects 0.000 description 5
- 241000282326 Felis catus Species 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 241000282376 Panthera tigris Species 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
Abstract
实现机器智能(Machine Intelligence)的方法和装置MI(Machine Intelligence)是机器自身具有智能,具有解决问题的能力。MI之前,机器所体现出的智能,都是AI;离开AI,机器本身什么智能也没有。牛顿定律激发了机械革命,解放了人的体力。图灵测试的误导,使人深陷AI的囹圄;AI让机器貌似有智能,MI让机器真有智能;AI将人变为机器的奴隶;MI能激发机器革命,解放人的脑力,将人变回主人。MI时代来了,世界IT大反转、大洗牌的时刻到了;许多理论和技术都要消亡或重生、各种程序序言、标记性语言等将消亡……。真正科学是简单的;MI比AI简单百倍;它能让你在大反转、大洗牌中,具有超强的竞争力;处于遥遥领先地位。
Description
技术领域
本发明涉及数字数据处理领域。
背景技术
从计算机诞生以来,机器所体现出的智能,都是人工智能。离开人工智能,机器本身什么智能也没有,什么事情也干不了。
例如:如果没有人工智能为机器做自然语言理解,中文信息就无法处理;如果没有人工智能为机器做网页解析,就没有互联网;如果没有人工智能为机器做源程序解释或编译,所有的程序都无法运行。本文人工智能,是指:用人的智能为机器做翻译:如自然语言理解、网页解析和源程序解释或编译等。
机器智能,MI(Machine Intelligence),不同于人工智能,AI(ArtificialIntelligence)。
发明内容
数字数据实质上是比特序列;机器没有智能的根本原因在于:比特序列中不含机器区分对象的语义,也不含机器解析对象属性的语义;机器不懂得如何处理数据,即机器没有智能。
本发明的目的在于:让比特序列含有让机器能区分对象的语义;让比特序列含有机器能解析对象属性的语义;从而实现机器智能。
发明内容和具体实施方式
什么是机器智能;什么是智能
机器智能是机器自身具有的智能,即机器自身具有解决问题的能力;也就是,离开人工智能,机器自身所体现的智能。
机器之所以没有智能,是因为机器不懂得数据,不具有区分和解析数据的能力。
人具有区分和解析数据的能力,人有智能
例如:“会计师去银行开会”
数据对人来说,这是一个汉字串,是一个汉字字形串,人懂得字形,即认识汉字,人依据自己的知识、经验;人具有区分和解析能力,这就是人的智能,人的智能具有将这个汉字串区分为词对象的能力,具有解析汉字语音的能力。
例如:人能将上面汉字串区分为以下词对象:
“会计师去银行开会”
对机器来说,数据是一个比特串,一个字节序列。这句话是一个汉字编码序列。
对“会计师去银行开会”,机器不具有将一个字节序列区分为字节组的能力;即不具有分词能力,也不具有解析汉字语音的能力。
从计算机诞生以来,机器具有存、取和计算数据的能力;但是,没有区分和解析数据的能力;机器没有智能。因此,必须借助于人工智能为机器理解和翻译。
以下介绍,如何让机器具有记忆语义、关联、区分和解析能力,如何实现机器智能。
(一)如何让机器具有区分对象和解析对象的智能
个汉字编码(GB2312)为2字节,每个字节的最左一位用作标记位,均置为1;ASCHII码是1字节,最左一位也用作标记位,置为0。
这种用作标记的比特,称作标记比特。标记比特的取值也为0或1;但是,0或1不用作数值,仅用作标记。
这里的标记比特,使机器具有了区分汉字编码与SCHII编码的能力。但是,不具有将一个字节序列区分为字节组的能力。
通过标记比特与字节组相关联,字节组与对象相关联,让机器具有区分对象的能力;标记比特能使字节序列关联作者的语义,让机器能将作者的语义解析出来。
一种二进制比特序列数字数据的处理方法,在一个二进制比特字节序列中,一个或多个字节对应一个对象;与对象相对应的字节称为字节组;由于字节序列中不含区分字节组的信息,对象难以区分;其特征在于:每个字节的最左比特,用作标记比特,标记比特的0或1用作标记;其特征还在于至少包含以下步骤之一:
建立标记比特与字节组相关联的步骤:
设字节序列的字节组含有(n+1)字节,n=0,或正整数;通过标记比特关联字节组的步骤如下;
如果n不等于0,则将最右字节的标记比特置为0;其余n字节的标记比特置为1;
如果n=0;则将这个字节的标记比特置为0;
区分字节组步骤;通过扫描字节序列的标记比特区分字节组,根据三种不同情况,选择以下扫描区分字节组步骤:
从左向右扫描字节序列的标记比特区分字节组步骤;
如果第1个标记比特为1,继续扫描,直到为0的标记比特,则从第一个为1的标记比特的字节,到为0的标记比特字节,被区分为1个字节组;
如果第1个标记比特为0,则标记比特为0的字节被区分为1个字节组;
从区分出的字节组的右边字节,按上述规则,继续扫描和区分,直至序列结束,或至字节序列的某个字节组;
从右向左扫描字节序列的标记比特区分字节组步骤;
如果第1个标记比特为1,继续扫描,直到为0的标记比特;
继续扫描,如果下一个标记比特为0;则上一个标记比特为0的字节,被区分为一个字节组;
如果下一个标记比特为1,继续扫描,直到为0的标记比特;则从上一个为0的标记比特的字节,到下一个为0的标记比特的右边字节,被区分为1个字节组;
从区分出的字节组的左边字节,按上述规则,继续扫描和区分,直至序列结束,或至字节序列的某个字节组;
从字节序列某一个中间比特标记区分字节组的步骤:
区分第1个字节组的步骤如下:
如果这个中间标记比特为1,则从这个标记比特向左扫描:
如果下一个标记比特为1,继续向左扫描,直到为0的标记比特,
然后,向右扫描,直到为0的标记比特;
则将左边为0标记比特的字节的右边字节,到右边为0标记比特的字节,被区分为第1个字节组;
如果这个中间标记比特为0,则从这个标记比特向左扫描:
如果左边标记比特为0,则这个中间标记比特为0的字节,被区分为第1个字节组;
如果左边标记比特为1,继续向左扫描,直到为0的标记比特;则将左边为0标记比特的字节的右边字节,到右边第一个为0标记比特的字节,被区分为第1个字节组;
区分第1个字节组右边的字节组,按从左向右扫描区分字节组步骤区分;
区分第1个字节组左边的字节组,按从右向左扫描区分字节组步骤区分。
上述方法以装置方式描述如下。
一种二进制比特序列数字数据的处理的装置, 该装置的二进制比特字节序列中,一个或多个字节对应一个对象;与对象相对应的字节称为字节组;由于字节序列中不含区分字节组的信息,对象难以区分;其特征在于:每个字节的最左比特,用作标记比特,标记比特的0或1用作标记;其特征还在于:该装置包含以下装置之一:
建立标记比特与字节组相关联装置;
设该装置字节序列的字节组含有(n+1)字节,n=0,或正整数;通过标记比特关联字节组的步骤如下;
如果n不等于0,则将最右字节的标记比特置为0;其余n字节的标记比特置为1;
如果n=0;则将这个字节的标记比特置为0;
区分字节组装置;该装置通过扫描字节序列的标记比特区分字节组;根据三种不同情况,该装置至少含有以下三种装置之一:
从左向右区分字节组装置;
该装置从左向右扫描字节序列的标记比特,含有以下操作步骤:
如果第1个标记比特为1,继续扫描,直到为0的标记比特,则从第一个为1的标记比特的字节,到为0的标记比特字节,被区分为1个字节组;
如果第1个标记比特为0,则标记比特为0的字节被区分为1个字节组;
从区分出的字节组的右边字节,按上述规则,继续扫描和区分,直至序列结束,或至某个字节组;
从右向左区分字节组装置;
该装置从右向左扫描字节序列的标记比特,含有以下操作步骤:
如果第1个标记比特为1,继续扫描,直到为0的标记比特;
继续扫描,如果下一个标记比特为0;则上一个标记比特为0的字节,被区分为一个字节组;
如果下一个标记比特为1,继续扫描,直到为0的标记比特;则从上一个为0的标记比特的字节,到下一个为0的标记比特的右边字节,被区分为1个字节组;
从区分出的字节组的左边字节,按上述规则,继续扫描和区分,直至序列结束,或至字节序列的某个字节组;
从字节序列中间的某个比特标记区分字节组装置;
该装置含有以下操作步骤:
区分第1个字节组的步骤如下:
如果这个中间标记比特为1,则从这个标记比特向左扫描:
如果下一个标记比特为1,继续向左扫描,直到为0的标记比特,
然后,向右扫描,直到为0的标记比特;
则将左边为0标记比特的字节的右边字节,到右边为0标记比特的字节,被区分为第1个字节组;
如果这个中间标记比特为0,则从这个标记比特向左扫描:
如果左边标记比特为0,则这个中间标记比特为0的字节,被区分为第1个字节组;
如果左边标记比特为1,继续向左扫描,直到为0的标记比特;则将左边为0标记比特的字节的右边字节,到右边第一个为0标记比特的字节,被区分为第1个字节组;
区分第1个字节组右边的字节组,用从左向右扫描区分字节组装置区分;
区分第1个字节组左边的字节组,用从右向左扫描区分字节组装置区分。
一个字节组对应一个对象,区分字节组,就是区分对象。
上面的“其特征还在于该装置至少包含以下装置之一:”,不是:“其特征还在于包含以下装置:”
;因为,保护范围会缩小。
一个中文词对象是一个2字节、4字节、6字节,……,的字节组,由于字节序列中不含区分字节组的比特信息,词对象难以区分,即机器本身没有能力区分词对象,以下是机器智能中文分词实例。
“乒乓球拍卖完了”,假定作者的分词意图为:“乒乓球,拍卖,完,了”
作者按词输入(或编辑)时,机器按照标记比特标注规则,根据作者的分词意图,对字节组作标注,让机器记住作者的意图。
“乒乓球拍卖完了”,这个字节串为14字节。作者按照分词意图:“乒乓球,拍卖,完,了”,分别输入4个词。1个词为1个字节组。机器按照标记比特标注规则,对每1个字节组的标记比特,标注如下:
对第1个字节组,6个字节的标记比特,分别标注为:1,1,1,1,1,0;
对第2个字节组,4个字节的标记比特,分别标注为:1,1,1,0;
对第3个字节组,2个字节的标记比特,分别标注为: 1,0;
对第4个字节组,2个字节的标记比特,分别标注为: 1,0。
标注前后的字节序列如图1(a)所示。
标注后的字节串和对应的标记比特如图1(b)所示;实验实例如图2所示。
机器根据标记比特扫描规则,区分字节组,将作者的意图解析出来
用户获取数据时,机器根据标记比特扫描规则,区分出每个字节组,1个字节组对应1个词对象。
根据标记比特扫描规则,扫描图2标记比特:0号标记比特为1,继续扫描, 1号标记比特为1,继续扫描,2号标记比特为1,继续扫描,3号标记比特为1,继续扫描,4号标记比特为1,继续扫描,5号标记比特为0;因此,0、1、2、3、4、5号字节被区分为1个字节组;这个字节组,对应词对象“乒乓球”;
继续扫描:6号标记比特为1,继续扫描, 7号标记比特为1,继续扫描,8号标记比特为1,继续扫描,9号标记比特为0;因此,6、7、8、9字节被区分为1个字节组;这个字节组,对应词对象“拍卖”;
继续扫描:a号标记比特为1,继续扫描, b号标记比特为0;因此,a、b字节被区分为1个字节组;这个字节组,对应词对象“完”;
继续扫描:c号标记比特为1,继续扫描, d号标记比特为0;因此,c、d字节被区分为1个字节组;这个字节组,对应词对象“了”。
扫描完毕,机器分词结果与作者输入的分词意图:“乒乓球,拍卖,完,了”,完全一样。
通过标记比特扫描,让机器具有将一个字节序列区分为字节组的能力,具有区分词的能力;机器具有了区分对象的能力,所以机器有了智能。
实例中,朗读这句话时,机器在两个词对象之间,增加了停顿,用户通过时间间隔,能区分词对象。
作者在创建文档(如输入或编辑)时,根据标记比特标注规则,标注比特标记:让机器将作者表达的精确分词意图存储起来,让机器具有了对作者意图的记忆能力。
用户获取数据时,根据标记比特扫描区分规则,扫描含有标记比特的字节串,让机器具有了获取作者意图的能力。
符合字节组标记比特标注规则的比特标记,称作Ubit(Ultra-bit,超比特)。超比特能使机器具有将一个字节序列区分为字节组的能力。
含有超比特的字节组;称作Ucode(Ultra-code,超编码)。区分字节组的扫描步骤,又称作超比特扫描区分规则。超编码是机器可区分的编码。一个超编码的长度为n个字节,n为正整数,即每个编码可以任意长。
标记比特与字节组相关联,即超比特与超编码相关联;通过扫描字节序列的标记比特区分字节组,即通过扫描超比特区分超编码。
在一个超编码序列中,超比特使得机器具有了区分不同长度编码的能力。上例,将“乒乓球拍卖完了”的汉字编码序列,通过超比特,将作者的分词意图:“乒乓球,拍卖,完,了”与超编码相关联。这里,超编码序列的4个超编码长度分别为6,4,2,2字节。实验实例如图2所示。
以上用超编码关联词对象;以下介绍如何关联对象或对象属性,机器如何区分对象和解析对象的属性。
(二)如何让机器具有区分对象和解析对象属性的智能
以HTML语言为例,网页的图形对象的三个基本属性,在网页上用标签和字符串标记和描述如下:
”红棕马.jpg” ALT=”¤红棕马¤”>
由于机器不懂得这些标签,不懂得如何区分对象,也不懂得如何解析对象的属性,因为对象的属性没有与机器懂的编码相关联。
以下通过对象或对象属性与超编码的关联,使得机器具有了区分对象和解析对象的能力。具体方法和装置如下:
一种二进制比特序列数字数据的处理方法,其特征在于:二进制比特字节序列为超编码序列;其特征还在于:至少包含以下步骤之一:
建立对象或对象属性与超编码的关联步骤;
建立对象与超编码相关联;一个对象与一个超编码相关联;
建立对象属性与超编码或部分超编码相关联,生成对象和属性与超编码的关联关系;
解析对象或对象属性包含以下步骤:
通过扫描字节序列的超比特,区分超编码,区分对象;
根据对象属性与超编码或部分超编码的关联关系,解析对象的属性。
上面的“其特征还在于至少包含以下步骤之一:”,不是:“其特征还在于包含以下步骤:”
;因为,保护范围会缩小。
上述方法以装置方式描述如下。
一种二进制比特序列数字数据的处理装置,其特征在于:该装置含有超编码序列;其特征还在于:至少包含以下装置之一:
建立对象或对象属性关联装置,该装置用于将对象或对象属性与超编码相关联;该装置包含以下装置:
建立对象与超编码相关联装置;一个对象与一个超编码相关联;
建立对象属性与超编码或部分超编码相关联装置,该装置含有对象属性与超编码的关联关系;
解析对象属性装置,该装置包含:
通过区分超编码区分对象的装置;该装置通过扫描字节序列的超比特,区分超编码,区分对象;
解析对象属性装置:根据对象属性与超编码或部分超编码的关联关系,解析对象的属性。
上面的“其特征还在于该装置至少包含以下装置之一:”,不是:“其特征还在于包含以下装置:”;因为,保护范围会缩小。
这里的“关联”有多种方式,例如:
第一,将对象或对象属性存储或嵌入到超编码;例如词对象中汉字的显示属性和语音属性;超编码或部分超编码直接指向对象或对象属性;这是一种直接关联方式;
第二,超编码或部分超编码存储的是指针,指向对象或对象属性的关联关系,由关联关系,机器能解析对象属性;这是间接关联关系。
这里的部分超编码是指:超编码中的1个或多个比特,一个或多个字节。
这里对象属性包含:
机器能懂得属性,机器能翻译给人的语义:如汉字的字形和语音;
机器能懂的属性,但无需翻译给人的语义。
实验实例:机器智能互联网实验网页实例
对象或对象属性的关联步骤
对象或对象属性与超编码或部分超编码相关联步骤的实例;
图像对象具有三个属性,将图像用1个3字节超编码“F1 A2 7C”相关联,第1字节,存储对象种类属性,这里的“F1”存储的是图像对象。这个超编码关联图像的显示属性。超编码的 2、3字节,关联图像的超链接为:”红棕马.jpg”。
图像、音频和视频对象与超编码的关联关系,如图3所示;图像、音频和视频对象,用3个字节的超编码关联或存储。超编码关联对象的显示属性,显示属性是为了让人懂的属性。例如:类似五线谱的符号∮表示音频;如:∮致爱丽丝∮;类似放映机的符号♂表示视频;如:♂猫和老鼠10♂;符号¤表示图像,如:¤红棕马¤。注意:这些符号,仅用来帮助人区分不同对象。
字节超编码分为两部份,第1字节用来关联对象的种类属性,例如:F1、F2、F3分别关联图像、音频和视频对象;它具有区分128种对象的能力。第2、3字节用来关联超链接属性。
机器解析对象或对象属性的步骤
根据对象或对象属性与超编码或部分超编码的的关联关系,机器区分对象和解析对象属性的步骤如下。
仍以图像为例,图3中,3字节超编码为,F1 A2 7C
机器根据图3的关联关系,根据该超编码关联的显示属性:¤红棕马¤;机器将该超编码在网页上显示为:¤红棕马¤;
该超编码的第1字节为F1,机器懂得该超编码对象的种类属性为图像对象;
该超编码的第2、3字节,关联的是对象的超链接属性,机器从服务器调取文件,显示该图像。
一个机器智能互联网实验网页
对象创建时,机器将作者的意图与超编码相关联
各种对象均通过一个输入法接口输入或编辑,将作者分词和语音意图与超编码相关联, 将图像、音频和视频等对象以及对象的属性与超编码相关联。
部分图像、音频和视频对象的超编码如图4(a)的第一行所示;超编码的关联关系如图3所示。
关联关系的建立有多种方式:
如,静态方式,由创建人事先建立。
又如:动态建立:,在创建过程中,自动建立。
网页输入或编辑完毕,生成超编码文件,一个超编码序列,如图4(a)所示。
在图4(a)的超编码中,偶数字节,如2字节为1字词,4字节为2字词,6字节为3字词,以此类推;其中的汉字编码与GB2312兼容(也可与日、韩、Unicode等各种语言字符兼容)。1字节超编码是ASCHII码字符,超编码与ASCHII码相同。图4(a)的超编码中,含有1、2、3、4、6字节不同长度的编码,机器具有区分不同长度超编码的能力;不同对象的编码相互兼容,互不冲突。机器还具有区分不同种类对象及对象属性的能力。5、7、9字节等长度的超编码可用于其他对象,例如:IP地址。
机器根据标记比特扫描规则,扫描图4网页(a) 超编码序列的标记比特, 区分超编码,解析超编码所关联的显示属性,显示网页。
机器将超编码序列对象的显示属性显示出来,看上去是一个字符串,实际是一个对象串,如图4(b)所示。
当用户访问网页时,将网页超编码文件下载到客户端。机器根据标记比特扫描规则,扫描超编码文件,00行:0-2为1个3字节的超编码;查询关联关系表(图3),查得该超编码关联的显示属性为:∮致爱丽丝∮;机器将此显示在客户端;同理,00行:3-5为1个3字节的超编码,查得该超编码关联的显示属性为:♂黑虎1♂;00行:6-8为1个3字节的超编码,查得该超编码关联的显示属性为:♂猫和老鼠10♂;00行:9-b 为1个3字节的超编码,查得该超编码关联的显示属性为:¤红棕马¤;00行:e-f为1个4字节的超编码,这是1个中文2字词,根据汉字编码,将字形显示为“乒乓”,00行显示完毕;其余省略。整个文件扫描完毕,机器智能将文件在客户端显示出来,如图4(b)所示。
当用户获取网页的对象时,机器根据标记比特扫描规则,扫描图4网页(a) 超编码序列的标记比特,识别和解析超编码,根据所关联的属性,解析网页;根据不同对象,以不同的方式“播放”。
实验实例中,如果用户选择“播放”网页所有的对象,机器扫描过程与上面类似,简述如下:
机器根据标记比特扫描规则,扫描该文件,00行:0-2为1个3字节的超编码,根据关联关系表,查得该超编码的种类字节为:F2,为音频对象;超编码的第2、3字节关联超链接为:“致爱丽丝.mp3”;机器从服务器调取该音频文件,用音频播放器播放该文件; 00行:3-5为1个3字节的超编码,查得该超编码的种类字节为:F3,为视频对象;超编码的第2、3字节关联超链接为:“黑虎1.mp4”;机器从服务器调取文件,用视频播放器播放该文件; 00行:6-8为1个3字节的超编码,为视频对象,机器从服务器调取文件,用视频播放器播放该文件;00行:9-b 为1个3字节的超编码,为图像对象,机器从服务器调取文件,显示该图像;00行:e-f为1个4字节的超编码,这是1个中文2字词,根据组成超编码的汉字编码与汉字语音的关联关系,机器解析其语音,播放语音;以此类推。
(三)如何让机器具有区分算法或程序的对象、解析算法或程序的对象和运行算法或程序的智能
现有的算法或程序都是用字符描述的,机器不懂得如何区分其中的对象,不懂得如何解析对象的语义,也不懂得如何执行;因此必须经过人工智能帮助机器翻译,这里的翻译称作编译或解释。
以下是机器智能如何能具有区分算法或程序的对象、解析算法或程序的对象和运行算法或程序的智能。
一种二进制比特序列数字数据的处理方法,其特征在于:比特字节序列为超编码序列,其特征还在于:至少包含以下步骤之一:
建立算法或程序的对象或对象属性与超编码的关联步骤;
建立对象与超编码相关联步骤;一个对象与一个超编码相关联;
建立对象属性与超编码或部分超编码相关联,生成对象和属性与超编码的关联关系;
解析算法或程序的对象或对象属性包含以下步骤:
通过扫描字节序列的超比特,区分超编码,区分对象;
根据对象属性与超编码的关联关系,解析对象或对象属性步骤。
机器边解析边运行步骤;该步骤包含以下步骤;
通过扫描字节序列的超比特,区分超编码,区分对象;
根据对象属性与超编码的关联关系,解析对象或对象属性,并运行算法或程序;
生成可执行文件步骤;包括:
通过扫描字节序列的超比特,区分超编码,区分对象;
根据对象属性与超编码的关联关系,解析对象或对象属性,并生成可执行文件。
上面的“其特征还在于至少包含以下步骤之一:”,不是:“其特征还在于包含以下步骤:”;因为,保护范围会缩小。
以下是上述方法描述为装置方式。
一种二进制比特序列数字数据的处理装置,其特征在于:比特字节序列为超编码序列;其特征还在于:至少包含以下装置之一:
算法或程序的对象或对象属性与超编码的关联装置;包括:
建立对象与超编码相关联装置;一个对象与一个超编码相关联;
建立对象属性与超编码或超编码的部分相关联装置;
机器运行装置;该装置包含以下装置之一;
边解析边运行装置;该装置包括:
通过区分超编码区分对象装置;
根据对象属性与超编码的关联关系,解析对象或对象属性,并运行的装置;
生成可执行文件装置;该装置包括以下装置:
通过区分超编码区分对象装置;
可执行文件装置:根据对象属性与超编码的关联关系,解析对象属性,并生成可执行文件。
上面的“其特征还在于该装置至少包含以下装置之一:”,不是:“其特征还在于包含以下装置:”;因为,保护范围会缩小。
一个机器智能算法或程序示例:程序的创建和运行
机器智能程序的创建
假定作者输入以下程序: y = a+ b * c
在创建过程,机器提示输入变量名称(即显示属性),选择变量的类型;在算法或程序的创建过程中,机器将对象或对象属性与超编码相关联。关联步骤如下:
程序含4个变量,设置一临时变量: buffer。
每一个变量用1个超编码存储,创建过程根据人机交互,生成一个变量与变量属性与超编码的关联关系,如图5所示。这里12表示变量类型为长整型(4字节)
程序含3个运算符,一个运算符对应1个超编码,运算符与运算符属性与超编码的关联关系由系统定义,如图6所示。
对象或对象属性与超编码相关联关系,如图5-6所示。
程序创建完毕,生成一个机器懂得如何运行的程序,一个超编码序列,如下:
机器智能程序的运行
机器运行方式有两种:
第一,边解析边运行的方式;这类似现有的解释运行
第二,解析超编码序列所有的对象或对象属性,生成执行文件运行;这类似现有的编译运行。
机器运行程序,即运行一个Ucode序列。以下是边解析边运行的方式的说明。
机器区分Ucode,并根据对象或对象属性与Ucode的关联关系,解析对象或对象属性,运行程序。
程序创建完毕,机器解析对象的显示属性,程序显示如下:
下面说明程序的执行过程。
对于变量对象,根据其种类配置存储空间,如图5所示。
图5的存储地址,也可在运行时,根据变量的类型,动态配置。
根据对象的种类,机器区分出运算符对象,并比较运算符的优先级;
,Ucode22 ,Ucode23 分别对应运算符 = ,+ ,* ;Ucode23 ( * ) 优先级为3,最高; 其前后变量分别为Ucode13 ,Ucode14 ;机器分别从地址:0x0008,0x000C 取出4个字节,根据对应的机器指令,做乘法运算,将结果存入临时变量buffer,地址:0x000F;然后,比较剩下的运算符Ucode21 , Ucode22 ( = ,+)的优先级;Ucode22 ( +)的优先级高,因此,机器将buffer的运算结果与Ucode12(地址:0x0004)的数值做加法运算。剩下的运算符Ucode21 ( = );机器将前面的运算结果存储到变量Ucode11 的地址:0x0000。然后,机器根据变量Ucode11和运算符 Ucode21的显示属性,将计算结果显示出来。
假定各个变量的初始值如图7所示,则机器的显示结果为:
(四)如何实现让机器具有处理中文语音的智能
这里,汉字属性主要指:字形和语音。
汉字语音的表达方法分为三种:
• 语音编码
汉字语音编码为2字节,11比特为拼音编码,3比特为音调编码。见图8。
• 拼音
拼音可有以下显示方式:只显示拼音字母,拼音字母中含带声调的字符,拼音字母中含表示声调的数字等
• 发音
发音指用音频表示的语音。
现有中文数据的处理过程中,只将编码与字形相关联,机器根据汉字编码的值,能够将字形显示出来;但是,机器不懂得汉字的语音。
以下机器在处理中文过程中,不仅将汉字编码与其字形相关联,而且,还要与语音相关联;因此,机器不仅懂得汉字对象的字形,还懂得汉字对象的语音。
一种二进制比特序列数字数据的处理方法,设一个汉字多音字含n+1个语音,n为正整数,将多音字的编码增加n个,其特征在于:该处理方法中含有汉字语音编码库、语音编码拼音库和语音编码发音库;或含有汉字拼音库和汉字发音库;其特征还在于:至少包含以下步骤之一:
建立汉字编码与字形属性和语音属性相关联步骤;
通过选择正确语音所对应的汉字,使汉字编码的值与汉字的字形和汉字的语音相关联;
解析汉字属性步骤,该步骤包含以下步骤:
根据汉字编码的值与字形属性的关联关系,解析汉字编码字形属性的步骤;
根据汉字编码的值与语音属性的关联关系,解析汉字编码语音属性的步骤。
汉字语音编码库、语音编码拼音库和语音编码发音库;或汉字拼音库和汉字发音库;见:图8汉字语音编码示意图;图9汉字编码与字形关系示意图;图10汉字编码与语音编码关系示意图:图11汉字语音编码与拼音关系示意图;图12 汉字语音编码与音频关系示意图;图13汉字编码与拼音关系示意图;图14汉字编码与音频关系示意图。
上面的“其特征还在于至少包含以下步骤之一:”,不是:“其特征还在于包含以下步骤:”;因为,保护范围会缩小。
具体解析步骤如下:
解析汉字字形步骤;
机器根据汉字编码的值,从汉字字形库中提取汉字的字形;
解析汉字拼音步骤1;
机器根据汉字编码的值,从语音编码库中提取语音编码;根据语音编码的拼音编码部分,从语音编码拼音库中提取汉字的拼音;根据语音编码的声调编码部分,解析汉字拼音的声调;
解析汉字发音步骤1;
机器根据汉字编码的值,从汉字语音编码库中提取汉字语音编码;根据语音编码的值,从语音编码发音库中提取汉字的发音;
解析汉字拼音步骤2;
机器根据汉字编码的值,从汉字拼音库中提取汉字的拼音;
解析汉字发音步骤2;
机器根据汉字编码的值,从汉字发音库中提取汉字的发音。
上面的“其特征还在于至少包含以下步骤之一:”,不是:“其特征还在于包含以下步骤:”;因为,保护范围会缩小。
以下是装置描述方式
一种二进制比特序列数字数据的处理装置,其特征在于:设一个汉字多音字含n+1个语音,n为正整数,将多音字的编码增加n个,其特征在于:该处理装置含有汉字语音编码库、语音编码拼音库和语音编码发音库;或含有汉字拼音库和汉字发音库;其特征还在于:至少包含以下装置之一:
建立汉字编码与字形属性和语音属性相关联的装置;
该装置通过选择正确语音所对应的汉字,使汉字编码的值与汉字的字形和汉字的语音相关联;
根据汉字编码与汉字属性的关联关系,解析汉字属性的装置;该装置包括:
根据汉字编码与汉字属性的关联关系,解析汉字编码字形属性的装置;
根据汉字编码与汉字属性的关联关系,解析汉字编码语音属性的装置。
具体解析装置如下:
解析汉字字形装置;
机器根据汉字编码的值,从汉字字形库中提取汉字的字形;
解析汉字拼音装置1;
机器根据汉字编码的值,从语音编码库中提取语音编码;根据语音编码的拼音编码部分,从语音编码拼音库中提取汉字的拼音;根据语音编码的声调编码部分,解析汉字拼音的声调;
解析汉字发音装置1;
机器根据汉字编码的值,从汉字语音编码库中提取汉字语音编码;根据语音编码的值,从语音编码发音库中提取汉字的发音;
解析汉字拼音装置2;
机器根据汉字编码的值,从汉字拼音库中提取汉字的拼音;
解析汉字发音装置2;
机器根据汉字编码的值,从汉字发音库中提取汉字的发音。
上面的“其特征还在于该装置至少包含以下装置之一:”,不是:“其特征还在于包含以下装置:”;因为,保护范围会缩小。
实验实例:
图15为“好事又读好事”,汉字编码与语音属性和字形属性相关联实验实例。
输入第一个“好”,是4声,选择“3”的“好事” (a,b,c,d,e分别对应于1,2,3,4声和轻声)。输入第2个“好事”,“好”是3声,选择“2”的“好事”。
图16 是图15实验实例的解析结果。
当用户获取数据时,机器根据汉字编码关联的语音属性和字形属性,解析字形和语音,解析的结果与作者的意图一致。
机器靠自身智能自动标注汉字的拼音,自动朗读,解析结果与作者的意图完全相同。
图17 实验实例:让机器具有区分中文词和解析汉字语音属性的能力
“会计师骑自行车去银行开会”
作者按词输入(或编辑),机器将作者分词和语音意图,与超编码相关联,让机器记住作者的意图
作者用拼音输入:“kuaijishi qi zixingche qu yinhang kaihui”
这里,即输入了分词信息,又输入了语音信息。
输入完毕,虽然显示的是:“会计师骑自行车去银行开会”;仍然是12个汉字(24个字节),却存储了作者正确的分词信息和语音信息。
这句话存储为6个超编码,每个超编码由组成词的汉字编码组成。
本实例中,每一个汉字的语音与相应的编码相关联,本例多音字“会,行,行,会”的正确语音与相应的编码相关联:“kuai, xing, hang, hui”(实际上,包含正确的音调)
例如:图17中,第一个“会”和最后一个“会”,对应的编码不同;关联的字形属性相同,但关联的语音属性不同。第一个编码“AD F0”关联的语音为“kuai”,而最后一个编码“BB61”关联的语音为“hui”。同理,图中第一个“行”和最后一个“行”的编码不同,关联的字形属性相同,但关联的语音属性不同。
图17中:“会计师骑自行车去银行开会”,超比特标注后存储的字节串,仍然是24个字节。
机器根据超编码,解析的分词为:“会计师骑自行车去银行开会”,与作者的意图一致。
机器根据超编码的汉字编码与语音的关联关系,解析的语音与作者的意图也一致。
如果,用户输入“hui”查询,查到的是“开会”;但是,查不到“会计师”,因为“会计师”中没有“hui”的语音。
附图说明
图1. 标注字节组和区分字节组示意图
根据作者的意图将字节序列标注为字节组序列示意图
通过标注,建立标记比特与字节组相关联。
通过扫描标记比特区分字节组,区分中文词对象示意图
图2 通过超编码与词对象及属性相关联实例
这里的词对象为:“乒乓球,拍卖,完,了”,每个词对象与一个超编码相关联,超编码中两个字节为一个汉字编码,关联了汉字的字形属性和语音属性。
根据超编码和词对象的关联关系,机器能区分词对象,能解析词对象的显示属性和语音属性。
机器具有区分超编码的能力,因此,具有了区分词的能力,其分词结果用不同颜色标注出来,
机器的区分和解析,与作者的意图一致。
图3 图像、音频和视频对象与超编码的关联关系示意图
网页的图像、音频和视频对象,用3个字节的超编码关联。超编码关联对象显示属性,例如:类似五线谱的符号∮表示音频;如:∮致爱丽丝∮;类似放映机的符号♂表示视频;如:♂猫和老鼠10♂;符号¤表示图像,如:¤红棕马¤。注意:这些符号,仅用来帮助人区分不同对象的。
字节超编码分为两部份,第1字节和第2、3字节,用来关联对象的种类属性,例如:F1、F2、F3分别关联图像、音频和视频对象。它具有区分128种对象的能力。第2、3字节,用来关联超链接属性。
图4 一个机器智能互联网实验网页
网页对应的超编码序列: 含有1、2、3、4、6字节不同长度的编码
网页的显示:对象的显示属性表示的对象串:包括音频、视频、图像,中文词对象、英文字符对象。
图5 变量与变量属性与超编码的关联关系示意图
图6 系统定义的运算符与运算符属性与超编码的关联关系示意图
程序含3个运算符,一个运算符对应1个超编码,运算符属性与超编码的关联关系由系统定义。
图7 变量的超编码,地址、初始值和最终值示意图
图 8. 汉字语音编码示意图
汉字语音编码为2字节,11比特为拼音编码,3比特为音调编码。要使语音编码与现有汉字编码能兼容,则每个字节的0比特可为1;要使语音编码与超编码能兼容,则第一个字节的0比特为1;第二个字节的0比特为0。要使语音编码与现有控制字符不冲突,则每个字节的1比特可置为1。
图9 汉字编码与字形关系示意图
每个汉字编码对应字形库的一个字形,通过汉字编码的值,机器能提取汉字的字形。其中扩展汉字编码为新增汉字编码。
图10 汉字编码与语音编码关系示意图
每个汉字编码对应语音编码库的一个2字节的语音编码;通过汉字编码的值,机器能提取汉字的语音编码,通过语音编码的值,借助于汉字语音编码与拼音关系;汉字语音编码与音频关系;机器能解析汉字的语音:生成拼音加声调,或者生成发音。其中扩展汉字编码为新增汉字编码。
图11 汉字语音编码与拼音关系示意图
每个语音编码对应相应拼音库中相应的拼音字母,通过汉字语音编码的值,机器能提取汉字的拼音;根据语音编码关联的3比特声调值,生成声调。
图12 汉字语音编码与音频关系示意图
每个汉字语音编码对应发音库的一个音频,通过汉字语音编码的值,机器能提取汉字的发音。
图13 汉字编码与拼音关系示意图
每个汉字编码对应拼音库的相应汉字的拼音字母和声调;通过汉字编码的值,机器能提取汉字的拼音字母和声调。其中扩展汉字编码为新增汉字编码。
图14 汉字编码与发音音频关系示意图
每个汉字编码对应发音库的一个音频;通过汉字编码的值,机器能提取汉字的音频。其中扩展汉字编码为新增汉字编码。
图15实验实例:汉字的语音和字形与汉字编码相关联
输入第一个“好”,是4声,选择“3”的“好事” (a,b,c,d,e分别对应于1,2,3,4声和轻声)。输入第2个“好事”,“好”是3声,选择“2”的“好事”。
图16图15实验实例中:机器解析汉字编码的语音属性,自动标注拼音
图17实验实例:让机器具有区分中文词和汉字语音属性的超编码
超编码与词对象及属性相关联;超编码中的汉字编码与汉字的语音和字形属性相关联
这里的词对象为:“会计师骑自行车去银行开会”,每个词对象与一个超编码相关联,其中两个字节为一个汉字编码,关联了汉字的字形属性和语音属性。
根据超编码和词对象的关联关系,机器能区分词对象,能解析词对象的显示属性(字形属性)和语音属性。
机器的区分和解析,与作者的意图一致。
Claims (8)
1.一种二进制比特序列数字数据的处理方法,在一个二进制比特字节序列中,一个或多个字节对应一个对象;与对象相对应的字节称为字节组;由于字节序列中不含区分字节组的信息,对象难以区分;其特征在于:每个字节的最左比特,用作标记比特,标记比特的0或1用作标记;其特征还在于至少包含以下步骤之一:
1)建立标记比特与字节组相关联的步骤:
设字节序列的字节组含有(n+1)字节,n=0,或正整数;通过标记比特关联字节组的步骤如下;
如果n不等于0,则将最右字节的标记比特置为0;其余n字节的标记比特置为1;
如果n=0;则将这个字节的标记比特置为0;
2)区分字节组步骤;通过扫描字节序列的标记比特区分字节组,根据三种不同情况,选择以下扫描区分字节组步骤:
[1]从左向右扫描字节序列的标记比特区分字节组步骤;
如果第1个标记比特为1,继续扫描,直到为0的标记比特,则从第一个为1的标记比特的字节,到为0的标记比特字节,被区分为1个字节组;
如果第1个标记比特为0,则标记比特为0的字节被区分为1个字节组;
从区分出的字节组的右边字节,按上述规则,继续扫描和区分,直至序列结束,或至字节序列的某个字节组;
[2]从右向左扫描字节序列的标记比特区分字节组步骤;
如果第1个标记比特为1,继续扫描,直到为0的标记比特;
继续扫描,如果下一个标记比特为0;则上一个标记比特为0的字节,被区分为一个字节组;
如果下一个标记比特为1,继续扫描,直到为0的标记比特;则从上一个为0的标记比特的字节,到下一个为0的标记比特的右边字节,被区分为1个字节组;
从区分出的字节组的左边字节,按上述规则,继续扫描和区分,直至序列结束,或至字节序列的某个字节组;
[3]从字节序列某一个中间比特标记区分字节组的步骤:
A.区分第1个字节组的步骤如下:
如果这个中间标记比特为1,则从这个标记比特向左扫描:
如果下一个标记比特为1,继续向左扫描,直到为0的标记比特,
然后,改为向右扫描,直到为0的标记比特;
则将左边为0标记比特的字节的右边字节,到右边为0标记比特的字节,被区分为第1个字节组;
如果这个中间标记比特为0,则从这个标记比特向左扫描:
如果左边标记比特为0,则这个中间标记比特为0的字节,被区分为第1个字节组;
如果左边标记比特为1,继续向左扫描,直到为0的标记比特;则将左边为0标记比特的字节的右边字节,到右边第一个为0标记比特的字节,被区分为第1个字节组;
B.区分第1个字节组右边的字节组,按从左向右扫描区分字节组步骤区分;
C.区分第1个字节组左边的字节组,按从右向左扫描区分字节组步骤区分。
2.一种二进制比特序列数字数据的处理的装置, 该装置的二进制比特字节序列中,一个或多个字节对应一个对象;与对象相对应的字节称为字节组;由于字节序列中不含区分字节组的信息,对象难以区分;其特征在于:每个字节的最左比特,用作标记比特,标记比特的0或1用作标记;其特征还在于:该装置包含以下装置之一:
1) 建立标记比特与字节组相关联装置;
设该装置字节序列的字节组含有(n+1)字节,n=0,或正整数;通过标记比特关联字节组的步骤如下;
如果n不等于0,则将最右字节的标记比特置为0;其余n字节的标记比特置为1;
如果n=0;则将这个字节的标记比特置为0;
2) 区分字节组装置;该装置通过扫描字节序列的标记比特区分字节组;根据三种不同情况,该装置至少含有以下三种装置之一:
[1]从左向右区分字节组装置;
该装置从左向右扫描字节序列的标记比特,含有以下操作步骤:
如果第1个标记比特为1,继续扫描,直到为0的标记比特,则从第一个为1的标记比特的字节,到为0的标记比特字节,被区分为1个字节组;
如果第1个标记比特为0,则标记比特为0的字节被区分为1个字节组;
从区分出的字节组的右边字节,按上述规则,继续扫描和区分,直至序列结束,或至某个字节组;
[2]从右向左区分字节组装置;
该装置从右向左扫描字节序列的标记比特,含有以下操作步骤:
如果第1个标记比特为1,继续扫描,直到为0的标记比特;
继续扫描,如果下一个标记比特为0;则上一个标记比特为0的字节,被区分为一个字节组;
如果下一个标记比特为1,继续扫描,直到为0的标记比特;则从上一个为0的标记比特的字节,到下一个为0的标记比特的右边字节,被区分为1个字节组;
从区分出的字节组的左边字节,按上述规则,继续扫描和区分,直至序列结束,或至字节序列的某个字节组;
[3]从字节序列中间的某个比特标记区分字节组装置;
该装置含有以下操作步骤:
A.区分第1个字节组的步骤如下:
如果这个中间标记比特为1,则从这个标记比特向左扫描:
如果下一个标记比特为1,继续向左扫描,直到为0的标记比特,
然后,改为向右扫描,直到为0的标记比特;
则将左边为0标记比特的字节的右边字节,到右边为0标记比特的字节,被区分为第1个字节组;
如果这个中间标记比特为0,则从这个标记比特向左扫描:
如果左边标记比特为0,则这个中间标记比特为0的字节,被区分为第1个字节组;
如果左边标记比特为1,继续向左扫描,直到为0的标记比特;则将左边为0标记比特的字节的右边字节,到右边第一个为0标记比特的字节,被区分为第1个字节组;
B.区分第1个字节组右边的字节组,用从左向右扫描区分字节组装置区分;
C.区分第1个字节组左边的字节组,用从右向左扫描区分字节组装置区分。
3.一种二进制比特序列数字数据的处理方法,其特征在于:二进制比特字节序列为超编码序列;其特征还在于:至少包含以下步骤之一:
1)建立对象或对象属性与超编码的关联步骤;
A.建立对象与超编码相关联;一个对象与一个超编码相关联;
B.建立对象属性与超编码或部分超编码相关联,生成对象和属性与超编码的关联关系;
2)解析对象或对象属性包含以下步骤:
A.通过扫描字节序列的超比特,区分超编码,区分对象;
B.根据对象属性与超编码或部分超编码的关联关系,解析对象的属性。
4.一种二进制比特序列数字数据的处理装置,其特征在于:该装置含有超编码序列;其特征还在于:至少包含以下装置之一:
1)建立对象或对象属性关联装置,该装置用于将对象或对象属性与超编码相关联;该装置包含以下装置:
A.建立对象与超编码相关联装置;一个对象与一个超编码相关联;
B.建立对象属性与超编码或部分超编码相关联装置,该装置含有对象属性与超编码的关联关系;
2)解析对象属性装置,该装置包含:
A.通过区分超编码区分对象的装置;该装置通过扫描字节序列的超比特,区分超编码,区分对象;
B.解析对象属性装置:根据对象属性与超编码或部分超编码的关联关系,解析对象的属性。
5.一种二进制比特序列数字数据的处理方法,其特征在于:比特字节序列为超编码序列,其特征还在于:至少包含以下步骤之一:
1)建立算法或程序的对象或对象属性与超编码的关联步骤;
A.建立对象与超编码相关联步骤;一个对象与一个超编码相关联;
B.建立对象属性与超编码或部分超编码相关联,生成对象和属性与超编码的关联关系;
2)解析算法或程序的对象或对象属性包含以下步骤:
A.通过扫描字节序列的超比特,区分超编码,区分对象;
B.根据对象属性与超编码的关联关系,解析对象或对象属性步骤;
3)机器边解析边运行步骤;该步骤包含以下步骤;
A.通过扫描字节序列的超比特,区分超编码,区分对象;
B.根据对象属性与超编码的关联关系,解析对象或对象属性,并运行算法或程序;
4)生成可执行文件步骤;包括:
A.通过扫描字节序列的超比特,区分超编码,区分对象;
B.根据对象属性与超编码的关联关系,解析对象或对象属性,并生成可执行文件。
6.一种二进制比特序列数字数据的处理装置,其特征在于:比特字节序列为超编码序列;其特征还在于:至少包含以下装置之一:
1)算法或程序的对象或对象属性与超编码的关联装置;包括:
A.建立对象与超编码相关联装置;一个对象与一个超编码相关联;
B.建立对象属性与超编码或超编码的部分相关联装置;
2)机器运行装置;该装置包含以下装置之一;
1)边解析边运行装置;该装置包括:
A.通过区分超编码区分对象装置;
B.根据对象属性与超编码的关联关系,解析对象或对象属性,并运行的装置;
2)生成可执行文件装置;该装置包括以下装置:
A.通过区分超编码区分对象装置;
B.可执行文件装置:根据对象属性与超编码的关联关系,解析对象属性,并生成可执行文件。
7.一种二进制比特序列数字数据的处理方法,设一个汉字多音字含n+1个语音,n为正整数,将多音字的编码增加n个,其特征在于:该处理方法中含有汉字语音编码库、语音编码拼音库和语音编码发音库;或含有汉字拼音库和汉字发音库;其特征还在于:至少包含以下步骤之一:
1)建立汉字编码与字形属性和语音属性相关联步骤;
通过选择正确语音所对应的汉字,使汉字编码的值与汉字的字形和汉字的语音相关联;
2)解析汉字属性步骤,该步骤包含以下步骤:
[1]根据汉字编码的值与字形属性的关联关系,解析汉字编码字形属性的步骤;
[2]根据汉字编码的值与语音属性的关联关系,解析汉字编码语音属性的步骤。
8.一种二进制比特序列数字数据的处理装置,其特征在于:设一个汉字多音字含n+1个语音,n为正整数,将多音字的编码增加n个,其特征在于:该处理装置含有汉字语音编码库、语音编码拼音库和语音编码发音库;或含有汉字拼音库和汉字发音库;其特征还在于:至少包含以下装置之一:
1)建立汉字编码与字形属性和语音属性相关联的装置;
该装置通过选择正确语音所对应的汉字,使汉字编码的值与汉字的字形和汉字的语音相关联;
2)根据汉字编码与汉字属性的关联关系,解析汉字属性的装置;该装置包括:
A.根据汉字编码与汉字属性的关联关系,解析汉字编码字形属性的装置;
B.根据汉字编码与汉字属性的关联关系,解析汉字编码语音属性的装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810635875.7A CN109086275A (zh) | 2018-06-20 | 2018-06-20 | 实现机器智能的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810635875.7A CN109086275A (zh) | 2018-06-20 | 2018-06-20 | 实现机器智能的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109086275A true CN109086275A (zh) | 2018-12-25 |
Family
ID=64840082
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810635875.7A Pending CN109086275A (zh) | 2018-06-20 | 2018-06-20 | 实现机器智能的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109086275A (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103543980A (zh) * | 2013-11-07 | 2014-01-29 | 吴胜远 | 数字数据处理的方法及装置 |
-
2018
- 2018-06-20 CN CN201810635875.7A patent/CN109086275A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103543980A (zh) * | 2013-11-07 | 2014-01-29 | 吴胜远 | 数字数据处理的方法及装置 |
US20160301524A1 (en) * | 2013-11-07 | 2016-10-13 | Shengyuan Wu | Methods and apparatuses of digital data processing |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Silberztein | Formalizing natural languages: The NooJ approach | |
WO2008048090A2 (en) | Method, device, computer program and computer program product for processing linguistic data in accordance with a formalized natural language. | |
CN111176650B (zh) | 解析器生成方法、检索方法、服务器及存储介质 | |
Casalnuovo et al. | Studying the difference between natural and programming language corpora | |
CN106372053B (zh) | 句法分析的方法和装置 | |
JP6952967B2 (ja) | 自動翻訳装置 | |
KR20040024619A (ko) | 복수 언어의 대역 텍스트 입력에 의한 제 3 언어 텍스트생성 알고리즘, 장치 및 프로그램 | |
Wax | Automated grammar engineering for verbal morphology | |
JP2018190287A (ja) | 機械翻訳装置、及びプログラム | |
CN113343717A (zh) | 一种基于翻译记忆库的神经机器翻译方法 | |
CN116360794A (zh) | 数据库语言解析方法、装置、计算机设备及存储介质 | |
Aranta et al. | Utilization Of Hexadecimal Numbers In Optimization Of Balinese Transliteration String Replacement Method | |
CN109086275A (zh) | 实现机器智能的方法和装置 | |
CN113076133B (zh) | 基于深度学习的Java程序内部注释的生成方法及系统 | |
CN114298032A (zh) | 文本标点检测方法、计算机设备及存储介质 | |
CN113095082A (zh) | 一种基于多任务模型进行文本处理的方法、装置、计算机装置及计算机可读取存储介质 | |
CN112965909A (zh) | 测试数据、测试用例生成方法及系统、存储介质 | |
Khemakhem | Standard-based lexical models for automatically structured dictionnaries | |
Rosén et al. | Syntactic annotation of learner corpora | |
JPH0748217B2 (ja) | 文書要約装置 | |
CN112181389B (zh) | 生成教程片段的api标记的方法、系统及计算机设备 | |
Turcato et al. | Pre-processing closed captions for machine translation | |
Alkhazi | Compression-Based Parts-of-Speech Tagger for the Arabic Language | |
Wu | Introduction to Ubit Semantic Computing | |
Pal et al. | Design & Analysis of an Exhaustive Algorithm for Sandhi Processing In Sanskrit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181225 |
|
WD01 | Invention patent application deemed withdrawn after publication |