CN110991148B - 信息处理方法及装置、信息交互方法及装置 - Google Patents
信息处理方法及装置、信息交互方法及装置 Download PDFInfo
- Publication number
- CN110991148B CN110991148B CN201911220907.8A CN201911220907A CN110991148B CN 110991148 B CN110991148 B CN 110991148B CN 201911220907 A CN201911220907 A CN 201911220907A CN 110991148 B CN110991148 B CN 110991148B
- Authority
- CN
- China
- Prior art keywords
- information
- element information
- coding
- extending
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000010365 information processing Effects 0.000 title claims abstract description 57
- 238000003672 processing method Methods 0.000 title claims abstract description 47
- 230000003993 interaction Effects 0.000 title claims abstract description 43
- 238000013507 mapping Methods 0.000 claims abstract description 87
- 238000012545 processing Methods 0.000 claims abstract description 44
- 238000006243 chemical reaction Methods 0.000 claims description 39
- 238000004590 computer program Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 abstract description 23
- 230000008569 process Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明提供一种信息处理方法及装置、信息交互方法及装置、存储介质及电子设备。该信息处理方法包括:确定需要进行编码的待编码信息和编码需求;基于编码需求和处理模型对待编码信息进行编码操作,以生成满足编码需求的编码输出信息,其中,处理模型包括至少一个三维基础映射架构,三维基础映射架构包括多条延伸轴和间隔排布的多层延展层,每层延展层与至少一条延伸轴呈交叉关系,多条延伸轴承载有数字元素信息和能够与数字元素信息相互转换的语音元素信息和/或文字元素信息,每层延展层承载有与该延展层呈交叉关系的延伸轴之间的信息映射关系数据。该信息处理方法能够降低语言编码技术的复杂度及编码成本,并且能够提高语言编码技术的实时性。
Description
技术领域
本发明涉及信息交换技术领域,具体涉及信息处理方法及装置、信息交互方法及装置、存储介质及电子设备。
背景技术
编码技术作为智能科技的重要支撑技术,其重要性不言而喻。编码技术的核心目的是将信息从一种形式或格式对应转换为另一种形式或格式。比如,用预先确定的信息处理方法将文字、数字或其他对象转换成数码,或将信息、数据转换成电脉冲信号,或将第一种语言的文字转换成对应的第二种语言的文字或语音等。
然而,近年来,随着智能科技的迅速发展,需要编码的信息量爆炸式增长。较大的信息量会导致编码成本的增长,而且极易引起编码数据延时等不良后果。比如,针对多种不同语言之间的转换关系的语音编码技术,该编码技术的良好实时性是实现不同语言间无障碍实时交流的重要前提。下述三篇专利文献分别公开了与语言编码技术相关的技术方案。在下述三篇专利文献基础上,如何降低语言编码技术的成本,并提高语言编码技术的实时性是亟需解决的问题。
具体地,专利文献CN100367161C公开了一种采用数字音码来实现汉字输入的方法。该方法通过将每一个汉字用三位数字表示的方式,实现了每输入一个汉字所击打的键盘中键的个数少,输入速度快、重码率低、组词效果和自动选字的效果好的目的,特别适用于手机短信、通讯、管理、速记或网络系统。专利文献CN104637482B公开了一种语音识别方法、装置、系统及语言交换系统。该方法包括:音素存储单元,用于存储第一语言音素特征数据;音素转换单元,用于将接收的音素信号序列通过第一语言音素特征数据转换为第一语言音素;数字编码单元,用于为第一语言音素进行唯一编码,形成第一语言音素编码序列;利用第一语言音素编码序列形成第一语言的字发音编码序列和词汇发音编码序列;字词存储单元,用于存储第一语言的字、词汇或图形及所对应的编码序列;字词转换单元,用于根据编码序列的对应关系生成第一语言的字、词汇、图形和/或其组合。通过该发明能够降低语音识别的设备成本并提高识别准确率。专利文献CN108597493B公开了一种语言语义的音频交换方法和音频交换系统,以解决现有技术中语言互译时因语义复杂导致数据响应出现差错和实时性差的技术问题。该方法包括:利用最小音素序列形成各语言的语音映射结构,通过各语音映射结构完成语义的语言间转换。利用语言构成中形成音频最小短段的最小音素作为各语言间语义转换的基本数据交换单元,利用最小音素作为数据交换的编码基础,改变了语音识别的基础结构,优化了语言中音频内容的编码复杂性和准确率,使得语言音频的编码过程中避免被藕合了语言片段中音调、音阶、音域等复合信息形成的复杂音频特征,保证了语音识别率。
发明内容
有鉴于此,本发明实施例致力于提供一种信息处理方法及装置、信息交互方法及电子设备,以解决现有信息处理技术复杂度高、实时性差的问题。
第一方面,本发明一实施例提供一种信息处理方法,该信息处理方法包括:确定需要进行编码的待编码信息和编码需求;基于编码需求和处理模型对待编码信息进行编码操作,以生成满足编码需求的编码输出信息,其中,处理模型包括至少一个三维基础映射架构,三维基础映射架构包括多条延伸轴和间隔排布的多层延展层,每层延展层与至少一条延伸轴呈交叉关系,多条延伸轴承载有数字元素信息和能够与数字元素信息相互转换的语音元素信息和/或文字元素信息,每层延展层承载有与该延展层呈交叉关系的延伸轴之间的信息映射关系数据。
在本发明一实施例中,多条延伸轴包括同一种语言的语音延伸轴、文字延伸轴和数字延伸轴,其中,语音延伸轴承载有语音元素信息,文字延伸轴承载有文字元素信息,数字延伸轴承载有数字元素信息。
在本发明一实施例中,处理模型包括多种语言对应的能够相互转换的语音元素信息、文字元素信息和数字元素信息。
在本发明一实施例中,延展层包括弧面延展层和/或球面延展层。
在本发明一实施例中,处理模型还包括与三维基础映射架构信号连接的扩展映射架构,扩展映射结构包覆三维基础映射架构,扩展映射架构基于三维基础映射架构形成与待编码信息对应的编码输出信息。
在本发明一实施例中,处理模型包括多个三维基础映射架构,多个三维基础映射架构中的任意两个三维基础映射架构之间设置有信息转换模块,信息转换模块能够实现信息转换操作。
第二方面,本发明一实施例还提供一种信息交互方法,该信息交互方法包括:确定第一用户输出的第一信息;基于第一信息和第二用户确定第二用户对应的编码需求;利用信息处理方法对第一信息进行编码操作,以生成第二用户能够接收的第二信息,其中,该信息处理方法为上述任一实施例所提及的信息处理方法。
第三方面,本发明一实施例还提供一种信息处理装置,该信息处理装置包括:编码信息确定模块,用于确定需要进行编码的待编码信息和编码需求;编码模块,用于基于编码需求和处理模型对待编码信息进行编码操作,以生成满足编码需求的编码输出信息,其中,处理模型包括至少一个三维基础映射架构,三维基础映射架构包括多条延伸轴和间隔排布的多层延展层,每层延展层与至少一条延伸轴呈交叉关系,其中,多条延伸轴承载有数字元素信息和能够与数字元素信息相互转换的语音元素信息和/或文字元素信息,每层延展层承载有与该延展层呈交叉关系的延伸轴之间的信息映射关系。
第四方面,本发明一实施例还提供一种信息交互装置,该信息交互装置包括:第一信息确定模块,用于确定第一用户输出的第一信息;编码需求确定模块,用于基于第一信息和第二用户确定第二用户对应的编码需求;第二信息生成模块,用于利用信息处理方法对第一信息进行编码操作,以生成所述第二用户能够接收的第二信息,其中,该信息处理方法为上述任一实施例所提及的信息处理方法。
第五方面,本发明一实施例还提供一种计算机可读存储介质,该存储介质存储有计算机程序,该计算机程序用于执行上述任一实施例所提及的信息处理方法,或执行上述任一实施例所提及的信息交互方法。
第六方面,本发明一实施例还提供一种电子设备,该电子设备包括:处理器;用于存储处理器可执行指令的存储器;该处理器用于执行上述任一实施例所提及的信息处理方法,或执行上述任一实施例所提及的信息交互方法。
本发明实施例提供的信息处理方法,通过确定需要进行编码的待编码信息和编码需求,然后基于编码需求和处理模型对待编码信息进行编码操作,以生成满足编码需求的编码输出信息的方式,实现了将待编码信息编码为满足编码需求的编码输出信息的目的。由于本发明实施例提供的信息处理方法无需采用现有信息处理技术中所利用的神经网络模型等复杂语言识别手段,因此,本发明实施例能够降低信息处理技术的复杂度及编码成本,并且能够提高信息处理技术的实时性,进而为实现同种语言间的语音文字转换,以及不同语言间的无障碍交流沟通提供了技术基础。
本发明实施例提供的信息交互方法,通过确定第一用户输出的第一信息,并基于第一信息和第二用户确定第二用户对应的编码需求,然后利用信息处理方法对第一信息进行编码操作,以生成第二用户能够接收的第二信息的方式,实现了第一用户与第二用户的信息交互。由于本发明实施例提供的信息交互方法借助本发明上述实施例提及的信息处理方法实现,因此,本发明实施例能够降低信息交互技术的复杂度及编码成本,并且能够提高信息交互技术的实时性。
附图说明
图1所示为本发明所适用的场景图。
图2所示为本发明一示例性实施例提供的信息处理方法的流程示意图。
图3所示为本发明一示例性实施例提供的处理模型的结构示意图。
图4所示为本发明另一示例性实施例提供的处理模型的结构示意图。
图5所示为本发明又一示例性实施例提供的处理模型的结构示意图。
图6所示为本发明再一示例性实施例提供的处理模型的结构示意图。
图7所示为本发明一示例性实施例提供的信息交互方法的流程示意图。
图8所示为本发明一示例性实施例提供的信息处理装置的结构示意图。
图9所示为本发明一示例性实施例提供的信息交互装置的结构示意图。
图10所示为本发明一示例性实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1所示为本发明所适用的场景图。如图1所示,本发明所适用的场景为基于电子设备的信息交互场景。其中,该信息交互场景中包括服务器1和电子设备2,并且,服务器1和电子设备2之间存在通信连接关系。此外,服务器1中包括处理模型。
具体而言,电子设备2用于确定需要进行编码的待编码信息和编码需求,服务器1用于获取电子设备2确定的待编码信息和编码需求,并基于编码需求和处理模型对待编码信息进行编码操作,以生成满足编码需求的编码输出信息,其中,处理模型包括至少一个三维基础映射架构,三维基础映射架构包括多条延伸轴和间隔排布的多层延展层,每层延展层与至少一条延伸轴呈交叉关系,多条延伸轴承载有数字元素信息和能够与数字元素信息相互转换的语音元素信息和/或文字元素信息,每层延展层承载有与该延展层呈交叉关系的延伸轴之间的信息映射关系数据。需要说明的是,由于该信息交互场景借助于服务器1实现基于编码需求和处理模型对待编码信息进行编码操作,以生成满足编码需求的编码输出信息的步骤,因此,该信息交互场景能够有效降低电子设备2的计算量。
需要说明的是,本发明还适用于另一场景。具体地,该信息交互场景中包括电子设备2,并且,电子设备2中包括处理模型。
具体而言,电子设备2用于确定需要进行编码的待编码信息和编码需求,并基于编码需求和处理模型对待编码信息进行编码操作,以生成满足编码需求的编码输出信息,其中,处理模型包括至少一个三维基础映射架构,三维基础映射架构包括多条延伸轴和间隔排布的多层延展层,每层延展层与至少一条延伸轴呈交叉关系,多条延伸轴承载有数字元素信息和能够与数字元素信息相互转换的语音元素信息和/或文字元素信息,每层延展层承载有与该延展层呈交叉关系的延伸轴之间的信息映射关系数据。需要说明的是,由于该信息交互场景无需进行电子设备2与服务器1之间的数据传输操作,因此,该信息交互场景能够保证所生成的满足编码需求的编码输出信息的实时性。
上述应用场景中提及的电子设备2,包括但不限于为电子眼镜、电子手表等具备良好地便携性的电子设备。此外,应当理解,本发明实施例提供的信息处理方法,不局限于上述提及的信息交互场景,只要涉及到需要借助信息编码操作以实现信息转换的应用场景,均属于本发明实施例的适用范围。
图2所示为本发明一示例性实施例提供的信息处理方法的流程示意图。如图2所示,本发明实施例提供的信息处理方法包括如下步骤。
步骤10,确定需要进行编码的待编码信息和编码需求。
可选地,待编码信息可以为语音信息、文字信息以及数字信息中的至少一种。对应地,编码需求为与待编码信息对应的编码需求。比如,待编码信息为语音信息,对应地,编码需求为将语音信息编码为数字信息或文字信息的需求。又比如,待编码信息为第一种语言的文字信息,对应地,编码需求为将第一种语言的文字信息编码为第二种语言的语音信息的需求。示例性地,第一种语言为汉语,第二种语言为英语。
步骤20,基于编码需求和处理模型对待编码信息进行编码操作,以生成满足编码需求的编码输出信息,其中,处理模型包括至少一个三维基础映射架构,三维基础映射架构包括多条延伸轴和间隔排布的多层延展层,每层延展层与至少一条延伸轴呈交叉关系,多条延伸轴承载有数字元素信息和能够与数字元素信息相互转换的语音元素信息和/或文字元素信息,每层延展层承载有与该延展层呈交叉关系的延伸轴之间的信息映射关系数据。
步骤20中提及的处理模型以及处理模型中包括的三维基础映射架构,均用于辅助编码操作。其中,三维基础映射架构中的延伸轴用于承载数字元素信息和能够与数字元素信息相互转换的语音元素信息和/或文字元素信息。延展层用于承载与该延展层呈交叉关系的延伸轴之间的信息映射关系数据。
示例性地,步骤20中提及的处理模型是一种包括信息映射过程和过程参数的图形化处理模型。
需要说明的是,信息映射关系数据指的是与所交叉的延伸轴对应的信息数据。比如,延伸轴为三条,分别为第一条延伸轴、第二条延伸轴和第三条延伸轴,其中,第一条延伸轴承载有汉语的语音元素信息,第二条延伸轴承载有汉语的文字元素信息,第三条延伸轴承载有数字元素信息,延展层与第一条延伸轴、第二条延伸轴和第三条延伸轴呈交叉关系,那么,信息映射关系数据为汉语的语音元素信息、汉语的文字元素信息以及数字元素信息之间的信息映射关系数据,即,信息映射关系数据能够表征汉语的语音信息和文字信息之间的转换关系。比如,文字信息为“今天天气不错”,那么,信息映射关系数据为能够表征文字信息“今天天气不错”以及语音信息“今天天气不错”之间的转换关系的数据。
应当理解,上述实施例提及的延伸轴与延展层,实质是为表征数据之间的转换关系所建立的架构,是为辅助数据编码所建立的虚拟架构,并非物理空间存在的架构。
在实际应用过程中,首先确定需要进行编码的待编码信息和编码需求,然后基于编码需求和处理模型对待编码信息进行编码操作,以生成满足编码需求的编码输出信息。
本发明实施例提供的信息处理方法,通过确定需要进行编码的待编码信息和编码需求,然后基于编码需求和处理模型对待编码信息进行编码操作,以生成满足编码需求的编码输出信息的方式,实现了将待编码信息编码为满足编码需求的编码输出信息的目的。由于本发明实施例提供的信息处理方法无需采用现有语言编码技术中所利用的神经网络模型等复杂语言识别手段,因此,本发明实施例能够降低语言编码技术的复杂度及编码成本,并且能够提高语言编码技术的实时性,进而为实现同种语言间的语音文字转换,以及不同语言间的无障碍交流沟通提供了技术基础。
优选地,在本发明一实施例中,数字元素信息指的是阿拉伯数字元素信息,比如,1、2以及3等等。
优选地,在本发明一实施例中,语音元素信息指的是语言的最小音素信息,比如汉语中的拼音字母,又比如英语中的英文字母。举例说明,汉语中利用声母和韵母形成音节,声母由单一最小音素或几个单一最小音素形成,韵母由一个或几个最小音素形成。同理,英语中利用元音与辅音形成音节,元音由单一最小音素或几个单一最小音素形成,辅音由一个或几个最小音素形成。下面基于表1给出利用数字元素信息对汉语和英语的音素进行编码的编码示例。
表1
需要说明的是,在表1中,统一音素序列中的单一最小音素在统一音素序列中具有唯一编码。比如,对于小于1000个的最小音素采用10bit(比特)长度就可以形成唯一编码。
优选地,在本发明一实施例中,文字元素信息指的是能够与语音元素信息对应的文字元素信息,并且,文字元素信息亦能够用数字元素信息表达。比如,基于语音元素信息构成了语音信息“你好”,由于语音元素信息与数字元素信息之间具备转换关系,且文字元素信息亦能够用数字元素信息表达,因此,语音信息“你好”可以借助数字元素信息转换为对应的文字信息“你好”。
由于数字是世界通用信息,即使是在不同种语言之间,数字亦是通用的。因此,将数字元素信息作为同种语言之间的语音信息和文字信息的转换媒介,或者将数字元素信息作为不同种语言之间的语音信息和语音信息、或语音信息和文字信息、或文字信息和文字信息的转换媒介,能够实现不同种语言间的语音转换、或语义转换、或语音和语音转换的编码操作。比如,在本发明一实施例中,多条延伸轴包括同一种语言的语音延伸轴、文字延伸轴和数字延伸轴,其中,语音延伸轴承载有语音元素信息,文字延伸轴承载有文字元素信息,数字延伸轴承载有数字元素信息。又比如,在本发明另一实施例中,处理模型包括多种语言对应的能够相互转换的语音元素信息、文字元素信息和数字元素信息。
下面图3至图6给出了处理模型的不同实施例。
图3所示为本发明一示例性实施例提供的处理模型的结构示意图。如图3所示,在本发明实施例中,处理模型包括三维基础映射架构。其中,三维基础映射架构包括相互交叉的第一延伸轴(X轴)、第二延伸轴(Y轴)和第三延伸轴(Z轴),以及被Z轴贯穿的多层延展层(即C1层至C5层),且多层延展层之间呈相互平行关系。
具体地,X轴上承载有数字元素信息,Y轴上承载有文字元素信息,Z轴上承载有语音元素信息。应当理解,本发明实施例提供的处理模型能够借助多层延展层表现更大的信息量。
需要说明的是,延展层的具体层级结构可根据实际情况确定,不局限为本发明实施例提及的五层,还可以为六层、七层等。
图4所示为本发明另一示例性实施例提供的处理模型的结构示意图。如图4所示,在本发明实施例中,处理模型包括三维基础映射架构。其中,三维基础映射架构包括第一延伸轴(X轴)、第二延伸轴(Y轴)和第三延伸轴(Z轴),并且X轴、Y轴和Z轴交汇到球心M。此外,处理模型还包括与X轴、Y轴和Z轴交叉的球面S(即球面延展层)。
需要说明的是,由于球面延展层为球形面,因此,与图3所示实施例提供的平面延展层相比,能够承载更多的信息映射关系数据,进而能够承载更多的信息量。
应当理解,球面延展层的数量不局限于本发明实施例提及的一个,还可以是两个、三个或更多个。可选地,多个球面延展层的半径互不相同,且球心均为M。
举例说明,在基于图4所示实施例延伸的本发明另一实施例中,处理模型被装载到电子手表中。具体地,处理模型共包括两层半径不同的球面,即球面S1和球面S2,其中,球面S1用于承载与用户运动状态相关的信息,球面S2用于承载与用户所处位置相关的信息。并且,X轴上承载有数字元素信息,Y轴上承载有文字元素信息,Z轴上承载有语音元素信息。
比如,用户正在行走中,则球面S1中承载与行走状态相关的信息。示例性地,球面S1与X轴交汇处或者预设交汇范围内承载有与行走状态相关的数字信息,该数字信息可基于背景技术部分记载的在先专利确定,比如,“行走”文字对应的多个阿拉伯数字的数字串,比如310478。球面S1与Y轴交汇处或者预设交汇范围内承载有与行走状态相关的文字信息,比如“行走”文字。球面S1与Z轴交汇处或者预设交汇范围内承载有与行走状态相关的语音信息,比如“行走”文字对应的汉语语音。
需要说明的是,不一定是球面延展层,还可以是弧面延展层,本发明实施例对此不进行统一限定。
在本发明一实施例中,处理模型还包括与三维基础映射架构信号连接的扩展映射架构,扩展映射结构包覆三维基础映射架构,扩展映射架构基于三维基础映射架构形成与待编码信息对应的编码输出信息。由于本发明实施例包括能够承载与待编码信息对应的编码输出信息,因此,能够进一步降低语言编码技术的复杂度。举例说明,扩展映射架构中承载有能够用三维基础映射架构中承载的元素信息(比如数字元素信息和/或语音元素信息和/或文字元素信息)表达的编码输出信息。
下面结合图5进行详细说明。图5所示为本发明又一示例性实施例提供的处理模型的结构示意图。如图5所示,处理模型包括三维基础映射架构P,环绕三维基础映射架构P为扩展映射架构。可选地,图5所示实施例中提及的三维基础映射架构P为图3或图4所示实施例中的三维基础映射架构。
在本发明一实施例中,处理模型包括多个三维基础映射架构,其中,多个三维基础映射架构中的任意两个三维基础映射架构之间设置有信息转换模块,该信息转换模块能够实现信息转换操作。由于本发明实施例提供的处理模型包括多个三维基础映射架构,且任意两个三维基础映射架构能够通过信息转换模块实现信息转换操作,因此,本发明实施例能够实现不同语言间的信息转换。下面结合图6进行详细说明。
图6所示为本发明再一示例性实施例提供的处理模型的结构示意图。如图6所示,本发明实施例提供的处理模型包括第一三维基础映射架构31、信息转换模块32以及第二三维基础映射架构33,并且,第一三维基础映射架构31和第二三维基础映射架构33能够借助信息转换模块32实现信息转换。
具体地,第一三维基础映射架构31包括分别承载有汉语的语音元素信息、汉语的文字元素信息以及数字元素信息的三条延伸轴,第二三维基础映射架构33包括分别承载有英语的语音元素信息、汉语的文字元素信息以及数字元素信息的三条延伸轴。
可选地,实际的编码需求为将汉语的文字信息“你好”转换为英语的文字信息“HELLO”。那么,在实际应用过程中,第一三维基础映射架构31接收编码需求,并将汉语的文字信息“你好”转换为数字信息,然后将转换成的数字信息传输到信息转换模块32,信息转换模块32将该数字信息传输至第二三维基础映射架构33并获取该数字信息在第二三维基础映射架构33中对应的文字信息。可选地,信息转换模块32将该对应的文字信息输出。至此,借助信息转换模块32成功实现将汉语的文字信息“你好”转换为英语的文字信息“HELLO”的目的。
图7所示为本发明一示例性实施例提供的信息交互方法的流程示意图。如图7所示,本发明实施例提供的信息交互方法包括如下步骤。
步骤40,确定第一用户输出的第一信息。
步骤50,基于第一信息和第二用户确定第二用户对应的编码需求。
需要说明的是,第二用户对应的编码需求基于第一信息和第二用户确定。比如,第一信息为英语的语音信息,第二用户为不能够听说英语,但能够听说汉语的中国人,那么,编码需求可以为将英语的语音信息编码转换为汉语的语音信息。
步骤60,利用信息处理方法对第一信息进行编码操作,以生成第二用户能够接收的第二信息。
需要说明的是,步骤60中提及的信息处理方法,可以为本发明上述任一实施例所提及的信息处理方法。
在实际应用过程中,首先确定第一用户输出的第一信息,然后基于第一信息和第二用户确定第二用户对应的编码需求,最后利用信息处理方法对第一信息进行编码操作,以生成第二用户能够接收的第二信息。
本发明实施例提供的信息交互方法,通过确定第一用户输出的第一信息,并基于第一信息和第二用户确定第二用户对应的编码需求,然后利用信息处理方法对第一信息进行编码操作,以生成第二用户能够接收的第二信息的方式,实现了第一用户与第二用户的信息交互。由于本发明实施例提供的信息交互方法借助本发明上述实施例提及的信息处理方法实现,因此,本发明实施例能够降低信息交互技术的复杂度及编码成本,并且能够提高信息交互技术的实时性。
图8所示为本发明一示例性实施例提供的信息处理装置的结构示意图。如图8所示,本发明实施例提供的信息处理装置包括:
编码信息确定模块100,用于确定需要进行编码的待编码信息和编码需求;
编码模块200,用于基于编码需求和处理模型对待编码信息进行编码操作,以生成满足编码需求的编码输出信息,其中,处理模型包括至少一个三维基础映射架构,三维基础映射架构包括多条延伸轴和间隔排布的多层延展层,每层延展层与至少一条延伸轴呈交叉关系,多条延伸轴承载有数字元素信息和能够与数字元素信息相互转换的语音元素信息和/或文字元素信息,每层延展层承载有与该延展层呈交叉关系的延伸轴之间的信息映射关系数据。
图9所示为本发明一示例性实施例提供的信息交互装置的结构示意图。如图9所示,本发明实施例提供的信息交互装置包括:
第一信息确定模块400,用于确定第一用户输出的第一信息;
编码需求确定模块500,用于基于第一信息和第二用户确定第二用户对应的编码需求;
第二信息生成模块600,用于利用信息处理方法对第一信息进行编码操作,以生成第二用户能够接收的第二信息。
应当理解,图8提供的信息处理装置中的编码信息确定模块100和编码模块200的操作和功能可以参考上述图2提供的信息处理方法,以及图3至图6提供的处理模型,为了避免重复,在此不再赘述。
此外,应当理解,图9提供的信息交互装置中的第一信息确定模块400、编码需求确定模块500和第二信息生成模块600的操作和功能可以参考上述图7提供的信息交互方法,为了避免重复,在此不再赘述。
下面,参考图10来描述根据本发明实施例的电子设备。图10所示为本发明一示例性实施例提供的电子设备的结构示意图。
如图10所示,电子设备70包括一个或多个处理器701和存储器702。
处理器701可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备70中的其他组件以执行期望的功能。
存储器702可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器701可以运行所述程序指令,以实现上文所述的本发明的各个实施例的信息处理方法、信息交互方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如语音信息、文字信息等各种内容。
在一个示例中,电子设备70还可以包括:输入装置703和输出装置704,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置703可以包括例如键盘、鼠标等等。
该输出装置704可以向外部输出各种信息,包括编码生成的语音信息、文字信息等。该输出装置704可以包括例如显示器、通信网络及其所连接的远程输出设备等等。
当然,为了简化,图10中仅示出了该电子设备70中与本发明有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备70还可以包括任何其他适当的组件。
需要说明的是,本发明上述实施例提供的电子设备70包括但不限于为具备便携性的电子手表、电子眼镜等电子设备。
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的信息处理方法和/或信息交互方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的信息处理方法和/或信息交互方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此发明的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此发明的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种信息处理方法,其特征在于,包括:
确定需要进行编码的待编码信息和编码需求;
基于所述编码需求和处理模型对所述待编码信息进行编码操作,以生成满足所述编码需求的编码输出信息,其中,所述处理模型包括至少一个三维基础映射架构,所述三维基础映射架构包括多条延伸轴和间隔排布的多层球面和/或弧面延展层,每层所述球面和/或弧面延展层与至少一条所述延伸轴呈交叉关系,所述多条延伸轴承载有数字元素信息和能够与所述数字元素信息相互转换的语音元素信息和/或文字元素信息,每层所述球面和/或弧面延展层承载有与该所述球面和/或弧面延展层呈交叉关系的延伸轴之间的信息映射关系数据,
所述多条延伸轴包括同一种语言的语音延伸轴、文字延伸轴和数字延伸轴,其中,所述语音延伸轴承载有所述语音元素信息,所述文字延伸轴承载有所述文字元素信息,所述数字延伸轴承载有所述数字元素信息,所述语音元素信息指的是语言的最小音素信息,
所述处理模型包括多种语言对应的能够相互转换的所述语音元素信息、所述文字元素信息和所述数字元素信息,
所述处理模型包括多个三维基础映射架构,所述多个三维基础映射架构中的任意两个所述三维基础映射架构之间设置有信息转换模块,所述信息转换模块能够实现信息转换操作,
其中,第一三维基础映射架构包括分别承载有第一语言的语音元素信息、第一语言的文字元素信息以及所述数字元素信息的三条延伸轴,第二三维基础映射架构包括分别承载有第二语言的语音元素信息、第二语言的文字元素信息以及所述数字元素信息的三条延伸轴。
2.根据权利要求1所述的方法,其特征在于,所述处理模型还包括与所述三维基础映射架构信号连接的扩展映射架构,所述扩展映射结构包覆所述三维基础映射架构,所述扩展映射架构基于所述三维基础映射架构形成与待编码信息对应的编码输出信息。
3.一种信息交互方法,其特征在于,包括:
确定第一用户输出的第一信息;
基于所述第一信息和第二用户确定所述第二用户对应的编码需求;
利用信息处理方法对所述第一信息进行编码操作,以生成所述第二用户能够接收的第二信息,其中,所述信息处理方法为上述权利要求1或2所述的信息处理方法。
4.一种信息处理装置,其特征在于,包括:
编码信息确定模块,用于确定需要进行编码的待编码信息和编码需求;
编码模块,用于基于所述编码需求和处理模型对所述待编码信息进行编码操作,以生成满足所述编码需求的编码输出信息,其中,所述处理模型包括至少一个三维基础映射架构,所述三维基础映射架构包括多条延伸轴和间隔排布的多层球面和/或弧面延展层,每层所述球面和/或弧面延展层与至少一条所述延伸轴呈交叉关系,其中,所述多条延伸轴承载有数字元素信息和能够与所述数字元素信息相互转换的语音元素信息和/或文字元素信息,每层所述球面和/或弧面延展层承载有与该所述球面和/或弧面延展层呈交叉关系的延伸轴之间的信息映射关系,
所述多条延伸轴包括同一种语言的语音延伸轴、文字延伸轴和数字延伸轴,其中,所述语音延伸轴承载有所述语音元素信息,所述文字延伸轴承载有所述文字元素信息,所述数字延伸轴承载有所述数字元素信息,所述语音元素信息指的是语言的最小音素信息,
所述处理模型包括多种语言对应的能够相互转换的所述语音元素信息、所述文字元素信息和所述数字元素信息,
所述处理模型包括多个三维基础映射架构,所述多个三维基础映射架构中的任意两个所述三维基础映射架构之间设置有信息转换模块,所述信息转换模块能够实现信息转换操作,
其中,第一三维基础映射架构包括分别承载有第一语言的语音元素信息、第一语言的文字元素信息以及所述数字元素信息的三条延伸轴,第二三维基础映射架构包括分别承载有第二语言的语音元素信息、第二语言的文字元素信息以及所述数字元素信息的三条延伸轴。
5.一种信息交互装置,其特征在于,包括:
第一信息确定模块,用于确定第一用户输出的第一信息;
编码需求确定模块,用于基于所述第一信息和第二用户确定所述第二用户对应的编码需求;
第二信息生成模块,用于利用信息处理方法对所述第一信息进行编码操作,以生成所述第二用户能够接收的第二信息,其中,所述信息处理方法为上述权利要求1或2所述的信息处理方法。
6.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1或2所述的信息处理方法,或执行上述权利要求3所述的信息交互方法。
7.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于执行上述权利要求1或2所述的信息处理方法,或执行上述权利要求3所述的信息交互方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911220907.8A CN110991148B (zh) | 2019-12-03 | 2019-12-03 | 信息处理方法及装置、信息交互方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911220907.8A CN110991148B (zh) | 2019-12-03 | 2019-12-03 | 信息处理方法及装置、信息交互方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110991148A CN110991148A (zh) | 2020-04-10 |
CN110991148B true CN110991148B (zh) | 2024-02-09 |
Family
ID=70089557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911220907.8A Active CN110991148B (zh) | 2019-12-03 | 2019-12-03 | 信息处理方法及装置、信息交互方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110991148B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1908863A (zh) * | 2005-08-07 | 2007-02-07 | 黄金富 | 双语混合输入方法及具有字典功能的手机 |
CN101923858A (zh) * | 2009-06-17 | 2010-12-22 | 劳英杰 | 一种实时同步互译语音终端 |
CN104637482A (zh) * | 2015-01-19 | 2015-05-20 | 孔繁泽 | 一种语音识别方法、装置、系统以及语言交换系统 |
CN108388549A (zh) * | 2018-02-26 | 2018-08-10 | 腾讯科技(深圳)有限公司 | 信息转换方法、装置、存储介质和电子装置 |
CN108597493A (zh) * | 2018-03-28 | 2018-09-28 | 孔繁泽 | 语言语义的音频交换方法和音频交换系统、编码图形 |
CN110189749A (zh) * | 2019-06-06 | 2019-08-30 | 四川大学 | 语音关键词自动识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102589637B1 (ko) * | 2016-08-16 | 2023-10-16 | 삼성전자주식회사 | 기계 번역 방법 및 장치 |
-
2019
- 2019-12-03 CN CN201911220907.8A patent/CN110991148B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1908863A (zh) * | 2005-08-07 | 2007-02-07 | 黄金富 | 双语混合输入方法及具有字典功能的手机 |
CN101923858A (zh) * | 2009-06-17 | 2010-12-22 | 劳英杰 | 一种实时同步互译语音终端 |
CN104637482A (zh) * | 2015-01-19 | 2015-05-20 | 孔繁泽 | 一种语音识别方法、装置、系统以及语言交换系统 |
CN108388549A (zh) * | 2018-02-26 | 2018-08-10 | 腾讯科技(深圳)有限公司 | 信息转换方法、装置、存储介质和电子装置 |
CN108597493A (zh) * | 2018-03-28 | 2018-09-28 | 孔繁泽 | 语言语义的音频交换方法和音频交换系统、编码图形 |
CN110189749A (zh) * | 2019-06-06 | 2019-08-30 | 四川大学 | 语音关键词自动识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110991148A (zh) | 2020-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7066349B2 (ja) | 翻訳方法、翻訳装置及びコンピュータプログラム | |
CN109964223B (zh) | 会话信息处理方法及其装置、存储介质 | |
US11769480B2 (en) | Method and apparatus for training model, method and apparatus for synthesizing speech, device and storage medium | |
JP2022058554A (ja) | エンドツーエンドのテキスト音声変換 | |
KR102386854B1 (ko) | 통합 모델 기반의 음성 인식 장치 및 방법 | |
CN110619867B (zh) | 语音合成模型的训练方法、装置、电子设备及存储介质 | |
US20210090550A1 (en) | Speech synthesis method, speech synthesis device, and electronic apparatus | |
CN110807331B (zh) | 一种多音字读音预测方法、装置和电子设备 | |
JP7264951B2 (ja) | オフライン音声認識方法、装置、電子機器、記憶媒体及びコンピュータプログラム | |
CN111353035B (zh) | 人机对话方法、装置、可读存储介质及电子设备 | |
CN111354343B (zh) | 语音唤醒模型的生成方法、装置和电子设备 | |
JP7335569B2 (ja) | 音声認識方法、装置及び電子機器 | |
CN116151276A (zh) | 用于多模式双语预训练和语音翻译的融合声学和文本编码 | |
CN114912450B (zh) | 信息生成方法与装置、训练方法、电子设备和存储介质 | |
CN111475635B (zh) | 语义补全方法、装置和电子设备 | |
CN114503193A (zh) | 多流递归神经网络换能器 | |
CN115394321A (zh) | 音频情感识别方法、装置、设备、存储介质及产品 | |
WO2019184942A1 (zh) | 语言语义的音频交换方法和音频交换系统、编码图形 | |
JP7216065B2 (ja) | 音声認識方法及び装置、電子機器並びに記憶媒体 | |
CN110991148B (zh) | 信息处理方法及装置、信息交互方法及装置 | |
CN116469374A (zh) | 基于情感空间的语音合成方法、装置、设备及存储介质 | |
CN114970666B (zh) | 一种口语处理方法、装置、电子设备及存储介质 | |
US20240038223A1 (en) | Speech recognition method and apparatus | |
CN114333772A (zh) | 语音识别方法、装置、设备、可读存储介质及产品 | |
CN109036379B (zh) | 语音识别方法、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |