CN110119513A - 一种基于大数据分析的远程日语教学交互系统及交互方法 - Google Patents

一种基于大数据分析的远程日语教学交互系统及交互方法 Download PDF

Info

Publication number
CN110119513A
CN110119513A CN201811552944.4A CN201811552944A CN110119513A CN 110119513 A CN110119513 A CN 110119513A CN 201811552944 A CN201811552944 A CN 201811552944A CN 110119513 A CN110119513 A CN 110119513A
Authority
CN
China
Prior art keywords
module
user
key
file
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811552944.4A
Other languages
English (en)
Inventor
乔宇芳
蒋秣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin Institute of Chemical Technology
Original Assignee
Jilin Institute of Chemical Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin Institute of Chemical Technology filed Critical Jilin Institute of Chemical Technology
Priority to CN201811552944.4A priority Critical patent/CN110119513A/zh
Publication of CN110119513A publication Critical patent/CN110119513A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Computer Hardware Design (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Educational Technology (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Machine Translation (AREA)

Abstract

本发明属于教学技术领域,公开了一种基于大数据分析的远程日语教学交互系统及交互方法,所述基于大数据分析的远程日语教学交互系统及交互方法系统包括:教学视频采集模块、输入模块、中央控制模块、网络通信模块、语音翻译模块、文本翻译模块、大数据处理模块、存储模块、显示模块。本发明通过语音翻译模块将人机对话提升为人与人的直接对话,提高了翻译语音的生动性和真实性,提升了用户体验;同时,通过文本翻译模块可利用音素序列对语音识别结果作容错处理,使得翻译后的目标文本能够更加准确地对应源语音信号,翻译结果更加准确,提高日语教学质量。

Description

一种基于大数据分析的远程日语教学交互系统及交互方法
技术领域
本发明属于教学技术领域,尤其涉及一种基于大数据分析的远程日语教学交互系统及交互方法。
背景技术
日语的使用范围包括日本国全境(琉球地区大部分使用,有原住民使用琉球语,日本不承认琉球语为独立语言)。日语在世界范围使用广泛,因为日本动漫产业在世界范围内的影响力,虽不是联合国工作语言,在世界上影响力也很大。特别是对于与ACG相关的物什,日语几乎是唯一的用语。日语极富变化,不单有口语和书面语的区别,还有简体和敬体、普通和郑重、男与女、老与少的区别,不同行业和职务的人说话也不同,这体现出日本社会森严的等级和团队思维。日语中的敬语发达,敬语的使用使得公众场合下的日语十分典雅,但过于繁复的语法使得学习敬语异常困难,即使土生土长的日本人也不能完全熟练掌握。然而,
综上所述,现有技术存在的问题是:
现有日语教学中使用的翻译机在进行语音翻译时,翻译语音听起来都是同一个人的声音,单调乏味,让人感觉是在与机器人对话,而不是与真人对话,缺乏真实感和人情味,容易引起听觉疲劳,用户体验不佳;同时,日语文本翻译时,由于在将源文本的音素序列转化为源文本的词序列时,转化过程容易出错,从而导致翻译结果也容易出错,影响教学质量。
发明内容
针对现有技术存在的问题,本发明提供了一种基于大数据分析的远程日语教学交互系统及交互方法。
本发明是这样实现的,一种基于大数据分析的远程日语教学交互系统包括:
教学视频采集模块,与中央控制模块连接,用于通过摄像头采集日语教学视频数据;
输入模块,与中央控制模块连接,用于通过输入键盘输入操作指令及待翻译文本;
中央控制模块,与教学视频采集模块、输入模块、网络通信模块、语音翻译模块、文本翻译模块、大数据处理模块、存储模块、显示模块连接,用于通过单片机控制各个模块正常工作;
网络通信模块,与中央控制模块连接,用于通过网卡连接互联网进行远程日语教学数据通信操作;
语音翻译模块,与中央控制模块连接,用于通过语音翻译器对日语语音进行识别翻译;
文本翻译模块,与中央控制模块连接,用于通过翻译程序对输入的日语文本进行翻译;
大数据处理模块,与中央控制模块连接,用于通过云服务器集中大数据资源对采集的日语教学视频进行处理分析;
存储模块,与中央控制模块连接,用于通过存储器存储采集的日语教学视频数据;
显示模块,与中央控制模块连接,用于通过触控显示器显示日语教学交互系统界面及日语教学视频内容。
一种基于大数据分析的远程日语教学交互方法包括以下步骤:
步骤一,通过教学视频采集模块利用摄像头采集日语教学视频数据;通过输入模块利用输入键盘输入操作指令及待翻译文本;
步骤二,中央控制模块通过网络通信模块利用网卡连接互联网进行远程日语教学数据通信操作;
步骤三,通过语音翻译模块利用语音翻译器对日语语音进行识别翻译;通过文本翻译模块利用翻译程序对输入的日语文本进行翻译;
步骤四,通过大数据处理模块利用云服务器集中大数据资源对采集的日语教学视频进行处理分析;
步骤五,通过存储模块利用存储器存储采集的日语教学视频数据;
步骤六,通过显示模块利用触控显示器显示日语教学交互系统界面及日语教学视频内容。
进一步,所述语音翻译模块翻译方法如下:
(1)从原始语音信息中提取出原始声纹;
(2)对所述原始语音信息进行翻译处理,获得翻译信息;
(3)将所述翻译信息和所述原始声纹合成为最终语音信息。
进一步,所述翻译信息为目标语音信息,所述将所述翻译信息和所述原始声纹合成为最终语音信息的步骤包括:
剔除所述目标语音信息中的预设声纹,得到无声纹的目标语音信息;
将所述原始声纹合成到所述无声纹的目标语音信息中,生成最终语音信息。
进一步,所述剔除所述目标语音信息中的预设声纹的步骤包括:
从所述目标语音信息中提取出预设声纹;
对所述目标语音信息和所述预设声纹做信号减法运算,得到无声纹的目标语音信息。
进一步,所述将所述原始声纹合成到所述无声纹的目标语音信息中,生成最终语音信息的步骤包括:
对所述原始声纹和所述无声纹的目标语音信息做信号加法运算,得到最终语音信息。
进一步,所述对所述原始语音信息进行翻译处理,获得翻译信息的步骤包括:
向第一服务器发送所述原始语音信息,以使所述第一服务器将所述原始语音信息翻译处理为目标语音信息;
接收所述第一服务器返回的所述目标语音信息。
进一步,所述文本翻译模块翻译方法如下:
1)获取源文本对应的音素序列编码向量及词序列向量;其中,所述源文本对应的音素序列编码向量由所述源文本中每一分词对应的音素编码向量所构成,所述源文本对应的词序列向量由所述源文本中每一分词对应的词向量所构成,所述源文本对应的音素序列编码向量中包含的音素编码向量数与所述源文本对应的词序列向量中包含的词向量数相同;
2)将所述源文本对应的音素序列编码向量与词序列向量输入至翻译模型,输出得到所述源文本对应的目标文本。
进一步,所述获取源文本中每一分词对应的音素编码向量,包括:
获取所述源文本中每一分词对应的音素序列中最后一个音素的编码向量,并作为每一分词对应的音素编码向量。
进一步,所述获取源文本中每一分词对应的音素编码向量,包括:
对所述源文本对应的音素序列作卷积处理,得到卷积向量;
根据所述卷积向量的维度及所述源文本对应的词序列向量中包含的词向量数,确定池化处理的窗口尺寸;
基于所述窗口尺寸对所述卷积向量作池化处理,得到每一分词对应的音素序列编码向量。
进一步,所述根据所述卷积向量的维度及所述源文本对应的词序列向量中包含的词向量数,确定池化处理的窗口尺寸,包括:
计算所述卷积向量的维度与所述源文本对应的词序列向量中包含的词向量数之间的比值,对计算得到的比值向上取整,将得到的整数值作为池化处理的窗口尺寸。
进一步,所述将所述源文本对应的音素序列编码向量与词序列向量输入至翻译模型,输出得到所述源文本对应的目标文本,包括:
将所述源文本中每一分词对应的音素编码向量与每一分词对应的词向量进行拼接,得到每一分词对应的特征向量,将每一分词对应的特征向量输入至翻译模型,输出得到所述源文本对应的目标文本。
进一步,步骤六中触控显示器显示日语教学交互系统界面及日语教学视频内容,同时进行人机交互;人机交互的方法包括:
步骤一,系统初始化:
用户A与用户B在首次登录系统时进行初始化;
用户A与用户B在完成初始化后即进行登陆系统,登陆过程如下:
用户登录系统,用户界面将自动获取存储于第三方存储机构的密钥文件,并通过对注册信息进行哈希计算获取到口令密钥,通过口令密钥解密密钥文件,对密钥文件进行解析后分别获得用户主密钥与用户私钥,并将主密钥与私钥存储于用户界面;
用户界面初拟关键指标集合;
精炼同层指标和计算权重;
计算跨层指标权重;
初拟关键指标集合的过程为:在具有N个专家参与系统评估的场景中,专家i给出的指标类型为:
其中,Ni是一个多指标的集合,指专家i给出的指标j的权重,表示指标类型个数,表示指标类型个数,M表示最多指标数量,N个专家形成该系统的总的指标集合为N'={Ni,i=1,...,N};
精炼同层指标和计算权重的过程为:在具有N个专家参与系统评估的场景中,根据所述N个专家形成的系统的总的指标集合为N'={Ni,i=1,...,N},求解公共的关键指标类型和相应指标的权重,其中精炼后的指标类型记作N0,则其中表示N个专家给出的指标类型Ni,i=1,...,N的交集;精炼后的关键指标的权重向量采用平均法计算,即其中表示第j个被加入到精炼后指标集合N0中的指标元素的权重;
步骤二,文件加密上传;
步骤三,密文共享;
步骤四,文件下载解密;
步骤五,注销:
当需要注销时,用户界面会自动清除存储于用户界面的主密钥与用户私钥。
进一步,在步骤三中所述文件共享具体包括:
第一步,用户A首先在自己的存储空间内选择需要共享的文件,设置文件属性为共享,提供用户查询的窗口,当用户A在窗口内输入用户B的用户名后用户界面自动发送查询请求到服务端查询用户B是否存在,如果用户B存在则将返回一个确认信息以及用户B的公钥;
第二步,用户A通过发送请求获取当前所要共享文件的加密后的文件密钥,第三方平台机构接收到请求后则会将第三方平台机构中存储的当前文件密态的文件密钥发送给用户A;
第三步,用户A接收到文件的文件密钥后,通过存储在本地的主密钥解密获取文件的明文状态的文件密钥;
第四步,通过使用在第一步中获取到的用户B的公钥对明文的文件密钥进行加密处理,形成新密态的文件密钥;
第五步,用户A的用户界面自动将新加密得到的密钥通过可视化编码为字符串,然后将编码后的密钥上传到第三方平台机构,并在共享文件信息列表中插入一条记录用来存储密钥以及相关信息;
第六步,第三方平台机构根据共享文件信息列表对用户B进行文件标记,使得用户B能够在自己的存储空间中看到并识别出共享文件。
本发明的优点及积极效果为:
本发明通过语音翻译模块利用从原始语音信息中提取出原始声纹,再将翻译信息和原始声纹合成为最终语音信息,使得最终语音信息与原始语音信息的声纹相同,听起来好像对方用户自己说出了翻译后的语言,实现了原声翻译的效果,将人机对话提升为人与人的直接对话,提高了翻译语音的生动性和真实性,提升了用户体验;同时,通过文本翻译模块获取源文本对应的音素序列编码向量及词序列向量;将源文本对应的音素序列编码向量与词序列向量输入至翻译模型,输出得到源文本对应的目标文本;由于在机器翻译的解码阶段之前,结合了词序列和音素序列进行编码,从而可利用音素序列对语音识别结果作容错处理,使得翻译后的目标文本能够更加准确地对应源语音信号,翻译结果更加准确,提高日语教学质量。
本发明中,触控显示器显示日语教学交互系统界面及日语教学视频内容,同时进行人机交互;人机交互的方法包括:步骤一,系统初始化:用户A与用户B在首次登录系统时进行初始化;用户A与用户B在完成初始化后即进行登陆系统,登陆过程如下:用户登录系统,用户界面将自动获取存储于第三方存储机构的密钥文件,并通过对注册信息进行哈希计算获取到口令密钥,通过口令密钥解密密钥文件,对密钥文件进行解析后分别获得用户主密钥与用户私钥,并将主密钥与私钥存储于用户界面;用户界面初拟关键指标集合;精炼同层指标和计算权重;计算跨层指标权重;步骤二,文件加密上传;步骤三,密文共享;能够方便的进行人机交换和共享文件。
附图说明
图1是本发明实施例提供的基于大数据分析的远程日语教学交互方法流程图。
图2是本发明实施例提供的基于大数据分析的远程日语教学交互系统结构框图。
图中:1、教学视频采集模块;2、输入模块;3、中央控制模块;4、网络通信模块;5、语音翻译模块;6、文本翻译模块;7、大数据处理模块;8、存储模块;9、显示模块。
具体实施方式
为能进一步了解本发明的发明内容、特点及功效,兹例举以下实施例,并配合附图详细说明如下。
下面结合附图对本发明的结构作详细的描述。
如图1所示,本发明提供的基于大数据分析的远程日语教学交互方法包括以下步骤:
S101,通过教学视频采集模块利用摄像头采集日语教学视频数据;通过输入模块利用输入键盘输入操作指令及待翻译文本;
S102,中央控制模块通过网络通信模块利用网卡连接互联网进行远程日语教学数据通信操作;
S103,通过语音翻译模块利用语音翻译器对日语语音进行识别翻译;通过文本翻译模块利用翻译程序对输入的日语文本进行翻译;
S104,通过大数据处理模块利用云服务器集中大数据资源对采集的日语教学视频进行处理分析;
S105,通过存储模块利用存储器存储采集的日语教学视频数据;
S106,通过显示模块利用触控显示器显示日语教学交互系统界面及日语教学视频内容。
如图2所示,本发明实施例提供的基于大数据分析的远程日语教学交互系统包括:教学视频采集模块1、输入模块2、中央控制模块3、网络通信模块4、语音翻译模块5、文本翻译模块6、大数据处理模块7、存储模块8、显示模块9。
教学视频采集模块1,与中央控制模块3连接,用于通过摄像头采集日语教学视频数据;
输入模块2,与中央控制模块3连接,用于通过输入键盘输入操作指令及待翻译文本;
中央控制模块3,与教学视频采集模块1、输入模块2、网络通信模块4、语音翻译模块5、文本翻译模块6、大数据处理模块7、存储模块8、显示模块9连接,用于通过单片机控制各个模块正常工作;
网络通信模块4,与中央控制模块3连接,用于通过网卡连接互联网进行远程日语教学数据通信操作;
语音翻译模块5,与中央控制模块3连接,用于通过语音翻译器对日语语音进行识别翻译;
文本翻译模块6,与中央控制模块3连接,用于通过翻译程序对输入的日语文本进行翻译;
大数据处理模块7,与中央控制模块3连接,用于通过云服务器集中大数据资源对采集的日语教学视频进行处理分析;
存储模块8,与中央控制模块3连接,用于通过存储器存储采集的日语教学视频数据;
显示模块9,与中央控制模块3连接,用于通过触控显示器显示日语教学交互系统界面及日语教学视频内容。
在本发明实施例中,本发明提供的语音翻译模块5翻译方法如下:
(1)从原始语音信息中提取出原始声纹;
(2)对所述原始语音信息进行翻译处理,获得翻译信息;
(3)将所述翻译信息和所述原始声纹合成为最终语音信息。
本发明提供的翻译信息为目标语音信息,所述将所述翻译信息和所述原始声纹合成为最终语音信息的步骤包括:
剔除所述目标语音信息中的预设声纹,得到无声纹的目标语音信息;
将所述原始声纹合成到所述无声纹的目标语音信息中,生成最终语音信息。
本发明提供的剔除所述目标语音信息中的预设声纹的步骤包括:
从所述目标语音信息中提取出预设声纹;
对所述目标语音信息和所述预设声纹做信号减法运算,得到无声纹的目标语音信息。
本发明提供的将所述原始声纹合成到所述无声纹的目标语音信息中,生成最终语音信息的步骤包括:
对所述原始声纹和所述无声纹的目标语音信息做信号加法运算,得到最终语音信息。
本发明提供的对所述原始语音信息进行翻译处理,获得翻译信息的步骤包括:
向第一服务器发送所述原始语音信息,以使所述第一服务器将所述原始语音信息翻译处理为目标语音信息;
接收所述第一服务器返回的所述目标语音信息。
本发明提供的文本翻译模块6翻译方法如下:
1)获取源文本对应的音素序列编码向量及词序列向量;其中,所述源文本对应的音素序列编码向量由所述源文本中每一分词对应的音素编码向量所构成,所述源文本对应的词序列向量由所述源文本中每一分词对应的词向量所构成,所述源文本对应的音素序列编码向量中包含的音素编码向量数与所述源文本对应的词序列向量中包含的词向量数相同;
2)将所述源文本对应的音素序列编码向量与词序列向量输入至翻译模型,输出得到所述源文本对应的目标文本。
在本发明实施例中,本发明提供的获取源文本中每一分词对应的音素编码向量,包括:
获取所述源文本中每一分词对应的音素序列中最后一个音素的编码向量,并作为每一分词对应的音素编码向量。
本发明提供的获取源文本中每一分词对应的音素编码向量,包括:
对所述源文本对应的音素序列作卷积处理,得到卷积向量;
根据所述卷积向量的维度及所述源文本对应的词序列向量中包含的词向量数,确定池化处理的窗口尺寸;
基于所述窗口尺寸对所述卷积向量作池化处理,得到每一分词对应的音素序列编码向量。
本发明提供的根据所述卷积向量的维度及所述源文本对应的词序列向量中包含的词向量数,确定池化处理的窗口尺寸,包括:
计算所述卷积向量的维度与所述源文本对应的词序列向量中包含的词向量数之间的比值,对计算得到的比值向上取整,将得到的整数值作为池化处理的窗口尺寸。
本发明提供的将所述源文本对应的音素序列编码向量与词序列向量输入至翻译模型,输出得到所述源文本对应的目标文本,包括:
将所述源文本中每一分词对应的音素编码向量与每一分词对应的词向量进行拼接,得到每一分词对应的特征向量,将每一分词对应的特征向量输入至翻译模型,输出得到所述源文本对应的目标文本。
在本发明实施例中,步骤六中触控显示器显示日语教学交互系统界面及日语教学视频内容,同时进行人机交互;人机交互的方法包括:
步骤一,系统初始化:
用户A与用户B在首次登录系统时进行初始化;
用户A与用户B在完成初始化后即进行登陆系统,登陆过程如下:
用户登录系统,用户界面将自动获取存储于第三方存储机构的密钥文件,并通过对注册信息进行哈希计算获取到口令密钥,通过口令密钥解密密钥文件,对密钥文件进行解析后分别获得用户主密钥与用户私钥,并将主密钥与私钥存储于用户界面;
用户界面初拟关键指标集合;
精炼同层指标和计算权重;
计算跨层指标权重;
初拟关键指标集合的过程为:在具有N个专家参与系统评估的场景中,专家i给出的指标类型为:
其中,Ni是一个多指标的集合,指专家i给出的指标j的权重,表示指标类型个数,表示指标类型个数,M表示最多指标数量,N个专家形成该系统的总的指标集合为N'={Ni,i=1,...,N};
精炼同层指标和计算权重的过程为:在具有N个专家参与系统评估的场景中,根据所述N个专家形成的系统的总的指标集合为N'={Ni,i=1,...,N},求解公共的关键指标类型和相应指标的权重,其中精炼后的指标类型记作N0,则其中表示N个专家给出的指标类型Ni,i=1,...,N的交集;精炼后的关键指标的权重向量采用平均法计算,即其中表示第j个被加入到精炼后指标集合N0中的指标元素的权重;
步骤二,文件加密上传;
步骤三,密文共享;
步骤四,文件下载解密;
步骤五,注销:
当需要注销时,用户界面会自动清除存储于用户界面的主密钥与用户私钥。
在本发明实施例中,在步骤一中所述初始化过程包括:
第一步,用户进入注册界面,按要求提供用户名与口令进行注册,然后用户界面会根据注册信息在用户界面通过哈希函数生成符合对称加密密钥长度要求的用户口令密钥;
第二步,用户界面会通过本地函数调用在本地生成大小为m的安全随机数,随机数作为用户的主密钥,m的大小根据对称加密算法对密钥长度的要求来进行确定,与此同时也在本地生成用户的非对称加密的密钥对;
第三步,将生成的用户主密钥与用户私钥通过口令密钥进行加密,生成密文状态的密钥文件,将文件通过编码后上传至第三方平台机构进行存储,存储至用户注册信息列表中;
第四步,将生成的公钥直接上传至用户注册信息列表中,进行存储从而完成注册;
在步骤二中所述文件上传过程包括:
第一步,用户A选择需要加密上传的文件,然后由用户界面随机生成一个安全的随机数,长度符合对称加密密钥长度,将随机数作为文件密钥;
第二步,通过使用文件密钥对所选文件进行加密,并将加密结果缓存在本地;
第三步,文件密钥通过用户主密钥进行加密,并且将加密后的文件密钥通过文件拼接的方式拼接到通过第二步加密后的文件前,组成一个新的文件,前m字节为加密后的文件密钥,m字节后为加密后的文件内容;
第四步,用户A将新组成的加密文件上传至服务端进行存储;
在步骤三中所述文件共享具体包括:
第一步,用户A首先在自己的存储空间内选择需要共享的文件,设置文件属性为共享,提供用户查询的窗口,当用户A在窗口内输入用户B的用户名后用户界面自动发送查询请求到服务端查询用户B是否存在,如果用户B存在则将返回一个确认信息以及用户B的公钥;
第二步,用户A通过发送请求获取当前所要共享文件的加密后的文件密钥,第三方平台机构接收到请求后则会将第三方平台机构中存储的当前文件密态的文件密钥发送给用户A;
第三步,用户A接收到文件的文件密钥后,通过存储在本地的主密钥解密获取文件的明文状态的文件密钥;
第四步,通过使用在第一步中获取到的用户B的公钥对明文的文件密钥进行加密处理,形成新密态的文件密钥;
第五步,用户A的用户界面自动将新加密得到的密钥通过可视化编码为字符串,然后将编码后的密钥上传到第三方平台机构,并在共享文件信息列表中插入一条记录用来存储密钥以及相关信息;
第六步,第三方平台机构根据共享文件信息列表对用户B进行文件标记,使得用户B能够在自己的存储空间中看到并识别出共享文件;
在步骤四中所述文件下载具体包括:
共享文件的下载解密:
第一步,用户B在自己的文件列表内选择接受到的共享文件,发送下载请求;
第二步,第三方平台机构根据下载请求判断该文件是否为共享文件,如果是共享文件则将存储于共享文件信息列表中的文件密钥发送给用户B,同时将请求的共享文件发送到用户B进行缓存;
第三步,用户界面将使用获取到的用户私钥对第二步中获取到的文件密钥进行解密,从而获取到文件密钥,通过使用文件密钥对文件进行解密获取到明文的原始文件;
非共享文件的下载解密:
第一步,用户A或者B选择需下载的非共享文件,发送下载请求;
第二步,第三方平台机构根据下载请求判断该文件是否为共享文件,如果不是共享文件,则将请求的文件发送到用户A或者B进行缓存;
第三步,用户界面获取缓存的文件头部信息,并通过用户的主密钥解密头部信息,获取得到明文的文件密钥,通过明文的文件密钥解密获取明文的原始文件,从而完成下载。
以上所述仅是对本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所做的任何简单修改,等同变化与修饰,均属于本发明技术方案的范围内。

Claims (10)

1.一种基于大数据分析的远程日语教学交互方法,其特征在于,所述基于大数据分析的远程日语教学交互方法包括:
步骤一,通过教学视频采集模块利用摄像头采集日语教学视频数据;通过输入模块利用输入键盘输入操作指令及待翻译文本;
步骤二,中央控制模块通过网络通信模块利用网卡连接互联网进行远程日语教学数据通信操作;
步骤三,通过语音翻译模块利用语音翻译器对日语语音进行识别翻译;通过文本翻译模块利用翻译程序对输入的日语文本进行翻译;
步骤四,通过大数据处理模块利用云服务器集中大数据资源对采集的日语教学视频进行处理分析;
步骤五,通过存储模块利用存储器存储采集的日语教学视频数据;
步骤六,通过显示模块利用触控显示器显示日语教学交互系统界面及日语教学视频内容。
2.如权利要求1所述的基于大数据分析的远程日语教学交互方法,其特征在于,所述语音翻译模块翻译方法包括:
(1)从原始语音信息中提取出原始声纹;
(2)对所述原始语音信息进行翻译处理,获得翻译信息;
(3)将所述翻译信息和所述原始声纹合成为最终语音信息。
3.如权利要求2所述的基于大数据分析的远程日语教学交互方法,其特征在于,所述翻译信息为目标语音信息,所述将所述翻译信息和所述原始声纹合成为最终语音信息的步骤包括:
剔除所述目标语音信息中的预设声纹,得到无声纹的目标语音信息;
将所述原始声纹合成到所述无声纹的目标语音信息中,生成最终语音信息。
4.如权利要求3所述的基于大数据分析的远程日语教学交互方法,其特征在于,所述剔除所述目标语音信息中的预设声纹的步骤包括:
从所述目标语音信息中提取出预设声纹;
对所述目标语音信息和所述预设声纹做信号减法运算,得到无声纹的目标语音信息。
5.如权利要求3所述的基于大数据分析的远程日语教学交互方法,其特征在于,所述将所述原始声纹合成到所述无声纹的目标语音信息中,生成最终语音信息的步骤包括:
对所述原始声纹和所述无声纹的目标语音信息做信号加法运算,得到最终语音信息;
所述对所述原始语音信息进行翻译处理,获得翻译信息的步骤包括:
向第一服务器发送所述原始语音信息,以使所述第一服务器将所述原始语音信息翻译处理为目标语音信息;
接收所述第一服务器返回的所述目标语音信息。
6.如权利要求1所述的基于大数据分析的远程日语教学交互方法,其特征在于,所述文本翻译模块翻译方法包括:
1)获取源文本对应的音素序列编码向量及词序列向量;其中,所述源文本对应的音素序列编码向量由所述源文本中每一分词对应的音素编码向量所构成,所述源文本对应的词序列向量由所述源文本中每一分词对应的词向量所构成,所述源文本对应的音素序列编码向量中包含的音素编码向量数与所述源文本对应的词序列向量中包含的词向量数相同;
2)将所述源文本对应的音素序列编码向量与词序列向量输入至翻译模型,输出得到所述源文本对应的目标文本;
所述获取源文本中每一分词对应的音素编码向量,包括:
获取所述源文本中每一分词对应的音素序列中最后一个音素的编码向量,并作为每一分词对应的音素编码向量;
所述获取源文本中每一分词对应的音素编码向量,包括:
对所述源文本对应的音素序列作卷积处理,得到卷积向量;
根据所述卷积向量的维度及所述源文本对应的词序列向量中包含的词向量数,确定池化处理的窗口尺寸;
基于所述窗口尺寸对所述卷积向量作池化处理,得到每一分词对应的音素序列编码向量。
7.如权利要求6所述的基于大数据分析的远程日语教学交互方法,其特征在于,所述根据所述卷积向量的维度及所述源文本对应的词序列向量中包含的词向量数,确定池化处理的窗口尺寸,包括:
计算所述卷积向量的维度与所述源文本对应的词序列向量中包含的词向量数之间的比值,对计算得到的比值向上取整,将得到的整数值作为池化处理的窗口尺寸;
所述将所述源文本对应的音素序列编码向量与词序列向量输入至翻译模型,输出得到所述源文本对应的目标文本,包括:
将所述源文本中每一分词对应的音素编码向量与每一分词对应的词向量进行拼接,得到每一分词对应的特征向量,将每一分词对应的特征向量输入至翻译模型,输出得到所述源文本对应的目标文本。
8.如权利要求1所述的基于大数据分析的远程日语教学交互方法,其特征在于,步骤六中触控显示器显示日语教学交互系统界面及日语教学视频内容,同时进行人机交互;人机交互的方法包括:
步骤一,系统初始化:
用户A与用户B在首次登录系统时进行初始化;
用户A与用户B在完成初始化后即进行登陆系统,登陆过程如下:
用户登录系统,用户界面将自动获取存储于第三方存储机构的密钥文件,并通过对注册信息进行哈希计算获取到口令密钥,通过口令密钥解密密钥文件,对密钥文件进行解析后分别获得用户主密钥与用户私钥,并将主密钥与私钥存储于用户界面;
用户界面初拟关键指标集合;
精炼同层指标和计算权重;
计算跨层指标权重;
初拟关键指标集合的过程为:在具有N个专家参与系统评估的场景中,专家i给出的指标类型为:
其中,Ni是一个多指标的集合,指专家i给出的指标j的权重,表示指标类型个数,表示指标类型个数,M表示最多指标数量,N个专家形成该系统的总的指标集合为N'={Ni,i=1,...,N};
精炼同层指标和计算权重的过程为:在具有N个专家参与系统评估的场景中,根据所述N个专家形成的系统的总的指标集合为N'={Ni,i=1,...,N},求解公共的关键指标类型和相应指标的权重,其中精炼后的指标类型记作N0,则其中表示N个专家给出的指标类型Ni,i=1,...,N的交集;精炼后的关键指标的权重向量采用平均法计算,即其中表示第j个被加入到精炼后指标集合N0中的指标元素的权重;
步骤二,文件加密上传;
步骤三,密文共享;
步骤四,文件下载解密;
步骤五,注销:
当需要注销时,用户界面会自动清除存储于用户界面的主密钥与用户私钥。
9.如权利要求8所述的基于大数据分析的远程日语教学交互方法,其特征在于,在步骤三中所述文件共享具体包括:
第一步,用户A首先在自己的存储空间内选择需要共享的文件,设置文件属性为共享,提供用户查询的窗口,当用户A在窗口内输入用户B的用户名后用户界面自动发送查询请求到服务端查询用户B是否存在,如果用户B存在则将返回一个确认信息以及用户B的公钥;
第二步,用户A通过发送请求获取当前所要共享文件的加密后的文件密钥,第三方平台机构接收到请求后则会将第三方平台机构中存储的当前文件密态的文件密钥发送给用户A;
第三步,用户A接收到文件的文件密钥后,通过存储在本地的主密钥解密获取文件的明文状态的文件密钥;
第四步,通过使用在第一步中获取到的用户B的公钥对明文的文件密钥进行加密处理,形成新密态的文件密钥;
第五步,用户A的用户界面自动将新加密得到的密钥通过可视化编码为字符串,然后将编码后的密钥上传到第三方平台机构,并在共享文件信息列表中插入一条记录用来存储密钥以及相关信息;
第六步,第三方平台机构根据共享文件信息列表对用户B进行文件标记,使得用户B能够在自己的存储空间中看到并识别出共享文件。
10.一种实施权利要求1所述基于大数据分析的远程日语教学交互方法的基于大数据分析的远程日语教学交互系统,其特征在于,所述基于大数据分析的远程日语教学交互系统包括:
教学视频采集模块,与中央控制模块连接,用于通过摄像头采集日语教学视频数据;
输入模块,与中央控制模块连接,用于通过输入键盘输入操作指令及待翻译文本;
中央控制模块,与教学视频采集模块、输入模块、网络通信模块、语音翻译模块、文本翻译模块、大数据处理模块、存储模块、显示模块连接,用于通过单片机控制各个模块正常工作;
网络通信模块,与中央控制模块连接,用于通过网卡连接互联网进行远程日语教学数据通信操作;
语音翻译模块,与中央控制模块连接,用于通过语音翻译器对日语语音进行识别翻译;
文本翻译模块,与中央控制模块连接,用于通过翻译程序对输入的日语文本进行翻译;
大数据处理模块,与中央控制模块连接,用于通过云服务器集中大数据资源对采集的日语教学视频进行处理分析;
存储模块,与中央控制模块连接,用于通过存储器存储采集的日语教学视频数据;
显示模块,与中央控制模块连接,用于通过触控显示器显示日语教学交互系统界面及日语教学视频内容。
CN201811552944.4A 2018-12-19 2018-12-19 一种基于大数据分析的远程日语教学交互系统及交互方法 Pending CN110119513A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811552944.4A CN110119513A (zh) 2018-12-19 2018-12-19 一种基于大数据分析的远程日语教学交互系统及交互方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811552944.4A CN110119513A (zh) 2018-12-19 2018-12-19 一种基于大数据分析的远程日语教学交互系统及交互方法

Publications (1)

Publication Number Publication Date
CN110119513A true CN110119513A (zh) 2019-08-13

Family

ID=67520229

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811552944.4A Pending CN110119513A (zh) 2018-12-19 2018-12-19 一种基于大数据分析的远程日语教学交互系统及交互方法

Country Status (1)

Country Link
CN (1) CN110119513A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110688556A (zh) * 2019-09-21 2020-01-14 郑州工程技术学院 一种基于大数据分析的远程日语教学交互系统及交互方法
CN111401330A (zh) * 2020-04-26 2020-07-10 四川自由健信息科技有限公司 教学系统及采用该教学系统的智能镜
CN112051771A (zh) * 2020-09-01 2020-12-08 北京视界云天科技有限公司 多云数据采集方法、装置、计算机设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101382937A (zh) * 2008-07-01 2009-03-11 深圳先进技术研究院 基于语音识别的多媒体资源处理方法及其在线教学系统
CN103714727A (zh) * 2012-10-06 2014-04-09 南京大五教育科技有限公司 一种人机互动的外语学习系统和方法
CN104598739A (zh) * 2015-01-26 2015-05-06 西安电子科技大学 一种面向网络整体效能的指标体系构建方法
CN106875764A (zh) * 2017-04-26 2017-06-20 北京大生在线科技有限公司 基于网络的虚拟现实外语学习系统及控制方法
CN107749296A (zh) * 2017-10-12 2018-03-02 深圳市沃特沃德股份有限公司 语音翻译方法和装置
CN108170686A (zh) * 2017-12-29 2018-06-15 科大讯飞股份有限公司 文本翻译方法及装置
CN108259173A (zh) * 2018-01-23 2018-07-06 武汉城市职业学院 一种基于物联网的移动智慧校园系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101382937A (zh) * 2008-07-01 2009-03-11 深圳先进技术研究院 基于语音识别的多媒体资源处理方法及其在线教学系统
CN103714727A (zh) * 2012-10-06 2014-04-09 南京大五教育科技有限公司 一种人机互动的外语学习系统和方法
CN104598739A (zh) * 2015-01-26 2015-05-06 西安电子科技大学 一种面向网络整体效能的指标体系构建方法
CN106875764A (zh) * 2017-04-26 2017-06-20 北京大生在线科技有限公司 基于网络的虚拟现实外语学习系统及控制方法
CN107749296A (zh) * 2017-10-12 2018-03-02 深圳市沃特沃德股份有限公司 语音翻译方法和装置
CN108170686A (zh) * 2017-12-29 2018-06-15 科大讯飞股份有限公司 文本翻译方法及装置
CN108259173A (zh) * 2018-01-23 2018-07-06 武汉城市职业学院 一种基于物联网的移动智慧校园系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110688556A (zh) * 2019-09-21 2020-01-14 郑州工程技术学院 一种基于大数据分析的远程日语教学交互系统及交互方法
CN111401330A (zh) * 2020-04-26 2020-07-10 四川自由健信息科技有限公司 教学系统及采用该教学系统的智能镜
CN111401330B (zh) * 2020-04-26 2023-10-17 四川自由健信息科技有限公司 教学系统及采用该教学系统的智能镜
CN112051771A (zh) * 2020-09-01 2020-12-08 北京视界云天科技有限公司 多云数据采集方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN110597991B (zh) 文本分类方法、装置、计算机设备及存储介质
CN110598651B (zh) 一种信息处理方法、装置及存储介质
WO2021031480A1 (zh) 文本生成方法和装置
CN110444196A (zh) 基于同声传译的数据处理方法、装置、系统和存储介质
CN110188182A (zh) 模型训练方法、对话生成方法、装置、设备及介质
CN109783657A (zh) 基于受限文本空间的多步自注意力跨媒体检索方法及系统
CN110597963B (zh) 表情问答库的构建方法、表情搜索方法、装置及存储介质
CN110119513A (zh) 一种基于大数据分析的远程日语教学交互系统及交互方法
CA2929018A1 (en) Natural expression processing method, processing and response method, device and system
CN112687259A (zh) 一种语音合成方法、装置以及可读存储介质
CN113014732A (zh) 会议记录处理方法、装置、计算机设备和存储介质
CN104021326B (zh) 一种外语教学方法与外语教具
CN113722987B (zh) 联邦学习模型的训练方法、装置、电子设备和存储介质
CN113127652A (zh) 一种摘要获取方法、设备及计算机可读存储介质
Mehta et al. Automated 3D sign language caption generation for video
CN112749561A (zh) 一种实体识别方法及设备
CN110600004A (zh) 一种语音合成播放方法、装置和存储介质
CN114419527B (zh) 一种数据处理方法、设备以及计算机可读存储介质
CN117271745A (zh) 一种信息处理方法、装置及计算设备、存储介质
CN111143454B (zh) 一种文本输出方法、装置及可读存储介质
CN111414609B (zh) 一种对象验证方法和装置
CN113889130A (zh) 一种语音转换方法、装置、设备及介质
CN114329064A (zh) 视频处理方法、装置、计算机设备及存储介质
CN113033209A (zh) 文本关系抽取方法、装置、存储介质及计算机设备
Sanyal et al. Study of holoportation: using network errors for improving accuracy and efficiency

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190813

WD01 Invention patent application deemed withdrawn after publication