CN117521680A - 一种记录仪的在线翻译方法及记录仪 - Google Patents

一种记录仪的在线翻译方法及记录仪 Download PDF

Info

Publication number
CN117521680A
CN117521680A CN202410010484.1A CN202410010484A CN117521680A CN 117521680 A CN117521680 A CN 117521680A CN 202410010484 A CN202410010484 A CN 202410010484A CN 117521680 A CN117521680 A CN 117521680A
Authority
CN
China
Prior art keywords
context
text
information
vector
context information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410010484.1A
Other languages
English (en)
Inventor
崔金涛
崔优生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Hecheng Video Technology Co ltd
Original Assignee
Shenzhen Hecheng Video Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Hecheng Video Technology Co ltd filed Critical Shenzhen Hecheng Video Technology Co ltd
Priority to CN202410010484.1A priority Critical patent/CN117521680A/zh
Publication of CN117521680A publication Critical patent/CN117521680A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation

Abstract

本发明涉及记录仪技术领域,特别涉及一种记录仪的在线翻译方法及记录仪。本发明通过第一用户的第一语音数据生成第一文本数据,通过提取第一文本数据中第一多义词的多个第一文本释义,并根据第一多义词的第一上文信息、第一下文信息和第一上下文语境信息获取每个第一文本释义的第一逻辑关系值,再通过选择第一逻辑关系值最高的第一文本释义来确定第一多义词的目标释义,从而这样可以通过结合上下文的语境等信息可以使得对第一多义词的翻译在特定语境中的目标释义的选择更为准确,而通过对每个第一文本释义计算第一逻辑关系值,有助于量化各个第一多义词的第一文本释义在上下文语境中的合理性,有助于系统更准确地选择目标释义,提高翻译的准确性。

Description

一种记录仪的在线翻译方法及记录仪
技术领域
本发明涉及记录仪技术领域,特别涉及一种记录仪的在线翻译方法及记录仪。
背景技术
记录仪通常被拍摄人员在工作时随身佩戴,它集成了实时视音频摄录、照相、录影等功能于一体,同时也可能具备对讲、定位、存储等功能。而随着电子技术以及互联网技术迅速发展,也促进文化交融进行火热发展,在实际应用中,随着国际性交流和区域性交流的增加,使用不同语种的语言沟通越来越频繁,因此记录仪对翻译的需求也越来越大。
然而当双方的母语不同时,现有的记录仪在线翻译一般是将用户的语音识别为文字信息,然后将文字信息基于翻译数据库进行翻译成对方母语的语音信息或文字信息提供给对方,从而可以为使用不同语言的用户双方提供翻译服务,使双方进行顺利沟通,但是由于一些语音字词存在多义性,在对这些语音字词翻译时可能会存在翻译不准确的情况,进而导致会出现在跨语言交流中沟通不畅的现象。
发明内容
本发明的主要目的为提供一种记录仪的在线翻译方法,旨在解决现有技术中的技术问题。
本发明提出一种记录仪的在线翻译方法,包括:
获取第一用户的第一语音数据,并根据自然语音处理技术对所述第一语音数据进行语种识别,得到第一语种;
根据所述第一语音数据生成第一文本数据,提取所述第一文本数据中的第一多义词,并获取所述第一多义词的多个第一文本释义;
根据所述第一多义词获取该第一多义词的第一上文信息和第一下文信息,并根据所述第一上文信息和第一下文信息获取第一上下文语境信息;
根据所述第一上文信息、第一下文信息和第一上下文语境信息获取每个第一文本释义的第一逻辑关系值;
选择第一逻辑关系值最高的第一文本释义,并根据该所述第一文本释义确定第一多义词的目标释义;
获取第二用户的第二语种,根据所述第二语种和所述第一语种从翻译数据库中进行匹配,得到语种翻译类型;
根据所述语种翻译类型将所述第一文本数据和第一多义词的目标释义转化为第二语种的第二语音数据。
作为优选,所述根据所述第一上文信息和第一下文信息获取第一上下文语境信息的步骤,包括:
根据所述第一上文信息和第一下文信息分别获取上文关键词和下文关键词;
提取所述上文关键词和下文关键词中具有相同释义的同义关键词,其中,所述同义关键词包括连接词和过渡词;
根据所述连接词和过渡词获取上下文逻辑连接信息;
根据所述第一上文信息和第一下文信息分别获取上文段落结构信息和下文段落结构信息;
根据所述上文段落结构信息和下文段落结构信息获取上下文逻辑转折信息;
根据所述上下文逻辑转折信息和上下文逻辑连接信息获取上下文核心主题,并根据所述上下文核心主题获取第一上下文语境信息。
作为优选,所述根据所述第一上文信息、第一下文信息和第一上下文语境信息获取每个第一文本释义的第一逻辑关系值的步骤,包括:
将每个所述第一文本释义输入至第一上文信息中,得到上文输入表示,并提取所述上文输入表示的第一特征向量;
将每个所述第一文本释义输入至第一下文信息中,得到下文输入表示,并提取所述下文输入表示的第二特征向量;
根据每个所述第一文本释义和所述第一上下文语境信息获取上下文语境表示,并提取所述上下文语境表示的特征向量值;
根据所述第一特征向量和第二特征向量获取上下文相似度值;
根据所述上下文相似度值和特征向量值计算每个第一文本释义的第一逻辑关系值,其中,计算公式为:
其中,f(x)表示第一逻辑关系值,d(3)表示特征向量值,b(3)表示特征向量值权重,a表示上下文相似度值权重,x(s)上下文相似度值。
作为优选,所述根据所述第一特征向量和第二特征向量获取上下文相似度值的步骤,包括:
根据所述第一特征向量获取第一向量范数;
根据所述第二特征向量获取第二向量范数;
根据所述第二向量范数和第一向量范数获取平均向量范数,并根据所述平均向量范数对第一特征向量和第二特征向量进行标准化,得到第一标准向量和第二标准向量;
根据所述第一标准向量、第二标准向量和平均向量范数计算上下文相似度值,其中,计算公式为:
其中,x(s)上下文相似度值,p(x)表示平均向量范数,Bx(1)表示第一标准向量,Bx(2)表示第二标准向量。
作为优选,所述根据所述第二向量范数和第一向量范数获取平均向量范数,并根据所述平均向量范数对第一特征向量和第二特征向量进行标准化,得到第一标准向量和第二标准向量的步骤,包括:
根据第二向量范数和第一向量范数计算平均向量范数,其中,计算公式为:
其中,p(x)表示平均向量范数,Xf(1)表示第一向量范数,Xf(2)表示第二向量范数;
根据所述平均向量范数和第一特征向量计算第一标准向量的公式为:
其中,Bx(1)表示第一标准向量,p(x)表示平均向量范数,d(1)表示第一特征向量;
根据所述平均向量范数和第一特征向量计算第一标准向量的公式为:
其中,Bx(2)表示第一标准向量,p(x)表示平均向量范数,d(2)表示第二特征向量。
作为优选,所述根据所述语种翻译类型将所述第一文本数据和第一多义词的目标释义转化为第二语种的第二语音数据的步骤,包括:
根据所述语种翻译类型将所述第一文本数据翻译为第二语种的初步文本数据;
提取所述初步文本数据中与第一多义词的目标释义相对应的第二多义词,并获取所述第二多义词的多个第二文本释义;
根据所述第二多义词获取该第二多义词的第二上文信息和第二下文信息,并根据所述第二上文信息和第二下文信息获取第二上下文语境信息;
根据所述第二上文信息、第二下文信息和第二上下文语境信息获取每个第二文本释义的第二逻辑关系值,选择第二逻辑关系值最高的第二文本释义,并根据该所述第二文本释义确定第二多义词的目标释义;
根据所述语种翻译类型将所述第二多义词的目标释义翻译为第二语种的第二多义词目标文本数据;
将所述初步文本数据中第二多义词的初步文本数据替换为第二多义词目标文本数据,得到第二文本数据;
将所述第二文本数据通过自然语言技术转化为第二语音数据。
本申请还提供一种记录仪,包括:
第一获取模块,用于获取第一用户的第一语音数据,并根据自然语音处理技术对所述第一语音数据进行语种识别,得到第一语种;
提取模块,用于根据所述第一语音数据生成第一文本数据,提取所述第一文本数据中的第一多义词,并获取所述第一多义词的多个第一文本释义;
第二获取模块,用于根据所述第一多义词获取该第一多义词的第一上文信息和第一下文信息,并根据所述第一上文信息和第一下文信息获取第一上下文语境信息;
第三获取模块,用于根据所述第一上文信息、第一下文信息和第一上下文语境信息获取每个第一文本释义的第一逻辑关系值;
确定模块,用于选择第一逻辑关系值最高的第一文本释义,并根据该所述第一文本释义确定第一多义词的目标释义;
匹配模块,用于获取第二用户的第二语种,根据所述第二语种和所述第一语种从翻译数据库中进行匹配,得到语种翻译类型;
翻译模块,用于根据所述语种翻译类型将所述第一文本数据和第一多义词的目标释义转化为第二语种的第二语音数据。
作为优选,所述第二获取模块,包括:
第一获取单元,用于根据所述第一上文信息和第一下文信息分别获取上文关键词和下文关键词;
提取单元,用于提取所述上文关键词和下文关键词中具有相同释义的同义关键词,其中,所述同义关键词包括连接词和过渡词;
第二获取单元,用于根据所述连接词和过渡词获取上下文逻辑连接信息;
第三获取单元,用于根据所述第一上文信息和第一下文信息分别获取上文段落结构信息和下文段落结构信息;
第四获取单元,用于根据所述上文段落结构信息和下文段落结构信息获取上下文逻辑转折信息;
第五获取单元,用于根据所述上下文逻辑转折信息和上下文逻辑连接信息获取上下文核心主题,并根据所述上下文核心主题获取第一上下文语境信息。
本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述一种记录仪的在线翻译方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种记录仪的在线翻译方法的步骤。
本发明的有益效果为:本发明通过第一用户的第一语音数据生成第一文本数据,通过提取第一文本数据中第一多义词的多个第一文本释义,并根据第一多义词的第一上文信息、第一下文信息和第一上下文语境信息获取每个第一文本释义的第一逻辑关系值,再通过选择第一逻辑关系值最高的第一文本释义来确定第一多义词的目标释义,从而这样可以通过结合上下文的语境等信息可以使得对第一多义词的翻译在特定语境中的目标释义的选择更为准确,而通过对每个第一文本释义计算第一逻辑关系值,有助于量化各个第一多义词的第一文本释义在上下文语境中的合理性,有助于系统更准确地选择目标释义,提高翻译的准确性。
附图说明
图1为本发明一实施例的方法流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本申请提供一种记录仪的在线翻译方法,包括:
S1、获取第一用户的第一语音数据,并根据自然语音处理技术对所述第一语音数据进行语种识别,得到第一语种;
S2、根据所述第一语音数据生成第一文本数据,提取所述第一文本数据中的第一多义词,并获取所述第一多义词的多个第一文本释义;
S3、根据所述第一多义词获取该第一多义词的第一上文信息和第一下文信息,并根据所述第一上文信息和第一下文信息获取第一上下文语境信息;
S4、根据所述第一上文信息、第一下文信息和第一上下文语境信息获取每个第一文本释义的第一逻辑关系值;
S5、选择第一逻辑关系值最高的第一文本释义,并根据该所述第一文本释义确定第一多义词的目标释义;
S6、获取第二用户的第二语种,根据所述第二语种和所述第一语种从翻译数据库中进行匹配,得到语种翻译类型;
S7、根据所述语种翻译类型将所述第一文本数据和第一多义词的目标释义转化为第二语种的第二语音数据。
如上述步骤S1-S7所述,记录仪是一种便携式摄像设备,通常由用户佩戴在身上,用于记录和存储工作活动中的视频和音频信息。这类设备在安全和监管领域得到广泛应用,其设计旨在提高透明度、责任和证据的可信度,记录仪主要用于录制高质量的视频,以记录用户的行为、交互和事件,许多记录仪也配备了内置麦克风,用于录制周围环境的音频,记录仪的使用对提高公众信任以及维护社会秩序都起到了积极的作用,记录仪通常被拍摄人员在工作时随身佩戴,它集成了实时视音频摄录、照相、录影等功能于一体,同时也可能具备对讲、定位、存储等功能。而随着电子技术以及互联网技术迅速发展,也促进文化交融进行火热发展,在实际应用中,随着国际性交流和区域性交流的增加,使用不同语种的语言沟通越来越频繁,因此记录仪对翻译的需求也越来越大,然而当双方的母语不同时,现有的记录仪在线翻译一般是将用户的语音识别为文字信息,然后将文字信息基于翻译数据库进行翻译成对方母语的语音信息或文字信息提供给对方,从而可以为使用不同语言的用户双方提供翻译服务,使双方进行顺利沟通,但是由于一些语音字词存在多义性,在对这些语音字词翻译时可能会存在翻译不准确的情况,进而导致会出现在跨语言交流中沟通不畅的现象。而本发明通过第一用户的第一语音数据生成第一文本数据,其中,第一用户即可以为记录仪的使用者也可以是记录仪面向的对象,但是当第一用户为记录仪的使用者时,则第二用户即为记录仪面向的对象,同理若第一用户为记录仪面向的对象时,则第二用户即为记录仪的使用者,通过提取第一文本数据中第一多义词的多个第一文本释义,通过结合第一上下文的语境等信息可以使得对第一多义词的翻译在特定语境中的目标释义的选择更为准确,并根据第一多义词的第一上文信息、第一下文信息和第一上下文语境信息获取每个第一文本释义的第一逻辑关系值,再通过选择第一逻辑关系值最高的第一文本释义来确定第一多义词的目标释义,而通过对每个第一文本释义计算第一逻辑关系值,有助于量化各个第一多义词的第一文本释义在第一上下文语境中的合理性,有助于系统更准确地选择目标释义,提高翻译的准确性,例如,第一用户为被采访者,第二用户为采访者,其中被采访者与采访者的母语不同,通过获取采访者的第一语音数据,并根据自然语音处理技术对所述第一语音数据进行语种识别得到第一语种,其中第一语种为英文,进而根据第一语音数据生成第一文本数据,例如此时的第一文本数据为“Please wait for a moment; we'llhandle this as quickly as possible. Additionally, we'll mark the detailedinspection on the recording device to ensure transparency throughout theprocess”,然后提取上述第一文本数据中的第一多义词,其中第一多义词为“mark”,然后通过获取“mark”的多个第一文本释义(包括标记和分数),并根据“mark”获取“Please waitfor a moment; we'll handle this as quickly as possible. Additionally”(第一上文信息)和“the detailed inspection on the recording device to ensuretransparency throughout the process”(第一下文信息),并根据“Please wait for amoment; we'll handle this as quickly as possible. Additionally”(第一上文信息)和“the detailed inspection on the recording device to ensure transparencythroughout the process”(第一下文信息)获取“检查和透明度”(第一上下文语境信息),根据上述的“Please wait for a moment; we'll handle this as quickly aspossible. Additionally”(第一上文信息)、“the detailed inspection on therecording device to ensure transparency throughout the process”(第一下文信息)和“检查和透明度”(第一上下文语境信息)分别获取“标记”和“分数”的第一逻辑关系值,这里“标记”的第一逻辑关系值最高,则确定第一多义词的目标释义即为“标记”,获取采访者的第二语种,其中第二语种为中文,然后根据英中翻译将“Please wait for a moment;we'll handle this as quickly as possible. Additionally, we'll mark thedetailed inspection on the recording device to ensure transparency throughoutthe process”(第一文本数据)和“mark”(第一多义词的目标释义)转化为第二语种的第二语音数据,即“请您稍等片刻,我们会尽快处理,同时我们会在记录仪上标注检查的详细情况,以确保整个过程的透明度”,最后根据第二用户的第二语种和第一语种从翻译数据库中进行匹配得到语种翻译类型,并根据语种翻译类型将第一文本数据和第一多义词的目标释义转化为第二语种的第二语音数据,有助于实现跨语言的信息传递和沟通,避免翻译时可能会存在翻译不准确的情况。
在一个实施例中,所述根据所述第一上文信息和第一下文信息获取第一上下文语境信息的步骤S3,包括:
S31、根据所述第一上文信息和第一下文信息分别获取上文关键词和下文关键词;
S32、提取所述上文关键词和下文关键词中具有相同释义的同义关键词,其中,所述同义关键词包括连接词和过渡词;
S33、根据所述连接词和过渡词获取上下文逻辑连接信息;
S34、根据所述第一上文信息和第一下文信息分别获取上文段落结构信息和下文段落结构信息;
S35、根据所述上文段落结构信息和下文段落结构信息获取上下文逻辑转折信息;
S36、根据所述上下文逻辑转折信息和上下文逻辑连接信息获取上下文核心主题,并根据所述上下文核心主题获取第一上下文语境信息。
如上述步骤S31-S36所述,本发明通过选择上文信息中具有连接和过渡类的字词为关键词,进而通过提取第一上文信息的上文关键词和第一下文信息下文关键词中具有相同释义的同义关键词,其中,同义关键词包括连接词和过渡词,进而根据连接词和过渡词获取上下文逻辑连接信息,这样通过提取上文关键词,可以获取上文的主题或重点信息,而提取同义关键词的提取可以帮助建立起上下文之间的语境,便于更好地理解上下文,同时连接词和过渡词通常指示不同句子或段落之间的关系,如因果关系、对比关系、顺承关系等,通过识别这些关系,更容易地抽取关键信息,有助于确定信息的层次结构,从而更容易理解主次关系,通过上文段落结构信息和下文段落结构信息得到上下文逻辑转折信息,进而根据上下文逻辑转折信息和上下文逻辑连接信息获取上下文核心主题,并根据上下文核心主题获取第一上下文语境信息,这样通过分析上下文逻辑连接信息和上下文逻辑转折信息,可以更深入地理解文本主题的多个方面,例如,根据第一上文信息“首先请您稍等片刻,然后我们会尽快处理”和第一下文信息“同时我们不仅会在记录仪上记录检查的详细情况,而且还会发您一份详细报告”获取上文关键词“首先、然后”和下文关键词“同时、不仅、而且”,然后提取上文关键词“首先、然后”和下文关键词“同时、不仅、而且”中具有相同释义的同义关键词“然后与同时”,然后根据连接词和过渡词“然后与同时”获取上下文逻辑连接信息,再根据第一上文信息“首先请您稍等片刻,然后我们会尽快处理”和第一下文信息“同时我们不仅会在记录仪上记录检查的详细情况,而且还会发您一份详细报告”分别获取上文段落结构信息(顺序过渡信息)和下文段落结构信息(转折过渡信息),然后根据上文段落结构信息(顺序过渡信息)和下文段落结构信息(转折过渡信息)获取上下文逻辑转折信息(首先等候、然后处理、再处理、最后发送),最后根据所述上下文逻辑转折信息和上下文逻辑连接信息获取上下文核心主题(处理记录),并根据所述上下文核心主题(处理记录)获取第一上下文语境信息即可,由于逻辑转折常常反映了在上下文发展过程中对主题或观点的变化,从而能够更有针对性地筛选和关注文本中的重要信息,通过分析上下文段落结构,能够更准确地把握文本的脉络,降低对第一用户原本意图的误解,且逻辑转折信息有助于确定上下文的核心主题,了解上下文的核心主题有助于更好地理解整个文本的语境。
在一个实施例中,所述根据所述第一上文信息、第一下文信息和第一上下文语境信息获取每个第一文本释义的第一逻辑关系值的步骤S4,包括:
S41、将每个所述第一文本释义输入至第一上文信息中,得到上文输入表示,并提取所述上文输入表示的第一特征向量;
S42、将每个所述第一文本释义输入至第一下文信息中,得到下文输入表示,并提取所述下文输入表示的第二特征向量;
S43、根据每个所述第一文本释义和所述第一上下文语境信息获取上下文语境表示,并提取所述上下文语境表示的特征向量值;
S44、根据所述第一特征向量和第二特征向量获取上下文相似度值;
S45、根据所述上下文相似度值和特征向量值计算每个第一文本释义的第一逻辑关系值,其中,计算公式为:
其中,f(x)表示第一逻辑关系值,d(3)表示特征向量值,b(3)表示特征向量值权重,a表示上下文相似度值权重,x(s)上下文相似度值。
如上述步骤S41-S45所述,本发明中通过将每个第一文本释义分别输入至第一上文信息和第一下文信息中,并分别提取得到的上文输入表示和下文输入表示的第一特征向量和第二特征向量,根据每个第一文本释义和第一上下文语境信息得到上下文语境表示,并提取上下文语境表示的特征向量值,这样通过将第一文本释义与上第一下文信息结合,可以获得更为丰富和全面的语境信息,这有助于更准确地捕捉文本的含义和上下文之间的关系,将第一文本释义分别输入至上文和下文,然后提取特征向量,使得模型能够考虑到文本在不同上下文中可能有不同的语义,这有助于更好地理解文本在不同语境中的含义,通过提取得到的上下文语境表示的特征向量值,可以更好地捕获上下文之间的逻辑关系,通过将第一文本释义输入上第一下文信息,能适应不同的上下文变化,从而提高对字词多义性和歧义性的处理能力,然后根据第一特征向量和第二特征向量获取上下文相似度值,例如,上文输入表示为“请您稍等片刻”,下文输入表示为“我们会尽快处理”,首先,列出所有在这两个文本中出现的独立词汇,然后用一个向量表示每个文本中每个词汇的出现次数,例如,上文输入表示的词汇为“请、您、稍等、片刻”,下文输入表示的词汇为“我们、会、尽快、处理”,则上文输入表示的第一特征向量为[1, 1, 1, 1, 0, 0, 0, 0],下文输入表示的第二特征向量为[0, 0, 0, 0, 1, 1, 1, 1],然后根据[1, 1, 1, 1, 0, 0, 0, 0]和[0, 0,0, 0, 1, 1, 1, 1]获取上下文相似度值,这里上下文相似度值为2,提取上下文语境表示的特征向量值为1,最后根据上下文相似度值2和特征向量值1计算每个第一文本释义的第一逻辑关系值,计算得到第一逻辑关系值为,这样通过获取得到的上下文相似度值提供了一种衡量不同第一文本释义与上下文之间相似度的度量方法,通过计算相似度值,可以量化不同第一文本释义与上下文的语义接近程度,帮助确定每个第一文本释义在语义上的相似程度,通过比较不同第一文本释义与上下文的相似度,可以提高准确性和效果,上下文相似度值有助于解决歧义问题和增强语义理解,当上下文中存在歧义时,通过计算相似度值可以判断不同第一文本释义与上下文的语义匹配程度,从而更准确地解决歧义并理解文本的含义,再根据上下文相似度值和特征向量值计算每个第一文本释义的第一逻辑关系值,这样对于具有多义性的词汇,不同释义在不同语境中可能表现出不同的逻辑关系,通过考虑特征向量值,可以更准确地判断在给定语境下哪种释义更合适,从而提高第一多义词处理的准确性。
在一个实施例中,所述根据所述第一特征向量和第二特征向量获取上下文相似度值的步骤S44,包括:
S441、根据所述第一特征向量获取第一向量范数;
S442、根据所述第二特征向量获取第二向量范数;
S443、根据所述第二向量范数和第一向量范数获取平均向量范数,并根据所述平均向量范数对第一特征向量和第二特征向量进行标准化,得到第一标准向量和第二标准向量;
S444、根据所述第一标准向量、第二标准向量和平均向量范数计算上下文相似度值,其中,计算公式为:
其中,x(s)上下文相似度值,p(x)表示平均向量范数,Bx(1)表示第一标准向量,Bx(2)表示第二标准向量。
如上述步骤S441- S444所述,本发明通过第一特征向量和第二特征向量分别获取第一向量范数和第二向量范数,并根据第一向量范数和第二向量范数得到平均向量范数,再根据平均向量范数对第一特征向量和第二特征向量进行标准化,得到第一标准向量和第二标准向量,进而根据标准化后的第一标准向量、第二标准向量和平均向量范数计算上下文相似度值,由于平均向量范数可以衡量第一特征向量和第二特征向量的大小,通过平均向量范数将第一特征向量和第二特征向量的大小标准化变为单位范数,从而可以消除第一特征向量和第二特征向量大小对于计算的影响,对于相似度的计算尤其重要,且标准化可以减小第一特征向量和第二特征向量中的噪声或异常值对后续计算的影响,在一定程度上稳定化第一特征向量和第二特征向量的表示,而标准化后的第一特征向量和第二特征向量表示更加规范和一致,使得后续的计算第一特征向量和第二特征向量之间的相似度,不需要考虑向量长度的影响,从而简化了计算过程。
在一个实施例中,所述根据所述第二向量范数和第一向量范数获取平均向量范数,并根据所述平均向量范数对第一特征向量和第二特征向量进行标准化,得到第一标准向量和第二标准向量的步骤S443,包括:
S4431、根据第二向量范数和第一向量范数计算平均向量范数,其中,计算公式为:
其中,p(x)表示平均向量范数,Xf(1)表示第一向量范数,Xf(2)表示第二向量范数;
S4432、根据所述平均向量范数和第一特征向量计算第一标准向量的公式为:
其中,Bx(1)表示第一标准向量,p(x)表示平均向量范数,d(1)表示第一特征向量;
S4433、根据所述平均向量范数和第一特征向量计算第一标准向量的公式为:
其中,Bx(2)表示第一标准向量,p(x)表示平均向量范数,d(2)表示第二特征向量。
如上述步骤S4431-S4433所述,本发明通过第二向量范数和第一向量范数计算平均向量范数,并根据平均向量范数和第一特征向量计算第一标准向量,其中平均向量范数和第二特征向量计算第二标准向量的公式算法如同上述平均向量范数和第一特征向量计算第一标准向量公式相同,因此这里不做叙述,这样通过第二向量范数和第一向量范数计算平均向量范数,可以确保第一特征向量和第二特征向量的大小相对一致,使其不受向量大小的影响,提高了数据的一致性,而计算第一标准向量是通过第一特征向量除以平均向量范数,这在涉及到向量表示的语义信息时有助于保持一致性,可以确保在计算过程中避免数值溢出或数值不稳定性,通过平均向量范数的计算和标准化过程,可以在一定程度上消除输入的第一特征向量与第二特征向量之间的尺度差异。
在一个实施例中,所述根据所述语种翻译类型将所述第一文本数据和第一多义词的目标释义转化为第二语种的第二语音数据的步骤S7,包括:
S71、根据所述语种翻译类型将所述第一文本数据翻译为第二语种的初步文本数据;
S72、提取所述初步文本数据中与第一多义词的目标释义相对应的第二多义词,并获取所述第二多义词的多个第二文本释义;
S73、根据所述第二多义词获取该第二多义词的第二上文信息和第二下文信息,并根据所述第二上文信息和第二下文信息获取第二上下文语境信息;
S74、根据所述第二上文信息、第二下文信息和第二上下文语境信息获取每个第二文本释义的第二逻辑关系值,选择第二逻辑关系值最高的第二文本释义,并根据该所述第二文本释义确定第二多义词的目标释义;
S75、根据所述语种翻译类型将所述第二多义词的目标释义翻译为第二语种的第二多义词目标文本数据;
S76、将所述初步文本数据中第二多义词的初步文本数据替换为第二多义词目标文本数据,得到第二文本数据;
S77、将所述第二文本数据通过自然语言技术转化为第二语音数据。
如上述步骤S71-S77所述,本发明根据语种翻译类型将第一文本数据翻译为第二语种的初步文本数据,然后提取初步文本数据中与第一多义词的目标释义相对应的第二多义词,并获取第二多义词的多个第二文本释义,通过结合第二上下文的语境等信息可以使得对第二多义词的翻译在特定语境中的目标释义的选择更为准确,根据第二多义词获取该第二多义词的第二上文信息和第二下文信息,并根据所述第二上文信息和第二下文信息获取第二上下文语境信息,根据第二上文信息、第二下文信息和第二上下文语境信息获取每个第二文本释义的第二逻辑关系值,选择第二逻辑关系值最高的第二文本释义,并根据该所述第二文本释义确定第二多义词的目标释义,而通过对每个第二文本释义计算第二逻辑关系值,有助于量化各个第二多义词的第二文本释义在第二上下文语境中的合理性,有助于系统更准确地选择目标释义,提高翻译的准确性,根据语种翻译类型将第二多义词的目标释义翻译为第二语种的第二多义词目标文本数据,并将得到的第二文本数据通过自然语言技术转化为第二语音数据,其中,具体的举例说明可以参见步骤S1-S7中的详细叙述,这里不做叙述,这样通过将第一多义词释义翻译为目标语种可以确保翻译后的文本在语义上更为准确,避免歧义,利用自然语言处理技术生成的语音数据通常较为自然,具体是通过选择一个适合需求的TTS(Text-to-Speech,即文字转语音)引擎,其中一些常见的TTS引擎如Google Cloud Text-to-Speech等。这些引擎通常提供API(Application ProgrammingInterface,即应用程序编程接口),也可以在云端使用,然后需要在其选定的TTS引擎上注册并获取API密钥,使用选定的TTS引擎提供的API,将第二文本数据传递给该API,此时API会返回一个包含语音数据的响应,其中关于获取第二上下文语境信息、第二逻辑关系值、上下文相似度值、特征向量等步骤计算公式与前文中由第一用户的第一语音数据转化过程相同,这里不做叙述。
本申请还提供一种记录仪,包括:
第一获取模块,用于获取第一用户的第一语音数据,并根据自然语音处理技术对所述第一语音数据进行语种识别,得到第一语种;
提取模块,用于根据所述第一语音数据生成第一文本数据,提取所述第一文本数据中的第一多义词,并获取所述第一多义词的多个第一文本释义;
第二获取模块,用于根据所述第一多义词获取该第一多义词的第一上文信息和第一下文信息,并根据所述第一上文信息和第一下文信息获取第一上下文语境信息;
第三获取模块,用于根据所述第一上文信息、第一下文信息和第一上下文语境信息获取每个第一文本释义的第一逻辑关系值;
确定模块,用于选择第一逻辑关系值最高的第一文本释义,并根据该所述第一文本释义确定第一多义词的目标释义;
匹配模块,用于获取第二用户的第二语种,根据所述第二语种和所述第一语种从翻译数据库中进行匹配,得到语种翻译类型;
翻译模块,用于根据所述语种翻译类型将所述第一文本数据和第一多义词的目标释义转化为第二语种的第二语音数据。
在一个实施例中,所述第二获取模块,包括:
第一获取单元,用于根据所述第一上文信息和第一下文信息分别获取上文关键词和下文关键词;
提取单元,用于提取所述上文关键词和下文关键词中具有相同释义的同义关键词,其中,所述同义关键词包括连接词和过渡词;
第二获取单元,用于根据所述连接词和过渡词获取上下文逻辑连接信息;
第三获取单元,用于根据所述第一上文信息和第一下文信息分别获取上文段落结构信息和下文段落结构信息;
第四获取单元,用于根据所述上文段落结构信息和下文段落结构信息获取上下文逻辑转折信息;
第五获取单元,用于根据所述上下文逻辑转折信息和上下文逻辑连接信息获取上下文核心主题,并根据所述上下文核心主题获取第一上下文语境信息。
本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述一种记录仪的在线翻译方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种记录仪的在线翻译方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种记录仪的在线翻译方法,其特征在于,包括:
获取第一用户的第一语音数据,并根据自然语音处理技术对所述第一语音数据进行语种识别,得到第一语种;
根据所述第一语音数据生成第一文本数据,提取所述第一文本数据中的第一多义词,并获取所述第一多义词的多个第一文本释义;
根据所述第一多义词获取该第一多义词的第一上文信息和第一下文信息,并根据所述第一上文信息和第一下文信息获取第一上下文语境信息;
根据所述第一上文信息、第一下文信息和第一上下文语境信息获取每个第一文本释义的第一逻辑关系值;
选择第一逻辑关系值最高的第一文本释义,并根据该所述第一文本释义确定第一多义词的目标释义;
获取第二用户的第二语种,根据所述第二语种和所述第一语种从翻译数据库中进行匹配,得到语种翻译类型;
根据所述语种翻译类型将所述第一文本数据和第一多义词的目标释义转化为第二语种的第二语音数据。
2.根据权利要求1所述的记录仪的在线翻译方法,其特征在于,所述根据所述第一上文信息和第一下文信息获取第一上下文语境信息的步骤,包括:
根据所述第一上文信息和第一下文信息分别获取上文关键词和下文关键词;
提取所述上文关键词和下文关键词中具有相同释义的同义关键词,其中,所述同义关键词包括连接词和过渡词;
根据所述连接词和过渡词获取上下文逻辑连接信息;
根据所述第一上文信息和第一下文信息分别获取上文段落结构信息和下文段落结构信息;
根据所述上文段落结构信息和下文段落结构信息获取上下文逻辑转折信息;
根据所述上下文逻辑转折信息和上下文逻辑连接信息获取上下文核心主题,并根据所述上下文核心主题获取第一上下文语境信息。
3.根据权利要求1所述的记录仪的在线翻译方法,其特征在于,所述根据所述第一上文信息、第一下文信息和第一上下文语境信息获取每个第一文本释义的第一逻辑关系值的步骤,包括:
将每个所述第一文本释义输入至第一上文信息中,得到上文输入表示,并提取所述上文输入表示的第一特征向量;
将每个所述第一文本释义输入至第一下文信息中,得到下文输入表示,并提取所述下文输入表示的第二特征向量;
根据每个所述第一文本释义和所述第一上下文语境信息获取上下文语境表示,并提取所述上下文语境表示的特征向量值;
根据所述第一特征向量和第二特征向量获取上下文相似度值;
根据所述上下文相似度值和特征向量值计算每个第一文本释义的第一逻辑关系值,其中,计算公式为:
其中,f(x)表示第一逻辑关系值,d(3)表示特征向量值,b(3)表示特征向量值权重,a表示上下文相似度值权重,x(s)上下文相似度值。
4.根据权利要求3所述的记录仪的在线翻译方法,其特征在于,所述根据所述第一特征向量和第二特征向量获取上下文相似度值的步骤,包括:
根据所述第一特征向量获取第一向量范数;
根据所述第二特征向量获取第二向量范数;
根据所述第二向量范数和第一向量范数获取平均向量范数,并根据所述平均向量范数对第一特征向量和第二特征向量进行标准化,得到第一标准向量和第二标准向量;
根据所述第一标准向量、第二标准向量和平均向量范数计算上下文相似度值,其中,计算公式为:
其中,x(s)上下文相似度值,p(x)表示平均向量范数,Bx(1)表示第一标准向量,Bx(2)表示第二标准向量。
5.根据权利要求4所述的记录仪的在线翻译方法,其特征在于,所述根据所述第二向量范数和第一向量范数获取平均向量范数,并根据所述平均向量范数对第一特征向量和第二特征向量进行标准化,得到第一标准向量和第二标准向量的步骤,包括:
根据第二向量范数和第一向量范数计算平均向量范数,其中,计算公式为:
其中,p(x)表示平均向量范数,Xf(1)表示第一向量范数,Xf(2)表示第二向量范数;
根据所述平均向量范数和第一特征向量计算第一标准向量的公式为:
其中,Bx(1)表示第一标准向量,p(x)表示平均向量范数,d(1)表示第一特征向量;
根据所述平均向量范数和第一特征向量计算第一标准向量的公式为:
其中,Bx(2)表示第一标准向量,p(x)表示平均向量范数,d(2)表示第二特征向量。
6.根据权利要求1所述的记录仪的在线翻译方法,其特征在于,所述根据所述语种翻译类型将所述第一文本数据和第一多义词的目标释义转化为第二语种的第二语音数据的步骤,包括:
根据所述语种翻译类型将所述第一文本数据翻译为第二语种的初步文本数据;
提取所述初步文本数据中与第一多义词的目标释义相对应的第二多义词,并获取所述第二多义词的多个第二文本释义;
根据所述第二多义词获取该第二多义词的第二上文信息和第二下文信息,并根据所述第二上文信息和第二下文信息获取第二上下文语境信息;
根据所述第二上文信息、第二下文信息和第二上下文语境信息获取每个第二文本释义的第二逻辑关系值,选择第二逻辑关系值最高的第二文本释义,并根据该所述第二文本释义确定第二多义词的目标释义;
根据所述语种翻译类型将所述第二多义词的目标释义翻译为第二语种的第二多义词目标文本数据;
将所述初步文本数据中第二多义词的初步文本数据替换为第二多义词目标文本数据,得到第二文本数据;
将所述第二文本数据通过自然语言技术转化为第二语音数据。
7.一种记录仪,其特征在于,包括:
第一获取模块,用于获取第一用户的第一语音数据,并根据自然语音处理技术对所述第一语音数据进行语种识别,得到第一语种;
提取模块,用于根据所述第一语音数据生成第一文本数据,提取所述第一文本数据中的第一多义词,并获取所述第一多义词的多个第一文本释义;
第二获取模块,用于根据所述第一多义词获取该第一多义词的第一上文信息和第一下文信息,并根据所述第一上文信息和第一下文信息获取第一上下文语境信息;
第三获取模块,用于根据所述第一上文信息、第一下文信息和第一上下文语境信息获取每个第一文本释义的第一逻辑关系值;
确定模块,用于选择第一逻辑关系值最高的第一文本释义,并根据该所述第一文本释义确定第一多义词的目标释义;
匹配模块,用于获取第二用户的第二语种,根据所述第二语种和所述第一语种从翻译数据库中进行匹配,得到语种翻译类型;
翻译模块,用于根据所述语种翻译类型将所述第一文本数据和第一多义词的目标释义转化为第二语种的第二语音数据。
8.根据权利要求7所述的记录仪,其特征在于,所述第二获取模块,包括:
第一获取单元,用于根据所述第一上文信息和第一下文信息分别获取上文关键词和下文关键词;
提取单元,用于提取所述上文关键词和下文关键词中具有相同释义的同义关键词,其中,所述同义关键词包括连接词和过渡词;
第二获取单元,用于根据所述连接词和过渡词获取上下文逻辑连接信息;
第三获取单元,用于根据所述第一上文信息和第一下文信息分别获取上文段落结构信息和下文段落结构信息;
第四获取单元,用于根据所述上文段落结构信息和下文段落结构信息获取上下文逻辑转折信息;
第五获取单元,用于根据所述上下文逻辑转折信息和上下文逻辑连接信息获取上下文核心主题,并根据所述上下文核心主题获取第一上下文语境信息。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202410010484.1A 2024-01-04 2024-01-04 一种记录仪的在线翻译方法及记录仪 Pending CN117521680A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410010484.1A CN117521680A (zh) 2024-01-04 2024-01-04 一种记录仪的在线翻译方法及记录仪

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410010484.1A CN117521680A (zh) 2024-01-04 2024-01-04 一种记录仪的在线翻译方法及记录仪

Publications (1)

Publication Number Publication Date
CN117521680A true CN117521680A (zh) 2024-02-06

Family

ID=89766832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410010484.1A Pending CN117521680A (zh) 2024-01-04 2024-01-04 一种记录仪的在线翻译方法及记录仪

Country Status (1)

Country Link
CN (1) CN117521680A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929860A (zh) * 2012-10-12 2013-02-13 浙江理工大学 一种基于上下文语境的中文分句情感极性判别方法
US9552354B1 (en) * 2003-09-05 2017-01-24 Spoken Traslation Inc. Method and apparatus for cross-lingual communication
CN106610990A (zh) * 2015-10-22 2017-05-03 北京国双科技有限公司 情感倾向性分析的方法及装置
CN110929507A (zh) * 2018-08-31 2020-03-27 中国移动通信有限公司研究院 一种文本信息处理的方法、装置及存储介质
CN111652005A (zh) * 2020-05-27 2020-09-11 沙塔尔江·吾甫尔 汉语与乌尔都语同步互译系统及方法
CN113591462A (zh) * 2021-07-28 2021-11-02 咪咕数字传媒有限公司 弹幕回复生成方法、装置及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9552354B1 (en) * 2003-09-05 2017-01-24 Spoken Traslation Inc. Method and apparatus for cross-lingual communication
CN102929860A (zh) * 2012-10-12 2013-02-13 浙江理工大学 一种基于上下文语境的中文分句情感极性判别方法
CN106610990A (zh) * 2015-10-22 2017-05-03 北京国双科技有限公司 情感倾向性分析的方法及装置
CN110929507A (zh) * 2018-08-31 2020-03-27 中国移动通信有限公司研究院 一种文本信息处理的方法、装置及存储介质
CN111652005A (zh) * 2020-05-27 2020-09-11 沙塔尔江·吾甫尔 汉语与乌尔都语同步互译系统及方法
CN113591462A (zh) * 2021-07-28 2021-11-02 咪咕数字传媒有限公司 弹幕回复生成方法、装置及电子设备

Similar Documents

Publication Publication Date Title
US11586987B2 (en) Dynamically updated text classifier
CN110444198B (zh) 检索方法、装置、计算机设备和存储介质
CN109145152B (zh) 一种基于查询词的自适应智能生成图文视频缩略图方法
US9262411B2 (en) Socially derived translation profiles to enhance translation quality of social content using a machine translation
JP5167546B2 (ja) 文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置
CN108427707A (zh) 人机问答方法、装置、计算机设备和存储介质
KR102376201B1 (ko) 멀티미디어 지식 베이스 구축 시스템 및 방법
US7739110B2 (en) Multimedia data management by speech recognizer annotation
US20130297284A1 (en) Apparatus and method for generating polite expressions for automatic translation
GB2570751A (en) Predicting style breaches within textual content
WO2021134524A1 (zh) 数据处理方法、装置、电子设备和存储介质
US20140348400A1 (en) Computer-readable recording medium storing program for character input
CN109600681B (zh) 字幕显示方法、装置、终端及存储介质
CN111276149A (zh) 语音识别方法、装置、设备及可读存储介质
US20230325611A1 (en) Video translation platform
Scherrer et al. Natural Language Processing for the Swiss German Dialect Area.
CN111797265A (zh) 一种基于多模态技术的拍照命名方法与系统
KR102030551B1 (ko) 인스턴트 메신저 구동 장치 및 그 동작 방법
CN111460224B (zh) 评论数据的质量标注方法、装置、设备及存储介质
CN117521680A (zh) 一种记录仪的在线翻译方法及记录仪
US11842165B2 (en) Context-based image tag translation
CN114449310A (zh) 视频剪辑方法、装置、计算机设备及存储介质
Hukkeri et al. Erratic navigation in lecture videos using hybrid text based index point generation
WO2022047516A1 (en) System and method for audio annotation
CN117573870B (zh) 一种多模态数据的文本标签提取方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination