CN111783481A - 耳机控制方法、翻译方法、耳机和云端服务器 - Google Patents
耳机控制方法、翻译方法、耳机和云端服务器 Download PDFInfo
- Publication number
- CN111783481A CN111783481A CN202010614142.2A CN202010614142A CN111783481A CN 111783481 A CN111783481 A CN 111783481A CN 202010614142 A CN202010614142 A CN 202010614142A CN 111783481 A CN111783481 A CN 111783481A
- Authority
- CN
- China
- Prior art keywords
- earphone
- voice data
- user
- user information
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000013519 translation Methods 0.000 title claims abstract description 59
- 230000006854 communication Effects 0.000 claims abstract description 56
- 238000004891 communication Methods 0.000 claims abstract description 47
- 238000012549 training Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/14—Session management
- H04L67/141—Setup of application sessions
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种耳机控制方法,该方法包括:获取第一用户的第一用户信息,获取第一语音数据,所述第一用户信息包括所述第一用户使用的第一语种和所述第一用户的第一身份信息;将所述第一用户信息和所述第一语音数据发送至云端服务器,以使所述云端服务器将接收到的所述第一语音数据翻译成所述第一语种对应的第二语音数据、并将所述第二语音数据发送至所述第一身份信息对应的第二耳机。本发明还公开了一种翻译方法、耳机和云端服务器。本发明旨在简化用户交流过程的翻译操作,提高不同语种的用户之间的交流的便利性。
Description
技术领域
本发明涉及耳机技术领域,尤其涉及耳机控制方法、翻译方法、耳机和云端服务器。
背景技术
在日常生活、工作中,很多时候不同语种的人需要面对面或电话通话交流,由于语言不通,为了保证交流顺畅,一般需要借助翻译软件。
然而,目前用户使用翻译软件进行翻译时,翻译软件一般安装在手机、电脑等设备中,一般需要用户将其所需发送的信息输入到翻译软件后,获取到翻译结果后再自行操作其他软件或设备发送给其所需交流的用户,或是用户直接将其所需发送的信息发送给其所需交流的用户,接收信息的用户接收到信息后自行输入到翻译软件中进行翻译。然而这样的交流过程操作繁杂,导致不同语种的用户之间交流极为不便。
发明内容
本发明的主要目的在于提供一种耳机控制方法,旨在简化用户交流过程的翻译操作,提高不同语种的用户之间的交流的便利性。
为实现上述目的,本发明提供一种耳机控制方法,应用于第一耳机,所述耳机控制方法包括以下步骤:
获取第一用户的第一用户信息,获取第一语音数据,所述第一用户信息包括所述第一用户使用的第一语种和所述第一用户的第一身份信息;
将所述第一用户信息和所述第一语音数据发送至云端服务器,以使所述云端服务器将接收到的所述第一语音数据翻译成所述第一语种对应的第二语音数据、并将所述第二语音数据发送至所述第一身份信息对应的第二耳机。
可选地,所述将所述第一用户信息和所述第一语音数据发送至云端服务器的步骤之前,还包括:
发送所述第一用户信息至所述云端服务器,以使所述云端服务器根据所述第一用户信息建立所述第一耳机与所述第二耳机之间的会话通道;
在接收到所述云端服务器返回的会话通道已建立的消息后,执行所述将所述第一用户信息和所述第一语音数据发送至云端服务器的步骤,以使所述云端服务器基于所述会话通道将接收到的所述第一语音数据翻译成所述第一语种对应的第二语音数据、并将所述第二语音数据发送至所述第一身份信息对应的第二耳机。
可选地,所述将所述第一用户信息和所述第一语音数据发送至云端服务器的步骤之前,还包括:
将第二用户信息发送至所述第二耳机,以使所述第二耳机获取所述第二用户信息和第三语音数据,将所述第二用户信息和所述第三语音数据发送至所述云端服务器;
其中,所述第二用户信息为使用所述第一耳机的第二用户的信息,所述第二用户信息包括所述第二用户使用的第二语种和所述第二用户的第二身份信息,所述云端服务器将所述第三语音数据翻译成所述第二语种对应的第四语音数据、并将所述第四语音数据发送至所述第二身份信息对应的所述第一耳机。
可选地,所述将第二用户信息发送至所述第二耳机的步骤之后,还包括:
当接收到所述第四语音数据时,播放所述第四语音数据。
可选地,所述获取第一用户的第一用户信息的步骤之前,还包括:
启动近场通信模块,以产生无线近场网络;
当存在设备进入所述无线近场网络时,建立与所述设备的近场通信通道;
所述获取第一用户的第一用户信息的步骤包括:
通过所述近场通信通道读取所述设备中的所述第一用户信息。
可选地,所述设备为所述第二耳机,所述将第二用户信息发送至所述第二耳机的步骤包括:
通过所述近场通信通道将第二用户信息发送至所述第二耳机。
此外,为了实现上述目的,本申请还提出一种翻译方法,应用于云端服务器,所述翻译方法包括:
获取第一耳机发送的第一用户信息和第一语音数据;所述第一用户信息包括第一用户使用的第一语种和第一用户的第一身份信息;
将所述第一语音数据翻译成所述第一语种对应的第二语音数据;
将所述第二语音数据发送至所述第一身份信息对应的第二耳机。
可选地,所述将所述第一语音数据翻译成所述第一语种对应的第二语音数据的步骤包括:
确定所述第一语音数据对应的第一文本信息;
将所述第一文本信息翻译成所述第一语种对应的第二文本信息;
将所述第二文本信息转换为所述第二语音数据。
可选地,所述将所述第二文本信息转换为所述第二语音数据的步骤包括:
获取所述第一耳机对应的语音生成模型;所述语音生成模型为通过使用所述第一耳机的第二用户的语音数据训练得到的模型;
将所述第二文本信息输入所述语音生成模型;
将所述语音生成模型的输出结果作为所述第二语音数据;所述第二语音数据具有所述第一耳机的第二用户的发音特征。
可选地,所述获取第一耳机发送的第一用户信息和第一语音数据的步骤之前,还包括:
当接收到所述第一耳机发送的第一用户信息时,根据所述第一用户信息建立所述第一耳机与所述第二耳机之间的会话通道;
所述将所述第一语音数据翻译成所述第一语种对应的第二语音数据的步骤包括:
通过所述会话通道,将所述第一语音数据翻译成所述第二语音数据
所述将所述第二语音数据发送至所述第一身份信息对应的第二耳机的步骤包括:
通过所述会话通道,将所述第二语音数据发送至所述第二耳机。
可选地,所述根据所述第一用户信息建立所述第一耳机与所述第二耳机之间的会话通道的步骤之前,还包括:
确定所述第一用户信息对应的第二耳机;
判断是否接收到所述第二耳机发送的第二用户信息;
当接收到所述第二用户信息,且所述第二用户信息为所述第一耳机对应的用户信息时,建立所述第一耳机与所述第二耳机之间的会话通道;且/或,
所述根据所述第一用户信息建立所述第一耳机与所述第二耳机之间的会话通道的步骤之后,还包括:
发送会话通道已建立的消息至所述第一耳机和所述第二耳机。
此外,为了实现上述目的,本申请还提出一种耳机,所述耳机包括:
麦克风,用于采集语音数据;
存储器、处理器及存储在所述存储器上并可在所述处理器上运行的耳机控制程序,所述处理器与所述麦克风连接,所述耳机控制程序被所述处理器执行时实现如上任一项所述的耳机控制方法的步骤。
可选地,所述耳机还包括近场通信模块,所述近场通信模块与所述处理器连接。
此外,为了实现上述目的,本申请还提出一种云端服务器,所述云端服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的翻译程序,所述翻译程序被所述处理器执行时实现如上任一项所述的翻译方法的步骤。
本发明提出的一种耳机控制方法,该方法通过第一耳机在获取第一用户的第一用户信息和第一语音数据后,将第一用户信息和第一语音数据发送至云端服务器,云端服务器可按照第一用户使用的第一语种对第一语音数据进行翻译成相应的语音数据、并将翻译后得到的语音数据发送至第一用户的第二耳机,从而使用户交流的过程中,发送消息的用户的第一耳机只需获取到接收消息的用户的信息,用户使用第一耳机输入第一语音数据,便可通过云端服务器自动的翻译、用户识别和转发,使接收消息的第一用户通过第二耳机接收自身使用语种匹配的语音数据,用户无需自行翻译、转发,简化交流双方、甚至是多方在交流过程中翻译操作,提高不同语种的用户之间的交流的便利性。
附图说明
图1为本发明耳机一实施例运行涉及的硬件结构示意图;
图2为本发明耳机控制方法一实施例的流程示意图;
图3为本发明耳机控制方法另一实施例的流程示意图;
图4为本发明耳机控制方法再一实施例的流程示意图;
图5为本发明云端服务器一实施例运行涉及的硬件结构示意图;
图6为本发明翻译方法一实施例的流程示意图;
图7为本发明实施例利用耳机控制方法和翻译方法进行多于一个耳机通过云端服务器实现用户识别、翻译、数据转发的工作场景示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:获取第一用户的第一用户信息,所述第一用户信息包括所述第一用户使用的第一语种和所述第一用户的第一身份信息,获取第一语音数据;将所述第一用户信息和所述第一语音数据发送至云端服务器,以使所述云端服务器将接收到的所述第一语音数据翻译成所述第一语种对应的第二语音数据、并将所述第二语音数据发送至所述第一身份信息对应的第二耳机。
由于现有技术中,用户使用翻译软件进行翻译时,翻译软件一般安装在手机、电脑等设备中,一般需要用户将其所需发送的信息输入到翻译软件后,获取到翻译结果后再自行操作其他软件或设备发送给其所需交流的用户,或是用户直接将其所需发送的信息发送给其所需交流的用户,接收信息的用户接收到信息后自行输入到翻译软件中进行翻译。然而这样的交流过程操作繁杂,导致不同语种的用户之间交流极为不便。
本发明提供上述的解决方案,旨在简化用户交流过程的翻译操作,提高不同语种的用户之间的交流的便利性。
本发明实施例提出一种耳机1。
在本实施例中,耳机1具体指的是真无线蓝牙耳机(TWS耳机)。在其他实施例中耳机1还可以是其他类型的无线耳机(如头戴式无线耳机、颈戴式无线耳机等)、有线耳机等。
在本实施例中,参照图1,耳机1具体包括麦克风11和耳机控制装置,麦克风11与耳机控制装置连接,麦克风11主要用于采集耳机所在环境的语音数据。需要说明的是,在其他实施例中,耳机控制装置也可独立于耳机设置。
进一步,耳机1还包括近场通信模块12(如射频模块和射频识别标签)。近场通信模块12可用于与其他设有近场通信模块的设备进行近场通信,兵基于近场通信实现信息交互。
在本发明实施例中,参照图1,耳机控制装置包括:处理器1001(例如CPU),存储器1002等。存储器1002可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1002可选的还可以是独立于前述处理器1001的存储装置。
存储器1002、上述的麦克风11、近场通信模块12均与处理器1001连接。处理器1001可从麦克风11获取其采集语音数据,并控制近场通信模块12的运行。
本领域技术人员可以理解,图1中示出的装置结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种可读存储介质的存储器1002中可以包括耳机控制程序。在图1所示的装置中,处理器1001可以用于调用存储器1002中存储的耳机控制程序,并执行以下实施例中耳机控制方法的相关步骤操作。
本发明实施例还提供一种耳机控制方法,可应用于通过耳机进行面对面通话的场景、通过耳机进行远程通话的场景、通过耳机进行会议通话等场景。
参照图2,提出本申请耳机控制方法一实施例。在本实施例中,所述耳机控制方法包括:
步骤S10,获取第一用户的第一用户信息,获取第一语音数据,所述第一用户信息包括所述第一用户使用的第一语种和所述第一用户的第一身份信息;具体的,判断耳机是否处于设定的翻译模式,若是则执行步骤S10,若否则不执行。其中,使用第一耳机的第二用户可通过按键或语音唤醒启动第一耳机的翻译模式。翻译模式具体为第一耳机对获取到的语音数据进行翻译处理的模式。在非翻译模式下,第一耳机不会对获取到的语音数据进行翻译处理。
第一语音数据指的是使用第一耳机的第二用户需要发送给第一用户的语音数据。第一语音数据可以通过获取第一耳机采集的第一耳机所在空间内的语音数据得到,也可通过获取第二用户通过指令输入到第一耳机中的语音数据或基于第二用户输入的指令去其他终端获取的语音数据得到,等等。在本实施例中,第一语音数据为第一耳机采集到的第一耳机所在空间内的语音数据。
云端服务器可预先存储有不同用户的预存用户信息。预存用户信息可具体包括每个用户对应的语种、身份信息(如账号)、用户输入的语音数据、其使用的耳机的设备标识信息等,每个用户对应的用户信息在云端服务器中关联存储。用户使用手机等终端上安装的预设应用在云端服务器上注册账户,注册的过程中获取用户的上述信息形成用户所对应的预存用户信息。预存用户信息除了保存在云端服务器外,还可保存在预存用户信息对应的耳机中。
第一用户信息具体为第一用户在云端服务器中注册形成的预存用户信息。第一用户具体指的是使用第一耳机的第二用户需要进行交流的、与该第二用户语种不同的用户。第一身份信息具体指的是在云端服务器上用于表征第一用户身份的信息,在本实施例中,第一身份信息具体为第一用户在云端服务器上的账号。在其他实施例中,第一身份信息还可为第一用户的名字、手机号、甚至身份证号等可用于区分不同用户身份的信息。第一用户信息可由使用第一耳机的第二用户自行输入,也可由第一耳机基于用户需求到其他设备中获取,甚至第一耳机获取与第一耳机处于通话状态的另一耳机所对应的用户信息作为这里第一用户的第一用户信息。
步骤S20,将所述第一用户信息和所述第一语音数据发送至云端服务器,以使所述云端服务器将接收到的所述第一语音数据翻译成所述第一语种对应的第二语音数据、并将所述第二语音数据发送至所述第一身份信息对应的第二耳机。
第一耳机将第一用户信息和第一语音数据发送至云端服务器。获取第一耳机发送的第一用户信息和第一语音数据;所述第一用户信息包括第一用户使用的第一语种和第一用户的第一身份信息,将所述第一语音数据翻译成所述第一语种对应的第二语音数据;将所述第二语音数据发送至所述第一身份信息对应的第二耳机。云端服务器接收到第一用户信息和第一语音数据后,可在存储的用户数据中确定与第一身份信息匹配的预存用户信息,将匹配的预存用户信息所对应的耳机则为第一用户所使用的第二耳机;此外,云端服务器按照第一用户信息中第一语种对接收到的第一语音数据进行翻译,得到语种为第一语种的第二语音数据,翻译得到的第二语音数据发送至第二耳机。第二耳机接收到第二语音数据后,播放第二语音数据,使用第二耳机的第一用户便可接听到第二语音数据。此外,在其他实施例中,第二耳机接收到第二语音数据后,也可不进行播放,而是转发到与第二耳机连接的其他设备中播放或显示。
其中,第一耳机、云端服务器之间可通过手机、电脑等终端实现连接,第一耳机通过蓝牙通信等方式将第一用户信息和第一语音数据发送至与其连接的手机,接收到第一用户信息和第一语音数据后通过互联网发送至云端服务器。第二耳机、云端服务器之间也可通过手机、电脑等终端实现连接,云端服务器可通过互联网将第二语音数据发送至与第二耳机连接的手机,手机通过蓝牙通信等方式将第二语音数据转发至第二耳机。
在本实施例中,为了实现任一耳机的用户均可通过该云端服务器自动进行数据的翻译和转发,第一耳机将第一用户信息和第一语音数据发送给云端服务器时,可同时将使用第一耳机的第二用户自身的第二用户信息发送至云端服务器,以使云端服务器可基于第二用户信息识别出第一语音数据是从哪个设备发来的,并基于第一用户信息识别出第一语音数据需发送至哪个设备,以确定第一语音数据翻译得到的语音数据的传输方向。此外,在其他实施例中,第一耳机为固定设备时,云端服务器中已知使用第一耳机的第二用户的第二用户信息,第一耳机可只发送第一用户的第一用户信息和获取到的第一语音数据给云端服务器,云端服务器便可确定第一语音数据翻译得到的语音数据的传输方向。
具体的,第一用户信息和第一语音数据可合成形成一个数据包进行发送,可提取第一用户信息中第一身份信息和第一语种形成相应的标识添加至数据包的包头,将数据包发送至云端服务器,云端服务器接收到数据包后,通过解析数据包的表头得到第一用户信息,得到需要接收该数据包中的第一语音数据的第一用户的信息。基于解析得到的第一用户信息确定数据包中的第一语音数据的处理方式(需翻译的目标语种、需接收数据的目标耳机等),按照所确定的处理方式对第一语音数据进行处理,得到第二语音数据并发送。
本发明实施例提出的一种耳机控制方法,该方法通过第一耳机在获取第一用户的第一用户信息和第一语音数据后,将第一用户信息和第一语音数据发送至云端服务器,云端服务器可按照第一用户使用的第一语种对第一语音数据进行翻译成相应的语音数据、并将翻译后得到的语音数据发送至第一用户所使用的第二耳机,从而使用户交流的过程中,发送消息的用户的第一耳机只需获取到接收消息的用户的信息,用户使用第一耳机输入第一语音数据,便可通过云端服务器自动的翻译、用户识别和转发,使接收消息的第一用户通过第二耳机接收自身使用语种匹配的语音数据,用户无需自行翻译、转发,简化交流双方、甚至是多方在交流过程中翻译操作,提高不同语种的用户之间的交流的便利性,有利于用户的实时交流。
需要说明的是,在本实施例中,第一耳机所获取的第一用户信息的数量可多于一个,对应的云端服务器所翻译得到的第二语音数据及其对应的第二耳机的数量均多于一个,从而提高多方不同语种的用户的交流的便利性。
进一步的,基于上述实施例,提出本申请耳机控制方法另一实施例。在本实施例中,参照图3,所述步骤S20之前,还包括:
步骤S11,发送所述第一用户信息至所述云端服务器,以使所述云端服务器根据所述第一用户信息建立所述第一耳机与所述第二耳机之间的会话通道;
在所述第一耳机接收到所述云端服务器返回的会话通道已建立的消息后,执行所述步骤S20,以使所述云端服务器基于所述会话通道将接收到的所述第一语音数据翻译成所述第一语种对应的第二语音数据、并将所述第二语音数据发送至所述第一身份信息对应的第二耳机。
会话通道具体为云端服务器中用于第一耳机与第二耳机之间的数据定向翻译和传输的通道。其中,两个耳机之间建立一个会话通道,一个耳机可对应建立多于一条会话通道。会话通道建立后,第一耳机与第二耳机之间数据的翻译方式固定、数据传输方向基于接收到的数据的传输需求确定,例如第一耳机的使用第二语种,第二耳机的用户使用第一语种时,当云端服务器接收到的语音数据为第一耳机给第二耳机发送的数据时,云端服务器按照第二语种翻译成第一语种的翻译方式对接收到的语音数据进行翻译、并将翻译得到的数据发送被第二耳机;当云端服务器接收到的语音数据为第二耳机给第一耳机发送的数据时,云端服务器按照第一语种翻译成第二语种的翻译方式对接收到的语音数据进行翻译,将翻译得到的数据发送给第一耳机。
具体的,当云端服务器接收到所述第一耳机发送的第一用户信息时,根据所述第一用户信息建立所述第一耳机与所述第二耳机之间的会话通道;所述将所述第一语音数据翻译成所述第一语种对应的第二语音数据的步骤包括:通过所述会话通道,将所述第一语音数据翻译成所述第二语音数据。基于此,云端服务器通过所述会话通道,将所述第二语音数据发送至所述第二耳机。在会话通道建立后,云端服务器发送会话通道已建立的消息至所述第一耳机和所述第二耳机,以使第一耳机和第二耳机可获知云端服务器当前关于第一耳机与第二耳机之间数据处理通道的建立情况,保证第一耳机和第二耳机后续响应的精准性。
在本实施例中,在翻译前,先确定云端服务器已经建立第一耳机与第二耳机之间的会话通道后,再将第一语音数据和第一用户的第一用户信息至云端服务器,从而保证云端服务器对第一语音数据进行翻译时的有效性,避免云端服务器翻译的错漏,进一步保证不同语种用户之间交流的顺畅性。
其中,云端服务器在根据所述第一用户信息建立所述第一耳机与所述第二耳机之间的会话通道之前,还可确定所述第一用户信息对应的第二耳机;判断是否接收到所述第二耳机发送的第二用户信息;当接收到所述第二用户信息,且所述第二用户信息为所述第一耳机对应的用户信息时,建立所述第一耳机与所述第二耳机之间的会话通道,若未接收到第二耳机对应的用户信息则不建立会话通道,从而保证语音数据的翻译、传输均为交流双方的需求的基础上才建立会话通道,以避免用户的耳机接收到不需要的数据,同时保证会话通道建立的准确性。
进一步的,当用户无需使用耳机进行翻译时,第一耳机或第二耳机的使用者可通过发出语音指令或按键的方式关闭翻译模式,在翻译模式关闭时,耳机可向云端服务器发送请求,云端服务器接收到请求后会关闭与发出请求的耳机的相关的所有会话通道。
进一步的,基于上述任一实施例,提出本申请耳机控制方法又一实施例。在本实施例中,所述步骤S20之前,还包括:
步骤S00,将第二用户信息发送至所述第二耳机,以使所述第二耳机获取所述第二用户信息和第三语音数据,将所述第二用户信息和所述第三语音数据发送至所述云端服务器;
其中,所述第二用户信息为使用所述第一耳机的第二用户的信息,所述第二用户信息包括所述第二用户使用的第二语种和所述第二用户的第二身份信息,所述云端服务器将所述第三语音数据翻译成所述第二语种对应的第四语音数据、并将所述第四语音数据发送至所述第二身份信息对应的所述第一耳机。
第二用户信息具体为使用第一耳机的第二用户在云端服务器上注册后形成的用户信息。若用户启动第一耳机的翻译模式时,若第一耳机中未存储有预存用户信息,则可发出提示信息,以使用户按照提示信息输入相关信息实现在云端服务器上的注册。
第一耳机将第二用户信息发送至第二耳机,第二耳机在接收到第二用户信息后,可类比参照上述实施例中第一耳机的数据处理方式,将所获取的第二用户信息和第三语音数据发送至云端服务器。云端服务器接收到第二用户信息和第三语音数据后,可按照第二用户信息中的第二语种将第三语音数据翻译成第二语种对应的第四语音数据,并按照第二用户信息中的第二身份信息对应的耳机,并将第四语音数据发送至所确定的耳机。由于第二用户信息为使用第一耳机的第二用户的用户信息,因此通过上述方式,便可实现使用第一耳机的第二用户和使用第二耳机的第一用户即使采用的是不同语种,也可进行实时的双向交流。
进一步的,在本实施例中,步骤S00之后,还包括:当所述第一耳机接收到所述第四语音数据时,播放所述第四语音数据,从而使第一耳机的用户可从其使用的耳机实时接收到第二耳机用户所需传递的信息。
需要说明的是,本实施例中的步骤S00与上述实施例中的步骤S10中的执行顺序不做具体限定,可根据实际情况同时或先后执行。此外,播放所述第四语音数据与上述实施例中的步骤S20之间的步骤,也不作具体限定,当会话通道建立成功后,第一耳机实时获取到第一语音数据,便可实时将第一语音数据和第一用户信息发送至云端服务器;而第一耳机实时接收到云端服务器发送的第四语音数据时,便可实时播放第四语音数据。
进一步的,基于上述任一实施例,提出本申请耳机控制方法再一实施例。在本实施例中,参照图4,所述获取第一用户的第一用户信息的步骤之前,还包括:
步骤S101,启动近场通信模块,以产生无线近场网络;
这里的无线近场网络具体通过第一耳机中的射频模块形成,射频模块启动后所产生的射频信号的覆盖范围形成无线近场网络。
步骤S102,当存在设备进入所述无线近场网络时,建立与所述设备的近场通信通道;
近场通信通道具体为无线近场网络中用于第一耳机与检测到的设备之间的数据传输的通道。设备中可设置有射频识别标签(如RFID芯片等),射频识别标签中存储有第一用户的第一用户信息。用户需要使用第一耳机与其他用户进行不同语种之间的交流时,可将第一耳机与设有该射频识别标签的设备靠近,第一耳机中的射频模块便可识别到设备中的射频识别标签,并建立第一耳机与该设备之间的近场通信通道。
所述获取第一用户的第一用户信息的步骤包括:通过所述近场通信通道读取所述设备中的所述第一用户信息。第一耳机可基于近场通信通道读取设备中射频识别标签中的信息,得到第一用户信息。基于此,通过近场通信,无需用户获知对方的信息,直接通过耳机与携带有第一用户的用户信息的设备进行信息交互,便可使第一耳机快速获取到第一用户的用户信息,实现将使用第一耳机的第二用户的语音数据翻译、转发至其所需的对象的耳机,进一步提高用户使用耳机进行翻译交流时的便利性。
在本实施例中,设备可具体为第二耳机。在用户需要采用耳机进行不同语种的交流时,只要将第二耳机与第一耳机靠近,无需用户操作,第一耳机便可快速读取到第二耳机中第一用户的第一用户信息。进一步的,每个耳机均可安装有射频模块和射频识别标签,每个射频识别标签均用于存储每个耳机对应使用者的用户信息,基于此,还可通过所述近场通信通道将第二用户信息发送至所述第二耳机,使通过第一耳机和第二耳机的靠近,便可快速交换需要不同语种交流双方的用户信息。
本发明实施例提出一种云端服务器2,具体用于实现不同耳机之间数据的翻译。上述任一实施例的耳机控制方法中所提及的云端服务器即为本实施例中的云端服务器2。
在本发明实施例中,参照图5,云端服务器2具体包括:处理器2001(例如CPU),存储器2002等。存储器2002可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器2002可选的还可以是独立于前述处理器2001的存储装置。
参照图5,云端服务器2可与不同的耳机1连接,以实现各耳机1之间的数据翻译、耳机对应的用户身份识别、数据转发等。
本领域技术人员可以理解,图5中示出的装置结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图5所示,作为一种可读存储介质的存储器2002中可以包括翻译程序。在图5所示的装置中,处理器2001可以用于调用存储器2002中存储的翻译程序,并执行以下实施例中翻译方法的相关步骤操作。
在本实施例中,提出一种翻译方法,应用于上述的云端服务器2。
参照图6,在本实施例中,翻译方法具体包括以下步骤:
步骤S100,获取第一耳机发送的第一用户信息和第一语音数据;所述第一用户信息包括第一用户使用的第一语种和第一用户的第一身份信息;
步骤S200,将所述第一语音数据翻译成所述第一语种对应的第二语音数据;
步骤S300,将所述第二语音数据发送至所述第一身份信息对应的第二耳机。
本实施例中翻译方法的各步骤的具体实施过程可具体参照上述耳机控制方法中云端服务器所执行的相关过程,在此不作赘述。
通过步骤S100至步骤S300,云端服务器接收第一耳机的发送的其第一用户的第一用户信息和第一语音数据,并基于第一用户信息对第一语音数据进行翻译、用户识别和数据转发,用户无需自行翻译、转发,简化交流双方、甚至是多方在交流过程中翻译操作,提高不同语种的用户之间的交流的便利性。
具体的,在本实施例中,所述将所述第一语音数据翻译成所述第一语种对应的第二语音数据的步骤包括:
步骤S210,确定所述第一语音数据对应的第一文本信息;
在接收到第一语音数据后,云端服务器可首先对第一语音数据进行断句。具体的,可识别第一语音数据中的静音时长,将静音时长持续时间达到设定阈值的前后两部分非静音的语音数据识别为用户说的两句话对应的数据。第一语音数据断句后得到至少一部分语音片段,每个语音片段对应用户的一句话。分别对每个语音片段进行声音特征提取,得到每个语音频段对应的文本信息,作为第一文本信息。
步骤S220,将所述第一文本信息翻译成所述第一语种对应的第二文本信息;
将第一文本信息从第二语种翻译成第一语种,翻译结果作为第二文本信息。其中,第二语种为使用第一耳机的第二用户所使用的语种,可通过直接对第一文本信息识别得到,也可通过获取使用第一耳机的第二用户的用户信息提取得到。
步骤S230,将所述第二文本信息转换为所述第二语音数据。
将第二文本信息执行文本转换成语音的操作,得到第二语音数据。
具体的,在本实施例中,获取所述第一耳机对应的语音生成模型;所述语音生成模型为通过使用第一耳机的第二用户的语音数据训练得到的模型;将所述第二文本信息输入所述语音生成模型;将所述语音生成模型的输出结果作为所述第二语音数据;所述第二语音数据具有使用所述第一耳机的第二用户的发音特征。其中,用于训练语音生成模型的语音数据可在使用第一耳机的第二用户对应的预存用户信息中获取,得到使用第一耳机的第二用户的语音数据后对预先设置的文本转语音的神经网络模型进行训练,得到具有语音生成模型。语音生成模型可将文字信息转换成具有使用第一耳机的第二用户的声音特征的语音数据。基于此,使第二耳机接收到的语音数据为具有使用第一耳机的第二用户的声音特征的语音数据,从而进一步提高不同语种的用户之间的交流体验。
进一步的,在步骤S100之前,还包括:当接收到所述第一耳机发送的第一用户信息时,根据所述第一用户信息建立所述第一耳机与所述第二耳机之间的会话通道;基于此,步骤S200包括:通过所述会话通道,将所述第一语音数据翻译成所述第二语音数据;步骤S300包括:通过所述会话通道,将所述第二语音数据发送至所述第二耳机。这里,会话通道相关概念、应用过程等具体内容及其技术效果可参照上述实施例的耳机控制方法中会话通道的相关记载,在此不作赘述。
再进一步的,在本实施例中,所述根据所述第一用户信息建立所述第一耳机与所述第二耳机之间的会话通道的步骤之前,还包括:确定所述第一用户信息对应的第二耳机;判断是否接收到所述第二耳机发送的第二用户信息;当接收到所述第二用户信息,且所述第二用户信息为所述第一耳机对应的用户信息时,建立所述第一耳机与所述第二耳机之间的会话通道。这里,在接收到第一耳机发送的第一用户信息后,建立会话通道前,在确认第二耳机的用户有同样的会话需求后才建立两个耳机之间的会话通道,从而保证语音数据的翻译、传输均为交流双方的需求的基础上才建立会话通道,以避免用户的耳机接收到不需要的数据,同时保证会话通道建立的准确性。
进一步的,所述根据所述第一用户信息建立所述第一耳机与所述第二耳机之间的会话通道的步骤之后,还包括:发送会话通道已建立的消息至所述第一耳机和所述第二耳机,以使第一耳机和第二耳机可获知云端服务器当前关于第一耳机与第二耳机之间数据处理通道的建立情况,保证第一耳机和第二耳机后续响应的精准性,保证第一耳机和第二耳机在知晓云端服务器可执行翻译操作时才发送翻译相关的数据至云端服务器,保证云端服务器翻译和转发的数据的精准性,保障使用耳机交流的不同语种的用户之间交流的顺畅性。
进一步的,为了更直观的说明本实施例中涉及的多于一个耳机通过云端服务器实现翻译和数据转发的过程,结合图7,蓝牙耳机用户A所使用的语种为中文,其说话被其所使用的耳机采集形成中文音频数据,通过手机上配套的APP中的账户向云端服务器发送耳机获取的中文音频数据以及的蓝牙耳机用户B的用户信息,云端服务器接收到蓝牙耳机用户A发送的中文音频数据和用户信息后,基于用户信息进行用户识别和目标语种识别,确定需要接收数据的是蓝牙耳机用户B以及其所使用的语种为英文,基于识别结果依次对接收到中文音频数据进行智能断句、语音转文本、翻译、文本转语音、数据转发操作,将中文音频数据转换成英文音频数据,并发送至蓝牙耳机用户B所使用的手机的APP中相应的账户,手机在接收到英文音频数据后再将英文音频数据发送给蓝牙耳机用户B所使用的耳机,蓝牙耳机用户B的耳机接收到英文音频数据后进行播放,使蓝牙耳机用户B可听到以英文作为表述的蓝牙耳机用户A的说话内容。此外,蓝牙耳机用户B所使用的语种为英文,其说话被其所使用的耳机采集形成英文音频数据,通过手机上配套的APP中的账户向云端服务器发送耳机获取的英文音频数据以及的蓝牙耳机用户A的用户信息,云端服务器接收到蓝牙耳机用户B发送的英文音频数据和用户信息后,基于用户信息进行用户识别和目标语种识别,确定需要接收数据的是蓝牙耳机用户A以及其所使用的语种为中文,基于识别结果依次对接收到英文音频数据进行智能断句、语音转文本、翻译、文本转语音、数据转发操作,将英文音频数据转换成中文音频数据,并发送至蓝牙耳机用户A所使用的手机的APP中相应的账户,手机在接收到中文音频数据后再将中文音频数据发送给蓝牙耳机用户A所使用的耳机,蓝牙耳机用户A的耳机接收到中文音频数据后进行播放,使蓝牙耳机用户A可听到以中文作为表述的蓝牙耳机用户B的说话内容。
此外,本发明实施例还提出一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上耳机控制方法和/或翻译方法任一实施例的相关步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,耳机,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (14)
1.一种耳机控制方法,其特征在于,应用于第一耳机,所述耳机控制方法包括以下步骤:
获取第一用户的第一用户信息,获取第一语音数据,所述第一用户信息包括所述第一用户使用的第一语种和所述第一用户的第一身份信息;
将所述第一用户信息和所述第一语音数据发送至云端服务器,以使所述云端服务器将接收到的所述第一语音数据翻译成所述第一语种对应的第二语音数据、并将所述第二语音数据发送至所述第一身份信息对应的第二耳机。
2.如权利要求1所述的耳机控制方法,其特征在于,所述将所述第一用户信息和所述第一语音数据发送至云端服务器的步骤之前,还包括:
发送所述第一用户信息至所述云端服务器,以使所述云端服务器根据所述第一用户信息建立所述第一耳机与所述第二耳机之间的会话通道;
在接收到所述云端服务器返回的会话通道已建立的消息后,执行所述将所述第一用户信息和所述第一语音数据发送至云端服务器的步骤,以使所述云端服务器基于所述会话通道将接收到的所述第一语音数据翻译成所述第一语种对应的第二语音数据、并将所述第二语音数据发送至所述第一身份信息对应的第二耳机。
3.如权利要求1或2所述的耳机控制方法,其特征在于,所述将所述第一用户信息和所述第一语音数据发送至云端服务器的步骤之前,还包括:
将第二用户信息发送至所述第二耳机,以使所述第二耳机获取所述第二用户信息和第三语音数据,将所述第二用户信息和所述第三语音数据发送至所述云端服务器;
其中,所述第二用户信息为使用所述第一耳机的第二用户的信息,所述第二用户信息包括所述第二用户使用的第二语种和所述第二用户的第二身份信息,所述云端服务器将所述第三语音数据翻译成所述第二语种对应的第四语音数据、并将所述第四语音数据发送至所述第二身份信息对应的所述第一耳机。
4.如权利要求3所述的耳机控制方法,其特征在于,所述将第二用户信息发送至所述第二耳机的步骤之后,还包括:
当接收到所述第四语音数据时,播放所述第四语音数据。
5.如权利要求3所述的耳机控制方法,其特征在于,所述获取第一用户的第一用户信息的步骤之前,还包括:
启动近场通信模块,以产生无线近场网络;
当存在设备进入所述无线近场网络时,建立与所述设备的近场通信通道;
所述获取第一用户的第一用户信息的步骤包括:
通过所述近场通信通道读取所述设备中的所述第一用户信息。
6.如权利要求5所述的耳机控制方法,其特征在于,所述设备为所述第二耳机,所述将第二用户信息发送至所述第二耳机的步骤包括:
通过所述近场通信通道将第二用户信息发送至所述第二耳机。
7.一种翻译方法,其特征在于,应用于云端服务器,所述翻译方法包括:
获取第一耳机发送的第一用户信息和第一语音数据;所述第一用户信息包括第一用户使用的第一语种和所述第一用户的第一身份信息;
将所述第一语音数据翻译成所述第一语种对应的第二语音数据;
将所述第二语音数据发送至所述第一身份信息对应的第二耳机。
8.如权利要求7所述的翻译方法,其特征在于,所述将所述第一语音数据翻译成所述第一语种对应的第二语音数据的步骤包括:
确定所述第一语音数据对应的第一文本信息;
将所述第一文本信息翻译成所述第一语种对应的第二文本信息;
将所述第二文本信息转换为所述第二语音数据。
9.如权利要求8所述的翻译方法,其特征在于,所述将所述第二文本信息转换为所述第二语音数据的步骤包括:
获取所述第一耳机对应的语音生成模型;所述语音生成模型为通过使用所述第一耳机的第二用户的语音数据训练得到的模型;
将所述第二文本信息输入所述语音生成模型;
将所述语音生成模型的输出结果作为所述第二语音数据;所述第二语音数据具有所述第一耳机的第二用户的发音特征。
10.如权利要求7所述的翻译方法,其特征在于,所述获取第一耳机发送的第一用户信息和第一语音数据的步骤之前,还包括:
当接收到所述第一耳机发送的第一用户信息时,根据所述第一用户信息建立所述第一耳机与所述第二耳机之间的会话通道;
所述将所述第一语音数据翻译成所述第一语种对应的第二语音数据的步骤包括:
通过所述会话通道,将所述第一语音数据翻译成所述第二语音数据
所述将所述第二语音数据发送至所述第一身份信息对应的第二耳机的步骤包括:
通过所述会话通道,将所述第二语音数据发送至所述第二耳机。
11.如权利要求10所述的翻译方法,其特征在于,所述根据所述第一用户信息建立所述第一耳机与所述第二耳机之间的会话通道的步骤之前,还包括:
确定所述第一用户信息对应的第二耳机;
判断是否接收到所述第二耳机发送的第二用户信息;
当接收到所述第二用户信息,且所述第二用户信息为所述第一耳机对应的用户信息时,建立所述第一耳机与所述第二耳机之间的会话通道;且/或,
所述根据所述第一用户信息建立所述第一耳机与所述第二耳机之间的会话通道的步骤之后,还包括:
发送会话通道已建立的消息至所述第一耳机和所述第二耳机。
12.一种耳机,其特征在于,所述耳机包括:
麦克风,用于采集语音数据;
存储器、处理器及存储在所述存储器上并可在所述处理器上运行的耳机控制程序,所述处理器与所述麦克风连接,所述耳机控制程序被所述处理器执行时实现如权利要求1至6中任一项所述的耳机控制方法的步骤。
13.如权利要求12所述的耳机,其特征在于,所述耳机还包括近场通信模块,所述近场通信模块与所述处理器连接。
14.一种云端服务器,其特征在于,所述云端服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的翻译程序,所述翻译程序被所述处理器执行时实现如权利要求7至11中任一项所述的翻译方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010614142.2A CN111783481A (zh) | 2020-06-30 | 2020-06-30 | 耳机控制方法、翻译方法、耳机和云端服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010614142.2A CN111783481A (zh) | 2020-06-30 | 2020-06-30 | 耳机控制方法、翻译方法、耳机和云端服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111783481A true CN111783481A (zh) | 2020-10-16 |
Family
ID=72760273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010614142.2A Pending CN111783481A (zh) | 2020-06-30 | 2020-06-30 | 耳机控制方法、翻译方法、耳机和云端服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111783481A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112309370A (zh) * | 2020-11-02 | 2021-02-02 | 北京分音塔科技有限公司 | 语音翻译方法、装置及设备、翻译机 |
CN113362818A (zh) * | 2021-05-08 | 2021-09-07 | 山西三友和智慧信息技术股份有限公司 | 一种基于人工智能的语音交互指导系统及方法 |
CN114267358A (zh) * | 2021-12-17 | 2022-04-01 | 北京百度网讯科技有限公司 | 音频处理方法、装置、设备、存储介质及程序 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107995361A (zh) * | 2017-11-28 | 2018-05-04 | 宇龙计算机通信科技(深圳)有限公司 | 操作语音信息的方法、蓝牙耳机和智能终端 |
CN108280067A (zh) * | 2018-02-26 | 2018-07-13 | 深圳市百泰实业股份有限公司 | 耳机翻译方法和系统 |
KR20190047559A (ko) * | 2017-10-27 | 2019-05-08 | 주식회사 비즈모델라인 | 블루투스 이어폰 장치를 이용한 오티피 제공 시스템 및 방법 |
CN110765786A (zh) * | 2019-10-12 | 2020-02-07 | 深圳情景智能有限公司 | 翻译系统、耳机翻译方法及翻译设备 |
-
2020
- 2020-06-30 CN CN202010614142.2A patent/CN111783481A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190047559A (ko) * | 2017-10-27 | 2019-05-08 | 주식회사 비즈모델라인 | 블루투스 이어폰 장치를 이용한 오티피 제공 시스템 및 방법 |
CN107995361A (zh) * | 2017-11-28 | 2018-05-04 | 宇龙计算机通信科技(深圳)有限公司 | 操作语音信息的方法、蓝牙耳机和智能终端 |
CN108280067A (zh) * | 2018-02-26 | 2018-07-13 | 深圳市百泰实业股份有限公司 | 耳机翻译方法和系统 |
CN110765786A (zh) * | 2019-10-12 | 2020-02-07 | 深圳情景智能有限公司 | 翻译系统、耳机翻译方法及翻译设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112309370A (zh) * | 2020-11-02 | 2021-02-02 | 北京分音塔科技有限公司 | 语音翻译方法、装置及设备、翻译机 |
CN113362818A (zh) * | 2021-05-08 | 2021-09-07 | 山西三友和智慧信息技术股份有限公司 | 一种基于人工智能的语音交互指导系统及方法 |
CN114267358A (zh) * | 2021-12-17 | 2022-04-01 | 北京百度网讯科技有限公司 | 音频处理方法、装置、设备、存储介质及程序 |
CN114267358B (zh) * | 2021-12-17 | 2023-12-12 | 北京百度网讯科技有限公司 | 音频处理方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107895578B (zh) | 语音交互方法和装置 | |
US10255918B2 (en) | Command and control of devices and applications by voice using a communication base system | |
JP2023158002A5 (ja) | システム、方法及びプログラム | |
CN111783481A (zh) | 耳机控制方法、翻译方法、耳机和云端服务器 | |
US7519359B2 (en) | Voice tagging of automated menu location | |
CN101473636A (zh) | 用于检索信息的方法和系统 | |
US20200211560A1 (en) | Data Processing Device and Method for Performing Speech-Based Human Machine Interaction | |
JP2019175426A (ja) | 翻訳システム、翻訳方法、翻訳装置、及び音声入出力装置 | |
WO2021077659A1 (zh) | 一种信息交互的实时翻译方法、介质及终端 | |
CN111325039A (zh) | 基于实时通话的语言翻译方法、系统、程序和手持终端 | |
TWI695281B (zh) | 翻譯系統、翻譯方法、以及翻譯裝置 | |
CN111554280A (zh) | 对利用人工智能的翻译内容和口译专家的口译内容进行混合的实时口译服务系统 | |
CN111681650A (zh) | 一种智能会议控制方法和装置 | |
JP2000206983A (ja) | 情報処理装置および方法、並びに提供媒体 | |
JP5163682B2 (ja) | 通訳通話システム | |
JP2014186713A (ja) | 会話システムおよびその会話処理方法 | |
CN114390144A (zh) | 语音来电智能处理方法、装置和控制系统 | |
CN113726952B (zh) | 通话过程中的同声传译方法及装置、电子设备、存储介质 | |
JP2005286979A (ja) | 通訳電話システム | |
CN111274828B (zh) | 基于留言的语言翻译方法、系统、计算机程序和手持终端 | |
KR102181583B1 (ko) | 음성인식 교감형 로봇, 교감형 로봇 음성인식 시스템 및 그 방법 | |
JP2005331608A (ja) | 情報処理装置および情報処理方法 | |
JP6805663B2 (ja) | 通信装置、通信システム、通信方法及びプログラム | |
TW201814508A (zh) | 將電話機的語音訊號輸入到智慧裝置的方法、電子裝置及具有非揮發性儲存裝置之電腦 | |
JP2003288340A (ja) | 通話翻訳装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |