CN111739528A - 一种交互方法、装置和耳机 - Google Patents

一种交互方法、装置和耳机 Download PDF

Info

Publication number
CN111739528A
CN111739528A CN202010507484.4A CN202010507484A CN111739528A CN 111739528 A CN111739528 A CN 111739528A CN 202010507484 A CN202010507484 A CN 202010507484A CN 111739528 A CN111739528 A CN 111739528A
Authority
CN
China
Prior art keywords
user
recognition result
voice recognition
assistant
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010507484.4A
Other languages
English (en)
Inventor
崔文华
赵楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Intelligent Technology Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN202010507484.4A priority Critical patent/CN111739528A/zh
Publication of CN111739528A publication Critical patent/CN111739528A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1091Details not provided for in groups H04R1/1008 - H04R1/1083
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephone Function (AREA)

Abstract

本发明实施例提供了一种交互方法、一种交互装置和一种耳机,所述交互方法包括对用户语音进行识别,得到语音识别结果;调用交互助手根据语音识别结果执行交互操作。耳机的交互助手可以根据用户语音的语音识别结果进行交互操作,不需要用户使用手操作耳机,实现耳机的多种交互功能。

Description

一种交互方法、装置和耳机
技术领域
本发明涉及电子设备技术领域,特别是涉及一种交互方法、一种交互装置和一种耳机。
背景技术
随着科学技术的不断发展,电子技术也得到了飞速的发展,电子设备的种类也越来越多,人们越来越习惯在生活中使用多种电子设备。
但是在一些场景中,电子设备的操作仍然存在一些限制,不利于用户对电子设备进行操作。例如,在驾驶汽车、骑行、跑步等场景中,用户不方便对手持式的电子设备进行操作。
发明内容
本发明实施例提供一种交互方法、一种交互装置和一种耳机。
本发明实施例公开了一种交互方法,应用于耳机,所述耳机具有交互助手,所述方法包括:
所述耳机对用户语音进行识别,得到语音识别结果;
调用所述交互助手根据所述语音识别结果执行交互操作。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
调用所述交互助手根据所述语音识别结果生成拍摄指令:
向具有拍摄功能的终端发送所述拍摄指令,所述拍摄指令用于指示所述终端在拍摄功能被启动的情况下,执行拍摄操作。
可选地,所述调用所述交互助手根据所述语音识别结果生成拍摄指令,包括:
当所述语音识别结果包括表征确认拍摄的信息时,调用所述交互助手生成拍摄指令。
可选地,所述当所述语音识别结果包括表征确认拍摄的信息时,调用所述交互助手生成拍摄指令,包括:
当所述语音识别结果还包括表征选择拍摄参数的信息时,调用所述交互助手生成包括所述拍摄参数的拍摄指令。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
根据所述语音识别结果唤醒所述交互助手;
获取用户状态;
调用所述交互助手根据所述用户状态推荐歌曲或播放歌曲。
可选地,所述耳机具有重力传感器,所述获取用户状态,包括:
获取所述重力传感器检测的传感数据,根据所述传感数据确定用户状态。
可选地,所述调用所述交互助手根据所述用户状态推荐歌曲,包括:
调用所述交互助手查找与所述用户状态匹配的推荐歌曲并向用户推荐。
可选地,所述调用所述交互助手根据所述用户状态推荐歌曲或播放歌曲,包括:
确定与所述用户状态匹配的音效,并将预设歌曲调整为所述音效;
调用所述交互助手播放调整音效后的所述预设歌曲。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取记录的信息并播放。
可选地,所述调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取已记录的信息并播放,包括:
调用所述交互助手根据所述语音识别结果从所述语音识别结果中识别备忘信息并记录,或根据所述语音识别结果获取预设备忘信息并播放。
可选地,所述调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取记录的信息并播放,包括:
调用所述交互助手根据所述语音识别结果从所述用户语音,识别目标语音并记录,或根据所述语音识别结果获取已记录的目标语音并播放。
可选地,还包括:在记录备忘信息之后,生成针对所述备忘信息的提醒事件。
可选地,还包括:当满足预设提醒事件的触发条件时,调用所述交互助手获取所述预设提醒事件相应的备忘信息并播放。
可选地,所述根据所述语音识别结果获取预设备忘信息并播放,包括:
从预设备忘信息中查找与所述语音识别结果匹配的信息;
调用所述交互助手播放所述与所述语音识别结果匹配的信息。
可选地,还包括:
对所述备忘信息进行语义分析,得到语义分析结果;
根据语义分析结果,对所述备忘信息生成标签信息。
可选地,所述根据所述语音识别结果获取预设备忘信息并播放,包括:
当所述语音识别结果包括表征需求查找具有目标标签信息的备忘信息时,调用所述交互助手查找与目标标签信息匹配的预设备忘信息并播放。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
从所述语音识别结果中获取对话语句;
调用所述交互助手生成与所述对话语句匹配的答复语句并播放。
可选地,所述调用所述交互助手,生成与所述对话语句匹配的答复语句并播放,包括:
获取用户方位信息;
调用所述交互助手根据所述用户方位信息和所述对话语句,生成用于语音导航的答复语句并播放。
可选地,所述耳机具有方位传感器,所述获取用户方位信息,包括:
获取所述方位传感器检测的用户方位信息。
可选地,所述耳机与移动设备通信连接,所述调用所述交互助手根据所述用户方位信息和所述对话语句,生成用于语音导航的答复语句并播放,包括:
获取所述移动设备检测的用户地理位置信息;
调用所述交互助手根据所述用户方位信息、所述对话语句和用户地理位置信息,生成用于语音导航的答复语句并播放。
本发明实施例还公开了一种交互装置,应用于耳机,所述耳机具有交互助手,所述交互装置包括:
语音识别模块,用于对用户语音进行识别,得到语音识别结果;
交互模块,用于调用所述交互助手根据所述语音识别结果执行交互操作。
可选地,所述交互模块包括:
指令生成子模块,用于调用所述交互助手根据所述语音识别结果生成拍摄指令:
指令发送子模块,用于向具有拍摄功能的终端发送所述拍摄指令,所述拍摄指令用于指示所述终端在拍摄功能被启动的情况下,执行拍摄操作。
可选地,所述指令生成子模块,用于当所述语音识别结果包括表征确认拍摄的信息时,调用所述交互助手生成拍摄指令。
可选地,所述指令生成子模块,用于当所述语音识别结果还包括表征选择拍摄参数的信息时,调用所述交互助手生成包括所述拍摄参数的拍摄指令。
可选地,所述交互模块包括:
唤醒子模块,用于根据所述语音识别结果唤醒所述交互助手;
用户状态获取子模块,用于获取用户状态;
歌曲交互子模块,用于调用所述交互助手根据所述用户状态推荐歌曲或播放歌曲。
可选地,所述耳机具有重力传感器,所述用户状态获取子模块,用于获取所述重力传感器检测的传感数据,根据所述传感数据确定用户状态。
可选地,所述歌曲交互子模块,用于调用所述交互助手查找与所述用户状态匹配的推荐歌曲并向用户推荐。
可选地,所述歌曲交互子模块,用于确定与所述用户状态匹配的音效,并将预设歌曲调整为所述音效;调用所述交互助手播放调整音效后的所述预设歌曲。
可选地,所述交互模块包括:记录交互子模块,用于调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取记录的信息并播放。
可选地,所述记录交互子模块,用于调用所述交互助手根据所述语音识别结果从所述语音识别结果中识别备忘信息并记录,或根据所述语音识别结果获取预设备忘信息并播放。
可选地,所述记录交互子模块,用于调用所述交互助手根据所述语音识别结果从所述用户语音,识别目标语音并记录,或根据所述语音识别结果获取已记录的目标语音并播放。
可选地,还包括:提醒事件生成模块,用于在记录备忘信息之后,生成针对所述备忘信息的提醒事件。
可选地,还包括:提醒事件触发模块,用于当满足预设提醒事件的触发条件时,调用所述交互助手获取所述预设提醒事件相应的备忘信息并播放。
可选地,所述记录交互子模块,用于从预设备忘信息中查找与所述语音识别结果匹配的信息;调用所述交互助手播放所述与所述语音识别结果匹配的信息。
可选地,还包括:
语义分析模块,用于对所述备忘信息进行语义分析,得到语义分析结果;
标签生成模块,用于根据语义分析结果,对所述备忘信息生成标签信息。
可选地,所述记录交互子模块,用于当所述语音识别结果包括表征需求查找具有目标标签信息的备忘信息时,调用所述交互助手查找与目标标签信息匹配的预设备忘信息并播放。
可选地,所述交互模块包括:
对话语句获取子模块,用于从所述语音识别结果中获取对话语句;
对话交互子模块,用于调用所述交互助手生成与所述对话语句匹配的答复语句并播放。
可选地,所述对话交互子模块,用于获取用户方位信息;调用所述交互助手根据所述用户方位信息和所述对话语句,生成用于语音导航的答复语句并播放。
可选地,所述对话交互子模块,用于获取所述方位传感器检测的用户方位信息。
可选地,所述耳机与移动设备通信连接,所述对话交互子模块,用于获取所述移动设备检测的用户地理位置信息;调用所述交互助手根据所述用户方位信息、所述对话语句和用户地理位置信息,生成用于语音导航的答复语句并播放。
本发明实施例还公开了一种耳机,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
所述耳机对用户语音进行识别,得到语音识别结果;
调用所述交互助手根据所述语音识别结果执行交互操作。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
调用所述交互助手根据所述语音识别结果生成拍摄指令:
向具有拍摄功能的终端发送所述拍摄指令,所述拍摄指令用于指示所述终端在拍摄功能被启动的情况下,执行拍摄操作。
可选地,所述调用所述交互助手根据所述语音识别结果生成拍摄指令,包括:
当所述语音识别结果包括表征确认拍摄的信息时,调用所述交互助手生成拍摄指令。
可选地,所述当所述语音识别结果包括表征确认拍摄的信息时,调用所述交互助手生成拍摄指令,包括:
当所述语音识别结果还包括表征选择拍摄参数的信息时,调用所述交互助手生成包括所述拍摄参数的拍摄指令。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
根据所述语音识别结果唤醒所述交互助手;
获取用户状态;
调用所述交互助手根据所述用户状态推荐歌曲或播放歌曲。
可选地,所述耳机具有重力传感器,所述获取用户状态,包括:
获取所述重力传感器检测的传感数据,根据所述传感数据确定用户状态。
可选地,所述调用所述交互助手根据所述用户状态推荐歌曲,包括:
调用所述交互助手查找与所述用户状态匹配的推荐歌曲并向用户推荐。
可选地,所述调用所述交互助手根据所述用户状态推荐歌曲或播放歌曲,包括:
确定与所述用户状态匹配的音效,并将预设歌曲调整为所述音效;
调用所述交互助手播放调整音效后的所述预设歌曲。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取记录的信息并播放。
可选地,所述调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取已记录的信息并播放,包括:
调用所述交互助手根据所述语音识别结果从所述语音识别结果中识别备忘信息并记录,或根据所述语音识别结果获取预设备忘信息并播放。
可选地,所述调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取记录的信息并播放,包括:
调用所述交互助手根据所述语音识别结果从所述用户语音,识别目标语音并记录,或根据所述语音识别结果获取已记录的目标语音并播放。
可选地,还包含用于进行以下操作的指令:
在记录备忘信息之后,生成针对所述备忘信息的提醒事件。
可选地,还包含用于进行以下操作的指令:
当满足预设提醒事件的触发条件时,调用所述交互助手获取所述预设提醒事件相应的备忘信息并播放。
可选地,所述根据所述语音识别结果获取预设备忘信息并播放,包括:
从预设备忘信息中查找与所述语音识别结果匹配的信息;
调用所述交互助手播放所述与所述语音识别结果匹配的信息。
可选地,还包含用于进行以下操作的指令:
对所述备忘信息进行语义分析,得到语义分析结果;
根据语义分析结果,对所述备忘信息生成标签信息。
可选地,所述根据所述语音识别结果获取预设备忘信息并播放,包括:
当所述语音识别结果包括表征需求查找具有目标标签信息的备忘信息时,调用所述交互助手查找与目标标签信息匹配的预设备忘信息并播放。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
从所述语音识别结果中获取对话语句;
调用所述交互助手生成与所述对话语句匹配的答复语句并播放。
可选地,所述调用所述交互助手,生成与所述对话语句匹配的答复语句并播放,包括:
获取用户方位信息;
调用所述交互助手根据所述用户方位信息和所述对话语句,生成用于语音导航的答复语句并播放。
可选地,所述耳机具有方位传感器,所述获取用户方位信息,包括:
获取所述方位传感器检测的用户方位信息。
可选地,所述耳机与移动设备通信连接,所述调用所述交互助手根据所述用户方位信息和所述对话语句,生成用于语音导航的答复语句并播放,包括:
获取所述移动设备检测的用户地理位置信息;
调用所述交互助手根据所述用户方位信息、所述对话语句和用户地理位置信息,生成用于语音导航的答复语句并播放。
本发明实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的交互方法的步骤。
本发明实施例包括以下优点:
在本发明实施例中,耳机的交互助手可以根据用户语音的语音识别结果进行交互操作,不需要用户使用手操作耳机,实现耳机的多种交互功能。
附图说明
图1是本发明的一种交互方法实施例一的步骤流程图;
图2是本发明的一种交互方法实施例二的步骤流程图;
图3是本发明的一种交互方法实施例三的步骤流程图;
图4是本发明的一种交互方法实施例四的步骤流程图;
图5是本发明的一种交互方法实施例五的步骤流程图;
图6是本发明的一种交互装置实施例一的结构框图;
图7是本发明的一种交互装置实施例二的结构框图;
图8是一示例性实施例示出的一种用于交互的耳机的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种交互方法实施例一的步骤流程图,该方法应用于耳机,耳机具有交互助手,所述方法具体可以包括如下步骤:
步骤101,所述耳机对用户语音进行识别,得到语音识别结果。
耳机是人们日常生活中经常使用的可携带电子设备,耳机可以具有播放功能,拾音功能和通信功能。用户可以使用耳机听歌或进行电话沟通。
本发明实施例中,为了增加耳机的交互性能,耳机可以具有语音识别功能。例如耳机设有语音识别芯片,或者在耳机芯片中设置语音识别的程序。耳机在采集用户语音后,可以对用户语音进行识别,得到语音识别结果。
步骤102,调用所述交互助手根据所述语音识别结果执行交互操作。
耳机安装交互助手,交互助手可以是安装在耳机中独立运行的程序,可以提供多种多样的交互功能。交互助手可以根据语音识别结果执行交互操作,以实现耳机的多种交互功能。
在本发明实施例中,耳机可以与移动终端通信连接,移动终端可以按照有与耳机的交互助手配套的应用程序APP,用户可以在APP的界面控制交互助手。
交互助手可以通过特定的方式被唤醒,例如,特定的语音指令。交互助手的一些交互功能可以在被唤醒后才执行,一些交互功能可以在不被唤醒的情况下也能执行。
在本发明实施例中,耳机的交互助手可以根据用户语音的语音识别结果进行交互操作,不需要用户使用手操作耳机,实现耳机的多种交互功能。
受限于自拍杆的长度,无法使用自拍杆进行远距离拍摄,为了便于用户进行远距离拍摄,在一实施例中,耳机的交互功能可以包括控制终端进行拍摄的功能。用户通过向耳机输入语音可以控制终端进行拍摄。
参照图2,示出了本发明的一种交互方法实施例二的步骤流程图,该方法应用于耳机,耳机具有交互助手,所述方法具体可以包括如下步骤:
步骤201,所述耳机对用户语音进行识别,得到语音识别结果。
耳机与终端的通信方式通常可以是蓝牙连接,通过蓝牙协议传输数据。终端可以包括手机、平板电脑等具有拍摄功能的设备。
用户在使用耳机控制终端进行拍摄时,用户可以向耳机输入语音,耳机对用户语音进行识别,得到语音识别结果。
步骤202,调用所述交互助手根据所述语音识别结果生成拍摄指令。
在本发发明实施例中,所述调用所述交互助手根据所述语音识别结果生成拍摄指令的步骤可以包括:当所述语音识别结果包括表征确认拍摄的信息时,调用所述交互助手生成拍摄指令。
表征确认拍摄的信息是指表示确认用户需要拍摄的信息。例如,用户说出“拍照”,“马上拍照”,“茄子”等信息时,可以确认用户需要拍摄。在识别结果包括确认拍摄的信息时,耳机才生成拍摄指令;如果识别结果不包括确认拍摄的信息时,耳机不生成拍摄指令。
进一步的,本发明实施例可以不仅仅只实现通过耳机触发终端拍摄,还可以实现控制终端以多种拍摄参数进行拍摄。拍摄参数可以包括对终端中实现拍照功能的软件进行控制的参数,例如,拍摄模式(如夜景模式,人像模式,运动模式),是否开启美颜,是否开启图像虚化,是否延迟拍照,是否连拍等参数。拍摄参数还可以包括对终端中涉及拍照功能的硬件进行控制的参数,例如,调节光圈,调节焦距等参数。
本发明实施例中,所述当所述语音识别结果包括表征确认拍摄的信息时,调用所述交互助手生成拍摄指令的步骤可以包括:当所述语音识别结果还包括表征选择拍摄参数的信息时,调用所述交互助手生成包括所述拍摄参数的拍摄指令。
表征选择拍摄参数是指表示用户选择某个拍摄参数的信息。例如,用户说出“美颜拍摄”,其中“美颜”为选择拍摄参数的信息,“拍摄”为确认拍摄的信息。又例如,用户说出“拍摄亮一点”,其中“亮一点”为选择拍摄参数的信息,“拍摄”为确认拍摄的信息。又例如,用户说出“延迟3秒拍摄”,其中“延迟3秒”为选择拍摄参数的信息,“拍摄”为确认拍摄的信息。
在本发明实施例中,可以采用预先训练的语音识别模型,对接收到的用户语音进行识别得到识别结果。
语音识别模型可以通过收集大量指示需要拍摄的语句作为训练样本。例如“现在拍摄”,“把人和后面的建筑都拍进来”,“拍一张美颜的,再拍一张不美颜的”。语音识别模型可以使用断句检测机制进行训练,使得可以完整识别用户不同拍摄需求的语句。
当识别结果不包括表征选择拍摄参数的信息时,耳机可以生成包括预设拍摄参数的拍摄指令,预设拍摄参数可以是用户根据使用习惯设定的参数。
当识别结果不包括表征选择拍摄参数的信息时,拍摄指令中可以不包括任何拍摄参数,终端可以接收到拍摄指令后选择拍摄参数进行拍摄。
步骤203,向具有拍摄功能的终端发送所述拍摄指令,所述拍摄指令用于指示所述终端在拍摄功能被启动的情况下,执行拍摄操作。
在一种示例中,如果耳机未与终端建立通信连接,耳机可以在语音识别结果包括需要拍摄的内容时,先与终端建立连接。
在另一种示例中,如果耳机已经与终端建立了通信连接,耳机可以直接向终端发送拍摄指令。
在本发明实施例中,耳机的交互助手可以根据用户语音的语音识别结果,生成拍摄指令并向终端发送;终端可以根据拍摄指令执行相应的拍摄操作。本发明实施例解决了对终端的拍摄控制受距离影响的问题,能够实现远距离拍摄;不需要用户使用肢体操作耳机、终端或者自拍杆就能控制终端拍摄,简化了用户的操作过程。
在本发明实施例中,终端可以向耳机发送反馈信息。终端在执行拍摄操作后,向耳机发送反馈信息。例如,拍摄操作执行成功,则反馈信息可以为“拍摄成功”。拍摄操作执行失败,则反馈信息可以为“内存不足,无法拍摄”。
耳机接收终端发送的反馈信息;响应反馈信息执行相应反馈操作。反馈操作可以播放预设语音,例如“拍照成功”的语音,“拍照失败”的语音。
在本发明实施例中,耳机可以对用户语音进行识别得到识别结果,交互助手根据识别结果生成拍摄指令;终端可以根据拍摄指令执行相应的拍摄操作。本发明实施例解决了对终端的拍摄控制受距离影响的问题,能够实现远距离拍摄;并且简化用户的操作过程,用户无需对终端或者自拍杆进行触碰控制。
在跑步、开车等场景下,用户不方便拿出手机查找歌曲,为了便于用户查找歌曲,在一实施例中,耳机的交互功能可以包括歌曲推荐功能。
参照图3,示出了本发明的一种交互方法实施例三的步骤流程图,该方法应用于耳机,耳机具有交互助手,所述方法具体可以包括如下步骤:
步骤301,所述耳机对用户语音进行识别,得到语音识别结果。
步骤302,根据所述语音识别结果唤醒所述交互助手。
当语音识别结果包括表征用户需要查找合适的歌曲,或调整歌曲的音效的信息时,唤醒交互助手向用户推荐歌曲的功能。例如,语音识别结果包括:“播放一个适合跑步的歌曲吧”,或“切换到适合跑步的音效”。
步骤303,获取用户状态。
用户状态,即用户所处的状态,可以包括静坐状态、步行状态、跑步状态、驾驶状态、骑行状态等。
在本发明实施例中,耳机可以具有可以检测用户状态的重力传感器。所述获取用户状态的步骤可以包括:获取所述重力传感器检测的传感数据,根据所述传感数据确定用户状态。具体的,可以根据重力传感器的传感数据,采用检测用户状态的算法,确定用户状态。
步骤304,调用所述交互助手根据所述用户状态推荐歌曲或播放歌曲。
交互助手可以根据用户状态向用户推荐歌曲,由用户确定是否播放歌曲;也可以直接播放适配用户状态的歌曲。
在本发明实施例中,可以调用交互助手查找与用户状态匹配的推荐歌曲并向用户推荐。
具体的,可以预先对预设歌曲列表中的歌曲配置多种标签或分类,例如,“摇滚”、“流行”、“爵士”、“民谣”、“纯音乐”、“节奏感强”、“激情”、“抒情”、“宁静”、“动感”等标签。交互助手可以查找与用户状态匹配的标签的歌曲。例如,当用户状态为“跑步状态”,则可以推荐标签为“节奏感强”的歌曲。
在本发明实施例中,交互助手还可以根据用户状态,调整歌曲的音效。所述根据所述用户状态播放歌曲的步骤可以包括:确定与所述用户状态匹配的音效,并将预设歌曲调整为所述音效;调用所述交互助手播放调整音效后的所述预设歌曲。
具体的,可以通过音效算法调整歌曲的音效。音效算法可以将歌曲调整为多种类型的音效,例如,“宁静”、“悠远”、“摇滚”等等。当用户状态为静坐,可以将预设歌曲调整为“宁静”的音效。
在本发明实施例中,耳机可以对用户语音进行识别得到识别结果,根据语音识别结果唤醒交互助手,并获取用户状态,调用交互助手根据用户状态推荐歌曲或播放歌曲。本发明实施例实现了不需要用户使用手操作耳机,由耳机向推荐歌曲或播放歌曲,简化用户的操作过程。
在跑步、开车等场景下,用户不方便拿出手机记录备忘信息或查找备忘信息,为了便于用户使用备忘录,在一实施例中,耳机的交互功能可以包括信息记录交互功能。
参照图4,示出了本发明的一种交互方法实施例四的步骤流程图,该方法应用于耳机,耳机具有交互助手,所述方法具体可以包括如下步骤:
步骤401,所述耳机对用户语音进行识别,得到语音识别结果。
步骤402,调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取记录的信息并播放。
在本发明实施例中,所述调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取记录的信息并播放的步骤可以包括:调用所述交互助手根据所述语音识别结果从所述用户语音,识别目标语音并记录,或根据所述语音识别结果获取已记录的目标语音并播放。
当语音识别结果包括表示需要记录用户语音时,交互助手可以从用户语音识别目标语音。例如,用户说出“录一下音”,则交互助手可以录下之后采集的用户语音。
用户可以设置录音的方式,以筛选需要录下的声音。例如,在会议中,用户希望录下参加会议的各个人员的语音,则耳机可以记录全向的用户语音。在课堂中,用户希望记录老师讲课的语音,则耳机可以记录指定方向的用户语音。
当语音识别结果包括表示需要播放已记录的目标语音时,交互助手可以查找目标语音并播放。
在本发明实施例中,所述调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取记录的信息并播放的步骤可以包括:调用所述交互助手根据所述语音识别结果从所述语音识别结果中识别备忘信息并记录,或根据所述语音识别结果获取预设备忘信息并播放。
当语音识别结果包括表示需要记录备忘信息的信息时,交互助手可以从语音识别结果提取相关的内容,并记录为备忘信息。交互助手支持指令连说,例如,语音指令的形式可以为“帮我记下+备忘内容”,语音识别结果为“帮我记下,明天上午10点与销售在三楼会议室开会”,“帮我记下”表示需要记录备忘信息,交互助手将“明天上午10点与销售在三楼会议室开会”记录为备忘信息。表示需要记录备忘信息的内容还可以是“帮我几个事”,“帮我记个账”,“帮父母记个事”,“帮我记个车位”等等,可以预先训练语音识别模型来识别表示需要记录备忘信息。
当语音识别结果包括表示需要查询备忘信息的信息时,交互助手可以获取预设备忘信息并播放。
在本发明实施例中,所述根据所述语音识别结果获取预设备忘信息并播放的步骤可以包括:从预设备忘信息中查找与所述语音识别结果匹配的信息;调用所述交互助手播放所述与所述语音识别结果匹配的信息。
具体的,交互助手可以从备忘信息检索特定信息,例如检索与用户语音中的关键词、时间、地点、分类等信息匹配的信息。例如,语音识别结果为“明天上午跟销售的会议是几点?”,交互助手答复为“10点”。
在本发明实施例中,耳机可以对所述备忘信息进行语义分析,得到语义分析结果;根据语义分析结果,对所述备忘信息生成标签信息。
在本发发明实施例中,可以采用自然语言理解的算法,对语音识别结果进行语义分析,得到语义分析结果。
所述根据所述语音识别结果获取预设备忘信息并播放的步骤可以包括:当所述语音识别结果包括表征需求查找具有目标标签信息的备忘信息时,调用所述交互助手查找与目标标签信息匹配的预设备忘信息并播放。
标签信息可以包括分类标签、属性标签等信息。交互助手可以根据语义分析结果,生成相应的标签信息。基于语义分析,交互助手可以对备忘信息添加标签,例如,用户说完“帮我记下,明天上午10点与销售在三楼会议室开会”,基于语义分析,这条备忘信息属于待办事项类,因此给这条备忘信息配置待办事项类标签。又例如,用户说出“帮我记下,中午外卖点了20块”,基于语义分析,这条备忘信息属于账单类,因此给这条备忘信息配置账单类标签。
用户除了通过关键词检索之外,还可以通过标签信息进行检索,比如用户语音为“明天我有什么待办事项?”,交互助手查找具有“待办事项”标签信息的备忘信息。
在本发明实施例中,可以在记录备忘信息之后,生成针对所述备忘信息的提醒事件。提醒事件可以包括提醒内容和触发条件,提醒内容即为备忘信息,触发条件即触发提醒事件的条件,例如达到设定的时间。
在本发明实施例中,当满足预设提醒事件的触发条件时,可以调用交互助手获取预设提醒事件相应的备忘信息并播放。
例如,提醒事件的触发条件为“时间达到9:45”,则耳机播放提醒事件对应的备忘信息,耳机通过语音提醒“您在10点安排了在三楼会议室,与销售开会,请提前安排”。
在本发明实施例中,耳机可以对用户语音进行识别得到语音识别结果;调用交互助手根据语音识别结果从用户语音中识别信息并记录,或,根据语音识别结果获取记录的信息并播放。本发明实施例实现了不需要用户使用手操作耳机,可以由耳机记录信息或播放已记录的信息,简化用户的操作过程。
在步行、骑行等场景下,用户不方便拿出手机进行查询,为了方便用户查询,在一实施例中,耳机的交互功能可以包括问答交互功能。
参照图5,示出了本发明的一种交互方法实施例五的步骤流程图,该方法应用于耳机,耳机具有交互助手,所述方法具体可以包括如下步骤:
步骤501,所述耳机对用户语音进行识别,得到语音识别结果。
步骤502,从所述语音识别结果中获取对话语句。
在本发明实施例中,交互助手可以与用户进行对话,可以从语音识别结果中获取用户的对话语句。
步骤503,调用所述交互助手生成与所述对话语句匹配的答复语句并播放。
交互助手可以根据用户的对话语句,生成匹配的答复语句并播放,从而与用户进行语音问答。
在本发明实施例中,所述调用所述交互助手,生成与所述对话语句匹配的答复语句并播放的步骤可以包括:获取用户方位信息;调用所述交互助手根据所述用户方位信息和所述对话语句,生成用于语音导航的答复语句并播放。
用户方位信息是指用户的正面朝向,在本发明实施例中,耳机可以具有方位传感器,在用户佩戴耳机时,方位传感器可以实时检测用户方位信息。
交互助手可以根据实时的用户方位信息和实时的对话,进行语音导航。
在实际中,用户往往不善于在屏幕地图上去辨别方向,在佩戴耳机的情况下,交互助手可以实时判断用户的方向,从而使得用户对方向的感知和真实空间结合更准确,无需通过屏幕去辨别到底是朝向何方。
在本发明实施例中,耳机可以获取当前的用户地理位置信息,例如,耳机检测当前的用户地理位置信息。又例如,耳机可以与移动设备通信连接。移动设备可以具备定位能力,例如设置GPS模块,或者通过与基站通信进行定位,耳机可以获取由移动设备检测的当前的用户地理位置信息。
所述调用所述交互助手根据所述用户方位信息和所述对话语句,生成用于语音导航的答复语句并播放的步骤可以包括:获取所述移动设备检测的用户地理位置信息;调用所述交互助手根据所述用户方位信息、所述对话语句和用户地理位置信息,生成用于语音导航的答复语句并播放。
交互助手可以与用户进行语音导航交互,在交互过程中可以根据实时的用户方位信息、实时的用户地理位置信息和用户不断说出的对话,播放导航语音。
例如,用户:附近有什么好吃的?
交互助手:您想吃什么风格的?
用户:四川风格。
交互助手:附近800米有家“眉州东坡”评价不错,您考虑去吗?
用户:好的。
交互助手:现在帮您导航到“眉州东坡”,您看到前方有个红色高楼了吗?
用户:看到了。
交互助手:您朝红色高楼方向走大概200米。
根据实时的用户地理位置信息确定用户此时开始向红色高楼方向步行。
交互助手:红色高楼下面有个理发店,您看到理发店之后,右转
根据实时的用户方位信息,确定用户此时开始右转。
交互助手:现在距离目的地还有600米。
交互助手:您看到前面有个十字路口了吗?
用户:看到了。
交互助手:您走到十字路口之后,左转。
根据实时的用户地理位置信息和用户方位信息,确定用户走到十字路口之后,左转。
交互助手:继续直行,“眉州东坡”在前方100米处。
根据实时的用户地理位置信息确定用户继续前行。
交互助手:“眉州东坡”在您的左手边,导航已完成,祝您用餐愉快。
在本发明实施例中,耳机可以对用户语音进行识别得到识别结果;从语音识别结果中获取对话语句,然后调用交互助手生成与对话语句匹配的答复语句并播放。本发明实施例实现了不需要用户使用手操作耳机,可以由耳机根据用户语音进行问答,简化用户的操作过程。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图6,示出了本发明的一种交互装置实施例一的结构框图,交互装置应用于耳机,所述耳机具有交互助手,所述交互装置具体可以包括如下模块:
语音识别模块601,用于耳机对用户语音进行识别,得到语音识别结果;
交互模块602,用于调用所述交互助手根据所述语音识别结果执行交互操作。
参照图7,示出了本发明的一种交互装置实施例二的结构框图,交互装置应用于耳机,所述耳机具有交互助手,所述交互装置具体可以包括如下模块:
语音识别模块701,用于耳机对用户语音进行识别,得到语音识别结果;
交互模块702,用于调用所述交互助手根据所述语音识别结果执行交互操作。
在本发明实施例中,所述交互模块702可以包括:
指令生成子模块7021,用于调用所述交互助手根据所述语音识别结果生成拍摄指令:
指令发送子模块7022,用于向具有拍摄功能的终端发送所述拍摄指令,所述拍摄指令用于指示所述终端在拍摄功能被启动的情况下,执行拍摄操作。
在本发明实施例中,所述指令生成子模块7021,用于当所述语音识别结果包括表征确认拍摄的信息时,调用所述交互助手生成拍摄指令。
在本发明实施例中,所述指令生成子模块7021,用于当所述语音识别结果还包括表征选择拍摄参数的信息时,调用所述交互助手生成包括所述拍摄参数的拍摄指令。
在本发明实施例中,所述交互模块702可以包括:
唤醒子模块7023,用于根据所述语音识别结果唤醒所述交互助手;
用户状态获取子模块7024,用于获取用户状态;
歌曲交互子模块7025,用于调用所述交互助手根据所述用户状态推荐歌曲或播放歌曲。
在本发明实施例中,所述耳机具有重力传感器,所述用户状态获取子模块7024,用于获取所述重力传感器检测的传感数据,根据所述传感数据确定用户状态。
在本发明实施例中,所述歌曲交互子模块7025,用于调用所述交互助手查找与所述用户状态匹配的推荐歌曲并向用户推荐。
在本发明实施例中,所述歌曲交互子模块7025,用于确定与所述用户状态匹配的音效,并将预设歌曲调整为所述音效;调用所述交互助手播放调整音效后的所述预设歌曲。
在本发明实施例中,所述交互模块702可以包括:
记录交互子模块7026,用于调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取记录的信息并播放。
在本发明实施例中,所述记录交互子模块7026,用于调用所述交互助手根据所述语音识别结果从所述语音识别结果中识别备忘信息并记录,或根据所述语音识别结果获取预设备忘信息并播放。
在本发明实施例中,所述记录交互子模块7026,用于调用所述交互助手根据所述语音识别结果从所述用户语音,识别目标语音并记录,或根据所述语音识别结果获取已记录的目标语音并播放。
在本发明实施例中,所述的交互装置还可以包括:
提醒事件生成模块703,用于在记录备忘信息之后,生成针对所述备忘信息的提醒事件。
在本发明实施例中,所述的交互装置还可以包括:
提醒事件触发模块704,用于当满足预设提醒事件的触发条件时,调用所述交互助手获取所述预设提醒事件相应的备忘信息并播放。
在本发明实施例中,所述记录交互子模块7026,用于从预设备忘信息中查找与所述语音识别结果匹配的信息;调用所述交互助手播放所述与所述语音识别结果匹配的信息。
在本发明实施例中,所述的交互装置还可以包括:
语义分析模块705,用于对所述备忘信息进行语义分析,得到语义分析结果;
标签生成模块706,用于根据语义分析结果,对所述备忘信息生成标签信息。
在本发明实施例中,所述记录交互子模块7026,用于当所述语音识别结果包括表征需求查找具有目标标签信息的备忘信息时,调用所述交互助手查找与目标标签信息匹配的预设备忘信息并播放。
在本发明实施例中,所述交互模块702可以包括:
对话语句获取子模块7027,用于从所述语音识别结果中获取对话语句;
对话交互子模块7028,用于调用所述交互助手生成与所述对话语句匹配的答复语句并播放。
在本发明实施例中,所述对话交互子模块7028,用于获取用户方位信息;调用所述交互助手根据所述用户方位信息和所述对话语句,生成用于语音导航的答复语句并播放。
在本发明实施例中,所述对话交互子模块7028,用于获取所述方位传感器检测的用户方位信息。
在本发明实施例中,所述耳机与移动设备通信连接,所述对话交互子模块7028,用于获取所述移动设备检测的用户地理位置信息;调用所述交互助手根据所述用户方位信息、所述对话语句和用户地理位置信息,生成用于语音导航的答复语句并播放。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图8是根据一示例性实施例示出的一种用于交互的耳机800的结构框图。参照图8,耳机800可以包括以下一个或多个组件:处理组件802,存储器804,电力组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制耳机800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在耳机800的操作。这些数据的示例包括用于在耳机800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件806为耳机800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为耳机800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述耳机800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当耳机800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当耳机800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为耳机800提供各个方面的状态评估。例如,传感器组件814可以检测到耳机800的打开/关闭状态,组件的相对定位,例如所述组件为耳机800的显示器和小键盘,传感器组件814还可以检测耳机800或耳机800一个组件的位置改变,用户与耳机800接触的存在或不存在,耳机800方位或加速/减速和耳机800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于耳机800和其他设备之间有线或无线方式的通信。耳机800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件814经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件814还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,耳机800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由耳机800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种耳机,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对用户语音进行识别,得到语音识别结果;
调用交互助手根据所述语音识别结果执行交互操作。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
调用所述交互助手根据所述语音识别结果生成拍摄指令:
向具有拍摄功能的终端发送所述拍摄指令,所述拍摄指令用于指示所述终端在拍摄功能被启动的情况下,执行拍摄操作。
可选地,所述调用所述交互助手根据所述语音识别结果生成拍摄指令,包括:
当所述语音识别结果包括表征确认拍摄的信息时,调用所述交互助手生成拍摄指令。
可选地,所述当所述语音识别结果包括表征确认拍摄的信息时,调用所述交互助手生成拍摄指令,包括:
当所述语音识别结果还包括表征选择拍摄参数的信息时,调用所述交互助手生成包括所述拍摄参数的拍摄指令。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
根据所述语音识别结果唤醒所述交互助手;
获取用户状态;
调用所述交互助手根据所述用户状态推荐歌曲或播放歌曲。
可选地,所述耳机具有重力传感器,所述获取用户状态,包括:
获取所述重力传感器检测的传感数据,根据所述传感数据确定用户状态。
可选地,所述调用所述交互助手根据所述用户状态推荐歌曲,包括:
调用所述交互助手查找与所述用户状态匹配的推荐歌曲并向用户推荐。
可选地,所述调用所述交互助手根据所述用户状态推荐歌曲或播放歌曲,包括:
确定与所述用户状态匹配的音效,并将预设歌曲调整为所述音效;
调用所述交互助手播放调整音效后的所述预设歌曲。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取记录的信息并播放。
可选地,所述调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取已记录的信息并播放,包括:
调用所述交互助手根据所述语音识别结果从所述语音识别结果中识别备忘信息并记录,或根据所述语音识别结果获取预设备忘信息并播放。
可选地,所述调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取记录的信息并播放,包括:
调用所述交互助手根据所述语音识别结果从所述用户语音,识别目标语音并记录,或根据所述语音识别结果获取已记录的目标语音并播放。
可选地,还包括:在记录备忘信息之后,生成针对所述备忘信息的提醒事件。
可选地,还包括:当满足预设提醒事件的触发条件时,调用所述交互助手获取所述预设提醒事件相应的备忘信息并播放。
可选地,所述根据所述语音识别结果获取预设备忘信息并播放,包括:
从预设备忘信息中查找与所述语音识别结果匹配的信息;
调用所述交互助手播放所述与所述语音识别结果匹配的信息。
可选地,还包括:
对所述备忘信息进行语义分析,得到语义分析结果;
根据语义分析结果,对所述备忘信息生成标签信息。
可选地,所述根据所述语音识别结果获取预设备忘信息并播放,包括:
当所述语音识别结果包括表征需求查找具有目标标签信息的备忘信息时,调用所述交互助手查找与目标标签信息匹配的预设备忘信息并播放。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
从所述语音识别结果中获取对话语句;
调用所述交互助手生成与所述对话语句匹配的答复语句并播放。
可选地,所述调用所述交互助手,生成与所述对话语句匹配的答复语句并播放,包括:
获取用户方位信息;
调用所述交互助手根据所述用户方位信息和所述对话语句,生成用于语音导航的答复语句并播放。
可选地,所述耳机具有方位传感器,所述获取用户方位信息,包括:
获取所述方位传感器检测的用户方位信息。
可选地,所述耳机与移动设备通信连接,所述调用所述交互助手根据所述用户方位信息和所述对话语句,生成用于语音导航的答复语句并播放,包括:
获取所述移动设备检测的用户地理位置信息;
调用所述交互助手根据所述用户方位信息、所述对话语句和用户地理位置信息,生成用于语音导航的答复语句并播放。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由耳机的处理器执行时,使得耳机能够执行一种交互方法,所述方法包括:
对用户语音进行识别,得到语音识别结果;
调用交互助手根据所述语音识别结果执行交互操作。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
调用所述交互助手根据所述语音识别结果生成拍摄指令:
向具有拍摄功能的终端发送所述拍摄指令,所述拍摄指令用于指示所述终端在拍摄功能被启动的情况下,执行拍摄操作。
可选地,所述调用所述交互助手根据所述语音识别结果生成拍摄指令,包括:
当所述语音识别结果包括表征确认拍摄的信息时,调用所述交互助手生成拍摄指令。
可选地,所述当所述语音识别结果包括表征确认拍摄的信息时,调用所述交互助手生成拍摄指令,包括:
当所述语音识别结果还包括表征选择拍摄参数的信息时,调用所述交互助手生成包括所述拍摄参数的拍摄指令。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
根据所述语音识别结果唤醒所述交互助手;
获取用户状态;
调用所述交互助手根据所述用户状态推荐歌曲或播放歌曲。
可选地,所述耳机具有重力传感器,所述获取用户状态,包括:
获取所述重力传感器检测的传感数据,根据所述传感数据确定用户状态。
可选地,所述调用所述交互助手根据所述用户状态推荐歌曲,包括:
调用所述交互助手查找与所述用户状态匹配的推荐歌曲并向用户推荐。
可选地,所述调用所述交互助手根据所述用户状态推荐歌曲或播放歌曲,包括:
确定与所述用户状态匹配的音效,并将预设歌曲调整为所述音效;
调用所述交互助手播放调整音效后的所述预设歌曲。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取记录的信息并播放。
可选地,所述调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取已记录的信息并播放,包括:
调用所述交互助手根据所述语音识别结果从所述语音识别结果中识别备忘信息并记录,或根据所述语音识别结果获取预设备忘信息并播放。
可选地,所述调用所述交互助手根据所述语音识别结果从所述用户语音中识别信息并记录,或,根据所述语音识别结果获取记录的信息并播放,包括:
调用所述交互助手根据所述语音识别结果从所述用户语音,识别目标语音并记录,或根据所述语音识别结果获取已记录的目标语音并播放。
可选地,还包含用于进行以下操作的指令:
在记录备忘信息之后,生成针对所述备忘信息的提醒事件。
可选地,还包含用于进行以下操作的指令:
当满足预设提醒事件的触发条件时,调用所述交互助手获取所述预设提醒事件相应的备忘信息并播放。
可选地,所述根据所述语音识别结果获取预设备忘信息并播放,包括:
从预设备忘信息中查找与所述语音识别结果匹配的信息;
调用所述交互助手播放所述与所述语音识别结果匹配的信息。
可选地,还包含用于进行以下操作的指令:
对所述备忘信息进行语义分析,得到语义分析结果;
根据语义分析结果,对所述备忘信息生成标签信息。
可选地,所述根据所述语音识别结果获取预设备忘信息并播放,包括:
当所述语音识别结果包括表征需求查找具有目标标签信息的备忘信息时,调用所述交互助手查找与目标标签信息匹配的预设备忘信息并播放。
可选地,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
从所述语音识别结果中获取对话语句;
调用所述交互助手生成与所述对话语句匹配的答复语句并播放。
可选地,所述调用所述交互助手,生成与所述对话语句匹配的答复语句并播放,包括:
获取用户方位信息;
调用所述交互助手根据所述用户方位信息和所述对话语句,生成用于语音导航的答复语句并播放。
可选地,所述耳机具有方位传感器,所述获取用户方位信息,包括:
获取所述方位传感器检测的用户方位信息。
可选地,所述耳机与移动设备通信连接,所述调用所述交互助手根据所述用户方位信息和所述对话语句,生成用于语音导航的答复语句并播放,包括:
获取所述移动设备检测的用户地理位置信息;
调用所述交互助手根据所述用户方位信息、所述对话语句和用户地理位置信息,生成用于语音导航的答复语句并播放。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种交互方法、一种交互装置和一种耳机,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种交互方法,其特征在于,应用于耳机,所述耳机具有交互助手,所述方法包括:
所述耳机对用户语音进行识别,得到语音识别结果;
调用所述交互助手根据所述语音识别结果执行交互操作。
2.根据权利要求1所述的方法,其特征在于,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
调用所述交互助手根据所述语音识别结果生成拍摄指令:
向具有拍摄功能的终端发送所述拍摄指令,所述拍摄指令用于指示所述终端在拍摄功能被启动的情况下,执行拍摄操作。
3.根据权利要求2所述的方法,其特征在于,所述调用所述交互助手根据所述语音识别结果生成拍摄指令,包括:
当所述语音识别结果包括表征确认拍摄的信息时,调用所述交互助手生成拍摄指令。
4.根据权利要求3所述的方法,其特征在于,所述当所述语音识别结果包括表征确认拍摄的信息时,调用所述交互助手生成拍摄指令,包括:
当所述语音识别结果还包括表征选择拍摄参数的信息时,调用所述交互助手生成包括所述拍摄参数的拍摄指令。
5.根据权利要求1所述的方法,其特征在于,所述调用所述交互助手根据所述语音识别结果执行交互操作,包括:
根据所述语音识别结果唤醒所述交互助手;
获取用户状态;
调用所述交互助手根据所述用户状态推荐歌曲或播放歌曲。
6.根据权利要求5所述的方法,其特征在于,所述耳机具有重力传感器,所述获取用户状态,包括:
获取所述重力传感器检测的传感数据,根据所述传感数据确定用户状态。
7.根据权利要求5所述的方法,其特征在于,所述调用所述交互助手根据所述用户状态推荐歌曲,包括:
调用所述交互助手查找与所述用户状态匹配的推荐歌曲并向用户推荐。
8.一种交互装置,其特征在于,应用于耳机,所述耳机具有交互助手,所述交互装置包括:
语音识别模块,用于对用户语音进行识别,得到语音识别结果;
交互模块,用于调用所述交互助手根据所述语音识别结果执行交互操作。
9.一种耳机,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对用户语音进行识别,得到语音识别结果;
调用所述交互助手根据所述语音识别结果执行交互操作。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的交互方法的步骤。
CN202010507484.4A 2020-06-05 2020-06-05 一种交互方法、装置和耳机 Pending CN111739528A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010507484.4A CN111739528A (zh) 2020-06-05 2020-06-05 一种交互方法、装置和耳机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010507484.4A CN111739528A (zh) 2020-06-05 2020-06-05 一种交互方法、装置和耳机

Publications (1)

Publication Number Publication Date
CN111739528A true CN111739528A (zh) 2020-10-02

Family

ID=72648408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010507484.4A Pending CN111739528A (zh) 2020-06-05 2020-06-05 一种交互方法、装置和耳机

Country Status (1)

Country Link
CN (1) CN111739528A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112394982A (zh) * 2021-01-21 2021-02-23 腾讯科技(深圳)有限公司 生成语音识别系统的方法、装置、介质及电子设备

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090274317A1 (en) * 2008-04-30 2009-11-05 Philippe Kahn Headset
CN202734834U (zh) * 2012-04-18 2013-02-13 无锡知谷网络科技有限公司 导航耳机
CN103702028A (zh) * 2013-12-19 2014-04-02 小米科技有限责任公司 一种控制拍摄的方法、装置及终端设备
CN103714836A (zh) * 2012-09-29 2014-04-09 联想(北京)有限公司 一种播放音频信息的方法及电子设备
CN104535074A (zh) * 2014-12-05 2015-04-22 惠州Tcl移动通信有限公司 基于蓝牙耳机的语音导航方法、系统和终端
CN105263075A (zh) * 2015-10-12 2016-01-20 深圳东方酷音信息技术有限公司 一种带方位传感器耳机及其3d声场还原方法
CN106550132A (zh) * 2016-10-25 2017-03-29 努比亚技术有限公司 一种移动终端及其控制方法
CN206490796U (zh) * 2016-08-16 2017-09-12 北京金锐德路科技有限公司 声控智能耳机
CN107478239A (zh) * 2017-08-15 2017-12-15 上海摩软通讯技术有限公司 基于音频再现装置的导航方法、导航系统及音频再现装置
CN107515007A (zh) * 2016-06-16 2017-12-26 北京小米移动软件有限公司 导航方法及装置
CN107528755A (zh) * 2017-09-30 2017-12-29 百度在线网络技术(北京)有限公司 智能设备的控制方法、装置、设备和存储介质
CN107569217A (zh) * 2017-08-29 2018-01-12 上海展扬通信技术有限公司 一种智能耳机及该智能耳机的控制方法
CN108958846A (zh) * 2018-09-27 2018-12-07 出门问问信息科技有限公司 一种记事本事项的创建方法及装置
CN109036401A (zh) * 2018-07-12 2018-12-18 深圳市艾唯尔科技有限公司 一种开启语音控制系统的方法
CN110136705A (zh) * 2019-04-10 2019-08-16 华为技术有限公司 一种人机交互的方法和电子设备
CN110266948A (zh) * 2019-06-25 2019-09-20 珠海格力电器股份有限公司 调节移动终端拍照预览效果的方法及移动终端
CN110620970A (zh) * 2019-10-29 2019-12-27 歌尔科技有限公司 一种耳机触控方法、装置、无线耳机及tws耳机

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090274317A1 (en) * 2008-04-30 2009-11-05 Philippe Kahn Headset
CN202734834U (zh) * 2012-04-18 2013-02-13 无锡知谷网络科技有限公司 导航耳机
CN103714836A (zh) * 2012-09-29 2014-04-09 联想(北京)有限公司 一种播放音频信息的方法及电子设备
CN103702028A (zh) * 2013-12-19 2014-04-02 小米科技有限责任公司 一种控制拍摄的方法、装置及终端设备
CN104535074A (zh) * 2014-12-05 2015-04-22 惠州Tcl移动通信有限公司 基于蓝牙耳机的语音导航方法、系统和终端
CN105263075A (zh) * 2015-10-12 2016-01-20 深圳东方酷音信息技术有限公司 一种带方位传感器耳机及其3d声场还原方法
CN107515007A (zh) * 2016-06-16 2017-12-26 北京小米移动软件有限公司 导航方法及装置
CN206490796U (zh) * 2016-08-16 2017-09-12 北京金锐德路科技有限公司 声控智能耳机
CN106550132A (zh) * 2016-10-25 2017-03-29 努比亚技术有限公司 一种移动终端及其控制方法
CN107478239A (zh) * 2017-08-15 2017-12-15 上海摩软通讯技术有限公司 基于音频再现装置的导航方法、导航系统及音频再现装置
CN107569217A (zh) * 2017-08-29 2018-01-12 上海展扬通信技术有限公司 一种智能耳机及该智能耳机的控制方法
CN107528755A (zh) * 2017-09-30 2017-12-29 百度在线网络技术(北京)有限公司 智能设备的控制方法、装置、设备和存储介质
CN109036401A (zh) * 2018-07-12 2018-12-18 深圳市艾唯尔科技有限公司 一种开启语音控制系统的方法
CN108958846A (zh) * 2018-09-27 2018-12-07 出门问问信息科技有限公司 一种记事本事项的创建方法及装置
CN110136705A (zh) * 2019-04-10 2019-08-16 华为技术有限公司 一种人机交互的方法和电子设备
CN110266948A (zh) * 2019-06-25 2019-09-20 珠海格力电器股份有限公司 调节移动终端拍照预览效果的方法及移动终端
CN110620970A (zh) * 2019-10-29 2019-12-27 歌尔科技有限公司 一种耳机触控方法、装置、无线耳机及tws耳机

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112394982A (zh) * 2021-01-21 2021-02-23 腾讯科技(深圳)有限公司 生成语音识别系统的方法、装置、介质及电子设备
CN112394982B (zh) * 2021-01-21 2021-04-13 腾讯科技(深圳)有限公司 生成语音识别系统的方法、装置、介质及电子设备

Similar Documents

Publication Publication Date Title
CN110634483B (zh) 人机交互方法、装置、电子设备及存储介质
CN106024009B (zh) 音频处理方法及装置
CN107172497B (zh) 直播方法、装置及系统
CN107644646B (zh) 语音处理方法、装置以及用于语音处理的装置
WO2018018482A1 (zh) 播放音效的方法及装置
US8144939B2 (en) Automatic identifying
WO2021244057A1 (zh) 一种交互方法、装置、耳机和耳机收纳装置
CN107832036A (zh) 语音控制方法、装置及计算机可读存储介质
CN104394137B (zh) 一种提醒语音通话的方法及装置
CN107666536B (zh) 一种寻找终端的方法和装置、一种用于寻找终端的装置
CN110147467A (zh) 一种文本描述的生成方法、装置、移动终端及存储介质
WO2021031308A1 (zh) 音频处理方法、装置及存储介质
CN104133851A (zh) 音频相似度的检测方法和检测装置、电子设备
CN105489220A (zh) 语音识别方法及装置
CN111696553A (zh) 一种语音处理方法、装置及可读介质
CN111696538A (zh) 语音处理方法、装置和介质
CN112068711A (zh) 一种输入法的信息推荐方法、装置和电子设备
WO2021244059A1 (zh) 一种交互方法、装置、耳机和服务器
CN108460138A (zh) 音乐推荐方法、装置、设备及存储介质
WO2021051588A1 (zh) 一种数据处理方法、装置和用于数据处理的装置
CN110415703A (zh) 语音备忘信息处理方法及装置
CN111739528A (zh) 一种交互方法、装置和耳机
CN111696536A (zh) 语音处理方法、装置和介质
CN113936697A (zh) 语音处理方法、装置以及用于语音处理的装置
CN112988956A (zh) 自动生成对话的方法及装置、信息推荐效果检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210705

Address after: 100084 Room 802, 8th floor, building 9, yard 1, Zhongguancun East Road, Haidian District, Beijing

Applicant after: Beijing Sogou Intelligent Technology Co.,Ltd.

Address before: 100084. Room 9, floor 01, cyber building, building 9, building 1, Zhongguancun East Road, Haidian District, Beijing

Applicant before: BEIJING SOGOU TECHNOLOGY DEVELOPMENT Co.,Ltd.

TA01 Transfer of patent application right