CN109285542B - K歌系统的语音交互方法、介质、装置及系统 - Google Patents
K歌系统的语音交互方法、介质、装置及系统 Download PDFInfo
- Publication number
- CN109285542B CN109285542B CN201811032360.4A CN201811032360A CN109285542B CN 109285542 B CN109285542 B CN 109285542B CN 201811032360 A CN201811032360 A CN 201811032360A CN 109285542 B CN109285542 B CN 109285542B
- Authority
- CN
- China
- Prior art keywords
- voice
- user
- karaoke system
- voice information
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000000875 corresponding effect Effects 0.000 claims abstract description 37
- 230000002452 interceptive effect Effects 0.000 claims abstract description 34
- 230000001276 controlling effect Effects 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 abstract description 10
- 238000004364 calculation method Methods 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 235000013405 beer Nutrition 0.000 description 4
- 230000004075 alteration Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种K歌系统的语音交互方法、介质、装置及系统,该方法包括以下步骤:获取用户的语音信息;根据语音信息对用户的当前状态进行识别,并在识别到用户的当前状态为语音交互状态时,对语音信息进行在线语音识别以获取语音指令;根据语音指令控制交互显示界面以列表的方式显示操作清单;基于操作清单接收用户的语音操作指令;根据语音操作指令控制K歌系统执行相应的动作;能够实现对用户的语音状态进行实时判断,并在判断用户当前状态为语音交互状态时,对语音信息进行在线识别;以根据识别结果与用户进行交互,减小语音识别过程中的存储压力和计算压力的同时,为用户提供更智能的语音交互环境,提高用户的使用体验和人机交互准确性。
Description
技术领域
本发明涉及音乐服务技术领域,特别涉及一种K歌系统的语音交互方法、介质、装置及系统。
背景技术
随着语音识别技术的发展,在K歌系统中,语音点歌也渐渐被人们所熟知。
现有的K歌交互系统中,多通过指明歌曲名或歌手名的方式以完成点歌;但是,基于人类语言交流的复杂性,以及不同用户的语言习惯和点歌模式的差别;这种点歌方式往往难以准确地反馈用户用户需求的服务;并且,这种点歌方式功能单一,难以满足用户的需求。
发明内容
本发明旨在至少在一定程度上解决上述技术中的技术问题之一。为此,本发明的一个目的在于提出一种K歌系统的语音交互方法,能够实现对用户的语音状态进行实时判断,并在判断用户当前状态为语音交互状态时,对语音信息进行在线识别;以根据识别结果与用户进行交互,减小K歌系统语音识别过程中的存储压力和计算压力的同时,为用户提供更智能的语音交互环境,提高用户的使用体验和人机交互准确性。
本发明的第二个目的在于提出一种计算机可读存储介质。
本发明的第三个目的在于提出一种K歌系统的语音交互装置。
本发明的第四个目的在于提出一种K歌系统。
为达到上述目的,本发明第一方面实施例提出了一种K歌系统的语音交互方法,所述K歌系统包括交互显示界面,所述语音交互方法包括以下步骤:获取用户的语音信息;根据所述语音信息对所述用户的当前状态进行识别,并在识别到所述用户的当前状态为语音交互状态时,对所述语音信息进行在线语音识别以获取语音指令;根据所述语音指令控制所述交互显示界面以列表的方式显示操作清单;基于所述操作清单接收所述用户的语音操作指令;根据所述语音操作指令控制所述K歌系统执行相应的动作。
根据本发明实施例的K歌系统的语音交互方法,首先,获取用户的语音信息;然后,根据语音信息对用户的当前状态进行识别,并在识别到用户的当前状态为语音交互状态时,对语音信息进行在线语音识别以获取语音指令;接着,根据语音指令控制交互显示界面以列表的方式显示操作清单;然后,基于操作清单接收用户的语音操作指令;接着,根据语音操作指令控制K歌系统执行相应的动作;从而实现对用户的语音状态进行实时判断,并在判断用户当前状态为语音交互状态时,对语音信息进行在线识别;以根据识别结果与用户进行交互,减小K歌系统语音识别过程中的存储压力和计算压力的同时,为用户提供更智能的语音交互环境,提高用户的使用体验和人机交互准确性。
另外,根据本发明上述实施例提出的K歌系统的语音交互方法还可以具有如下附加的技术特征:
可选地,所述交互显示界面还显示提示信息以便所述用户根据所述提示信息发出所述语音操作指令。
可选地,所述操作清单包括相同歌名对应的不同演绎方式的列表、同一歌星对应的不同曲目的列表和语音服务列表中的任意一种。
可选地,所述语音操作指令包括选择指令、优先指令和交易指令中一种或多种。
可选地,对所述语音信息进行在线语音识别以获取语音指令,包括:将所述语音信息发送到云端服务器;所述云端服务器对所述语音信息进行识别以获取所述语音信息对应的语音指令,并将所述语音指令返回到所述K歌系统。
可选地,通过所述K歌系统中的麦克风获取所述用户的语音信息。
可选地,采用断句算法对所述语音信息进行处理以识别所述用户的当前状态,其中,所述用户的当前状态包括语音交互状态和唱歌状态。
为达到上述目的,本发明第二方面实施例提出了一种计算机可读存储介质,其上存储有K歌系统的语音交互程序,该K歌系统的语音交互程序被处理器执行时实现上述的K歌系统的语音交互方法。
为达到上述目的,本发明第三方面实施例提出了一种K歌系统的语音交互装置,所述K歌系统包括交互显示界面,所述语音交互装置包括:获取模块,用于获取用户的语音信息;语音识别模块,用于根据所述语音信息对所述用户的当前状态进行识别,并在识别到所述用户的当前状态为语音交互状态时将所述语音信息发送到云端服务器,以便所述云端服务器对所述语音信息进行在线语音识别以获取语音指令;交互控制模块,用于根据所述语音指令控制所述交互显示界面以列表的方式显示操作清单,以便基于所述操作清单接收所述用户的语音操作指令,以及根据所述语音操作指令控制所述K歌系统执行相应的动作。
根据本发明实施例的K歌系统的语音交互装置,K歌系统包括交互显示界面,语音交互装置包括:获取模块,用于获取用户的语音信息;语音识别模块,用于根据语音信息对用户的当前状态进行识别,并在识别到用户的当前状态为语音交互状态时将语音信息发送到云端服务器,以便云端服务器对语音信息进行在线语音识别以获取语音指令;交互控制模块,用于根据语音指令控制交互显示界面以列表的方式显示操作清单,以便基于操作清单接收用户的语音操作指令,以及根据语音操作指令控制K歌系统执行相应的动作;从而实现对用户的语音状态进行实时判断,并在判断用户当前状态为语音交互状态时,对语音信息进行在线识别;以根据识别结果与用户进行交互,减小K歌系统语音识别过程中的存储压力和计算压力的同时,为用户提供更智能的语音交互环境,提高用户的使用体验和人机交互准确性。
为达到上述目的,本发明第四方面实施例提出了一种K歌系统,包括语音输入装置和客户端,所述客户端包括交互显示界面,所述客户端还包括存储器、处理器及存储在存储器上并可在处理器上运行的K歌系统的语音交互程序,所述处理器执行所述语音交互程序时实现上述的K歌系统的语音交互方法。
附图说明
图1为根据本发明实施例的K歌系统的语音交互方法的流程示意图;
图2为根据本发明实施例的K歌系统的语音交互装置的方框示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
在现有的K歌系统中,多采用本地语音识别,其准确度较低,且这种点歌方式功能单一,难以满足用户的需求;本发明实施例提出的K歌系统的语音交互方法,首先,获取用户的语音信息;然后,根据语音信息对用户的当前状态进行识别,并在识别到用户的当前状态为语音交互状态时,对语音信息进行在线语音识别以获取语音指令;接着,根据语音指令控制交互显示界面以列表的方式显示操作清单;然后,基于操作清单接收用户的语音操作指令;接着,根据语音操作指令控制K歌系统执行相应的动作;从而实现对用户的语音状态进行实时判断,并在判断用户当前状态为语音交互状态时,对语音信息进行在线识别;以根据识别结果与用户进行交互,减小K歌系统语音识别过程中的存储压力和计算压力的同时,为用户提供更智能的语音交互环境,提高用户的使用体验和人机交互准确性。
为了更好的理解上述技术方案,下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
图1为根据本发明实施例提出的K歌系统的语音交互方法的流程示意图,其中,K歌系统包括交互显示界面;如图1所示,该K歌系统的语音交互方法包括以下步骤:
S101,获取用户的语音信息。
需要说明的是,K歌系统的设置方式有多种,例如,在KTV中设置服务器、云端服务器、点歌服务端、麦克风以及显示屏以形成K歌系统;或者,通过设置云端服务器,并建立云端服务器与下载了相应程序的用户终端的连接,以形成K歌系统,其中,用户终端可以是手机、电脑、平板电脑或其他智能终端。
相应地,获取用户的语音信息的途经可以有多种,例如,在K歌系统用户通过其手机下载相应程序之后,通过该已下载相应程序的手机获取用户的语音信息。
作为一种示例,通过K歌系统中的麦克风获取用户的语音信息。
其中,获取用户的语音信息的方式可以有多种,例如,对用户的语音信号进行实时采集,并将采集到的用户的语音信号实时传输给云端服务器,以便后续云端服务器对接收到的用户的语音信号进行语音识别。
S102,根据语音信息对用户的当前状态进行识别,并在识别到用户的当前状态为语音交互状态时,对语音信息进行在线语音识别以获取语音指令。
其中,根据语音信息对用户的当前状态进行识别的方法可以有多种,例如,通过获取历史歌唱信息,以根据历史歌唱信息进行用户状态识别模型的训练,并在获取到用户的语音信息之后,将该语音信息输入用户状态识别模型,以判断用户的当前状态;并在判断结果为用户当前状态为语音交互状态时,才对语音信息进行语音识别;如此,可减轻服务器对于语音信息的存储压力以及识别运算压力。
作为一种示例,采用断句算法对语音信息进行处理以识别用户的当前状态,其中,用户的当前状态包括语音交互状态和唱歌状态。具体地,当获取到用户的语音信息之后,判断该语音信息未处于预设静音阈值状态的连续时长是否达到第一时间阈值;若是,则开始录音,开始录音之后,判断该语音信息处于预设静音阈值状态的连续时长是否达到第二时间阈值,若是,则停止录音;并将上述录音作为用户的语音信息,以及判断该语音信息的持续时长是否满足预设要求,并在判断结果为是时对该语音信息进行识别,以获取语音指令。
其中,对语音信息进行在线语音识别以获取语音指令,具体可以包括:将语音信息发送到云端服务器;云端服务器对语音信息进行识别以获取语音信息对应的语音指令,并将语音指令返回到K歌系统。
S103,根据语音指令控制交互显示界面以列表的方式显示操作清单。
也就是说,在对语音信息进行在线语音识别获取到语音指令之后,K歌系统根据获取到的语音指令控制交互显示界面以列表的方式进行操作清单的显示。
其中,操作清单可以包括相同歌名对应的不同演绎方式的列表、同一歌星对应的不同曲目的列表和语音服务列表中的任意一种。
作为一种示例,当用户的语音指令为“歌曲C”,则根据该语音指令“歌曲C”控制交互显示界面以列表的方式显示该相同歌名对应的不同演绎方式的列表,当用户的语音指令为“来一首A的歌”,则根据该语音指令“来一首A的歌”控制交互显示界面以列表的方式显示同一歌星对应的不同曲目;当用户的语音指令为“呼叫服务”或“服务员”等,则根据该用户的语音指令控制交互显示界面以列表的方式显示服务列表。
其中,交互显示界面还可以显示提示信息以便用户根据提示信息发出语音操作指令。
作为一种示例,在根据用户的语音指令控制交互显示界面以列表的方式显示操作清单之后,同时还显示提示信息,例如,当歌曲已关联编号,并在已列表的方式对歌曲进行显示时,可提示用户以语音说出歌曲对应的编号以进行点歌。
S104,基于操作清单接收用户的语音操作指令。
也就是说,在根据语音指令控制交互显示界面以列表的方式显示操作清单之后,基于操作清单接收用户的语音操作指令,以便后续根据该语音操作指令进行相应地操作。
其中,语音操作指令可以包括选择指令、优先指令和交易指令中的一种或多种。
作为一种示例,K歌系统在根据语音指令控制交互显示界面以列表的方式显示操作清单之后,用户根据各歌曲名、歌曲编号、列表页面编号、歌手名或者歌手编号发出的选择指令;并在选择完毕之后,根据自身的需要选择是否对当前选择歌曲进行优先设置,若是,则发出优先指令以对当前选择歌曲进行置顶;或者,在获取到用户的交易指令之后,执行相应的动作,需要说明的是,该交易指令的具体方式根据用户的个人语言习惯差异存在很大不同,例如,“啤酒”、“来一打啤酒”、“上啤酒”均表示为用户购买啤酒的意图。
S105,根据语音操作指令控制K歌系统执行相应的动作。
也就是说,在接收到用户发出的语音操作指令之后,控制K歌系统执行相应的动作,以完成与用户之间的交互。
作为一种示例,在接收到用户根据列表发出的歌曲编号选择指令之后,将该歌曲编号对应的歌曲加入待播放列表尾部,并在接收到用户的优先指令之后,将当前已点歌曲进行置顶。
作为另一种示例,在接收到用户发出的交易指令之后,根据用户交易指令所对应的商品类别显示该商品类别对应的商品列表,并获取用户根据该商品列表发出的选择指令,以根据该选择指令生成商品项目对应的订单,以及根据该订单完成与用户之间的交易;其中,该订单可以以二维码的形式体现,以便于用户通过自身携带的移动终端进行相应款项的支付。
需要说明的是,操作指令还可以包括呼叫服务指令,在获取用户的呼叫服务指令之后,对用户的语音信息进行录音,并在获取到预设时间阈值的录音信息之后,将该录音信息发送给相应的工作人员,以便相应的工作人员对事项进行处理。
综上所述,根据本发明实施例的K歌系统的语音交互方法,首先,获取用户的语音信息;然后,根据语音信息对用户的当前状态进行识别,并在识别到用户的当前状态为语音交互状态时,对语音信息进行在线语音识别以获取语音指令;接着,根据语音指令控制交互显示界面以列表的方式显示操作清单;然后,基于操作清单接收用户的语音操作指令;接着,根据语音操作指令控制K歌系统执行相应的动作;从而实现对用户的语音状态进行实时判断,并在判断用户当前状态为语音交互状态时,对语音信息进行在线识别;以根据识别结果与用户进行交互,减小K歌系统语音识别过程中的存储压力和计算压力的同时,为用户提供更智能的语音交互环境,提高用户的使用体验和人机交互准确性。
为了实现上述实施例,本发明实施例还提出了一种计算机可读存储介质,其上存储有K歌系统的语音交互程序,该K歌系统的语音交互程序被处理器执行时实现上述的K歌系统的语音交互方法。
如图2所示,为了实现上述实施例,本发明实施例还提出了一种K歌系统的语音交互装置,该K歌系统的语音交互装置包括:获取模块10、语音识别模块20和交互控制模块30。
其中,获取模块10,用于获取用户的语音信息。
语音识别模块20,用于根据语音信息对用户的当前状态进行识别,并在识别到用户的当前状态为语音交互状态时将语音信息发送到云端服务器,以便云端服务器对语音信息进行在线语音识别以获取语音指令。
交互控制模块30,用于根据语音指令控制交互显示界面以列表的方式显示操作清单,以便基于操作清单接收用户的语音操作指令,以及根据语音操作指令控制K歌系统执行相应的动作。
需要说明的是,上述关于图1中K歌系统的语音交互方法的描述同样适用于该K歌系统的语音交互装置,在此不做赘述。
综上所述,根据本发明实施例的K歌系统的语音交互装置,K歌系统包括交互显示界面,语音交互装置包括:获取模块,用于获取用户的语音信息;语音识别模块,用于根据语音信息对用户的当前状态进行识别,并在识别到用户的当前状态为语音交互状态时将语音信息发送到云端服务器,以便云端服务器对语音信息进行在线语音识别以获取语音指令;交互控制模块,用于根据语音指令控制交互显示界面以列表的方式显示操作清单,以便基于操作清单接收用户的语音操作指令,以及根据语音操作指令控制K歌系统执行相应的动作;从而实现对用户的语音状态进行实时判断,并在判断用户当前状态为语音交互状态时,对语音信息进行在线识别;以根据识别结果与用户进行交互,减小K歌系统语音识别过程中的存储压力和计算压力的同时,为用户提供更智能的语音交互环境,提高用户的使用体验和人机交互准确性。
为了实现上述实施例,本发明实施例还提出了一种K歌系统,包括语音输入装置和客户端,所述客户端包括交互显示界面,所述客户端还包括存储器、处理器及存储在存储器上并可在处理器上运行的K歌系统的语音交互程序,所述处理器执行所述语音交互程序时实现上述的K歌系统的语音交互方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征 “上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不应理解为必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (8)
1.一种K歌系统的语音交互方法,其特征在于,所述K歌系统包括交互显示界面,所述语音交互方法包括以下步骤:
获取用户的语音信息;
根据所述语音信息对所述用户的当前状态进行识别,并在识别到所述用户的当前状态为语音交互状态时,对所述语音信息进行在线语音识别以获取语音指令;其中,采用断句算法对所述语音信息进行处理以识别所述用户的当前状态,其中,所述用户的当前状态包括语音交互状态和唱歌状态;
根据所述语音指令控制所述交互显示界面以列表的方式显示操作清单;
基于所述操作清单接收所述用户的语音操作指令;
根据所述语音操作指令控制所述K歌系统执行相应的动作;
所述交互显示界面还显示提示信息以便所述用户根据所述提示信息发出所述语音操作指令;
其中,采用断句算法对所述语音信息进行处理以识别所述用户的当前状态包括:当获取到用户的语音信息之后,判断该语音信息未处于预设静音阈值状态的连续时长是否达到第一时间阈值;若是,则开始录音,开始录音之后,判断该语音信息处于预设静音阈值状态的连续时长是否达到第二时间阈值,若是,则停止录音;并将上述录音作为用户的语音信息,以及判断该语音信息的持续时长是否满足预设要求,并在判断结果为是时对该语音信息进行识别,以获取语音指令。
2.如权利要求1所述的K歌系统的语音交互方法,其特征在于,所述操作清单包括相同歌名对应的不同演绎方式的列表、同一歌星对应的不同曲目的列表和语音服务列表中的任意一种。
3.如权利要求1所述的K歌系统的语音交互方法,其特征在于,所述语音操作指令包括选择指令、优先指令和交易指令中一种或多种。
4.如权利要求1-3中任一项所述的K歌系统的语音交互方法,其特征在于,对所述语音信息进行在线语音识别以获取语音指令,包括:
将所述语音信息发送到云端服务器;
所述云端服务器对所述语音信息进行识别以获取所述语音信息对应的语音指令,并将所述语音指令返回到所述K歌系统。
5.如权利要求1-3中任一项所述的K歌系统的语音交互方法,其特征在于,通过所述K歌系统中的麦克风获取所述用户的语音信息。
6.一种计算机可读存储介质,其特征在于,其上存储有K歌系统的语音交互程序,该K歌系统的语音交互程序被处理器执行时实现如权利要求1-5中任一项所述的K歌系统的语音交互方法。
7.一种K歌系统的语音交互装置,其特征在于,所述K歌系统包括交互显示界面,所述语音交互装置包括:
获取模块,用于获取用户的语音信息;
语音识别模块,用于根据所述语音信息对所述用户的当前状态进行识别,并在识别到所述用户的当前状态为语音交互状态时将所述语音信息发送到云端服务器,以便所述云端服务器对所述语音信息进行在线语音识别以获取语音指令;其中,采用断句算法对所述语音信息进行处理以识别所述用户的当前状态,其中,所述用户的当前状态包括语音交互状态和唱歌状态;
交互控制模块,用于根据所述语音指令控制所述交互显示界面以列表的方式显示操作清单,以便基于所述操作清单接收所述用户的语音操作指令,以及根据所述语音操作指令控制所述K歌系统执行相应的动作;所述交互显示界面还显示提示信息以便所述用户根据所述提示信息发出所述语音操作指令;
其中,采用断句算法对所述语音信息进行处理以识别所述用户的当前状态包括:当获取到用户的语音信息之后,判断该语音信息未处于预设静音阈值状态的连续时长是否达到第一时间阈值;若是,则开始录音,开始录音之后,判断该语音信息处于预设静音阈值状态的连续时长是否达到第二时间阈值,若是,则停止录音;并将上述录音作为用户的语音信息,以及判断该语音信息的持续时长是否满足预设要求,并在判断结果为是时对该语音信息进行识别,以获取语音指令。
8.一种K歌系统,其特征在于,包括语音输入装置和客户端,所述客户端包括交互显示界面,所述客户端还包括存储器、处理器及存储在存储器上并可在处理器上运行的K歌系统的语音交互程序,所述处理器执行所述语音交互程序时实现如权利要求1-5中任一项所述的K歌系统的语音交互方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811032360.4A CN109285542B (zh) | 2018-09-05 | 2018-09-05 | K歌系统的语音交互方法、介质、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811032360.4A CN109285542B (zh) | 2018-09-05 | 2018-09-05 | K歌系统的语音交互方法、介质、装置及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109285542A CN109285542A (zh) | 2019-01-29 |
CN109285542B true CN109285542B (zh) | 2022-04-01 |
Family
ID=65184496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811032360.4A Active CN109285542B (zh) | 2018-09-05 | 2018-09-05 | K歌系统的语音交互方法、介质、装置及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109285542B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110069657A (zh) * | 2019-04-30 | 2019-07-30 | 百度在线网络技术(北京)有限公司 | 一种交互式音乐点播方法、装置及终端 |
CN112817553A (zh) * | 2019-11-15 | 2021-05-18 | 阿里巴巴集团控股有限公司 | 一种语音交互方法、装置及系统 |
CN111161734A (zh) * | 2019-12-31 | 2020-05-15 | 苏州思必驰信息科技有限公司 | 基于指定场景的语音交互方法及装置 |
CN111785270A (zh) * | 2020-07-17 | 2020-10-16 | 深圳市特伦斯科技有限公司 | 电子琴的控制方法、电子琴及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104460990A (zh) * | 2014-11-18 | 2015-03-25 | 北京洛哈技术有限公司 | 一种点歌操作的方法及设备 |
CN107318036A (zh) * | 2017-06-01 | 2017-11-03 | 腾讯音乐娱乐(深圳)有限公司 | 歌曲搜索方法、智能电视及存储介质 |
CN108281142A (zh) * | 2018-02-05 | 2018-07-13 | 北京唱吧科技股份有限公司 | 一种歌曲点播方法及系统 |
CN108345489A (zh) * | 2018-03-07 | 2018-07-31 | 北京唱吧科技股份有限公司 | 一种点唱系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110065080A1 (en) * | 2009-09-17 | 2011-03-17 | Sony Corporation | Tv-based karaoke |
-
2018
- 2018-09-05 CN CN201811032360.4A patent/CN109285542B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104460990A (zh) * | 2014-11-18 | 2015-03-25 | 北京洛哈技术有限公司 | 一种点歌操作的方法及设备 |
CN107318036A (zh) * | 2017-06-01 | 2017-11-03 | 腾讯音乐娱乐(深圳)有限公司 | 歌曲搜索方法、智能电视及存储介质 |
CN108281142A (zh) * | 2018-02-05 | 2018-07-13 | 北京唱吧科技股份有限公司 | 一种歌曲点播方法及系统 |
CN108345489A (zh) * | 2018-03-07 | 2018-07-31 | 北京唱吧科技股份有限公司 | 一种点唱系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109285542A (zh) | 2019-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109285542B (zh) | K歌系统的语音交互方法、介质、装置及系统 | |
EP3485492B1 (en) | Multi-user authentication on a device | |
US11688402B2 (en) | Dialog management with multiple modalities | |
CN106658129B (zh) | 基于情绪的终端控制方法、装置及终端 | |
CN111261151B (zh) | 一种语音处理方法、装置、电子设备及存储介质 | |
CN107463700B (zh) | 用于获取信息的方法、装置及设备 | |
CN109949783A (zh) | 歌曲合成方法及系统 | |
US20160078773A1 (en) | System and method of providing task-based solicitation of request related user inputs | |
CN107003999A (zh) | 对用户的在先自然语言输入的后续响应的系统和方法 | |
CN108874895B (zh) | 交互信息推送方法、装置、计算机设备及存储介质 | |
CN110851221B (zh) | 一种智慧家居场景配置的方法及装置 | |
CN108519998B (zh) | 基于知识图谱的问题引导方法及装置 | |
CN111081280A (zh) | 与文本无关的语音情感识别方法及装置、用于识别情感的算法模型的生成方法 | |
WO2019045816A1 (en) | GRAPHIC DATA SELECTION AND DIGITAL CONTENT PRESENTATION | |
US8543406B2 (en) | Method and system for communicating with an interactive voice response (IVR) system | |
CN103426429B (zh) | 语音控制方法和装置 | |
CN110659387A (zh) | 用于提供视频的方法和设备 | |
KR20210036527A (ko) | 사용자 발화를 처리하는 전자 장치 및 그 작동 방법 | |
CN112151034B (zh) | 设备的语音控制方法、装置、电子设备及存储介质 | |
WO2023093280A1 (zh) | 语音控制方法、装置、电子设备及存储介质 | |
CN114067842B (zh) | 客户满意度鉴别方法及装置、存储介质及电子设备 | |
CN113920996A (zh) | 语音交互的处理方法、装置、电子设备与存储介质 | |
CN114817582A (zh) | 资源信息的推送方法和电子装置 | |
WO2013181633A1 (en) | Providing a converstional video experience | |
CN112380871A (zh) | 语义识别方法、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20190507 Address after: Room 601, Room 5, 56 Guanri Road, Phase II, Xiamen Software Park, Fujian Province Applicant after: Xiamen Ju Hi Technology Co., Ltd. Address before: Room 802, 154 Longshan Road, Siming District, Xiamen City, Fujian Province Applicant before: Xiamen Light Singing Technology Co., Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |