CN110277091A - 智能家具的语音识别方法及相关产品 - Google Patents

智能家具的语音识别方法及相关产品 Download PDF

Info

Publication number
CN110277091A
CN110277091A CN201910373219.9A CN201910373219A CN110277091A CN 110277091 A CN110277091 A CN 110277091A CN 201910373219 A CN201910373219 A CN 201910373219A CN 110277091 A CN110277091 A CN 110277091A
Authority
CN
China
Prior art keywords
max
hidden layer
result
moment
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910373219.9A
Other languages
English (en)
Other versions
CN110277091B (zh
Inventor
周小莲
唐文姬
陈景
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Emomo Technology Co Ltd
Original Assignee
Emomo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Emomo Technology Co Ltd filed Critical Emomo Technology Co Ltd
Priority to CN201910373219.9A priority Critical patent/CN110277091B/zh
Publication of CN110277091A publication Critical patent/CN110277091A/zh
Application granted granted Critical
Publication of CN110277091B publication Critical patent/CN110277091B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供了一种智能家具的语音识别方法及相关产品,所述方法包括如下步骤:智能家具采集第一图片和第一语音;智能家具对第一图片进行人脸识别确定第一图片的第一身份,提取第一身份的历史语音隐层结果;智能家具将该第一语音输入到循环神经网络计算得到该第一语音的含义,所述循环神经网络的第一个隐层的输入为历史语音隐层结果。本申请提供的技术方案具有识别精度高的优点。

Description

智能家具的语音识别方法及相关产品
技术领域
本申请涉及人工智能领域,具体涉及一种智能家具的语音识别方法及相关产品。
背景技术
现有技术中,人工智能已经应用到很多领域,例如语音识别等等。人工智能中神经网络目前的潜力最大,大部分的研究人员均将研发的反向投入到该领域。
对于神经网络中,现有的人工智能在进行语音识别时无法考虑历史的识别参数,这样影响识别的准确性,由于在智能家具领域,影响用户体验度。
申请内容
本申请实施例提供了一种智能家具的语音识别方法及相关产品,提高了识别的准确性,提高了用户体验度。
第一方面,本申请实施例提供一种智能家具的语音识别方法,所述方法包括如下步骤:
智能家具采集第一图片和第一语音;
智能家具对第一图片进行人脸识别确定第一图片的第一身份,提取第一身份的历史语音隐层结果;
智能家具将该第一语音输入到循环神经网络计算得到该第一语音的含义,所述循环神经网络的第一个隐层的输入为历史语音隐层结果
第二方面,提供一种智能家具,所述智能家具包括:处理器、存储器、麦克风、摄像头;
所述摄像头,用于采集第一图片,
所述麦克风,用于采集第一语音;
所述处理器,用于对第一图片进行人脸识别确定第一图片的第一身份,提取第一身份的历史语音隐层结果;将该第一语音输入到循环神经网络计算得到该第一语音的含义,所述循环神经网络的第一个隐层的输入为历史语音隐层结果。
第三方面,提供一种计算机可读存储介质,其存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行第一方面提供的所述的方法。
第四方面,提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行第一方面提供的方法。
实施本申请实施例,具有如下有益效果:
可以看出,本申请提供的技术方案确定第一图片以及第一语音之后,首先通过对第一图片的人脸识别确定第一图片的第一身份,然后提取第一身份的历史语音隐层结果,然后依据历史语音隐层结果以及第一语音输入到循环神经网络计算得到第一语音的含义,此方法充分考虑了历史语音的识别结果,这样使得循环神经网络在第一隐层计算时即能够得到比较准确的历史数据,因此其具有语音识别准确度高的优点。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种智能家具的结构示意图。
图2是本申请实施例公开的一种智能家具的语音识别方法的流程示意图。
图3是本申请循环神经网络的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
参阅图1,图1为一种智能家具的示意图,如图1所示,该智能家具可以为智能衣柜、智能沙发等等,图1以智能衣柜为例,该智能衣柜配置有智能设备,该智能设备可以包括:处理器、存储器、麦克风、摄像头10和显示屏等等。该处理器与智能衣柜的其他电气设备连接,其他电气设备可以对智能衣柜的状态进行改变。其他电气设备例如:紫外线灯、电机等等,本申请并不限制上述其他电气设备的具体表现形式。对于不同的智能家具,上述其他电气设备也可以不同,例如智能沙发,上述其他电气设备可以为音箱、电灯或按摩器等等设备。
参阅图2,图2提供了一种智能家具的语音识别方法,该方法由如图1所示的智能家具实现,该方法如图2所示,包括如下步骤:
步骤S201、智能家具采集第一图片和第一语音;
步骤S202、智能家具对第一图片进行人脸识别确定第一图片的第一身份,提取第一身份的历史语音隐层结果;
上述人脸识别的算法可以采用现有的人脸识别算法,例如百度人脸识别算法、华为人脸识别算法等等,类似手机的人脸识别算法的嵌入。
步骤S203、智能家具将该第一语音输入到循环神经网络计算得到该第一语音的含义,所述循环神经网络的第一个隐层的输入为历史语音隐层结果。
本申请提供的技术方案确定第一图片以及第一语音之后,首先通过对第一图片的人脸识别确定第一图片的第一身份,然后提取第一身份的历史语音隐层结果,然后依据历史语音隐层结果以及第一语音输入到循环神经网络计算得到第一语音的含义,此方法充分考虑了历史语音的识别结果,这样使得循环神经网络在第一隐层计算时即能够得到比较准确的历史数据,因此其具有语音识别准确度高的优点。得到语音含义以后,处理器可以生成与该语音含义匹配的控制命令来控制其他电气设备。
循环神经网络为语音翻译常用的神经网络模型,对于循环神经网络,其结构如图3所示,其包含输入层、隐层、输出层,其中隐层的输出结构作为下一时刻的隐层的一个输入数据。
如图3所示,例如t时刻隐层的输出结果为下一时刻t+1隐层的输出。
如图3所示,其中W表示权值,Xt-1表示t-1时刻的输入层的输入数据,Xt表示t时刻的输入层的输入数据,St-1表示t-1时刻的隐层的输出结果,Ot-1表示t-1时刻的输出层的输出结果;
以t时刻为例:
St=Xt×W+St-1×W
Ot=f(St)
其中f表示激活函数,该激活函数包括但不限于:sigmoid函数、tanh函数等等。
当然在实际应用中,还可以使用其他的激活函数。
对于t-1时刻,在现有的循环神经网络中,如t-1时刻是第1时刻,那么其对应的第一隐层St-1=0,即没有对应的输出,此种情况会影响循环神经网络的计算精度。对于其他场景,由于其进行语言识别的人数太多,如果保留历史语音隐层结果,即历史循环神经网络的最后一个隐层的输出结果Smax’会非常多,并且由于使用频率也不多,因此保存也没有任何的意义,但是对于智能家具的使用者大部分情况为固定的人群(例如家庭成员),其数量不多,并且对应的输出结果Smax’并不会太多,并且由于重复性强,因此记录历史语音隐层结果会具有一定的意义。
上述智能家具将该第一语音输入到循环神经网络计算得到该第一语音的含义具体可以包括:
获取循环神经网络输入层t时刻的输入数据Xt、权值W,如t=0,获取最后一个隐层的输出结果Smax’,依据输出结果Smax’、输入数据Xt、权值W计算得到t时刻的输出结果Ot以及t=0时刻的隐层输出结果S0,将S0作为t+1隐层的输入数据,依据S0、输入数据Xt+1、权值W计算得到t+1时刻的输出结果Ot+1以及t+1时刻的隐层输出结果St+1;依次执行t+1时刻之后的运算直至得到循环神经网络的输出结果Omax以及Smax,依据输出结果Omax得到该第一语音的含义(确定含义的方式可以采用现有的循环神经网络的确定方式,例如谷歌的循环神经网络运算系统,本申请仅仅对循环神经网络的计算过程进行处理,对计算得到的结果如何得到语意并无改进)。
依据输出结果Smax’、输入数据Xt、权值W计算得到t时刻的输出结果Ot以及t=0时刻的隐层输出结果S0具体可以包括:
S0=Xt×W+S’max×W
Ot=f(S0)
依次执行t+1时刻之后的运算直至得到循环神经网络的输出结果Omax以及Smax的实现方法可以参见t时刻到t+1时刻的执行方式,仅仅是输入数据以及隐层输出结果依据时刻进行变换。
例如,如计算的时刻为t+x,x为大于等于2的整数,则:
St+x=Xt+x×W+St+x-1×W
Ot=f(St+x)
可选的,依据输出结果Smax’、输入数据Xt、权值W计算得到t时刻的输出结果Ot以及t=0时刻的隐层输出结果S0具体可以包括:
S0=Xt×W+k*S’max×W
Ot=f(S0)
上述k可以为调整系数,该k的取值为【0,1】;
上述k可以为用户自行设定,当然为了更好的实现隐层输出结果,上述k可以依据输入数据Xt与输出结果Smax’之间的比较结果来调整。
上述k的具体调整方式可以为:
获取输入数据Xt所有元素值的绝对值的平均值α,获取输出结果Smax’所有元素的绝对值,提取输出结果Smax’所有元素的绝对值中大于α的元素值的数量β,依据β所处的区间确定该k的取值。
根据不同的区间依据区间与k的取值列表来确定k的取值。
设定k的取值的策略的目的为,对于循环神经网络的运算,其主要的计算结果还是需要由输入数据来决定,对于历史数据,如果历史数据的对计算结果占用的比例过高,那么历史数据与权值计算以后必然对该输出结果产生影响,而对于计算结果影响比较大的为元素值的绝对值比较大的那部分元素值,因此如果Smax’较大的数量β越大,那么k的取值就需要越小,反之,如果Smax’较大的数量β越小,那么k的取值就需要越大。
本申请还提供一种智能家具,所述智能家具包括:处理器、存储器、麦克风、摄像头;
所述摄像头,用于采集第一图片,
所述麦克风,用于采集第一语音;
所述处理器,用于对第一图片进行人脸识别确定第一图片的第一身份,提取第一身份的历史语音隐层结果;将该第一语音输入到循环神经网络计算得到该第一语音的含义,所述循环神经网络的第一个隐层的输入为历史语音隐层结果。
可选的,处理器,具体用于获取循环神经网络输入层t时刻的输入数据Xt、权值W,如t=0,获取最后一个隐层的输出结果Smax’,依据输出结果Smax’、输入数据Xt、权值W计算得到t时刻的输出结果Ot以及t=0时刻的隐层输出结果S0,将S0作为t+1隐层的输入数据,依据S0、输入数据Xt+1、权值W计算得到t+1时刻的输出结果Ot+1以及t+1时刻的隐层输出结果St+1;依次执行t+1时刻之后的运算直至得到循环神经网络的输出结果Omax以及Smax,依据输出结果Omax得到该第一语音的含义。
上述具体的计算方法可以由处理器完成,该具体计算方法可以参见如图2所示的方法实施例的描述,这里不再赘述。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种智能家具的语音识别方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种智能家具的语音识别方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种智能家具的语音识别方法,其特征在于,所述方法包括如下步骤:
智能家具采集第一图片和第一语音;
智能家具对第一图片进行人脸识别确定第一图片的第一身份,提取第一身份的历史语音隐层结果;
智能家具将该第一语音输入到循环神经网络计算得到该第一语音的含义,所述循环神经网络的第一个隐层的输入为历史语音隐层结果。
2.根据权利要求1所述的方法,其特征在于,所述智能家具将该第一语音输入到循环神经网络计算得到该第一语音的含义具体包括:
获取循环神经网络输入层t时刻的输入数据Xt、权值W,如t=0,获取最后一个隐层的输出结果Smax’,依据输出结果Smax’、输入数据Xt、权值W计算得到t时刻的输出结果Ot以及t=0时刻的隐层输出结果S0,将S0作为t+1隐层的输入数据,依据S0、输入数据Xt+1、权值W计算得到t+1时刻的输出结果Ot+1以及t+1时刻的隐层输出结果St+1;依次执行t+1时刻之后的运算直至得到循环神经网络的输出结果Omax以及Smax,依据输出结果Omax得到该第一语音的含义。
3.根据权利要求2所述的方法,其特征在于,依据输出结果Smax’、输入数据Xt、权值W计算得到t时刻的输出结果Ot以及t=0时刻的隐层输出结果S0具体包括:
S0=Xt×W+S’max×W
Ot=f(S0)
其中,f为激活函数。
4.根据权利要求1所述的方法,其特征在于,所述依据输出结果Smax’、输入数据Xt、权值W计算得到t时刻的输出结果Ot以及t=0时刻的隐层输出结果S0具体包括:
S0=Xt×W+k*S’max×W
Ot=f(S0)
其中,f为激活函数,k为调整系数。
5.根据权利要求4所述的方法,其特征在于,所述k的调整方式具体包括:
获取输入数据Xt所有元素值的绝对值的平均值α,获取输出结果Smax’所有元素的绝对值,提取输出结果Smax’所有元素的绝对值中大于α的元素值的数量β,依据β所处的区间确定该k的取值。
6.一种智能家具,其特征在于,所述智能家具包括:处理器、存储器、麦克风、摄像头;
所述摄像头,用于采集第一图片,
所述麦克风,用于采集第一语音;
所述处理器,用于对第一图片进行人脸识别确定第一图片的第一身份,提取第一身份的历史语音隐层结果;将该第一语音输入到循环神经网络计算得到该第一语音的含义,所述循环神经网络的第一个隐层的输入为历史语音隐层结果。
7.根据权利要求6所述的智能家具,其特征在于,
所述处理器,具体用于获取循环神经网络输入层t时刻的输入数据Xt、权值W,如t=0,获取最后一个隐层的输出结果Smax’,依据输出结果Smax’、输入数据Xt、权值W计算得到t时刻的输出结果Ot以及t=0时刻的隐层输出结果S0,将S0作为t+1隐层的输入数据,依据S0、输入数据Xt+1、权值W计算得到t+1时刻的输出结果Ot+1以及t+1时刻的隐层输出结果St+1;依次执行t+1时刻之后的运算直至得到循环神经网络的输出结果Omax以及Smax,依据输出结果Omax得到该第一语音的含义。
8.根据权利要求7所述的智能家居,其特征在于,
所述处理器,具体用于依据下述公式计算得到t时刻的输出结果Ot以及隐层输出结果S0
S0=Xt×W+S’max×W
Ot=f(S0)
其中,f为激活函数。
9.根据权利要求7所述的方法,其特征在于,
所述处理器,具体用于依据下述公式计算得到t时刻的输出结果Ot以及隐层输出结果S0
S0=Xt×W+k*S’max×W
Ot=f(S0)
其中,f为激活函数,k为调整系数;所述k的调整方式具体包括:
获取输入数据Xt所有元素值的绝对值的平均值α,获取输出结果Smax’所有元素的绝对值,提取输出结果Smax’所有元素的绝对值中大于α的元素值的数量β,依据β所处的区间确定该k的取值。
10.一种计算机可读存储介质,其特征在于,其存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-5任意一项所述的方法。
CN201910373219.9A 2019-05-06 2019-05-06 智能家具的语音识别方法及相关产品 Active CN110277091B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910373219.9A CN110277091B (zh) 2019-05-06 2019-05-06 智能家具的语音识别方法及相关产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910373219.9A CN110277091B (zh) 2019-05-06 2019-05-06 智能家具的语音识别方法及相关产品

Publications (2)

Publication Number Publication Date
CN110277091A true CN110277091A (zh) 2019-09-24
CN110277091B CN110277091B (zh) 2020-03-17

Family

ID=67959623

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910373219.9A Active CN110277091B (zh) 2019-05-06 2019-05-06 智能家具的语音识别方法及相关产品

Country Status (1)

Country Link
CN (1) CN110277091B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105354277A (zh) * 2015-10-30 2016-02-24 中国船舶重工集团公司第七0九研究所 一种基于递归神经网络的推荐方法及系统
CN105389972A (zh) * 2015-10-20 2016-03-09 中国矿业大学 一种基于手机客户端的公交车乘车系统
CN105489218A (zh) * 2015-11-24 2016-04-13 江苏惠通集团有限责任公司 一种语音控制的系统、遥控器及服务器
CN108024158A (zh) * 2017-11-30 2018-05-11 天津大学 利用视觉注意力机制的有监督视频摘要提取方法
CN109204007A (zh) * 2018-08-29 2019-01-15 江西理工大学 一种无人驾驶的悬挂式磁悬浮列车及其控制方法
US20190051292A1 (en) * 2017-08-14 2019-02-14 Samsung Electronics Co., Ltd. Neural network method and apparatus
US10242665B1 (en) * 2017-12-29 2019-03-26 Apex Artificial Intelligence Industries, Inc. Controller systems and methods of limiting the operation of neural networks to be within one or more conditions
US10255910B2 (en) * 2016-09-16 2019-04-09 Apptek, Inc. Centered, left- and right-shifted deep neural networks and their combinations

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389972A (zh) * 2015-10-20 2016-03-09 中国矿业大学 一种基于手机客户端的公交车乘车系统
CN105354277A (zh) * 2015-10-30 2016-02-24 中国船舶重工集团公司第七0九研究所 一种基于递归神经网络的推荐方法及系统
CN105489218A (zh) * 2015-11-24 2016-04-13 江苏惠通集团有限责任公司 一种语音控制的系统、遥控器及服务器
US10255910B2 (en) * 2016-09-16 2019-04-09 Apptek, Inc. Centered, left- and right-shifted deep neural networks and their combinations
US20190051292A1 (en) * 2017-08-14 2019-02-14 Samsung Electronics Co., Ltd. Neural network method and apparatus
CN108024158A (zh) * 2017-11-30 2018-05-11 天津大学 利用视觉注意力机制的有监督视频摘要提取方法
US10242665B1 (en) * 2017-12-29 2019-03-26 Apex Artificial Intelligence Industries, Inc. Controller systems and methods of limiting the operation of neural networks to be within one or more conditions
CN109204007A (zh) * 2018-08-29 2019-01-15 江西理工大学 一种无人驾驶的悬挂式磁悬浮列车及其控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FRANOIS CHOLLET: "Keras中文文档", 《KERAS中文文档》 *
满腹的小不甘(QQ_27586341): "Keras之LSTM 有状态模型(stateful LSTM)和无状态模型(stateless LSTM),https://blog.csdn.net/qq_27586341/article/details/88239404", 《KERAS之LSTM 有状态模型(STATEFUL LSTM)和无状态模型(STATELESS LSTM)》 *

Also Published As

Publication number Publication date
CN110277091B (zh) 2020-03-17

Similar Documents

Publication Publication Date Title
US11093805B2 (en) Image recognition method and apparatus, image verification method and apparatus, learning method and apparatus to recognize image, and learning method and apparatus to verify image
JP6757398B2 (ja) 音声認識方法、装置、機器及び記憶媒体
US10346726B2 (en) Image recognition method and apparatus, image verification method and apparatus, learning method and apparatus to recognize image, and learning method and apparatus to verify image
CN111357051B (zh) 语音情感识别方法、智能装置和计算机可读存储介质
CN109658943B (zh) 一种音频噪声的检测方法、装置、存储介质和移动终端
US20200057916A1 (en) Image identification apparatus, image identification method, training apparatus, and neural network
CN109616102B (zh) 声学模型的训练方法、装置及存储介质
WO2023173593A1 (zh) 文本分类方法、文本分类装置、存储介质及电子装置
CN112308227B (zh) 神经网络架构搜索方法、装置、终端设备以及存储介质
CN109190654A (zh) 人脸识别模型的训练方法和装置
US20210200945A1 (en) Prediction of media success from polot summaries using machine learning model
CN110321761A (zh) 一种行为识别方法、终端设备及计算机可读存储介质
CN107203611A (zh) 基于图片内容的信息提供方法和装置
CN105022797B (zh) 一种资源的主题处理方法和装置
AU2014277847A1 (en) A method or computing device for configuring parameters of a feature extractor
CN114548262A (zh) 一种情感计算中多模态生理信号的特征级融合方法
CN112070019B (zh) 一种人脸识别方法、装置、电子设备和存储介质
CN113657272A (zh) 一种基于缺失数据补全的微视频分类方法及系统
CN110277091A (zh) 智能家具的语音识别方法及相关产品
CN109616103B (zh) 声学模型的训练方法、装置及存储介质
CN115116470B (zh) 音频处理方法、装置、计算机设备和存储介质
CN107203916A (zh) 一种用户信用模型建立方法及装置
KR20180135616A (ko) 딥 네트워크 구조 및 딥 러닝 기반 영상 인식 시스템
CN110826726B (zh) 目标处理方法、目标处理装置、目标处理设备及介质
CN116758601A (zh) 人脸识别模型的训练方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant