CN109410985A - 哭声智能翻译手表 - Google Patents
哭声智能翻译手表 Download PDFInfo
- Publication number
- CN109410985A CN109410985A CN201811240895.0A CN201811240895A CN109410985A CN 109410985 A CN109410985 A CN 109410985A CN 201811240895 A CN201811240895 A CN 201811240895A CN 109410985 A CN109410985 A CN 109410985A
- Authority
- CN
- China
- Prior art keywords
- crying
- test sample
- formula
- intelligent translation
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010011469 Crying Diseases 0.000 title claims abstract description 37
- 238000013519 translation Methods 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 15
- 230000004069 differentiation Effects 0.000 claims abstract description 5
- 238000012360 testing method Methods 0.000 claims description 34
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 4
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 claims description 2
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 claims description 2
- 210000000299 nuclear matrix Anatomy 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 4
- 230000007812 deficiency Effects 0.000 abstract description 2
- 238000007792 addition Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
- General Health & Medical Sciences (AREA)
- Child & Adolescent Psychology (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种哭声智能翻译手表,具体涉及语音智能识别技术领域。其解决了现有的哭声识别主要关注在识别小孩有没有在哭泣,并没有关注小孩为什么哭泣,不能将小孩的哭声翻译成对应的信号,便于家长及时的了解孩子的需求的不足。哭声智能翻译手表,包括声音采集器和智能翻译系统,所述声音采集器将采集的哭声信息输送至智能翻译系统,智能翻译系统利用基于组合特征的系数表示方法对声音信息进行判别认证,经过判别认证的声音信息对应的内容以语音形式输出。
Description
技术领域
本发明涉及语音智能识别技术领域,具体涉及一种哭声智能翻译手表。
背景技术
小孩哭声识别系统是目前儿童护理系统当中非常关键的一个子系统,在很多企业和科研单位受到很大的关注。小孩哭声识别系统主要用于很好的识别小孩在哭及因为什么原因哭。目前主要的小孩哭声识别技术主要有:防丢失哭声求助智能手环。智能化多功能婴幼儿伴护系统,现有的哭声识别主要关注在识别小孩有没有在哭泣,并没有关注小孩为什么哭泣,不能将小孩的哭声翻译成对应的信号,便于家长及时的了解孩子的需求。
发明内容
本发明的目的是针对上述不足,提出了一种基于智能翻译系统对哭声声音信息认证,以语音形式反馈出哭声信息表示的含义的哭声智能翻译手表。
本发明具体采用如下技术方案:
哭声智能翻译手表,包括声音采集器和智能翻译系统,所述声音采集器将采集的哭声信息输送至智能翻译系统,智能翻译系统利用基于组合特征的系数表示方法对声音信息进行判别认证,经过判别认证的声音信息对应的内容以语音形式输出。
优选地,所述基于组合特征的系数表示方法包括稀疏编码方法,该方法以声音采集器采集的哭声信息为测试样本;
设定非线性特征映射函数,Φ(.):Rq→RQ(q<<Q)该函数将测试样本x和扩展原型集按照式(1)映射到高维特征空间
x→Φ(x) (1)
将SRC中使用的原始特征定义为测试样本的“线性特征”,基于核函数的SRC使用的高维特征作为测试样本的“非线性特征”;将原始线性特征和非线性特征按照式(2)结合起来
其中,是测试样板的线性特征,是测试样本的非线性特征,Z是新的原型集,z是新的测试样本;将稀疏编码的优化问题表述为式(3)
另是核矩阵,K采用式(4)进行计算
在将非线性特征变换到低维空间之后,组合特征矩阵采用式(5)表示
其中,d是伪变换矩阵K的保留维数,根据式(6)提出组合-多特征模型
其中Fcom表示组合特征,F1,F2,...,Fv表示等待组合的v特征,w1,w2,...,wv是加权值和 表示样本的第v个特征中的所有点的平方的总和。
优选地,取线性特征和非线性特征的贡献相同,即w1和w2都为0.5,将X和K的每一列标准化为加权为式(7)
测试样本的非线性特征也被转换为式(8)
测试样品的组合特征可以描述为式(9)
然后采用式(10)测试样本
本发明具有如下有益效果:
具体实施方式
下面结合附图和具体实施例对本发明的具体实施方式做进一步说明:
SRC:(sparse representation-based classifier)基于稀疏表达的分类。
哭声智能翻译手表(哭声可以着重针对小孩的哭声),包括声音采集器和智能翻译系统,所述声音采集器将采集的哭声信息输送至智能翻译系统,智能翻译系统利用基于组合特征的系数表示方法对声音信息进行判别认证,经过判别认证的声音信息对应的内容以语音形式输出。
基于组合特征的系数表示方法包括稀疏编码方法,该以声音采集器采集的哭声信息为测试样本,在算法部分,测试样本可以为若干5秒左右(或者10s左右)的声音片断作为一个样本。
测试样本包括两部分数据:实施采集的数据x和预先采集的数据
实施采集数据是实施采集出手环旁边的声音,然后使用分类方法去判断这个声音是不是小孩哭声是那种类型的哭声(例如饿了、困了、厌烦了或者身体不舒服等)。
预先采集的数据(就是手环生产前采集的训练数据)
X_c这个大字母里面有很多小字母,也就是有很多样本,样本个数是N_c(c=1,2,3,4,5),c=1代表是小孩没有哭,c=2代表是小孩饿了的哭声c=3代表小孩困了的哭声c=4代表小孩烦了的哭声c=5代表小孩身体不舒服的哭声,X_c里面的声音样本是提前采集好的可以有很多也就是N_c可以有很多,(例如100或者300等)一般来说N_c越大识别精度越高不过计算量也会增加。
分类方法最后会输出一个类标,即返回一个数值c=1?2?3?4?5?代表不同种类的哭声。
系数表示(SRC)仅使用原型集来解决线性问题,但是测试样本不容易被数据集线性编码。因此,基于核函数的稀疏表示使用原型集的非线性特征来对测试样本进行分类,设定非线性特征映射函数,Φ(.):Rq→RQ(q<<Q)该函数将测试样本x和扩展原型集按照式(1)映射到高维特征空间
x→Φ(x) (1)
将SRC中使用的原始特征定义为测试样本的“线性特征”,基于核函数的SRC使用的高维特征作为测试样本的“非线性特征”;将原始线性特征和非线性特征按照式(2)结合起来
其中,是测试样板的线性特征,是测试样本的非线性特征,Z是新的原型集,z是新的测试样本;将稀疏编码的优化问题表述为式(3)
由于Q非常大,优化问题不能直接解决,另是核矩阵,K采用式(4)进行计算
在将非线性特征变换到低维空间之后,组合特征矩阵采用式(5)表示
其中,d是伪变换矩阵K的保留维数,根据式(6)提出组合-多特征模型
其中Fcom表示组合特征,F1,F2,...,Fv表示等待组合的v特征,w1,w2,...,wv是加权值和 表示样本的第v个特征中的所有点的平方的总和。
取线性特征和非线性特征的贡献相同,即w1和w2都为0.5,将X和K的每一列标准化为加权为式(7)
测试样本的非线性特征也被转换为式(8)
测试样品的组合特征可以描述为式(9)
然后采用式(10)测试样本
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。
Claims (3)
1.哭声智能翻译手表,其特征在于,包括声音采集器和智能翻译系统,所述声音采集器将采集的哭声信息输送至智能翻译系统,智能翻译系统利用基于组合特征的系数表示方法对声音信息进行判别认证,经过判别认证的声音信息对应的内容以语音形式输出。
2.如权利要求1所述的哭声智能翻译手表,其特征在于,所述基于组合特征的系数表示方法包括稀疏编码方法,该方法以声音采集器采集的哭声信息为测试样本;
设定非线性特征映射函数,Φ(.):Rq→RQ(q<<Q)该函数将测试样本x和扩展原型集按照式(1)映射到高维特征空间
x→Φ(x) (1)
将SRC中使用的原始特征定义为测试样本的“线性特征”,基于核函数的SRC使用的高维特征作为测试样本的“非线性特征”;将原始线性特征和非线性特征按照式(2)结合起来
其中,是测试样板的线性特征,是测试样本的非线性特征,Z是新的原型集,z是新的测试样本;将稀疏编码的优化问题表述为式(3)
另是核矩阵,K采用式(4)进行计算
在将非线性特征变换到低维空间之后,组合特征矩阵采用式(5)表示
其中,d是伪变换矩阵K的保留维数,根据式(6)提出组合-多特征模型
其中Fcom表示组合特征,F1,F2,...,Fv表示等待组合的v特征,w1,w2,...,wv是加权值和 表示样本的第v个特征中的所有点的平方的总和。
3.如权利要求2所述的哭声智能翻译手表,其特征在于,取线性特征和非线性特征的贡献相同,即w1和w2都为0.5,将X和K的每一列标准化为加权为式(7)
测试样本的非线性特征也被转换为式(8)
测试样品的组合特征可以描述为式(9)
然后采用式(10)测试样本
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811240895.0A CN109410985B (zh) | 2018-10-24 | 2018-10-24 | 哭声智能翻译手表 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811240895.0A CN109410985B (zh) | 2018-10-24 | 2018-10-24 | 哭声智能翻译手表 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109410985A true CN109410985A (zh) | 2019-03-01 |
CN109410985B CN109410985B (zh) | 2022-11-04 |
Family
ID=65469363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811240895.0A Active CN109410985B (zh) | 2018-10-24 | 2018-10-24 | 哭声智能翻译手表 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109410985B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020135485A1 (en) * | 2001-03-22 | 2002-09-26 | Meiji University Legal Person | System and method for analyzing baby cries |
CN103177265A (zh) * | 2013-03-25 | 2013-06-26 | 中山大学 | 基于核函数与稀疏编码的高清图像分类方法 |
CN103440513A (zh) * | 2013-09-17 | 2013-12-11 | 西安电子科技大学 | 基于稀疏非负张量分解的大脑特定视觉认知状态判定方法 |
CN106531192A (zh) * | 2016-12-09 | 2017-03-22 | 电子科技大学 | 基于冗余特征和多词典表示的语音情感识别方法及系统 |
WO2017166933A1 (zh) * | 2016-03-30 | 2017-10-05 | 深圳大学 | 一种基于核机器学习的非负矩阵分解人脸识别方法及系统 |
CN107886953A (zh) * | 2017-11-27 | 2018-04-06 | 四川长虹电器股份有限公司 | 一种基于表情和语音识别的婴儿哭声翻译系统 |
CN108564967A (zh) * | 2018-03-14 | 2018-09-21 | 南京邮电大学 | 面向哭声检测系统的Mel能量声纹特征提取方法 |
-
2018
- 2018-10-24 CN CN201811240895.0A patent/CN109410985B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020135485A1 (en) * | 2001-03-22 | 2002-09-26 | Meiji University Legal Person | System and method for analyzing baby cries |
CN103177265A (zh) * | 2013-03-25 | 2013-06-26 | 中山大学 | 基于核函数与稀疏编码的高清图像分类方法 |
CN103440513A (zh) * | 2013-09-17 | 2013-12-11 | 西安电子科技大学 | 基于稀疏非负张量分解的大脑特定视觉认知状态判定方法 |
WO2017166933A1 (zh) * | 2016-03-30 | 2017-10-05 | 深圳大学 | 一种基于核机器学习的非负矩阵分解人脸识别方法及系统 |
CN106531192A (zh) * | 2016-12-09 | 2017-03-22 | 电子科技大学 | 基于冗余特征和多词典表示的语音情感识别方法及系统 |
CN107886953A (zh) * | 2017-11-27 | 2018-04-06 | 四川长虹电器股份有限公司 | 一种基于表情和语音识别的婴儿哭声翻译系统 |
CN108564967A (zh) * | 2018-03-14 | 2018-09-21 | 南京邮电大学 | 面向哭声检测系统的Mel能量声纹特征提取方法 |
Non-Patent Citations (1)
Title |
---|
顾国良等: "基于数字信号处理器的婴儿声音识别系统的设计与实现", 《生物医学工程研究》 * |
Also Published As
Publication number | Publication date |
---|---|
CN109410985B (zh) | 2022-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Land use/land cover changes and their driving factors in the Northeastern Tibetan Plateau based on Geographical Detectors and Google Earth Engine: A case study in Gannan Prefecture | |
Wang et al. | Quantifying influences of natural and anthropogenic factors on vegetation changes based on geodetector: A case study in the Poyang Lake Basin, China | |
Licandro et al. | Changes of zooplankton communities in the Gulf of Tigullio (Ligurian Sea, Western Mediterranean) from 1985 to 1995. Influence of hydroclimatic factors | |
Chen et al. | Mapping local climate zones using ArcGIS-based method and exploring land surface temperature characteristics in Chenzhou, China | |
Proutsos et al. | Growth response of endemic black pine trees to meteorological variations and drought episodes in a Mediterranean region | |
Mol et al. | Deciduous tusks and small permanent tusks of the Woolly Mammoth, Mammuthus primigenius (Blumenbach, 1799) found on beaches in The Netherlands | |
Su et al. | An evaluation model for urban comprehensive carrying capacity: An empirical case from Harbin city | |
Calabrese et al. | Long-term changes in the composition, ecology, and structure of Pinus mugo scrubs in the Apennines (Italy) | |
Zhang et al. | Adaptive threshold model in google earth engine: A case study of Ulva prolifera extraction in the south yellow sea, China | |
Torres-Valcárcel et al. | Impacts of urban development on precipitation in the tropical maritime climate of Puerto Rico | |
Li et al. | Dynamics of carbon storage and its drivers in Guangdong Province from 1979 to 2012 | |
Fall et al. | Assessment of climate-driven variations in malaria transmission in Senegal using the VECTRI model | |
Li et al. | Temporal and spatial variations of precipitation change from Southeast to Northwest China during the period 1961–2017 | |
Jin et al. | Extraction of arecanut planting distribution based on the feature space optimization of PlanetScope imagery | |
Zhang et al. | Land-Greening Hotspot Changes in the Yangtze River Economic Belt during the Last Four Decades and Their Connections to Human Activities | |
Han et al. | Geographic exploration of the driving forces of the NDVI spatial differentiation in the Upper Yellow River Basin from 2000 to 2020 | |
Yao et al. | Spatial pattern of changing vegetation dynamics and its driving factors across the Yangtze River basin in chongqing: a geodetector-based study | |
Sun et al. | Effects of landscape positions and landscape types on soil properties and chlorophyll content of citrus in a sloping orchard in the three gorges reservoir area, China | |
CN109410985A (zh) | 哭声智能翻译手表 | |
Wei et al. | Ecological Sensitivity of Urban Agglomeration in the Guanzhong Plain, China | |
Su et al. | A decrease in the daily maximum temperature during global warming hiatus causes a delay in spring phenology in the China–DPRK–Russia cross-border area | |
Chian et al. | Variation in mountain vegetation composition between the east and the west sides of southern Taiwan | |
Meng et al. | Three-Dimensional Mineral Prospectivity Modeling for Delineation of Deep-Seated Skarn-Type Mineralization in Xuancheng–Magushan Area, China | |
Ren et al. | Butterfly community diversity in the Qinling mountains | |
Xu et al. | Exploring spatial distribution of pollen allergenic risk zones in urban China |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |