CN106228988A - 一种基于声纹信息的习惯信息匹配方法及装置 - Google Patents
一种基于声纹信息的习惯信息匹配方法及装置 Download PDFInfo
- Publication number
- CN106228988A CN106228988A CN201610624760.9A CN201610624760A CN106228988A CN 106228988 A CN106228988 A CN 106228988A CN 201610624760 A CN201610624760 A CN 201610624760A CN 106228988 A CN106228988 A CN 106228988A
- Authority
- CN
- China
- Prior art keywords
- user
- voiceprint
- terminal
- information
- habit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000008569 process Effects 0.000 title claims abstract description 35
- 239000000284 extract Substances 0.000 claims abstract description 14
- 238000000605 extraction Methods 0.000 claims description 8
- 239000000203 mixture Substances 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 abstract description 7
- 230000008878 coupling Effects 0.000 abstract description 6
- 238000005859 coupling reaction Methods 0.000 abstract description 6
- 230000001755 vocal effect Effects 0.000 description 21
- 208000031481 Pathologic Constriction Diseases 0.000 description 6
- 210000001215 vagina Anatomy 0.000 description 6
- RYYVLZVUVIJVGH-UHFFFAOYSA-N caffeine Chemical compound CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- LPHGQDQBBGAPDZ-UHFFFAOYSA-N Isocaffeine Natural products CN1C(=O)N(C)C(=O)C2=C1N(C)C=N2 LPHGQDQBBGAPDZ-UHFFFAOYSA-N 0.000 description 2
- 229960001948 caffeine Drugs 0.000 description 2
- VJEONQKOZGKCAK-UHFFFAOYSA-N caffeine Natural products CN1C(=O)N(C)C(=O)C2=C1C=CN2C VJEONQKOZGKCAK-UHFFFAOYSA-N 0.000 description 2
- 235000006694 eating habits Nutrition 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 210000000867 larynx Anatomy 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 210000003928 nasal cavity Anatomy 0.000 description 2
- 230000035479 physiological effects, processes and functions Effects 0.000 description 2
- 230000033764 rhythmic process Effects 0.000 description 2
- 210000000515 tooth Anatomy 0.000 description 2
- 208000037656 Respiratory Sounds Diseases 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/14—Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Signal Processing (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于声纹信息的习惯信息匹配方法及装置。包括:终端接收用户的用户声音,提取用户声音的声纹信息;判断声纹信息是否符合预设声纹信息;若声纹信息符合预设声纹信息,则根据声纹信息在用户习惯数据库中查找与声纹信息对应的用户习惯信息;终端根据用户习惯信息为用户提供对应服务。通过实施本发明,终端不仅能通过用户的声纹信息识别用户,还能通过记录用户的操作信息来不断“学习”用户的使用习惯,不断了解用户,并根据用户的声纹信息为用户提供匹配的服务,提高用户使用体验。
Description
技术领域
本发明涉及人工智能领域,更具体地说,涉及一种基于声纹信息的习惯信息匹配方法及装置。
背景技术
随着计算机技术的发展,人工智能越来越多的应用于人们的生产生活,人机交互的方式也从传统的文字指令和按键发展为语音及图像。语音作为人们之间交流的方式,不仅能根据具体单个指令执行信息,还能通过交流逐渐了解对方,形成对对方的一定程度认知,以便根据认知更好的理解对方。
目前,在人工智能领域,语音信息多作为一种验证方式,用于用户身份的识别,且只能根据用户发出的具体指令信息进行具体的操作,属于单向指令逻辑,智能化程度不高。例如,门禁系统利用用户的声音识别用户的身份;一台具有语音识别的电视机,可根据用户的指令进行开关电视、音量调节、选择节目等,但不能通过“学习”用户的操作了解用户的使用习惯,不能根据用户的声音为用户提供个性化的服务,这大大限制了人与机器之间的交流。
发明内容
本发明要解决的技术问题在于,提供一种基于声纹信息的习惯信息匹配方法及装置。
本发明解决其技术问题所采用的技术方案是:构造一种基于声纹信息的习惯信息匹配方法,所述方法包括下述步骤:
终端接收用户的用户声音,提取所述用户声音的声纹信息;
判断所述声纹信息是否符合预设声纹信息;
若是,则根据所述声纹信息在用户习惯数据库中查找与所述声纹信息对应的用户习惯信息。
优选地,本发明所述的基于声纹信息的习惯信息匹配方法,在提取所述用户声音的声纹信息的步骤之后,还包括下述步骤:
将所述声纹信息与声纹信息库进行比对,判断所述声纹信息是否已经存在已有账号;
若否,则将所述声纹信息添加至所述声纹信息库,并设置为预设声纹信息;
设置用户账户,建立所述预设声纹信息和所述用户账号的对应关系。
优选地,本发明所述的基于声纹信息的习惯信息匹配方法,若所述用户的所述声纹信息符合所述预设声纹信息,则执行下述步骤:
所述终端记录所述用户在使用所述终端过程中的操作信息;
将所述操作信息存储至所述用户对应的用户习惯数据库。
优选地,本发明所述的基于声纹信息的习惯信息匹配方法,在查找与所述声纹信息对应的用户习惯信息的步骤之后,执行下述步骤:
所述终端根据所述用户习惯信息为所述用户提供对应服务。
优选地,本发明所述的基于声纹信息的习惯信息匹配方法,若所述用户习惯信息包括多个用户习惯时,所述终端根据所述用户习惯信息为所述用户提供对应服务的步骤,具体包括下述步骤:
提供所述用户习惯数据库中的多个用户习惯选项供所述用户选择;
根据所述用户选择的所述用户习惯选项为所述用户提供对应服务。
优选地,在本发明所述的基于声纹信息的习惯信息匹配方法中,所述用户习惯信息包括:用户设置所述终端的参数、用户使用所述终端的使用参数、用户选择所述终端提供服务的种类、用户选择所述终端提供的服务的组成参数、用户使用所述终端时的环境参数。
另,本发明还公开一种基于声纹信息的习惯信息匹配装置,所述装置包括:
第一接收单元,用于终端接收用户的用户声音,提取所述用户声音的声纹信息;
判断单元,用于判断所述声纹信息是否符合预设声纹信息;
查找单元,用于若所述声纹信息是否符合预设声纹信息,则根据所述声纹信息在用户习惯数据库中查找与所述声纹信息对应的用户习惯信息。
优选地,本发明所述的基于声纹信息的习惯信息匹配装置,所述装置还包括:
第二接收单元,用于向所述终端中输入所述用户的预设用户声音;
提取单元,用于提取所述预设用户声音的预设声纹信息;
账户设置单元,用于设置用户账户,建立所述预设声纹信息和所述用户的对用关系。
优选地,本发明所述的基于声纹信息的习惯信息匹配装置,所述装置还包括:
记录单元,用于所述终端记录所述用户在使用所述终端过程中的操作信息;
存储单元,用于将所述操作信息存储至所述用户对应的用户习惯数据库。
优选地,本发明所述的基于声纹信息的习惯信息匹配装置,所述装置还包括:
执行单元,用于所述终端根据所述用户习惯信息为所述用户提供对应服务。
优选地,本发明所述的基于声纹信息的习惯信息匹配装置,所述执行单元包括:
第一选择子单元,用于提供所述用户习惯数据库中的多个用户习惯选项供所述用户选择;
执行子单元,用于根据所述用户选择的所述用户习惯选项为所述用户提供对应服务。
实施本发明的基于声纹信息的习惯信息匹配方法及装置,具有以下有益效果:本发明公开的基于声纹信息的习惯信息匹配方法包括:终端接收用户的用户声音,提取用户声音的声纹信息;判断声纹信息是否符合预设声纹信息;若声纹信息符合预设声纹信息,则根据声纹信息在用户习惯数据库中查找与声纹信息对应的用户习惯信息;终端根据用户习惯信息为用户提供对应服务。通过实施本发明,终端不仅能通过用户的声纹信息识别用户,还能通过记录用户的操作信息来不断“学习”用户的使用习惯,不断了解用户,从而根据用户的声纹信息为用户提供匹配的服务,提高用户使用体验。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明基于声纹信息的习惯信息匹配方法的流程示意图;
图2是本发明基于声纹信息的习惯信息匹配装置的结构示意图。
具体实施方式
如图1所示,是本发明一种基于声纹信息的习惯信息匹配方法的优选实施例。
图1示出的是基于声纹信息的习惯信息匹配方法的流程示意图。该方法用于多种智能终端中,要求智能终端具有语音接收设备,智能终端包括但不限于:电脑、智能手机、智能家电设备、智能娱乐设备等。本实施例公开的一种基于声纹信息的习惯信息匹配方法,包括下述步骤:
S101:终端接收用户的用户声音,提取用户声音的声纹信息。所谓声纹,是用电声学仪器显示的携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异,每个人的语音声学特征既有相对稳定性,因此在一般情况下,人们仍能区别不同的人的声音或判断是否是同一人的声音。终端通过麦克风设备接收用户的语音信息,通过处理,提取用户声音中的声纹信息。终端将接收到的声纹信息存储到声纹信息库中,每个用户在声纹信息库中都有对应的用户账号,该账号可包含对应用户的多个声纹信息样本,可以理解的是,用户账户对应的声纹信息的样本越多,终端识别用户的准确率就越高。
S102:将声纹信息与声纹信息库进行比对,判断声纹信息是否已经存在已有账号。在终端接收到用户的声音后,将提取的声纹信息与终端的声纹信息库中的声纹信息进行比较。经过比较,如果声纹信息库中存在与接收到的声纹信息对应的声纹信息,则判定接收到的声纹信息对应的用户在终端中已存在用户账号;反之,如果声纹信息库中不存在与接收到的声纹信息对应的声纹信息,则判定接收到的声纹信息对应的用户在终端中不存在用户账号。可以理解,即使终端中已有用户账号,但在比较过程中,终端也很难接收到与声纹信息库中存储的声纹信息完全一样,因为用户的声音是在一定范围内变化的。因此,本实施例中比较声纹信息的相似程度,并设定声纹阈值,当终端接收到的声纹信息与声纹信息库中存储的声纹信息的相似程度达到声纹阈值时,则判定该声纹信息与声纹信息库中存储的声纹信息匹配;反之则判定为不匹配。当判定用户新输入的声纹信息与已存在的声纹信息匹配后,为增大该用户账户的样本量,将该声纹信息作为样本存储在终端的声纹信息库中。
S103:若声纹信息不存在已有账号,则将声纹信息添加至声纹信息库,并设置为预设声纹信息。通过比较,若终端接收到的声纹信息在终端中没有对应的账号,则将该声纹信息设置为预设声纹信息,该预设声纹信息用于识别与该声纹信息对应的用户。
S104:设置用户账户,建立预设声纹信息和用户账号的对应关系。当判定接收到的声纹信息在终端中不存在对应用户账号后,自动为该用户设置用户账户,并自动建立该声纹信息与该用户账户的对应关系,即自动建立用户账户与用户的对应关系。在本实施例中,当终端遇到新用户注册时,并不需要手动去添加新用户信息,终端可自动识别并建立用户账户,方便新用户注册,提高用户的使用体验。
S105:判断声纹信息是否符合预设声纹信息。终端将提取的声纹信息与预设声纹信息进行比较,本实施例中比较声纹信息的相似程度,并设定声纹阈值,当终端接收到的声纹信息与预设声纹信息的相似程度达到声纹阈值时,则判定该声纹信息与声纹信息库中存储的声纹信息匹配;反之则判定为不匹配。当判定用户新输入的声纹信息与预设声纹信息匹配后,为增大该用户账户的样本量,将该声纹信息作为样本存储在终端的声纹信息库中,作为预设声纹信息的新样本。
S106:若声纹信息符合预设声纹信息,则终端记录用户在使用终端过程中的操作信息。为使终端更加“了解”用户,在终端识别用户后,开始记录用户在使用终端过程中的操作信息,并对记录的操作信息进行分类统计分析,得出用户的使用习惯。例如,智能终端为一台智能咖啡机,用户在使用咖啡机的过程中,放糖量较大,且经常出现,通过统计,可以得出该用户喜欢放糖量大的咖啡,咖啡机则记录用户的该使用习惯,并在得到用户的使用习惯后,建立用户声纹信息与用户使用习惯之间的对应关系,根据用户不同的声纹信息对应不同的用户使用习惯。用户使用习惯信息不仅仅是用户的习惯,还包括用户在操作终端过程中的操作流程和参数设置,终端通过执行该操作流程和参数设置即可获得对应的服务。
S107:将操作信息存储至用户对应的用户习惯数据库。用户习惯数据库用于存储用户的习惯信息,终端记录用户的操作信息后,将操作信息存储至用户习惯数据库,终端的存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
S108:若声纹信息符合预设声纹信息,则根据声纹信息在用户习惯数据库中查找与声纹信息对应的用户习惯信息。用户习惯信息包括但不限于:用户设置终端的参数、用户使用终端的使用参数、用户所述终端提供服务的种类、用户选择终端提供的服务的组成参数、用户使用终端时的环境参数。例如,终端为智能咖啡机,此时用户习惯信息为用户选择咖啡的浓度、含糖量、温度、是否加奶等参数;又如,终端为智能空调,用户习惯信息为用户使用空调时选择的温度、出风量、风向、湿度等参数;又如,终端为智能电视,用户习惯信息为用户经常看收看的电视节目的频道、种类、时间等参数。
用户习惯数据库中存储有用户的使用习惯,且有用户使用习惯与用户声纹信息之间的对应关系,当终端从接收的用户声音中提取的声纹信息与预设声纹信息匹配后,终端根据该预设声纹信息与用户使用习惯之间的对应关系查找出该用户声音对应的用户习惯信息。
S109:终端根据用户习惯信息为用户提供对应服务。在根据用户声音查找到与之对应的用户习惯信息后,终端调用该使用习惯信息,并将该使用习惯信息解码成对应的终端操作流程和参数设置,终端根据该操作流程和参数设置为用户提供对应的服务。例如一台带语音控制的咖啡机,第一次根据声纹识别到一个新用户发出煮咖啡的命令,则记录这个用户的饮食习惯,例如咖啡浓度,放糖量多少。当同一个用户第二次发出煮咖啡命令,则询问用户是否要保持和上一次口味相同,如果是,则直接使用上一次的搭配。又例如,对于带语音控制的电视盒子,如果根据声纹识别出是小孩在控制打开电视,则自动进入儿童模式,推荐儿童喜好的影片。如果根据声纹识别出是老人,则推荐健康,戏曲等相关节目,并优先展示本用户上次看得视频。
优选地,本发明的基于声纹信息的习惯信息匹配方法,若用户习惯信息包括多个用户习惯时,终端根据用户习惯信息为用户提供对应服务的步骤,具体包括下述步骤:
S1091:提供用户习惯数据库中的多个用户习惯选项供用户选择;终端将该声纹信息对应的多个用户习惯按照一定的排序方式进行排序,例如用户使用过该用户习惯的次数,次数越高,排名越高。终端通过语音提示或显示屏显示多个用户习惯选项供用户选择。
S1092:根据用户选择的用户习惯选项为用户提供对应服务。用户接收到提示后,可通过语音、按键、触摸等方式对终端进行反馈,选择需要的选项,并调用该使用习惯信息,并将该使用习惯信息解码成对应的终端操作流程和参数设置,终端根据该操作流程和参数设置为用户提供对应的服务。
如图2所示,是本发明一种基于声纹信息的习惯信息匹配装置的优选实施例。
图2示出的是基于声纹信息的习惯信息匹配装置的结构示意图。该装置用于多种智能终端中,要求智能终端具有语音接收设备,智能终端包括但不限于:电脑、智能手机、智能家电设备、智能娱乐设备等。本实施例公开的一种基于声纹信息的习惯信息匹配装置,装置包括:第一接收单元201、第二接收单元202、提取单元203、账户设置单元204、判断单元205、记录单元206、存储单元207、查找单元208、执行单元209,以下分别做详细说明。
第一接收单元201,用于终端接收用户的用户声音,提取用户声音的声纹信息;终端接收用户的用户声音,提取用户声音的声纹信息。所谓声纹,是用电声学仪器显示的携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异,每个人的语音声学特征既有相对稳定性,因此在一般情况下,人们仍能区别不同的人的声音或判断是否是同一人的声音。终端通过麦克风设备接收用户的语音信息,通过处理,提取用户声音中的声纹信息。终端将接收到的声纹信息存储到声纹信息库中,每个用户在声纹信息库中都有对应的用户账号,该账号可包含对应用户的多个声纹信息样本,可以理解的是,用户账户对应的声纹信息的样本越多,终端识别用户的准确率就越高。
第二接收单元202,用于向终端中输入用户的预设用户声音;向终端输入用户的用户声音,提取用户声音的声纹信息。终端通过麦克风设备接收用户的语音信息,通过处理,提取用户声音中的声纹信息。终端将接收到的声纹信息存储到声纹信息库中,每个用户在声纹信息库中都有对应的用户账号,该账号可包含对应用户的多个声纹信息样本,可以理解的是,用户账户对应的声纹信息的样本越多,终端识别用户的准确率就越高。
提取单元203,用于提取预设用户声音的预设声纹信息。优选地,声纹信息的提取采用特征提取方式,特征提取的任务是提取并选择对说话人的声纹具有可分性强、稳定性高等特性的声学或语言特征。与语音识别不同,声纹识别的特征必须是“个性化”特征,而说话人识别的特征对说话人来讲必须是“共性特征”。表征一个人特点的特征应该是多层面的,包括:(1)与人类的发音机制的解剖学结构有关的声学特征(如频谱、倒频谱、共振峰、基音、反射系数等)、鼻音、带深呼吸音、沙哑音、笑声等;(2)受社会经济状况、受教育水平、出生地等影响的语义、修辞、发音、言语习惯等;(3)个人特点或受父母影响的韵律、节奏、速度、语调、音量等特征。从利用数学方法可以建模的角度出发,声纹自动识别模型目前可以使用的特征包括:(1)声学特征(倒频谱);(2)词法特征;(3)韵律特征;(4)语种、方言和口音信息;(5)通道信息(使用何种通道)。
账户设置单元204,用于设置用户账户,建立预设声纹信息和用户的对用关系。当判定接收到的声纹信息在终端中不存在对应用户账号后,自动为该用户设置用户账户,并自动建立该声纹信息与该用户账户的对应关系,即自动建立用户账户与用户的对应关系。在本实施例中,当终端遇到新用户注册时,并不需要手动去添加新用户信息,终端可自动识别并建立用户账户,方便新用户注册,提高用户的使用体验。
判断单元205,用于判断声纹信息是否符合预设声纹信息;终端将提取的声纹信息与预设声纹信息进行比较,本实施例中比较声纹信息的相似程度,并设定声纹阈值,当终端接收到的声纹信息与预设声纹信息的相似程度达到声纹阈值时,则判定该声纹信息与声纹信息库中存储的声纹信息匹配;反之则判定为不匹配。当判定用户新输入的声纹信息与预设声纹信息匹配后,为增大该用户账户的样本量,将该声纹信息作为样本存储在终端的声纹信息库中,作为预设声纹信息的新样本。将声纹信息与预设声纹信息输出至移动终端内置的主控制器或其他具有数据运算处理功能的处理器或控制器,包括但不限于微处理器、微控制器、数字信号处理器、微型计算器、中央处理器、场编程门阵列、可编程逻辑设备、状态器、逻辑电路、模拟电路、数字电路和/或任何基于操作指令操作信号(模拟和/或数字)的设备。
记录单元206,用于终端记录用户在使用终端过程中的操作信息;为使终端更加“了解”用户,在终端识别用户后,开始记录用户在使用终端过程中的操作信息,并对记录的操作信息进行分类统计分析,得出用户的使用习惯。例如,智能终端为一台智能咖啡机,用户在使用咖啡机的过程中,放糖量较大,且经常出现,通过统计,可以得出该用户喜欢放糖量大的咖啡,记录用户的该使用习惯。在得到用户的使用习惯后,建立用户声纹信息与用户使用习惯之间的对应关系,用户不同的声纹信息对应不同的用户使用习惯。用户使用习惯信息不仅仅是用户的习惯,还包括用户在操作终端过程中的操作流程和参数设置,终端通过执行该操作流程和参数设置即可获得对应的服务。
存储单元207,用于将操作信息存储至用户对应的用户习惯数据库。用户习惯数据库用于存储用户的习惯信息,终端记录用户的操作信息后,将操作信息存储至用户习惯数据库,终端的存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
查找单元208,用于若声纹信息是否符合预设声纹信息,则根据声纹信息在用户习惯数据库中查找与声纹信息对应的用户习惯信息。用户习惯数据库中存储有用户的使用习惯,且有用户使用习惯与用户声纹信息之间的对应关系,当终端从接收的用户声音中提取的声纹信息与预设声纹信息匹配后,终端根据该预设声纹信息与用户使用习惯之间的对应关系查找出该用户声音对应的用户习惯信息。
执行单元209,用于终端根据用户习惯信息为用户提供对应服务。在根据用户声音查找到与之对应的用户习惯信息后,终端调用该使用习惯信息,并将该使用习惯信息解码成对应的终端操作流程和参数设置,终端根据该操作流程和参数设置为用户提供对应的服务。例如一台带语音控制的咖啡机,第一次根据声纹识别到一个新用户发出煮咖啡的命令,则记录这个用户的饮食习惯,例如咖啡浓度,放糖量多少。当同一个用户第二次发出煮咖啡命令。则询问用户是否要保持和上一次口味相同。如果是,则直接使用上一次的搭配。又例如,对于带语音控制的电视盒子,如果根据声纹识别出是小孩在控制打开电视,则自动进入儿童模式,推荐儿童喜好的影片。如果根据声纹识别出是老人,则推荐健康,戏曲等相关节目,并优先展示本用户上次看得视频。
优选地,本发明的基于声纹信息的习惯信息匹配装置,执行单元包括:
第一选择子单元2091,用于提供用户习惯数据库中的多个用户习惯选项供用户选择;终端将该声纹信息对应的多个用户习惯按照一定的排序方式进行排序,例如用户使用过该用户习惯的次数,次数越高,排名越高。终端通过语音提示或显示屏显示多个用户习惯选项供用户选择。
执行子单元2092,用于根据用户选择的用户习惯选项为用户提供对应服务。用户接收到提示后,可通过语音、按键、触摸等方式对终端进行反馈,选择需要的选项,并调用该使用习惯信息,并将该使用习惯信息解码成对应的终端操作流程和参数设置,终端根据该操作流程和参数设置为用户提供对应的服务。
本发明实施例的方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例的装置中的模块或单元或子单元可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成。
以上实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据此实施,并不能限制本发明的保护范围。凡跟本发明权利要求范围所做的均等变化与修饰,均应属于本发明权利要求的涵盖范围。
Claims (10)
1.一种基于声纹信息的习惯信息匹配方法,其特征在于,所述方法包括下述步骤:
终端接收用户的用户声音,提取所述用户声音的声纹信息;
判断所述声纹信息是否符合预设声纹信息;
若是,则根据所述声纹信息在用户习惯数据库中查找与所述声纹信息对应的用户习惯信息。
2.根据权利要求1所述的基于声纹信息的习惯信息匹配方法,其特征在于,在提取所述用户声音的声纹信息的步骤之后,还包括下述步骤:
将所述声纹信息与声纹信息库进行比对,判断所述声纹信息是否已经存在已有账号;
若否,则将所述声纹信息添加至所述声纹信息库,并设置为预设声纹信息;
设置用户账户,建立所述预设声纹信息和所述用户账号的对应关系。
3.根据权利要求1或2所述的基于声纹信息的习惯信息匹配方法,其特征在于,若所述用户的所述声纹信息符合所述预设声纹信息,则执行下述步骤:
所述终端记录所述用户在使用所述终端过程中的操作信息;
将所述操作信息存储至所述用户对应的用户习惯数据库。
4.根据权利要求1所述的基于声纹信息的习惯信息匹配方法,其特征在于,在查找与所述声纹信息对应的用户习惯信息的步骤之后,执行下述步骤:
所述终端根据所述用户习惯信息为所述用户提供对应服务。
5.根据权利要求4所述的基于声纹信息的习惯信息匹配方法,其特征在于,若所述用户习惯信息包括多个用户习惯时,所述终端根据所述用户习惯信息为所述用户提供对应服务的步骤,具体包括下述步骤:
提供所述用户习惯数据库中的多个用户习惯选项供所述用户选择;
根据所述用户选择的所述用户习惯选项为所述用户提供对应服务。
6.根据权利要求1所述的基于声纹信息的习惯信息匹配方法,其特征在于,所述用户习惯信息包括:用户设置所述终端的参数、用户使用所述终端的使用参数、用户选择所述终端提供服务的种类、用户选择所述终端提供的服务的组成参数、用户使用所述终端时的环境参数。
7.一种基于声纹信息的习惯信息匹配装置,其特征在于,所述装置包括:
第一接收单元,用于终端接收用户的用户声音,提取所述用户声音的声纹信息;
判断单元,用于判断所述声纹信息是否符合预设声纹信息;
查找单元,用于若所述声纹信息是否符合预设声纹信息,则根据所述声纹信息在用户习惯数据库中查找与所述声纹信息对应的用户习惯信息。
8.根据权利要求7所述的基于声纹信息的习惯信息匹配装置,其特征在于,所述装置还包括:
第二接收单元,用于向所述终端中输入所述用户的预设用户声音;
提取单元,用于提取所述预设用户声音的预设声纹信息;
账户设置单元,用于设置用户账户,建立所述预设声纹信息和所述用户的对用关系。
9.根据权利要求7或者8所述的基于声纹信息的习惯信息匹配装置,其特征在于,所述装置还包括:
记录单元,用于所述终端记录所述用户在使用所述终端过程中的操作信息;
存储单元,用于将所述操作信息存储至所述用户对应的用户习惯数据库。
10.根据权利要求7所述的基于声纹信息的习惯信息匹配装置,其特征在于,所述装置还包括:
执行单元,用于所述终端根据所述用户习惯信息为所述用户提供对应服务;
所述执行单元包括:
第一选择子单元,用于提供所述用户习惯数据库中的多个用户习惯选项供所述用户选择;
执行子单元,用于根据所述用户选择的所述用户习惯选项为所述用户提供对应服务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610624760.9A CN106228988A (zh) | 2016-07-29 | 2016-07-29 | 一种基于声纹信息的习惯信息匹配方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610624760.9A CN106228988A (zh) | 2016-07-29 | 2016-07-29 | 一种基于声纹信息的习惯信息匹配方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106228988A true CN106228988A (zh) | 2016-12-14 |
Family
ID=57535723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610624760.9A Pending CN106228988A (zh) | 2016-07-29 | 2016-07-29 | 一种基于声纹信息的习惯信息匹配方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106228988A (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106683673A (zh) * | 2016-12-30 | 2017-05-17 | 智车优行科技(北京)有限公司 | 驾驶模式的调整方法、装置和系统、车辆 |
CN107147618A (zh) * | 2017-04-10 | 2017-09-08 | 北京猎户星空科技有限公司 | 一种用户注册方法、装置及电子设备 |
CN107146616A (zh) * | 2017-06-13 | 2017-09-08 | 广东欧珀移动通信有限公司 | 设备控制方法及相关产品 |
CN107451242A (zh) * | 2017-07-26 | 2017-12-08 | 广东美的制冷设备有限公司 | 数据播放控制方法、系统和计算机可读存储介质 |
CN107483445A (zh) * | 2017-08-23 | 2017-12-15 | 百度在线网络技术(北京)有限公司 | 一种静默声纹识别注册方法、装置、服务器和存储介质 |
CN107863108A (zh) * | 2017-11-16 | 2018-03-30 | 百度在线网络技术(北京)有限公司 | 信息输出方法和装置 |
CN107885836A (zh) * | 2017-11-09 | 2018-04-06 | 广东小天才科技有限公司 | 一种用于智能终端的应用程序推荐方法及装置 |
CN107945806A (zh) * | 2017-11-10 | 2018-04-20 | 北京小米移动软件有限公司 | 基于声音特征的用户识别方法及装置 |
CN108122557A (zh) * | 2017-12-25 | 2018-06-05 | 四川长虹电器股份有限公司 | 基于声纹识别的车载多媒体导航终端 |
CN108320753A (zh) * | 2018-01-22 | 2018-07-24 | 珠海格力电器股份有限公司 | 电器设备的控制方法、装置和系统 |
CN108682419A (zh) * | 2018-03-30 | 2018-10-19 | 京东方科技集团股份有限公司 | 语音控制方法及设备、计算机可读存储介质及设备 |
CN109065056A (zh) * | 2018-09-26 | 2018-12-21 | 珠海格力电器股份有限公司 | 一种语音控制空调的方法及装置 |
CN109145123A (zh) * | 2018-09-30 | 2019-01-04 | 国信优易数据有限公司 | 知识图谱模型的构建方法、智能交互方法、系统及电子设备 |
CN109487491A (zh) * | 2017-09-13 | 2019-03-19 | 青岛海尔洗衣机有限公司 | 洗衣机显示切换控制方法及洗衣机 |
WO2019080406A1 (zh) * | 2017-10-26 | 2019-05-02 | 深圳创维-Rgb电子有限公司 | 电视机语音交互方法、语音交互控制装置及存储介质 |
CN109752021A (zh) * | 2018-12-18 | 2019-05-14 | 维沃移动通信有限公司 | 一种行驶路线规划方法及装置 |
CN110134022A (zh) * | 2019-05-10 | 2019-08-16 | 平安科技(深圳)有限公司 | 智能家居设备的声音控制方法、装置、及电子装置 |
CN110867188A (zh) * | 2018-08-13 | 2020-03-06 | 珠海格力电器股份有限公司 | 内容服务的提供方法、装置、存储介质及电子装置 |
CN112201257A (zh) * | 2020-09-29 | 2021-01-08 | 北京百度网讯科技有限公司 | 基于声纹识别的信息推荐方法、装置、电子设备及存储介质 |
WO2021196610A1 (zh) * | 2020-04-02 | 2021-10-07 | 深圳创维-Rgb电子有限公司 | 一种设备推荐方法、装置、电子设备及可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103276554A (zh) * | 2013-03-29 | 2013-09-04 | 海尔集团公司 | 智能洗衣机语音控制方法 |
CN103532916A (zh) * | 2012-07-05 | 2014-01-22 | 百度在线网络技术(北京)有限公司 | 通过语音获取信息的方法、移动终端和语音信息系统 |
CN103730120A (zh) * | 2013-12-27 | 2014-04-16 | 深圳市亚略特生物识别科技有限公司 | 电子设备的语音控制方法及系统 |
CN103743065A (zh) * | 2014-01-20 | 2014-04-23 | 美的集团股份有限公司 | 空调器的控制方法、控制系统、空调器和终端 |
-
2016
- 2016-07-29 CN CN201610624760.9A patent/CN106228988A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103532916A (zh) * | 2012-07-05 | 2014-01-22 | 百度在线网络技术(北京)有限公司 | 通过语音获取信息的方法、移动终端和语音信息系统 |
CN103276554A (zh) * | 2013-03-29 | 2013-09-04 | 海尔集团公司 | 智能洗衣机语音控制方法 |
CN103730120A (zh) * | 2013-12-27 | 2014-04-16 | 深圳市亚略特生物识别科技有限公司 | 电子设备的语音控制方法及系统 |
CN103743065A (zh) * | 2014-01-20 | 2014-04-23 | 美的集团股份有限公司 | 空调器的控制方法、控制系统、空调器和终端 |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106683673A (zh) * | 2016-12-30 | 2017-05-17 | 智车优行科技(北京)有限公司 | 驾驶模式的调整方法、装置和系统、车辆 |
CN106683673B (zh) * | 2016-12-30 | 2020-11-13 | 智车优行科技(北京)有限公司 | 驾驶模式的调整方法、装置和系统、车辆 |
CN107147618A (zh) * | 2017-04-10 | 2017-09-08 | 北京猎户星空科技有限公司 | 一种用户注册方法、装置及电子设备 |
US11568876B2 (en) | 2017-04-10 | 2023-01-31 | Beijing Orion Star Technology Co., Ltd. | Method and device for user registration, and electronic device |
CN107147618B (zh) * | 2017-04-10 | 2020-05-15 | 易视星空科技无锡有限公司 | 一种用户注册方法、装置及电子设备 |
WO2018188586A1 (zh) * | 2017-04-10 | 2018-10-18 | 北京猎户星空科技有限公司 | 一种用户注册方法、装置及电子设备 |
CN107146616A (zh) * | 2017-06-13 | 2017-09-08 | 广东欧珀移动通信有限公司 | 设备控制方法及相关产品 |
US10909981B2 (en) | 2017-06-13 | 2021-02-02 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Mobile terminal, method of controlling same, and computer-readable storage medium |
CN107146616B (zh) * | 2017-06-13 | 2020-05-08 | Oppo广东移动通信有限公司 | 设备控制方法及相关产品 |
CN107451242A (zh) * | 2017-07-26 | 2017-12-08 | 广东美的制冷设备有限公司 | 数据播放控制方法、系统和计算机可读存储介质 |
CN107483445A (zh) * | 2017-08-23 | 2017-12-15 | 百度在线网络技术(北京)有限公司 | 一种静默声纹识别注册方法、装置、服务器和存储介质 |
CN109487491A (zh) * | 2017-09-13 | 2019-03-19 | 青岛海尔洗衣机有限公司 | 洗衣机显示切换控制方法及洗衣机 |
WO2019080406A1 (zh) * | 2017-10-26 | 2019-05-02 | 深圳创维-Rgb电子有限公司 | 电视机语音交互方法、语音交互控制装置及存储介质 |
CN107885836B (zh) * | 2017-11-09 | 2021-12-07 | 广东小天才科技有限公司 | 一种用于智能终端的应用程序推荐方法及装置 |
CN107885836A (zh) * | 2017-11-09 | 2018-04-06 | 广东小天才科技有限公司 | 一种用于智能终端的应用程序推荐方法及装置 |
CN107945806A (zh) * | 2017-11-10 | 2018-04-20 | 北京小米移动软件有限公司 | 基于声音特征的用户识别方法及装置 |
CN107863108A (zh) * | 2017-11-16 | 2018-03-30 | 百度在线网络技术(北京)有限公司 | 信息输出方法和装置 |
CN108122557A (zh) * | 2017-12-25 | 2018-06-05 | 四川长虹电器股份有限公司 | 基于声纹识别的车载多媒体导航终端 |
CN108320753A (zh) * | 2018-01-22 | 2018-07-24 | 珠海格力电器股份有限公司 | 电器设备的控制方法、装置和系统 |
WO2019141028A1 (zh) * | 2018-01-22 | 2019-07-25 | 珠海格力电器股份有限公司 | 电器设备的控制方法、装置和系统 |
CN108682419A (zh) * | 2018-03-30 | 2018-10-19 | 京东方科技集团股份有限公司 | 语音控制方法及设备、计算机可读存储介质及设备 |
CN110867188A (zh) * | 2018-08-13 | 2020-03-06 | 珠海格力电器股份有限公司 | 内容服务的提供方法、装置、存储介质及电子装置 |
CN109065056A (zh) * | 2018-09-26 | 2018-12-21 | 珠海格力电器股份有限公司 | 一种语音控制空调的方法及装置 |
CN109065056B (zh) * | 2018-09-26 | 2021-05-11 | 珠海格力电器股份有限公司 | 一种语音控制空调的方法及装置 |
CN109145123A (zh) * | 2018-09-30 | 2019-01-04 | 国信优易数据有限公司 | 知识图谱模型的构建方法、智能交互方法、系统及电子设备 |
CN109752021A (zh) * | 2018-12-18 | 2019-05-14 | 维沃移动通信有限公司 | 一种行驶路线规划方法及装置 |
CN110134022A (zh) * | 2019-05-10 | 2019-08-16 | 平安科技(深圳)有限公司 | 智能家居设备的声音控制方法、装置、及电子装置 |
WO2021196610A1 (zh) * | 2020-04-02 | 2021-10-07 | 深圳创维-Rgb电子有限公司 | 一种设备推荐方法、装置、电子设备及可读存储介质 |
CN112201257A (zh) * | 2020-09-29 | 2021-01-08 | 北京百度网讯科技有限公司 | 基于声纹识别的信息推荐方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106228988A (zh) | 一种基于声纹信息的习惯信息匹配方法及装置 | |
JP3678421B2 (ja) | 音声認識装置及び音声認識方法 | |
CN102404278A (zh) | 一种基于声纹识别的点歌系统及其应用方法 | |
CN109036395A (zh) | 个性化的音箱控制方法、系统、智能音箱及存储介质 | |
US11074916B2 (en) | Information processing system, and information processing method | |
CN109545197B (zh) | 语音指令的识别方法、装置和智能终端 | |
CN104575504A (zh) | 采用声纹和语音识别进行个性化电视语音唤醒的方法 | |
CN106847283A (zh) | 智能家电控制方法和装置 | |
CN104008752A (zh) | 语音识别装置及方法、以及半导体集成电路装置 | |
CN104934031B (zh) | 新增口说语汇的语音识别系统与方法 | |
CN111343028A (zh) | 配网控制方法及装置 | |
TWI839834B (zh) | 語音喚醒方法和相關裝置 | |
EP1280137B1 (en) | Method for speaker identification | |
CN113112575B (zh) | 一种口型生成方法、装置、计算机设备及存储介质 | |
CN102473416A (zh) | 音质变换装置及其方法、元音信息制作装置及音质变换系统 | |
CN109215638A (zh) | 一种语音学习方法、装置、语音设备及存储介质 | |
CN111027675B (zh) | 一种多媒体播放设置自动调节方法及系统 | |
WO2017008075A1 (en) | Systems and methods for human speech training | |
CN110853669A (zh) | 音频识别方法、装置及设备 | |
CN111128127A (zh) | 一种语音识别处理方法及装置 | |
CN117198335A (zh) | 一种语音交互方法、装置、计算机设备及智能家居系统 | |
JP2014130227A (ja) | 発声評価装置、発声評価方法、及びプログラム | |
CN114067807A (zh) | 音频数据处理方法、装置及电子设备 | |
US20150380012A1 (en) | Speech rehabilitation assistance apparatus and method for controlling the same | |
CN106971734A (zh) | 一种可根据模型的提取频率训练识别模型的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161214 |