CN114863928A - 智能家居语音控制方法、系统、电子设备及存储介质 - Google Patents
智能家居语音控制方法、系统、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114863928A CN114863928A CN202210791287.9A CN202210791287A CN114863928A CN 114863928 A CN114863928 A CN 114863928A CN 202210791287 A CN202210791287 A CN 202210791287A CN 114863928 A CN114863928 A CN 114863928A
- Authority
- CN
- China
- Prior art keywords
- voice
- preset
- voice instruction
- instruction
- word segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000011218 segmentation Effects 0.000 claims abstract description 61
- 238000012545 processing Methods 0.000 claims abstract description 28
- 238000004458 analytical method Methods 0.000 claims abstract description 18
- 238000001914 filtration Methods 0.000 claims abstract description 16
- 238000004590 computer program Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 230000006399 behavior Effects 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000013075 data extraction Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000004378 air conditioning Methods 0.000 description 4
- 230000009193 crawling Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 206010063385 Intellectualisation Diseases 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007791 dehumidification Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000005485 electric heating Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/325—Hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Machine Translation (AREA)
Abstract
本发明提供了一种智能家居语音控制方法、系统、电子设备及存储介质;所述方法包括:基于用户的语音指令获取语音数据流,将所述语音数据流进行识别并转换成语音指令文本;针对所述语音指令文本进行分词处理,并抽取关键词,基于所述关键词进行同义词过滤处理,获取所述语音指令对应的规范表达式;根据预设知识图谱及预设使用习惯数据库对所述规范表达式进行意图分析,生成所述语音指令的真实意图;基于所述真实意图,将所述语音指令转化成智能家居设备的控制指令。本申请最大限度地精准匹配用户实际意图,从而提高智能家居语音控制的易用性,有效解决智能家居语音控制中有关泛指指令和模式指令的意图无法精准匹配的问题。
Description
技术领域
本发明属于智能家居控制的技术领域,具体地涉及一种智能家居语音控制方法、系统、电子设备及存储介质。
背景技术
随着智能终端的计算能力、互联网通信速率的发展,以及语音识别、语义理解技术的突破,很多智能设备的交互可以通过语音的方式进行控制。在嵌入式芯片领域,芯片的处理能力不断提高,而成本不断下降,这使得在嵌入式系统中进行部分智能语音的处理成为可能,这有力推动了智能语音技术在移动设备中的应用。嵌入式设备中应用智能语音的主要场景就是智能家居的场景,通过语音实现对家庭中的设备进行控制,从而提升用户在家庭中的设备使用体验,解放双手使用遥控器或按键。随着嵌入式技术与互联网的日渐成熟,以智能语音控制为基础的智能家居系统也快速发展起来,并且越来越多地走进普通家庭。
目前市场上的智能家居产品能够正确匹配的语音指令多为精准指令,对于泛指指令和模式指令的意图匹配的精准性、易用性的用户满意度较低,无法达到真正的智能化。
因此,如何解决智能家居语音控制中有关泛指指令和模式指令的意图无法精准匹配的问题,已成为一个亟待解决的课题。
发明内容
为了解决上述技术问题,本发明提供了一种智能家居语音控制方法、系统、电子设备及存储介质,采用在设备端进行中文分词后,针对智能家居环境近似意图词的过滤,并使用智能家居领域知识图谱查询结合用户特有使用习惯数据查询,最大限度地精准匹配用户实际意图,从而提高智能家居语音控制的易用性;有效解决智能家居语音控制中有关泛指指令和模式指令的意图无法精准匹配的问题。
第一方面,本申请提供一种智能家居语音控制方法,包括:
基于用户的语音指令获取语音数据流,将所述语音数据流进行识别并转换成语音指令文本;
针对所述语音指令文本进行分词处理,并抽取关键词,基于所述关键词进行同义词过滤处理,获取所述语音指令对应的规范表达式;
根据预设知识图谱及预设使用习惯数据库对所述规范表达式进行意图分析,生成所述语音指令的真实意图;
基于所述真实意图,将所述语音指令转化成智能家居设备的控制指令。
较佳地,所述分词处理采用字符匹配分词方法中的优化正向最大匹配算法,所述优化正向最大匹配算法包括:对所述语音指令文本中选取的最大字段逐字与预设分词词典进行匹配,若所述预设分词词典中存在所述最大字段,则将所述最大字段标注切分;如果所述预设分词词典中不存在所述最大字段,将所述最大字段做为前缀与下一个字组成新词,继续与所述预设分词词典进行匹配,直到可以在所述预设分词词典中匹配词条进行标注切分后,继续选取所述语音指令文本中剩余部分的最大字段。
较佳地,所述预设分词词典的存储结构釆用哈希表的开散列法,将同一首字下相同长度的词语以序列表的形式存储。
较佳地,所述同义词过滤处理包括:针对分词结果中的词调用预设函数,以査询其对应的关键词;若关键词对应的同义词大于一个,则根据相似率大小返回获取预设相似率的同义词;若无法匹配到同义词,则调用所述预设函数的Add方法计算相似率并添加同义词对应关系。
较佳地,所述规范表达式的格式釆用JSON格式进行表达。
较佳地,所述根据预设知识图谱及预设使用习惯数据库对所述规范表达式进行意图分析,生成所述语音指令的真实意图的步骤具体包括:
调用预设知识图谱对所述关键词进行查询,获得所述关键词对应的关联项和所属属性;
调用预设使用习惯数据库,获得所述所属属性对应的常用数据值;其中,所述预设使用习惯数据库通过记录的用户使用行为数据,根据权重策略选取所述所属属性对应的常用数据值;
根据所述关联项和所述常用数据值,生成所述语音指令的真实意图。
较佳地,所述预设知识图谱的构建由网页抓取、抽取数据并结构化、数据清洗和知识抽取的步骤构成。
第二方面,本申请提供一种智能家居语音控制系统,包括:
语音转文本模块,用于基于用户的语音指令获取语音数据流,将所述语音数据流进行识别并转换成语音指令文本;
中文分词模块,用于针对所述语音指令文本进行分词处理,并抽取关键词,基于所述关键词进行同义词过滤处理,获取所述语音指令对应的规范表达式;
意图分析模块,用于根据预设知识图谱及预设使用习惯数据库对所述规范表达式进行意图分析,生成所述语音指令的真实意图;
设备控制模块,用于基于所述真实意图,将所述语音指令转化成智能家居设备的控制指令。
较佳地,所述意图分析模块包括:
第一调用单元,用于调用预设知识图谱对所述关键词进行查询,获得所述关键词对应的关联项和所属属性。
第二调用单元,用于调用预设使用习惯数据库,获得所述所属属性对应的常用数据值;其中,所述预设使用习惯数据库通过记录的用户使用行为数据,根据权重策略选取所述所属属性对应的常用数据值;
生成单元,用于根据所述关联项和所述常用数据值,生成所述语音指令的真实意图。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的智能家居语音控制方法。
第四方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的智能家居语音控制方法。
相比于现有技术,本申请提供的一种智能家居语音控制方法、系统、电子设备及存储介质,通过语音转文本模块、中文分词模块、意图分析模块、设备控制模块的各模块协同作用,首先,当用户发起一个语音指令,通过调用语音转文本模块将语音数据解析后得到语音指令文本;其次,调用中文分词模块对语音指令文本结果进行分词处理,抽取的关键词,并对关键词进行同义词过滤处理,得到规范的表达式;再次,调用意图分析模块对规范表达式进行意图分析,获取用户语音指令的最佳匹配意图;最后,调用设备控制模块发出家居设备控制指令。本申请采用在设备端进行中文分词后,针对智能家居环境近似意图词的过滤,并使用智能家居领域知识图谱查询结合用户特有使用习惯数据查询,最大限度地精准匹配用户实际意图,从而提高智能家居语音控制的易用性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1提供的智能家居语音控制方法的流程图;
图2为本发明实施例1提供的预设分词词典的同一首字下不同长度词语存储结构的结构图;
图3为本发明实施例1提供的智能家居语音控制方法步骤S103的具体流程图;
图4是本发明实施例2提供的与实施例1方法对应的智能家居语音控制结构框图;
图5是本发明实施例3提供的电子设备的硬件结构示意图。
附图标记说明:
11-语音转文本模块、12-中文分词模块、13-意图分析模块、131-第一调用单元、132-第二调用单元、133-生成单元、14-设备控制模块;
20-总线、21-处理器、22-存储器、23-通信接口。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明的实施例,而不能理解为对本发明的限制。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
在现实的智能家居环境下,通过智能语音助手发出控制指令,常常的反馈是“我没有听懂你说了什么”,需要不断的调整说话的方式和语序,不断的提高控制指令的准确意图,才能达成控制的目标。本申请针对智能家居场景,收集了智能家居场景下产生的常用1000条有明确意图的语料进行分析,经过统计发现,其中80%为泛指指令和模式指令,20%为精准指令。这些控制指令可以按照以下分类:1.精准控制指令,例如:空调调到25度;2.泛指控制指令,例如:屋里有点儿冷;3.模式控制指令,例如:我回来了。目前市场上的智能家居产品能够正确匹配的语音指令多为精准指令,对于泛指指令和模式指令的意图匹配的精准性、易用性的用户满意度较低,无法达到真正的智能化。通过以上数据统计分析可以看出,有效的提升泛指指令和模式指令的意图匹配准确性,将在一定程度上提升智能家居的用户体验;本申请正是基于此提出来的。
实施例1
本实施例提供了一种智能家居语音控制方法。图1是根据本申请实施例的智能家居语音控制方法的流程图,如图1所示,该流程包括如下步骤:
S101,基于用户的语音指令获取语音数据流,将所述语音数据流进行识别并转换成语音指令文本。
其中,本实施例的将语音信号转化为文本采用语音识别技术,通过机器对语音信号的识别和理解,将人类的语音中的内容转换为可以在计算机中存储操作的信息,例如字符序列的二进制编码。
具体地,本实施例选择百度语音识别方案,本实施例选择Python语言进行开发,使用百度语音识别Python封装的SDK;通过使用百度语音识别方案提供的SDK调用方案,实现将语音信号转化为文本。
S102,针对所述语音指令文本进行分词处理,并抽取关键词,基于所述关键词进行同义词过滤处理,获取所述语音指令对应的规范表达式。
其中,分词处理采用基于字符匹配的分词算法。本实施例中,为了解决字符匹配分词算法本身的歧义和匹配准确性差的问题,基于现有正向最大匹配法做了优化处理。具体地,现有正向最大匹配法是指:依据字典中最长词条字符数为准,假设字符数为n,则将待分词文本按照从左到右的顺序取n个字符,与词典进行匹配:如果存在将该词条切分,未切分部分继续取n个字符进行匹配,直到文本切分结束;如果不存在该词条,则去掉词条中最后一个字符继续进行匹配。从现有正向最大匹配法的算法可以看出,对词条的每次切分完全依赖词典,因此对于未登录词典的新词不能很好的识别。使用正向最大匹配算法针对智能家居常用语音控制指令中,切词不准确的案例进行分析发现,较多案例是因为交集型歧义。交集型歧义是指:待切分词ABC,AB∈分词字典,BC∈分词字典,此时称ABC为交集型歧义字段。诸如:“打开灯”、“打开”存在于分词字典中,同时“开灯”也存在与分词字典中,因此“打开灯”为交集型歧义字段。基于此,所述分词处理采用优化正向最大匹配算法,所述优化正向最大匹配算法包括:对所述语音指令文本中选取的最大字段逐字与预设分词词典进行匹配,若所述预设分词词典中存在所述最大字段,则将所述最大字段标注切分;如果所述预设分词词典中不存在所述最大字段,将所述最大字段做为前缀与下一个字组成新词,继续与所述预设分词词典进行匹配,直到可以在所述预设分词词典中匹配词条进行标注切分后,继续选取所述语音指令文本中剩余部分的最大字段。诸如:待处理的语音指令文本N=N1N2N3N4…Nn(Ni∈汉字字符集,0≤i≤n),使用优化后算 法过程如下:
1.取第一个字符N1与预设分词词典进行比较。
2.如果存在,标注切分出N1,一次切分结束。
3.如果不存在,取出第二个文本N2,与N1组成新词N1N2与预设分词词典继续匹配。
4.如果词典中不存在以N1N2为前缀的词条,将N1标注切分。
5.如果词典中存在,査找预设分词词典中以N1N2为前缀的词条数。
6.如果前缀为N1N2的词条数等于0,则一次分词结束。
7.如果前缀为N1N2的词条数大于0,从字符串N中取下一个字符叫组成新的前缀重复以上步骤。
需要说明的是,为了提高中文分词效率,本实施例选择的预设分词词典是基于jieba通用词典,通过中国汉字编码体系和中文分词特点,构建的新词典机制。如图2所示,预设分词词典采用了哈希表的开散列法,将同一首字下相同长度的词语以有序列表的形式存储在一起,从而方便在词典中快速查找词。预设分词词典优化后的存储结构与现有的基于tire树的存储方式相比,很大程度地缩减了存储空间,同时利用区位码可以快速确定出唯一首字,以及通过首字和长度缩减了字符匹配范围,可以更快速准确地确定唯一首字。
进一步地,由于使用计算机来理解中文,中文的各种特性决定了难度;其中,同义词就是难题之一,处理好同义词问题,将会简化后续意图理解的时候的复杂度。本实施例中,所述同义词过滤处理包括:针对所述分词结果中的词调用预设函数,以査询其对应的关键词;若关键词对应的同义词大于一个,则根据相似率大小返回获取预设相似率的同义词;若无法匹配到同义词,则调用所述预设函数的Add方法计算相似率并添加同义词对应关系,优选地,预设函数为KeyWordDict接口函数。
针对智能家居场景,设计的同义词数据库设计如表1所示。
表1
综上步骤S102所述,现以步骤S101获得的语音指令文本“屋里有点儿冷”举例说明规范表达式生成过程:首先,进行中文分词得到“屋里/有点儿/冷”;其次,进行关键词提取得到关键词“屋里、冷”;再次,查询关键词的同义词得到“房间、冷”;最后,处理完成的格式釆用JSON格式进行表达,表达结果如下:
{
“location”: “房间”,
“desc”:“冷”,
}。
S103,根据预设知识图谱及预设使用习惯数据库对所述规范表达式进行意图分析,生成所述语音指令的真实意图。
其中,由于智能家居的知识图谱,目前公开的数据都没有涉及,因此需要针对智能家居设备建立知识图谱。知识图谱里,通常用“实体”来表达图里的节点、用“关系”来表达图里的“边”;实体指的是现实世界中的事物比如人、地名、概念、药物、公司等,关系则用来表达不同实体之间的某种联系。针对智能家居环境的知识图谱涉及实体类型数据表、实体关系类型、属性类型;其中,实体类型数据表在智能家居系统中主要分为房间和设备两类实体,具体如表2所示;实体关系类型在智能家居系统中主要是智能设备和房间的拥有关系,具体如表3所示;属性类型表示每个设备具有的属性类型,具体如表4所示。
表2
表3
表4
具体地,本申请的预设知识图谱的构建由网页抓取、抽取数据并结构化、数据清洗和知识抽取的步骤构成。具体如下:
1.网页抓取
由于网络上没有结构化的智能家电设备的数据,因此需要通过爬取网页获取数据,通过对比网页的规则性,发现苏宁的家电设备的网页结构化数据很好,因此选择了苏宁网站作为数据爬取的来源。
(1)获取空调数据的接口为:https://search.suning.com/空调/
(2)获取电视数据的接口为:https://search.suning.com/电视/
以抓取空调数据为例,首先通过以下python代码获取一级页面,抓取每一款产品的url入口。
html=self.get_html(“https://search.suning.com/空调/”),
selector=etree.HTML(html),
nexturl=selector.xpath(“//th. suning.com/”),
然后抓取产品的详情页,通过如下python代码抓取产品详情页。
html=self.get_html(nexturl),
selector=etree.HTML(html),
nexturl= selector.xpath('//div[@class=“head-txt”]')。
2.抽取数据并结构化
针对获取的空调产品详情页,爬取相应的产品参数,使用家用电器属性词典,过滤产品参数,获取的参数如下:
(1)型号:KFR-72LW/BpR3TA01+2;
(2)品牌:奥克斯;
(3)冷暖类型:冷暖;
(4)自动清洁:支持;
(5)独立除湿:支持;
(6)Wifi连接:支持;
(9)扫风方式:上下/左右。
通过以上步骤,共解析3250条空调产品和2000条电视的数据,形成初步数据集合。
3.数据清洗
针对以上数据,使用常用家用电器控制字词典,对数据进一步处理成结构化数据,数据格式使用JS0N格式,形成如下数据例子形式:
{
“brand”:“奥克斯”,
“model”:“KFR-72LW/BpR3TA01+2”,
“connection”:“wifi”,
“temperature”:“code/warm”,
“moisture”:“yes”,
}。
4.知识抽取
将生成的每一条产品的数据整合到一个JSON文件中,形成智能家居设备知识的数据集,后续做意图识别的时候,将使用这些数据导入neo4j的图数据库中,用于意图的匹配和处理。
如图3所示,步骤S103的具体步骤包括:
S1031,调用预设知识图谱对所述关键词进行查询,获得所述关键词对应的关联项和所属属性;
S1032,调用预设使用习惯数据库,获得所述所属属性对应的常用数据值;其中,所述预设使用习惯数据库通过记录的用户使用行为数据,根据权重策略选取所述所属属性对应的常用数据值;
S1033,根据所述关联项和所述常用数据值,生成所述语音指令的真实意图。
具体地,预设知识图谱的查询和预设使用习惯数据库的査询是正确匹配用户意图的关键。通过意图匹配类图设计说明重点部分的设计,各个类的说明如下:
1.HomeDeviceGraph类是使用生成的JSON文件导入neo4j图数据库中,形成可用于意图匹配的知识图谱,可能实现匹配意图,基于智能家居设备的推理功能。
2.userProfile类是记录用户的使用习惯,从知识图谱中查询的结果,结合获取的用户使用习惯,可以更加精准的匹配用户的真实控制需求。
3.IntensionAnalysis类是处理输入并形成意图,输出设备控制需求到设备控制模块。
综上步骤S103所述,现以步骤S102获得的规范表达式{“location”:“房间”,“desc”,“冷”},举例说明所述语音指令的真实意图生成过程:
(1)预设知识图谱査询“房间”,得到与其关联项。该用户房间中已建立连接的智能家居设备有空调、空气净化器、电暖气、灯等设备。
(2)调用预设知识图谱查询“冷”,已有智能设备中空调和电暖气都具有温度控制属性,因此进入下一步进行预设使用习惯数据库査询。
(3)査询当前空调状态为关,因此得到用户意图为“房间,空调,制暖”。
(4)査询预设使用习惯数据库,用户习惯温度为24度,整理用户意图为“打开房间空调,并设置为24度”。
S104,基于所述真实意图,将所述语音指令转化成智能家居设备的控制指令。
具体地,目前国内外控制智能家居设备的协议没有统一,而主流的智能家居设备厂家的产品,控制协议各自为战。因此本申请中涉及的设备控制采用自定义协议,模拟设备的控制过程。具体地,设计类图包含一个类,即HomeDeviceControl类。HomeDeviceControl类主要针对家庭中己经添加的设备形成设备的列表,对这些设备进行管理,在发送控制命令的时候,会对设备的属性和状态进行检査,确保设备控制能够准确的发送。
发送控制的指令采用JSON格式,格式例子如下:
{
“location”:“卧室”,
“device”:“空调”,
“action”:“制冷模式”,
}。
综上所述,当用户发起一个语音指令,将语音数据解析后得到语音指令文本;其次,对语音指令文本结果进行分词处理,抽取的关键词,并对关键词进行同义词过滤处理,得到规范的表达式;再次,对规范表达式进行意图分析,获取用户语音指令的最佳匹配意图;最后,发出家居设备控制指令。本实施例采用在设备端进行中文分词后,针对智能家居环境近似意图词的过滤,并使用智能家居领域知识图谱查询结合用户特有使用习惯数据查询,最大限度地精准匹配用户实际意图,从而提高智能家居语音控制的易用性。
实施例2
本实施例提供了与实施例1所述方法相对应的系统的结构框图。图4是根据本申请实施例的智能家居语音控制系统的结构框图,如图4所示,该系统包括:
语音转文本模块11,用于基于用户的语音指令获取语音数据流,将所述语音数据流进行识别并转换成语音指令文本;
中文分词模块12,用于针对所述语音指令文本进行分词处理,并抽取关键词,基于所述关键词进行同义词过滤处理,获取所述语音指令对应的规范表达式;
意图分析模块13,用于根据预设知识图谱及预设使用习惯数据库对所述规范表达式进行意图分析,生成所述语音指令的真实意图;
设备控制模块14,用于基于所述真实意图,将所述语音指令转化成智能家居设备的控制指令。
进一步地,所述意图分析模块13包括:
第一调用单元131,用于调用预设知识图谱对所述关键词进行查询,获得所述关键词对应的关联项和所属属性。
第二调用单元132,用于调用预设使用习惯数据库,获得所述所属属性对应的常用数据值;其中,所述预设使用习惯数据库通过记录的用户使用行为数据,根据权重策略选取所述所属属性对应的常用数据值;
生成单元133,用于根据所述关联项和所述常用数据值,生成所述语音指令的真实意图。
实施例3
结合图1所描述的本发明的智能家居语音控制方法可以由电子设备来实现。图5为根据本申请实施例的电子设备的硬件结构示意图。
电子设备可以包括处理器21以及存储有计算机程序指令的存储器22。
具体地,上述处理器21可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器22可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器22可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(SolidState Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(Universal SerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器22可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器22可在数据处理装置的内部或外部。在特定实施例中,存储器22是非易失性(Non-Volatile)存储器。在特定实施例中,存储器22包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(RandomAccess Memory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory,简称为PROM)、可擦除PROM(Erasable ProgrammableRead-Only Memory,简称为EPROM)、电可擦除PROM(Electrically Erasable ProgrammableRead-Only Memory,简称为EEPROM)、电可改写ROM(Electrically Alterable Read-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-Access Memory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode Dynamic Random Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(Extended Date Out Dynamic RandomAccess Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。
存储器22可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器21所执行的可能的计算机程序指令。
处理器21通过读取并执行存储器22中存储的计算机程序指令,以实现上述实施例1的智能家居语音控制方法。
在其中一些实施例中,电子设备还可包括通信接口23和总线20。其中,如图5所示,处理器21、存储器22、通信接口23通过总线20连接并完成相互间的通信。
通信接口23用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。通信接口23还可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。
总线20包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。总线20包括但不限于以下至少之一:数据总线(Data Bus)、地址总线(Address Bus)、控制总线(ControlBus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制,总线20可包括图形加速接口(Accelerated Graphics Port,简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,简称为EISA)总线、前端总线(FrontSide Bus,简称为FSB)、超传输(Hyper Transport,简称为HT)互连、工业标准架构(Industry Standard Architecture,简称为ISA)总线、无线带宽(InfiniBand)互连、低引脚数(Lo瓦 Pin Count,简称为LPC)总线、存储器总线、微信道架构(Micro ChannelArchitecture,简称为MCA)总线、外围组件互连(Peripheral Component Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial AdvancedTechnology Attachment,简称为SATA)总线、视频电子标准协会局部(Video ElectronicsStandards Association Local Bus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线20可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该电子设备可以基于获取到智能家居语音控制系统,执行本申请实施例1的智能家居语音控制方法。
另外,结合上述实施例1中的智能家居语音控制方法,本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例1的智能家居语音控制方法。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体与详细,但并不能因此而理解为对本发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形与改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。
Claims (10)
1.一种智能家居语音控制方法,其特征在于,包括:
基于用户的语音指令获取语音数据流,将所述语音数据流进行识别并转换成语音指令文本;
针对所述语音指令文本进行分词处理,并抽取关键词,基于所述关键词进行同义词过滤处理,获取所述语音指令对应的规范表达式;
根据预设知识图谱及预设使用习惯数据库对所述规范表达式进行意图分析,生成所述语音指令的真实意图;
基于所述真实意图,将所述语音指令转化成智能家居设备的控制指令。
2.根据权利要求1所述的智能家居语音控制方法,其特征在于,所述分词处理采用字符匹配分词方法中的优化正向最大匹配算法,所述优化正向最大匹配算法包括:对所述语音指令文本中选取的最大字段逐字与预设分词词典进行匹配,若所述预设分词词典中存在所述最大字段,则将所述最大字段标注切分;如果所述预设分词词典中不存在所述最大字段,将所述最大字段做为前缀与下一个字组成新词,继续与所述预设分词词典进行匹配,直到可以在所述预设分词词典中匹配词条进行标注切分后,继续选取所述语音指令文本中剩余部分的最大字段。
3.根据权利要求2所述的智能家居语音控制方法,其特征在于,所述预设分词词典的存储结构釆用哈希表的开散列法,将同一首字下相同长度的词语以序列表的形式存储。
4.根据权利要求1所述的智能家居语音控制方法,其特征在于,所述同义词过滤处理包括:针对分词结果中的词调用预设函数,以査询其对应的关键词;若关键词对应的同义词大于一个,则根据相似率大小返回获取预设相似率的同义词;若无法匹配到同义词,则调用所述预设函数的Add方法计算相似率并添加同义词对应关系。
5.根据权利要求1所述的智能家居语音控制方法,其特征在于,所述规范表达式的格式釆用JSON格式进行表达。
6.根据权利要求1所述的智能家居语音控制方法,其特征在于,所述根据预设知识图谱及预设使用习惯数据库对所述规范表达式进行意图分析,生成所述语音指令的真实意图的步骤具体包括:
调用预设知识图谱对所述关键词进行查询,获得所述关键词对应的关联项和所属属性;
调用预设使用习惯数据库,获得所述所属属性对应的常用数据值;其中,所述预设使用习惯数据库通过记录的用户使用行为数据,根据权重策略选取所述所属属性对应的常用数据值;
根据所述关联项和所述常用数据值,生成所述语音指令的真实意图。
7.根据权利要求1所述的智能家居语音控制方法,其特征在于,所述预设知识图谱的构建由网页抓取、抽取数据并结构化、数据清洗和知识抽取的步骤构成。
8.一种智能家居语音控制系统,其特征在于,包括:
语音转文本模块,用于基于用户的语音指令获取语音数据流,将所述语音数据流进行识别并转换成语音指令文本;
中文分词模块,用于针对所述语音指令文本进行分词处理,并抽取关键词,基于所述关键词进行同义词过滤处理,获取所述语音指令对应的规范表达式;
意图分析模块,用于根据预设知识图谱及预设使用习惯数据库对所述规范表达式进行意图分析,生成所述语音指令的真实意图;
设备控制模块,用于基于所述真实意图,将所述语音指令转化成智能家居设备的控制指令。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的智能家居语音控制方法。
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至7中任一项所述的智能家居语音控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210791287.9A CN114863928A (zh) | 2022-07-07 | 2022-07-07 | 智能家居语音控制方法、系统、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210791287.9A CN114863928A (zh) | 2022-07-07 | 2022-07-07 | 智能家居语音控制方法、系统、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114863928A true CN114863928A (zh) | 2022-08-05 |
Family
ID=82626314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210791287.9A Pending CN114863928A (zh) | 2022-07-07 | 2022-07-07 | 智能家居语音控制方法、系统、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114863928A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115421396A (zh) * | 2022-09-29 | 2022-12-02 | 深圳康佳电子科技有限公司 | 一种智能家居设备控制方法和装置、电子设备 |
CN116880738A (zh) * | 2023-06-08 | 2023-10-13 | 广州光点信息科技股份有限公司 | 一种基于语音数据的三维地图操控方法及装置 |
CN117077252A (zh) * | 2023-07-25 | 2023-11-17 | 南昌华飞物联技术有限公司 | 一种智能家居现场勘查及方案设计系统与方法 |
CN117518857A (zh) * | 2023-12-31 | 2024-02-06 | 深圳酷宅科技有限公司 | 应用nlp的个性化智能家居控制策略生成方法及系统 |
WO2024036694A1 (zh) * | 2022-08-18 | 2024-02-22 | 青岛海尔科技有限公司 | 控制指令的发送方法、控制装置、存储介质及电子装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114582318A (zh) * | 2021-12-31 | 2022-06-03 | 广州视声智能科技股份有限公司 | 一种基于语音识别的智能家居控制方法及系统 |
CN114582340A (zh) * | 2022-02-08 | 2022-06-03 | 北京麦颂文化传播有限公司 | 包房语音控制方法、装置、设备和计算机可读存储介质 |
-
2022
- 2022-07-07 CN CN202210791287.9A patent/CN114863928A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114582318A (zh) * | 2021-12-31 | 2022-06-03 | 广州视声智能科技股份有限公司 | 一种基于语音识别的智能家居控制方法及系统 |
CN114582340A (zh) * | 2022-02-08 | 2022-06-03 | 北京麦颂文化传播有限公司 | 包房语音控制方法、装置、设备和计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
张瑾: "智能家居语音控制的研究与实现", 《中国优秀硕士学位论文全文数据库 工程科技II辑》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024036694A1 (zh) * | 2022-08-18 | 2024-02-22 | 青岛海尔科技有限公司 | 控制指令的发送方法、控制装置、存储介质及电子装置 |
CN115421396A (zh) * | 2022-09-29 | 2022-12-02 | 深圳康佳电子科技有限公司 | 一种智能家居设备控制方法和装置、电子设备 |
CN116880738A (zh) * | 2023-06-08 | 2023-10-13 | 广州光点信息科技股份有限公司 | 一种基于语音数据的三维地图操控方法及装置 |
CN117077252A (zh) * | 2023-07-25 | 2023-11-17 | 南昌华飞物联技术有限公司 | 一种智能家居现场勘查及方案设计系统与方法 |
CN117077252B (zh) * | 2023-07-25 | 2024-05-28 | 南昌华飞物联技术有限公司 | 一种智能家居现场勘查及方案设计系统与方法 |
CN117518857A (zh) * | 2023-12-31 | 2024-02-06 | 深圳酷宅科技有限公司 | 应用nlp的个性化智能家居控制策略生成方法及系统 |
CN117518857B (zh) * | 2023-12-31 | 2024-04-09 | 深圳酷宅科技有限公司 | 应用nlp的个性化智能家居控制策略生成方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114863928A (zh) | 智能家居语音控制方法、系统、电子设备及存储介质 | |
US11164568B2 (en) | Speech recognition method and apparatus, and storage medium | |
CN110019658B (zh) | 检索项的生成方法及相关装置 | |
CN109033075B (zh) | 意图匹配的方法、装置、存储介质和终端设备 | |
WO2015096477A1 (zh) | 信息回复方法及装置 | |
KR102144534B1 (ko) | 검색 캐시 업데이트 방법 및 장치 | |
US10713302B2 (en) | Search processing method and device | |
WO2016015431A1 (zh) | 搜索方法、装置、设备及非易失性计算机存储介质 | |
JP2021501402A (ja) | 意味的豊富度に基づいた文書のランキング | |
CN112818181B (zh) | 图数据库检索方法、系统、计算机设备和存储介质 | |
WO2015127747A1 (zh) | 一种添加多媒体文件的方法和设备 | |
CN103226601B (zh) | 一种图片搜索的方法和装置 | |
CN114582340A (zh) | 包房语音控制方法、装置、设备和计算机可读存储介质 | |
CN108763202A (zh) | 识别敏感文本的方法、装置、设备及可读存储介质 | |
CN111859079B (zh) | 信息搜索方法、装置、计算机设备及存储介质 | |
CN112446405A (zh) | 一种家电客服的用户意图引导方法及智能家电 | |
CN114139040A (zh) | 一种数据存储及查询方法、装置、设备及可读存储介质 | |
CN109472032A (zh) | 一种实体关系图的确定方法、装置、服务器及存储介质 | |
CN112241493A (zh) | 商品检索方法、装置、计算机设备和存储介质 | |
CN109918661B (zh) | 同义词获取方法及装置 | |
CN104239292A (zh) | 一种获取专业词汇译文的方法 | |
WO2016101737A1 (zh) | 搜索查询方法和装置 | |
KR20180101955A (ko) | 문헌 스코어링 방법 및 문헌 검색 시스템 | |
US11314794B2 (en) | System and method for adaptively adjusting related search words | |
CN113722540A (zh) | 基于视频字幕的知识图谱构建方法、装置及计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220805 |