CN111079209A - 智能语音识别的建筑建模方法及系统 - Google Patents
智能语音识别的建筑建模方法及系统 Download PDFInfo
- Publication number
- CN111079209A CN111079209A CN201911270610.2A CN201911270610A CN111079209A CN 111079209 A CN111079209 A CN 111079209A CN 201911270610 A CN201911270610 A CN 201911270610A CN 111079209 A CN111079209 A CN 111079209A
- Authority
- CN
- China
- Prior art keywords
- voice
- operation command
- dimensional
- model
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000004048 modification Effects 0.000 claims description 33
- 238000012986 modification Methods 0.000 claims description 33
- 230000008676 import Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明提供了一种智能语音识别的建筑建模方法及系统,本发明可以将语音识别功能加入建筑绘图建模软件,可以在软件中预设用户语音,将语音内容和预设用户语音中的音频特征对比相似度;将语音内容与对应文件名称的操作命令相匹配。可以减少工作中人工手动重复的简单操作,减少人工描图的重复工作,减少生成模型错误率。
Description
技术领域
本发明涉及一种智能语音识别的建筑建模方法及系统。
背景技术
目前将二维图纸导入建模软件中,需要将二维图纸描绘,加入建筑物标高方式建立三维模型;或者将二维图纸导入模型插件中,直接生成模型,但生成的模型常会出现梁柱识别成面的情况,造成模型生成错误,需要人为检查修改。
发明内容
本发明的目的在于提供一种智能语音识别的建筑建模方法及系统。
为解决上述问题,本发明提供一种智能语音识别的建筑建模方法,包括:
多次获取输入的第一语音,并分别对每次获取的第一语音进行识别以得到对应的第一操作命令,基于各个第一操作命令在文件库中检索文件名称,分别将梁、斜梁、柱、板或墙的图纸的对应半径、角度和长宽高的二维数据图形导入建模软件,以分批形成各个三维模型;
按从左到右、从上到下的方式,分别生成各个分批形成的三维模型对应的数字或字母编号;
获取数字或字母编号的第二语音,对所述第二语音进行识别以得到对应的第二操作命令,基于所述第二操作命令调整各个三维模型的上下左右、旋转或倾斜的位置或复制一个或多个三维模型。
进一步的,在上述方法中,基于所述第二操作命令调整各个三维模型的上下左右、旋转或倾斜的位置或复制一个或多个三维模型之后,还包括:
获取模型材质的第三语音,对所述第三语音进行识别以得到对应的第三操作命令,基于所述第三操作命令对一个或多个三维模型导入对应的模型材质。
进一步的,在上述方法中,基于所述第二操作命令调整各个三维模型的上下左右、旋转或倾斜的位置或复制一个或多个三维模型之后,还包括:
获取模型修改的第四语音,对所述第四语音进行识别以得到对应的第四操作命令,基于所述第四操作命令对一个或多个三维模型进行对应的碰撞修改。
进一步的,在上述方法中,基于所述第四操作命令一个或多个三维模型进行对应的修改之后,还包括:
按三维模型的类型记录记录各个碰撞修改的内容。
进一步的,在上述方法中,所述数字包括1-10,所述字母编号A-Z。
根据本发明的另一面,还一种智能语音识别的建筑建模系统,包括:
三维模型生成模块,用于多次获取输入的第一语音,并分别对每次获取的第一语音进行识别以得到对应的第一操作命令,基于各个第一操作命令在文件库中检索文件名称,分别将梁、斜梁、柱、板或墙的图纸的对应半径、角度和长宽高的二维数据图形导入建模软件,以分批形成各个三维模型;
编号生成模块,用于按从左到右、从上到下的方式,分别生成各个分批形成的三维模型对应的数字或字母编号;
调整模块,用于获取数字或字母编号的第二语音,对所述第二语音进行识别以得到对应的第二操作命令,基于所述第二操作命令调整各个三维模型的上下左右、旋转或倾斜的位置或复制一个或多个三维模型。
进一步的,在上述系统中,还包括:
材质导入模块,用于获取模型材质的第三语音,对所述第三语音进行识别以得到对应的第三操作命令,基于所述第三操作命令对一个或多个三维模型导入对应的模型材质。
进一步的,在上述系统中,还包括:
修改模块,用于获取模型修改的第四语音,对所述第四语音进行识别以得到对应的第四操作命令,基于所述第四操作命令对一个或多个三维模型进行对应的碰撞修改。
进一步的,在上述系统中,还包括:
记录模块,用于按三维模型的类型记录记录各个碰撞修改的内容。
进一步的,在上述系统中,所述数字包括1-10,所述字母编号A-Z。
与现有技术相比,本发明可以将语音识别功能加入建筑绘图建模软件(BIM、3DMax)。本发明可以在软件中预设用户语音,将语音内容和预设用户语音中的音频特征对比相似度;将语音内容与对应文件名称的操作命令相匹配。可以减少工作中人工手动重复的简单操作,减少人工描图的重复工作,减少生成模型错误率。
附图说明
图1是本发明一实施例的智能语音识别的建筑建模方的基本流程图;
图2是本发明一实施例的智能语音识别的建筑建模方的详细流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1和2所示,本发明提供一种智能语音识别的建筑建模方法,包括:
步骤S1,多次获取输入的第一语音,并分别对每次获取的第一语音进行识别以得到对应的第一操作命令,基于各个第一操作命令在文件库中检索文件名称,分别将梁、斜梁、柱、板或墙的图纸的对应半径、角度和长宽高的二维数据图形导入建模软件,以分批形成各个三维模型;
步骤S2,按从左到右、从上到下的方式,分别生成各个分批形成的三维模型对应的数字或字母编号;
步骤S3,获取数字或字母编号的第二语音,对所述第二语音进行识别以得到对应的第二操作命令,基于所述第二操作命令调整各个三维模型的上下左右、旋转或倾斜的位置或复制一个或多个三维模型。
在此,目前将二维图纸导入建模软件中,常会出现梁柱识别成面的情况,所以本发明在导入文件时采用多次语音识别输入方式,在电脑的文件库中检索文件名称,分别将梁、斜梁,柱,板、墙图纸对应半径,角度,长宽高的二维数据图形导入建模软件,分批形成各个三维模型。
然后,将由导入的二维数据图形即二维封闭线框生成的三维模型按从左到右,从上到下的方式形成数字或字母编号,通过编号语音识别输入调整三维模型上下左右,旋转,倾斜等在三维模型中的位置;同时通过语音识别编码的方式复制一个或多个模型。
本发明可以将语音识别功能加入建筑绘图建模软件(BIM、3DMax)。本发明可以在软件中预设用户语音,将语音内容和预设用户语音中的音频特征对比相似度;将语音内容与对应文件名称的操作命令相匹配。可以减少工作中人工手动重复的简单操作,减少人工描图的重复工作,减少生成模型错误率。
本发明的智能语音识别的建筑建模方法一实施例中,步骤S3,基于所述第二操作命令调整各个三维模型的上下左右、旋转或倾斜的位置或复制一个或多个三维模型之后,还包括:
获取模型材质的第三语音,对所述第三语音进行识别以得到对应的第三操作命令,基于所述第三操作命令对一个或多个三维模型导入对应的模型材质。
在此,建模软件需要为三维模型贴材质时,仍然可进行语音识别输入方式,在批量导入同一三维模型后,通过语音识别导入三维模型的模型材质。
本发明的智能语音识别的建筑建模方法一实施例中,步骤S3,基于所述第二操作命令调整各个三维模型的上下左右、旋转或倾斜的位置或复制一个或多个三维模型之后,还包括:
获取模型修改的第四语音,对所述第四语音进行识别以得到对应的第四操作命令,基于所述第四操作命令对一个或多个三维模型进行对应的碰撞修改。
在此,通过语音识别第四操作命令,实现对一个或多个三维模型的便捷碰撞修改。
本发明的智能语音识别的建筑建模方法一实施例中,基于所述第四操作命令一个或多个三维模型进行对应的修改之后,还包括:
按三维模型的类型记录记录各个碰撞修改的内容。
在此,可以查找建模错误问题,记录生成后模型修改原因。按模型修改类型记录导入二维图纸生成三维模型的错误及原因,记录三维模型需要进行碰撞修改的部分。
后续可以基于记录的各个碰撞修改的内容,可以查找建模错误问题,记录三维模型生成后模型修改的原因,减少生成模型错误率,减少工作中手动操作软件,减少描图的重复工作。
本发明的智能语音识别的建筑建模方法一实施例中,所述数字包括1-10,所述字母编号A-Z,从而实现各个三维模型的可靠区分和识别。
在此,可以预设语音内容1:软件名称-打开软件—导入—文件名称;
预设语音内容2:梁、斜梁、柱、板、墙、复制
预设语音内容3:数字1-10;字母:A-Z;
预设语音内容4:上下左右、前后、半径、角度、旋转、长宽高。
从而实现各种操作命令的可靠识别。
在工作中可以随时暂停,语音输入保存—文件命名—确认—关闭软件。
如图1和2所示,本发明提供一种智能语音识别的建筑建模系统,包括:
三维模型生成模块,用于多次获取输入的第一语音,并分别对每次获取的第一语音进行识别以得到对应的第一操作命令,基于各个第一操作命令在文件库中检索文件名称,分别将梁、斜梁、柱、板或墙的图纸的对应半径、角度和长宽高的二维数据图形导入建模软件,以分批形成各个三维模型;
编号生成模块,用于按从左到右、从上到下的方式,分别生成各个分批形成的三维模型对应的数字或字母编号;
调整模块,用于获取数字或字母编号的第二语音,对所述第二语音进行识别以得到对应的第二操作命令,基于所述第二操作命令调整各个三维模型的上下左右、旋转或倾斜的位置或复制一个或多个三维模型。
在此,目前将二维图纸导入建模软件中,常会出现梁柱识别成面的情况,所以本发明在导入文件时采用多次语音识别输入方式,在电脑的文件库中检索文件名称,分别将梁、斜梁,柱,板、墙图纸对应半径,角度,长宽高的二维数据图形导入建模软件,分批形成各个三维模型。
然后,将由导入的二维数据图形即二维封闭线框生成的三维模型按从左到右,从上到下的方式形成数字或字母编号,通过编号语音识别输入调整三维模型上下左右,旋转,倾斜等在三维模型中的位置;同时通过语音识别编码的方式复制一个或多个模型。
本发明可以将语音识别功能加入建筑绘图建模软件(BIM、3DMax)。本发明可以在软件中预设用户语音,将语音内容和预设用户语音中的音频特征对比相似度;将语音内容与对应文件名称的操作命令相匹配。可以减少工作中人工手动重复的简单操作,减少人工描图的重复工作,减少生成模型错误率。
本发明的智能语音识别的建筑建模系统一实施例中,还包括:
材质导入模块,用于获取模型材质的第三语音,对所述第三语音进行识别以得到对应的第三操作命令,基于所述第三操作命令对一个或多个三维模型导入对应的模型材质。
在此,建模软件需要为三维模型贴材质时,仍然可进行语音识别输入方式,在批量导入同一三维模型后,通过语音识别导入三维模型的模型材质。
本发明的智能语音识别的建筑建模系统一实施例中,还包括:
修改模块,用于获取模型修改的第四语音,对所述第四语音进行识别以得到对应的第四操作命令,基于所述第四操作命令对一个或多个三维模型进行对应的碰撞修改。
在此,通过语音识别第四操作命令,实现对一个或多个三维模型的便捷碰撞修改。
本发明的智能语音识别的建筑建模系统一实施例中,还包括:
记录模块,用于按三维模型的类型记录记录各个碰撞修改的内容。
在此,可以查找建模错误问题,记录生成后模型修改原因。按模型修改类型记录导入二维图纸生成三维模型的错误及原因,记录三维模型需要进行碰撞修改的部分。
后续可以基于记录的各个碰撞修改的内容,可以查找建模错误问题,记录三维模型生成后模型修改的原因,减少生成模型错误率,减少工作中手动操作软件,减少描图的重复工作。
本发明的智能语音识别的建筑建模系统一实施例中,所述数字包括1-10,所述字母编号A-Z,从而实现各个三维模型的可靠区分和识别。
在此,可以预设语音内容1:软件名称-打开软件—导入—文件名称;
预设语音内容2:梁、斜梁、柱、板、墙、复制
预设语音内容3:数字1-10;字母:A-Z;
预设语音内容4:上下左右、前后、半径、角度、旋转、长宽高。
从而实现各种操作命令的可靠识别。
在工作中可以随时暂停,语音输入保存—文件命名—确认—关闭软件。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
显然,本领域的技术人员可以对发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。
Claims (10)
1.一种智能语音识别的建筑建模方法,其特征在于,包括:
多次获取输入的第一语音,并分别对每次获取的第一语音进行识别以得到对应的第一操作命令,基于各个第一操作命令在文件库中检索文件名称,分别将梁、斜梁、柱、板或墙的图纸的对应半径、角度和长宽高的二维数据图形导入建模软件,以分批形成各个三维模型;
按从左到右、从上到下的方式,分别生成各个分批形成的三维模型对应的数字或字母编号;
获取数字或字母编号的第二语音,对所述第二语音进行识别以得到对应的第二操作命令,基于所述第二操作命令调整各个三维模型的上下左右、旋转或倾斜的位置或复制一个或多个三维模型。
2.如权利要求1所述的智能语音识别的建筑建模方法,其特征在于,基于所述第二操作命令调整各个三维模型的上下左右、旋转或倾斜的位置或复制一个或多个三维模型之后,还包括:
获取模型材质的第三语音,对所述第三语音进行识别以得到对应的第三操作命令,基于所述第三操作命令对一个或多个三维模型导入对应的模型材质。
3.如权利要求1所述的智能语音识别的建筑建模方法,其特征在于,基于所述第二操作命令调整各个三维模型的上下左右、旋转或倾斜的位置或复制一个或多个三维模型之后,还包括:
获取模型修改的第四语音,对所述第四语音进行识别以得到对应的第四操作命令,基于所述第四操作命令对一个或多个三维模型进行对应的碰撞修改。
4.如权利要求3所述的智能语音识别的建筑建模方法,其特征在于,基于所述第四操作命令一个或多个三维模型进行对应的修改之后,还包括:
按三维模型的类型记录记录各个碰撞修改的内容。
5.如权利要求1所述的智能语音识别的建筑建模方法,其特征在于,所述数字包括1-10,所述字母编号A-Z。
6.一种智能语音识别的建筑建模系统,其特征在于,包括:
三维模型生成模块,用于多次获取输入的第一语音,并分别对每次获取的第一语音进行识别以得到对应的第一操作命令,基于各个第一操作命令在文件库中检索文件名称,分别将梁、斜梁、柱、板或墙的图纸的对应半径、角度和长宽高的二维数据图形导入建模软件,以分批形成各个三维模型;
编号生成模块,用于按从左到右、从上到下的方式,分别生成各个分批形成的三维模型对应的数字或字母编号;
调整模块,用于获取数字或字母编号的第二语音,对所述第二语音进行识别以得到对应的第二操作命令,基于所述第二操作命令调整各个三维模型的上下左右、旋转或倾斜的位置或复制一个或多个三维模型。
7.如权利要求6所述的智能语音识别的建筑建模系统,其特征在于,还包括:
材质导入模块,用于获取模型材质的第三语音,对所述第三语音进行识别以得到对应的第三操作命令,基于所述第三操作命令对一个或多个三维模型导入对应的模型材质。
8.如权利要求6所述的智能语音识别的建筑建模系统,其特征在于,还包括:
修改模块,用于获取模型修改的第四语音,对所述第四语音进行识别以得到对应的第四操作命令,基于所述第四操作命令对一个或多个三维模型进行对应的碰撞修改。
9.如权利要求8所述的智能语音识别的建筑建模系统,其特征在于,还包括:
记录模块,用于按三维模型的类型记录记录各个碰撞修改的内容。
10.如权利要求6所述的智能语音识别的建筑建模系统,其特征在于,所述数字包括1-10,所述字母编号A-Z。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911270610.2A CN111079209B (zh) | 2019-12-12 | 2019-12-12 | 智能语音识别的建筑建模方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911270610.2A CN111079209B (zh) | 2019-12-12 | 2019-12-12 | 智能语音识别的建筑建模方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111079209A true CN111079209A (zh) | 2020-04-28 |
CN111079209B CN111079209B (zh) | 2023-04-11 |
Family
ID=70313939
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911270610.2A Active CN111079209B (zh) | 2019-12-12 | 2019-12-12 | 智能语音识别的建筑建模方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111079209B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130257753A1 (en) * | 2012-04-03 | 2013-10-03 | Anirudh Sharma | Modeling Actions Based on Speech and Touch Inputs |
CN109711099A (zh) * | 2019-01-23 | 2019-05-03 | 河南省交通规划设计研究院股份有限公司 | 一种基于图像识别机器学习的bim自动建模系统 |
CN110162585A (zh) * | 2019-05-22 | 2019-08-23 | 青岛博海数字创意研究院 | 实时成像三维建模历史地理信息系统 |
-
2019
- 2019-12-12 CN CN201911270610.2A patent/CN111079209B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130257753A1 (en) * | 2012-04-03 | 2013-10-03 | Anirudh Sharma | Modeling Actions Based on Speech and Touch Inputs |
CN109711099A (zh) * | 2019-01-23 | 2019-05-03 | 河南省交通规划设计研究院股份有限公司 | 一种基于图像识别机器学习的bim自动建模系统 |
CN110162585A (zh) * | 2019-05-22 | 2019-08-23 | 青岛博海数字创意研究院 | 实时成像三维建模历史地理信息系统 |
Non-Patent Citations (2)
Title |
---|
SRIRAM GANAPATHY等: "3-D CNN Models for Far-Field Multi-Channel Speech Recognition", 《IEEE XPLORE》 * |
曹愉航等: "数字技术在建筑三维虚拟表现中的应用", 《中国科技信息》 * |
Also Published As
Publication number | Publication date |
---|---|
CN111079209B (zh) | 2023-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112149216A (zh) | 基于矢量数据的规则单体建筑bim自动建模系统及方法 | |
TW202022633A (zh) | 基於特徵擷取與機器學習的優化方法及其模組 | |
JP2011198268A (ja) | 情報処理装置および方法、並びにプログラム | |
CN112163262B (zh) | 基于bim技术的轻钢龙骨设计方法、装置及存储介质 | |
CN113110995A (zh) | 系统迁移的测试方法及装置 | |
CN111105016A (zh) | 一种数据处理方法、装置、电子设备及可读存储介质 | |
CN111079209B (zh) | 智能语音识别的建筑建模方法及系统 | |
US20080126307A1 (en) | Method for recognizing feature of 3D solid model | |
CN104199545A (zh) | 一种基于口型执行预设操作的方法及装置 | |
JPH10198718A (ja) | ソリッドモデル自動生成装置およびその方法 | |
WO2020119670A1 (zh) | 一种视频转码方法及装置 | |
CN112446408A (zh) | 基于装置上训练的识别用户的方法和设备 | |
CN106599637A (zh) | 一种在验证界面输入验证码的方法和装置 | |
CN114942718B (zh) | 虚拟按键的设置方法、装置、介质以及电子设备 | |
CN115510550A (zh) | 基于Revit的异形线性构造自动识别及定位出图方法 | |
Morante et al. | Automatic demonstration and feature selection for robot learning | |
CN114218428A (zh) | 音频数据聚类方法、装置、设备及存储介质 | |
CN108717444A (zh) | 一种基于分布式结构的大数据聚类方法和装置 | |
CN114139142A (zh) | 一种服务器密码修改方法、装置、电子设备及存储介质 | |
JP4624902B2 (ja) | Ncパス生成方法及び装置 | |
US11328502B2 (en) | Visualized time sequence pattern matching method for data visualization analysis based on Hough transformation | |
CN113971459A (zh) | 分类网络模型的训练方法、装置以及电子设备 | |
US11094320B1 (en) | Dialog visualization | |
CN113792362B (zh) | 一种机械设计方案分步推荐方法 | |
CN117633945B (zh) | 基于catia的微波组件结构快速设计方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |