CN116109911A - 一种三维场景审核方法、装置及计算机存储介质 - Google Patents
一种三维场景审核方法、装置及计算机存储介质 Download PDFInfo
- Publication number
- CN116109911A CN116109911A CN202211382370.7A CN202211382370A CN116109911A CN 116109911 A CN116109911 A CN 116109911A CN 202211382370 A CN202211382370 A CN 202211382370A CN 116109911 A CN116109911 A CN 116109911A
- Authority
- CN
- China
- Prior art keywords
- image
- scene
- dimensional scene
- violation
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 184
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 230000002452 interceptive effect Effects 0.000 claims abstract description 51
- 230000000007 visual effect Effects 0.000 claims abstract description 40
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 39
- 238000012552 review Methods 0.000 claims description 49
- 238000001514 detection method Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 abstract description 58
- 230000008859 change Effects 0.000 description 53
- 238000012545 processing Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 9
- 238000012795 verification Methods 0.000 description 9
- 238000012550 audit Methods 0.000 description 8
- 230000006399 behavior Effects 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 238000013507 mapping Methods 0.000 description 6
- 239000002699 waste material Substances 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008921 facial expression Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 210000000697 sensory organ Anatomy 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/005—General purpose rendering architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Computer Graphics (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
本发明公开了一种三维场景审核方法、装置及计算机存储介质。该审核方法通过将服务器获取到的交互界面实时显示的三维场景画面作为场景图像,这些场景图像在利用图像识别算法进行违规信息识别时,能够有效地检测出三维场景中不同平面的元素所共同构成的违规视觉信息。本发明能够在用户创建三维场景的过程中就对三维场景的实时画面进行获取得到场景图像并用于审核,可以及时得到审核结果以便能够在用户创建完整个三维场景之前告知用户存在违规,便于用户即时修改,降低用户整改的工作量。
Description
技术领域
本发明涉及元宇宙技术领域,特别涉及一种三维场景审核方法、装置及计算机存储介质。
背景技术
“下一代互联网”也被称为Web3.0,Web3.0是去中心化技术重构生产关系的“后端”,而元宇宙可视作是直接和用户互动的“前端"。其中,元宇宙是一个互联、体验式的3D虚拟世界,位于任何地方的人都可以在其中进行实时社交和娱乐。允许用户自由地、便捷地在元宇宙中创建三维场景是元宇宙的基本需求和必备功能,随着Unity3D和UE4(虚幻4引擎)等三维引擎的广泛应用,现有的元宇宙应用程序已经能够向用户提供自由便捷地创建三维场景的功能。
由于元宇宙中的高自由度,用户可能随意创建任何三维场景,若是用户创建的三维场景存在不符合法律法规的问题,可能会给元宇宙平台带来风险。例如,用户私自创建的三维场景中包含了版权立体形象或某个人物的立体雕塑,当该三维场景发布在元宇宙平台上供大众进入该场景游玩时,元宇宙平台可能存在侵犯知识产权或侵犯肖像权的连带责任。因此,对于用户在元宇宙中创建的三维场景,元宇宙平台方需要进行审核并通过后才能其允许发布。
公开号为CN114522427A的中国专利披露了一种游戏违规场景的检测方法,方法包括:通过获取三维游戏场景数据,并对所述三维游戏场景数据进行切片和栅格化处理,以得到栅格数据;通过查询预设的色彩映射表,来获取与所述栅格数据对应的颜色数据;基于与所述栅格数据对应的颜色数据,对所述栅格数据进行光栅化处理,以得到场景图像;通过将所述场景图像输入到预先训练好的违规图像检测模型,得到识别结果,从而实现通过对所有游戏的建造场景进行处理,得到若干场景图像,以自动识别出违规的建造场景。该方法能够实现自动审核三维场景中的违规内容。
经研究,上述现有技术中采用的三维场景审核方法是基于对三维场景数据进行切片来实现的,其至少存在以下不足:
切片处理只能够获取位于同一切割平面上的元素所形成的视觉图像,三维场景中位于不同切割平面上元素共同形成的视觉图像无法被切片法所采集,而进入三维场景中的用户所能够看到的视觉图像大多是由位于不同切割平面上元素共同形成的三维场景图像(称之为关键内容),而现有技术中基于切片法采集三维场景图像的自动审核方案往往会遗漏了关键内容,当违规作品通过自动审核而允许发布时,会给元宇宙平台带来法律风险。如图1所示,立体小黄人雕塑的五官并不在一个平面上,在利用上述现有技术对三维场景中的小黄人立体雕塑进行切片处理时,获得的场景图像并没有携带小黄人的五官信息,因此现有技术中基于切片处理的三维场景自动审核方法无法有效地检测出呈现在三维场景中不同平面的元素所共同构成的违规视觉信息。
发明内容
有鉴于此,本发明第一个方面的主要目的在于,提供一种三维场景的待审核图像集合获取方法,能够有效地采集到三维场景中不同平面的元素所共同构成的违规视觉信息。
本发明在第一方面主要目的基础上,给出第二个方面的主要目的,提供一种三维场景审核方法,能够有效地检测出三维场景中不同平面的元素所共同构成的违规视觉信息。
为了达到上述第一个方面的目的,本发明提出的技术方案为:
一种三维场景的待审核图像集合获取方法,应用于服务器,所述方法包括:
处于在线编辑模式下,响应于用户的操控操作,调整三维场景数据,并通过交互界面实时显示与所述操控操作对应的三维场景;
检测到所述操控操作满足预设条件时,获取所述交互界面当前所显示三维场景的画面作为场景图像,并利用所述场景图像更新待审核图像集合;所述待审核图像集合中的场景图像用于进行违规信息识别。
上述方案提供的一种三维场景的待审核图像集合获取方法,至少具有如下的有益效果:
1.通过将获取到的交互界面实时显示的三维场景画面作为场景图像,这些场景图像在利用图像识别算法进行违规信息识别时,能够有效地检测出三维场景中不同平面的元素所共同构成的违规视觉信息。
2.相较于现有技术中进行切片法审核时,获得的每一张场景图像都需要依次进行切片、查询色彩映射表、栅格化处理、光栅化处理,导致得到用于违规信息识别的场景图像的过程占用计算机资源多、时间成本高。而本发明则可以直接将三维场景渲染后对应的画面作为场景图像,无需进行中间过程的处理,节省了计算机资源和时间成本。
3.现有技术中切片法审核时,对整个三维场景进行全面、多维度切片并经过处理后得到多张场景图像,但并不是每张场景图像都有必要,造成计算机资源和时间成本浪费的问题,本发明中只有在检测到所述操控操作满足预设条件时才会获取场景图像,针对性强,能够有效控制场景图像的数量,节省计算机资源和时间成本。
为了达到上述第二个方面的目的,本发明提出的技术方案为:
一种三维场景审核方法,应用于服务器,所述方法包括:
根据本发明第一方面所述一种三维场景的待审核图像集合获取方法,获取三维场景的待审核图像集合;
利用图像识别算法对所述待审核图像集合中的所述场景图像进行违规信息识别,得到审核结果。
上述方案提供的一种三维场景审核方法,至少具有如下的有益效果:
1.通过将获取到的交互界面实时显示的三维场景画面作为场景图像,并利用图像识别算法对所述场景图像进行违规信息识别得到审核结果,能够有效地检测出三维场景中不同平面的元素所共同构成的违规视觉信息。
2.相较于现有技术中进行切片法审核时,获得的每一张场景图像都需要依次进行切片、查询色彩映射表、栅格化处理、光栅化处理,导致得到用于违规信息识别的场景图像的过程占用计算机资源多、时间成本高。而本发明则可以直接将三维场景渲染后对应的画面作为场景图像,无需进行中间过程的处理,节省了计算机资源和时间成本。
3.现有技术中切片法审核时,对整个三维场景进行全面、多维度切片并经过处理后得到多张场景图像,但并不是每张场景图像都有必要,造成计算机资源和时间成本浪费的问题,本发明中只有在检测到所述操控操作满足预设条件时才会获取场景图像,针对性强,能够有效控制场景图像的数量,节省计算机资源和时间成本。
4.现有技术中一般是在整个三维场景创建完成之后进行切片,而在用户花费较多时间创建完成整个场景并上传后才进行切片识别出违规信息的存在,会使用户整改三维场景的工作量巨大。本发明能够在用户创建三维场景的过程中就对三维场景的实时画面进行获取得到场景图像并用于审核,可以及时得到审核结果以便能够在用户创建完整个三维场景之前告知用户存在违规,便于用户即时修改,降低用户整改的工作量。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
下面结合附图和实施例对本发明进一步地说明;
图1为现有技术中利用切片法对三维场景进行审核的原理示意图。
图2为一个实施例中在线编辑模式的原理示意图。
图3为一个实施例中编辑器交互界面的示意图。
图4为实施例一提供的三维场景的待审核图像集合获取方法的流程示意图。
图5为实施例一提供的三维场景的待审核图像集合获取方法的流程示意图。
图6为实施例二提供的三维场景的待审核图像集合获取方法的流程示意图。
图7为实施例二提供的三维场景的待审核图像集合获取方法的流程示意图。
图8为实施例三至五提供的三维场景审核方法的流程示意图。
图9为实施例五提供的三维场景审核方法的流程示意图。
图10为实施例五提供的三维场景审核方法的流程示意图。
图11为一个实施例中计算机设备的结构框图。
图12为一个实施例中速率采集模式下的交互界面示意图。
具体实施方式
本部分将详细描述本发明的具体实施例,本发明之较佳实施例在附图中示出,附图的作用在于用图形补充说明书文字部分的描述,使人能够直观地、形象地理解本发明的每个技术特征和整体技术方案,但其不能理解为对本发明保护范围的限制。
为了便于理解本发明给现有技术带来的技术贡献,有必要对做出本发明的背景进行简要说明。由于元宇宙的高自由度,元宇宙平台会提供编辑器给用户自由创建三维场景,用户可以在元宇宙平台上创建个性化的三维场景,并且用户创建的三维场景可以用于在元宇宙平台上进行交易,用户可以个性化创建三维场景的行为成为元宇宙平台经济系统的重要一环,显然元宇宙平台负有对用户发布三维场景进行审核的责任。经调研,市面上已经有大量第三方平台提供基于人工智能技术的内容审核服务,但是其要求提供的文件格式为文本、图片或视频,显然无法适用于元宇宙平台中用户创建的三维场景内容。基于此,如何提供一种能够适用于元宇宙平台中用户创建的三维场景内容的自动审核方案成为需要解决的问题。经检索,现有技术中,公开号为CN114522427A的中国专利披露了一种基于切片处理的游戏违规场景的检测方法,其在一定程度上实现了自动对三维场景的审核,但是基于切片处理的三维场景自动审核方法存在无法有效地检测出呈现在三维场景中不同平面的元素所共同构成的违规视觉信息的问题。
在此基础上,一种容易想到的方式是,人工打开创作者上传的三维场景进行查看审核,但是人工方式效率低下。另一种容易想到的方式是,接收到创作者上传的三维场景之后,按照预设的摄像机视角参数,获取三维场景中对应视角的画面(即在三维场景中摄像机按照一定的轨迹获取三维场景的画面),然后将这些画面用于自动审核。该方式获取的三维场景画面用于审核,可以起到一定程度的自动审核效果,但是由于该方式获得的三维场景画面是随机的,由于三维场景中各三维模型之间存在相互遮挡的情况,并且所有的三维场景都使用相同的摄像机轨迹来获取画面,无法确保得到用于审核的图像中完全包含一个表达单元,审核效果不佳。例如,如果创作者想要呈现给其他用户的内容是某个三维模型的正面,而摄像机仅仅从该三维模型的顶面拍摄得到一张图像,若是该三维模型正面存在违规内容,显然将此时得到的图像用于审核,审核的准确度不高。
定义:创作者想要呈现给其他用户的内容,称之为一个表达单元。例如,创作者想要呈现给其他用户的内容为小黄人的整体造型,则表达单元为构成小黄人整体三维模型的部件集合;若创作者想要呈现给其他用户的内容是小黄人的面部表情,则表达单元为构成小黄人面部表情的部件集合。可以理解的是,只有保证用于审核的图像中包含创作者的所有表达单元,才能够获得更加准确的审核结果。而通过对创作者创作过程中行为的分析,可以确定创作者想要呈现给其他用户的内容,即找到表达单元。例如,在创建三维模型过程中,用户将各部件进行组合操作形成一个整体三维模型,则可以确定用户想要将该整体三维模型呈现给其他用户,因此需要提供一张图像,该图像中完整包含了该整体三维模型某个视角的画面;进一步的,若是创作者在该整体三维模型的背面设计了特别的内容,则创作者会在预览模式下花较长时间停留在该整体三维模型的背面进行观察,因此,需要提供一张图像,该图像中完整包含该整体三维模型背面视角的画面。
基于此,本申请的发明构思为,在创作者创建三维模型的过程中,对创作者创建模型过程的行为数据进行分析,根据分析结果确定创作者想要呈现给其他用户的内容,并将完整包含该内容(即一个表达单元)的场景图像用于审核,从而提高采集图像的针对性,无需采集大量无效的图像,进而提高审核的效率和准确率。
下面,将通过几个具体的实施例对本发明提供的一种三维场景的待审核图像集合获取方法和一种三维场景审核方法进行详细介绍和说明。
图2为一个实施例中在线编辑模式的原理示意图。需要说明的是,本文所称的在线编辑模式是指,创作者在创建三维场景时,由服务器对三维场景数据进行渲染的模式,该模式下,由于编辑器运行于服务器上,因此服务器可以在创作者使用编辑器创建三维场景的过程中,就实时采集得到三维场景的画面作为场景图像进行审核,即在线编辑模式下服务器可以在创作者创建三维场景的同时进行图像采集以及审核,能够在创作者创建完成三维场景之前就向创作者反馈存在的违规内容。具体的,如图2所示,由服务器运行用于编辑三维场景数据的编辑器进程并且由服务器对三维场景数据进行渲染得到三维场景的画面,服务器将编辑器交互界面的实时画面生成视频流发送给用户终端,并将编辑器的控制权转移给用户终端,用户通过与用户终端连接的输入设备向终端输入操控操作,该操控操作由用户终端发送给服务器,服务器根据该操控操作实时调整三维场景数据。为了便于理解,做出如下定义:本文所称的三维模型是指,由至少一个部件创建而成的三维对象。本文所称的三维场景是指摄像机所能够拍摄到的三维对象的总和,包括环境模型、角色模型、UI元素以及被当前摄像机拍摄到的其他摄像机等。在线编辑模式使得终端性能不足的创作者也可以进行创作,有利于元宇宙平台的推广。
图3示出了在线编辑模式下的编辑器交互界面示意图。如图3所示,编辑器交互界面左侧是提示区域,中间是场景区域,右侧是项目管理器面板和属性面板。其中,场景区域用于显示服务器将三维场景渲染后得到的光栅图,提示区域用于显示违规提示页面,通过上下拖动提示区域右侧的滚动条查看违规提示页面的全部内容。
实施例一
如图4所示,在一个实施例中,提供了一种三维场景的待审核图像集合获取方法,该方法应用于服务器。该方法包括如下步骤:
步骤S202,处于在线编辑模式下,服务器响应于用户的操控操作,调整三维场景数据,并通过交互界面实时显示与所述操控操作对应的三维场景。
如图3所示,在编辑器交互界面的场景区域,创作者创建了小黄人三维模型以及一颗树木三维模型,用户在终端可以通过操作鼠标或键盘或者触控方式向服务器发送控制编辑器的指令,服务器根据接收到的指令控制编辑器执行相应操作,从而操控编辑器中三维模型。
步骤S204,服务器检测到所述操控操作满足预设条件时,获取所述交互界面的场景区域当前所显示三维场景的画面作为场景图像,并利用所述场景图像更新待审核图像集合;所述待审核图像集合中的场景图像用于进行违规信息识别。
需要说明的是,获取所述交互界面当前所显示三维场景的画面的方式包括:
1.截图,即截取交互界面当前所显示的三维场景画面,该方式需要在服务器上部署独立于编辑器进程的截图模块,该截图模块无需与编辑器进行数据交互。
2.直接保存服务器渲染出来的三维场景当前的画面对应的图像,该方式需要要编辑器进行数据交互。
3.录屏,即对显示三维场景画面的区域进行录屏,该方式需要在服务器上部署独立于编辑器进程的录屏模块,该录屏模块无需与编辑器进行数据交互。
可以理解的是,上述三种方式均能够直接得到三维场景的画面,各幅画面均能够直接作为图像识别算法的输入,无需再进行额外处理,相较于切片法采集到数据之后还需要进行复杂的处理才能得到可以用于图像识别的图像数据,本实施例采集到的数据能够立即用于图像识别算法检测,加快了审核效率。
需要解释的是,本实施例中所声称的“利用所述场景图像更新待审核图像集合”,包括向待审核图像集合中添加新的场景图像,或者在向待审核图像集合中添加新的场景图像的同时,删除其他已存在的场景图像等操作。
其中,违规信息是指违反法律规定、社会公序良俗或者运营方规定的信息,例如,未经授权擅自利用编辑器在三维场景中创建有版权的三维卡通模型(如小黄人)属于违反著作权法的行为,对应的,有版权的美术作品被视为违规信息;同理,涉黄、涉暴等三维模型,也属于违规信息。
有益效果:
1.本发明提供的三维场景审核方法,通过将获取到的交互界面实时显示的三维场景画面作为场景图像,并利用图像识别算法对所述场景图像进行违规信息识别得到审核结果,能够有效地检测出三维场景中不同平面的元素所共同构成的违规视觉信息。
2.相较于现有技术中进行切片法审核时,获得的每一张场景图像都需要依次进行切片、查询色彩映射表、栅格化处理、光栅化处理,导致得到用于违规信息识别的场景图像的过程占用计算机资源多、时间成本高。而本发明则可以直接将三维场景渲染后对应的画面作为场景图像,无需进行中间过程的处理,节省了计算机资源和时间成本。
3.现有技术中切片法审核时,对整个三维场景进行全面、多维度切片并经过处理后得到多张场景图像,但并不是每张场景图像都有必要,造成计算机资源和时间成本浪费的问题,本发明中只有在检测到所述操控操作满足预设条件时才会获取场景图像,针对性强,能够有效控制场景图像的数量,节省计算机资源和时间成本。
4.现有技术中一般是在整个三维场景创建完成之后进行切片,而在用户花费较多时间创建完成整个场景并上传后才进行切片识别出违规信息的存在,会使用户整改三维场景的工作量巨大。本发明能够在用户创建三维场景的过程中就对三维场景的实时画面进行获取得到场景图像并用于审核,可以及时得到审核结果以便能够在用户创建完整个三维场景之前告知用户存在违规,便于用户即时修改,降低用户整改的工作量。
本实施例中,所述操控操作满足预设条件,具体包括:所述操控操作是组合操作;其中,
所述组合操作,用于使三维场景中被选中的多个第一对象与同一个第二对象建立父子关系,得到整体模型。
需要说明的是,组合操作通俗理解就是将多个部件编辑成一个整体,保持各部件之间的相对位置不变,从而实现对各部件的整体操作,如复制、移动、旋转等。其技术上是通过将多个部件作为子物体并将多个子物体(即第一对象)共同与同一个父物体(即第二对象)形成父子关系来实现的,在unity和UE4等3D引擎中都提供了具体的实现算法,此处不再赘述。概括地说,组合操作是一种常用的建模规范,在建模过程中把模型对象分成组,可以避免日后相邻模型之间发生黏连情况,同时可以充分利用组件的关联复制性,把模型成组后再复制,以提高后续模型的使用效率。本实施例所称的第一对象为三维场景中可以被选中的三维对象,第二对象为三维场景中可以被选中的且与第一对象不同的三维对象。
在本实施例中,考虑到用户在创建一个三维场景时,会创建多个模型,例如房屋模型、树木模型、NPC模型等,为了便于后续重复使用或者避免邻近模型的黏连,用户在创建模型的过程中或者创建模型完成之际,会以模型为单位,将用于构建同一个模型的多个部件组合成为一个整体模型。显然用户通过在对目标模型进行组合操作时,交互界面当前显示的三维场景画面会包括该目标模型对应的画面。
需要说明的是,在创建三维场景时,可操作三维对象的最小单位称之为部件,其具体可以是正方体、球体或者圆柱体等规则的三维几何对象,用户通过交互界面可视化地调整这些部件的相对位置、尺寸和材质,创建模型,多个模型共同构成一个三维场景。
可以理解的是,美术作品是以模型为单位进行表达的,单个部件等规则的三维几何对象一般构成作品,不存在著作权侵权的风险。只有当多个部件共同构成一个模型时,例如一个房屋模型或者NPC模型等,才能够表达一幅美术作品,因此应当以单个模型作为单位来开展著作权侵权审核。可以理解的是,只有当构成一个模型的所有部件都位于当前视锥范围内时,当前摄像机视角下得到的渲染画面才能够尽可能全面的反映模型上的视觉信息,将此时得到的画面对应的场景图像用于违规信息审核,具有更准确的审核精度。经发明人研究发现,在实际操作中,如何确定哪些部件共同构成一个模型是审核的关键。考虑到用户在交互界面中选择各部件进行组合操作时,需要将对应部件移动到摄像机视锥范围内才能够进行选中操作,因此在用户执行组合操作时,三维场景当前的画面中必然会显示用于组成模型的各部件。因此,本实施例中,将用户在创建模型时的组合操作作为获取画面的触发条件,此时无需计算模型的位置、无需统计构成该模型的部件有哪些,由于当前画面中包含该模型渲染后内容,因此也无需再单独渲染该模型,从而在消耗很少计算资源和时间成本的情况下,获得该模型渲染后对应的画面。
具有的应用场景中,用户在创建模型过程中,必然会通过交互界面查看该模型所呈现出来的视觉效果,以对模型进行实时调整,因此利用用户在创建模型过程中查看该模型的视角对应的画面进行审核,能够获得用户希望通过该模型传达出的重要视觉信息。例如,用户创建了一个小黄人模型,显然小黄人模型具有独创性和识别性的部分在于其正面部分,则该用户在创建模型过程中一般会更加关注小黄人模型正面的视角效果,使得摄像机视角会在朝向小黄人模型正面的位置停留时间更多。
在一个示例中,用户创建模型的流程大致如下:
1.用户在编辑器的交互界面中对各部件执行拖拽、拉伸、缩小、旋转、添加材质等操作,初步创建出模型;
2.用户调整摄像机视角观察初步创建好的模型的视觉效果;
3.当用户觉得当前模型视觉效果满足自己的要求时,在交互界面中选中构成该模型的各部件,单击鼠标右键,选中组合操作选项,编辑器进程会创建一个空物体,将这些部件都作为该空物体的子物体,即建立父子关系;
4.当编辑器进程检测到组合操作被触发时,会获取三维场景当前的画面作为场景图像,并将该场景图像加入到待审核图像集合中。
如图5所示,在一个示例中,所述利用所述场景图像更新待审核图像集合,具体包括:
步骤S302,服务器检测到组合操作时,确定当前组合操作对应的多个第一对象是否与上一次组合操作对应的所述多个第一对象至少有部分相同。
步骤S304,若否,则服务器将当前组合操作对应的场景图像添加到待审核图像集合中,以更新所述待审核图像集合。
需要说明的是,当前组合操作对应的场景图像是指,组合操作被触发时的场景图像。举例,在A时刻,当用户在交互界面中选中构成该模型的各部件,单击鼠标右键,选中组合操作选项,则此时组合操作被触发,则将A时刻的场景图像作为与当前组合操作对应的场景图像。
步骤S306,若是,则服务器将当前组合操作对应的场景图像添加到待审核图像集合中并将上一次组合操作对应的场景图像从待审核图像集合中剔除,以更新所述待审核图像集合。
具体而言,利用所述场景图像更新待审核图像集合的具体流程如下:
1.在编辑器打开之后,初始化参考数据集和临时数据集,将参考数据集和临时数据集中的元素都设置为缺省值;
2.检测到组合操作时,将临时数据集中的所有元素删除并将当前组合操作对应的各部件(即子物体)唯一识别编号作为新元素加入到临时数据集中:
3.将临时数据集与参考数据集的各元素进行比较;
4.若临时数据集与参考数据集至少有一个元素相同,则将当前组合操作对应的场景图像添加到待审核图像集合中并将上一次组合操作对应的场景图像从待审核图像集合中剔除,以更新所述待审核图像集合,通过添加完善度更高的模型画面并剔除完善度低的模型画面,实现对待审核图像集合的迭代,保留下来的场景图像都是具有更大审核价值的;否则,将当前组合操作对应的场景图像添加到待审核图像集合中,以更新所述待审核图像集合。可以理解的是,本步骤中所称的上一次组合操作对应的场景图像是加入到待审核图像集合中时间最晚的图像,可以通过识别各场景图像加入待审核图像集合的时间来识别出上一次组合操作对应的场景图像;
5.执行完步骤4之后,将参考数据集中的所有元素删除并将临时数据集的所有元素加入到参考数据集中,完成对参考数据集的更新。
本示例中,考虑到不同用户在三维场景中创建模型时的操作习惯存在差异,一般可以划分为如下2种情况:
1.在完全创建完成一个模型时,对所有部件进行组合操作;
2.创建模型过程中,当向模型中新增若干个部件时,不定时的将新增的部件与已有部件进行组合操作,导致一个模型创建过程执行了多次组合操作。
对于第2种情况,用户可能会在创建一个模型的过程中多次执行组合操作,例如每向模型中新增一个部件就执行一次组合操作,而每次组合操作都会触发获取一张对应的场景图像,这就可能造成用户在创建一个模型的过程中生成很多张对应场景图像,不仅会占用计算机的存储资源,并且若是每张场景图像都调用图像识别算法进行识别,会增加服务器计算资源的开销。
发明人经研究发现,一个模型往往在创建的后期(即准备创建完成的时候),其完成度高时的外观才能够显示出用户希望表达的内容,对模型此时的外观进行审核才是有意义的,才能够识别出是否存在著作权侵权风险。换而言之,虽然用户对于同一个模型执行了多次组合操作,但往往只有最后一次组合操作才能使得模型的外观显示出用户想要表达的内容。基于上述原因,本示例中,利用同一个模型在创建后期完成度更高的模型对应的场景图像来替换前期模型完成度低时对应的场景图像,无需同时保存所有组合操作得到的场景图像,降低了对计算机存储资源的消耗。
举例而言,若用户创建的某个模型有45个部件构成,对该模型总共执行了30次组合操作,虽然获取了30次对应的场景图像,但是本实施例中在待审核图像集合中与该模型对应的场景图像数量为1,降低了对计算机存储资源的消耗。
综上所述,在实施例一中,通过分析创作者创建三维场景过程中的行为,采集到了完整包含创作者想要呈现给其他用户的三维内容的场景图像,提高采集图像的针对性,无需采集大量无效的图像,进而提高审核的效率和准确率。
实施例二
如图4所示,在一个实施例中,提供了一种三维场景的待审核图像集合获取方法,该方法应用于服务器。该方法包括如下步骤:
步骤S202,处于在线编辑模式下,响应于用户的操控操作,调整三维场景数据,并通过交互界面实时显示与所述操控操作对应的三维场景。
如图2所示,在编辑器交互界面的场景区域,创作者创建了小黄人三维模型以及一颗树木三维模型,用户在终端可以通过操作鼠标向服务器发送控制编辑器的指令,服务器根据接收到的指令控制编辑器执行相应操作,从而操控编辑器中三维模型。
步骤S204,服务器检测到所述操控操作满足预设条件时,获取所述交互界面的场景区域当前所显示三维场景的画面作为场景图像,并利用所述场景图像更新待审核图像集合;所述待审核图像集合中的场景图像用于进行违规信息识别。
需要说明的是,获取所述交互界面当前所显示三维场景的画面的方式包括:
1.截图,即截取交互界面当前所显示的三维场景画面,该方式需要在服务器上部署独立于编辑器进程的截图模块,该截图模块无需与编辑器进行数据交互。
2.直接保存服务器渲染出来的三维场景当前的画面对应的图像,该方式需要要编辑器进行数据交互。
3.录屏,即对显示三维场景画面的区域进行录屏,该方式需要在服务器上部署独立于编辑器进程的录屏模块,该录屏模块无需与编辑器进行数据交互。
可以理解的是,上述三种方式均能够直接得到三维场景的画面,各幅画面均能够直接作为图像识别算法的输入,无需再进行额外处理,相较于切片法采集到数据之后还需要进行复杂的处理才能得到可以用于图像识别的图像数据,本实施例采集到的数据能够立即用于图像识别算法检测,加快了审核效率。
需要解释的是,本实施例中所声称的“利用所述场景图像更新待审核图像集合”,包括向待审核图像集合中添加新的场景图像,或者在向待审核图像集合中添加新的场景图像的同时,删除其他已存在的场景图像等操作。
其中,违规信息是指违反法律规定、社会公序良俗或者运营方规定的信息,例如,未经授权擅自利用编辑器在三维场景中创建有版权的三维卡通模型(如小黄人)属于违反著作权法的行为,对应的,有版权的美术作品被视为违规信息;同理,涉黄、涉暴等三维模型,也属于违规信息。
有益效果:
1.本发明提供的三维场景审核方法,通过将获取到的交互界面实时显示的三维场景画面作为场景图像,并利用图像识别算法对所述场景图像进行违规信息识别得到审核结果,能够有效地检测出三维场景中不同平面的元素所共同构成的违规视觉信息。
2.相较于现有技术中进行切片法审核时,获得的每一张场景图像都需要依次进行切片、查询色彩映射表、栅格化处理、光栅化处理,导致得到用于违规信息识别的场景图像的过程占用计算机资源多、时间成本高。而本发明则可以直接将三维场景渲染后对应的画面作为场景图像,无需进行中间过程的处理,节省了计算机资源和时间成本。
3.现有技术中切片法审核时,对整个三维场景进行全面、多维度切片并经过处理后得到多张场景图像,但并不是每张场景图像都有必要,造成计算机资源和时间成本浪费的问题,本发明中只有在检测到所述操控操作满足预设条件时才会获取场景图像,针对性强,能够有效控制场景图像的数量,节省计算机资源和时间成本。
4.现有技术中一般是在整个三维场景创建完成之后进行切片,而在用户花费较多时间创建完成整个场景并上传后才进行切片识别出违规信息的存在,会使用户整改三维场景的工作量巨大。本发明能够在用户创建三维场景的过程中就对三维场景的实时画面进行获取得到场景图像并用于审核,可以及时得到审核结果以便能够在用户创建完整个三维场景之前告知用户存在违规,便于用户即时修改,降低用户整改的工作量。
本实施例中,所述操控操作满足预设条件,具体包括:所述操控操作是预览操作;所述预览操作,用于触发将由预览摄像机提供的三维场景画面作为交互界面当前所显示的三维场景画面。
需要说明的是,在执行预览操作后,进入预览模式,此时交互界面中所显示的三维场景画面大致就是最终发布后用户看到的画面(细节不完全一致)。在预览模式下,创作者可以提前查看自己创作的三维场景在发布后的大致情况,预览模型下的所有改动,在退出预览模式之后,都会回到原始状态。
可以理解的是,当用户进入到预览模式时,一般是为了查看当前三维场景中的某些对象是否符合自己的设计构想,例如,可以查看自己创作的小黄人模型在预览模型下的效果,进而判断是否需要修改。因此,在预览模式下,创作者调整预览摄像机所查看的画面中会存在创作者关注的作品,而这些作品往往需要进行审核的重要内容。
具体的,在检测到操控操作为预览操作并进入预览模式之后,交互界面当前所显示的三维场景画面为预览摄像机提供的三维场景画面,此时获取所述交互界面当前所显示三维场景的画面的方式包括:
1.截图,即截取交互界面当前所显示的三维场景画面,该方式需要在服务器上部署独立于编辑器进程的截图模块,该截图模块无需与编辑器进行数据交互。
2.直接保存服务器渲染出来的三维场景当前的画面对应的图像,该方式需要要编辑器进行数据交互。
3.录屏,该方式需要在服务器上部署独立于编辑器进程的录屏模块,该录屏模块无需与补给舰进行数据交互。
可以理解的是,上述三种方式均能够直接得到三维场景的画面,各幅画面均能够直接作为图像识别算法的输入,无需再进行额外处理,相较于切片法采集到数据之后还需要进行复杂的处理才能得到可以用于图像识别的图像数据,本实施例采集到的数据能够立即用于图像识别算法检测,加快了审核效率。
需要说明的是,在创建三维场景时,创作者需要进入到预览模式查看当前三维模型,预览模式是为了体验建模完成并发布后,游戏用户在场景内游玩所见到的场景画面。预览操作的定义是,换一个预设的摄像机来获取画面,包括游戏模式预览或者纯场景预览。游戏模式预览是指,在切换预览摄像机获取画面后,在三维场景中生成对应的游戏人物,并将预览摄像机与该游戏人物进行绑定,使得预览摄像机与该游戏人物相对位置不变,一般分为第三人称视角和第一人称视角,创作者操控该游戏人物的同时实现对预览摄像机的操控,获得更接近实际游戏时的体验。纯场景预览是指,在切换预览摄像机获取画面后,不生成对应的游戏人物,创作者仅可以控制预览摄像机位置参数和角度参数来改变所获取的三维场景画面内容。
本实施例中,考虑到创作者进入预览模式是为了查看最终发布三维场景的视觉效果,因此在预览模式下,创作者一般会重点查看自己所关注和需要表达的三维模型或三维场景的其他内容,而为了查看这些创作者重点关注和需要表达的内容,创作者会调整预览摄像机的视角使得创作者重点关注和需要表达的内容出现在交互界面当前所显示的画面中,该内容可能侵犯知识产权,或者涉及违反法律或者平台规定的内容,是需要进行审核的重点内容。相对而言,除了创作者重点关注和需要表达的内容,在三维场景中还存在其他通用的三维模型,例如在unity商店中,预先提供可以通用的树木、房屋、山体等三维模型,显然这些通用的三维模型并非审核的重点,因为允许发布并供其他用户使用的通用三维模型一般都是经过对应平台审核的。需要审核的重点是创作者自己创建的三维模型,而用户进入预览模式也是为了自己所创建的三维模型的视觉效果,因此能够在预览模式下获取用户所关注的三维模型的画面,即需要重点审核的三维模型对应的画面,将此时得到的画面对应的场景图像用于违规信息审核,具有更准确的审核精度。
如图6所述,在一个示例中,所述获取所述交互界面当前所显示三维场景的画面作为场景图像,具体包括:
步骤S402,按照预设频率获取预览摄像机提供的三维场景画面,得到预览视频;所述预览视频的每一帧视频帧均与一张三维场景画面对应。
步骤S404,将所述预览视频的视频帧作为场景图像。
所述利用所述场景图像更新待审核图像集合,具体包括:
将所述场景图像添加到待审核图像集合中,以更新所述待审核场景图像。
需要说明的是,在预览模式下,获取三维场景画面的方式包括:
1.直接获取服务器渲染出来的三维场景当前的画面对应的图像,该方式需要要编辑器进行数据交互。
2.录屏,即对显示三维场景画面的区域进行录屏,该方式需要在服务器上部署独立于编辑器进程的录屏模块,该录屏模块无需与编辑器进行数据交互。
按照预设频率获取预览摄像机提供的三维场景画面,包括通过录屏方式获取三维场景画面和直接获取服务器渲染出来的三维场景画面。
在一个示例中,采用录屏的方式获取三维场景画面。具体的,录屏是指服务器对交互界面的全部或部分区域的显示内容进行采集,并将采集得到的显示内容以视频流的形式进行编码得到视频文件的处理方式,视频的每一帧对应一张三维场景画面。
在另一个示例中,不设置额外的录屏模块,可以每间隔预设时间就采集一张服务器渲染出来的三维场景画面作为视频帧,从而生成视频。例如,每间隔0.1秒采集一张视频帧,则得到的视频对应帧率为10帧/秒。
无论是录屏或者直接采集服务器渲染好的三维场景画面所得到的视频,由于得到的视频包含在时间上连续的三维场景画面,所以都能够保证数据全面性(即能够获取到创作者在预览模式下所浏览的各个视角对应的三维场景画面),更重要的是能够为每张三维场景画面关联对应的预览摄像机视角参数,从而获取两帧视频帧之间在预览摄像机视角参数上的关系。根据该关系,能够将录屏视频中内容相同的重复帧删除,只保留其中一个帧,从而降低审核的数据量,提升审核效率。
具体的,当相邻两帧对应的预览摄像机视角参数不变或者变动小于设定阈值时,则认为两帧重复,或者当非相邻两帧对应的预览摄像机视角参数相同或者差值小于设定阈值时,则认为两帧重复。对于重复的帧,只保留其中一帧,其他帧进行删除。可以理解的是,本实施例中剔除重复帧的方案与现有技术中的视频压缩方案不同,现有技术中压缩视频的方案是通过相邻帧的图像数据比较来实现的,图像数据比较占用资源多,且一般只对相邻帧进行图像数据比较。而本实施例中,两帧比较的内容并非是图像数据,而是比较与帧图像关联的预览摄像机视角参数,相较于图像数据,预览数据线视角参数仅包括摄像机的位置信息和旋转信息,摄像机视角参数的数据量远小于图像数据的数据量,能够更快地获得两帧视频帧是否重复的比较结果。
如图7所示,在一个示例中,所述获取所述交互界面当前所显示三维场景的画面作为场景图像,具体包括:
步骤S502,按照预设频率获取预览摄像机提供的三维场景画面,得到预览视频。
步骤S504,获取所述预览视频的视频帧;每一视频帧均对应一组预览摄像机视角参数,每组预览摄像机视角参数均包括多类视角分量。
步骤S506,将符合条件的视频帧作为场景图像。
其中,所述将符合条件的视频帧作为场景图像,具体包括:
步骤S5061,计算下一相邻帧与当前帧二者之间的各相同类视角分量的差值的绝对值。
步骤S5062,计算各所述差值的绝对值与预设频率倒数的比值,得到当前帧的视角参数变化率;所述视角参数变化率包括各类视角分量对应的分量变化率。
步骤S5063,从视频中剔除任一分量变化率大于对应的第一变化率的当前帧以及各类视角分量对应的分量变化率均小于对应的第二变化率的当前帧。
步骤S5064,将剩余的视频帧作为场景图像。
所述利用所述场景图像更新待审核图像集合,具体包括:
将所述场景图像添加到待审核图像集合中,以更新所述待审核场景图像。
在具体的场景中,创作者在预览模式下,调整预览摄像机的视角参数来从不同视角查看三维场景的效果。在一个示例中,当创作者调整预览摄像机视角参数的速度过快时,意味着创作者在当前视角下并未定位到自己希望查看的内容,因此需要快速调整摄像机视角,以加快到达需要观察视角的速度。例如,用户在进入预览模式时,摄像机的初始位置在A点,用户希望观察的三维模型位于B点附近,B点距离A点距离较远,则用户会通过键盘或鼠标快速调整摄像机视角参数中的位置参数,从而加快摄像机到达B点位置的速度。因此,在预览摄像机视角参数的变化速度过快的情况下,可以认为这个过程中显示在交互界面中的画面并不存在用户关注的内容。显然,用户关注的内容才是审核的重点,而并未用户关注的内容并非审核重点,为了降低审核的场景图像数量,可以仅针对用户关注内容进行审核。可以理解的是,若摄像机的初始位置在A点,创作者希望观察的三维模型位于A点附件,但是若该三维模型并不位于摄像机视锥范围内,用户也会快速调整摄像机视角参数中的旋转参数,因此,无论是位置参数还是旋转参数的快速改变过程,都认为该过程中不存在用户关注的内容,为了降低审核场景图像的数量,可以忽略该过程对应的画面。
在一个示例中,当创作者调整预览摄像机视角参数的速度过慢时(包括视角参数不变的情况),意味着这一段时间内,三维场景画面的内容变动很小甚至没有变动,可以判断其存在重复帧,为了降低审核场景图像的数量,需要删除重复帧。
具体的,预览摄像机视角参数包括摄像机的位置信息和旋转信息,其中,位置信息包括x、y、z三个方向的参数,旋转信息包括x、y、z三个方向的参数,共计6个参数,每个参数的变动都会导致交互界面显示的画面发生改变。以unity3D为例,在一个示例中,视频的帧率为5帧/秒,即相邻两帧的时间间隔为0.2秒,据transform组件可知,position属性的值(即位置信息)为{x:4.48,y:3.7,z:-7.74};rotation属性的值(即旋转信息)为{x:18.178,y:-23.276,z:-7.693}。
如下表所示,根据计算结果可以确定当前帧是否能够作为场景图像用于审核。
如上表所示,基于简洁考虑,6类视角分量对应的分量变化率α1至α6定义如下:α1为位置信息X参数的分量变化率,α2为位置信息Y参数的分量变化率,α3为位置信息Z参数的分量变化率,α4为旋转信息X参数的分量变化率,α5为旋转信息Y参数的分量变化率,α6为旋转信息Z参数的分量变化率。当β=0,则剔除当前帧,不将其作为场景图像;当β=1,则将当前帧作为场景图像。γ1为下一相邻帧1,γ2为下一相邻帧2,γ3为下一相邻帧3,γ4为下一相邻帧4,γ5为下一相邻帧5,γ6为下一相邻帧6,γ7为下一相邻帧7,γ8为下一相邻帧8。
已知,当前帧(即位置信息){x:4.48,y:3.7,z:-7.74};(即旋转信息){x:18.178,y:-23.276,z:-7.693},表中示例性示出了下一相邻帧预览摄像机视角参数的8种情况(即γ1至γ8)。根据预先设定的预设变化率范围,在计算出当前帧的视角参数变化率位于预设变化率范围内时,将当前帧作为场景图像用于审核。其中对于6个参数都设置有相应的预设变化率范围,并且进行视角参数变化率计算时,也是针对6个参数分别计算。可以理解的是,6个参数中的任一个参数变化率大于阈值范围,就会导致视角变化速度很快,认为该画面不存在用户关注内容,需要剔除。例如,在unity中,(即位置信息){x:4.48,y:3.7,z:-7.74}中的三个参数单位为米,预设频率为5帧/秒,其倒数为0.2秒,第一变化率为2.1米/秒,即下一相邻帧1的位置信息X参数的分量变化率α1=2,意味着在用户操控下,摄像机的位置信息X参数以2米/秒的速率进行变化,认为此时用户并未找到希望观察的内容,正在快速调整视角定位到需要观察的内容,所以此时得到视频帧不适合作为场景图像用于审核。
为了加快速度,一旦计算到存在一个参数变化率大于阈值的情况,就可以停止计算其他参数,降低计算资源的占用,如表格所示,画斜杠的位置均不需要计算。进一步的,只有当6个参数的参数变化率都为零或者都小于预设值,即画面差异很小,存在重复帧,需要剔除。例如,第二变化率10度/秒,显然下一相邻帧8被判定为重复帧,需要剔除。
可以理解的是,考虑到不同用户调整摄像机视角参数的速度不同,为了对各个用户赋予更精确的第一变化率和第二变化率,本示例中提供了一种采集各用户调整摄像机视角参数速度的方法。
如图12所示,进入速率采集模式后,在交互界面显示文字“请在三维场景中将摄像机视角快速旋转一周。使得你能够在右下角窗口清楚看到场景中的球体”。A-1中右下角的窗口显示的画面为左上方摄像机视锥范围内模型的渲染画面,可见,在A-1中,右下角的窗口无法看到场景中的球体,用户在通过鼠标控制摄像机转动以调整摄像机旋转信息之后,如A-2所示,右下角窗口出现了球体,当用户认为其足以在右下角窗口看清该球体时,就会单击界面中的结束控件,从而采集到用户在速率采集模式下快速调整旋转信息所用的时间,在统计初始的旋转信息和最终的旋转信息,就可以得到本次各旋转信息的变化率,即在XYZ等3类视角分量的变化率,一般采集用户5次的操作,统计出旋转信息在3类视角分量的变化率,得到第一变化率。同理,如图12的B-1所示,在进入速率采集模式之后,在交互界面显示文字“请在三维场景中将摄像机快速移动到能够在右下角窗口情况看到球体的位置”。当用户通过鼠标操作调整摄像机的位置信息之后,如B-2所示,右下角窗口出现了球体,当用户认为其足以在右下角窗口看清该球体时,就会单击界面中的结束控件,从而采集到用户在速率采集模式下快速调整位置信息所用的时间,在统计初始的位置信息和最终的位置信息,就可以得到本次各位置信息的变化率,即在XYZ等3类视角分量的变化率,一般采集用户5次的操作,统计出位置信息在3类视角分量的变化率,得到第一变化率。综上可以得到第一变化率对应的6类视角分量的分量变化率。
概括的说,本示例中,通过统计每个用户在速率采集模式下,操作摄像机的位置信息和旋转信息时各类视角分量对应的分量变化率,确定每个用户对应的第一变化率,更贴合用户的操作习惯,而非设置固定值,使得对场景图像的筛选更加准确。
在一个场景中,平台在采集到预览模式下的三维场景画面之后,会将这些画面交由第三方视频审核平台帮忙审核。现有的视频审核平台为了加快审核速度,降低审核数据量,在进行视频进行审核时,可以对待审核的视频进行截帧处理,并每隔预定时长抽取关键帧,然后对关键帧进行审核。或者对所有的视频帧进行聚类,离聚类中心最近的视频帧确定为关键帧;或者,选取变化较为明显的视频帧作为关键帧。显然上述的现有技术都是基于视频帧本身的数据进行处理,而无法获取用户对各视频帧的关注程度,显然用户越关注的视频帧中越有可能出现其需要表达的作品,这些作品是需要审核的重点内容。而若是仅仅将采集到的三维场景画面视频提交给第三方审核,第三方审核单位的通用视频审核方法可能会导致遗漏对创作者关注内容的审核。为了解决该技术问题,本实施例中提供了如下技术方案:
检测到当前视频帧的各类视角分量对应的分量变化率均小于对应的第二变化率且持续时间超过重点时间时,将所述当前视频帧标记为重点帧。
可以理解的是,在预览模式下,用户为了更仔细观察其关注的三维模型,一般会在定位到对应视角之后,停留一段时间进行观察。基于此,可知,对于用户停留较长时间的视角对应的场景图像,应当是需要重点审核。若是用户在某个摄像机视角下停留时间较长,反映在视频帧上就是出现了重复帧,因此,本示例中,用于确定重点帧的判定条件就是在确定重复帧的条件基础上,判定停留的时间,即持续时间是否超过重点时间。之所以需要判断持续时间是否超过重点时间,是因为可能由于鼠标操作停顿或者用户活动手臂等原因也会导致产生停留和重复帧,所以为了更准确找到重点帧,需要检测到当前视频帧的各类视角分量对应的分量变化率均小于对应的第二变化率且持续时间超过重点时间时,才将所述当前视频帧标记为重点帧。
可以理解的是,在标记重点帧之后,可以指定视频审核平台必须对重点帧进行审核并反馈结果,从而避免现有技术进行截帧处理时导致将重要的视频帧漏审的问题。
在一个示例中,在将所述场景图像添加到待审核图像集合之前,所述方法还包括:
检测到目标场景图像与已添加到待审核图像集合中的场景图像在各类视角分量对应的分量变化率的差值均小于对应的第三变化率时,将目标场景图像删除;其中,所述目标场景图像为未添加到待审核图像集合中的场景图像。
可以理解的是,上述实施例中删除的重复视频帧都是相邻的重复视频帧,在一些情况下,预览模式下,创作者可能多次在同一个视角下查看同一个三维模型,此时预览摄像机视角参数的各类视角分量是相同或者差异很小的,意味着两个视角下的视频帧内容相同,即该情况下也会产生重复的视频帧。为了减少审核数量,降低对计算机资源的占用,有必要对该情况产生的重复视频帧进行剔除。
剔除重复视频帧的常规技术手段是将两帧进行图像比较,会占用较多计算资源和计算时间。本示例中,提供了一种占用资源更少,计算时间更快的方法。本示例中,不需要对两帧视频帧直接进行图像数据的比较,只需要比较两帧视频帧对应的预览摄像机视角参数,相较于图像数据比较的大数据量,预览摄像机视角参数只需要比较6个参数,降低了资源占用,加快了比较时间。
综上所述,在实施例二中,通过分析创作者创建三维场景过程中的行为,采集到了完整包含创作者想要呈现给其他用户的三维内容的场景图像,提高采集图像的针对性,无需采集大量无效的图像,进而提高审核的效率和准确率。
实施例三
在实施例一或实施例二中,获取了三维场景的待审核图像集合,实施例三将提供对上述审核图像集合中的图像进行审核的方法,以确定三维场景是否存在违规内容。
如图8所示,在一个实施例中,提供了一种三维场景的待审核图像集合获取方法,该方法应用于服务器。该方法包括如下步骤:
步骤A1,获取在实施例一或实施例二中采集到的三维场景的待审核图像集合。
步骤A2,利用图像识别算法对所述待审核图像集合中的所述场景图像进行违规信息识别,得到审核结果。
其中,违规信息是指违反法律规定、社会公序良俗或者运营方规定的信息,例如,未经授权擅自利用编辑器在三维场景中创建有版权的三维卡通模型(如小黄人)属于违反著作权法的行为,对应的,有版权的美术作品被视为违规信息;同理,涉黄、涉暴等三维模型,也属于违规信息。
值得注意的是,图像识别算法是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的算法,例如,图像识别算法可以采用一种卷积神经网络模型来实现,卷积神经网络模型通过包含大量训练样本的训练集进行训练而具备准确识别违规信息的能力。该卷积神经网络模型训练集的训练样本分为正负样本,该正样本包括包含违规信息的图像和用于标记该图像包含违规信息的标签,该负样本包括不包含违规信息的图像和用于标记该图像不包含违规信息的标签。经过训练后的模型对待审核图像集合中的场景图像进行识别时,便可以准确分辨出待审核图像集合中的场景图像是否包含违规信息,从而得到审核结果,审核结果用户标识被识别的场景图像是否包含违规信息。可以理解的是,上述卷积神经网络模型只是本申请实现图像识别算法的一个示例性说明,不应当理解为对本申请保护范围的限制,图像识别算法还可以由BP神经网络、RBF神经网络、感知器网络等神经网络模型实现,或者通过其他现有的机器学习算法实现,此处不再赘述。
有益效果:
1.本发明提供的三维场景审核方法,通过将获取到的交互界面实时显示的三维场景画面作为场景图像,并利用图像识别算法对所述场景图像进行违规信息识别得到审核结果,能够有效地检测出三维场景中不同平面的元素所共同构成的违规视觉信息。
2.相较于现有技术中进行切片法审核时,获得的每一张场景图像都需要依次进行切片、查询色彩映射表、栅格化处理、光栅化处理,导致得到用于违规信息识别的场景图像的过程占用计算机资源多、时间成本高。而本发明则可以直接将三维场景渲染后对应的画面作为场景图像,无需进行中间过程的处理,节省了计算机资源和时间成本。
3.现有技术中切片法审核时,对整个三维场景进行全面、多维度切片并经过处理后得到多张场景图像,但并不是每张场景图像都有必要,造成计算机资源和时间成本浪费的问题,本发明中只有在检测到所述操控操作满足预设条件时才会获取场景图像,针对性强,能够有效控制场景图像的数量,节省计算机资源和时间成本。
4.现有技术中一般是在整个三维场景创建完成之后进行切片,而在用户花费较多时间创建完成整个场景并上传后才进行切片识别出违规信息的存在,会使用户整改三维场景的工作量巨大。本发明能够在用户创建三维场景的过程中就对三维场景的实时画面进行获取得到场景图像并用于审核,可以及时得到审核结果以便能够在用户创建完整个三维场景之前告知用户存在违规,便于用户即时修改,降低用户整改的工作量。
实施例四
在实施例一中,获取了三维场景的待审核图像集合,实施例四将提供对实施例一获得的审核图像集合中的图像进行审核的方法,以确定三维场景是否存在违规内容。
如图8所示,在实施例三的基础上,本实施例中提供了一种三维场景的待审核图像集合获取方法,该方法应用于服务器。该方法包括如下步骤:
步骤A1,获取在实施例一中采集到的三维场景的待审核图像集合。
步骤A2,利用图像识别算法对所述待审核图像集合中的所述场景图像进行违规信息识别,得到审核结果。
本实施例中,所述利用图像识别算法对实施例一中获取的所述待审核图像集合中的所述场景图像进行违规信息识别,得到审核结果,具体包括:
在检测到当前组合操作对应的多个第一对象与上一次组合操作对应的所述多个第一对象完全不同时,在将当前组合操作对应的场景图像添加到待审核图像集合中之前,利用图像识别算法对所述待审核图像集合中的所述场景图像进行违规信息识别,得到审核结果,并将已经被识别过的场景图像从待审核图像集合中删除。
具体的,利用图像识别算法对所述待审核图像集合中的所述场景图像进行违规信息识别,得到审核结果,可以有两种实现方式:
第一种,实时监控待审核图像集合,在检测到待审核图像集合有新增的场景图像时,立即将新增的场景图像输入到图像识别算法进行违规信息识别,得到审核结果。
第一种实现方式的优势是,能够实时检测到创建模型过程中可能存在的违规信息。但是对于模型完成度较低时对应的场景图像进行审核,存在违规信息的几率小,也就是说,第一种实现方式导致计算机耗费过多资源在无需审核的内容上,造成计算机资源的浪费。
第二种,监控到新的组合操作时,说明用户已经完成当前模型的创建,因此应当将此时已经得到的场景图像用于审核。即在检测到当前组合操作对应的多个第一对象与上一次组合操作对应的所述多个第一对象完全不同时,利用图像识别算法对所述待审核图像集合中的所述场景图像进行违规信息识别,得到审核结果。
具体的,监控到临时数据集与参考数据集中的元素完全不相同时,利用图像识别算法对所述待审核图像集合中的所有场景图像进行违规信息识别,得到审核结果,并将已经识别过的场景图像从待审核图像集合中删除。
值得注意的是,由于在检测到当前组合操作对应的多个第一对象与上一次组合操作对应的所述多个第一对象完全不同时,触发了两个操作,第一个操作是:将当前组合操作对应的场景图像添加到待审核图像集合中,以更新所述待审核图像集合;第二个操作是:利用图像识别算法对所述待审核图像集合中的所述场景图像进行违规信息识别,得到审核结果。由于新模型对应的场景图像完成度低,所以不需要对新模型对应的场景图像进行识别。需要说明的是,由于当前组合操作是对新模型的第一次组合操作,此时创建的新模型可能完善程度不高,所以此时该新模型对应的场景图像审核价值不高,应该等新模型对应的场景图像迭代出更高审核价值的场景图像之后再进行识别审核,以节省计算机的计算资源。因此,本实施例中限制两个操作之间的顺序,在将当前组合操作对应的场景图像添加到待审核图像集合中之前,利用图像识别算法对所述待审核图像集合中的所述场景图像进行违规信息识别,仅对上一个模型对应的具有较高审核价值的场景图像进行审核,提升对计算机计算资源的利用率。得到审核结果之后,将已经被识别过的场景图像从待审核图像集合中删除,降低对计算机存储资源的占用率。
实施例五
如图8所示,在实施例三的基础上,本实施例中提供了一种三维场景的待审核图像集合获取方法,该方法应用于服务器。该方法包括如下步骤:
步骤A1,获取在实施例一或实施例二中采集到的三维场景的待审核图像集合。
步骤A2,利用图像识别算法对所述待审核图像集合中的所述场景图像进行违规信息识别,得到审核结果。
因此,实施例五具有实施例四所有的有益效果,在此基础上,如图9所示,所述方法还包括:
步骤B1,当所述审核结果指示对应的场景图像包含违规信息时,将包含违规信息的场景图像作为目标图像,并添加到违规集合中;
步骤B2,在所述交互界面的提示区域显示违规提示页面;其中,所述违规提示页面用于显示基于违规集合中目标图像所生成的提示内容,所述提示内容包括多条检测结果,每条所述检测结果分别与一张目标图像相对应;每条所述检测结果显示的内容包括以下内容中的任意一个或任意多个的组合:提示文字和提示图片。
在用户创建三维场景的过程中,当检测到用户创建的三维场景中存在违规信息时,向用户反馈越早,用户修改难度越小,成本越低。本实施例中,能够在用户创建三维场景的过程中及时将三维场景中的各模型对应的渲染图输入到图像识别算法进行违规信息识别,在用户创建三维场景过程中即可实时反馈审核结果,便于用户及时进行违规内容的修改。
具体的,当所述审核结果指示对应的场景图像包含违规信息时,会将该场景图像作为目标图像并添加到违规集合中。需要说明的是,平台每检测到有一张场景图像存在违规信息,就会将该场景图像添加到该三维场景对应的违规集合中,并为添加进来的场景图像关联对应类型的违规标记,通过判断某个三维场景对应的违规集合中是否存在场景图像,就可以判断该三维场景是否存在违规内容,在三维场景存在违规内容的情况下,不允许该三维场景在平台进行发布。同时,通过识别与违规集合中的场景图像关联的违规标记,可以识别对应场景图像的违规类型。平台将违规信息通过提示信息反馈给用户之后,用户会根据提示信息对三维场景进行修改或者申诉。
在违规提示页面中会显示提示内容,具体的,基于违规集合中的目标图像生成提示内容的过程具体包括:
当检测结果显示的内容为提示文字时,基于所述目标图像在进行违规信息识别时检测到的违规类型,以生成提示文字。
当检测结果显示的内容为提示图片时,基于所述目标图像在进行违规信息识别时检测到的违规对象,在所述目标图像上显示与所述违规对象对应的边界框,以生成提示图片。如图3所示,在未点击目标图像1时,目标图像1以缩略图形式显示在页面上,当点击目标图像1时,该目标图像1就会放大显示在提示区域中,当用户再次点击放大后的目标图像1时,该目标图像1就会返回缩略图状态。在目标图像1中小黄人被边界框框起来,便于用户确认违规信息的位置。
当检测结果显示的内容为提示图片时,基于所述目标图像在进行违规信息识别时检测到的违规对象,在所述目标图像上显示与所述违规对象对应的标识符,以生成提示图片。如图3所示,在边界框的上方显示有汉字“小黄人”,便于用户确定违规信息对应的版权信息。
当检测结果显示的内容为提示图片时,基于所述目标图像在进行违规信息识别时检测到的违规对象,将所述违规对象从目标图像上分割出来作为提示图片的内容,以生成提示图片。
在一个示例中,每条检测结果显示的内容可以仅为提示文字,违规类型包括以下类型:著作权违规、商标权违规、涉暴违规、涉黄违规,则提示文字可以是上述违规类型之一。
在一个示例中,为了便于用户能够更明确该三维场景中违规的内容具体是什么,每条检测结果显示的内容可以是一张图片(即提示图片),该图片为包含违规信息的场景图像,并且根据图像识别算法得到的边界框将场景图像上的违规信息框起来。例如,场景图像中包含具有著作权的小黄人,则在判定该场景图像存在违规信息后,将该场景图像中的小黄人利用边界框框住,将该场景图像作为提示信息展示在交互界面中,便于用户根据该场景图像快速明确违规的内容。可以理解的是,该提示信息还可以显示在新打开的窗口中,该新打开的窗口界面置顶显示在编辑器交互界面之上。
在一个示例中,每条所述检测结果显示的内容还包括:
定位控件,所述定位控件用于响应于用户对所述定位控件的触发操作,将当前摄像机视角参数设置为获得所述目标图像时的摄像机视角参数。
具体的,当检测结果显示的内容为定位控件时,将所述定位控件与获得所述目标图像时的摄像机视角参数进行绑定,以生成定位控件。
相较于上述仅显示提示信息的实施方式,本实施方式中,在显示提示信息的同时还显示了定位控件。在获取场景图像时,会将获取场景图像时的摄像机视角参数与该场景图像进行绑定,并将与场景图像绑定的摄像机视角参数进行保存。保存的方式可以是写入文件中,或者写入数据库中。具体的,摄像机视角参数包括摄像机的位置信息、旋转信息、视野角度、视锥体的近剪切面信息和视锥体的远剪切面信息。以unity3D为例,在一个示例中,根据transform组件可知,position属性的值(即位置信息)为{x:4.48,y:3.7,z:-7.74};rotation属性的值(即旋转信息)为{x:18.178,y:-23.276,z:-7.693};field of view属性的值(即视野角度)为60;near clip plane属性的值(即视锥体的近剪切面信息)为0.3;near clip plane属性的值(即视锥体的远剪切面信息)为1000。在三维场景中的三维对象数据不变动的情况下,被设置为相同摄像机视角参数的摄像机所拍摄到内容画面是相同的。
因此,在本实施例中,当检测出用户创建的三维场景中存在违规信息时,不仅可以将保护违规信息的提示图片(即目标图像)显示给用户,利用边界框将图片中违规的内容框起来,以提示用户具体的违规内容。进一步,当用户触发定位控件时,还会将当前摄像机的视角参数恢复到拍摄得到目标图像时的视角参数,在该视角参数之下,界面中所显示的三维场景中至少包括被判定为违规的三维对象。例如,被判定为违规的三维对象是三维小黄人模型,在恢复目标图像绑定的摄像机视角参数后,当前界面中会显示三维小黄人模型,用户无需自己调整摄像机视角,便于用户直接对照目标图像对小黄人模型进行修改。可以理解的是,当用户操作的终端使用鼠标作为输入设备时,用户触发定位控件的触发操作可以是利用鼠标单击的操作;当用户操作的终端使用触控屏作为输入设备时,用户触发定位控件的触发操作可以是利用手指触摸的操作。具体实施时,可以根据终端输入设备的类型设置对应的触发操作,以上触发操作的实施方式仅作为示例性说明,不作为对本申请保护范围的限制。
在一个示例中,每条所述检测结果显示的内容还包括:
复审控件,所述复审控件用于响应于用户对所述复审控件的触发操作,将当前摄像机视角参数设置为获得所述目标图像时的摄像机视角参数,并获取所述交互界面当前所显示的三维场景画面作为复审图像,并将所述复审图像与所述目标图像进行关联;
所述方法还包括:
步骤C1,利用图像识别算法对所述复审图像进行违规信息识别,得到复审结果;
步骤C2,当所述复审结果指示对应的复审图像未包含违规信息时,从所述三维场景对应的违规集合中删除与所述复审图像关联的所述目标图像。
具体的,当检测结果显示的内容为复审控件时,将所述复审控件与获得所述目标图像时的摄像机视角参数进行绑定,以生成复审控件。
需要说明的是,平台每检测到有一张场景图像存在违规信息,就会将该场景图像添加到该三维场景对应的违规集合中,并为添加进来的场景图像关联对应类型的违规标记,通过判断某个三维场景对应的违规集合中是否存在场景图像,就可以判断该三维场景是否存在违规内容,在三维场景存在违规内容的情况下,不允许该三维场景在平台进行发布。同时,通过识别与违规集合中的场景图像关联的违规标记,可以识别对应场景图像的违规类型。平台将违规信息通过提示信息反馈给用户之后,用户会根据提示信息对三维场景进行修改或者申诉。
具体的,在自动检测到三维场景中存在违规信息之后,用户一般有两种解决方案,第一种是直接将违规内容进行删除或修改,第二种是对审核结果不服,进行人工申诉。现有技术中,对于人工申诉一般由人工进行复审,例如,审核结果是可能侵犯著作权,用户在申诉时提供其作为对应著作权的权利证明(著作权证书、著作权授权许可),由人工进行审核,在人工审核确定不侵权之后,由人工删除对应的违规标记。该违规标记包括以下类型:著作权违规、商标权违规、涉暴违规、涉黄违规。本实施例中,为了便于工作人员进行操作,可以为每个三维场景对应的违规集合构建一个对应的违规信息表格,并将该表格展示在违规信息展示页面中,表格中每一行第一列为违规标记的类型,第二列为包含违规信息的场景图像。例如,第一行第一列违规标记的类型为著作权违规,第二列为包含小黄人的场景图像,便于人工核对。
可以理解的是,相较于进行人工申诉,更多的情况是经过平台的反馈,用户发现自己创建的三维场景中确实存在违规内容,然后对违规内容进行删除或修改。在用户删除违规内容之后,平台还需要再次对三维场景进行审核,在审核通过后才能够将存在违规信息的场景图像从违规集合中删除,只有当三维场景对应的违规集合中不存在任何一张场景图像时,才判定该三维场景无违规内容,此时才允许三维场景在平台上发布。一种容易想到的方案是,在用户对违规内容进行删除或修改之后,用户再将修改后的三维场景文件上传至平台并提醒平台的工作人员进行审核,平台工作人员打开三维场景文件之后,根据违规信息表格查看包含违规信息的场景图像并核对模型中是否已经删除违规内容,若已经删除了违规内容,则由人工将对应的场景图像从违规集合中删除,只有当三维场景对应的违规集合中不存在任何一张场景图像时,才允许该三维场景在平台上发布,显然这种人工复审的方案效率不高,需要消耗过多人力资源。
本实施例中,提供了自动实现违规内容复审的方案。具体的,当用户在违规提示页面中查看到三维场景中被判定为违规的对象后,用户会对照提示图片调整摄像机视角参数,找到违规的对象进行修改,或者直接触发复审控件实现自动切换视角,然后进行修改。修改完成之后,用户触发复审控件,此时编辑器会从复审控件接收获得所述目标图像时的摄像机视角参数,将当前摄像机视角参数设置为获得所述目标图像时的摄像机视角参数,并获取所述交互界面当前所显示的三维场景画面作为复审图像,并将所述复审图像与所述目标图像进行关联;然后将复审图像进行违规信息识别,若是经过识别后,检测到所述复审结果指示对应的复审图像未包含违规信息时,从所述三维场景对应的违规集合中删除与所述复审图像关联的所述目标图像,从而实现自动复审,无需人工复审。可以理解的是,当用户触发复审控件之后,在复审结果没有出来前,会在该条检测结果显示的内容中增加一行文字提示,例如文字提示为“复审中,请稍后!”,当复审结果为不通过时,则会变更文字提示为“复审未通过,请确认违规内容是否删除?如有疑惑请与客服联系”。若是通过了复审,则在从所述三维场景对应的违规集合中删除与所述复审图像关联的所述目标图像之后,也会将该目标图像在违规提示页面中的内容进行删除。
图11示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端(或服务器)。如图11所示,该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现实施例一或实施例二所述的一种三维场景的待审核图像集合获取方法或者实施例三或实施例四或实施例五所述的一种三维场景审核方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行实施例一或实施例二所述的一种三维场景的待审核图像集合获取方法或者实施例三或实施例四或实施例五所述的一种三维场景审核方法。本领域技术人员可以理解,图11中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时执行上述实施例一或实施例二所述的一种三维场景的待审核图像集合获取方法或者实施例三或实施例四或实施例五所述的一种三维场景审核方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行上述实施例一或实施例二所述的一种三维场景的待审核图像集合获取方法或者实施例三或实施例四或实施例五所述的一种三维场景审核方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRA)、存储器总线(Rambus)直接RAM(RDRA)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
Claims (11)
1.一种三维场景的待审核图像集合获取方法,应用于服务器,其特征在于,所述方法包括:
处于在线编辑模式下,响应于用户的操控操作,调整三维场景数据,并通过交互界面实时显示与所述操控操作对应的三维场景;
检测到所述操控操作满足预设条件时,获取所述交互界面当前所显示三维场景的画面作为场景图像,并利用所述场景图像更新待审核图像集合;所述待审核图像集合中的场景图像用于进行违规信息识别。
2.根据权利要求1所述的一种三维场景的待审核图像集合获取方法,其特征在于,所述操控操作满足预设条件,具体包括:所述操控操作是组合操作;其中,
所述组合操作,用于使三维场景中被选中的多个第一对象与同一个第二对象建立父子关系,得到整体模型。
3.根据权利要求2所述的一种三维场景的待审核图像集合获取方法,其特征在于,所述利用所述场景图像更新待审核图像集合,具体包括:
检测到组合操作时,确定当前组合操作对应的多个第一对象是否与上一次组合操作对应的所述多个第一对象至少有部分相同;
若否,则将当前组合操作对应的场景图像添加到待审核图像集合中,以更新所述待审核图像集合;
若是,则将当前组合操作对应的场景图像添加到待审核图像集合中并将上一次组合操作对应的场景图像从待审核图像集合中剔除,以更新所述待审核图像集合。
4.一种三维场景审核方法,应用于服务器,其特征在于,所述方法包括:
根据权利要求1或2或3的方法,获取三维场景的待审核图像集合;
利用图像识别算法对所述待审核图像集合中的所述场景图像进行违规信息识别,得到审核结果。
5.根据权利要求4所述的一种三维场景审核方法,其特征在于,所述方法还包括:
当所述审核结果指示对应的场景图像包含违规信息时,将包含违规信息的场景图像作为目标图像,并添加到违规集合中;
在所述交互界面的提示区域显示违规提示页面;其中,所述违规提示页面用于显示基于违规集合中目标图像所生成的提示内容,所述提示内容包括多条检测结果,每条所述检测结果分别与一张目标图像相对应;每条所述检测结果显示的内容包括以下内容中的任意一个或任意多个的组合:提示文字和提示图片。
6.根据权利要求5所述的一种三维场景审核方法,其特征在于,每条所述检测结果显示的内容还包括:
定位控件,所述定位控件用于响应于用户对所述定位控件的触发操作,将当前摄像机视角参数设置为获得所述目标图像时的摄像机视角参数。
7.根据权利要求5所述的一种三维场景审核方法,其特征在于,每条所述检测结果显示的内容还包括:
复审控件,所述复审控件用于响应于用户对所述复审控件的触发操作,将当前摄像机视角参数设置为获得所述目标图像时的摄像机视角参数,并获取所述交互界面当前所显示的三维场景画面作为复审图像,并将所述复审图像与所述目标图像进行关联;
所述方法还包括:
利用图像识别算法对所述复审图像进行违规信息识别,得到复审结果;
当所述复审结果指示对应的复审图像未包含违规信息时,从所述三维场景对应的违规集合中删除与所述复审图像关联的所述目标图像。
8.根据权利要求5所述的一种三维场景审核方法,其特征在于,基于违规集合中的目标图像生成提示内容的过程具体包括:
当检测结果显示的内容为提示文字时,基于所述目标图像在进行违规信息识别时检测到的违规类型,以生成提示文字;
当检测结果显示的内容为提示图片时,基于所述目标图像在进行违规信息识别时检测到的违规对象,在所述目标图像上显示与所述违规对象对应的边界框,以生成提示图片;
当检测结果显示的内容为提示图片时,基于所述目标图像在进行违规信息识别时检测到的违规对象,在所述目标图像上显示与所述违规对象对应的标识符,以生成提示图片;
当检测结果显示的内容为提示图片时,基于所述目标图像在进行违规信息识别时检测到的违规对象,将所述违规对象从目标图像上分割出来作为提示图片的内容,以生成提示图片。
9.一种三维场景审核方法,应用于服务器,其特征在于,所述方法包括:
根据权利要求3的方法,获取三维场景的待审核图像集合;
利用图像识别算法对所述待审核图像集合中的所述场景图像进行违规信息识别,得到审核结果;
其中,所述利用图像识别算法对所述待审核图像集合中的所述场景图像进行违规信息识别,得到审核结果,具体包括:
在检测到当前组合操作对应的多个第一对象与上一次组合操作对应的所述多个第一对象完全不同时,在将当前组合操作对应的场景图像添加到待审核图像集合中之前,利用图像识别算法对所述待审核图像集合中的所述场景图像进行违规信息识别,得到审核结果,并将已经被识别过的场景图像从待审核图像集合中删除。
10.一种计算机装置,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1至3任一项所述三维场景的待审核图像集合获取方法的步骤或权利要求4至8任一项所述三维场景审核方法或权利要求9所述三维场景审核方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至3任一项所述三维场景的待审核图像集合获取方法的步骤或权利要求4至8任一项所述三维场景审核方法或权利要求9所述三维场景审核方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211382370.7A CN116109911A (zh) | 2022-12-15 | 2022-12-15 | 一种三维场景审核方法、装置及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211382370.7A CN116109911A (zh) | 2022-12-15 | 2022-12-15 | 一种三维场景审核方法、装置及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116109911A true CN116109911A (zh) | 2023-05-12 |
Family
ID=86266355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211382370.7A Pending CN116109911A (zh) | 2022-12-15 | 2022-12-15 | 一种三维场景审核方法、装置及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116109911A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116594532A (zh) * | 2023-07-12 | 2023-08-15 | 江西格如灵科技股份有限公司 | 一种3d模型审核方法、系统、计算机及可读存储介质 |
-
2022
- 2022-12-15 CN CN202211382370.7A patent/CN116109911A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116594532A (zh) * | 2023-07-12 | 2023-08-15 | 江西格如灵科技股份有限公司 | 一种3d模型审核方法、系统、计算机及可读存储介质 |
CN116594532B (zh) * | 2023-07-12 | 2023-09-08 | 江西格如灵科技股份有限公司 | 一种3d模型审核方法、系统、计算机及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110163198B (zh) | 一种表格识别重建方法、装置和存储介质 | |
CN105684038B (zh) | 用于替换图像的部分的图像缓存 | |
US10467800B2 (en) | Method and apparatus for reconstructing scene, terminal device, and storage medium | |
CN107168619B (zh) | 用户生成内容处理方法和装置 | |
CN111429341B (zh) | 一种视频处理方法、设备及计算机可读存储介质 | |
WO2021082589A1 (zh) | 内容审核模型的训练方法和装置、视频内容的审核方法和装置、计算机设备以及存储介质 | |
CN110832583A (zh) | 用于从多个图像帧生成概要故事板的系统和方法 | |
CN105684046B (zh) | 生成图像组成 | |
US10282614B2 (en) | Real-time detection of object scanability | |
US11574392B2 (en) | Automatically merging people and objects from multiple digital images to generate a composite digital image | |
CN112199545B (zh) | 基于图片文字定位的关键词显示方法、装置及存储介质 | |
Balchandani et al. | A deep learning framework for smart street cleaning | |
CN111612891A (zh) | 模型生成方法、点云数据处理方法、装置、设备及介质 | |
CN111062854A (zh) | 检测水印的方法、装置、终端及存储介质 | |
Lee et al. | Synthetic image dataset development for vision-based construction equipment detection | |
CN116109911A (zh) | 一种三维场景审核方法、装置及计算机存储介质 | |
Lin et al. | Integrated circuit board object detection and image augmentation fusion model based on YOLO | |
Yang et al. | Multi-modality image manipulation detection | |
CN112819509B (zh) | 自动筛选广告图片的方法、系统、电子设备和存储介质 | |
CN114359159A (zh) | 视频生成方法、系统、电子设备和存储介质 | |
KR102495954B1 (ko) | 2d 이미지를 이용한 3d 모델 생성 방법, 3d 모델 생성 시스템 및 이를 위한 컴퓨터 프로그램 | |
CN116594759A (zh) | 一种三维场景审核方法、装置及计算机存储介质 | |
CN108769612A (zh) | 一种vr可视化平台 | |
US11042274B2 (en) | Extracting demonstrations from in-situ video content | |
Nallapati et al. | Identification of Deepfakes using Strategic Models and Architectures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |