WO2023128045A1 - 기계학습을 위한 프리핸드 스케치 이미지 생성 방법 및 시스템 - Google Patents

기계학습을 위한 프리핸드 스케치 이미지 생성 방법 및 시스템 Download PDF

Info

Publication number
WO2023128045A1
WO2023128045A1 PCT/KR2022/000874 KR2022000874W WO2023128045A1 WO 2023128045 A1 WO2023128045 A1 WO 2023128045A1 KR 2022000874 W KR2022000874 W KR 2022000874W WO 2023128045 A1 WO2023128045 A1 WO 2023128045A1
Authority
WO
WIPO (PCT)
Prior art keywords
generating
sketch
model
freehand
information processing
Prior art date
Application number
PCT/KR2022/000874
Other languages
English (en)
French (fr)
Inventor
윤경원
블랑코로저
현경훈
반성훈
Original Assignee
주식회사 리콘랩스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 리콘랩스 filed Critical 주식회사 리콘랩스
Publication of WO2023128045A1 publication Critical patent/WO2023128045A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • G06T15/20Perspective computation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/203Drawing of straight lines or curves
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/02Non-photorealistic rendering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects

Definitions

  • the present disclosure relates to a method and system for generating freehand sketch images for machine learning, and more particularly, to a method and system for generating a plurality of freehand sketch images from a three-dimensional model.
  • the present disclosure provides a method for generating freehand sketch data for machine learning to solve the above problems, a computer program stored in a recording medium, and a device (system).
  • the present disclosure provides 2D freehand sketch data from pre-generated 3D models to create learning data for generating a machine learning model for converting a 2D sketch into a 3D model. It is to provide a way to automatically generate .
  • the present disclosure may be implemented in a variety of ways, including a method, apparatus (system) or computer program stored on a readable storage medium.
  • a method for generating freehand sketch data for machine learning executed by at least one processor includes receiving a 3D model of a target object and based on the 3D model. and generating a plurality of different freehand sketch images of the target object, wherein each freehand sketch image includes a plurality of strokes and a plurality of guide lines.
  • generating a plurality of freehand sketch images may include generating a first edge map looking at a target object in a first direction from a first point based on a 3D model; Generating a second edge map looking at the target object in a second direction from a second point based on the model, generating a first sketch image based on the first 87 edge map, and generating a second edge map based on the second edge map 2 characterized in that it comprises the step of generating a sketch image.
  • generating a first edge map may include adjusting vertices in a 3D model and determining a projection matrix based on a first point and a first direction; Adjusting the projection matrix, and generating a first edge map based on the three-dimensional model and the adjusted projection matrix.
  • the generating of the first sketch image may include generating a stroke by connecting pixels in the first edge map, the length of the stroke reaching a first predetermined threshold or a predetermined second and starting generation of a new stroke when the stroke is bent at an angle exceeding a threshold value.
  • the generating of the first sketch image may further include applying a thickness profile and a transparency profile to each generated stroke.
  • the generating of the first sketch image may further include applying a texture to each generated stroke.
  • the step of generating a first sketch image includes the step of converting into two straight lines by performing polygonization on each of the generated strokes, and selecting some of the converted straight lines,
  • the method may further include generating guide lines of the first type by extending the lengths of the selected straight lines.
  • generating a first sketch image may include performing polygonization on each of the generated strokes and converting them into two straight lines in a vertical direction and a straight line in a horizontal direction, and converted Selecting some of the straight lines in the vertical direction and the straight lines in the horizontal direction and extending the length of the selected straight lines to generate guide lines of a second type.
  • a computer readable non-transitory recording medium recording instructions for executing a freehand sketch generation method for machine learning on a computer.
  • An information processing system includes a communication module, a memory, and at least one processor connected to the memory and configured to execute at least one computer-readable program included in the memory, and including at least one program. includes instructions for receiving a 3D model of the target object and generating a plurality of different freehand sketch images of the target object based on the 3D model, each freehand sketch image having a plurality of strokes ( stroke) and a plurality of guide lines.
  • data for machine learning may be obtained more efficiently and effectively by automatically generating a plurality of freehand sketches from a 3D model.
  • FIG. 1 is a diagram illustrating an example in which a plurality of freehand sketch images are generated from a 3D model according to an embodiment of the present disclosure.
  • FIG. 2 is a block diagram showing the internal configuration of a user terminal and an information processing system according to an embodiment of the present disclosure.
  • FIG. 3 is a diagram illustrating a method of generating a sketch image from a 3D model according to an embodiment of the present disclosure
  • FIG. 4 is a diagram illustrating a method of generating a stroke of a sketch image from a 3D model according to an embodiment of the present disclosure.
  • FIG. 5 is a diagram illustrating an example of generating a plurality of strokes of a sketch image from a 3D model according to an embodiment of the present disclosure.
  • FIG. 6 is a diagram illustrating an example of a thickness profile and an alpha profile according to an embodiment of the present disclosure.
  • FIG 7 illustrates an example of primary spatial noise and secondary spatial noise according to an embodiment of the present disclosure.
  • FIG 8 shows an example of a texture applied to a stroke according to an embodiment of the present disclosure.
  • FIG. 9 is a diagram illustrating a method of generating a first type of guide line according to an embodiment of the present disclosure.
  • FIG. 10 is a diagram illustrating an example of generating a first type of guide line of a sketch image according to an embodiment of the present disclosure.
  • FIG. 11 is a diagram illustrating a method of generating a second type of guide line of a sketch image according to an embodiment of the present disclosure.
  • FIG. 12 is a diagram illustrating an example of generating a second type of guide line of a sketch image according to an embodiment of the present disclosure.
  • FIG. 13 is a diagram illustrating an example of a 2D sketch image generated from a 3D model according to an embodiment of the present disclosure.
  • FIG. 14 is a diagram illustrating an example of a method of generating a sketch image from a 3D model according to an embodiment of the present disclosure.
  • a modulee' or 'unit' used in the specification means a software or hardware component, and the 'module' or 'unit' performs certain roles.
  • 'module' or 'unit' is not meant to be limited to software or hardware.
  • a 'module' or 'unit' may be configured to reside in an addressable storage medium and may be configured to reproduce one or more processors.
  • a 'module' or 'unit' includes components such as software components, object-oriented software components, class components, and task components, processes, functions, and attributes. , procedures, subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays, or variables.
  • a 'module' or 'unit' may be implemented with a processor and a memory.
  • 'Processor' should be interpreted broadly to include general-purpose processors, central processing units (CPUs), microprocessors, digital signal processors (DSPs), controllers, microcontrollers, state machines, and the like.
  • 'processor' may refer to an application specific integrated circuit (ASIC), programmable logic device (PLD), field programmable gate array (FPGA), or the like.
  • ASIC application specific integrated circuit
  • PLD programmable logic device
  • FPGA field programmable gate array
  • 'Processor' refers to a combination of processing devices, such as, for example, a combination of a DSP and a microprocessor, a combination of a plurality of microprocessors, a combination of one or more microprocessors in conjunction with a DSP core, or a combination of any other such configurations. You may. Also, 'memory' should be interpreted broadly to include any electronic component capable of storing electronic information.
  • 'Memory' includes random access memory (RAM), read-only memory (ROM), non-volatile random access memory (NVRAM), programmable read-only memory (PROM), erasable-programmable read-only memory (EPROM), It may also refer to various types of processor-readable media, such as electrically erasable PROM (EEPROM), flash memory, magnetic or optical data storage, registers, and the like.
  • RAM random access memory
  • ROM read-only memory
  • NVRAM non-volatile random access memory
  • PROM programmable read-only memory
  • EPROM erasable-programmable read-only memory
  • a memory is said to be in electronic communication with the processor if the processor can read information from and/or write information to the memory.
  • Memory integrated with the processor is in electronic communication with the processor.
  • a 'system' may include at least one of a server device and a cloud device, but is not limited thereto.
  • a system may consist of one or more server devices.
  • a system may consist of one or more cloud devices.
  • the system may be operated by configuring a server device and a cloud device together.
  • a 'machine learning model' may include any model used to infer an answer to a given input.
  • the machine learning model may be a machine learning model that generates a 3D model by learning 2D sketch data.
  • a model described as one machine learning model may include a plurality of machine learning models, and a plurality of models described as separate machine learning models may be implemented as a single machine learning model. may be
  • 'display' may refer to any display device associated with a computing device, for example, any display device capable of displaying any information/data provided or controlled by the computing device. can refer to
  • 'each of a plurality of A' or 'each of a plurality of A' may refer to each of all components included in a plurality of A's, or each of some components included in a plurality of A's. .
  • 'a plurality of images' may refer to a video including a plurality of images
  • 'video' may refer to a plurality of images included in the video.
  • the information processing system can generate a machine learning model capable of converting a 2D sketch into a 3D model by learning a plurality of training data pairs composed of a 3D model and a corresponding 2D freehand sketch.
  • the information processing system may generate a plurality of freehand sketch images based on the 3D model of the target object.
  • a freehand sketch may refer to an image similar to a user (eg, a designer) directly sketching a target object for design.
  • the information processing system may receive the three-dimensional model 110 to create a freehand sketch image.
  • the information processing system may generate a plurality of different freehand sketch images 120 , 130 , and 140 for one 3D model 110 .
  • the plurality of freehand sketch images 120 , 130 , and 140 may be 2D images of the 3D model 110 viewed from different angles.
  • the plurality of freehand sketch images may generate freehand sketches viewed from the front, left side, and right side.
  • FIG. 1 it is shown that three freehand sketch images 120, 130, and 140 are generated from one 3D model 110, but it is not limited thereto, and any number of freehand sketch images may be generated. .
  • Each pair of sketch images 120 may be used as training data for training a machine learning model.
  • pairs of various pre-generated 3D models and corresponding freehand sketch images are created and used as learning data.
  • Each of the plurality of freehand sketch images 120, 130, and 140 may include a plurality of strokes and a plurality of guide lines.
  • the plurality of strokes may be line segments constituting the target object in the sketch image.
  • the plurality of guide lines may include a first-type supporting guide line indicating the main direction of the sketch, a second-type construction line indicating a simplified geometric structure of the sketch, and the like.
  • the information processing system may generate an edge map using a projection matrix for stroke generation. Also, the information processing system may generate a stroke using pixels in the edge map. A detailed description thereof will be replaced with descriptions of FIGS. 4 to 8 to be described later.
  • the information processing system may create a stroke from the 3D model, adjust the thickness and transparency of the stroke, or adjust the texture in order to generate a guideline. A detailed description thereof will be replaced with descriptions of FIGS. 9 to 12 to be described later.
  • the process of generating a plurality of freehand sketch images from a 3D model has been described as being performed by an information processing system, but is not limited thereto and may be implemented differently in other embodiments.
  • at least some or all of a series of processes for generating a plurality of freehand sketch images from a 3D model may be performed by a user terminal.
  • the following will be described on the premise that the freehand sketch image generation process is performed by the information processing system.
  • FIG. 2 is a block diagram showing the internal configuration of the user terminal 210 and the information processing system 230 according to an embodiment of the present disclosure.
  • the user terminal 210 may refer to any computing device capable of executing a 3D modeling application, a freehand sketch image generation application for learning a 3D model, a web browser, etc. and capable of wired/wireless communication, for example , may include a mobile phone terminal, a tablet terminal, a PC terminal, and the like.
  • the user terminal 210 may include a memory 212 , a processor 214 , a communication module 216 and an input/output interface 218 .
  • information processing system 230 may include memory 232 , processor 234 , communication module 236 and input/output interface 238 .
  • the user terminal 210 and the information processing system 230 are configured to communicate information and/or data through the network 220 using respective communication modules 216 and 236. It can be.
  • the input/output device 240 may be configured to input information and/or data to the user terminal 210 through the input/output interface 218 or output information and/or data generated from the user terminal 210.
  • the memories 212 and 232 may include any non-transitory computer readable media. According to one embodiment, the memories 212 and 232 are non-perishable mass storage devices such as random access memory (RAM), read only memory (ROM), disk drives, solid state drives (SSDs), flash memory, and the like. (permanent mass storage device) may be included. As another example, a non-perishable mass storage device such as a ROM, SSD, flash memory, or disk drive may be included in the user terminal 210 or the information processing system 230 as a separate permanent storage device separate from memory.
  • RAM random access memory
  • ROM read only memory
  • SSDs solid state drives
  • flash memory and the like.
  • a non-perishable mass storage device such as a ROM, SSD, flash memory, or disk drive may be included in the user terminal 210 or the information processing system 230 as a separate permanent storage device separate from memory.
  • the memories 212 and 232 include an operating system and at least one program code (eg, a 3D modeling application installed and driven in the user terminal 210, a freehand sketch image generation application for machine learning of a 3D model) code for etc.) can be stored.
  • program code eg, a 3D modeling application installed and driven in the user terminal 210, a freehand sketch image generation application for machine learning of a 3D model) code for etc.
  • a recording medium readable by such a separate computer may include a recording medium directly connectable to the user terminal 210 and the information processing system 230, for example, a floppy drive, a disk, a tape, a DVD/CD- It may include a computer-readable recording medium such as a ROM drive and a memory card.
  • software components may be loaded into the memories 212 and 232 through a communication module rather than a computer-readable recording medium. For example, at least one program is loaded into the memories 212 and 232 based on a computer program installed by files provided by developers or a file distribution system that distributes application installation files through the network 220 . It can be.
  • the processors 214 and 234 may be configured to process instructions of a computer program by performing basic arithmetic, logic, and input/output operations. Instructions may be provided to processors 214 and 234 by memory 212 and 232 or communication modules 216 and 236 . For example, processors 214 and 234 may be configured to execute instructions received according to program code stored in a recording device such as memory 212 and 232 .
  • the communication modules 216 and 236 may provide configurations or functions for the user terminal 210 and the information processing system 230 to communicate with each other through the network 220, and the user terminal 210 and/or information processing.
  • System 230 may provide configurations or functions for communicating with other user terminals or other systems (eg, separate cloud systems, etc.). For example, a request or data generated by the processor 214 of the user terminal 210 according to a program code stored in a recording device such as the memory 212 (eg, freehand sketch data generation request, 3D model data, etc.) ) may be transmitted to the information processing system 230 through the network 220 under the control of the communication module 216 .
  • a control signal or command provided under the control of the processor 234 of the information processing system 230 passes through the communication module 236 and the network 220 through the communication module 216 of the user terminal 210. It may be received by the user terminal 210 .
  • the user terminal 210 may receive a freehand sketch image or the like from the information processing system 230 through the communication module 216 .
  • the input/output interface 218 may be a means for interfacing with the input/output device 240 .
  • the input device may include a device such as a camera, keyboard, microphone, mouse, etc. including an audio sensor and/or image sensor
  • the output device may include a device such as a display, speaker, haptic feedback device, or the like.
  • the input/output interface 218 may be a means for interface with a device in which a configuration or function for performing input and output is integrated into one, such as a touch screen. For example, when the processor 214 of the user terminal 210 processes a command of a computer program loaded into the memory 212, information and/or data provided by the information processing system 230 or other user terminals are used.
  • a service screen or the like configured as described above may be displayed on the display through the input/output interface 218 .
  • the input/output device 240 is not included in the user terminal 210 in FIG. 2 , it is not limited thereto, and the user terminal 210 and the user terminal 210 may be configured as one device.
  • the input/output interface 238 of the information processing system 230 is connected to the information processing system 230 or means for interface with a device (not shown) for input or output that the information processing system 230 may include.
  • the input/output interfaces 218 and 238 are shown as separate elements from the processors 214 and 234, but are not limited thereto, and the input/output interfaces 218 and 238 may be included in the processors 214 and 234. there is.
  • the user terminal 210 and the information processing system 230 may include more components than those shown in FIG. 2 . However, there is no need to clearly show most of the prior art components. According to one embodiment, the user terminal 210 may be implemented to include at least some of the aforementioned input/output devices 240 . In addition, the user terminal 210 may further include other components such as a transceiver, a global positioning system (GPS) module, a camera, various sensors, and a database. For example, when the user terminal 210 is a smart phone, it may include components that are generally included in a smart phone, for example, an acceleration sensor, a gyro sensor, a camera module, various physical buttons, and a touch screen.
  • GPS global positioning system
  • Various components such as a button using a panel, an input/output port, and a vibrator for vibration may be implemented to be further included in the user terminal 210 .
  • the processor 214 of the user terminal 210 may be configured to operate an application providing a freehand sketch image. At this time, codes associated with the application and/or program may be loaded into the memory 212 of the user terminal 210 .
  • the processor 214 uses an input device such as a camera, a microphone, and the like including a touch screen, a keyboard, an audio sensor, and/or an image sensor connected to the input/output interface 218. It is possible to receive input or selected text, image, video, voice, and/or action, etc., and store the received text, image, video, voice, and/or action in the memory 212 or the communication module 216. And it can be provided to the information processing system 230 through the network 220.
  • an input device such as a camera, a microphone, and the like including a touch screen, a keyboard, an audio sensor, and/or an image sensor connected to the input/output interface 218. It is possible to receive input or selected text, image, video, voice, and/or action, etc., and store the received text, image, video, voice, and/or action in the memory 212 or the communication module 216. And it can be provided to the information processing system 230 through the network 220.
  • the processor 214 receives a 3D model through the input/output interface 218 and sends a 3D model and freehand sketch image generation request to the communication module to generate a freehand sketch image for the 3D model ( 216) and the information processing system 230 through the network 220.
  • the processor 214 of the user terminal 210 manages, processes, and/or stores information and/or data received from the input device 240, other user terminals, the information processing system 230, and/or a plurality of external systems. can be configured to Information and/or data processed by processor 214 may be provided to information processing system 230 via communication module 216 and network 220 .
  • the processor 214 of the user terminal 210 may transmit and output information and/or data to the input/output device 240 through the input/output interface 218 .
  • the processor 214 may display the received information and/or data on the screen of the user terminal.
  • the processor 234 of the information processing system 230 may be configured to manage, process, and/or store information and/or data received from a plurality of user terminals 210 and/or a plurality of external systems. Information and/or data processed by the processor 234 may be provided to the user terminal 210 via the communication module 236 and the network 220 .
  • the processor 234 of the information processing system 230 receives a 3D model of the target object from the user terminal 210, and a freehand including a plurality of strokes and a plurality of guidelines for the 3D model. You can create sketch images.
  • the processor 234 of the information processing system 230 may provide the plurality of freehand sketch images thus generated to the user terminal 210 through the communication module 236 and the network 220 .
  • the processor 234 of the information processing system 230 uses the output device 240 such as a display output capable device (eg, a touch screen, a display, etc.) of the user terminal 210 and an audio output capable device (eg, a speaker). It may be configured to output processed information and/or data.
  • the processor 234 of the information processing system 230 provides a 3D model of the target object to the user terminal 210 through the communication module 236 and the network 220, and generates the 3D model. It may be configured to output through a display output capable device of the user terminal 210 .
  • the information processing system may receive (312) a 3D model.
  • the 3D model may be data representing a 3D shape of a target object.
  • Model-view transformation may include modeling transformation and viewing transformation.
  • the information processing system may perform a modeling conversion of transforming from the local coordinate system of the 3D model to the world coordinate system through the scale-rotation adjustment 314 .
  • the information processing system may perform modeling transformation by combining at least one of a position value, a rotation value, and a size value.
  • the information processing system may perform model view conversion 324 after modeling conversion.
  • the model view transformation 324 may indicate transformation of the world coordinate system of the 3D model into a view coordinate system viewed from a specific point and a specific direction. That is, the information processing system may perform a plurality of view transformations corresponding to a plurality of view coordinate systems viewed from different points and directions.
  • the information processing system may perform projection transformation 326 based on the projection adjustment 316 .
  • Projection transformation 326 can represent transforming a view coordinate system into a clip coordinate system.
  • Projection transformation can be divided into linear projection transformation with perspective reduction and projection transformation without perspective reduction.
  • the information processing system may determine a projection matrix according to a specific point and a specific direction for the projection transformation 326 . Thereafter, the information processing system may perform projection transformation 326 by adjusting the projection matrix according to whether the projection is reduced due to perspective.
  • the information processing system may determine a projection matrix while changing a specific point and a specific direction. For example, the information processing system may determine a projection matrix based on a first point and a first direction, or may determine a projection matrix based on a second point different from the first point and a second direction different from the first direction. . That is, the information processing system can determine any one projection matrix among a plurality of projection matrices according to the point and direction.
  • the information processing system may generate an edge map 342 from normal (normal) data 332 and depth data 334 .
  • Normal data 332 and depth data 334 may be generated by projection transformation. Accordingly, the information processing system may generate different normal data 332 and depth data 334 according to the point and direction in which the projection matrix is determined. Accordingly, the information processing system may generate different edge maps based on different normal data 332 and different depth data 334 .
  • the information processing system may configure a stroke by connecting pixels in the at least one edge map (354). Accordingly, the information processing system may generate strokes constituting the freehand sketch image for each different edge map. Accordingly, the present invention can generate a plurality of freehand sketch images for each different edge map.
  • the information processing system may perform multi-stroke rendering 352 based on the stroke length and stroke angle configured through the edge map. That is, the information processing system may generate at least one or more strokes based on the stroke length and stroke angle. For example, the information processing system may terminate generation of existing strokes and generate new strokes when the stroke length reaches a predetermined first threshold value. As another example, the information processing system may terminate generation of the existing stroke and generate a new stroke when the angle of the stroke exceeds the second predetermined threshold.
  • the information processing system may perform guide line rendering 356 on the stroke generated through the edge map.
  • the guide line may be a first type guide line indicating the main direction of the sketch or a second type guide line that displays a simplified geometric structure of the sketch.
  • a first type of guideline may be referred to as a supporting guideline.
  • a second type of guide-in may be named a construction guideline.
  • the information processing system may convert the stroke into a plurality of straight lines by performing polygonization on the stroke. After that, guide lines may be generated using some of the plurality of straight lines. A detailed description of the generation of the guideline is replaced with the description to be described later in FIGS. 9 to 12 .
  • the information processing system may perform image-space augmentation 362 after rendering the strokes and guidelines.
  • Image spatial enhancement 362 may be applied at the pixel level.
  • the information processing system may generate 372 a plurality of freehand sketch images after performing image-space augmentation is completed.
  • the information processing system may perform contour 412 and edge detection 414 first.
  • the information processing system can detect a silhouette and a depth edge based on the outline 412 and edge 414 of the edge map.
  • the information processing system may merge 420 the outline 412 and the edge 414 .
  • the information processing system may generate a sketch image by making at least one of stroke thickness, transparency, noise application, and texture application different from each other in order to generate a freehand sketch image like a human hand.
  • the information processing system may repeatedly perform different stroke generating processes a predetermined number of times (eg, N times). For example, as shown in FIG. 4, it can be repeatedly performed by changing at least one of stroke thickness, transparency, noise application, and texture application from random seed #0 (430_0) to random seed #N (430_N). there is.
  • random seed #0 (430_0) will be described as a standard, and the process from random seed #1 to random seed #N will be replaced with description of random seed #0.
  • the information processing system may generate a stroke (440_0). Strokes can be created by a chain of pixels or edges of the outline at any point. At this time, the information processing system may end generation of a new stroke based on the length of the generated stroke and the rotation angle of the stroke. For example, the information processing system may terminate generation of a new stroke when the length of the generated stroke reaches a first threshold value or when the generated stroke is bent at an angle exceeding a second threshold value.
  • the information processing system may apply (450_0) a thickness and an alpha profile to the created stroke. Specifically, the information processing system may apply at least one of a stroke thickness profile and a transparency profile as a specific value. This will be described later with reference to FIG. 6 .
  • the information processing system may sequentially perform primary spatial noise application (460_0) and secondary spatial noise application (470_0).
  • the first-order spatial noise and the second-order spatial noise may be perlin noise functions having different scale levels. This will be described later with reference to FIG. 7 .
  • the information processing system may apply (480_0) a texture to the generated stroke. For example, a texture in which a line is drawn on paper using a pencil or pen may be applied to the created stroke.
  • the information processing system may generate a plurality of strokes by repeatedly performing a process of generating strokes from random seed #0 to random seed #N, and merging each stroke.
  • FIG. 5 is a diagram illustrating an example of generating a plurality of strokes of a sketch image from a 3D model according to an embodiment of the present disclosure.
  • the first picture 510 shows the result of merging the edge and the contour of the edge map.
  • the second picture 520 shows an example of generating a stroke using one of a plurality of random seeds.
  • a third picture 530 shows an example in which thickness and alpha profiles are applied to a plurality of strokes.
  • the fourth figure 540 and the fifth figure 550 each show an example in which primary spatial noise and secondary spatial noise are applied to a plurality of strokes.
  • a sixth figure 560 shows an example in which a sketch composed of a plurality of strokes is generated by merging a plurality of sketches generated from a plurality of random seeds.
  • FIG. 6 is a diagram illustrating an example of a thickness profile 610 and an alpha profile 620 according to an embodiment of the present disclosure.
  • the information processing system may use a profile that varies in thickness and transparency along the stroke.
  • the stroke thickness may increase as it approaches the midpoint and decrease as it moves away from the midpoint.
  • the transparency of the stroke may decrease as it approaches the midpoint and increase as it moves away from the midpoint.
  • a stroke similar to that drawn by a human hand can be created by allowing one stroke to have thickness and transparency according to a position.
  • primary spatial noise 710 can create stroke transitions to simulate a designer's level of sketching skill.
  • Secondary spatial noise 720 can incorporate small perturbations along the stroke to simulate the stability of the designer's hand.
  • the information processing system may generate integrated spatial noise 740 by merging 730 the first and second spatial noises 710 and 720 . As a result, the information processing system may apply integrated spatial noise 740 to the stroke.
  • the texture 810 shows an example of a texture 810 applied to a stroke according to an embodiment of the present disclosure.
  • the texture 810 may be for realizing paper, a texture of a pencil or a pen drawn on paper, or a texture of a pen.
  • FIG. 9 is a diagram illustrating a method of generating a first type of guide line according to an embodiment of the present disclosure.
  • Actual designers can sketch guidelines that indicate the main direction of the sketch when sketching. Accordingly, in the present invention, a freehand sketch similar to a designer's sketch is implemented by generating a first type of guide line indicating the main direction of the sketch.
  • the information processing system may extract an outline 910 from a 3D model.
  • the information processing system may then generate 920 a stroke based on the outline 910 .
  • the information processing system may then apply 930 the thickness and alpha profile to the stroke, and apply 940 spatial noise. Steps 910 to 940 are replaced with descriptions of steps 412 to 470_0 of FIG. 4 for convenience of detailed description.
  • the information processing system may perform simplification 950 of the stroke.
  • the information processing system can convert a plurality of strokes into a plurality of straight lines by performing polygonization on the strokes.
  • the information processing system may perform sampling 960 of selecting some of the plurality of straight lines converted by polygonization.
  • the information processing system may extend 970 the selected part of the straight line.
  • the information processing system may extend the straight line in both directions outside the contour of the target object. That is, straight lines can be extended in the main direction of the sketch for contour sketching.
  • the information processing system may generate the first type of guideline by applying a texture to the finally created straight line (980).
  • the method of generating the first type of guideline has been described.
  • the present invention can implement guidelines included in the actual designer's sketch, and can implement a freehand sketch image that is more realistic.
  • FIG. 10 is a diagram illustrating an example of generating a first type of guide line of a sketch image according to an embodiment of the present disclosure.
  • the first picture 1010 shows an example in which an outline is extracted from a 3D model.
  • a second picture 1020 shows an example in which a stroke is generated based on the outline.
  • a third picture 1030 shows an example in which spatial noise is applied to a stroke.
  • Figure 4 1040 shows an example of converting a plurality of strokes into a plurality of straight lines by performing polygonization on the strokes.
  • a fifth figure 1050 shows an example in which a guide line of the first type is generated by performing sampling to select some of the plurality of generated straight lines and extending the selected partial straight lines.
  • FIG. 11 is a diagram illustrating a method of generating a second type of guide line of a sketch image according to an embodiment of the present disclosure.
  • Designers can sketch guidelines that represent the structure of an object when sketching.
  • the second type of guide line may be a guide line indicating structural characteristics of the target object.
  • the information processing system may extract an outline 1110, generate a stroke 1120, and apply a thickness and an alpha profile (1130) to create a guideline of the second type.
  • Steps 1110 to 1130 are replaced with descriptions of steps 412 to 450_0 of FIG. 4 for convenience of description.
  • the information processing system may proceed with stroke simplification (1140).
  • the information processing system can convert a stroke into a polygon and convert it into two straight lines in a vertical direction and a straight line in a horizontal direction. That is, the two converted straight lines may form an angle of 90 degrees.
  • the information processing system may select some of the converted vertical and horizontal straight lines and extend the lengths of the selected straight lines (1150). After that, the information processing system may generate the second type of guide line by applying the texture (1160).
  • the first picture 1210 shows an example in which an outline is extracted from a 3D model.
  • the second picture 1220 is an example in which a stroke is generated based on the outline.
  • a third drawing 1230 shows an example of converting a plurality of strokes into vertical straight lines and horizontal straight lines by performing polygonization on the strokes and extending the lengths of the straight lines.
  • FIG. 13 is a diagram illustrating an example of a 2D sketch image 1320 generated from a 3D model 1310 according to an embodiment of the present disclosure.
  • the 2D sketch image 1320 includes a plurality of strokes and a plurality of guide lines. With this configuration, a freehand sketch image similar to the actual designer's sketch can be automatically generated.
  • Method 1400 is a diagram illustrating an example of a method 1400 of generating a sketch image from a 3D model according to an embodiment of the present disclosure.
  • Method 1400 may be performed by at least one processor of an information processing system or a user terminal.
  • the information processing system may receive a 3D model of the target object in order to generate a plurality of freehand sketch images (S1410).
  • the information processing system may generate a plurality of different freehand sketch images of the target object (S1420). More specifically, the information processing system provides a first sketch image of a target object viewed from a first point in a first direction and a second sketch image of a target object viewed from a second point different from the first point in a second direction different from the first direction. image can be created. That is, sketch images viewed from various angles of the same 3D model may be generated.
  • the information processing system may generate different edge maps to generate different sketch images. For example, the information processing system may generate a first edge map looking at the target object in a first direction from a first point and a second edge map looking at the target object in a second direction from a second point.
  • the information processing system may adjust vertices in the 3D model to generate an edge map.
  • a projection matrix may be determined based on a point and a direction represented by the edge map.
  • the information processing system may adjust the projection matrix in consideration of an error due to perspective.
  • the information processing system can generate an edge map based on the adjusted projection matrix and the three-dimensional model.
  • the edge map may include normal data and depth data.
  • the information processing system may generate a freehand sketch image using the edge map. More specifically, the information processing system may generate a stroke by connecting pixels in an edge map. At this time, the information processing system may generate a new stroke based on the length and rotation angle of the generated stroke. For example, the information processing system may generate a new stroke when the length of the generated stroke exceeds a first threshold value or the rotation angle of the stroke exceeds a second threshold value.
  • the information processing system may apply at least one of thickness and transparency, noise, and texture of the generated stroke. A detailed description thereof is replaced with the description of FIGS. 4 to 8 above.
  • the information processing system may generate a plurality of guidelines using the generated strokes. For example, the information processing system may generate a first type of guide line indicating the main direction of the sketch or a second type of guide line indicating structural characteristics of the target object. A detailed description thereof is replaced with the description of FIGS. 9 to 12 . Thereafter, the information processing system may learn a model capable of generating a 3D model based on the generated freehand sketch image and the 3D model (S1430).
  • the above method may be provided as a computer program stored in a computer readable recording medium to be executed on a computer.
  • the medium may continuously store programs executable by a computer or temporarily store them for execution or download.
  • the medium may be various recording means or storage means in the form of a single or combined hardware, but is not limited to a medium directly connected to a certain computer system, and may be distributed on a network. Examples of the medium include magnetic media such as hard disks, floppy disks and magnetic tapes, optical recording media such as CD-ROM and DVD, magneto optical media such as floptical disks, and Anything configured to store program instructions may include a ROM, RAM, flash memory, or the like.
  • examples of other media include recording media or storage media managed by an app store that distributes applications, a site that supplies or distributes various other software, and a server.
  • the processing units used to perform the techniques may include one or more ASICs, DSPs, digital signal processing devices (DSPDs), programmable logic devices (PLDs) ), field programmable gate arrays (FPGAs), processors, controllers, microcontrollers, microprocessors, electronic devices, and other electronic units designed to perform the functions described in this disclosure. , a computer, or a combination thereof.
  • a general purpose processor may be a microprocessor, but in the alternative, the processor may be any conventional processor, controller, microcontroller, or state machine.
  • a processor may also be implemented as a combination of computing devices, eg, a combination of a DSP and a microprocessor, a plurality of microprocessors, one or more microprocessors in conjunction with a DSP core, or any other configuration.
  • the techniques include random access memory (RAM), read-only memory (ROM), non-volatile random access memory (NVRAM), PROM (on a computer readable medium, such as programmable read-only memory (EPROM), erasable programmable read-only memory (EPROM), electrically erasable PROM (EEPROM), flash memory, compact disc (CD), magnetic or optical data storage device, or the like. It can also be implemented as stored instructions. Instructions may be executable by one or more processors and may cause the processor(s) to perform certain aspects of the functionality described in this disclosure.
  • Computer readable media includes both computer storage media and communication media including any medium that facilitates transfer of a computer program from one place to another.
  • a storage media may be any available media that can be accessed by a computer.
  • such computer readable media may include RAM, ROM, EEPROM, CD-ROM or other optical disk storage, magnetic disk storage or other magnetic storage devices, or desired program code in the form of instructions or data structures. It can be used for transport or storage to and can include any other medium that can be accessed by a computer. Also, any connection is properly termed a computer-readable medium.
  • the software is transmitted from a website, server, or other remote source using coaxial cable, fiber optic cable, twisted pair, digital subscriber line (DSL), or wireless technologies such as infrared, radio, and microwave
  • coaxial cable , fiber optic cable, twisted pair, digital subscriber line, or wireless technologies such as infrared, radio, and microwave
  • Disk and disc as used herein include CD, laser disc, optical disc, digital versatile disc (DVD), floppy disk, and blu-ray disc, where disks are usually magnetic data is reproduced optically, whereas discs reproduce data optically using a laser. Combinations of the above should also be included within the scope of computer readable media.
  • a software module may reside in RAM memory, flash memory, ROM memory, EPROM memory, EEPROM memory, registers, hard disk, a removable disk, a CD-ROM, or any other form of storage medium known in the art.
  • An exemplary storage medium can be coupled to the processor such that the processor can read information from or write information to the storage medium.
  • the storage medium may be integral to the processor.
  • the processor and storage medium may reside within an ASIC.
  • An ASIC may exist within a user terminal.
  • the processor and storage medium may exist as separate components in a user terminal.

Abstract

본 개시는 적어도 하나의 프로세서에 의해 실행되는 기계학습을 위한 3차원 모델의 프리핸드 스케치 생성 방법에 관한 것이다. 기계학습을 위한 프리핸드 스케치(freehand sketch) 데이터 생성 방법은 대상 물체에 대한 3차원 모델을 수신하는 단계 및 상기 3차원 모델에 기초하여 상기 대상 물체에 대한 서로 상이한 복수의 프리핸드 스케치 이미지를 생성하는 단계를 포함하고, 각 프리핸드 스케치 이미지는 복수의 스트로크(stroke) 및 복수의 가이드 라인을 포함하는 것을 특징으로 한다.

Description

기계학습을 위한 프리핸드 스케치 이미지 생성 방법 및 시스템
본 개시는 기계학습을 위한 프리핸드 스케치(freehand sketch) 이미지 생성 방법 및 시스템에 관한 것으로, 구체적으로, 3차원 모델로부터 복수의 프리핸드 스케치 이미지를 생성하는 방법 및 시스템에 관한 것이다.
종래의 기계학습 모델은 기계학습의 복잡성을 단순화하기 위하여, 3차원 모델로부터 단일 선으로 구성된 프리핸드 스케치를 생성하였다. 그러나, 단일 선의 프리핸드 스케치는 디자이너의 실제 스케치 디자인을 충실히 반영하지 못하는 문제점이 있었다.
이를 보완하기 위하여 샘플 데이터를 이용하여 기계학습을 위한 적정 수준으로 스케치 데이터를 증강시키는 방법이 제안되었다. 그러나, 이러한 방식 역시 충분한 양의 샘플 데이터가 요구되고, 사용자로부터 스케치 데이터를 획득하는 것은 시간과 비용이 많이 소모되는 문제점이 있었다.
이에, 사용자로부터 스케치 데이터를 얻지 않고, 자동으로 스케치 데이터를 획득하기 위한 방법이 제시되었다. 이는 시간과 비용의 소모를 줄이는데 도움이 되지만, 사용자 프리핸드 스케치의 고유 특성이 남아 있지 않아, 프리핸드 스케치를 데이터베이스로 일반화하는데 도움이 되지 않는다는 문제점이 있었다.
본 개시는 상기와 같은 문제점을 해결하기 위한 기계학습을 위한 프리핸드 스케치 데이터 생성 방법, 기록매체에 저장된 컴퓨터 프로그램 및 장치(시스템)를 제공한다.
본 개시의 일 실시예에 따르면, 본 개시는 2차원 스케치를 3차원 모델로 변환하기 위한 기계학습 모델을 생성하기 위한 학습 데이터를 만들기 위해, 기 생성된 3차원 모델들로부터 2차원 프리핸드 스케치 데이터를 자동으로 생성하는 방법을 제공하는 것이다.
본 개시는 방법, 장치(시스템) 또는 판독 가능 저장 매체에 저장된 컴퓨터 프로그램을 포함한 다양한 방식으로 구현될 수 있다.
본 개시의 일 실시예에 따르면, 적어도 하나의 프로세서에 의해 실행되는 기계학습을 위한 프리핸드 스케치(freehand sketch) 데이터 생성 방법은 대상 물체에 대한 3차원 모델을 수신하는 단계 및 3차원 모델에 기초하여 대상 물체에 대한 서로 상이한 복수의 프리핸드 스케치 이미지를 생성하는 단계를 포함하고, 각 프리핸드 스케치 이미지는 복수의 스트로크(stroke) 및 복수의 가이드 라인을 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따르면, 복수의 프리핸드 스케치 이미지를 생성하는 단계는, 3차원 모델에 기초하여 제1 지점에서 대상 물체를 제1 방향으로 바라본 제1 에지 맵을 생성하는 단계와 3차원 모델에 기초하여 제2 지점에서 대상 물체를 제2 방향으로 바라본 제2 에지 맵을 생성하는 단계와 제1 87에지 맵에 기초하여 제1 스케치 이미지를 생성하는 단계 및 제2 에지 맵에 기초하여 제2 스케치 이미지를 생성하는 단계를 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따르면, 제1 에지 맵을 생성하는 단계는, 3차원 모델 내의 버텍스를 조정하는 단계와 제1 지점 및 제1 방향에 기초하여 투영 행렬(projection matrix)을 결정하는 단계와 투영 행렬을 조정하는 단계 및 3차원 모델 및 조정된 투영 행렬에 기초하여 제1 에지 맵을 생성하는 단계를 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따르면, 제1 스케치 이미지를 생성하는 단계는, 제1 에지 맵 내의 픽셀들을 연결하여 스트로크를 생성하되, 스트로크의 길이가 미리 정해진 제1 임계값에 도달하거나 정해진 미리 제2 임계값을 초과하는 각도로 꺽이는 경우 새로운 스트로크의 생성을 시작하는 단계를 더 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따르면, 제1 스케치 이미지를 생성하는 단계는, 생성된 각 스트로크에 대해서 두께 프로필 및 투명도 프로필을 적용하는 단계를 더 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따르면, 제1 스케치 이미지를 생성하는 단계는, 생성된 각 스트로크에 대해 텍스처를 적용 단계를 더 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따르면, 제1 스케치 이미지를 생성하는 단계는, 생성된 스트로크 각각에 대해서 폴리곤화(poligonize)를 수행하여 2개의 직선으로 변환하는 단계 및 변환된 직선들 중 일부를 선택하고 선택된 직선들의 길이를 연장하여 제1 타입의 가이드 라인들을 생성하는 단계를 더 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따르면, 제1 스케치 이미지를 생성하는 단계는, 생성된 스트로크 각각에 대해서 폴리곤화(poligonize)를 수행하여 수직 방향의 직선과 수평 방향의 직선 2개로 변환하는 단계 및 변환된 수직 방향의 직선들 및 수평 방향의 직선들 중 일부를 선택하고 선택된 직선들이 길이를 연장하여 제2 타입의 가이드 라인들을 생성하는 단계를 더 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 기계학습을 위한 프리핸드 스케치 생성 방법을 컴퓨터에서 실행하기 위한 명령어들을 기록한 컴퓨터 판독 가능한 비일시적 기록매체가 제공된다.
본 개시의 일 실시예에 따른 정보 처리 시스템은, 통신 모듈, 메모리 및 메모리와 연결되고, 메모리에 포함된 컴퓨터 판독 가능한 적어도 하나의 프로그램을 실행하도록 구성된 적어도 하나의 프로세서를 포함하고, 적어도 하나의 프로그램은, 대상 물체에 대한 3차원 모델을 수신하고, 3차원 모델에 기초하여 대상 물체에 대한 서로 상이한 복수의 프리핸드 스케치 이미지를 생성하기 위한 명령어들을 포함하고, 각 프리핸드 스케치 이미지는 복수의 스트로크(stroke) 및 복수의 가이드 라인을 포함하는 것을 특징으로 한다.
본 개시의 일부 실시예에 따르면, 3차원 모델로부터 복수의 프리핸드 스케치를 자동 생성함으로써, 기계학습을 위한 데이터를 보다 효율적이고 효과적으로 획득할 수 있다.
본 개시의 일부 실시예에 따르면, 스트로크를 활용한 다양한 형태의 스케치 이미지를 생성함으로써 일반적인 형태의 스케치 스타일을 이용한 스케치 데이터의 생성이 가능하여, 보다 보편적인 기계학습을 가능하게 할 수 있다.
본 개시의 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급되지 않은 다른 효과들은 청구범위의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자(“통상의 기술자”라 함)에게 명확하게 이해될 수 있을 것이다.
본 개시의 실시예들은, 이하 설명하는 첨부 도면들을 참조하여 설명될 것이며, 여기서 유사한 참조 번호는 유사한 요소들을 나타내지만, 이에 한정되지는 않는다.
도 1은 본 개시의 일 실시예에 따라 3차원 모델로부터 복수의 프리핸드 스케치 이미지가 생성되는 예시를 나타내는 도면이다.
도 2는 본 개시의 일 실시예에 따른 사용자 단말 및 정보 처리 시스템의 내부 구성을 나타내는 블록도이다.
도 3은 본 개시의 일 실시예에 따른 3차원 모델로부터 스케치 이미지를 생성하는 방법을 나타내는 도면이다
도 4는 본 개시의 일 실시예에 따른 3차원 모델로부터 스케치 이미지의 스트로크를 생성하는 방법을 나타내는 도면이다.
도 5는 본 개시의 일 실시예에 따라 3차원 모델로부터 스케치 이미지의 복수의 스트로크가 생성되는 예시를 나타내는 도면이다.
도 6은 본 개시의 일 실시예에 따른 두께 프로필과 알파 프로필의 예시를 나타내는 도면이다.
도 7은 본 개시의 일 실시예에 따른 1차 공간 노이즈와 2차 공간 노이즈의 예시를 나타낸다.
도 8은 본 개시의 일 실시예에 따른 스트로크에 적용되는 텍스처의 예시를 나타낸다.
도 9는 본 개시의 일 실시예에 따른 제1 타입의 가이드 라인 생성 방법을 나타내는 도면이다.
도 10은 본 개시의 일 실시예에 따라 스케치 이미지의 제1 타입의 가이드 라인이 생성되는 예시를 나타내는 도면이다.
도 11는 본 개시의 일 실시예에 따른 스케치 이미지의 제2 타입의 가이드 라인을 생성하는 방법을 나타내는 도면이다.
도 12는 본 개시의 일 실시예에 따라 스케치 이미지의 제2 타입의 가이드 라인이 생성되는 예시를 나타내는 도면이다.
도 13은 본 개시의 일 실시예에 따른 3차원 모델로부터 생성된 2차원 스케치 이미지의 예시를 나타내는 도면이다.
도 14는 본 개시의 일 실시예에 따른 3차원 모델로부터 스케치 이미지를 생성하는 방법의 예시를 나타내는 도면이다.
이하, 본 개시의 실시를 위한 구체적인 내용을 첨부된 도면을 참조하여 상세히 설명한다. 다만, 이하의 설명에서는 본 개시의 요지를 불필요하게 흐릴 우려가 있는 경우, 널리 알려진 기능이나 구성에 관한 구체적 설명은 생략하기로 한다.
첨부된 도면에서, 동일하거나 대응하는 구성요소에는 동일한 참조부호가 부여되어 있다. 또한, 이하의 실시예들의 설명에 있어서, 동일하거나 대응되는 구성요소를 중복하여 기술하는 것이 생략될 수 있다. 그러나, 구성요소에 관한 기술이 생략되어도, 그러한 구성요소가 어떤 실시예에 포함되지 않는 것으로 의도되지는 않는다.
개시된 실시예의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 개시는 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 개시가 완전하도록 하고, 본 개시가 통상의 기술자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것일 뿐이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 개시된 실시예에 대해 구체적으로 설명하기로 한다. 본 명세서에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 관련 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서, 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.
본 명세서에서의 단수의 표현은 문맥상 명백하게 단수인 것으로 특정하지 않는 한, 복수의 표현을 포함한다. 또한, 복수의 표현은 문맥상 명백하게 복수인 것으로 특정하지 않는 한, 단수의 표현을 포함한다. 명세서 전체에서 어떤 부분이 어떤 구성요소를 포함한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다.
또한, 명세서에서 사용되는 '모듈' 또는 '부'라는 용어는 소프트웨어 또는 하드웨어 구성요소를 의미하며, '모듈' 또는 '부'는 어떤 역할들을 수행한다. 그렇지만, '모듈' 또는 '부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '모듈' 또는 '부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서, '모듈' 또는 '부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 또는 변수들 중 적어도 하나를 포함할 수 있다. 구성요소들과 '모듈' 또는 '부'들은 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '모듈' 또는 '부'들로 결합되거나 추가적인 구성요소들과 '모듈' 또는 '부'들로 더 분리될 수 있다.
본 개시의 일 실시예에 따르면, '모듈' 또는 '부'는 프로세서 및 메모리로 구현될 수 있다. '프로세서'는 범용 프로세서, 중앙 처리 장치(CPU), 마이크로프로세서, 디지털 신호 프로세서(DSP), 제어기, 마이크로제어기, 상태 머신 등을 포함하도록 넓게 해석되어야 한다. 몇몇 환경에서, '프로세서'는 주문형 반도체(ASIC), 프로그램가능 로직 디바이스(PLD), 필드 프로그램가능 게이트 어레이(FPGA) 등을 지칭할 수도 있다. '프로세서'는, 예를 들어, DSP와 마이크로프로세서의 조합, 복수의 마이크로프로세서들의 조합, DSP 코어와 결합한 하나 이상의 마이크로프로세서들의 조합, 또는 임의의 다른 그러한 구성들의 조합과 같은 처리 디바이스들의 조합을 지칭할 수도 있다. 또한, '메모리'는 전자 정보를 저장 가능한 임의의 전자 컴포넌트를 포함하도록 넓게 해석되어야 한다. '메모리'는 임의 액세스 메모리(RAM), 판독-전용 메모리(ROM), 비-휘발성 임의 액세스 메모리(NVRAM), 프로그램가능 판독-전용 메모리(PROM), 소거-프로그램가능 판독 전용 메모리(EPROM), 전기적으로 소거가능 PROM(EEPROM), 플래쉬 메모리, 자기 또는 광학 데이터 저장장치, 레지스터들 등과 같은 프로세서-판독가능 매체의 다양한 유형들을 지칭할 수도 있다. 프로세서가 메모리로부터 정보를 판독하고/하거나 메모리에 정보를 기록할 수 있다면 메모리는 프로세서와 전자 통신 상태에 있다고 불린다. 프로세서에 집적된 메모리는 프로세서와 전자 통신 상태에 있다.
본 개시에서, '시스템'은 서버 장치와 클라우드 장치 중 적어도 하나의 장치를 포함할 수 있으나, 이에 한정되는 것은 아니다. 예를 들어, 시스템은 하나 이상의 서버 장치로 구성될 수 있다. 다른 예로서, 시스템은 하나 이상의 클라우드 장치로 구성될 수 있다. 또 다른 예로서, 시스템은 서버 장치와 클라우드 장치가 함께 구성되어 동작될 수 있다.
본 개시에서, '기계학습 모델'은 주어진 입력에 대한 해답(answer)을 추론하는데 사용하는 임의의 모델을 포함할 수 있다. 일 실시예에 있어서, 기계학습 모델은 2차원 스케치 데이터를 학습하여 3차원 모델을 생성하는 기계학습 모델일 수 있다. 본 개시의 일부 실시예에서, 하나의 기계학습 모델로 설명된 모델은 복수 개의 기계학습 모델을 포함할 수 있으며, 또한, 별도의 기계학습 모델로 설명된 복수 개의 모델은 단일 기계학습 모델로서 구현될 수도 있다.
본 개시에서, '디스플레이'는 컴퓨팅 장치와 연관된 임의의 디스플레이 장치를 지칭할 수 있는데, 예를 들어, 컴퓨팅 장치에 의해 제어되거나 컴퓨팅 장치로부터 제공된 임의의 정보/데이터를 표시할 수 있는 임의의 디스플레이 장치를 지칭할 수 있다.
본 개시에서, '복수의 A의 각각' 또는 '복수의 A 각각'은 복수의 A에 포함된 모든 구성 요소의 각각을 지칭하거나, 복수의 A에 포함된 일부 구성 요소의 각각을 지칭할 수 있다.
본 개시의 일부 실시예에서, '복수의 이미지'는 복수의 이미지를 포함하는 영상을 지칭할 수 있으며, '영상'은 영상에 포함된 복수의 이미지를 지칭할 수 있다.
도 1은 본 개시의 일 실시예에 따라 3차원 모델로부터 복수의 프리핸드 스케치가 생성되는 예시를 나타내는 도면이다. 본 발명에 따른 정보 처리 시스템은 3차원 모델과 그에 대응하는 2차원 프리핸드 스케치로 구성된 복수의 학습 데이터 쌍을 학습함으로써, 2차원 스케치를 3차원 모델로 변환할 수 있는 기계학습 모델을 생성할 수 있다. 이를 위하여, 정보 처리 시스템은 대상 물체에 대한 3차원 모델에 기초하여 복수의 프리핸드 스케치 이미지를 생성할 수 있다. 프리핸드 스케치는 사용자(예를 들어, 디자이너 등)가 디자인하기 위한 대상 물체를 직접 스케치한 것과 유사한 형태의 이미지를 지칭할 수 있다.
일 실시예에서, 정보 처리 시스템은 프리핸드 스케치 이미지를 생성하기 위하여 3차원 모델(110)을 수신할 수 있다. 이 경우, 정보 처리 시스템은 하나의 3차원 모델(110)에 대하여 서로 상이한 복수의 프리핸드 스케치 이미지(120, 130, 140)를 생성할 수 있다.
복수의 프리핸드 스케치 이미지(120, 130, 140)는 3차원 모델(110)을 서로 다른 각도에서 바라본 2차원 이미지일 수 있다. 예를 들어, 복수의 프리핸드 스케치 이미지는 정면, 왼쪽 측면, 오른쪽 측면에서 바라본 프리핸드 스케치를 생성할 수 있다. 도 1에서는 하나의 3차원 모델(110)로부터 3개의 프리핸드 스케치 이미지(120, 130, 140)가 생성되는 것으로 도시되었으나, 이에 한정되지 않으며, 임의의 수의 프리핸드 스케치 이미지가 생성될 수 있다.
3차원 모델(110)과 제1 프리핸드 스케치 이미지(120)의 쌍, 3차원 모델(110)과 제2 프리핸드 스케치 이미지(130)의 쌍, 그리고 3차원 모델(110)과 제1 프리핸드 스케치 이미지(120)의 쌍은 각각 기계학습 모델을 학습시키기 위한 학습 데이터로 사용될 수 있다. 이와 유사한 방식은 기 생성된 다양한 3차원 모델과 그에 대응하는 프리핸드 스케치 이미지의 쌍이 생성되고, 학습 데이터로 사용될 수 있다.
복수의 프리핸드 스케치 이미지(120, 130, 140)는 각각 복수의 스트로크(stroke) 및 복수의 가이드 라인을 포함할 수 있다. 복수의 스트로크는 스케치 이미지 내의 대상 물체를 구성하는 선분일 수 있다. 복수의 가이드 라인은 스케치의 주방향을 나타내는 제1 타입의 가이드 라인(supporting guide line), 스케치의 기하학적 구조를 단순화하여 표시하는 제2 타입의 가이드 라인(construction line) 등을 포함할 수 있다.
일 실시예에서, 정보 처리 시스템은 스트로크 생성을 위하여, 투영 행렬을 이용한 에지 맵을 생성할 수 있다. 그리고, 정보 처리 시스템은 에지 맵 내 픽셀들을 이용하여 스트로크를 생성할 수 있다. 이에 대하 자세한 설명은 후술하는 도 4 내지 도 8의 설명으로 대체한다.
또한, 정보 처리 시스템은 가이드 라인을 생성하기 위하여 3차원 모델로부터 스트로크를 생성하거나, 스트로크의 두께 및 투명도를 조정하거나, 텍스처를 조정할 수 있다. 이에 대한 자세한 설명은 후술하는 도 9 내지 도 12의 설명으로 대체한다.
상술한 설명에서, 3차원 모델로부터 복수의 프리핸드 스케치 이미지를 생성하는 과정은 정보 처리 시스템에 의해 수행되는 것으로 기재하였으나, 이에 한정되지 않으며 다른 실시예에서는 다르게 구현될 수 있다. 예를 들어, 3차원 모델로부터 복수의 프리핸드 스케치 이미지를 생성하는 일련의 과정 중 적어도 일부 또는 모든 과정이 사용자 단말에 의해 수행될 수 있다. 다만, 설명의 편의를 위해, 이하에서는 정보 처리 시스템에 의해 프리핸드 스케치 이미지의 생성 과정이 수행되는 것을 전제로 설명하고자 한다.
본 개시의 기계학습을 위한 3차원 모델로부터 프리핸드 스케치 이미지를 생성하는 방법에 의하면, 복수의 스트로크 및 복수의 가이드 라인이 포함된 다양한 형태의 프리핸드 스케치 이미지를 생성함으로써, 보다 효율적이고 효과적으로 3차원 모델의 기계학습을 수행할 수 있다.
도 2는 본 개시의 일 실시예에 따른 사용자 단말(210) 및 정보 처리 시스템(230)의 내부 구성을 나타내는 블록도이다. 사용자 단말(210)은 3차원 모델링 애플리케이션, 3차원 모델 학습을 위한 프리핸드 스케치 이미지 생성 애플리케이션, 웹 브라우저 등을 실행 가능하고 유/무선 통신이 가능한 임의의 컴퓨팅 장치를 지칭할 수 있으며, 예를 들어, 휴대폰 단말, 태블릿 단말, PC 단말 등을 포함할 수 있다. 도시된 바와 같이, 사용자 단말(210)은 메모리(212), 프로세서(214), 통신 모듈(216) 및 입출력 인터페이스(218)를 포함할 수 있다. 이와 유사하게, 정보 처리 시스템(230)은 메모리(232), 프로세서(234), 통신 모듈(236) 및 입출력 인터페이스(238)를 포함할 수 있다. 도 2에 도시된 바와 같이, 사용자 단말(210) 및 정보 처리 시스템(230)은 각각의 통신 모듈(216, 236)을 이용하여 네트워크(220)를 통해 정보 및/또는 데이터를 통신할 수 있도록 구성될 수 있다. 또한, 입출력 장치(240)는 입출력 인터페이스(218)를 통해 사용자 단말(210)에 정보 및/또는 데이터를 입력하거나 사용자 단말(210)로부터 생성된 정보 및/또는 데이터를 출력하도록 구성될 수 있다.
메모리(212, 232)는 비-일시적인 임의의 컴퓨터 판독 가능한 기록매체를 포함할 수 있다. 일 실시예에 따르면, 메모리(212, 232)는 RAM(random access memory), ROM(read only memory), 디스크 드라이브, SSD(solid state drive), 플래시 메모리(flash memory) 등과 같은 비소멸성 대용량 저장 장치(permanent mass storage device)를 포함할 수 있다. 다른 예로서, ROM, SSD, 플래시 메모리, 디스크 드라이브 등과 같은 비소멸성 대용량 저장 장치는 메모리와는 구분되는 별도의 영구 저장 장치로서 사용자 단말(210) 또는 정보 처리 시스템(230)에 포함될 수 있다. 또한, 메모리(212, 232)에는 운영체제와 적어도 하나의 프로그램 코드(예를 들어, 사용자 단말(210)에 설치되어 구동되는 3차원 모델링 애플리케이션, 3차원 모델의 기계학습을 위한 프리핸드 스케치 이미지 생성 애플리케이션 등을 위한 코드)가 저장될 수 있다.
이러한 소프트웨어 구성요소들은 메모리(212, 232)와는 별도의 컴퓨터에서 판독가능한 기록매체로부터 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독가능한 기록매체는 이러한 사용자 단말(210) 및 정보 처리 시스템(230)에 직접 연결가능한 기록 매체를 포함할 수 있는데, 예를 들어, 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록매체를 포함할 수 있다. 다른 예로서, 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록매체가 아닌 통신 모듈을 통해 메모리(212, 232)에 로딩될 수도 있다. 예를 들어, 적어도 하나의 프로그램은 개발자들 또는 애플리케이션의 설치 파일을 배포하는 파일 배포 시스템이 네트워크(220)를 통해 제공하는 파일들에 의해 설치되는 컴퓨터 프로그램에 기반하여 메모리(212, 232)에 로딩될 수 있다.
프로세서(214, 234)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(212, 232) 또는 통신 모듈(216, 236)에 의해 프로세서(214, 234)로 제공될 수 있다. 예를 들어, 프로세서(214, 234)는 메모리(212, 232)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다.
통신 모듈(216, 236)은 네트워크(220)를 통해 사용자 단말(210)과 정보 처리 시스템(230)이 서로 통신하기 위한 구성 또는 기능을 제공할 수 있으며, 사용자 단말(210) 및/또는 정보 처리 시스템(230)이 다른 사용자 단말 또는 다른 시스템(일례로 별도의 클라우드 시스템 등)과 통신하기 위한 구성 또는 기능을 제공할 수 있다. 일례로, 사용자 단말(210)의 프로세서(214)가 메모리(212) 등과 같은 기록 장치에 저장된 프로그램 코드에 따라 생성한 요청 또는 데이터(예를 들어, 프리핸드 스케치 데이터 생성 요청, 3차원 모델 데이터 등)는 통신 모듈(216)의 제어에 따라 네트워크(220)를 통해 정보 처리 시스템(230)으로 전달될 수 있다. 역으로, 정보 처리 시스템(230)의 프로세서(234)의 제어에 따라 제공되는 제어 신호나 명령이 통신 모듈(236)과 네트워크(220)를 거쳐 사용자 단말(210)의 통신 모듈(216)을 통해 사용자 단말(210)에 수신될 수 있다. 예를 들어, 사용자 단말(210)은 정보 처리 시스템(230)으로부터 통신 모듈(216)을 통해 프리핸드 스케치 이미지 등을 수신할 수 있다.
입출력 인터페이스(218)는 입출력 장치(240)와의 인터페이스를 위한 수단일 수 있다. 일 예로서, 입력 장치는 오디오 센서 및/또는 이미지 센서를 포함한 카메라, 키보드, 마이크로폰, 마우스 등의 장치를, 그리고 출력 장치는 디스플레이, 스피커, 햅틱 피드백 디바이스(haptic feedback device) 등과 같은 장치를 포함할 수 있다. 다른 예로, 입출력 인터페이스(218)는 터치스크린 등과 같이 입력과 출력을 수행하기 위한 구성 또는 기능이 하나로 통합된 장치와의 인터페이스를 위한 수단일 수 있다. 예를 들어, 사용자 단말(210)의 프로세서(214)가 메모리(212)에 로딩된 컴퓨터 프로그램의 명령을 처리함에 있어서 정보 처리 시스템(230)이나 다른 사용자 단말이 제공하는 정보 및/또는 데이터를 이용하여 구성되는 서비스 화면 등이 입출력 인터페이스(218)를 통해 디스플레이에 표시될 수 있다. 도 2에서는 입출력 장치(240)가 사용자 단말(210)에 포함되지 않도록 도시되어 있으나, 이에 한정되지 않으며, 사용자 단말(210)과 하나의 장치로 구성될 수 있다. 또한, 정보 처리 시스템(230)의 입출력 인터페이스(238)는 정보 처리 시스템(230)과 연결되거나 정보 처리 시스템(230)이 포함할 수 있는 입력 또는 출력을 위한 장치(미도시)와의 인터페이스를 위한 수단일 수 있다. 도 2에서는 입출력 인터페이스(218, 238)가 프로세서(214, 234)와 별도로 구성된 요소로서 도시되었으나, 이에 한정되지 않으며, 입출력 인터페이스(218, 238)가 프로세서(214, 234)에 포함되도록 구성될 수 있다.
사용자 단말(210) 및 정보 처리 시스템(230)은 도 2의 구성요소들보다 더 많은 구성요소들을 포함할 수 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 일 실시예에 따르면, 사용자 단말(210)은 상술된 입출력 장치(240) 중 적어도 일부를 포함하도록 구현될 수 있다. 또한, 사용자 단말(210)은 트랜시버(transceiver), GPS(Global Positioning system) 모듈, 카메라, 각종 센서, 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수 있다. 예를 들어, 사용자 단말(210)이 스마트폰인 경우, 일반적으로 스마트폰이 포함하고 있는 구성요소를 포함할 수 있으며, 예를 들어, 가속도 센서, 자이로 센서, 카메라 모듈, 각종 물리적인 버튼, 터치패널을 이용한 버튼, 입출력 포트, 진동을 위한 진동기 등의 다양한 구성요소들이 사용자 단말(210)에 더 포함되도록 구현될 수 있다. 일 실시예에 따르면, 사용자 단말(210)의 프로세서(214)는 프리핸드 스케치 이미지를 제공하는 애플리케이션 등이 동작하도록 구성될 수 있다. 이 때, 해당 애플리케이션 및/또는 프로그램과 연관된 코드가 사용자 단말(210)의 메모리(212)에 로딩될 수 있다.
프리핸드 스케치 이미지를 제공하는 애플리케이션 등을 위한 프로그램이 동작되는 동안에, 프로세서(214)는 입출력 인터페이스(218)와 연결된 터치 스크린, 키보드, 오디오 센서 및/또는 이미지 센서를 포함한 카메라, 마이크로폰 등의 입력 장치를 통해 입력되거나 선택된 텍스트, 이미지, 영상, 음성 및/또는 동작 등을 수신할 수 있으며, 수신된 텍스트, 이미지, 영상, 음성 및/또는 동작 등을 메모리(212)에 저장하거나 통신 모듈(216) 및 네트워크(220)를 통해 정보 처리 시스템(230)에 제공할 수 있다. 예를 들어, 프로세서(214)는 입출력 인터페이스(218)를 통하여 3차원 모델을 입력받고, 3차원 모델에 대한 프리핸드 스케치 이미지를 생성하기 위하여 3차원 모델 및 프리핸드 스케치 이미지 생성 요청을 통신 모듈(216) 및 네트워크(220)를 통해 정보 처리 시스템(230)에 제공할 수 있다.
사용자 단말(210)의 프로세서(214)는 입력 장치(240), 다른 사용자 단말, 정보 처리 시스템(230) 및/또는 복수의 외부 시스템으로부터 수신된 정보 및/또는 데이터를 관리, 처리 및/또는 저장하도록 구성될 수 있다. 프로세서(214)에 의해 처리된 정보 및/또는 데이터는 통신 모듈(216) 및 네트워크(220)를 통해 정보 처리 시스템(230)에 제공될 수 있다. 사용자 단말(210)의 프로세서(214)는 입출력 인터페이스(218)를 통해 입출력 장치(240)로 정보 및/또는 데이터를 전송하여, 출력할 수 있다. 예를 들면, 프로세서(214)는 수신한 정보 및/또는 데이터를 사용자 단말의 화면에 디스플레이할 수 있다.
정보 처리 시스템(230)의 프로세서(234)는 복수의 사용자 단말(210) 및/또는 복수의 외부 시스템으로부터 수신된 정보 및/또는 데이터를 관리, 처리 및/또는 저장하도록 구성될 수 있다. 프로세서(234)에 의해 처리된 정보 및/또는 데이터는 통신 모듈(236) 및 네트워크(220)를 통해 사용자 단말(210)에 제공할 수 있다. 예를 들어, 정보 처리 시스템(230)의 프로세서(234)는 사용자 단말(210)로부터 대상 물체에 대한 3차원 모델을 수신하고, 3차원 모델에 대한 복수의 스트로크 및 복수의 가이드 라인을 포함한 프리핸드 스케치 이미지를 생성할 수 있다. 정보 처리 시스템(230)의 프로세서(234)는 이렇게 생성된 복수의 프리핸드 스케치 이미지를 통신 모듈(236) 및 네트워크(220)를 통해 사용자 단말(210)로 제공할 수 있다.
정보 처리 시스템(230)의 프로세서(234)는 사용자 단말(210)의 디스플레이 출력 가능 장치(예: 터치 스크린, 디스플레이 등), 음성 출력 가능 장치(예: 스피커) 등의 출력 장치(240)를 통해 처리된 정보 및/또는 데이터를 출력하도록 구성될 수 있다. 예를 들어, 정보 처리 시스템(230)의 프로세서(234)는, 대상 물체에 대한 3차원 모델을 통신 모듈(236) 및 네트워크(220)를 통해 사용자 단말(210)로 제공하고, 3차원 모델을 사용자 단말(210)의 디스플레이 출력 가능 장치 등을 통해 출력하도록 구성될 수 있다.
이하에서는 본 개시에 따른 3차원 모델로부터 서로 상이한 복수의 프리핸드 스케치 이미지를 생성하는 방법을 설명한다.
도 3은 본 개시의 일 실시예에 따른 3차원 모델로부터 프리핸드 스케치 이미지를 생성하는 방법을 나타내는 도면이다. 도 3을 참조하면, 우선 정보 처리 시스템은 3차원 모델을 수신(312)할 수 있다. 3차원 모델은 대상 물체의 3차원 형상을 나타내는 데이터일 수 있다.
정보 처리 시스템은 3차원 모델이 수신되면, 3차원 모델 내의 버텍스(vertex)의 위치를 조정(322)할 수 있다. 3차원 모델 내의 버텍스의 위치를 미세 조정한 후, 정보 처리 시스템은 모델뷰 변환(324)을 수행할 수 있다. 모델뷰 변환은 모델링 변환(Modeling Transformation) 및 뷰 변환(viewing transformation)을 포함할 수 있다. 구체적으로, 정보 처리 시스템은 스케일-회전 조정(314)을 통하여 3차원 모델의 로컬(local) 좌표계에서 월드(global) 좌표계로 변환하는 모델링 변환을 수행할 수 있다. 예를 들어, 정보 처리 시스템은 위치값, 회전값, 크기값 중 적어도 하나를 조합하여 모델링 변환을 수행할 수 있다.
또한, 정보 처리 시스템은 모델링 변환 후 모델뷰 변환(324)을 수행할 수 있다. 일 실시예에서, 모델뷰 변환(324)은 3차원 모델의 월드 좌표계를 특정 지점 및 특정 방향에서 바라본 뷰 좌표계로 변환하는 것을 나타낼 수 있다. 즉, 정보 처리 시스템은 서로 다른 지점 및 서로 다른 방향에서 바라본 복수의 뷰 좌표계에 대응하여 복수의 뷰 변환을 수행할 수 있다.
정보 처리 시스템은 모델뷰 변환(324)이 수행된 후, 프로젝션 조정(316)에 근거하여, 프로젝션 변환(326)을 수행할 수 있다. 프로젝션 변환(326)은 뷰 좌표계를 클립 좌표계로 변환하는 것을 나타낼 수 있다. 프로젝션 변환은 원근으로 인한 축소가 있는 선형 프로젝션 변환과 원근 축소가 없는 프로젝션 변환으로 구분될 수 있다.
구체적으로, 정보 처리 시스템은 프로젝션 변환(326)을 위하여 특정 지점 및 특정 방향에 따른 투영 행렬을 결정할 수 있다. 그 후, 정보 처리 시스템은 원근으로 인한 축소 여부에 따라 투영 행렬을 조정하여 프로젝션 변환(326)을 수행할 수 있다. 정보 처리 시스템은 특정 지점 및 특정 방향을 변경하면서 투영 행렬을 결정할 수 있다. 예를 들어, 정보 처리 시스템은 제1 지점 및 제1 방향에 기초하여 투영 행렬을 결정하거나, 제1 지점과 다른 제2 지점 및 제1 방향과 다른 제2 방향에 기초하여 투영 행렬을 결정할 수 있다. 즉, 정보 처리 시스템은 지점 및 방향에 따라 복수의 투영 행렬 중 어느 하나의 투영 행렬로 결정할 수 있다.
정보 처리 시스템은 노말(법선) 데이터(332) 및 깊이 데이터(334)로부터 에지 맵(342)을 생성할 수 있다. 노말 데이터(332) 및 깊이 데이터(334)는 프로젝션 변환에 의하여 생성될 수 있다. 이에, 정보 처리 시스템은 투영 행렬을 결정한 지점 및 방향에 따라 서로 다른 노말 데이터(332) 및 깊이 데이터(334)를 생성할 수 있다. 이에, 정보 처리 시스템은 서로 다른 노말 데이터(332) 및 깊이 데이터(334)에 근거하여, 서로 다른 에지 맵을 생성할 수 있다.
정보 처리 시스템은 적어도 하나 이상의 에지 맵이 생성되면, 적어도 하나 이상의 에지 맵 내 픽셀들을 연결하여 스트로크를 구성(354)할 수 있다. 이에, 정보 처리 시스템은 서로 다른 에지 맵 별로 프리핸드 스케치 이미지를 구성하는 스트로크를 생성할 수 있다. 따라서, 본 발명은 서로 다른 에지 맵 별로 복수의 프리핸드 스케치 이미지를 생성할 수 있다.
스트로크의 구성에 대하여 보다 구체적으로 살펴보면, 정보 처리 시스템은 에지 맵을 통하여 구성된 스트로크의 길이 및 스트로크의 각도에 근거하여, 멀티 스트로크 랜더링(352)을 수행할 수 있다. 즉, 정보 처리 시스템은 스트로크의 길이 및 스트로크의 각도에 근거하여, 적어도 하나 이상의 스트로크를 생성할 수 있다. 예를 들어, 정보 처리 시스템은 스트로크의 길이가 미리 정해진 제1 임계값에 도달하는 경우, 기존 스트로크의 생성을 종료하고 새로운 스트로크를 생성할 수 있다. 또 다른 예로, 정보 처리 시스템은 스트로크의 꺽이는 각도가 미리 정해진 제2 임계값을 초과하는 경우, 기존 스트로크의 생성을 종료하고 새로운 스트로크를 생성할 수 있다.
또한, 정보 처리 시스템은 에지 맵을 통하여 생성된 스트로크에 대하여 가이드 라인 랜더링(356)을 수행할 수 있다. 가이드 라인은 스케치의 주방향을 나타내는 제1 타입의 가이드 라인이거나, 스케치의 기하학적 구조를 단순화하여 표시하는 제2 타입의 가이드 라인일 수 있다. 제1 타입의 가이드 라인은 서포팅 가이드 라인(supporting guideline)이라고 명명될 수 있다. 제2 타입의 가이드 인은 구조 가이드 라인(construction guideline)으로 명명될 수 있다.
구체적으로, 정보 처리 시스템은 스트로크에 대한 폴리곤화(polygonise)를 수행하여 스트로크를 복수의 직선으로 변환할 수 있다. 그 후, 복수의 직선 중 일부를 이용하여 가이드 라인을 생성할 수 있다. 가이드 라인의 생성에 대한 상세한 기술은 도 9 내지 도 12에서 후술하는 설명으로 대체한다.
정보 처리 시스템은 스트로크 및 가이드 라인 랜더링 후, 이미지-공간 증강(362)을 수행할 수 있다. 이미지 공간 증강(362)은 픽셀 레벨에서 적용될 수 있다. 정보 처리 시스템은 이미지-공간 증강 수행이 완료된 후, 복수의 프리핸드 스케치 이미지를 생성(372)할 수 있다.
이상에서는 3차원 모델로부터 복수의 프리핸드 스케치 이미지를 생성하는 방법에 대하여 설명하였다. 이를 통하여 본 개시에서는 기계학습을 위하여, 사용자가 3차원 모델에 대한 다양한 프리핸드 스케치를 그리지 않더라도, 보다 편리하게 다양한 형태의 프리핸드 스케치 이미지를 학습할 수 있다.
이하에서는 3차원 모델로부터 스케치 이미지의 스트로크를 생성하는 방법을 설명한다.
도 4는 본 개시의 일 실시예에 따른 3차원 모델로부터 스케치 이미지의 스트로크를 생성하는 방법을 나타내는 도면이다. 도시된 것과 같이, 정보 처리 시스템은 우선 윤곽선(412)과 에지 검출(414)을 수행할 수 있다. 예를 들어, 정보 처리 시스템은 에지 맵의 윤곽선(412) 및 에지(414)에 근거하여, 실루엣 및 깊이 에지를 검출할 수 있다. 그리고 정보 처리 시스템은 윤곽선(412)과 에지(414)를 병합(420)할 수 있다.
정보 처리 시스템은 사람이 손으로 그린 것과 같은 프리핸드 스케치 이미지를 생성하기 위하여 스트로크의 두께, 투명도, 노이즈 적용, 텍스쳐 적용 중 적어도 하나를 서로 다르게 하여 스케치 이미지를 생성할 수 있다. 이를 위하여, 정보 처리 시스템은 서로 상이한 스트로크 생성 과정을 기 설정된 횟수(예를 들어, N번)만큼 반복하여 수행할 수 있다. 예를 들어, 도 4에 도시된 바와 같이, 랜덤 시드 #0(430_0)부터, 랜덤 시드 #N(430_N)까지 스트로크 두께, 투명도, 노이즈 적용, 텍스쳐 적용 중 적어도 하나를 변경하여 반복하여 수행할 수 있다. 이하에서는 동일 과정의 반복이므로, 랜덤 시드 #0(430_0)을 기준으로 설명하고, 랜덤 시드 #1부터 랜덤 시드 #N까지의 과정은 랜덤 시드 #0의 설명으로 대체한다.
랜덤 시드 #0이 시작되면, 정보 처리 시스템은 스트로크를 생성(440_0)할 수 있다. 스트로크들은 임의의 지점에서의 윤곽선의 픽셀이나 에지 체인에 의하여 생성될 수 있다. 이때, 정보 처리 시스템은 생성된 스트로크의 길이 및 스트로크의 회전 각도에 근거하여, 새로운 스트로크를 생성을 종료할 수 있다. 예를 들어, 정보 처리 시스템은 생성된 스트로크의 길이가 제1 임계값에 도달하거나, 생성된 스트로크가 제2 임계값을 초과하는 각도로 휘어지는 경우, 새로운 스트로크를 생성을 종료할 수 있다.
스트로크 생성 후, 정보 처리 시스템은 생성된 스트로크에 두께 및 알파 프로필을 적용(450_0)할 수 있다. 구체적으로, 정보 처리 시스템은 스트로크의 두께 프로필 및 투명도 프로필 중 적어도 하나를 특정 값으로 적용할 수 있다. 이는 도 6을 참조하여 후술한다.
그 다음, 정보 처리 시스템은 1차 공간 노이즈 적용(460_0) 및 2차 공간 노이즈 적용(470_0)을 순차적으로 수행할 수 있다. 1차 공간 노이즈 및 2차 공간 노이즈는 스케일 레벨이 다른 펄린 노이즈(perlin noise) 함수일 수 있다. 이에 대해서는 도 7을 참조하여 후술한다. 마지막으로 정보 처리 시스템은 생성된 스트로크에 텍스처를 적용(480_0)할 수 있다. 예를 들어, 종이에 연필, 펜 등을 이용하여 선을 그린 텍스처를 생성된 스트로크에 적용할 수 있다.
정보 처리 시스템은 랜덤 시드 #0부터 랜덤 시드 #N까지 스트로크를 생성하는 과정을 반복하여 수행하고, 각 스트로크를 병합하여, 복수의 스트로크를 생성할 수 있다.
도 5는 본 개시의 일 실시예에 따라 3차원 모델로부터 스케치 이미지의 복수의 스트로크가 생성되는 예시를 나타내는 도면이다. 제1 그림(510)은 에지 맵의 윤곽선과 에지를 병합한 결과를 나타낸다. 제2 그림(520)은 복수의 랜덤 시드 중 하나를 이용하여 스트로크를 생성한 예시를 나타낸다. 제3 그림(530)은 복수의 스트로크에 두께 및 알파 프로필을 적용한 예시를 나타낸다. 제4 그림(540)과 제5 그림(550)은 각각 복수의 스트로크에 1차 공간 노이즈와 2차 공간 노이즈를 적용한 예시를 나타낸다. 제6 그림(560)은 복수의 랜덤 시드로부터 생성된 복수의 스캐치를 병합하여 복수의 스트로크로 구성된 스케치를 생성한 예시를 나타낸다.
도 6은 본 개시의 일 실시예에 따른 두께 프로필(610)과 알파 프로필(620)의 예시를 나타내는 도면이다. 도시된 것과 같이, 정보 처리 시스템은 스트로크를 따라 두께와 투명도가 변하는 프로필을 사용할 수 있다. 스트로크의 두께는 중간 지점에 가까워질수록 증가하고, 중간 지점에서 멀어질수록 감소할 수 있다. 반대로, 스트로크의 투명도는 중간 지점에 가까워질수록 감소하고, 중간 지점에서 멀어질수록 증가할 수 있다. 도시된 바와 같이, 하나의 스트로크에서 위치에 따라 두께와 투명도를 가지도록 함으로써, 사람이 손으로 그린 것과 같은 스트로크를 생성할 수 있다.
도 7은 본 개시의 일 실시예에 따른 1차 공간 노이즈(710)와 2차 공간 노이즈(720)의 예시를 나타낸다. 도시된 것과 같이, 1차 공간 노이즈(710)는 디자이너의 스케치 스킬 수준을 시뮬레이션하기 위하여 스트로크 변이를 생성할 수 있다. 2차 공간 노이즈(720)는 디자이너 손의 안정성을 시뮬레이션하기 위하여 스트로크를 따라 작은 섭동을 통합할 수 있다. 정보 처리 시스템은 제1 및 제2 공간 노이즈(710, 720)를 병합(730)하여 통합 공간 노이즈(740)를 생성할 수 있다. 결과적으로, 정보 처리 시스템은 스트로크에 통합 공간 노이즈(740)를 적용할 수 있다.
도 8은 본 개시의 일 실시예에 따른 스트로크에 적용되는 텍스처(810)의 예시를 나타낸다. 도시된 것과 같이, 텍스처(810)는 종이 및 종이에 그려진 연필, 펜 등의 질감, 펜의 질감을 구현하기 위한 것일 수 있다.
이하에서는 프리핸드 스케치 이미지에 포함되는 가이드 라인을 생성하는 방법을 설명한다.
도 9는 본 개시의 일 실시예에 따른 제1 타입의 가이드 라인 생성 방법을 나타내는 도면이다. 실제 디자이너들은 스케치 시 스케치의 주방향을 나타내는 가이드 라인을 스케치할 수 있다. 이에, 본 발명에서는 스케치의 주방향을 나타내는 제1 타입의 가이드 라인을 생성하여 디자이너의 스케치와 유사한 프리핸드 스케치를 구현한다.
도시된 바와 같이, 정보 처리 시스템은 3차원 모델로부터 윤곽선(910)을 추출할 수 있다. 그 뒤 정보 처리 시스템은 윤곽선(910)에 기초하여 스트로크를 생성(920)할 수 있다. 정보 처리 시스템은 그 뒤 스트로크에 두께 및 알파 프로필을 적용(930)하고, 공간 노이즈를 적용(940)할 수 있다. 910부터 940 단계는 구체적인 설명의 편의를 위하여 앞서 도 4의 412부터 470_0의 설명으로 대체한다.
공간 노이즈 적용 후, 정보 처리 시스템은 스트로크의 단순화(950)를 수행할 수 있다. 예를 들어, 정보 처리 시스템은 스트로크에 대하여 폴리곤화를 수행하여 복수의 스트로크를 복수의 직선으로 변환할 수 있다. 정보 처리 시스템은 폴리곤화에 의하여 변환된 복수의 직선들 중 일부를 선택하는 샘플링(960)을 수행할 수 있다.
그 후 정보 처리 시스템은 선택된 일부의 직선을 연장(970)할 수 있다. 이때, 정보 처리 시스템은 대상 물체의 윤곽선 외부로 직선을 양 방향으로 확장할 수 있다. 즉 윤곽선 스케치를 위한 스케치의 주방향으로 직선을 확장할 수 있다.
정보 처리 시스템은 최종적으로 생성된 직선에 텍스처를 적용(980)하여 제1 타입의 가이드 라인을 생성할 수 있다. 이상에서는 제1 타입의 가이드 라인의 생성 방법에 대하여 설명하였다. 이를 통하여 본 발명은 실제 디자이너의 스케치에 포함된 가이드 라인을 구현할 수 있으며, 보다 실제와 유사한 프리핸드 스케치 이미지를 구현할 수 있다.
도 10은 본 개시의 일 실시예에 따라 스케치 이미지의 제1 타입의 가이드 라인이 생성되는 예시를 나타내는 도면이다. 제1 그림(1010)은 3차원 모델로부터 윤곽선이 추출된 예시를 나타낸다. 제2 그림(1020)은 윤곽선에 기초하여 스트로크가 생성된 예시를 나타낸다. 제3 그림(1030)은 스트로크에 공간 노이즈가 적용된 예시를 나타낸다. 제4 그림(1040)은 스트로크에 대하여 폴리곤화를 수행하여 복수의 스트로크를 복수의 직선으로 변환한 예시를 나타낸다. 제5 그림(1050)은 생성된 복수의 직선들 중 일부를 선택하는 샘플링을 수행하고, 선택된 일부의 직선을 연장하여 제1 타입의 가이드 라인이 생성된 예시를 나타낸다.
이하에서는 제2 타입의 가이드 라인 생성방법에 대하여 설명한다.
도 11는 본 개시의 일 실시예에 따른 스케치 이미지의 제2 타입의 가이드 라인을 생성하는 방법을 나타내는 도면이다. 디자이너들은 스케치 시 대상 물체의 구조를 나타내는 가이드 라인을 스케치할 수 있다. 제2 타입의 가이드 라인은 대상 물체의 구조적 특징을 나타내는 가이드 라인일 수 있다.
도시된 바와 같이, 정보 처리 시스템은 제2 타입의 가이드 라인 생성을 위하여 윤곽선(1110)을 추출하고, 스트로크(1120)를 생성하고, 두께 및 알파 프로필 적용(1130)할 수 있다. 1110부터 1130단계는 설명의 편의를 위하여 앞서 도 4의 412부터 450_0의 설명으로 대체한다.
두께 및 알파 프로필 적용 후, 정보 처리 시스템은 스트로크 단순화(1140)를 진행할 수 있다. 예를 들어, 정보 처리 시스템은 스트로크를 폴리곤화하여, 수직 방향의 직선과 수평 방향의 직선 2개로 변환할 수 있다. 즉, 변환된 2개의 직선은 90도 각도를 이룰 수 있다.
정보 처리 시스템은 변환된 수직 방향의 직선과 수평 방향의 직선들 중 일부를 선택하고, 선택된 직선들의 길이를 연장(1150)할 수 있다. 그 후, 정보 처리 시스템은 텍스처를 적용(1160)하여 제2 타입의 가이드 라인을 생성할 수 있다.
도 12는 본 개시의 일 실시예에 따라 스케치 이미지의 제2 타입의 가이드 라인이 생성되는 예시를 나타내는 도면이다. 제1 그림(1210)은 3차원 모델로부터 윤곽선이 추출된 예시를 나타낸다. 제2 그림(1220)은 윤곽선에 기초하여 스트로크가 생성된 예시이다. 제3 그림(1230)은 스트로크에 대하여 폴리곤화를 수행하여 복수의 스트로크를 수직 방향의 직선과 수평 방향의 직선으로 변환하고 직선들의 길이를 연장한 예시를 나타낸다.
이하에서는 복수의 스트로크 및 복수의 가이드 라인으로 구성된 프리핸드 스케치를 생성하는 방법에 대하여 설명한다.
도 13은 본 개시의 일 실시예에 따른 3차원 모델(1310)로부터 생성된 2차원 스케치 이미지(1320)의 예시를 나타내는 도면이다. 도시된 것과 같이, 2차원 스케치 이미지(1320)는 복수의 스트로크 및 복수의 가이드 라인을 포함한다. 이와 같은 구성에 의해 실제 디자이너의 스케치와 유사한 형태의 프리핸드 스케치 이미지를 자동으로 생성할 수 있다.
도 14는 본 개시의 일 실시예에 따른 3차원 모델로부터 스케치 이미지를 생성하는 방법(1400)의 예시를 나타내는 도면이다. 방법(1400)은 정보 처리 시스템 또는 사용자 단말의 적어도 하나의 프로세서에 의해 수행될 수 있다. 도시된 것과 같이, 정보 처리 시스템은 복수의 프리핸드 스케치 이미지를 생성하기 위하여 대상 물체에 대한 3차원 모델을 수신할 수 있다(S1410).
정보 처리 시스템은 3차원 모델이 수신되면, 대상 물체에 대한 서로 상이한 복수의 프리핸드 스케치 이미지를 생성할 수 있다(S1420). 보다 구체적으로, 정보 처리 시스템은 제1 지점에서 제1 방향으로 대상 물체를 바라본 제1 스케치 이미지와 제1 지점과 다른 제2 지점에서 제1 방향과 다른 제2 방향으로 대상 물체를 바라본 제2 스케치 이미지를 생성할 수 있다. 즉, 동일한 3차원 모델을 다양한 각도에서 바라본 스케치 이미지를 생성할 수 있다.
이를 위하여, 정보 처리 시스템은 서로 상이한 스케치 이미지 생성을 위하여 서로 다른 에지 맵을 생성할 수 있다. 예를 들어, 정보 처리 시스템은 제1 지점에서 제1 방향으로 대상 물체를 바라본 제1 에지 맵과 제2 지점에서 제2 방향으로 대상 물체를 바라본 제2 에지맵을 생성할 수 있다.
정보 처리 시스템은 에지 맵을 생성하기 위하여, 3차원 모델 내 버텍스를 조정할 수 있다. 그리고, 에지 맵이 표현하는 지점 및 방향에 기초하여 투영 행렬을 결정할 수 있다. 이때, 정보 처리 시스템은 원근에 따른 오류를 감안하여 투영 행렬을 조정할 수 있다. 그 후, 정보 처리 시스템은 조정된 투영 행렬과 3차원 모델에 기초하여 에지 맵을 생성할 수 있다. 이때, 에지 맵에는 노말 데이터와 깊이 데이터가 포함될 수 있다.
정보 처리 시스템은 에지 맵을 이용하여 프리핸드 스케치 이미지를 생성할 수 있다. 보다 구체적으로, 정보 처리 시스템은 에지 맵 내 픽셀들을 연결하여 스트로크를 생성할 수 있다. 이때 정보 처리 시스템은 생성된 스트로크의 길이 및 회전 각도에 근거하여, 새로운 스트로크를 생성할 수 있다. 예를 들어, 정보 처리 시스템은 생성된 스트로크의 길이가 미리 정해진 제1 임계값을 초과하거나, 스트로크의 회전 각도가 제2 임계값을 초과하는 경우, 새로운 스트로크를 생성할 수 있다.
또한, 정보 처리 시스템은 생성된 스트로크의 두께 및 투명도, 노이즈, 텍스처 중 적어도 하나를 적용할 수 있다. 이에 대한 상세한 설명은 앞선 도 4 내지 도 8의 설명으로 대체한다.
한편, 정보 처리 시스템은 생성된 스트로크를 이용하여 복수의 가이드 라인을 생성할 수 있다. 예를 들어, 정보 처리 시스템은 스케치의 주방향을 나타내는 제1 타입의 가이드 라인을 생성하거나, 대상 물체의 구조적 특징을 나타내는 제2 타입의 가이드 라인을 생성할 수 있다. 이에 대한 상세한 설명은 도 9 내지 도 12의 설명으로 대체한다. 그 후, 정보 처리 시스템은 생성된 프리핸드 스케치 이미지 및 3차원 모델에 기초하여 3차원 모델을 생성할 수 있는 모델을 학습시킬 수 있다(S1430).
상술한 방법은 컴퓨터에서 실행하기 위해 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램으로 제공될 수 있다. 매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일수도 있다. 또한, 매체는 단일 또는 수개 하드웨어가 결합된 형태의 다양한 기록 수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD 와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 애플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다.
본 개시의 방법, 동작 또는 기법들은 다양한 수단에 의해 구현될 수도 있다. 예를 들어, 이러한 기법들은 하드웨어, 펌웨어, 소프트웨어, 또는 이들의 조합으로 구현될 수도 있다. 본원의 개시와 연계하여 설명된 다양한 예시적인 논리적 블록들, 모듈들, 회로들, 및 알고리즘 단계들은 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양자의 조합들로 구현될 수도 있음을 통상의 기술자들은 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 대체를 명확하게 설명하기 위해, 다양한 예시적인 구성요소들, 블록들, 모듈들, 회로들, 및 단계들이 그들의 기능적 관점에서 일반적으로 위에서 설명되었다. 그러한 기능이 하드웨어로서 구현되는지 또는 소프트웨어로서 구현되는 지의 여부는, 특정 애플리케이션 및 전체 시스템에 부과되는 설계 요구사항들에 따라 달라진다. 통상의 기술자들은 각각의 특정 애플리케이션을 위해 다양한 방식들로 설명된 기능을 구현할 수도 있으나, 그러한 구현들은 본 개시의 범위로부터 벗어나게 하는 것으로 해석되어서는 안된다.
하드웨어 구현에서, 기법들을 수행하는 데 이용되는 프로세싱 유닛들은, 하나 이상의 ASIC들, DSP들, 디지털 신호 프로세싱 디바이스들(digital signal processing devices; DSPD들), 프로그램가능 논리 디바이스들(programmable logic devices; PLD들), 필드 프로그램가능 게이트 어레이들(field programmable gate arrays; FPGA들), 프로세서들, 제어기들, 마이크로제어기들, 마이크로프로세서들, 전자 디바이스들, 본 개시에 설명된 기능들을 수행하도록 설계된 다른 전자 유닛들, 컴퓨터, 또는 이들의 조합 내에서 구현될 수도 있다.
따라서, 본 개시와 연계하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 및 회로들은 범용 프로세서, DSP, ASIC, FPGA나 다른 프로그램 가능 논리 디바이스, 이산 게이트나 트랜지스터 로직, 이산 하드웨어 컴포넌트들, 또는 본원에 설명된 기능들을 수행하도록 설계된 것들의 임의의 조합으로 구현되거나 수행될 수도 있다. 범용 프로세서는 마이크로프로세서일 수도 있지만, 대안으로, 프로세서는 임의의 종래의 프로세서, 제어기, 마이크로제어기, 또는 상태 머신일 수도 있다. 프로세서는 또한, 컴퓨팅 디바이스들의 조합, 예를 들면, DSP와 마이크로프로세서, 복수의 마이크로프로세서들, DSP 코어와 연계한 하나 이상의 마이크로프로세서들, 또는 임의의 다른 구성의 조합으로서 구현될 수도 있다.
펌웨어 및/또는 소프트웨어 구현에 있어서, 기법들은 랜덤 액세스 메모리(random access memory; RAM), 판독 전용 메모리(read-only memory; ROM), 비휘발성 RAM(non-volatile random access memory; NVRAM), PROM(programmable read-only memory), EPROM(erasable programmable read-only memory), EEPROM(electrically erasable PROM), 플래시 메모리, 컴팩트 디스크(compact disc; CD), 자기 또는 광학 데이터 스토리지 디바이스 등과 같은 컴퓨터 판독가능 매체 상에 저장된 명령들로서 구현될 수도 있다. 명령들은 하나 이상의 프로세서들에 의해 실행 가능할 수도 있고, 프로세서(들)로 하여금 본 개시에 설명된 기능의 특정 양태들을 수행하게 할 수도 있다.
소프트웨어로 구현되는 경우, 상기 기법들은 하나 이상의 명령들 또는 코드로서 컴퓨터 판독 가능한 매체 상에 저장되거나 또는 컴퓨터 판독 가능한 매체를 통해 전송될 수도 있다. 컴퓨터 판독가능 매체들은 한 장소에서 다른 장소로 컴퓨터 프로그램의 전송을 용이하게 하는 임의의 매체를 포함하여 컴퓨터 저장 매체들 및 통신 매체들 양자를 포함한다. 저장 매체들은 컴퓨터에 의해 액세스될 수 있는 임의의 이용 가능한 매체들일 수도 있다. 비제한적인 예로서, 이러한 컴퓨터 판독가능 매체는 RAM, ROM, EEPROM, CD-ROM 또는 다른 광학 디스크 스토리지, 자기 디스크 스토리지 또는 다른 자기 스토리지 디바이스들, 또는 소망의 프로그램 코드를 명령들 또는 데이터 구조들의 형태로 이송 또는 저장하기 위해 사용될 수 있으며 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수 있다. 또한, 임의의 접속이 컴퓨터 판독가능 매체로 적절히 칭해진다.
예를 들어, 소프트웨어가 동축 케이블, 광섬유 케이블, 연선, 디지털 가입자 회선 (DSL), 또는 적외선, 무선, 및 마이크로파와 같은 무선 기술들을 사용하여 웹사이트, 서버, 또는 다른 원격 소스로부터 전송되면, 동축 케이블, 광섬유 케이블, 연선, 디지털 가입자 회선, 또는 적외선, 무선, 및 마이크로파와 같은 무선 기술들은 매체의 정의 내에 포함된다. 본원에서 사용된 디스크(disk) 와 디스크(disc)는, CD, 레이저 디스크, 광 디스크, DVD(digital versatile disc), 플로피디스크, 및 블루레이 디스크를 포함하며, 여기서 디스크들(disks)은 보통 자기적으로 데이터를 재생하고, 반면 디스크들(discs) 은 레이저를 이용하여 광학적으로 데이터를 재생한다. 위의 조합들도 컴퓨터 판독가능 매체들의 범위 내에 포함되어야 한다.
소프트웨어 모듈은, RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터들, 하드 디스크, 이동식 디스크, CD-ROM, 또는 공지된 임의의 다른 형태의 저장 매체 내에 상주할 수도 있다. 예시적인 저장 매체는, 프로세가 저장 매체로부터 정보를 판독하거나 저장 매체에 정보를 기록할 수 있도록, 프로세서에 연결될 수 있다. 대안으로, 저장 매체는 프로세서에 통합될 수도 있다. 프로세서와 저장 매체는 ASIC 내에 존재할 수도 있다. ASIC은 유저 단말 내에 존재할 수도 있다. 대안으로, 프로세서와 저장 매체는 유저 단말에서 개별 구성요소들로서 존재할 수도 있다.
이상 설명된 실시예들이 하나 이상의 독립형 컴퓨터 시스템에서 현재 개시된 주제의 양태들을 활용하는 것으로 기술되었으나, 본 개시는 이에 한정되지 않고, 네트워크나 분산 컴퓨팅 환경과 같은 임의의 컴퓨팅 환경과 연계하여 구현될 수도 있다. 또 나아가, 본 개시에서 주제의 양상들은 복수의 프로세싱 칩들이나 장치들에서 구현될 수도 있고, 스토리지는 복수의 장치들에 걸쳐 유사하게 영향을 받게 될 수도 있다. 이러한 장치들은 PC들, 네트워크 서버들, 및 휴대용 장치들을 포함할 수도 있다.
본 명세서에서는 본 개시가 일부 실시예들과 관련하여 설명되었지만, 본 개시의 발명이 속하는 기술분야의 통상의 기술자가 이해할 수 있는 본 개시의 범위를 벗어나지 않는 범위에서 다양한 변형 및 변경이 이루어질 수 있다. 또한, 그러한 변형 및 변경은 본 명세서에 첨부된 특허청구의 범위 내에 속하는 것으로 생각되어야 한다.

Claims (10)

  1. 적어도 하나의 프로세서에 의해 실행되는 기계학습을 위한 프리핸드 스케치(freehand sketch) 데이터 생성 방법에 있어서,
    대상 물체에 대한 3차원 모델을 수신하는 단계; 및
    상기 3차원 모델에 기초하여 상기 대상 물체에 대한 서로 상이한 복수의 프리핸드 스케치 이미지를 생성하는 단계
    를 포함하고,
    각 프리핸드 스케치 이미지는 복수의 스트로크(stroke) 및 복수의 가이드 라인을 포함하는, 프리핸드 스케치 데이터 생성 방법.
  2. 제1항에 있어서,
    상기 복수의 프리핸드 스케치 이미지를 생성하는 단계는,
    상기 3차원 모델에 기초하여 제1 지점에서 상기 대상 물체를 제1 방향으로 바라본 제1 에지 맵을 생성하는 단계;
    상기 3차원 모델에 기초하여 제2 지점에서 상기 대상 물체를 제2 방향으로 바라본 제2 에지 맵을 생성하는 단계;
    상기 제1 에지 맵에 기초하여 제1 스케치 이미지를 생성하는 단계; 및
    상기 제2 에지 맵에 기초하여 제2 스케치 이미지를 생성하는 단계
    를 포함하는, 프리핸드 스케치 데이터 생성 방법.
  3. 제2항에 있어서,
    상기 제1 에지 맵을 생성하는 단계는,
    상기 3차원 모델 내의 버텍스를 조정하는 단계;
    상기 제1 지점 및 상기 제1 방향에 기초하여 투영 행렬(projection matrix)을 결정하는 단계;
    상기 투영 행렬을 조정하는 단계; 및
    상기 3차원 모델 및 상기 조정된 투영 행렬에 기초하여 상기 제1 에지 맵을 생성하는 단계
    를 포함하는, 프리핸드 스케치 데이터 생성 방법.
  4. 제3항에 있어서,
    상기 제1 스케치 이미지를 생성하는 단계는,
    상기 제1 에지 맵 내의 픽셀들을 연결하여 스트로크를 생성하되, 스트로크의 길이가 미리 정해진 제1 임계값에 도달하거나 정해진 미리 제2 임계값을 초과하는 각도로 꺽이는 경우 새로운 스트로크의 생성을 시작하는 단계
    를 더 포함하는, 프리핸드 스케치 데이터 생성 방법.
  5. 제4항에 있어서,
    상기 제1 스케치 이미지를 생성하는 단계는,
    생성된 각 스트로크에 대해서 두께 프로필 및 투명도 프로필을 적용하는 단계
    를 더 포함하는, 프리핸드 스케치 데이터 생성 방법.
  6. 제4항에 있어서,
    상기 제1 스케치 이미지를 생성하는 단계는,
    생성된 각 스트로크에 대해 텍스처를 적용 단계
    를 더 포함하는, 프리핸드 스케치 데이터 생성 방법.
  7. 제4항에 있어서,
    상기 제1 스케치 이미지를 생성하는 단계는,
    생성된 스트로크 각각에 대해서 폴리곤화(poligonize)를 수행하여 2개의 직선으로 변환하는 단계; 및
    변환된 직선들 중 일부를 선택하고 선택된 직선들의 길이를 연장하여 제1 타입의 가이드 라인들을 생성하는 단계
    를 더 포함하는, 프리핸드 스케치 데이터 생성 방법.
  8. 제4항에 있어서,
    상기 제1 스케치 이미지를 생성하는 단계는,
    생성된 스트로크 각각에 대해서 폴리곤화(poligonize)를 수행하여 수직 방향의 직선과 수평 방향의 직선 2개로 변환하는 단계; 및
    변환된 수직 방향의 직선들 및 수평 방향의 직선들 중 일부를 선택하고 선택된 직선들이 길이를 연장하여 제2 타입의 가이드 라인들을 생성하는 단계
    를 더 포함하는, 프리핸드 스케치 데이터 생성 방법.
  9. 제1항에 따른 방법을 컴퓨터에서 실행하기 위한 명령어들을 기록한 컴퓨터 판독 가능한 비일시적 기록매체.
  10. 정보 처리 시스템으로서,
    통신 모듈;
    메모리; 및
    상기 메모리와 연결되고, 상기 메모리에 포함된 컴퓨터 판독 가능한 적어도 하나의 프로그램을 실행하도록 구성된 적어도 하나의 프로세서
    를 포함하고,
    상기 적어도 하나의 프로그램은,
    대상 물체에 대한 3차원 모델을 수신하고,
    상기 3차원 모델에 기초하여 상기 대상 물체에 대한 서로 상이한 복수의 프리핸드 스케치 이미지를 생성하기 위한 명령어들을 포함하고,
    각 프리핸드 스케치 이미지는 복수의 스트로크(stroke) 및 복수의 가이드 라인을 포함하는, 정보 처리 시스템.
PCT/KR2022/000874 2021-12-29 2022-01-18 기계학습을 위한 프리핸드 스케치 이미지 생성 방법 및 시스템 WO2023128045A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2021-0191848 2021-12-29
KR1020210191848A KR102403256B1 (ko) 2021-12-29 2021-12-29 기계학습을 위한 프리핸드 스케치 이미지 생성 방법 및 시스템

Publications (1)

Publication Number Publication Date
WO2023128045A1 true WO2023128045A1 (ko) 2023-07-06

Family

ID=81796761

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/000874 WO2023128045A1 (ko) 2021-12-29 2022-01-18 기계학습을 위한 프리핸드 스케치 이미지 생성 방법 및 시스템

Country Status (3)

Country Link
US (1) US11823308B2 (ko)
KR (1) KR102403256B1 (ko)
WO (1) WO2023128045A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210358202A1 (en) * 2020-05-13 2021-11-18 Electronic Caregiver, Inc. Room Labeling Drawing Interface for Activity Tracking and Detection

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130004066A (ko) * 2011-05-11 2013-01-09 다솔 시스템므 기하학적 3차원 모델링된 오브젝트를 디자인하는 방법
KR20130060162A (ko) * 2011-11-29 2013-06-07 다솔 시스템므 복수의 3d 곡선들로부터의 표면 생성
KR20160136525A (ko) * 2015-05-19 2016-11-30 모젼스랩(주) 프리핸드 드로잉을 이용한 3차원 캐릭터 구현 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6327043B1 (en) * 1994-05-18 2001-12-04 Xerox Corporation Object optimized printing system and method
US10019440B2 (en) * 2011-05-27 2018-07-10 Adobe Systems Incorporated Methods and apparatus for three-dimensional (3D) sketching
WO2014119524A1 (ja) * 2013-02-01 2014-08-07 株式会社セルシス 三次元オブジェクトの多視点描画装置、方法、及びプログラム
EP2911119A1 (en) * 2014-02-24 2015-08-26 Dassault Systèmes A method for designing a three dimensional modeled object in a three dimensional scene by extruding a curve
US10168899B1 (en) * 2015-03-16 2019-01-01 FiftyThree, Inc. Computer-readable media and related methods for processing hand-drawn image elements
US10192355B2 (en) * 2017-01-16 2019-01-29 Adobe Inc. Providing a tutorial for drawing a scaffold to guide a drawing of a three dimensional object
US10424086B2 (en) * 2017-11-16 2019-09-24 Adobe Inc. Oil painting stroke simulation using neural network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130004066A (ko) * 2011-05-11 2013-01-09 다솔 시스템므 기하학적 3차원 모델링된 오브젝트를 디자인하는 방법
KR20130060162A (ko) * 2011-11-29 2013-06-07 다솔 시스템므 복수의 3d 곡선들로부터의 표면 생성
KR20160136525A (ko) * 2015-05-19 2016-11-30 모젼스랩(주) 프리핸드 드로잉을 이용한 3차원 캐릭터 구현 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PIERRE BENARD; AARON HERTZMANN: "Line Drawings from 3D Models", ARXIV.ORG, 2 October 2018 (2018-10-02), XP081599972, DOI: 10.1561/0600000075 *
YE MEIJUAN; ZHOU SHIZHE; FU HONGBO: "DeepShapeSketch : Generating hand drawing sketches from 3D objects", 2019 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), IEEE, 14 July 2019 (2019-07-14), pages 1 - 8, XP033621659, DOI: 10.1109/IJCNN.2019.8851809 *

Also Published As

Publication number Publication date
US20230206519A1 (en) 2023-06-29
US11823308B2 (en) 2023-11-21
KR102403256B1 (ko) 2022-05-30

Similar Documents

Publication Publication Date Title
CN112933599B (zh) 三维模型渲染方法、装置、设备及存储介质
WO2014109599A1 (en) Method and apparatus for controlling multitasking in electronic device using double-sided display
WO2021082885A1 (zh) 语义分割模型的训练样本的生成方法、装置、存储介质及电子设备
WO2020017890A1 (en) System and method for 3d association of detected objects
CN107566793A (zh) 用于远程协助的方法、装置、系统及电子设备
WO2021004412A1 (zh) 手持输入设备及其指示图标的显示位置控制方法和装置
WO2023128045A1 (ko) 기계학습을 위한 프리핸드 스케치 이미지 생성 방법 및 시스템
WO2020130667A1 (en) Method and electronic device for controlling augmented reality device
CN112116690A (zh) 视频特效生成方法、装置及终端
WO2023125365A1 (zh) 图像处理方法、装置、电子设备及存储介质
US9092909B2 (en) Matching a system calculation scale to a physical object scale
US20220139016A1 (en) Sticker generating method and apparatus, and medium and electronic device
WO2023128027A1 (ko) 비정형 스케치 기반 3차원 모델링 방법 및 시스템
CN114116435A (zh) 游戏测试方法、系统、电子设备及计算机可读存储介质
WO2018164287A1 (ko) 증강현실 제공 방법, 장치 및 컴퓨터 프로그램
WO2019119999A1 (zh) 立体图形的展开过程呈现方法以及装置、设备及存储介质
WO2022244948A1 (en) System and method of controlling brightness on digital displays for optimum visibility and power consumption
CN108256072B (zh) 相册显示方法、装置、存储介质以及电子设备
WO2012173304A1 (ko) 저해상도 그래픽 영상을 고해상도 그래픽 영상으로 실시간 변환하는 그래픽 영상 처리 장치 및 방법
CN114049403A (zh) 一种多角度三维人脸重建方法、装置及存储介质
WO2023128043A1 (ko) 3차원 모델 자동 생성 인터페이스 제공 방법 및 시스템
CN114020390A (zh) Bim模型显示方法、装置、计算机设备和存储介质
CN110930499B (zh) 一种3d数据处理方法及装置
CN113703704A (zh) 界面显示方法、头戴式显示设备和计算机可读介质
WO2018124678A1 (en) Electronic device and operation method thereof

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22916206

Country of ref document: EP

Kind code of ref document: A1