WO2015016691A1 - Method for converting and reproducing image for providing moderate three-dimensional effect between two-dimensional image and three-dimensional image - Google Patents

Method for converting and reproducing image for providing moderate three-dimensional effect between two-dimensional image and three-dimensional image Download PDF

Info

Publication number
WO2015016691A1
WO2015016691A1 PCT/KR2014/007190 KR2014007190W WO2015016691A1 WO 2015016691 A1 WO2015016691 A1 WO 2015016691A1 KR 2014007190 W KR2014007190 W KR 2014007190W WO 2015016691 A1 WO2015016691 A1 WO 2015016691A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
converted
video
frame
frames
Prior art date
Application number
PCT/KR2014/007190
Other languages
French (fr)
Korean (ko)
Inventor
최재혁
Original Assignee
고포디 테크놀로지 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고포디 테크놀로지 엘엘씨 filed Critical 고포디 테크놀로지 엘엘씨
Publication of WO2015016691A1 publication Critical patent/WO2015016691A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/332Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/93Regeneration of the television signal or of selected parts thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/356Image reproducers having separate monoscopic and stereoscopic modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/139Format conversion, e.g. of frame-rate or size
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording

Definitions

  • the present invention relates to image processing, and more particularly, by providing an intermediate three-dimensional effect between a two-dimensional image and a three-dimensional image, image signal conversion and reproduction that can reduce visual fatigue or psychological anxiety caused by viewing a complete three-dimensional image. It is about a method.
  • Stereoscopic image content for 3D display can be produced through a binocular lens shooting method that simultaneously shoots with two cameras that are about 65mm apart to have binocular parallax. There is also a method of converting image contents of a single eye view taken by a single-eye lens camera through hardware and software calculations to achieve the same effect as a two-eye lens shooting method.
  • the stereoscopic image due to the binocular vision has gained much attention immediately after the success of the movie avatar, but recently, consumers' desire to purchase stereoscopic images has been stalled for a while.
  • the reason why the popularity of stereoscopic images has become weaker is that the cost of viewing devices is high, while stereoscopic contents are largely lacking. But the more fundamental reason is that concerns about watching stereoscopic images can be uncomfortable and even adversely affect people's health.
  • Visual fatigue and instability associated with viewing 3D images include eyestrain, eyes feel heavy, double vision, dry eyes, heavy head, headache Shoulder stiffness, shoulder pain, back pain, nausea, giddiness, and headache.
  • Statistics show that about 12% of people are unable to see stereoscopic images properly due to various medical conditions, and about 30% of people have very weak stereoscopic vision, making them poorly aware of depth. Such people have little or no significant effect on the stereoscopic image. Because of these points, there are surprisingly many consumers who have a rejection of viewing stereoscopic images in three dimensions.
  • the fundamental solution to various health problems caused by viewing stereoscopic images may be to minimize or eliminate stereoscopic effects.
  • the solution needs to be a third method, not a method of using a stereoscopic image that causes discomfort such as dizziness.
  • the user may have normal gaze direction characteristics, but may have abnormal gaze characteristics such as strabismus.
  • Technical considerations are also required to ensure that the characteristics of strabismus allow the user to comfortably view the images.
  • the present invention provides a three-dimensional to depth feeling and a sense of realism and a sense of presence by monocular factors, which are differentiated from 2D images that do not provide any stereoscopic feeling, but also cause visual fatigue or psychological anxiety caused by three-dimensional feeling depending on binocular factors. It is an object of the present invention to provide a video conversion and reproduction method that does not.
  • Another object of the present invention is to provide an image converting and reproducing method for viewing an image generated by the above method much larger than an actual screen.
  • the present invention by adjusting the position of the image displayed in the side-by-side form on the display screen of the video player according to the characteristics of the user's gaze direction, the image conversion that allows a user with strabismus to enjoy a comfortable image And to provide a regeneration method.
  • the image conversion unit by converting each source image frame (Fi) of the source image data to a corresponding target image frame (Fi ') in sequence to the target image frame A first step of generating the converted image data consisting of (Fi '), wherein the conversion of each source image frame (Fi) to the corresponding target image frame (Fi') is a ratio of the source image frame (Fi ') By scaling to create two substantially identical transformed video frames, and combining the two transformed video frames to form the target image frame Fi '; A second step of providing the converted image data to the image reproducing unit; And reproducing the target image frames Fi 'of the converted image data provided by the image reproducing unit on a screen, and displaying the images of the two substantially identical converted image frames constituting each target image frame Fi'.
  • the left eye and the right half of the display screen are respectively displayed so that the same two converted image frames constituting each target image frame (Fi ') are viewed by a stereoscopic lens including two lenses.
  • a video data conversion and playback method comprising a third step of reproducing so that it can be seen separately from each other.
  • the ratio applied to the scaling is such that the two substantially identical transformed video frames have an image size that can be displayed in the left half and right half regions of the display screen of the image reproducing apparatus, respectively. It is preferable to be determined.
  • the two substantially identical converted video frame to reduce the size of the source video frame (Fi) in the horizontal direction and the vertical direction in half each reduced image frame and then the two reduced image frame It is two reduced image frames obtained by duplication.
  • the two substantially identical transformed image frames are (i) even with a first transformed image frame constructed by taking only pixel data in odd-numbered rows and columns of the source image frame Fi. It consists of a second converted image frame composed of only the pixel data in the first row and column.
  • the image data converting and reproducing method may further include: displaying a target for correcting an image display area in a left half region and a right half region divided by left and right sides of the display screen; And receiving image display area correction coordinate information of any one of the left half region and the right half region through a user input means, and changing the image display region coordinates according to the image display region correction coordinate information.
  • the image display in the third step is performed in a portable image reproducing apparatus including a smartphone or a tablet computer, and the image content consumer of the stereoscopic mirror provides a viewing angle of 40 to 70 °. It is preferable that the two convex lenses simultaneously view the two substantially identical converted image frames through the stereoscopic mirror with the convex lens separated by 30 to 80 mm from the display screen.
  • the first step, the second step, and the third step may be performed in an image reproducing device of a consumer of an image content including both the image converting unit and the image reproducing unit. have.
  • the first and second steps are performed by an image providing system on the side of an image content provider including the image converting unit, and the third step comprises the image reproducing unit.
  • the image content may be performed by an image reproducing device of a consumer.
  • the image conversion unit transmits the converted image data to the image reproduction unit in a streaming method or a broadcast method.
  • the source image data is also provided.
  • the third step is performed when the video content consumer instructs playback by selecting the latter of the source video data and the converted video data.
  • the 3D image effect using binocular disparity is It can't be felt, but it's not like the feeling of a simple 'two-dimensional' image when the left eye and the right eye are in common. Since the left and right eyes view the 'two' identical images separately, you can only feel the so-called 'three-dimensional effect of monocular factors' (described later) through each of the left and right eyes. The viewing feeling of the reproduced video is halfway between the full 3D and simple two-dimensional. Therefore, almost no visual fatigue or psychological anxiety, which is felt in a complete 3D stereoscopic image, is rather comfortable, but a sense of reality and presence is alive and refreshed. Therefore, side effects (visual fatigue and psychological anxiety) caused by viewing 3D images can be prevented.
  • the display position of the image frames can be adjusted according to the characteristics of the user's gaze direction. have. Therefore, users with strabismus can adjust the position of the video display according to their own gaze direction, thereby making it easier to view the video.
  • FIG. 1 is a view conceptually illustrating an image display and a viewing method according to the present invention
  • FIG. 2 illustrates a state in which the left eye (including the left lens) and the right eye (including the right lens) of the user view the left half and the right half of the display screen, respectively, aligned at their centers.
  • FIG. 3 is a diagram schematically showing a converted image frame in a side-by-side manner in which an original frame is reduced in half, and then duplicated two reduced image frames.
  • FIG. 5 schematically shows the configuration of an image content provider system (necessary for processing an image transformation in which the original image is left and right juxtaposed with two reduced identical images;
  • FIG. 6 is a flowchart illustrating a processing procedure of an application program in which an image conversion algorithm according to the present invention is implemented.
  • FIG. 7 schematically illustrates a configuration of a video player 500 of a content consumer
  • FIG. 8 is a flowchart illustrating a method of reproducing an image according to the present invention at an image content consumer when providing the image into two types, an original image and an image converted according to the present invention.
  • FIG. 9 is a flowchart schematically illustrating a processing procedure of an application program for processing video conversion when video data is provided in the form of a live broadcast signal.
  • FIG. 10 is a view for explaining the effect that the screen is enlarged according to the lens focal length of the stereoscopic when viewing the converted image in accordance with the stereoscopic mirror,
  • 11 (a) and 11 (b) illustrate a case where a user views two identical converted images reproduced in a side by side form on a smartphone using a simple stereoscopic head and a stereoscopic stereoscopic head mounted mirror according to an embodiment of the present invention.
  • FIG. 13 is an explanatory diagram of an embodiment of a target for adjusting the position of an image display area displayed on a display screen and a corrected image display area.
  • the present inventors have found the following points in the process of exploring techniques for solving side effects (visual fatigue and psychological anxiety) caused by stereoscopic images caused by binocular factors. That is, when the same two images are viewed simultaneously through the left eye and the right eye in substantially the same visual direction (ie, the two directions of the two images facing each other in both eyes are parallel to each other), The effect of double recognition of the three-dimensional effect occurs. In addition, when the two images are greatly enlarged through the convex lens, the stereoscopic effect by the monocular factors can be recognized more clearly, and the realism and presence of the image are combined together so that the stereoscopic or simple 2D image due to the existing binocular factor is combined. You can enjoy the video with a completely different feeling from the audience's view. The present invention is based on this concept.
  • the same two images' include two completely identical image frames, such as the original and a duplicate, when the original image frame is duplicated, and of course, they are not completely identical but can be regarded as 'substantially identical'.
  • the concept includes up to two image frames having the same identity.
  • two image frames eg, a first image frame configured by extracting only even fields and a second image frame extracted only odd-numbered fields
  • a first image frame formed by extracting only odd pixels in a row and a column direction, and a second image frame formed by extracting only even pixels, or an original image frame for example, interpolation (eg, adjacent pixel interpolation, Linear image interpolation, cubic interpolation, B-spline interpolation, etc.) may be a representative example of 'two image frames having the same' as two image frames obtained by reducing or expanding at an appropriate ratio. no.
  • the 'substantially identical two images' are derived from the same original image frame, and widely cover those two image frames having no wide-angle difference such as binocular disparity between the two image frames and having only a slight difference in pixel data values.
  • the 'monocular factor' that is the basis of the three-dimensional effect provided by the present invention is mainly an empirical depth clue, for example, as follows. Recognizing depth when the same object appears large when it's close and small when it's far away (relative size of the object), when two parallel lines actually converge in one point in three-dimensional space (line perspective) Recognizing through experience that obscured objects are behind when overlapping (overlapping); perception of depth in experience when distant objects appear blurred by atmospheric scattering effects (atmospheric scattering); Perception of depth when recognizing texture changes in an object (texture gradient); guessing the three-dimensional shape of an object through light and shadow (light and shadow); Perception (relative velocity) and perception of depth due to a change in focus on an object (focus) are typical monocular factors.
  • the stereoscopic effect caused by such monocular factors is inherently different from the stereoscopic effect of a normal 3D image.
  • the stereoscopic effect of the image due to conventional binocular factors may be obtained by photographing the same object at different angles or by processing the image to have such a difference by a wide-angle difference corresponding to binocular disparity. It is a three-dimensional feeling when the left and right eyes view the images in different directions by binocular disparity.
  • the stereoscopic effect according to the monocular factor provided by the present invention hardly causes side effects (visual fatigue and psychological anxiety) exhibited by such stereoscopic images due to such a binocular factor. It is also different from the normal 2D image, which has no sense of three-dimensionality, which is perceived when the 'one image' is viewed in 'left and right eyes' in different directions.
  • the present invention is a method for allowing the user to separately view the same two images through the left eye and the right eye, respectively.
  • the display screen 20 of the image device 10 used by the user is divided into left and right as illustrated in FIG. 1. And displaying the same two images in the left image display area 22L and the right image display area 22R in the left screen area 20L and the right screen area 20R, respectively.
  • the user views two images of the left image display area 22L and the right image display area 22R into the left and right eyes through two convex lenses 30L and 30R having a predetermined magnification, respectively. see.
  • the left eye and the right eye see the same left image and the right image in substantially the same visual direction.
  • Direction VD1 For normal eyes other than strabismus, the direction VD1 from the left lens 30L to the center point CP1 of the left screen region 20L and from the right lens 30R to the center point CP2 of the right screen region 20R.
  • Direction VD2 is substantially parallel.
  • An exemplary image processing method proposed by the present invention is to convert an original image into a new frame for each frame.
  • the converted frame is a frame in which two images that are substantially identical to the left half and the right half of the frame are arranged in a side-by-side (SBS) form.
  • the resolution of the converted frame may be the same as or different from the resolution of the original frame.
  • the image data composed of the converted image frames is directly made by the system of the image provider (e.g., broadcaster, YouTube, etc.) and provided to the user's image device, or consumes the image content. May be made using original image data provided from an image provider.
  • each frame of the original image is reduced in half, and then the reduced image is duplicated in two and juxtaposed to the left and right to produce a converted frame corresponding to the frame.
  • 3 schematically shows one example of converting image data in this manner
  • FIG. 4 shows a configuration of means for performing such image conversion processing.
  • the image conversion unit 200 receives an original image and performs image conversion processing to output the converted image.
  • the image conversion process first reads the original image in units of frames to produce a reduced image frame 110 in which the number of horizontal pixels and the number of vertical pixels of each image frame 100 are reduced by half.
  • the reduced image frame 110 is copied twice to create a new SBS-type image frame 120 in which the two reduced image frames 110 are juxtaposed on the left and right sides.
  • the image frame 120 is the converted image frame 120 according to the image processing method of the present invention.
  • two reduced image frames 110 may be made from the original image frame 100 by using various known interpolation methods or extracting field data.
  • the content provider side system provides the processed video to the user's video playback device in a streaming transmission method or a broadcasting transmission method through a wired or wireless communication network.
  • the user's image reproducing apparatus only needs to decode the received image data and reproduce each converted image frame 120 as it is. Since the converted image frame 120 itself is composed of two identical reduced frames arranged side by side, the same two images are simultaneously displayed on the left half and right half regions of the screen on the display screen of the image reproducing apparatus. The user sees the displayed image using, for example, a stereoscopic mirror in which two convex lenses correspond to the two eyes.
  • the left eye sees the image of the left half of the converted image frame 120 and the right eye sees the right half of the image 110 by the distance between the display screen and the two convex lenses and the refractive indices of the two convex lenses. See). Since the user sees the same image of the left eye and the right eye at the same time, the user can feel the stereoscopic effect due to the monocular factor double.
  • each of the two images entering the left and right eyes is a sense of coolness with a sense of depth or three-dimensional by the monocular factors included in the image.
  • the converted images according to the present invention can be viewed with higher quality.
  • the two images are magnified through two convex lenses of stereoscopic mirrors, the sense of presence and reality are added, and a new feeling image which is not experienced in a general 2D or 3D image can be viewed. Details thereof will be described later.
  • FIG. 5 schematically illustrates a configuration of an image content provider system 300 necessary to process an image transformation in which the same original image is reduced and left and right juxtaposed as described above.
  • the system 300 may include a data store 310 or a camera 320 as a content source.
  • a CPU 330, a memory 340, and an input / output device serving as a user interface 350 are also included.
  • an application program hereinafter, referred to as an image conversion program
  • a user interface program implementing the image conversion algorithm described below are also required.
  • 6 is a flowchart schematically showing an execution procedure of this video conversion program.
  • the source image to be converted is stored in the data storage 310 in the form of a file.
  • the CPU 330 executes an image conversion program to generate a converted image frame (also referred to as a target image frame) by scaling each source image frame of the original image by a predetermined ratio.
  • the ratio applied to the scaling is preferably set to a value such that the two target video image frames have an image size that can be displayed in the left half region and the right half region of the display screen of the video reproducing apparatus, respectively.
  • the ratio of reduction or enlargement of the source image frame may be preferably determined in consideration of the correlation between the resolution of the source image data and the resolution of the display of the image device.
  • the resolution of the target image frame converted from the source image frame does not exceed the resolution of the display.
  • the resolution of the source image data is the same as that of the display of the imaging device, as mentioned above, the two targets of which the resolution of the source image frame is reduced in the ratio of half or less in the horizontal and vertical directions respectively are juxtaposed on the left and right sides. You can configure the frame. If the resolution of the source image data is, for example, about 1/4 of the resolution of the display of the imaging apparatus, the resolution of the source image data may be increased up to twice.
  • the number of pixels of the target image frame is determined (step S10).
  • Examples of resolutions set as standards may include various types such as 1080p (1920x1080 pixels), 720p (1280x720 pixels), 480p (640x480 pixels), and the like.
  • the resolution of the source image is, for example, 1080p (1920x1080 pixels)
  • the resolution of the target image frame may also be set to 1920x1080. Of course, it is possible to set the value higher or lower than this resolution. If the target image frame has a higher resolution than the source image frame, the frame size is larger. On the contrary, if the target image frame has a lower resolution, the frame size is smaller.
  • the CPU 330 secures sufficient buffer memory space in consideration of the resolution of the target image frame.
  • the CPU 330 reads the source image file from the data storage 310 (step S12).
  • the image files may be files compressed according to a predetermined compression standard such as MP4, avi, wmv, mkv, and the like. If it is such a compressed video file, the video file is decompressed using the decoding tool of the corresponding standard (step S14). Decode based on eg 30 frames per second.
  • each video frame Fi 100 of the decoded video data is scaled by a predetermined ratio (step S16).
  • the scaling ratio is determined according to how much to enlarge or reduce the original video frame Fi 100.
  • an example in which each image frame Fi 100 is reduced to half the size will be described.
  • One exemplary method of reducing each image frame Fi 100 by half is to reduce the horizontal and vertical pixel counts of each image frame Fi 100 by half, respectively.
  • each image frame Fi 100 for example, all the even-numbered pixels are removed and the image is newly constructed with only the odd-numbered pixels, or all the odd-numbered pixels are removed and only the even-numbered pixels are removed in the horizontal and vertical directions.
  • the reduced image frame Fi / 2 (110) is a screen in which the number of pixels is reduced in half and the area is reduced to one quarter in comparison with the original image in the horizontal and vertical directions, respectively.
  • the number of pixels of the reduced image frame Fi / 2 110 is 960x540.
  • the reduced image Fi / 2 110 is left and right in the converted image region of the memory 340 as shown in FIG.
  • the new video frame Fi 120 configured by combining two reduced frames of the original video frame is the converted video frame or the target video frame that the present invention intends to obtain through the conversion.
  • the converted target image frames Fi '120 are encoded in a desired file format (MP4, avi, wmv, mkv, etc.) in consideration of storage efficiency or transmission efficiency and then stored in the data storage 310 (S20). step).
  • a desired file format MP4, avi, wmv, mkv, etc.
  • the converted image file stored in the data storage 310 is provided to the content playback device of the content consumer (step S22).
  • the method of providing the converted video file to the content consumer may be, for example, a wired or wireless transmission method such as a streaming method, a broadcasting method, or a download method, but is not necessarily limited thereto.
  • a video broadcasted by a television station in real time also performs the above-described conversion processing prior to radio transmission, and then converts the converted video into a broadcast signal such as over-the-air broadcast, cable broadcast, or DMB broadcast. You can also send.
  • the source of the conversion target image may be the camera device 320 instead of the data storage 310. That is, an image frame generated by the camera device 320 is provided to the CPU 330 in real time, and the CPU 330 scales each image frame of the image data at a predetermined ratio in the same manner as described above. To be broadcasted by the broadcasting method.
  • the CPU 330 processes an image frame provided by the camera device 320 to the image, which is scaled by a predetermined ratio for each frame through the processing of steps S16 and S18 described above, for example, an image reduced to 1/2. After making it, it is converted to a combined video frame by juxtaposing it. Then, the converted video frames are collected and subjected to compression encoding processing in accordance with the transmission format of the broadcast signal, and transmitted by the broadcasting method.
  • the video playback device of the user receives the converted video signal and receives the normal video. This can be done according to the signal reproduction method. Then, the image displayed on the display screen of the image reproducing apparatus will display an image in which the same two images are arranged side by side.
  • the image content provider side may provide the same image in two forms to the content consumer side. That is, one is the image data of the target image frame Fi 'obtained by converting two identical image frames reduced from the source image frame to the left and right as described above, and the other is an image composed of the original source image frame which is not converted. Data.
  • Content consumers may have the choice of video in both of them in consuming video content.
  • the left half image and the right half image constituting each image frame of the converted image data are the left eye of the user. Play the video so that you can see each one separately.
  • any one of the known 3D stereoscopic image display methods may be combined with the reproduction of the converted image data.
  • 7 schematically illustrates a configuration of an exemplary video playback device 500 of a content consumer that can do so.
  • the image reproducing apparatus 500 includes a communication unit 510, a CPU 530, a memory 540, a storage unit 520, a user interface 550, a video driver 530, a display 570, and the like.
  • the communication unit 510 receives video data provided by an external video providing system (for example, a broadcasting system or a streaming server system) and delivers demodulated video data to the CPU 430.
  • the CPU 530 utilizes a data processing space provided by the memory 540 to perform overall control of the image reproducing apparatus 500 and to reproduce image data transmitted through the communication unit 510 in a desired stereoscopic image reproducing method.
  • the storage unit 520 functions as an application program, image data before and after processing, and a data storage space (for example, a hard disk or a flash memory) for storing a program or data necessary for performing the present invention.
  • the user interface 550 provides a function that allows the user to give a command and check the processing result, including specifying one of the original image and the converted image.
  • the video driver 560 converts the image data provided by the CPU 530 into a display driving signal and provides the converted image data to the display 570.
  • the display 570 displays an image on the screen according to the display driving signal.
  • FIG. 8 is a flowchart illustrating a method of reproducing an image according to the present invention at the image content consumer side, when the image content provider provides two types of the original image and the converted image according to the present invention.
  • the content consumer may select one of the original source image and the converted image through the user interface 550.
  • the image selection information is provided to the CPU 530 (step S30). Only when the converted video is selected, the processing described below is performed. If the original video is selected, the processing of Fig. 8 described below is not performed, and the original video is reproduced by a normal playback method.
  • the CPU 530 which has received the image selection information from the user interface 550, requests the content providing system to provide the image while providing information on the desired converted image to the content providing system through the receiver 510 (S32).
  • this step may be omitted depending on the transmission method of the video content. For example, when the content provider transmits the original source video and the converted video at the same time by broadcasting, the user's request procedure may be omitted, and the user may selectively take the converted video from the received video. On the other hand, if the content provider side provides the video content in response to the demand of the content consumer, such a request will be necessary.
  • the communication unit 510 receives the converted image data and transmits the converted image data to the CPU 530.
  • the CPU 530 may store the video data in a file form in the storage unit 520 and perform the playback process described below when necessary. If the transmitted video is a live broadcast video, the communication unit 510 may demodulate and then provide the demodulation process to the CPU 530.
  • the video data is a video provided by a streaming method or a live broadcast video
  • the CPU 530 performs the following processing for reproducing the video data in real time while receiving the video data stream.
  • the CPU 530 temporarily stores the converted image data stream provided through the communication unit 510 in the buffer memory (step S34).
  • the converted video data is read and decoded by predetermined units (step S36).
  • the CPU 530 also performs additional processing in accordance with the specifications of the stereoscopic image reproduction method (viewing method) and the display 570 for each decoded screen frame Fi (step S38).
  • the processed image data is provided to the video driver 560 (step S40).
  • the video driver 560 generates a driving signal for driving the display 570 based on the image data provided by the CPU 530, and drives the display 570 with the driving signal. As a result, an image is displayed on the display 570 according to a desired stereoscopic image reproduction method.
  • the content consumer sees the image played on the display 570.
  • the playback image should match the stereoscopic image viewing method used by the consumer.
  • Known three-dimensional image viewing method can be largely divided into glasses and glasses-free method.
  • an eyeglass viewing method playback method
  • a stereoscope method a head mounted display (HMD)
  • a red-blue eyeglass method As anaglyph, a polarizer method, a time division to a shutter glass method Etc.
  • the glasses-free viewing method (playing method) includes a parallax barrier method and a lenticular method.
  • the premise that these spectacle viewing methods and the glasses-free viewing methods are common premise is that different left-eye images and right-eye images are artificially assigned to the optical angle in order to make the playback image feel three-dimensional. Is the point.
  • the present invention is fundamentally different from the conventional stereoscopic image reproducing method in that the left eye image and the right eye image are the same. That is, in the present invention, the same left image and right image constituting each frame Fi 'of the converted image are used as the left eye image and the right eye image.
  • the present invention differs from the conventional stereoscopic image reproducing method in that an image frame Fi 'converted by the above-described conversion method is used as a source image for reproduction.
  • the left and right eyes are located at the center of each of the left and right images, and the stereoscopic image reproduction is performed in that the direction connecting the centers of the left and left images is substantially parallel to the direction connecting the centers of the right and right images. And the viewing method is different.
  • the stereoscopic method known as one of the 3D imaging techniques, juxtaposes two images having wide-angle deviations as much as binocular disparity to the left and right, and forms the two images on both eyes separately through two convex lenses juxtaposed to the left and right. It is a way to make the image feel in three dimensions.
  • This stereoscopic method can be applied to the present invention. In this case, the left image and the right image of the converted image frame Fi 'are displayed on the left half and the right half of the display 570 or vice versa.
  • the content consumer wears a stereoscopic mirror in which two convex lenses are juxtaposed to the left eye and the right eye, and the left half of the display 570 is viewed as the left eye, and the right half is viewed as the right eye.
  • the left eye and the right eye view the same two images with no wide angle difference.
  • the three-dimensional feeling as much as when viewed with the conventional stereoscopic image viewing method is not felt. However, it is not the same as the feeling of seeing a 'one' image in which the left and right eyes are common.
  • the viewing feeling is about a three-dimensional feeling between the three-dimensional effect and the simple two-dimensional feeling. It is so comfortable that almost no visual fatigue or psychological anxiety can be felt in a full stereoscopic image, but it looks like a living and refreshing feeling to some extent.
  • the effect of the image is greatly enlarged according to the magnification of the lens to obtain Can be.
  • This is particularly effective when watching an image with a smartphone having a small size of the display 570. If the user wears a stereoscopic mirror and views the two images with the left and right eyes, respectively, while the two images are reproduced in the left and right half of the screen, respectively, the size of the image felt by the user is greatly enlarged according to the lens focal length.
  • FIG. 11 shows the image displayed on the left and right two regions of the display screen 20 of the smartphone 10 through the stereoscopic mirrors 50 and 60, using the smartphone 10 as the user's video playback device.
  • An example is shown.
  • two convex lenses 30L and 30R are mounted on a frame 52 having an eyeglass shape, and the leg ends 40L and 40R of the frame 52 are smart.
  • the left and right outer portions of the display screen 20 of the phone 10 are provided to be picked up.
  • the head mounted stereoscopic mirror 50 of FIG. 11 (b) two convex lenses 30L and 30R are mounted to a position of two eyes in a frame 62 that is shaped to be used on a user's head.
  • the front of the frame 62 is provided with a detachable smartphone 10, the speaker 64 is provided on both ears of the user.
  • the lenses 30L and 30R of the stereoscopic mirrors 50 and 60 it is preferable to use a simple plano covex lens, or an aspherical lens or a double-sided aspheric lens for minimizing chromatic aberration and refraction.
  • the diameter of the lens is preferably 20 to 50mm. Since the viewing angle that a person can see comfortably is about 40 to 70 degrees, it is preferable to use a lens having characteristics that can provide such a viewing angle.
  • the focal length of the lens is suitably between about 30 and 80 mm.
  • the display screen of the image reproducing apparatus is separated from the two lenses by an interval of about 30 to 80 mm. It is preferable. If the lens is too close to the display screen, the viewing angle is too wide, which can cause eye fatigue. If the viewing angle is too narrow, there is a limit to increasing the viewing magnification of the screen, and in order to enlarge the screen with a large magnification, the lens and the display screen must be separated from each other, causing various inconveniences. In addition, since the distance between the eyes of the user varies from person to person, it is preferable that each user adjusts the distance between the centers of the two lenses to approximately 45 to 70 mm according to their own eye distance.
  • FIG. 10 is a stereoscopic lens when a user's video player is a smartphone (Samsung Galaxy S4 model) having a screen size of 11cm x 6.5cm in width and length, and a virtual screen is positioned 150cm in front of a stereoscopic lens.
  • a virtual screen is positioned 150cm in front of a stereoscopic lens.
  • the size of the screen seen through a stereoscopic mirror is shown schematically.
  • FIG. 10 in the case of a lens having a focal length of 6, an image having a length of about 277.24 cm is displayed on a virtual screen 1.5 m away.
  • the two images are arranged in a side-by-side form and are half-divided so that they are enlarged to 138.62 cm.
  • Half of the actual width of the smartphone is 5.5cm, so it is approximately 25 times larger.
  • the user can play the stereoscopic image of the converted image according to the present invention on the smartphone of the size (5-inch screen diagonally), and the user wears a stereoscopic mirror composed of two lenses having a focal length of 6 cm to view the reproduced image.
  • the same effect can be seen with the naked eye seeing a 125-inch screen 25 times magnified 1.5 meters forward.
  • the lens focal length of the stereoscopic mirror becomes longer, the effect of screen magnification is halved.
  • the focal length of the lens is 24cm, it is like viewing a screen with a width of 72.66cm on the virtual screen 1.5m forward.
  • the screen magnification is approximately 6.5 times (72/11), so that the user perceives a 36-inch television about the same size as the naked eye looking at 1.5 meters away.
  • Table 1 division Conventional stereoscopic image Image of the present invention Simple two-dimensional image Source footage Two images for left and right eyes with a wide angle difference (non-identical images) Two images for left eye and right eye with no difference in wide angle (same image) One image for the left eye and the right eye How to watch View left eye and right eye images in the left and right eyes, respectively View left eye and right eye images in the left and right eyes, respectively Both the left and right eyes view one video Spectating feeling Three-dimensional About halfway between three-dimensional feeling and two-dimensional feeling Two-dimensional Other If you wear a magnified lens, you can zoom in on the small display image.
  • the process of converting the source video frame into the target video frame can be performed by the video reproducing apparatus of the user consuming the content. Even in this case, the user's video reproducing apparatus scales (reduces or enlarges the video frame) the original video signal composed of the source video frame received from the content provider system to produce a target video signal.
  • the scaling process it is desirable to consider the correlation between the resolution of the original source video frame and the resolution of the display screen.
  • the image reproducing apparatus 500 having a hardware resource as shown in FIG. 7 is sufficient.
  • an application program configured to execute an image conversion processing algorithm.
  • the application program can be converted in a smartphone, tablet PC, general PC, and the like to convert an image. It may be desirable to implement this application program in a form of inclusion as some functions of a video player.
  • the video data to be converted may be stored in a file format in the storage unit 520, video data streamed in real time from an external content providing system, or video data carried on a broadcast signal transmitted by an external broadcast system.
  • the content provider does not differ much from generating the converted image. That is, the original source image frame is scaled to a desired ratio and converted into a target image frame, and the converted target image frame is duplicated in two to be displayed in the left half and the right half of the display screen, respectively.
  • the basic concept of allowing the left and right eyes to see the image displayed in the left half of the display screen and the image displayed in the right half through the lens is the same.
  • FIG. 9 is a flowchart schematically showing an execution procedure of an application program for processing video conversion in this case.
  • the image provided by the external broadcasting system is a general digital image.
  • the content consumer may choose whether to watch the unconverted original image or the converted image according to the present invention. This option may be exercised through the user interface 550 (step S50). If it is selected to watch the converted video, the CPU 530 performs the video conversion processing described below.
  • the image data received in the form of a broadcast signal will be provided to the CPU 530 through the communication unit 510. Since this video data will normally be encoded according to a specific compression standard, the CPU 530 decodes the received video data (step S52). Each screen frame Fi of the decoded video data is scaled by a desired ratio (step S54).
  • the scaling ratio is preferably determined in consideration of the resolution of the image data and the resolution of the display 570. For example, if the resolution of the display 570 is 720p (1280x720 pixels), consider splitting the screen of the display 570 to the left and right to display the same two target image frames on the split left and right screens. . In this case, the conversion is performed to reduce each source image frame by half.
  • the above-described method that is, removing all the even pixels in the horizontal and vertical directions of the image frame and using the remaining odd pixels as the converted image frame can be used. .
  • the number of pixels in the converted frame is 640x360. If the image is displayed on the display in a half-contracted state without any other conversion, the size of the image displayed in the side-by-side form is half the display size. That is, with respect to the reference coordinate of the display (when the coordinate of the upper left is set to (0, 0), for example), the coordinate of the upper left (starting position) of the left half region (left eye display area) of the display 570 screen is (0).
  • the coordinates of the lower right (end position) are (639, 539).
  • the coordinates of the upper left (start position) of the right half area (right eye display area) of the display 570 screen are (640, 179), and the coordinates of the lower right (end position) are (1279, 539).
  • the image frame may be converted using an appropriate scaling method according to the position and size of the display area of the display.
  • Each screen frame (Fi / 2) obtained by the scaling process is duplicated in two and arranged to be parallel to the left and right to form a new image frame (Fi ') (step S56).
  • the CPU 530 sequentially generates the converted image frame Fi 'and performs necessary processing according to the stereoscopic image reproducing method applying the converted screen frames on the other hand (step S58).
  • the processed screen frames are collected and provided to the video driver 560. That is, the CPU 530 divides two duplicate image frames Fi 'into two predetermined memory regions of the video driver 560-two memory regions corresponding to the left half region and the right half region of the display 570. Store each in-. Then, the video driver 560 reads out the two duplicated image frames Fi 'from the two memory regions and processes them to be displayed on the left half and right half regions of the display 570 (step S60).
  • the CPU 530 may collect the new image frames Fi ′ obtained in step S46 and store them in a file form in the storage unit 520, and later read and play the stored files when necessary.
  • conventional image files stored in the storage unit 520 may be converted into a converted image file according to the present invention. That is, the CPU 530 reads the source image file to be converted from the storage unit 520 and sequentially executes a combination of decoding in step 42, image reduction in step 44, and juxtaposed image in step 46.
  • the screen frame (Fi) is processed into a converted video frame (Fi ').
  • steps S48 and S50 are performed to perform playback in parallel with the conversion, or the converted frames Fi 'are collected and stored in a file format in the storage unit 520 and played back when necessary.
  • a user with normal binocular rather than strabismus has a visual direction of both eyes as shown in (a) of FIG. 12.
  • the center (CP1) and the right half region (the center of the left half region 20L of the display 20, 570) 20R) will be towards the center (CP2).
  • the eyes of the eyes of the strabismus are different.
  • the visual direction of the two eyes viewed through the two lenses 30L and 30R of the stereoscopic mirrors 50 and 60 shows a slight deviation in the left eye and a right deviation in the right eye as shown in FIG.
  • the left eye is slightly upward while being narrowed in the left and right directions, or as in (d), the left eye has a slight deviation from the center (CP1) to the upper right and the right eye has a large deviation upward.
  • the visual direction of at least one of the two eyes does not coincide with the two centers CP1 and CP2. It is necessary to correct the center of the left image and the center of the right image displayed in the side-by-side form on the display screen 20 so as to match the visual directions of the eyes of the users themselves.
  • targets C1 and C2 for image display area correction are respectively displayed on the left image display area 22L and the right image display area 22R of the displays 20 and 570, as shown in FIG. 13A. ).
  • the targets C1 and C2 may use a circle in which a centerline is displayed. However, the targets C1 and C2 may be various shapes such as a rectangle and a hexagon.
  • FIG. 13 (b) shows a state where the user who is out of focus with the pupil is recognized when using the stereoscopic mirrors 50 and 60 to view the side-by-side image displayed so as to be horizontal, as shown in FIG. 13 (a).
  • FIG. 13 (a) shows a state where the user who is out of focus with the pupil is recognized when using the stereoscopic mirrors 50 and 60 to view the side-by-side image displayed so as to be horizontal, as shown in FIG. 13 (a).
  • FIG. 13 (a) shows a state where the user who is out of focus with the pupil is recognized when using the stereoscopic mirrors 50 and
  • the second target C2 is moved by -dx and -dy to match. That is, the image reproducing apparatuses 10 and 500 adjust the coordinates CS2 of the right image display area 22R through an input device (for example, a remote control or joystick connected by Bluetooth) or a touch screen sensor.
  • the display 20 and 570 receive an input of a position adjustment signal which is commanded to move by (-dx, -dy).
  • the adjustment end signal is input by the user at that time, and the image reproducing apparatus is input.
  • the CPU 530 of (10, 500) receives the adjustment end signal and records the coordinate positions of the adjusted left image display area 22L and / or right image display area 22R in the storage unit 520.
  • do. 13 (c) shows the left image display area 22L and / or the right image display area 22R adjusted to be suitable for the user.
  • the left image and the right image of the converted target image frame are displayed in the left image display area 22L and the right image display area 22R, respectively, which are positioned to match the eyes of the user's eyes.
  • the conversion of an image frame may be performed in advance in the content provider system to provide the converted image content to the content consumer, or the content consumer may perform the conversion process of the image frame.
  • the pre- and post-processing of the transformation resulting from differences in the transformation environment or conditions may be slightly different, but the core algorithms of the image transformation are substantially the same.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

Disclosed is a method for reproducing a source image by converting the source image into an image having a three-dimensional effect which is moderate between two-dimensional and three-dimensional images by monocular cues. The method, which is executed by a computer, comprises: firstly, sequentially converting respective source image frames of source image data into corresponding target image frames so as to generate converted image data, wherein the conversion into the corresponding target image frames of the respective source image frames is obtained by scaling the source image frames in a predetermined ratio so as to form two converted image frames which are substantially the same as each other, and by combining the two converted image frames so as to form the target image frames; reproducing the target image frames of the converted image data on a screen; and respectively displaying images of the same two converted image frames, which form the respective target image frames, on a left half side and a right half side of a display screen such that the same two converted image frames, which form the respective target image frames, are respectively and separately seen by a left eye and a right eye of a consumer viewing image content with three-dimensional glasses having two lenses.

Description

2차원 영상과 3차원 영상의 중간 정도의 입체감을 주는 영상 변환 및 재생 방법Image conversion and playback method giving a three-dimensional effect between 2D and 3D images
본 발명은 영상처리에 관한 것으로서, 보다 상세하게는 2차원 영상과 3차원 영상의 중간 정도의 입체감을 제공함으로써 완전한 3차원 영상의 시청에 따른 시각적 피로감이나 심리적 불안증을 줄일 수 있는 영상신호 변환 및 재생 방법에 관한 것이다. The present invention relates to image processing, and more particularly, by providing an intermediate three-dimensional effect between a two-dimensional image and a three-dimensional image, image signal conversion and reproduction that can reduce visual fatigue or psychological anxiety caused by viewing a complete three-dimensional image. It is about a method.
입체영화 '아바타'가 개봉된 이후, 입체영상에 대한 사람들의 관심이 폭발적으로 증가하였다. 입체영상에 대한 시장도 크게 성장하였다. 입체영상(3D 영상)을 시청할 수 있는 TV, 모니터 등도 다양하게 출시되었고, 관련 입체영상 기술도 더욱 발전하였다. Since the release of the three-dimensional film Avatar, people's interest in stereoscopic images has exploded. The market for stereoscopic images also grew significantly. Various TVs, monitors, etc., which can watch 3D images (3D images), have also been released, and related 3D image technologies have been further developed.
사람이 두 눈으로 어떤 대상물을 볼 때 입체감을 느낄 수 있는 것은 어떤 대상을 바라볼 때 양안의 시선이 대상을 향해 모이는 현상인 폭주(convergence)와 약 65mm 간격을 가진 사람의 양안의 시차만큼 양안의 망막에 생기는 상에 차이가 생기는 현상인 양안시차(binocular disparity)의 두 요인(양안시 요인) 때문이다. 이들 두 요인에 의해 좌안과 우안이 소정의 편차를 갖는 서로 다른 2차원 화상을 각각 보게 되고, 이 두 화상이 망막을 통해 뇌로 전달되면, 뇌는 이를 정확히 서로 융합하여 본래 입체영상의 깊이감(perception of depth), 임장감, 사실감(perception of volume)을 재생한다. 입체영상을 디스플레이 하기 위해서는 양안시차를 갖는 서로 다른 2개의 영상이 필요하다. 3D 디스플레이용 입체영상 콘텐츠는 양안시차를 갖도록 65mm 가량 벌린 두 대의 카메라로 동시에 촬영하는 2안 렌즈 촬영방식을 통해 제작될 수 있다. 1안 렌즈로 된 카메라로 촬영한 1안 시점의 영상 콘텐츠를 하드웨어, 소프트웨어적인 계산을 통해 변환하여 2안 렌즈 촬영방식과 같은 효과를 나타내는 방법도 있다. When one looks at an object with two eyes, one can feel the three-dimensional effect of convergence, which is a phenomenon in which the eyes of both eyes converge toward the object and the parallax of both eyes of a person having a distance of about 65 mm. This is due to two factors (binocular vision) of binocular disparity, which is a phenomenon in which a difference occurs in the retina. Due to these two factors, the left and right eyes see different two-dimensional images, each with a predetermined deviation, and when these two images are transmitted through the retina to the brain, the brain fusions exactly with each other and the perception of the depth of the original stereoscopic image. of depth, presence, and perception of volume. In order to display a stereoscopic image, two different images having binocular disparity are required. Stereoscopic image content for 3D display can be produced through a binocular lens shooting method that simultaneously shoots with two cameras that are about 65mm apart to have binocular parallax. There is also a method of converting image contents of a single eye view taken by a single-eye lens camera through hardware and software calculations to achieve the same effect as a two-eye lens shooting method.
그런데 양안시 요인에 의한 입체영상은 영화 아바타의 성공 직후 크게 각광받았지만, 최근에는 입체영상의 소비주체들의 구매욕이 잠시 주춤한 상태에 있다. 입체영상의 인기가 다소 시들해지게 된 것은 시청기기의 단가가 높은 반면, 입체영상 콘텐츠는 크게 부족한 것이 한 가지 이유이다. 하지만 입체영상 시청이 사람들에게 불편함을 주고 심지어는 건강에 나쁜 영향을 미칠 수 있다는 우려가 더 근본적인 이유가 될 수 있다. By the way, the stereoscopic image due to the binocular vision has gained much attention immediately after the success of the movie avatar, but recently, consumers' desire to purchase stereoscopic images has been stalled for a while. The reason why the popularity of stereoscopic images has become weaker is that the cost of viewing devices is high, while stereoscopic contents are largely lacking. But the more fundamental reason is that concerns about watching stereoscopic images can be uncomfortable and even adversely affect people's health.
양안시 요인에 의한 입체영상을 시청한 사람들은 시각적 피로감과 심리적 불안정을 느끼는 것으로 알려져 있다. 3D 영상 시청에 따른 시각적 피로와 불안정의 증세로는 눈의 피곤함(eyestrain), 눈의 무겁게 느껴짐(eyes feel heavy), 이중상(double vision), 눈의 건조(dry eyes), 머리가 무거워짐, 두통, 어깨가 뻣뻣해짐, 어깨 아픔, 등의 아픔, 멀미증상(nausea), 현기증(giddiness), 두통 등이 있다. 통계에 의하면 대략 12% 정도의 사람들은 여러 가지 의학적 조건들 때문에 입체영상을 제대로 볼 수 없다, 또한 사람들의 대략 30% 정도는 매우 약한 입체시(stereoscopic vision)를 가져 깊이 인식을 잘 하지 못한다. 그런 사람들에게는 입체영상에 대한 집중 효과가 거의 없거나 크게 감소된다. 이런 점들 때문에, 입체영상 영상을 입체적으로 보는 것에 대해 거부감을 갖는 소비자들이 의외로 많다. People who watched stereoscopic images due to binocular vision are known to have visual fatigue and psychological instability. Visual fatigue and instability associated with viewing 3D images include eyestrain, eyes feel heavy, double vision, dry eyes, heavy head, headache Shoulder stiffness, shoulder pain, back pain, nausea, giddiness, and headache. Statistics show that about 12% of people are unable to see stereoscopic images properly due to various medical conditions, and about 30% of people have very weak stereoscopic vision, making them poorly aware of depth. Such people have little or no significant effect on the stereoscopic image. Because of these points, there are surprisingly many consumers who have a rejection of viewing stereoscopic images in three dimensions.
양안시 요인에 의한 입체영상을 시청한 많은 사람들이 눈의 피로, 어지럼증을 경험한 데서, 그 입체영상의 지속적인 시청이 인체에 해로운 영향을 미치지 않는가 하는 문제에 강한 의구심도 생겨나고 있다. 입체영상의 산업 활성화를 위해서는 이 문제에 대한 연구를 통해 3D 디스플레이 및 콘텐츠에 대한 안정성 기준을 마련하는 것이 매우 중요하다. 입체영상에 있어서의 시각 심리적 피로를 유발하는 요인에 관해서는 명쾌하게 규명된 것은 아니다. 하지만, 대체로 두 눈의 초점거리와 수렴각도의 불일치, 부자연스러운 영상, 운동시차의 불일치, 좌우영상의 광학적 특징 등이 그런 시각 심리적 피로 유발요인이 될 수 있다는 점은 수긍할만하다. 이런 요인들은 입체영상의 잘못된 촬영, 잘못된 디스플레이를 포함한 입체영상 재생시스템의 오류와 관련 있기도 하지만, 입체영상 자체의 본래적 속성과도 밀접하게 관련된 것으로 이해된다. 양안시 요인에 의한 입체영상에서는 움직이는 물체의 과도한 돌출감과 속도감이 느껴지고, 영상이 화려한 색채와 복잡한 무늬를 많이 포함하면 그 부분이 입체감에 더해 문양과 색채들의 잔상을 남긴다. 이런 영상을 오래도록 보게 되면 어지럼증 등 시각적 피로감과 심리적 불안증이 유발된다. Many people who have watched stereoscopic images due to binocular vision have experienced eye fatigue and dizziness, and there is also a strong suspicion that the continuous viewing of stereoscopic images does not adversely affect the human body. In order to activate the industry of stereoscopic images, it is very important to study the problem and to establish stability standards for 3D display and contents. The factors causing visual psychological fatigue in stereoscopic images are not clearly identified. However, it is generally acceptable that the discrepancy between the focal length and convergence angle of the two eyes, the unnatural image, the disparity of the motion parallax, and the optical characteristics of the left and right images can be the cause of visual psychological fatigue. Although these factors are related to the error of stereoscopic image reproducing system including wrong shooting of stereoscopic images and wrong display, it is understood that these factors are closely related to the original attributes of stereoscopic images themselves. In stereoscopic images caused by binocular vision, excessive protrusion and speed of moving objects are felt, and if the image contains a lot of colorful colors and intricate patterns, the part adds a three-dimensional feeling to leave afterimages of patterns and colors. Watching these videos for a long time causes visual fatigue and psychological anxiety, such as dizziness.
입체영상 시청 시 어지러움 현상 등을 최소화하기 위한 기술들이 여러 가지 제안되고 있다. 일예로, 입체영상 제작 시 촬영자 개인의 능력차로 인해 발생하는 입체영상의 오류를 보정하는 기술(대한민국 특허공개공보 제 10-2012-0064560호. 발명의 명칭: 시각적 피로 최소화를 지원하는 입체영상 제작시스템 및 그 방법)이 알려져 있다. 이 종래기술은 촬영단계에서 발생할 수 있는 입체영상의 오류로 좌/우 영상 간 기하오차, 색상오차, 영상의 잔상 발생, 한쪽 영상에만 보이는 물체 등) 여러 가지 요인이 있다고 보고, 이런 오류를 제거 내지 최소화 할 수 있는 입체 보정 기술을 제시한다. 하지만, 이 기술은 촬영단계에서의 오류 수정에 초점이 맞춰져 있으므로, 문제의 근본적인 해결책은 되지 못한다. Various techniques for minimizing dizziness when viewing 3D images have been proposed. For example, a technology for correcting an error of a stereoscopic image caused by a difference in capability of an individual photographer when producing a stereoscopic image (Korean Patent Publication No. 10-2012-0064560. Name of the Invention: A stereoscopic image production system supporting minimizing visual fatigue And the method) are known. The prior art reports that there are various factors such as geometric errors between left and right images, color errors, afterimages of images, and objects visible only on one image as errors of stereoscopic images that may occur in the shooting stage. We present stereoscopic correction technology that can be minimized. However, this technique is focused on error correction at the shooting stage, and thus is not a fundamental solution to the problem.
결국, 영상을 입체적으로 보이게 하는 것이 모든 사람들에게 좋은 것은 아니다. 입체영상 시청으로 인해 야기되는 여러 가지 건강상의 문제들에 대한 근본적인 해법은 입체감을 최소화 하거나 제거하는 것일 수 있다.After all, making images look stereoscopic is not good for everyone. The fundamental solution to various health problems caused by viewing stereoscopic images may be to minimize or eliminate stereoscopic effects.
한편, 동일한 영상이라 하더라도 그 영상이 표시되는 화면의 크기에 따라서 보는 사람의 감동이 달라진다. 영화관의 대형 스크린을 통해서 본 영화의 감흥을 컴퓨터 모니터 또는 스마트폰과 같은 작은 화면을 통해서는 제대로 느끼기 힘들다. 그 이유는 사용자가 보는 화면의 크기에 차이가 있기 때문이다. 영화관의 스크린만큼까지는 아니더라도, 작은 사이즈의 화면을 확대하여 영상을 화면의 실제 크기보다 훨씬 크게 볼 수 있다면, 사용자들의 요구에 제대로 부응하는 것이라 할 수 있다. 컴퓨터 모니터를 통한 영상 콘텐츠 감상이 널리 일반화되었듯이, 최근에는 스마트폰 사용 인구의 폭발적 증가에 따라 스마트폰을 이용한 영상 콘텐츠나 TV 시청도 일반화되고 있다. 위와 같은 요구는 화면 사이즈가 상대적으로 작은 스마트폰이나 컴퓨터 모니터를 통한 영상 시청 시에 더욱 강하다고 할 수 있다. Meanwhile, even in the same image, the impression of the viewer varies according to the size of the screen on which the image is displayed. It is hard to feel the inspiration of this movie through the big screen of a movie theater on a small screen such as a computer monitor or a smartphone. This is because there is a difference in the size of the screen that the user sees. If not as much as the screen of a movie theater, it can be said that if the screen of the small size can be enlarged and the image can be seen to be much larger than the actual size of the screen, it can meet the needs of users. As the viewing of video contents through computer monitors has become widespread, in recent years, with the explosive increase in the population of smartphones, the viewing of video contents and TVs using smartphones has become commonplace. Such demands can be said to be stronger when viewing images on a smartphone or computer monitor with a relatively small screen size.
영상을 실제 화면보다 더 크게 볼 수 있는 해법이 강구될 필요가 있다. 그런데 그 해법은 어지럼증 등과 같은 불편함을 유발하는 입체영상을 이용하는 방법이 아닌 제3의 방법일 필요가 있다. There is a need to find a solution to view an image larger than the actual screen. However, the solution needs to be a third method, not a method of using a stereoscopic image that causes discomfort such as dizziness.
또한, 사용자들은 시선 방향 특성이 정상적인 경우도 있지만, 사시와 같이 비정상적인 시선방향 특성을 갖는 경우도 있다. 사시 특성을 사용자들이 편안하게 영상을 감상할 수 있도록 하기 위한 기술적 고려도 필요하다.In addition, the user may have normal gaze direction characteristics, but may have abnormal gaze characteristics such as strabismus. Technical considerations are also required to ensure that the characteristics of strabismus allow the user to comfortably view the images.
본 발명은 단안시 요인들에 의한 입체감 내지 깊이감과 실제감 및 임장감을 제공함으로써, 입체감을 전혀 제공하지 못하는 2D 영상과는 차별화된 영상이면서도 양안시 요인에 따른 입체감에 의한 시각적 피로감이나 심리적 불안증은 유발하지 않는 영상 변환 및 재생 방법을 제공하는 것을 목적으로 한다. The present invention provides a three-dimensional to depth feeling and a sense of realism and a sense of presence by monocular factors, which are differentiated from 2D images that do not provide any stereoscopic feeling, but also cause visual fatigue or psychological anxiety caused by three-dimensional feeling depending on binocular factors. It is an object of the present invention to provide a video conversion and reproduction method that does not.
본 발명은 또한 위와 같은 방법으로 생성한 영상을 실제 화면에 비해 훨씬 더 크게 시청할 수 있도록 하는 영상 변환 및 재생 방법을 제공하는 것을 다른 목적으로 한다.Another object of the present invention is to provide an image converting and reproducing method for viewing an image generated by the above method much larger than an actual screen.
본 발명은 또한, 영상재생기기의 디스플레이 화면에 사이드 바이 사이드 형태로 표시되는 영상의 위치를 사용자의 시선방향의 특성에 맞게 조정할 수 있도록 함으로써, 사시를 가진 사용자도 편안한 영상 감상을 가능하게 해주는 영상 변환 및 재생 방법을 제공하는 것을 또 다른 목적으로 한다.In another aspect, the present invention, by adjusting the position of the image displayed in the side-by-side form on the display screen of the video player according to the characteristics of the user's gaze direction, the image conversion that allows a user with strabismus to enjoy a comfortable image And to provide a regeneration method.
위와 같은 목적을 달성하기 위한 본 발명의 일 측면에 따르면, 영상변환부에서, 소스 영상데이터의 각 소스 영상프레임(Fi)을 대응하는 타겟 영상프레임(Fi')으로 순차적으로 변환하여 상기 타겟 영상프레임(Fi')들로 구성된 변환 영상데이터를 생성하는 제1단계, 여기서 상기 각 소스 영상프레임(Fi)의 대응 타겟 영상프레임(Fi')으로의 변환은 상기 소스 영상프레임(Fi)을 소정의 비율로 스케일링 하여 실질적으로 동일한 두 개의 변환 영상프레임을 만들고, 상기 두 개의 변환 영상프레임을 조합하여 상기 타겟 영상프레임(Fi')을 구성하는 것에 의해 달성되며; 상기 영상변환부가 상기 변환 영상데이터를 영상재생부로 제공하는 제2단계; 및 상기 영상재생부에서, 제공받은 상기 변환 영상데이터의 타겟 영상프레임(Fi')들을 화면에 재생하되, 각 타겟 영상프레임(Fi')을 구성하는 상기 실질적으로 동일한 두 개의 변환 영상프레임의 영상을 디스플레이 화면의 좌측 절반과 우측 절반에 각각 디스플레이 되게 함으로써, 각 타겟 영상프레임(Fi')을 구성하는 동일한 두 개의 변환 영상프레임이 두 개의 렌즈를 포함하는 입체경(stereoscope)으로 관람하는 영상콘텐츠 소비자의 좌안과 우안에 각각 별도로 보일 수 있도록 재생하는 제3단계를 포함하는 것을 특징으로 하는 영상 데이터 변환 및 재생 방법이 제공된다.According to an aspect of the present invention for achieving the above object, in the image conversion unit, by converting each source image frame (Fi) of the source image data to a corresponding target image frame (Fi ') in sequence to the target image frame A first step of generating the converted image data consisting of (Fi '), wherein the conversion of each source image frame (Fi) to the corresponding target image frame (Fi') is a ratio of the source image frame (Fi ') By scaling to create two substantially identical transformed video frames, and combining the two transformed video frames to form the target image frame Fi '; A second step of providing the converted image data to the image reproducing unit; And reproducing the target image frames Fi 'of the converted image data provided by the image reproducing unit on a screen, and displaying the images of the two substantially identical converted image frames constituting each target image frame Fi'. The left eye and the right half of the display screen are respectively displayed so that the same two converted image frames constituting each target image frame (Fi ') are viewed by a stereoscopic lens including two lenses. There is provided a video data conversion and playback method comprising a third step of reproducing so that it can be seen separately from each other.
상기 방법에 있어서, 상기 스케일링에 적용하는 비율은, 상기 실질적으로 동일한 두 개의 변환 영상프레임이 영상재생기기의 디스플레이 화면의 좌측 반분영역과 우측 반분영역 내에 각각 표시될 수 있는 영상 크기를 갖게 하는 값으로 정해지는 것이 바람직하다.In the above method, the ratio applied to the scaling is such that the two substantially identical transformed video frames have an image size that can be displayed in the left half and right half regions of the display screen of the image reproducing apparatus, respectively. It is preferable to be determined.
상기 방법의 일예에 따르면, 상기 실질적으로 동일한 두 개의 변환 영상프레임은, 상기 소스 영상프레임(Fi)의 크기를 가로방향과 세로방향으로 각각 절반으로 줄인 축소 영상프레임을 만든 다음 상기 축소 영상프레임을 두 개로 복제하여 얻어지는 두 개의 축소 영상 프레임이다. According to one example of the method, the two substantially identical converted video frame, to reduce the size of the source video frame (Fi) in the horizontal direction and the vertical direction in half each reduced image frame and then the two reduced image frame It is two reduced image frames obtained by duplication.
상기 방법의 다른 예에 따르면, 상기 실질적으로 동일한 두 개의 변환 영상프레임은, (i) 상기 소스 영상 프레임(Fi)의 홀수 번째의 행과 열에 있는 픽셀 데이터들만을 취하여 구성한 제1 변환 영상프레임과 짝수 번째의 행과 열에 있는 픽셀 데이터들만을 취하여 구성한 제2 변환 영상 프레임으로 구성되는 것이다.According to another example of the method, the two substantially identical transformed image frames are (i) even with a first transformed image frame constructed by taking only pixel data in odd-numbered rows and columns of the source image frame Fi. It consists of a second converted image frame composed of only the pixel data in the first row and column.
상기 영상 데이터 변환 및 재생 방법은, 상기 디스플레이 화면의 좌우로 양분한 좌측 반분영역과 우측 반분영역에 각각 이미지 표시 영역 보정을 위한 표적을 표시하는 단계; 및 사용자 입력수단을 통해 상기 좌측 반분영역 또는 우측 반분영역 중 어느 하나의 이미지 표시 영역 보정 좌표 정보를 입력받아, 상기 이미지 표시 영역 보정 좌표 정보에 따라서 이미지 표시 영역 좌표를 변경하는 단계를 더 포함할 수 있다.The image data converting and reproducing method may further include: displaying a target for correcting an image display area in a left half region and a right half region divided by left and right sides of the display screen; And receiving image display area correction coordinate information of any one of the left half region and the right half region through a user input means, and changing the image display region coordinates according to the image display region correction coordinate information. have.
상기 영상 데이터 변환 및 재생 방법에 있어서, 상기 제3단계에서의 영상 디스플레이는 스마트폰 또는 타블렛 컴퓨터를 비롯한 휴대용 영상재생기기에서 수행되고, 영상콘텐츠 소비자는 40~70°의 시야각을 제공하는 상기 입체경의 두 개의 볼록렌즈가 상기 디스플레이 화면으로부터 30 ~ 80 mm의 이격된 상태에서 상기 입체경을 통해 상기 실질적으로 동일한 두 개의 변환 영상프레임을 동시에 보는 것이 바람직하다.In the image data converting and reproducing method, the image display in the third step is performed in a portable image reproducing apparatus including a smartphone or a tablet computer, and the image content consumer of the stereoscopic mirror provides a viewing angle of 40 to 70 °. It is preferable that the two convex lenses simultaneously view the two substantially identical converted image frames through the stereoscopic mirror with the convex lens separated by 30 to 80 mm from the display screen.
상기 영상 데이터 변환 및 재생 방법에 있어서, 상기 제1단계, 상기 제2단계, 및 상기 제3단계는 상기 영상변환부와 상기 영상재생부를 모두 구비하는 영상콘텐츠 소비자 측의 영상재생기기에서 수행될 수 있다. In the video data conversion and playback method, the first step, the second step, and the third step may be performed in an image reproducing device of a consumer of an image content including both the image converting unit and the image reproducing unit. have.
상기 영상 데이터 변환 및 재생 방법에 있어서, 상기 제1단계와 상기 제2단계는 상기 영상변환부를 구비하는 영상콘텐츠 제공자 측의 영상제공시스템에 의해 수행되고, 상기 제3단계는 상기 영상재생부를 구비하는 영상콘텐츠 소비자 측의 영상재생기기에 의해 수행될 수도 있다. 이 경우, 상기 영상변환부가 상기 제2단계를 수행할 때 상기 변환 영상데이터를 스트리밍(streaming) 방식 또는 방송(broadcast) 방식으로 상기 영상재생부에 전송한다.In the video data converting and reproducing method, the first and second steps are performed by an image providing system on the side of an image content provider including the image converting unit, and the third step comprises the image reproducing unit. The image content may be performed by an image reproducing device of a consumer. In this case, when the image conversion unit performs the second step, the image conversion unit transmits the converted image data to the image reproduction unit in a streaming method or a broadcast method.
상기 제2단계에서 상기 영상제공시스템이 상기 영상재생기기에 상기 변환 영상데이터를 제공함에 있어서 상기 소스 영상데이터도 함께 제공하는 것이 바람직하다. 이 경우, 상기 제3단계는 상기 영상재생기기에서 영상콘텐츠 소비자가 상기 소스 영상데이터와 상기 변환 영상데이터 중 후자를 선택하여 재생을 지시하는 경우에 수행된다.In the second step, when the image providing system provides the converted image data to the image reproducing apparatus, the source image data is also provided. In this case, the third step is performed when the video content consumer instructs playback by selecting the latter of the source video data and the converted video data.
본 발명의 영상 변환 및 재생 방법에 따르면, 사용자의 좌안과 우안에 보이는 두 영상은 광각의 차이가 전혀 없는(즉, 서로 간에 오프셋이 전혀 없는) 완전히 동일한 영상이므로, 양안시차를 이용한 3D영상 효과는 느낄 수 없고, 그렇다고 좌안과 우안이 공통된 '하나의' 영상을 볼 때의 느낌(단순한 2차원감)과 같은 느낌도 아니다. 좌안과 우안이 '두 개의' 동일 영상을 각각 별도로 보기 때문에, 좌안과 우안 각각을 통해 소위 '단안시 요인에 따른 입체감'(이에 관해서는 후술함)을 느낄 수 있을 뿐입니다. 재생되는 영상의 관람 느낌은 완전한 3D 입체감과 단순한 2차원감의 중간 정도의 느낌이다. 그러므로 완전한 3D 입체영상에서 느껴지는 시각적 피로나 심리적 불안증이 거의 생기지 않고, 오히려 아주 편안하면서도 실제감 및 임장감이 어느 정도 살아있고 청량감마저 느껴진다. 그러므로 3D 영상의 시청으로 인한 부작용(시각적 피로감과 심리적 불안증)을 막을 수 있다.According to the image converting and reproducing method of the present invention, since the two images visible to the left and right eyes of the user are completely identical images (that is, no offset between each other), the 3D image effect using binocular disparity is It can't be felt, but it's not like the feeling of a simple 'two-dimensional' image when the left eye and the right eye are in common. Since the left and right eyes view the 'two' identical images separately, you can only feel the so-called 'three-dimensional effect of monocular factors' (described later) through each of the left and right eyes. The viewing feeling of the reproduced video is halfway between the full 3D and simple two-dimensional. Therefore, almost no visual fatigue or psychological anxiety, which is felt in a complete 3D stereoscopic image, is rather comfortable, but a sense of reality and presence is alive and refreshed. Therefore, side effects (visual fatigue and psychological anxiety) caused by viewing 3D images can be prevented.
게다가 스테레오스코프 방식으로 재생하면서 배율이 있는 입체경을 착용하고 관람하면, 재생 영상을 상당히 크게 확대하여 볼 수 있는 효과를 누릴 수 있다. 즉, 사용하는 입체경의 렌즈 배율에 따라 영상이 확대되어 보이는 효과를 얻을 수 있다. 예컨대, 초점거리가 6cm인 두 렌즈로 된 입체경을 착용하여 그 재생 영상을 보면, 사용자는 1.5미터 전방에 25배 확대된 125인치 스크린을 맨눈으로 보는 것과 동일한 효과를 얻을 수 있다. 이는 화면 사이즈가 작은 스마트폰과 같은 영상재생기의 단점을 상쇄시켜주는 효과가 있다. In addition, when wearing a stereoscopic mirror with a magnification while playing in stereoscope method, you can enjoy the effect of enlarging the playback image considerably. That is, the image can be enlarged and seen according to the lens magnification of the stereoscopic mirror to be used. For example, when viewing a playback image of a stereoscopic mirror composed of two lenses having a focal length of 6 cm, the user can obtain the same effect as when viewing a 125-inch screen magnified 25 times in front of 1.5 meters. This has the effect of offsetting the shortcomings of a video player such as a smartphone with a small screen size.
또한, 본 발명의 방법에 의하면, 두 개의 변환 영상 프레임을 디스플레이의 좌측 반분영역과 우측 반분영역에 사이드 바이 사이드 형식으로 표시함에 있어서 그 영상 프레임의 표시 위치를 사용자의 시선방향의 특성에 맞게 조절할 수 있다. 따라서 사시를 갖는 사용자들도 자신의 시선방향에 적합하게 영상 표시 위치를 조절하여 영상 관람을 편안하게 할 수 있도록 해준다.In addition, according to the method of the present invention, in displaying two converted image frames in a side by side format on the left half region and the right half region of the display, the display position of the image frames can be adjusted according to the characteristics of the user's gaze direction. have. Therefore, users with strabismus can adjust the position of the video display according to their own gaze direction, thereby making it easier to view the video.
도 1은 본 발명에 따른 영상 디스플레이 및 관람 방법을 개념적으로 도시한 도면이고,1 is a view conceptually illustrating an image display and a viewing method according to the present invention;
도 2는 사용자의 좌안(좌측 렌즈 포함)과 우안(우측 렌즈 포함)이 디스플레이 화면의 좌측 절반과 우측 절반을 각각의 중심에 각각 정렬되어 관람하는 상태를 나타내며,2 illustrates a state in which the left eye (including the left lens) and the right eye (including the right lens) of the user view the left half and the right half of the display screen, respectively, aligned at their centers.
도 3은 원본 프레임을 절반으로 축소한 다음 그 축소된 영상 프레임을 두 개 복제하여 좌우에 병치하는(side-by-side) 방식으로 변환 영상 프레임을 만드는 것을 도식적으로 나타낸 도면이고,FIG. 3 is a diagram schematically showing a converted image frame in a side-by-side manner in which an original frame is reduced in half, and then duplicated two reduced image frames.
도 4는 본 발명에 따른 영상변환 처리를 수행하는 수단을 간략하게 도시하며,4 briefly shows a means for performing image conversion processing according to the present invention,
도 5는 원본 영상을 축소된 두 개의 동일 영상을 좌우 병치시키는 영상 변환을 처리하는 데 필요한 영상 콘텐츠 제공자 시스템(의 구성을 개략적으로 나타내며,FIG. 5 schematically shows the configuration of an image content provider system (necessary for processing an image transformation in which the original image is left and right juxtaposed with two reduced identical images;
도 6은 본 발명에 따른 영상 변환 알고리즘이 구현된 애플리케이션 프로그램의 처리 절차를 흐름도이며,6 is a flowchart illustrating a processing procedure of an application program in which an image conversion algorithm according to the present invention is implemented.
도 7은 콘텐츠 소비자의 영상재생기기(500)의 구성을 개략적으로 도시하며,7 schematically illustrates a configuration of a video player 500 of a content consumer,
도 8은 영상 콘텐츠 제공자 측에서 원래의 영상과 본 발명에 따라 변환한 영상의 두 가지 종류로 제공할 때, 영상 콘텐츠 소비자 측에서 본 발명에 따라 영상을 재생하는 방법을 나타낸 흐름도이며, FIG. 8 is a flowchart illustrating a method of reproducing an image according to the present invention at an image content consumer when providing the image into two types, an original image and an image converted according to the present invention.
도 9는 영상 데이터가 라이브 방송신호 형태로 제공되는 경우의 영상 변환을 처리하는 애플리케이션 프로그램의 처리 절차를 개략적으로 나타낸 흐름도이며,9 is a flowchart schematically illustrating a processing procedure of an application program for processing video conversion when video data is provided in the form of a live broadcast signal.
도 10은 본 발명에 따라 변환된 영상을 입체경으로 시청할 때, 입체경의 렌즈 초점거리에 따라 화면이 확대되는 효과를 설명하기 위한 도면이며,10 is a view for explaining the effect that the screen is enlarged according to the lens focal length of the stereoscopic when viewing the converted image in accordance with the stereoscopic mirror,
도 11의 (a)와 (b)는 본 발명의 일 실시예에 따라 스마트폰에서 사이드 바이 사이드 형태로 재생되는 동일한 두 변환 영상을 사용자가 간이형 입체경과 헤드 마운트형 입체경을 이용하여 관람하는 경우를 각각 나타내며,11 (a) and 11 (b) illustrate a case where a user views two identical converted images reproduced in a side by side form on a smartphone using a simple stereoscopic head and a stereoscopic stereoscopic head mounted mirror according to an embodiment of the present invention. Respectively,
도 12는 사용자의 두 눈의 시선방향이 디스플레이 화면의 좌우 반분영역의 중심에 정상적으로 위치하는 경우((a)의 경우)와 사시로 인해 어긋나게 위치하는 경우((b) 내지 (d)의 경우)를 예시적으로 도시하며,12 illustrates a case in which the eyes of the user's eyes are normally positioned at the center of the left and right half-half regions of the display screen (in case of (a)) and when they are displaced due to strabismus (in case of (b) to (d)). By way of example,
도 13은 디스플레이 화면에 표시되는 영상 표시 영역의 위치 조정을 위한 표적의 일실시예와 보정된 영상 표시 영역에 관한 설명도이다.13 is an explanatory diagram of an embodiment of a target for adjusting the position of an image display area displayed on a display screen and a corrected image display area.
이하에서는 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 설명하기로 한다.Hereinafter, with reference to the accompanying drawings will be described a preferred embodiment of the present invention.
본 발명자는 양안시 요인들에 의한 입체영상이 나타내는 부작용(시각적 피로감과 심리적 불안증)을 해결할 수 있는 기술을 탐구하는 과정에서, 다음과 같은 점을 발견하게 되었다. 그것은 바로 '동일한 두 영상'을 좌안과 우안을 통해 실질적으로 동일한 시선방향(즉, 양안에서 두 영상을 각각 향하는 두 방향이 서로 평행임)으로 동시에 보았을 때 그 두 영상 각각에 관해 단안시 요인들에 따른 입체감을 이중적으로 인식하게 되는 효과가 생긴다는 점이다. 또한 그 두 영상을 볼록렌즈를 통해 크게 확대시켜 보면, 단안시 요인들에 의한 입체감을 더욱 뚜렷이 인식할 수 있고 그 영상에 대한 실제감과 임장감이 함께 어우러져 기존의 양안시 요인에 의한 입체감이나 단순한 2D 영상의 관람감과는 전혀 다른 느낌의 영상을 즐길 수 있다는 점이다. 본 발명은 이런 개념에 기반을 둔 것이다.The present inventors have found the following points in the process of exploring techniques for solving side effects (visual fatigue and psychological anxiety) caused by stereoscopic images caused by binocular factors. That is, when the same two images are viewed simultaneously through the left eye and the right eye in substantially the same visual direction (ie, the two directions of the two images facing each other in both eyes are parallel to each other), The effect of double recognition of the three-dimensional effect occurs. In addition, when the two images are greatly enlarged through the convex lens, the stereoscopic effect by the monocular factors can be recognized more clearly, and the realism and presence of the image are combined together so that the stereoscopic or simple 2D image due to the existing binocular factor is combined. You can enjoy the video with a completely different feeling from the audience's view. The present invention is based on this concept.
본 발명에 있어서, '동일한 두 영상'은 원본 영상 프레임을 복제하였을 때 그 원본과 복제본과 같이 완전히 동일한 두 영상 프레임을 포함하는 것은 물론, 완전히 동일하지는 않지만 '실질적으로 동일'하다고 인정할 수 있는 정도의 동일성을 갖는 두 영상 프레임까지를 포함하는 개념이다. 예컨대 하나의 원본 영상 프레임으로부터 동일성이 인정될 정도로 비슷한 특정 영상 데이터를 추출하는 방식으로 구성한 두 영상 프레임(예: 짝수 번째 필드만을 추출하여 구성한 제1 영상 프레임과 홀수 번째 필드만을 추출한 제2 영상 프레임, 또는 행과 열 방향으로 각각 홀수 번째 픽셀만을 추출하여 구성한 제1 영상 프레임과 짝수 번째 픽셀들만 추출하여 구성한 제2 영상 프레임 등), 또는 하나의 원본 영상 프레임을 예컨대 보간법(예: 인접 화소 보간법, 양선형 보간법, 3차 회선 보간법, B-스플라인 보간법 등) 등을 이용하여 적절한 비율로 축소 또는 확대하여 얻은 두 영상 프레임을 '동일성을 갖는 두 영상 프레임'의 대표적인 예로 들 수 있지만, 반드시 이에 한정되는 것은 아니다. '실질적으로 동일한 두 영상'은 같은 원본 영상 프레임으로부터 유래된 것으로서, 두 영상 프레임 간에 양안시차와 같은 광각의 차이가 없고 단지 화소 데이터 값의 미세한 차이를 갖는 그 두 영상 프레임을 널리 포괄한다.In the present invention, 'the same two images' include two completely identical image frames, such as the original and a duplicate, when the original image frame is duplicated, and of course, they are not completely identical but can be regarded as 'substantially identical'. The concept includes up to two image frames having the same identity. For example, two image frames (eg, a first image frame configured by extracting only even fields and a second image frame extracted only odd-numbered fields) may be configured by extracting specific image data that are similar enough to be recognized from one original image frame. Or a first image frame formed by extracting only odd pixels in a row and a column direction, and a second image frame formed by extracting only even pixels, or an original image frame, for example, interpolation (eg, adjacent pixel interpolation, Linear image interpolation, cubic interpolation, B-spline interpolation, etc.) may be a representative example of 'two image frames having the same' as two image frames obtained by reducing or expanding at an appropriate ratio. no. The 'substantially identical two images' are derived from the same original image frame, and widely cover those two image frames having no wide-angle difference such as binocular disparity between the two image frames and having only a slight difference in pixel data values.
본 발명이 제공하는 입체감의 토대가 되는 '단안시 요인'은 주로 경험적 깊이 단서로서, 예를 들면 다음과 같은 것 들이다. 동일한 사물이 가까이 있으면 크게 보이고 멀리 있으면 작게 보이는 것(물체의 상대적 크기), 3차원 공간상에서 실제 평행한 두 직선이 하나의 점으로 수렴하는 모습을 보일 때 깊이감을 인지하는 것(선원근법), 앞뒤 사물이 겹쳐 있을 때 가려진 사물이 뒤에 있다는 것을 경험을 통해서 인지하는 것(중첩), 대기 산란 효과에 의해 멀리 있는 사물이 흐릿하게 보일 때 경험상 깊이감을 인지하는 것(대기산란), 근거리와 원거리에 놓인 물체의 질감 변화를 인지할 때 깊이감을 지각하는 것(텍스처 구배), 빛과 그림자를 통해 사물의 3차원 형상을 짐작하는 것(빛과 그림자), 거리에 따른 물체의 상대적 움직임 변화로 인해 깊이감을 지각하는 것(상대 속도), 물체에 맺힌 초점 변화로 인한 깊이감을 지각하는 것(초점) 등이 대표적인 단안시 요인이다.The 'monocular factor' that is the basis of the three-dimensional effect provided by the present invention is mainly an empirical depth clue, for example, as follows. Recognizing depth when the same object appears large when it's close and small when it's far away (relative size of the object), when two parallel lines actually converge in one point in three-dimensional space (line perspective) Recognizing through experience that obscured objects are behind when overlapping (overlapping); perception of depth in experience when distant objects appear blurred by atmospheric scattering effects (atmospheric scattering); Perception of depth when recognizing texture changes in an object (texture gradient); guessing the three-dimensional shape of an object through light and shadow (light and shadow); Perception (relative velocity) and perception of depth due to a change in focus on an object (focus) are typical monocular factors.
이런 단안시 요인에 의한 입체감은 통상적인 3D 영상의 입체감과는 본질적으로 다르다. 통상적인 양안시 요인들에 의한 영상의 입체감은, 동일한 대상을 양안시차(Binocular Disparity)에 상응하는 광각의 차이만큼 다른 각도에서 촬영하거나 또는 그런 차이를 갖도록 영상을 가공하여, 소정의 편차를 갖는 두 영상을 좌안과 우안이 양안시차만큼 서로 다른 방향으로 각각 보았을 때 느끼는 입체감이다. 본 발명이 제공하는 단안시 요인에 따른 입체감은 이런 통상적인 양안시 요인에 의한 입체영상이 나타내는 부작용(시각적 피로감과 심리적 불안증)을 거의 유발하지 않는다. 또한, '하나의 영상'을 좌안과 우안이 '서로 다른(비평행) 시선방향'으로 볼 때 인식되는, 입체감을 전혀 못 느끼는 통상적인 2D 영상과도 다르다.The stereoscopic effect caused by such monocular factors is inherently different from the stereoscopic effect of a normal 3D image. The stereoscopic effect of the image due to conventional binocular factors may be obtained by photographing the same object at different angles or by processing the image to have such a difference by a wide-angle difference corresponding to binocular disparity. It is a three-dimensional feeling when the left and right eyes view the images in different directions by binocular disparity. The stereoscopic effect according to the monocular factor provided by the present invention hardly causes side effects (visual fatigue and psychological anxiety) exhibited by such stereoscopic images due to such a binocular factor. It is also different from the normal 2D image, which has no sense of three-dimensionality, which is perceived when the 'one image' is viewed in 'left and right eyes' in different directions.
본 발명은, 사용자가 동일한 두 영상을 좌안과 우안을 통해 각각 별도로 볼 수 있도록 하기 위한 한 가지 방법으로, 도 1에 예시하였듯이 사용자가 이용하는 영상장치(10)의 디스플레이 화면(20)을 좌우로 반분하고 동일한 두 영상을 좌측 화면영역(20L)과 우측 화면영역(20R) 내의 좌측 영상표시영역(22L)과 우측 영상표시영역(22R)에서 각각 디스플레이 하는 방법을 사용한다. 그리고 도 2에 도시되어 있듯이, 사용자는 소정의 배율을 갖는 두 개의 볼록 렌즈(30L, 30R)를 통해 좌안과 우안으로 좌측 영상표시영역(22L)과 우측 영상표시영역(22R)의 두 영상을 각각 본다. 이 때 좌안과 우안은 동일한 좌측 영상과 우측 영상을 실질적으로 동일한 시선방향으로 보게 된다. 사시가 아닌 정상적인 눈의 경우, 좌측 렌즈(30L)에서 좌측 화면영역(20L)의 중심점(CP1)까지의 방향(VD1)과 우측 렌즈(30R)에서 우측 화면영역(20R)의 중심점(CP2)까지의 방향(VD2)은 실질적으로 평행을 이룬다.The present invention is a method for allowing the user to separately view the same two images through the left eye and the right eye, respectively. The display screen 20 of the image device 10 used by the user is divided into left and right as illustrated in FIG. 1. And displaying the same two images in the left image display area 22L and the right image display area 22R in the left screen area 20L and the right screen area 20R, respectively. As shown in FIG. 2, the user views two images of the left image display area 22L and the right image display area 22R into the left and right eyes through two convex lenses 30L and 30R having a predetermined magnification, respectively. see. At this time, the left eye and the right eye see the same left image and the right image in substantially the same visual direction. For normal eyes other than strabismus, the direction VD1 from the left lens 30L to the center point CP1 of the left screen region 20L and from the right lens 30R to the center point CP2 of the right screen region 20R. Direction VD2 is substantially parallel.
이와 같은 영상 표시가 가능하기 위해서는 원본 영상을 적절히 가공할 필요가 있다. 본 발명이 예시적으로 제안하는 영상 가공 방법은 원래의 영상을 프레임 별로 새로운 프레임으로 변환하는 것이다. 그 변환된 프레임은 그 프레임의 좌측 절반과 우측 절반에 실질적으로 동일한 두 영상이 사이드 바이 사이드(side-by-side: SBS) 형태로 배치된 프레임이다. 그 변환된 프레임의 해상도는 원본 프레임의 해상도와 같거나 또는 다를 수도 있다. 이러한 변환된 영상 프레임들로 구성된 영상 데이터는 영상 제공자(예컨대, 방송국, 유투브 등과 같은 영상 콘텐츠 제공자) 측의 시스템에서 직접 만들어 사용자의 영상장치에 제공해주거나 또는 영상 콘텐츠를 소비하는 사용자 측의 영상 재생장치가 영상 제공자로부터 제공받은 원본 영상 데이터를 이용하여 만들 수도 있다.In order to be able to display such an image, the original image needs to be properly processed. An exemplary image processing method proposed by the present invention is to convert an original image into a new frame for each frame. The converted frame is a frame in which two images that are substantially identical to the left half and the right half of the frame are arranged in a side-by-side (SBS) form. The resolution of the converted frame may be the same as or different from the resolution of the original frame. The image data composed of the converted image frames is directly made by the system of the image provider (e.g., broadcaster, YouTube, etc.) and provided to the user's image device, or consumes the image content. May be made using original image data provided from an image provider.
먼저, 영상제공자 측에서 변환된 영상 데이터를 만드는 경우를 설명한다. 일예에 의하면, 원본 영상의 각 프레임을 절반으로 축소한 다음, 그 축소된 영상을 두 개로 복제하여 좌우에 병치하여 그 프레임에 대응하는 변환된 프레임을 만든다. 도 3은 이런 방법으로 영상 데이터를 변환하는 한 가지 예를 도식적으로 나타내었고, 도 4는 이런 영상변환 처리를 수행하는 수단의 구성을 도시한다. First, a case of generating converted image data at the image provider side will be described. According to an example, each frame of the original image is reduced in half, and then the reduced image is duplicated in two and juxtaposed to the left and right to produce a converted frame corresponding to the frame. 3 schematically shows one example of converting image data in this manner, and FIG. 4 shows a configuration of means for performing such image conversion processing.
변환 대상인 원래의 영상 프레임(100)이 가로 및 세로 픽셀 수가 각각 a개 및 b개인 디지털 영상이라고 하자. 예시적인 영상 가공 방법에 따르면, 영상 변환을 위해 먼저, 영상변환부(200)는 원래의 영상을 입력받아 영상 변환 처리를 하여 변환된 영상을 출력한다. 영상 변환 처리는 먼저 원래의 영상을 프레임 단위로 읽어 각 영상 프레임(100)의 가로 픽셀 수와 세로 픽셀 수를 각각 절반으로 줄인 축소된 영상 프레임(110)을 만든다. 그런 다음, 그 축소된 영상 프레임(110)을 두 번 복사하여 두 개의 축소된 영상 프레임(110)이 좌우에 병치된 SBS 형태의 영상 프레임(120)을 새로 만든다. 그 영상 프레임(120)이 바로 본 발명의 영상 가공 방법에 따른 변환된 영상 프레임(120)이다. Assume that the original image frame 100 to be converted is a digital image having a and b pixels, respectively. According to an exemplary image processing method, first, for image conversion, the image conversion unit 200 receives an original image and performs image conversion processing to output the converted image. The image conversion process first reads the original image in units of frames to produce a reduced image frame 110 in which the number of horizontal pixels and the number of vertical pixels of each image frame 100 are reduced by half. Then, the reduced image frame 110 is copied twice to create a new SBS-type image frame 120 in which the two reduced image frames 110 are juxtaposed on the left and right sides. The image frame 120 is the converted image frame 120 according to the image processing method of the present invention.
이런 방법 대신, 앞에서 언급하였듯이, 알려진 여러 가지 보간법을 이용하거나 필드 데이터를 추출하는 방법 등을 이용하여 원래의 영상 프레임(100)으로부터 두 개의 축소된 영상 프레임(110)을 만들 수도 있다.Instead of this method, as mentioned above, two reduced image frames 110 may be made from the original image frame 100 by using various known interpolation methods or extracting field data.
콘텐츠 제공자측 시스템은 이렇게 가공한 변환 영상을 유, 무선 통신망을 통한 스트리밍 전송방식이나 브로드캐스팅 전송방식으로 사용자의 영상 재생장치에 제공한다. 사용자의 영상 재생장치에서는 수신된 영상 데이터를 디코딩하여 각 변환 영상 프레임(120)을 그대로 재생하기만 하면 된다. 그 변환 영상 프레임(120) 자체가 좌우 병치된 두 개의 동일한 축소 프레임으로 구성되어 있으므로, 영상 재생장치의 디스플레이 화면에는 동일한 두 영상이 화면의 좌측 절반과 우측 절반 영역에 동시에 디스플레이 된다. 사용자는 예컨대 두 개의 볼록렌즈가 두 눈에 대응하는 위치에 있는 입체경을 이용하여 그 디스플레이되는 영상을 본다. 이 때, 디스플레이 화면과 두 볼록렌즈 간의 이격거리, 그리고 두 볼록렌즈의 굴절률에 의해, 좌안은 변환된 영상 프레임(120)의 좌측 절반의 영상(110)을 보고, 우안은 우측 절반의 영상(110)을 보도록 한다. 사용자는 좌안과 우안이 동일한 영상을 동시에 보게 되므로, 단안시 요인에 의한 입체감을 이중적으로 느낄 수 있게 된다. The content provider side system provides the processed video to the user's video playback device in a streaming transmission method or a broadcasting transmission method through a wired or wireless communication network. The user's image reproducing apparatus only needs to decode the received image data and reproduce each converted image frame 120 as it is. Since the converted image frame 120 itself is composed of two identical reduced frames arranged side by side, the same two images are simultaneously displayed on the left half and right half regions of the screen on the display screen of the image reproducing apparatus. The user sees the displayed image using, for example, a stereoscopic mirror in which two convex lenses correspond to the two eyes. At this time, the left eye sees the image of the left half of the converted image frame 120 and the right eye sees the right half of the image 110 by the distance between the display screen and the two convex lenses and the refractive indices of the two convex lenses. See). Since the user sees the same image of the left eye and the right eye at the same time, the user can feel the stereoscopic effect due to the monocular factor double.
이 점이 일반적인 3D 입체영상과는 다른 점이다. 일반적인 3D 입체영상의 경우, 좌안과 우안이 보는 두 영상은 동일하지 않고 양안시차에 상당하는 편차를 갖는 두 방향에서 본(촬영한) 비동일 영상(하나의 영상은 나머지 하나의 영상에 비해 왜곡된 영상임)이다. 사람의 뇌는 두 눈에서 받아들이는 영상의 차이로 그 영상의 깊이(입체감)를 인지한다. 영상의 입체감을 느끼도록 하기 위해서는 양쪽 눈에 차이가 있는 영상, 그것도 물체의 거리에 따라서 차이가 있는 영상을 보여주어야 한다. 본 발명의 경우, 좌안 및 우안으로 들어가는 두 영상은 동일하기 때문에, 일반적인 3D 입체영상과 같은 입체감이 나타나지 않는다. 대신에, 동일한 두 영상이 좌우의 두 눈을 통해 각각 따로따로 보이도록 하면, 그 영상에 포함된 단안시 요인들에 의한 깊이감 내지 입체감과 함께 청량감이 돋보이는 영상으로 느껴진다.This is different from general 3D stereoscopic images. In a typical 3D stereoscopic image, the two images seen by the left and right eyes are not the same, and the non-identical images (photographed) viewed from two directions with a deviation corresponding to binocular disparity (one image is distorted compared to the other image) Video). The human brain perceives the depth (stereometry) of the image by the difference between the images received by both eyes. In order to feel the three-dimensional feeling of the image, it is necessary to show an image having a difference between both eyes, and also an image having a difference according to the distance of an object. In the case of the present invention, since the two images entering the left and right eyes are the same, a stereoscopic feeling like a general 3D stereoscopic image does not appear. Instead, if the same two images are seen separately through the left and right eyes, each of the two images is a sense of coolness with a sense of depth or three-dimensional by the monocular factors included in the image.
또한, 입체영상을 관람할 때 사용하는 기술들을 활용하면, 본 발명에 따라 변환한 영상을 더욱 고품질로 볼 수 있다. 특히, 입체경의 두 볼록렌즈를 통해 그 두 영상을 각각 확대하여 보면, 임장감과 실재감까지 더해져, 일반적인 2D 영상이나 3D 영상에서는 경험하지 못한 새로운 느낌의 영상을 감상할 수 있다. 이에 관해 구체적인 내용은 후술한다. In addition, by utilizing the techniques used to view stereoscopic images, the converted images according to the present invention can be viewed with higher quality. In particular, when the two images are magnified through two convex lenses of stereoscopic mirrors, the sense of presence and reality are added, and a new feeling image which is not experienced in a general 2D or 3D image can be viewed. Details thereof will be described later.
도 5는 위와 같이 원본 영상을 축소된 두 개의 동일 영상을 좌우 병치시키는 영상 변환을 처리하는 데 필요한 영상 콘텐츠 제공자 시스템(300)의 구성을 개략적으로 나타낸다. 이 시스템(300)은 콘텐츠 소스로서 데이터 저장소(310)나 카메라(320)를 포함할 수 있다. 영상 데이터 변환 처리를 수행하는 CPU(330)와 메모리(340), 그리고 사용자 인터페이스(350) 역할을 하는 입출력장치도 포함한다. FIG. 5 schematically illustrates a configuration of an image content provider system 300 necessary to process an image transformation in which the same original image is reduced and left and right juxtaposed as described above. The system 300 may include a data store 310 or a camera 320 as a content source. A CPU 330, a memory 340, and an input / output device serving as a user interface 350 are also included.
이런 하드웨어 자원과는 별도로, 이하에서 설명하는 영상 변환 알고리즘이 구현된 애플리케이션 프로그램(이하, '영상 변환 프로그램'이라 함), 사용자 인터페이스 프로그램도 필요하다. 도 6의 흐름도는 이 영상 변환 프로그램의 실행 절차를 개략적으로 나타낸 흐름도이다. Apart from these hardware resources, an application program (hereinafter, referred to as an image conversion program) and a user interface program implementing the image conversion algorithm described below are also required. 6 is a flowchart schematically showing an execution procedure of this video conversion program.
일예로, 변환대상인 소스 영상은 데이터 저장소(310)에 파일 형태로 저장되어 있는 경우를 고려한다. CPU(330)는 영상 변환 프로그램을 실행하여, 원본 영상의 각 소스 영상 프레임 소정의 비율로 스케일링 하여 변환된 영상 프레임(이를 타겟 영상 프레임이라고도 함)을 생성한다. 스케일링에 적용하는 비율은, 두 개의 타겟 영상 영상프레임이 영상재생기기의 디스플레이 화면의 좌측 반분영역과 우측 반분영역 내에 각각 표시될 수 있는 영상 크기를 갖게 하는 값으로 정하는 것이 바람직하다. 소스 영상 프레임의 축소 또는 확대의 비율은 소스 영상 데이터의 해상도와 영상 장치의 디스플레이의 해상도 간의 상관관계를 고려하여 정하는 것이 바람직할 수 있다. 소스 영상 프레임에서 변환된 타겟 영상 프레임의 해상도가 디스플레이의 해상도를 초과하지 않는 범위에서 변환을 하는 것이 필요하다. 예컨대 소스 영상 데이터의 해상도가 영상 장치의 디스플레이의 해상도와 같다면, 위에서 언급한 것처럼 소스 영상 프레임의 해상도를 가로 및 세로로 각각 절반이나 그 이하의 비율로 축소한 두 영상을 좌우에 병치하여 새로운 타겟 프레임을 구성할 수 있다. 소스 영상 데이터의 해상도가 영상장치의 디스플레이의 해상도에 비해 예컨대 1/4 수준이면, 소스 영상 데이터의 해상도를 최대 2배로 높일 수도 있을 것이다.As an example, consider a case in which the source image to be converted is stored in the data storage 310 in the form of a file. The CPU 330 executes an image conversion program to generate a converted image frame (also referred to as a target image frame) by scaling each source image frame of the original image by a predetermined ratio. The ratio applied to the scaling is preferably set to a value such that the two target video image frames have an image size that can be displayed in the left half region and the right half region of the display screen of the video reproducing apparatus, respectively. The ratio of reduction or enlargement of the source image frame may be preferably determined in consideration of the correlation between the resolution of the source image data and the resolution of the display of the image device. It is necessary to perform conversion in a range in which the resolution of the target image frame converted from the source image frame does not exceed the resolution of the display. For example, if the resolution of the source image data is the same as that of the display of the imaging device, as mentioned above, the two targets of which the resolution of the source image frame is reduced in the ratio of half or less in the horizontal and vertical directions respectively are juxtaposed on the left and right sides. You can configure the frame. If the resolution of the source image data is, for example, about 1/4 of the resolution of the display of the imaging apparatus, the resolution of the source image data may be increased up to twice.
스케일링을 위해, 먼저 타겟 영상 프레임의 화소수 즉, 해상도를 결정한다(S10 단계). 표준으로 정해진 해상도의 예로는 1080p (1920x1080 픽셀), 720p (1280x720 픽셀), 480p (640x480 픽셀) 등과 같이 여러 종류가 있을 수 있다. 소스 영상의 해상도가 예컨대 1080p (1920x1080 픽셀)이면 타겟 영상 프레임의 해상도 역시 동일하게 1920x1080로 정할 수 있다. 물론 이 해상도보다 더 높거나 낮은 값으로 정하는 것도 가능하다. 타겟 영상 프레임이 소스 영상 프레임보다 해상도가 더 높으면 프레임 사이즈가 더 크고 반대로 해상도가 더 낮으면 프레임 사이즈가 더 작게 된다. CPU(330)는 타겟 영상 프레임을 해상도를 고려하여 충분한 버퍼 메모리 공간을 확보한다. For scaling, first, the number of pixels of the target image frame, that is, the resolution, is determined (step S10). Examples of resolutions set as standards may include various types such as 1080p (1920x1080 pixels), 720p (1280x720 pixels), 480p (640x480 pixels), and the like. If the resolution of the source image is, for example, 1080p (1920x1080 pixels), the resolution of the target image frame may also be set to 1920x1080. Of course, it is possible to set the value higher or lower than this resolution. If the target image frame has a higher resolution than the source image frame, the frame size is larger. On the contrary, if the target image frame has a lower resolution, the frame size is smaller. The CPU 330 secures sufficient buffer memory space in consideration of the resolution of the target image frame.
CPU(330)는 데이터 저장소(310)로부터 소스 영상 파일을 읽어 들인다(S12 단계). 그 영상 파일들은 예컨대 MP4, avi, wmv, mkv 등과 같은 소정의 압축표준에 따라 압축된 파일일 수 있다. 그런 압축 영상 파일이면, 그 영상 파일을 해당 표준의 디코딩 툴을 이용하여 압축을 푼다(S14 단계). 초당 예컨대 30 프레임을 기준으로 디코딩한다. The CPU 330 reads the source image file from the data storage 310 (step S12). The image files may be files compressed according to a predetermined compression standard such as MP4, avi, wmv, mkv, and the like. If it is such a compressed video file, the video file is decompressed using the decoding tool of the corresponding standard (step S14). Decode based on eg 30 frames per second.
이제 디코딩 된 영상 데이터를 가지고 본 발명에 따른 영상 변환 처리를 수행한다. 먼저 디코딩 된 영상데이터의 각 영상 프레임 Fi(100)을 소정의 비율로 스케일링 한다(S16 단계). 스케일링 비율은 원본 영상 프레임Fi(100)을 어느 정도로 확대하거나 축소할 것인지에 따라 정해진다. 이하에서는, 각 영상 프레임 Fi(100)을 절반의 크기로 축소하는 경우를 예로 하여 설명한다. 각 영상 프레임 Fi(100)을 절반으로 줄이는 예시적인 한 가지 방법은 각 영상 프레임 Fi(100)의 가로방향 픽셀 수와 세로방향 픽셀 수를 각각 절반으로 줄이는 것이다. 즉, 각 영상 프레임 Fi(100)의 가로방향 및 세로방향으로 예컨대 짝수 번째 픽셀들은 모두 제거하고 홀수 번째 픽셀들만으로 영상을 새로 구성하거나 또는 가로방향 및 세로방향으로 홀수 번째 픽셀들은 모두 없애고 짝수 번째 픽셀들만으로 영상을 새로 구성하는 것이다. 이렇게 축소된 영상 프레임 Fi/2(110)은 원래의 영상에 비해 가로방향과 세로방향으로 각각 픽셀 수가 절반으로 줄고, 면적은 1/4로 감소된 화면이다. 위 예에 따르면, 축소된 영상 프레임 Fi/2(110)의 픽셀 수는 960x540이 된다.The video conversion process according to the present invention is now performed with the decoded video data. First, each video frame Fi 100 of the decoded video data is scaled by a predetermined ratio (step S16). The scaling ratio is determined according to how much to enlarge or reduce the original video frame Fi 100. Hereinafter, an example in which each image frame Fi 100 is reduced to half the size will be described. One exemplary method of reducing each image frame Fi 100 by half is to reduce the horizontal and vertical pixel counts of each image frame Fi 100 by half, respectively. That is, in the horizontal and vertical directions of each image frame Fi 100, for example, all the even-numbered pixels are removed and the image is newly constructed with only the odd-numbered pixels, or all the odd-numbered pixels are removed and only the even-numbered pixels are removed in the horizontal and vertical directions. To reconstruct the video. The reduced image frame Fi / 2 (110) is a screen in which the number of pixels is reduced in half and the area is reduced to one quarter in comparison with the original image in the horizontal and vertical directions, respectively. According to the above example, the number of pixels of the reduced image frame Fi / 2 110 is 960x540.
각 영상 프레임별로 절반으로 축소된 영상 Fi/2(110)이 준비되면, 도 3의 (c)에 도시된 것처럼 그 축소된 영상 Fi/2(110)을 메모리(340)의 변환 영상 영역에 좌우로 병치되게 두 번 복사하여 새로운 영상 프레임 Fi'(120)를 구성한다(S18 단계). 이렇게 원본 영상프레임의 축소 프레임 두 개를 조합하여 구성된 새로운 영상 프레임 Fi(120)이 바로 본 발명이 변환을 통해 얻고자 하는 변환 영상 프레임 내지 타겟 영상 프레임이다. When the image Fi / 2 110, which is reduced in half for each image frame, is prepared, the reduced image Fi / 2 110 is left and right in the converted image region of the memory 340 as shown in FIG. By copying twice in parallel to form a new image frame Fi '(120) (S18). The new video frame Fi 120 configured by combining two reduced frames of the original video frame is the converted video frame or the target video frame that the present invention intends to obtain through the conversion.
이 변환된 타겟 영상 프레임들 Fi'(120)은 저장 효율이나 전송 효율 등을 고려하여, 원하는 파일 형식(MP4, avi, wmv, mkv 등)으로 인코딩한 다음 데이터 저장소(310)에 저장해둔다(S20 단계). The converted target image frames Fi '120 are encoded in a desired file format (MP4, avi, wmv, mkv, etc.) in consideration of storage efficiency or transmission efficiency and then stored in the data storage 310 (S20). step).
그리고 필요한 시점에 또는 콘텐츠 소비자의 요청에 응하여, 데이터 저장소(310)에 저장되어 있는 변환 영상 파일을 콘텐츠 소비자의 영상재생기기에 제공한다(S22 단계). 그 변환된 영상 파일을 콘텐츠 소비자에게 제공하는 방법은 예컨대 스트리밍 방식, 브로드캐스팅 방식, 또는 다운로드 방식 등과 같은 유무선 전송방식이 될 수 있으나, 반드시 이것에 한정되는 것은 아니다. Then, when necessary or in response to the request of the content consumer, the converted image file stored in the data storage 310 is provided to the content playback device of the content consumer (step S22). The method of providing the converted video file to the content consumer may be, for example, a wired or wireless transmission method such as a streaming method, a broadcasting method, or a download method, but is not necessarily limited thereto.
한편, 브로드캐스팅 전송 방식의 일 예로서, 텔레비전 방송국에서 실시간 중계하는 영상도 무선 송출에 앞서 위와 같은 변환 처리를 한 다음, 그 변환된 영상을 예컨대 공중파 방송, 케이블 방송 또는 DMB 방송 등과 같은 방송신호로 송출할 수도 있다. 이 경우, 변환 대상 영상의 소스는 데이터 저장소(310)가 아니라 카메라 장치(320)가 될 수 있다. 즉, 카메라 장치(320)에서 생성되는 영상 프레임이 CPU(330)에 실시간으로 제공되고, CPU(330)에서는 위에서 설명한 것과 같은 방식으로 영상 데이터의 각 영상 프레임을 소정의 비율로 스케일링한 타겟 영상 프레임으로 변환하여 브로드캐스팅 방법으로 송출되도록 한다. 구체적으로, CPU(330)에서는 카메라 장치(320)가 제공하는 영상 프레임을 위에서 설명한 단계 S16과 단계 S18의 처리를 통해 프레임별로 소정의 비율로 스케일링 처리한 영상, 예컨대 1/2로 축소된 영상을 만든 다음, 그것을 좌우 병치하여 조합한 영상 프레임으로 변환한다. 그런 다음, 그 변환된 영상 프레임들을 모아 방송신호의 송출 포맷에 맞게 압축 부호화 처리를 하여 브로드캐스팅방법으로 송출한다.On the other hand, as an example of a broadcasting transmission method, a video broadcasted by a television station in real time also performs the above-described conversion processing prior to radio transmission, and then converts the converted video into a broadcast signal such as over-the-air broadcast, cable broadcast, or DMB broadcast. You can also send. In this case, the source of the conversion target image may be the camera device 320 instead of the data storage 310. That is, an image frame generated by the camera device 320 is provided to the CPU 330 in real time, and the CPU 330 scales each image frame of the image data at a predetermined ratio in the same manner as described above. To be broadcasted by the broadcasting method. In detail, the CPU 330 processes an image frame provided by the camera device 320 to the image, which is scaled by a predetermined ratio for each frame through the processing of steps S16 and S18 described above, for example, an image reduced to 1/2. After making it, it is converted to a combined video frame by juxtaposing it. Then, the converted video frames are collected and subjected to compression encoding processing in accordance with the transmission format of the broadcast signal, and transmitted by the broadcasting method.
이렇게 콘텐츠 제공자 시스템에서 소스 영상 프레임을 타겟 영상 프레임으로 미리 변환한 후, 콘텐츠 소비자인 사용자의 영상재생기기에 제공하는 방법에 따르면, 사용자의 영상재생장치는 그 변환된 영상신호를 수신하여 통상의 영상신호 재생방법에 따라 재생하기면 하면 된다. 그러면, 그 영상재생기기의 디스플레이 화면에 표시되는 영상은 동일한 두 영상이 좌우에 병치된 형태의 영상이 표시될 것이다. According to the method of pre-converting the source video frame into the target video frame in the content provider system and providing the same to the video playback device of the user who is the content consumer, the video playback device of the user receives the converted video signal and receives the normal video. This can be done according to the signal reproduction method. Then, the image displayed on the display screen of the image reproducing apparatus will display an image in which the same two images are arranged side by side.
본 발명을 적용하는 실제의 영상 콘텐츠 제공에 있어서는, 영상 콘텐츠 제공자 측은 콘텐츠 소비자 측으로 같은 영상을 두 가지 형태로 제공할 수 있을 것이다. 즉, 한 가지는 위와 같이 소스 영상 프레임으로부터 축소된 두 개의 동일 영상 프레임을 좌우에 병치하여 변환한 타겟 영상 프레임(Fi')의 영상 데이터이고, 다른 한 가지는 변환되지 않은 원래의 소스 영상 프레임으로 구성된 영상 데이터이다. 콘텐츠 소비자는 영상 콘텐츠를 소비함에 있어서 이 두 가지에 영상에 대한 선택권을 가질 수 있다. In providing the actual image content to which the present invention is applied, the image content provider side may provide the same image in two forms to the content consumer side. That is, one is the image data of the target image frame Fi 'obtained by converting two identical image frames reduced from the source image frame to the left and right as described above, and the other is an image composed of the original source image frame which is not converted. Data. Content consumers may have the choice of video in both of them in consuming video content.
콘텐츠 소비자 측이 변환된 타겟 영상 프레임(Fi')들로 구성된 변환된 영상 데이터를 제공받아 재생함에 있어서, 그 변환된 영상 데이터의 각 영상 프레임을 구성하는 좌측 절반 영상과 우측 절반 영상이 사용자의 좌안과 우안에 각각 따로 따로 보일 수 있도록 영상 재생을 한다. 이를 위한 예시적인 방안으로서, 기존에 알려진 3D 입체영상 디스플레이 방법 중 어느 한 가지를 변환된 영상 데이터의 재생에 접목할 수도 있다. 도 7은 그렇게 할 수 있는 콘텐츠 소비자의 예시적인 영상재생기기(500)의 구성을 개략적으로 도시한다. When the content consumer receives and reproduces the converted image data including the converted target image frames (Fi ′), the left half image and the right half image constituting each image frame of the converted image data are the left eye of the user. Play the video so that you can see each one separately. As an exemplary method for this, any one of the known 3D stereoscopic image display methods may be combined with the reproduction of the converted image data. 7 schematically illustrates a configuration of an exemplary video playback device 500 of a content consumer that can do so.
영상재생기기(500)는 통신부(510), CPU(530)와 메모리(540), 저장부(520), 사용자 인터페이스(550), 비디오 구동부(530), 그리고 디스플레이(570) 등을 포함한다. 통신부(510)는 외부의 영상제공시스템(예컨대, 방송시스템 또는 스트리밍 서버시스템 등)이 제공하는 영상 데이터를 수신하고, 복조 처리를 한 영상 데이터를 CPU(430)에 전달한다. CPU(530)는 메모리(540)가 제공하는 데이터 처리 공간을 활용하여, 영상재생기기(500)의 전반적인 제어를 수행하고 또한 통신부(510)를 통해 전달되는 영상 데이터를 원하는 입체영상 재생방법으로 재생하는 데 필요한 여러 가지 데이터처리를 수행한다. 저장부(520)는 애플리케이션 프로그램, 처리 전후의 영상데이터, 기타 본 발명의 수행에 필요한 프로그램이나 데이터를 저장하기 위한 데이터 저장 공간(예컨대 하드디스크 또는 플래시 메모리 등으로 구성)으로 기능한다. 사용자 인터페이스(550)는 원래의 영상과 변환된 영상 중 어느 한 가지를 특정 하는 것을 비롯하여 사용자가 명령을 내리고 그 처리 결과를 확인할 수 있도록 해주는 기능을 제공한다. 비디오 구동부(560)는 CPU(530)가 제공하는 영상 데이터를 디스플레이 구동신호로 변환하여 디스플레이(570)에 제공한다. 그리고 디스플레이(570)는 디스플레이 구동신호에 따라 영상을 화면에 표시되도록 한다. The image reproducing apparatus 500 includes a communication unit 510, a CPU 530, a memory 540, a storage unit 520, a user interface 550, a video driver 530, a display 570, and the like. The communication unit 510 receives video data provided by an external video providing system (for example, a broadcasting system or a streaming server system) and delivers demodulated video data to the CPU 430. The CPU 530 utilizes a data processing space provided by the memory 540 to perform overall control of the image reproducing apparatus 500 and to reproduce image data transmitted through the communication unit 510 in a desired stereoscopic image reproducing method. Perform various data processing necessary to The storage unit 520 functions as an application program, image data before and after processing, and a data storage space (for example, a hard disk or a flash memory) for storing a program or data necessary for performing the present invention. The user interface 550 provides a function that allows the user to give a command and check the processing result, including specifying one of the original image and the converted image. The video driver 560 converts the image data provided by the CPU 530 into a display driving signal and provides the converted image data to the display 570. The display 570 displays an image on the screen according to the display driving signal.
도 8의 흐름도는 영상 콘텐츠 제공자 측에서 원래의 영상과 본 발명에 따라 변환한 영상의 두 가지 종류로 제공할 때, 영상 콘텐츠 소비자 측에서 본 발명에 따라 영상을 재생하는 방법을 나타낸 것이다. 8 is a flowchart illustrating a method of reproducing an image according to the present invention at the image content consumer side, when the image content provider provides two types of the original image and the converted image according to the present invention.
콘텐츠 소비자는 사용자 인터페이스(550)를 통해 원래의 소스 영상과 변환된 영상 중 원하는 한 가지를 선택할 수 있다. 영상 선택정보는 CPU(530)로 제공된다(S30 단계). 변환된 영상을 선택한 경우에 한해, 이하에서 설명하는 처리를 수행한다. 만약 원래의 영상을 선택하는 경우에는 이하에서 설명하는 도 8의 처리는 수행하지 않고, 원래의 영상을 통상의 재생방법으로 재생한다. The content consumer may select one of the original source image and the converted image through the user interface 550. The image selection information is provided to the CPU 530 (step S30). Only when the converted video is selected, the processing described below is performed. If the original video is selected, the processing of Fig. 8 described below is not performed, and the original video is reproduced by a normal playback method.
사용자 인터페이스(550)로부터 영상 선택정보를 전달받은 CPU(530)는 수신부(510)를 통해 콘텐츠 제공 시스템에 원하는 변환 영상에 관한 정보를 제공하면서 그 영상을 제공해줄 것을 요청한다(S32 단계). 다만, 이 단계는 영상 콘텐츠의 전송 방식에 따라 생략될 수도 있다. 예컨대 콘텐츠 제공자측이 원래의 소스 영상과 변환된 영상을 한꺼번에 브로드캐스팅 방식으로 전송하는 경우에는 사용자의 요청 절차는 생략되고, 수신된 영상 중 변환 영상만을 선택적으로 이용하는 조치를 취하면 된다. 이와 달리, 콘텐츠 제공자측이 콘텐츠 소비자의 요구에 응하여 영상 콘텐츠를 제공하는 경우에는, 위와 같은 요청이 필요할 것이다. The CPU 530, which has received the image selection information from the user interface 550, requests the content providing system to provide the image while providing information on the desired converted image to the content providing system through the receiver 510 (S32). However, this step may be omitted depending on the transmission method of the video content. For example, when the content provider transmits the original source video and the converted video at the same time by broadcasting, the user's request procedure may be omitted, and the user may selectively take the converted video from the received video. On the other hand, if the content provider side provides the video content in response to the demand of the content consumer, such a request will be necessary.
콘텐츠 제공자 시스템이 변환 영상 데이터를 전송하면, 통신부(510)는 그 변환 영상 데이터를 수신하여 CPU(530)에 전달한다. 그 영상 데이터의 저장이 허용되는 경우, CPU(530)는 그 영상 데이터를 파일 형태로 저장부(520)에 저장해두었다가 필요한 시점에 이하에서 설명하는 재생 처리를 수행하면 될 것이다. 만약, 전송되는 영상이 라이브 방송 영상인 경우, 통신부(510)에서 복조 처리를 한 다음 CPU(530)에 제공하면 된다. 그 영상 데이터가 스트리밍 방식으로 제공되는 영상이거나 라이브 방송 영상인 경우, CPU(530)는 영상 데이터 스트림을 입력받으면서 그 영상 데이터를 실시간으로 재생하기 위한 이하의 처리를 수행한다. When the content provider system transmits the converted image data, the communication unit 510 receives the converted image data and transmits the converted image data to the CPU 530. When the video data is allowed to be stored, the CPU 530 may store the video data in a file form in the storage unit 520 and perform the playback process described below when necessary. If the transmitted video is a live broadcast video, the communication unit 510 may demodulate and then provide the demodulation process to the CPU 530. When the video data is a video provided by a streaming method or a live broadcast video, the CPU 530 performs the following processing for reproducing the video data in real time while receiving the video data stream.
먼저, CPU(530)는 통신부(510)를 통해 제공되는 변환 영상 데이터 스트림을 버퍼 메모리에 임시로 저장한다(S34 단계). 그리고 그 변환 영상 데이터를 소정 단위씩 읽어 와서 디코딩 한다(S36 단계). CPU(530)는 또한 디코딩 된 각 화면 프레임(Fi)을 원하는 입체영상 재생방법(관람방법)과 디스플레이(570)의 사양에 적합하게 추가적인 가공을 한다(S38 단계). 그런 다음, 그 가공된 영상 데이터를 비디오 구동부(560)에 제공한다(S40 단계). 비디오 구동부(560)는 CPU(530)가 제공해주는 영상 데이터에 의거하여 디스플레이(570)의 구동을 위한 구동신호를 만들고, 그 구동신호로 디스플레이(570)를 구동시킨다. 이에 의해, 디스플레이(570)에는 원하는 입체영상 재생방법에 따라 영상이 디스플레이 된다. First, the CPU 530 temporarily stores the converted image data stream provided through the communication unit 510 in the buffer memory (step S34). The converted video data is read and decoded by predetermined units (step S36). The CPU 530 also performs additional processing in accordance with the specifications of the stereoscopic image reproduction method (viewing method) and the display 570 for each decoded screen frame Fi (step S38). Then, the processed image data is provided to the video driver 560 (step S40). The video driver 560 generates a driving signal for driving the display 570 based on the image data provided by the CPU 530, and drives the display 570 with the driving signal. As a result, an image is displayed on the display 570 according to a desired stereoscopic image reproduction method.
콘텐츠 소비자는 디스플레이(570)에 재생되는 영상을 본다. 그 재생 영상은 소비자가 사용하는 입체영상 관람방법과 매치되는 영상이어야 할 것이다. 기존에 알려진 입체영상 관람방법(재생방법)으로는 크게 안경식과 무안경식 방법으로 구분할 수 있다. 안경식 관람방법(재생방법)으로는 스테레오스코프(Stereoscope) 방식, 머리장착 방식(HMD: Head Mounted Display), 적청 안경 방식(Anaglyph), 편광 필터(Polarizer) 방식, 시분할 내지 셔터 글래스(Shutter glass) 방식 등이 알려져 있다. 무안경식 관람방법(재생방법)에는 패럴랙스 베리어(Parallax Barrier) 방식, 렌티큘러(Lenticular) 방식 등이 있다. 이들 안경식 관람방법과 무안경식 관람방법들이 공통적으로 전제하는 사항은 재생 영상에 입체감을 느낄 수 있도록 하기 위해 광각(optical angle)의 차이를 인위적으로 부여한 서로 다른 좌안용 영상과 우안용 영상을 필요로 한다는 점이다. The content consumer sees the image played on the display 570. The playback image should match the stereoscopic image viewing method used by the consumer. Known three-dimensional image viewing method (playing method) can be largely divided into glasses and glasses-free method. As an eyeglass viewing method (playback method), a stereoscope method, a head mounted display (HMD), a red-blue eyeglass method (Anaglyph), a polarizer method, a time division to a shutter glass method Etc. are known. The glasses-free viewing method (playing method) includes a parallax barrier method and a lenticular method. The premise that these spectacle viewing methods and the glasses-free viewing methods are common premise is that different left-eye images and right-eye images are artificially assigned to the optical angle in order to make the playback image feel three-dimensional. Is the point.
이에 비해, 본 발명은 좌안용 영상과 우안용 영상이 동일하다는 점에서 기존 입체영상 재생방법과 근본적으로 다르다. 즉, 본 발명에서는, 변환된 영상의 각 프레임(Fi')을 구성하는 동일한 좌측 영상 및 우측 영상을 좌안용 영상 및 우안용 영상으로 이용한다. 본 발명은 위에서 설명한 변환방법으로 변환한 영상 프레임 (Fi')을 재생용 소스 영상으로 사용하는 점에서 기존 입체영상 재생방법과 다르다. 또한, 좌안과 우안은 좌측 영상과 우측 영상 각각의 거의 중심에 위치하고, 그 좌안과 좌측 영상의 중심을 잇는 방향이 우안과 우측 영상의 중심을 잇는 방향과 거의 평행한 점에서, 기존의 입체영상 재생 및 관람 방법과 차이가 있다.In contrast, the present invention is fundamentally different from the conventional stereoscopic image reproducing method in that the left eye image and the right eye image are the same. That is, in the present invention, the same left image and right image constituting each frame Fi 'of the converted image are used as the left eye image and the right eye image. The present invention differs from the conventional stereoscopic image reproducing method in that an image frame Fi 'converted by the above-described conversion method is used as a source image for reproduction. In addition, the left and right eyes are located at the center of each of the left and right images, and the stereoscopic image reproduction is performed in that the direction connecting the centers of the left and left images is substantially parallel to the direction connecting the centers of the right and right images. And the viewing method is different.
3D 영상 기술의 한 가지로 알려진 스테레오스코프 방식은 양안시차만큼의 광각 편차를 갖는 두 영상을 좌우에 병치하고 그 좌우의 두 영상을 좌우에 병치된 두 볼록렌즈를 통해 두 눈에 따로따로 결상되게 함으로써 그 영상을 입체적으로 느끼게 하는 방식이다. 이 스테레오스코프 방식을 본 발명에 적용할 수 있다. 이 경우, 변환 영상 프레임(Fi')의 좌측 영상과 우측 영상을 디스플레이(570)의 좌측 절반과 우측 절반에 또는 이와 반대 형태로 각각 디스플레이 되게 한다. 그리고 콘텐츠 소비자는 그 디스플레이 영상을 두 개의 볼록렌즈가 좌안과 우안에 맞게 병치된 입체경을 착용하여 디스플레이(570)의 좌측 절반의 영상은 좌안으로 보고 우측 절반의 영상은 우안으로 본다. 즉, 좌안과 우안이 광각의 차이가 없는 동일한 두 영상을 각각 별도로 본다. The stereoscopic method, known as one of the 3D imaging techniques, juxtaposes two images having wide-angle deviations as much as binocular disparity to the left and right, and forms the two images on both eyes separately through two convex lenses juxtaposed to the left and right. It is a way to make the image feel in three dimensions. This stereoscopic method can be applied to the present invention. In this case, the left image and the right image of the converted image frame Fi 'are displayed on the left half and the right half of the display 570 or vice versa. In addition, the content consumer wears a stereoscopic mirror in which two convex lenses are juxtaposed to the left eye and the right eye, and the left half of the display 570 is viewed as the left eye, and the right half is viewed as the right eye. In other words, the left eye and the right eye view the same two images with no wide angle difference.
본 발명의 경우, 광각의 차이가 없는 두 영상을 보기 때문에, 기존의 입체영상 관람방법으로 볼 때와 같은 정도의 입체감은 느껴지지 않는다. 그렇다고 좌안과 우안이 공통된 '하나의' 영상을 볼 때의 느낌(단순한 2차원감)과 같은 느낌도 아니다. 본 발명은 좌안과 우안이 '두 개의' 동일 영상을 각각 별도로 보기 때문에, 관람 느낌은 입체감과 단순한 2차원감의 중간 정도의 입체감이다. 완전한 입체영상에서 느껴지는 시각적 피로나 심리적 불안증이 거의 생기지 않을 정도로 아주 편안하면서도 실제감이나 임장감이 어느 정도 살아있고 청량함마저 느껴지는 화면으로 보인다. In the case of the present invention, since two images with no wide-angle difference are viewed, the three-dimensional feeling as much as when viewed with the conventional stereoscopic image viewing method is not felt. However, it is not the same as the feeling of seeing a 'one' image in which the left and right eyes are common. In the present invention, since the left eye and the right eye separately view the two 'same' images, the viewing feeling is about a three-dimensional feeling between the three-dimensional effect and the simple two-dimensional feeling. It is so comfortable that almost no visual fatigue or psychological anxiety can be felt in a full stereoscopic image, but it looks like a living and refreshing feeling to some extent.
특히, 두 개의 렌즈가 좌우에 병치되어 영상 재생 기기의 디스플레이를 향하도록 배치된 입체경을 착용하고 디스플레이(570)에 표시되는 두 영상을 보면, 렌즈의 배율에 따라 영상이 크게 확대되어 보이는 효과도 얻을 수 있다. 이는 디스플레이(570)의 사이즈가 작은 스마트 폰으로 영상을 시청하는 경우에 특히 효과적이다. 두 영상을 화면의 좌우 절반에 각각 스테레오스코프 방식으로 재생하면서 사용자가 입체경을 착용하고 그 두 영상을 좌안과 우안으로 각각 보는 경우, 사용자가 느끼는 영상의 크기는 렌즈 초점거리에 따라 크게 확대된다. In particular, when wearing two-dimensional mirror juxtaposed to the left and right of the two lens facing the display of the image reproducing apparatus and looking at the two images displayed on the display 570, the effect of the image is greatly enlarged according to the magnification of the lens to obtain Can be. This is particularly effective when watching an image with a smartphone having a small size of the display 570. If the user wears a stereoscopic mirror and views the two images with the left and right eyes, respectively, while the two images are reproduced in the left and right half of the screen, respectively, the size of the image felt by the user is greatly enlarged according to the lens focal length.
도 11은 스마트폰(10)을 사용자의 영상 재생 기기로서 사용하고, 사용자가 입체경(50, 60)을 통해 그 스마트폰(10)의 디스플레이 화면(20)의 좌우측 두 영역에 표시되는 영상을 관람하는 경우를 예시적으로 보여준다. 도 11의 (a)의 간이형 입체경(50)은 안경태 형태의 프레임(52)에 두 개의 볼록 렌즈(30L, 30R)가 장착되고 그 프레임(52)의 다리부 말단(40L, 40R)은 스마트폰(10)의 디스플레이 화면(20)의 좌우측 바깥 부분을 집을 수 있게 마련된다. 도 11의 (b)의 헤드마운트형 입체경(50)은 사용자의 머리에 쓸 수 있는 형태로 된 프레임(62)에 두 개의 볼록 렌즈(30L, 30R)가 두 눈의 위치에 맞게 장착되고, 그 프레임(62)의 맨 앞에는 스마트폰(10) 착탈부가 마련되며, 사용자의 양 귀 쪽에는 스피커(64)가 마련된다. 11 shows the image displayed on the left and right two regions of the display screen 20 of the smartphone 10 through the stereoscopic mirrors 50 and 60, using the smartphone 10 as the user's video playback device. An example is shown. In the simplified stereoscopic mirror 50 of FIG. 11 (a), two convex lenses 30L and 30R are mounted on a frame 52 having an eyeglass shape, and the leg ends 40L and 40R of the frame 52 are smart. The left and right outer portions of the display screen 20 of the phone 10 are provided to be picked up. In the head mounted stereoscopic mirror 50 of FIG. 11 (b), two convex lenses 30L and 30R are mounted to a position of two eyes in a frame 62 that is shaped to be used on a user's head. The front of the frame 62 is provided with a detachable smartphone 10, the speaker 64 is provided on both ears of the user.
입체경(50, 60)의 렌즈(30L, 30R)로는 단순한 플라노 콘벡스(plano covex) 렌즈, 또는 색수차와 굴절을 최소화 하기 위한 비구면 렌즈 또는 양면 비구면 렌즈 사용하는 것이 바람직하다. 렌즈의 직경은 20 ~ 50mm를 사용하는 것이 바람직하다. 사람이 편안하게 볼 수 있는 시야각은 대략 40~70°정도이므로, 이런 시야각을 제공할 수 있는 특성을 지닌 렌즈를 사용하는 것이 바람직하다. 렌즈의 초점거리는 대략 30 ~ 80 mm 사이의 것이 적당하다. 즉, 입체경(50, 60)을 사용하여 스마트 폰과 같은 영상재생기기(10)에서 표시되는 영상을 관람할 때, 그 영상재생기기의 디스플레이 화면과 두 렌즈를 대략 30 ~ 80 mm의 간격만큼 이격시키는 것이 바람직하다. 렌즈가 디스플레이 화면과 지나치게 가까우면 시야각이 지나치게 넓어져서 눈에 피로감을 주어 좋지 않다. 시야각이 지나치게 좁으면 화면의 관람 배율을 높이는데 한계가 있고, 큰 배율로 화면을 확대하려면 렌즈와 디스플레이 화면을 멀리 이격시켜야 하므로 여러 가지 불편한 점이 발생한다. 또한, 사용자의 두 눈의 간격이 사람에 따라 다르므로, 각 사용자가 자신의 눈 간격에 맞게 두 렌즈의 각 중심 간의 거리는 대략 45 ~ 70mm 사이에서 조절가능하게 하는 것이 바람직하다.As the lenses 30L and 30R of the stereoscopic mirrors 50 and 60, it is preferable to use a simple plano covex lens, or an aspherical lens or a double-sided aspheric lens for minimizing chromatic aberration and refraction. The diameter of the lens is preferably 20 to 50mm. Since the viewing angle that a person can see comfortably is about 40 to 70 degrees, it is preferable to use a lens having characteristics that can provide such a viewing angle. The focal length of the lens is suitably between about 30 and 80 mm. That is, when viewing images displayed on the image reproducing apparatus 10 such as a smart phone using the stereoscopic mirrors 50 and 60, the display screen of the image reproducing apparatus is separated from the two lenses by an interval of about 30 to 80 mm. It is preferable. If the lens is too close to the display screen, the viewing angle is too wide, which can cause eye fatigue. If the viewing angle is too narrow, there is a limit to increasing the viewing magnification of the screen, and in order to enlarge the screen with a large magnification, the lens and the display screen must be separated from each other, causing various inconveniences. In addition, since the distance between the eyes of the user varies from person to person, it is preferable that each user adjusts the distance between the centers of the two lenses to approximately 45 to 70 mm according to their own eye distance.
도 10은 사용자의 영상재생기기가 화면 크기가 가로x세로 11cm x 6.5cm인 스마트폰(삼성전자 갤럭시 S4 모델)이고, 가상의 스크린이 입체경의 렌즈로부터 150cm 앞에 위치한다고 가정할 때, 입체경의 렌즈 초점거리가 6cm, 12cm, 18cm, 24cm의 4가지인 경우에 입체경을 통해 보이는 화면의 크기를 도식적으로 나타내었다. 도 10에 따르면, 초점거리가 6인 렌즈의 경우, 1.5m 떨어진 가상 스크린에 가로길이가 약 277.24cm의 영상이 표시되는 것과 같은 효과가 있다. 달리 말하면, 화면의 가로 사이즈가 277cmm인 TV를 1.5m 떨어진 위치에서 사용자가 (입체경을 착용하지 않고) 육안으로 보는 것과 같은 효과가 있다. 다만, 본 발명의 경우, 두 영상이 사이드 바이 사이드 형태로 배치되어 반분된 것과 같으므로, 138.62cm 크기로 확대되어 보인다. 스마트폰의 실제 가로 사이즈의 절반이 5.5cm이므로 대략 25배로 확대되는 효과가 있다. 즉 상기 사이즈(대각선으로 5인치 화면)의 스마트폰에 본 발명에 따른 변환 영상을 스테레오스코프 방식으로 재생하고, 사용자가 초점거리가 6cm인 두 렌즈로 된 입체경을 착용하여 그 재생 영상을 보면, 사용자는 1.5미터 전방에 25배 확대된 125인치 스크린을 맨 눈으로 보는 것과 동일한 효과를 누릴 수 있다. FIG. 10 is a stereoscopic lens when a user's video player is a smartphone (Samsung Galaxy S4 model) having a screen size of 11cm x 6.5cm in width and length, and a virtual screen is positioned 150cm in front of a stereoscopic lens. In the case of four types of focal lengths of 6 cm, 12 cm, 18 cm and 24 cm, the size of the screen seen through a stereoscopic mirror is shown schematically. According to FIG. 10, in the case of a lens having a focal length of 6, an image having a length of about 277.24 cm is displayed on a virtual screen 1.5 m away. In other words, it has the same effect as the user visually (without wearing a stereoscopic body) a TV having a horizontal size of 277cmm at a distance of 1.5m. However, in the case of the present invention, the two images are arranged in a side-by-side form and are half-divided so that they are enlarged to 138.62 cm. Half of the actual width of the smartphone is 5.5cm, so it is approximately 25 times larger. In other words, the user can play the stereoscopic image of the converted image according to the present invention on the smartphone of the size (5-inch screen diagonally), and the user wears a stereoscopic mirror composed of two lenses having a focal length of 6 cm to view the reproduced image. The same effect can be seen with the naked eye seeing a 125-inch screen 25 times magnified 1.5 meters forward.
입체경의 렌즈 초점거리가 더 길어지면, 화면 확대의 효과는 반감된다. 예컨대 렌즈의 초점거리가 24cm로 되면, 1.5m 전방의 가상스크린에 가로길이가 72.66cm인 화면을 보는 것과 같게 된다. 이 경우, 화면 확대율은 대략 6.5배(72/11)로 되어, 사용자는 약 36인치 텔레비젼을 1.5미터 떨어진 곳에서 육안으로 보는 것과 같은 크기로 인식하게 된다. If the lens focal length of the stereoscopic mirror becomes longer, the effect of screen magnification is halved. For example, if the focal length of the lens is 24cm, it is like viewing a screen with a width of 72.66cm on the virtual screen 1.5m forward. In this case, the screen magnification is approximately 6.5 times (72/11), so that the user perceives a 36-inch television about the same size as the naked eye looking at 1.5 meters away.
이상에서 설명한 본 발명에 따른 재생 영상과 기존의 입체영상 및 단순한 2차원 영상 간의 차이점을 아래 표에 정리하였다.The difference between the playback image according to the present invention described above, a conventional stereoscopic image, and a simple 2D image is summarized in the following table.
표 1
구분 종래의 입체영상 본 발명의 영상 단순 2차원 영상
소스 영상 광각의 차이를 갖는 좌안용 및 우안용 두 영상(비동일 영상) 광각의 차이가 없는 좌안용 및 우안용 두 영상(동일 영상) 좌안용과 우안용 구별 없는 하나의 영상
관람 방법 좌안용 영상과 우안용 영상을 각각 좌안과 우안으로 봄 좌안용 영상과 우안용 영상을 각각 좌안과 우안으로 봄 좌안과 우안 모두 하나의 영상을 봄
관람 느낌 입체감 입체감과 2차원감의 중간 정도의 느낌 2차원감
기타 배율 있는 렌즈를 착용하여 관람하면, 작은 사이즈의 디스플레이 영상도 아주 크게 확대하여 볼 수 있음
Table 1
division Conventional stereoscopic image Image of the present invention Simple two-dimensional image
Source footage Two images for left and right eyes with a wide angle difference (non-identical images) Two images for left eye and right eye with no difference in wide angle (same image) One image for the left eye and the right eye
How to watch View left eye and right eye images in the left and right eyes, respectively View left eye and right eye images in the left and right eyes, respectively Both the left and right eyes view one video
Spectating feeling Three-dimensional About halfway between three-dimensional feeling and two-dimensional feeling Two-dimensional
Other If you wear a magnified lens, you can zoom in on the small display image.
이와 달리, 소스 영상 프레임을 타겟 영상 프레임으로 변환하는 처리를 콘텐츠를 소비하는 사용자의 영상 재생 기기에서도 할 수 있다. 이 경우에도, 사용자의 영상 재생 기기에서는 콘텐츠 제공자 시스템으로부터 수신한 소스 영상 프레임으로 구성된 원본 영상 신호를 원하는 비율로 스케일링 처리(영상 프레임의 축소 또는 확대)를 하여 타겟 영상 신호를 만든다. 그 스케일링 처리를 할 때, 원래의 소스 영상 프레임의 해상도와 디스플레이 화면의 해상도의 상관관계를 고려하는 것이 바람직하다.Alternatively, the process of converting the source video frame into the target video frame can be performed by the video reproducing apparatus of the user consuming the content. Even in this case, the user's video reproducing apparatus scales (reduces or enlarges the video frame) the original video signal composed of the source video frame received from the content provider system to produce a target video signal. When performing the scaling process, it is desirable to consider the correlation between the resolution of the original source video frame and the resolution of the display screen.
다음으로, 변환된 영상 프레임 (Fi')을 만드는 작업을 해당 영상을 소비하는 사용자측에서 수행하는 경우를 설명한다. 영상 변환 작업을 위한 수단으로, 예컨대 도 7과 같은 하드웨어 자원을 갖는 영상재생기기(500)면 충분하다. 그리고 영상 변환 처리 알고리즘을 실행하도록 구성된 애플리케이션 프로그램도 필요하다. 예컨대 스마트폰, 타블렛 PC, 일반 PC 등에서 그 애플리케이션 프로그램을 실행하여 영상을 변환할 수 있다. 이 애플리케이션 프로그램은 예컨대 영상재생 플레이어의 일부 기능으로서 포함시키는 형태로 구현하는 것이 바람직할 것이다.Next, a case in which the operation of creating the converted image frame Fi 'is performed by the user who consumes the image will be described. As a means for converting the image, for example, the image reproducing apparatus 500 having a hardware resource as shown in FIG. 7 is sufficient. There is also a need for an application program configured to execute an image conversion processing algorithm. For example, the application program can be converted in a smartphone, tablet PC, general PC, and the like to convert an image. It may be desirable to implement this application program in a form of inclusion as some functions of a video player.
변환 대상인 영상 데이터는 저장부(520)에 파일 형태로 저장된 것이거나, 외부의 콘텐츠 제공 시스템으로부터 실시간으로 스트리밍 되어 오는 영상데이터이거나 또는 외부의 방송시스템이 전송해주는 방송신호에 실린 영상데이터일 수 있다. 어느 경우나, 콘텐츠 제공자 측에서 변환 영상을 만들어내는 것과 크게 다르지 않다. 즉, 원래의 소스 영상 프레임을 원하는 비율로 스케일링 하여 타겟 영상 프레임으로 변환하고, 그 변환된 타겟 영상프레임을 두 개로 복제하여 디스플레이 화면의 좌측 절반과 우측 절반 내에 각각 디스플레이되도록 하고, 사용자는 입체경의 두 렌즈를 통해 좌안과 우안이 디스플레이 화면의 좌측 절반 내에 표시된 영상과 우측 절반 내에 표시된 영상을 볼 수 있도록 하는 기본 개념은 동일하다. The video data to be converted may be stored in a file format in the storage unit 520, video data streamed in real time from an external content providing system, or video data carried on a broadcast signal transmitted by an external broadcast system. In either case, the content provider does not differ much from generating the converted image. That is, the original source image frame is scaled to a desired ratio and converted into a target image frame, and the converted target image frame is duplicated in two to be displayed in the left half and the right half of the display screen, respectively. The basic concept of allowing the left and right eyes to see the image displayed in the left half of the display screen and the image displayed in the right half through the lens is the same.
먼저, 영상 데이터가 라이브 방송신호 형태로 제공되는 경우를 고려한다. 도 9는 이 경우의 영상 변환을 처리하는 애플리케이션 프로그램의 실행 절차를 개략적으로 나타낸 흐름도이다. First, consider a case where the image data is provided in the form of a live broadcast signal. 9 is a flowchart schematically showing an execution procedure of an application program for processing video conversion in this case.
외부의 방송시스템이 제공하는 영상은 일반적인 디지털 영상이다. 콘텐츠 소비자는 변환되지 않은 원래대로의 영상을 시청할 것인지 아니면, 본 발명에 따라 변환된 영상을 시청할 것인지를 선택할 수 있다. 이런 선택권은 사용자 인터페이스(550)를 통해 행사할 수 있다(S50 단계). 변환된 영상을 시청하는 것으로 선택된 경우, CPU(530)는 이하에서 설명하는 영상 변환 처리를 수행한다.The image provided by the external broadcasting system is a general digital image. The content consumer may choose whether to watch the unconverted original image or the converted image according to the present invention. This option may be exercised through the user interface 550 (step S50). If it is selected to watch the converted video, the CPU 530 performs the video conversion processing described below.
구체적으로, 방송신호 형태로 수신되는 영상 데이터는 통신부(510)를 통해 CPU(530)에 제공될 것이다. 이 영상 데이터는 통상 특정 압축 표준에 따라 인코딩되어 있을 것이므로, CPU(530)는 그 수신된 영상 데이터를 디코딩한다(S52 단계). 그리고 그 디코딩 영상 데이터의 각 화면 프레임 Fi를 원하는 비율로 스케일링 한다(S54 단계). 스케일링 비율은 영상 데이터의 해상도와 디스플레이(570)의 해상도를 함께 고려하여 정하는 것이 바람직하다. 예를 들어 디스플레이(570)의 해상도가 720p (1280x720 픽셀)인 경우, 디스플레이(570)의 화면을 좌우로 반분하여 그 반분된 좌측 화면과 우측 화면에 동일한 두 타겟 영상 프레임을 표시하는 경우를 고려하자. 이 경우 각 소스 영상 프레임을 절반 크기로 줄이는 변환을 수행한다. 소스 영상 프레임을 절반으로 줄이는 방법으로, 앞에서 예시한 방법 즉, 이미지 프레임의 가로방향 및 세로방향으로 짝수 번째 픽셀들은 모두 제거하고, 나머지 홀수 번째 픽셀들을 변환된 이미지 프레임으로 사용하는 방법을 사용할 수 있다. 그 변환된 프레임의 픽셀 수는 640x360이 된다. 다른 변환을 하지 않고 이미지를 절반 수축된 상태로 디스플레이에 표시할 경우, 사이드 바이 사이드 형태로 표시되는 이미지의 크기는 디스플레이 크기의 절반이 된다. 즉, 디스플레이의 기준 좌표(좌측 상단의 좌표를 예컨대 (0, 0)로 정할 경우)에 대하여 디스플레이(570) 화면의 좌측 반분영역(좌안 표시영역)의 좌측 상단(시작위치)의 좌표는 (0, 179)가 되고, 우측 하단(끝나는 위치)의 좌표는 (639, 539)가 된다. 또한, 디스플레이(570) 화면의 우측 반분영역(우안 표시영역)의 좌측 상단(시작위치)의 좌표는 (640, 179)가 되고, 우측 하단(끝나는 위치)의 좌표는 (1279, 539)가 된다. 소스 영상의 해상도가 디스플레이(570)의 해상도와 다른 경우, 정해진 디스플레이의 표시영역의 위치와 크기에 따라서 적당한 스케일링 방법을 사용하여 영상 프레임을 변환할 수 있다.In detail, the image data received in the form of a broadcast signal will be provided to the CPU 530 through the communication unit 510. Since this video data will normally be encoded according to a specific compression standard, the CPU 530 decodes the received video data (step S52). Each screen frame Fi of the decoded video data is scaled by a desired ratio (step S54). The scaling ratio is preferably determined in consideration of the resolution of the image data and the resolution of the display 570. For example, if the resolution of the display 570 is 720p (1280x720 pixels), consider splitting the screen of the display 570 to the left and right to display the same two target image frames on the split left and right screens. . In this case, the conversion is performed to reduce each source image frame by half. As a method of reducing the source image frame by half, the above-described method, that is, removing all the even pixels in the horizontal and vertical directions of the image frame and using the remaining odd pixels as the converted image frame can be used. . The number of pixels in the converted frame is 640x360. If the image is displayed on the display in a half-contracted state without any other conversion, the size of the image displayed in the side-by-side form is half the display size. That is, with respect to the reference coordinate of the display (when the coordinate of the upper left is set to (0, 0), for example), the coordinate of the upper left (starting position) of the left half region (left eye display area) of the display 570 screen is (0). 179, and the coordinates of the lower right (end position) are (639, 539). In addition, the coordinates of the upper left (start position) of the right half area (right eye display area) of the display 570 screen are (640, 179), and the coordinates of the lower right (end position) are (1279, 539). . If the resolution of the source image is different from that of the display 570, the image frame may be converted using an appropriate scaling method according to the position and size of the display area of the display.
스케일링 처리로 얻어진 각 화면 프레임(Fi/2)을 두 개로 복제하여 좌우에 병치되도록 구성하여 새로운 영상 프레임 (Fi')을 구성한다(S56 단계). Each screen frame (Fi / 2) obtained by the scaling process is duplicated in two and arranged to be parallel to the left and right to form a new image frame (Fi ') (step S56).
CPU(530)는 이렇게 변환된 영상 프레임 (Fi')을 순차적으로 만들면서, 한편으로는 그 변환된 화면 프레임들을 적용하는 입체영상 재생방법에 따라 필요한 가공을 한다(S58 단계). The CPU 530 sequentially generates the converted image frame Fi 'and performs necessary processing according to the stereoscopic image reproducing method applying the converted screen frames on the other hand (step S58).
그리고 그 가공된 화면 프레임들을 모아서 비디오 구동부(560)에 제공한다. 즉, CPU(530)는 두 개의 복제된 영상 프레임(Fi')을 비디오 구동부(560)의 미리 지정된 두 메모리영역--디스플레이(570)의 좌측 반분영역과 우측 반분영역에 대응하는 두 메모리영역--에 각각 저장한다. 그러면, 비디오 구동부(560)가 그 두 메모리영역으로부터 두 개의 복제된 영상 프레임(Fi')을 읽어내어 디스플레이(570)의 좌측 반분영역과 우측 반분영역에 각각 표시되도록 처리하게 된다(S60 단계).The processed screen frames are collected and provided to the video driver 560. That is, the CPU 530 divides two duplicate image frames Fi 'into two predetermined memory regions of the video driver 560-two memory regions corresponding to the left half region and the right half region of the display 570. Store each in-. Then, the video driver 560 reads out the two duplicated image frames Fi 'from the two memory regions and processes them to be displayed on the left half and right half regions of the display 570 (step S60).
허용된다면, CPU(530)는 S46 단계에서 얻어지는 새로운 영상 프레임들 (Fi')을 모아서 파일 형태로 저장부(520)에 저장하였다가, 나중에 필요할 때 그 저장된 파일을 읽어 와서 재생할 수도 있을 것이다.If allowed, the CPU 530 may collect the new image frames Fi ′ obtained in step S46 and store them in a file form in the storage unit 520, and later read and play the stored files when necessary.
다음으로, 저장부(520)에 저장되어 있는 통상적인 영상 파일들을 본 발명에 따른 변환 영상 파일로 만들 수도 있다. 즉, CPU(530)는 저장부(520)에서 변환 대상인 소스 영상 파일을 읽어 와서 단계 42의 디코딩, 단계 44의 영상 축소, 단계 46의 축소 영상의 병치 조합을 순차적으로 수행하여 통해 소스 영상의 각 화면 프레임(Fi)을 변환 영상 프레임 (Fi')으로 가공한다. 계속해서 단계 S48과 S50을 수행하여 변환과 병행하여 재생을 하거나, 또는 그 변환된 프레임 (Fi')들을 모아서 저장부(520)에 파일 형태로 저장하고 필요 시 재생을 한다.Next, conventional image files stored in the storage unit 520 may be converted into a converted image file according to the present invention. That is, the CPU 530 reads the source image file to be converted from the storage unit 520 and sequentially executes a combination of decoding in step 42, image reduction in step 44, and juxtaposed image in step 46. The screen frame (Fi) is processed into a converted video frame (Fi '). Subsequently, steps S48 and S50 are performed to perform playback in parallel with the conversion, or the converted frames Fi 'are collected and stored in a file format in the storage unit 520 and played back when necessary.
한편, 사시와 같이 두 눈의 눈동자의 근육에 이상이 있는 사용자의 경우, 디스플레이에 표시되는 사이드 바이 사이드 형태의 두 영상의 표시 위치를 자신의 두 눈의 시선방향에 맞도록 조절할 수 있도록 해주는 것이 바람직하다. 이를 위한 방법을 설명한다.On the other hand, if the user has an abnormal muscle of the eyes of the eyes, such as strabismus, it is desirable to be able to adjust the display position of the two images of the side-by-side type displayed on the display to match the eyes of the two eyes. Do. Explain how to do this.
사시가 아닌 정상적인 두 눈을 가진 사용자는 두 눈의 시선방향이 도 12의 (a)에 도시된 것처럼 디스플레이(20, 570) 화면의 좌측 반분영역(20L)의 중심(CP1)과 우측 반분영역(20R)의 중심(CP2)을 향할 것이다. 하지만, 사시를 가진 사용자의 두 눈의 시선방향은 이와 다르다. 예컨대, 입체경(50, 60)의 두 렌즈(30L, 30R)을 통해 본 두 눈의 시선방향은 도 12의 (b)처럼 좌안은 좌상방으로 약간의 편차를 나타내고 우안은 우측으로 큰 편차를 나타내거나, (c)처럼 좌우측 방향으로 좁혀지면서 좌안이 약간 위쪽으로 향하거나, 또는 (d)처럼 좌안은 중심(CP1)에서 우상방으로 약간의 편차를 나타내고 우안은 상방으로 큰 편차를 나타내는 것과 같이, 두 눈의 적어도 어느 한 쪽의 시선방향이 상기 두 중심(CP1, CP2)와 일치하지 않는다. 디스플레이 화면(20)에 사이드 바이 사이드 형태로 표시되는 좌측 영상의 중심과 우측 영상의 중심을 사용자 자신의 두 눈의 시선방향에 일치되게 보정할 필요가 있다.A user with normal binocular rather than strabismus has a visual direction of both eyes as shown in (a) of FIG. 12. The center (CP1) and the right half region (the center of the left half region 20L of the display 20, 570) 20R) will be towards the center (CP2). However, the eyes of the eyes of the strabismus are different. For example, the visual direction of the two eyes viewed through the two lenses 30L and 30R of the stereoscopic mirrors 50 and 60 shows a slight deviation in the left eye and a right deviation in the right eye as shown in FIG. As shown in (c), the left eye is slightly upward while being narrowed in the left and right directions, or as in (d), the left eye has a slight deviation from the center (CP1) to the upper right and the right eye has a large deviation upward. The visual direction of at least one of the two eyes does not coincide with the two centers CP1 and CP2. It is necessary to correct the center of the left image and the center of the right image displayed in the side-by-side form on the display screen 20 so as to match the visual directions of the eyes of the users themselves.
이를 위해, 먼저 도 13의 (a)에 도시된 것처럼 디스플레이(20, 570)의 좌측 영상표시영역(22L)과 우측 영상표시영역(22R)에 각각 영상 표시 영역 보정을 위한 표적들(C1, C2)을 표시한다. 이 표적들(C1, C2)은 중심선이 표시된 원을 사용할 수 있으나, 이에 한정되는 것은 아니고 사각형, 6각형 등 다양한 도형이 사용될 수 있다. 도 13(b)는 눈동자의 초점이 어긋나 있는 사용자가 도 13의 (a)에 표시된 것과 같이 수평이 맏도록 표시된 사이드 바이 사이드 이미지를 입체경(50, 60)을 사용하여 볼 경우 인식되는 상태를 도시한 경우이다. 어떤 사용자가 사이드 바이 사이드 이미지를 볼 때 도 13의 (b)와 같이 인식되는 경우, 제2 표적(C2)을 각각 -dx, -dy 만큼 이동 시키면 일치하게 된다. 즉, 영상재생기기(10, 500)는 입력장치(예를 들면 블루투스로 연결되는 리모콘 또는 조이스틱)나 터치스크린 센서를 통하여 우측 영상표시영역(22R)의 좌표(CS2)를 (-dx, -dy) 만큼 이동시키도록 지령하는 위치조절 신호를 입력을 받아서 디스플레이(20, 570)에 표시한다. 영상재생기기(10, 500)의 사용자가 디스플레이(20, 570)에 표시된 좌우 병치된 두 영상을 볼 때 표적이 일치하는 것으로 인식되면, 그 때 사용자에 의하여 조정 종료 신호가 입력되고, 영상재생기기(10, 500)의 CPU(530)는 그 조정 종료 신호를 입력받고, 조정된 좌측 영상표시영역(22L) 및/또는 우측 영상표시영역(22R)의 좌표의 위치를 저장부(520)에 기록한다. 13의 (c)는 사용자에 맞도록 조정된 좌측 영상표시영역(22L) 및/또는 우측 영상표시영역(22R)을 나타낸다. 이에 의해, 변환된 타겟 영상 프레임의 좌측 영상과 우측 영상은 사용자의 두 눈의 시선방향에 맞게 위치 조정된 좌측 영상표시영역(22L)과 우측 영상표시영역(22R)에 각각 디스플레이 된다.To this end, first, targets C1 and C2 for image display area correction are respectively displayed on the left image display area 22L and the right image display area 22R of the displays 20 and 570, as shown in FIG. 13A. ). The targets C1 and C2 may use a circle in which a centerline is displayed. However, the targets C1 and C2 may be various shapes such as a rectangle and a hexagon. FIG. 13 (b) shows a state where the user who is out of focus with the pupil is recognized when using the stereoscopic mirrors 50 and 60 to view the side-by-side image displayed so as to be horizontal, as shown in FIG. 13 (a). One case. When a user sees the side-by-side image as shown in FIG. 13 (b), the second target C2 is moved by -dx and -dy to match. That is, the image reproducing apparatuses 10 and 500 adjust the coordinates CS2 of the right image display area 22R through an input device (for example, a remote control or joystick connected by Bluetooth) or a touch screen sensor. The display 20 and 570 receive an input of a position adjustment signal which is commanded to move by (-dx, -dy). When the user of the image reproducing apparatus 10 or 500 sees that the target coincides when viewing the left and right juxtaposed images displayed on the displays 20 and 570, the adjustment end signal is input by the user at that time, and the image reproducing apparatus is input. The CPU 530 of (10, 500) receives the adjustment end signal and records the coordinate positions of the adjusted left image display area 22L and / or right image display area 22R in the storage unit 520. do. 13 (c) shows the left image display area 22L and / or the right image display area 22R adjusted to be suitable for the user. As a result, the left image and the right image of the converted target image frame are displayed in the left image display area 22L and the right image display area 22R, respectively, which are positioned to match the eyes of the user's eyes.
본 발명은 이상에서 설명한 것처럼, 영상 프레임의 변환을 콘텐츠 제공자 시스템에서 미리 수행하여 변환된 영상 콘텐츠를 콘텐츠 소비자에게 제공하거나, 또는 영상 프레임의 변환 처리를 콘텐츠 소비자 측에서 수행할 있다. 어느 경우나, 변환 환경이나 조건의 차이에서 비롯되는 변환의 전처리나 후처리가 조금 차이날 수는 있겠지만, 영상 변환의 핵심적인 알고리즘은 실질적으로 동일하다고 볼 수 있다. 이와 달리, 그 영상 변환 알고리즘을 운영체제 프로그램에 심는 방법도 가능할 것이다. 즉, 사용자에게 화면 분할에 대한 선택권을 제공하고, 사용자의 선택에 따라 화면을 좌우 두 개로 분할하면서 재생할 영상을 모두 그 분할된 두 화면에 동시에 디스플레이 되도록 하는 방법도 가능하다.As described above, the conversion of an image frame may be performed in advance in the content provider system to provide the converted image content to the content consumer, or the content consumer may perform the conversion process of the image frame. In either case, the pre- and post-processing of the transformation resulting from differences in the transformation environment or conditions may be slightly different, but the core algorithms of the image transformation are substantially the same. Alternatively, it may be possible to embed the image conversion algorithm into an operating system program. In other words, it is possible to provide a user with a right to divide a screen, and to split the screen into two left and right sides according to a user's selection, and to simultaneously display both images to be played on the divided two screens.

Claims (11)

  1. 영상변환부에서, 소스 영상데이터의 각 소스 영상프레임(Fi)을 대응하는 타겟 영상프레임(Fi')으로 순차적으로 변환하여 상기 타겟 영상프레임(Fi')들로 구성된 변환 영상데이터를 생성하는 제1단계, 여기서 상기 각 소스 영상프레임(Fi)의 대응 타겟 영상프레임(Fi')으로의 변환은 상기 소스 영상프레임(Fi)을 소정의 비율로 스케일링 하여 실질적으로 동일한 두 개의 변환 영상프레임을 만들고, 상기 두 개의 변환 영상프레임을 조합하여 상기 타겟 영상프레임(Fi')을 구성하는 것에 의해 달성되며;In the image conversion unit, first converting each source image frame (Fi) of the source image data to a corresponding target image frame (Fi ') to generate the converted image data consisting of the target image frame (Fi') Step, wherein the conversion of each source video frame (Fi) to a corresponding target video frame (Fi ') to scale the source video frame (Fi) by a predetermined ratio to create two substantially identical converted video frame, Achieved by combining the two converted image frames to form the target image frame Fi ';
    상기 영상변환부가 상기 변환 영상데이터를 영상재생부로 제공하는 제2단계; 및A second step of providing the converted image data to the image reproducing unit; And
    상기 영상재생부에서, 제공받은 상기 변환 영상데이터의 타겟 영상프레임(Fi')들을 화면에 재생하되, 각 타겟 영상프레임(Fi')을 구성하는 상기 실질적으로 동일한 두 개의 변환 영상프레임의 영상을 디스플레이 화면의 좌측 절반과 우측 절반에 각각 디스플레이 되게 함으로써, 각 타겟 영상프레임(Fi')을 구성하는 동일한 두 개의 변환 영상프레임이 두 개의 렌즈를 포함하는 입체경(stereoscope)으로 관람하는 영상콘텐츠 소비자의 좌안과 우안에 각각 별도로 보일 수 있도록 재생하는 제3단계를 포함하는 것을 특징으로 하는 영상 데이터 변환 및 재생 방법.The image reproducing unit reproduces the received target image frames Fi 'of the converted image data on a screen, and displays the images of the two substantially identical converted image frames constituting each target image frame Fi'. By displaying the left half and the right half of the screen, respectively, the left eye and the left eye of the image content consumer viewing the same two converted image frames constituting each target image frame (Fi ') with a stereoscope including two lenses. And a third step of reproducing the right eye so that the right eye can be seen separately.
  2. 제1항에 있어서, 상기 스케일링에 적용하는 비율은, 상기 실질적으로 동일한 두 개의 변환 영상프레임이 영상재생기기의 디스플레이 화면의 좌측 반분영역과 우측 반분영역 내에 각각 표시될 수 있는 영상 크기를 갖게 하는 값으로 정해지는 것을 특징으로 하는 영상 데이터 변환 및 재생 방법. The method of claim 1, wherein the ratio applied to the scaling is such that the two substantially identical converted image frames have an image size that can be displayed in the left half region and the right half region of the display screen of the image reproducing apparatus, respectively. Video data conversion and playback method characterized in that.
  3. 제1항에 있어서, 상기 실질적으로 동일한 두 개의 변환 영상프레임은, 상기 소스 영상프레임(Fi)의 크기를 가로방향과 세로방향으로 각각 절반으로 줄인 축소 영상프레임을 만든 다음 상기 축소 영상프레임을 두 개로 복제하여 얻어지는 두 개의 축소 영상 프레임인 것을 특징으로 하는 영상 데이터 변환 및 재생 방법. The method of claim 1, wherein the two substantially identical converted video frames are made to reduce the size of the source video frame (Fi) in half in the horizontal and vertical directions, respectively, and then reduce the reduced video frames into two. Video data conversion and reproduction method characterized in that the two reduced image frames obtained by copying.
  4. 제1항에 있어서, 상기 실질적으로 동일한 두 개의 변환 영상프레임은, (i) 상기 소스 영상 프레임(Fi)의 홀수 번째의 행과 열에 있는 픽셀 데이터들만을 취하여 구성한 제1 변환 영상프레임과 짝수 번째의 행과 열에 있는 픽셀 데이터들만을 취하여 구성한 제2 변환 영상 프레임으로 구성되는 것을 특징으로 하는 영상 데이터 변환 및 재생 방법.2. The method of claim 1, wherein the two substantially identical transformed image frames comprise (i) an even numbered first and second transformed image frames formed by taking only pixel data in odd-numbered rows and columns of the source image frame Fi. 3. And a second converted video frame composed of only pixel data in rows and columns.
  5. 제1항에 있어서, 상기 디스플레이 화면의 좌우로 양분한 좌측 반분영역과 우측 반분영역에 각각 이미지 표시 영역 보정을 위한 표적을 표시하는 단계와,The method of claim 1, further comprising: displaying a target for correcting an image display area in the left half and right half divided by the left and right of the display screen;
    사용자 입력수단을 통해 상기 좌측 반분영역 또는 우측 반분영역 중 어느 하나의 이미지 표시 영역 보정 좌표 정보를 입력받아, 상기 이미지 표시 영역 보정 좌표 정보에 따라서 이미지 표시 영역 좌표를 변경하는 단계를 더 포함하는 것을 특징으로 하는 영상 데이터 변환 및 재생 방법.And receiving the image display area correction coordinate information of any one of the left half region and the right half region through a user input means, and changing the image display region coordinates according to the image display region correction coordinate information. Video data conversion and playback method.
  6. 제1항에 있어서, 상기 제3단계에서의 영상 디스플레이는 스마트폰 또는 타블렛 컴퓨터를 비롯한 휴대용 영상재생기기에서 수행되고, 영상콘텐츠 소비자는 40~70°의 시야각을 제공하는 상기 입체경의 두 개의 볼록렌즈가 상기 디스플레이 화면으로부터 30 ~ 80 mm의 이격된 상태에서 상기 입체경을 통해 상기 실질적으로 동일한 두 개의 변환 영상프레임을 동시에 보는 것을 특징으로 하는 영상 데이터 변환 및 재생 방법.The stereoscopic two-convex lens of claim 3, wherein the image display in the third step is performed in a portable image playback device including a smartphone or a tablet computer, and the image content consumer provides a viewing angle of 40 to 70 degrees. And simultaneously view the two substantially identical converted image frames through the stereoscopic mirror in a state spaced 30 to 80 mm from the display screen.
  7. 제1항에 있어서, 상기 제1단계, 상기 제2단계, 및 상기 제3단계는 상기 영상변환부와 상기 영상재생부를 모두 구비하는 영상콘텐츠 소비자 측의 영상재생기기에서 수행되는 것을 특징으로 하는 영상 데이터 변환 및 재생방법.The image reproducing apparatus as claimed in claim 1, wherein the first, second and third steps are performed in an image reproducing apparatus of the image content consumer, which includes both the image converting unit and the image reproducing unit. How to convert and play data.
  8. 제1항에 있어서, 상기 제1단계와 상기 제2단계는 상기 영상변환부를 구비하는 영상콘텐츠 제공자 측의 영상제공시스템에 의해 수행되고, 상기 제3단계는 상기 영상재생부를 구비하는 영상콘텐츠 소비자 측의 영상재생기기에 의해 수행되는 것을 특징으로 하는 영상 데이터 변환 및 재생방법.The image content consumer side according to claim 1, wherein the first step and the second step are performed by an image providing system of an image content provider having the image converting unit, and the third step is provided with the image reproducing unit. Image data conversion and playback method characterized in that performed by the video playback device.
  9. 제8항에 있어서, 상기 영상변환부가 상기 제2단계를 수행할 때 상기 변환 영상데이터를 스트리밍(streaming) 방식 또는 방송(broadcast) 방식으로 상기 영상재생부에 전송하는 것을 특징으로 하는 영상 데이터 변환 및 재생방법. The image data conversion method according to claim 8, wherein when the image conversion unit performs the second step, the converted image data is transmitted to the image reproduction unit by a streaming method or a broadcast method. How to play.
  10. 제9항에 있어서, 상기 제2단계에서 상기 영상제공시스템이 상기 영상재생기기에 상기 변환 영상데이터를 제공함에 있어서 상기 소스 영상데이터도 함께 제공하는 것을 특징으로 하는 영상 데이터 변환 및 재생방법.  10. The method of claim 9, wherein in the second step, the image providing system provides the source image data together with providing the converted image data to the image reproducing apparatus.
  11. 제10항에 있어서, 상기 제3단계는 상기 영상재생기기에서 영상콘텐츠 소비자가 상기 소스 영상데이터와 상기 변환 영상데이터 중 후자를 선택하여 재생을 지시하는 경우에 수행되는 것을 특징으로 하는 영상 데이터 변환 및 재생방법. 12. The method of claim 10, wherein the third step is performed when the video content consumer instructs playback by selecting the latter of the source video data and the converted video data in the video playback device. How to play.
PCT/KR2014/007190 2013-08-02 2014-08-04 Method for converting and reproducing image for providing moderate three-dimensional effect between two-dimensional image and three-dimensional image WO2015016691A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020130091906A KR101433082B1 (en) 2013-08-02 2013-08-02 Video conversing and reproducing method to provide medium feeling of two-dimensional video and three-dimensional video
KR10-2013-0091906 2013-08-02

Publications (1)

Publication Number Publication Date
WO2015016691A1 true WO2015016691A1 (en) 2015-02-05

Family

ID=51751089

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2014/007190 WO2015016691A1 (en) 2013-08-02 2014-08-04 Method for converting and reproducing image for providing moderate three-dimensional effect between two-dimensional image and three-dimensional image

Country Status (2)

Country Link
KR (1) KR101433082B1 (en)
WO (1) WO2015016691A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017000317A1 (en) * 2015-06-29 2017-01-05 爱侣健康科技有限公司 Readily-controllable video glasses

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100135032A (en) * 2009-06-16 2010-12-24 삼성전자주식회사 Conversion device for two dimensional image to three dimensional image and method thereof
KR20110114994A (en) * 2010-04-14 2011-10-20 엘지전자 주식회사 Image display device of 2d/3d convertible display and operating method for the same
KR20120133571A (en) * 2011-05-31 2012-12-11 삼성전자주식회사 Imformation processing apparatus, implementation method thereof, and computer-readable storage medium thereof
JP2013033172A (en) * 2011-08-03 2013-02-14 Panasonic Corp Stereoscopic display device

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030001758A (en) * 2001-06-27 2003-01-08 한국전자통신연구원 Apparatus and Method for stereoscopic video coding/decoding with motion and disparity compensated prediction
KR20070089305A (en) * 2006-02-28 2007-08-31 주식회사 서울테크밸리 Method for transmission of stereoscopic image
JP4792054B2 (en) 2008-03-24 2011-10-12 株式会社東芝 3D image display device, 3D image display method, and liquid crystal display
JP2012099905A (en) 2010-10-29 2012-05-24 Sharp Corp Three-dimentional video reproduction device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100135032A (en) * 2009-06-16 2010-12-24 삼성전자주식회사 Conversion device for two dimensional image to three dimensional image and method thereof
KR20110114994A (en) * 2010-04-14 2011-10-20 엘지전자 주식회사 Image display device of 2d/3d convertible display and operating method for the same
KR20120133571A (en) * 2011-05-31 2012-12-11 삼성전자주식회사 Imformation processing apparatus, implementation method thereof, and computer-readable storage medium thereof
JP2013033172A (en) * 2011-08-03 2013-02-14 Panasonic Corp Stereoscopic display device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017000317A1 (en) * 2015-06-29 2017-01-05 爱侣健康科技有限公司 Readily-controllable video glasses

Also Published As

Publication number Publication date
KR101433082B1 (en) 2014-08-25

Similar Documents

Publication Publication Date Title
CN106165415B (en) Stereoscopic viewing
US20150358539A1 (en) Mobile Virtual Reality Camera, Method, And System
US8077964B2 (en) Two dimensional/three dimensional digital information acquisition and display device
JP5745822B2 (en) Playback mode switching method, output mode switching method, display device using the same, and 3D video providing system
CN105187816B (en) Method and apparatus for the activity space of reasonable employment frame packing form
US9137523B2 (en) Method and apparatus for controlling image display so that viewers selectively view a 2D or a 3D service
JP5833667B2 (en) Method and apparatus for providing monovision in a multi-view system
US20160344999A1 (en) SYSTEMS AND METHODs FOR PRODUCING PANORAMIC AND STEREOSCOPIC VIDEOS
CN106796390A (en) For the camera apparatus with big visual field of three-dimensional imaging
CA2933704A1 (en) Systems and methods for producing panoramic and stereoscopic videos
KR101329057B1 (en) An apparatus and method for transmitting multi-view stereoscopic video
WO2018167549A1 (en) Instantaneous 180° 3d imaging and playback methods
CN204681518U (en) A kind of panorama image information collecting device
CN103209335A (en) Three-dimensional film playing method and system supporting high screen refresh rate
CN103149697A (en) Cylindrical lens stereoscopic image vision aid screen and stereoscopic image reconstruction system
WO2022142757A1 (en) Video processing method and apparatus, electronic device, and computer readable storage medium
WO2015016691A1 (en) Method for converting and reproducing image for providing moderate three-dimensional effect between two-dimensional image and three-dimensional image
Zhang et al. A new 360 camera design for multi format VR experiences
CN114040184A (en) Image display method, system, storage medium and computer program product
CN203219433U (en) 3D movie play system supporting high screen refresh rate
CN203164525U (en) Cylindrical-lens 3D (Three-Dimensional) image watching assistant screen and 3D image reproducing system
KR101674688B1 (en) A method for displaying a stereoscopic image and stereoscopic image playing device
KR101733488B1 (en) Method for displaying 3 dimensional image and 3 dimensional image display device thereof
Kara et al. The couch, the sofa, and everything in between: discussion on the use case scenarios for light field video streaming services
JP2014175813A (en) Stereoscopic video display method and device

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14832531

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14832531

Country of ref document: EP

Kind code of ref document: A1