WO2007029393A1 - Multimedia reproducing apparatus, menu operation accepting method, and computer program - Google Patents

Multimedia reproducing apparatus, menu operation accepting method, and computer program Download PDF

Info

Publication number
WO2007029393A1
WO2007029393A1 PCT/JP2006/312029 JP2006312029W WO2007029393A1 WO 2007029393 A1 WO2007029393 A1 WO 2007029393A1 JP 2006312029 W JP2006312029 W JP 2006312029W WO 2007029393 A1 WO2007029393 A1 WO 2007029393A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
image
menu
multimedia playback
playback device
Prior art date
Application number
PCT/JP2006/312029
Other languages
French (fr)
Japanese (ja)
Inventor
Katsu Saito
Original Assignee
Sony Computer Entertainment Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Computer Entertainment Inc. filed Critical Sony Computer Entertainment Inc.
Publication of WO2007029393A1 publication Critical patent/WO2007029393A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures

Definitions

  • Multimedia playback device menu operation reception method, and computer program
  • the present invention relates to an information processing system that recognizes a user's action from an image taken by a video camera and receives a menu operation.
  • Patent Document 1 includes a media icon array including a plurality of media icons indicating types of media that can be played back, and a content icon array 72 including a plurality of content icons indicating content items that can be played back.
  • a media icon array including a plurality of media icons indicating types of media that can be played back
  • a content icon array 72 including a plurality of content icons indicating content items that can be played back.
  • Patent Document 1 Japanese Unexamined Patent Application Publication No. 2004-356774
  • Patent Document 1 The input interface disclosed in Patent Document 1 is capable of selecting, playing, and executing desired multimedia content according to an up / down direction and a left / right direction, so that it is easy to understand for everyone. have. For this reason, application in the field of multimedia playback systems with a wide range of users is expected.
  • An object of the present invention is to further improve the user operability in multimedia playback.
  • a multimedia playback device for solving the above-described problem is a multimedia playback device that plays back content specified by a menu operation.
  • Moving image input means for inputting a user's moving image
  • a menu image generating means for generating a menu image for accepting an operation relating to content reproduction
  • a superimposed image generating means for generating a superimposed moving image of the mirrored moving image of the input moving image and the menu image
  • Motion direction determining means for determining the direction of the user's motion in the motion recognition area set in the superimposed moving image
  • the menu image generation means receives the determined user movement direction as an operation instruction for the menu image.
  • a menu operation accepting method for solving the above-mentioned problem is a menu operation accepting method in a multimedia reproducing apparatus for reproducing content specified by a menu operation,
  • a menu image generation step for generating a menu image for accepting an operation relating to content reproduction
  • a computer program according to a third aspect of the present invention for solving the above-described problem is a computer program that causes an information processing device to function as a multimedia playback device that plays back content specified by a menu operation.
  • a menu image generating means for generating a menu image for accepting an operation relating to content reproduction
  • a superimposed image generating means for generating a superimposed moving image of the mirrored moving image of the input moving image and the menu image
  • the information processing apparatus further functions as a motion direction determination unit that determines the direction of the user's motion
  • the menu image generation means receives the determined user movement direction as an operation instruction for the menu image.
  • FIG. 1 is a diagram showing a basic configuration of a multimedia playback system.
  • FIG. 2 is a diagram for explaining an outline of a menu configuration in the present embodiment.
  • FIG. 3 is a block diagram showing a functional configuration of the multimedia playback device.
  • FIG. 4 is a diagram showing recognition areas set on the screen.
  • FIG. 5 is a diagram for explaining a recognition area and a peripheral area.
  • FIG. 6 is a diagram showing a user operation in the recognition area.
  • FIG. 7 is a diagram showing an image of a recognition area at time (t) and an image of each peripheral area at time (t + 1).
  • FIG. 8 is a diagram for explaining another example of motion recognition.
  • FIG. 9 is a flowchart showing motion recognition processing.
  • FIG. 10 is a flowchart illustrating menu operation acceptance processing.
  • FIG. 11 is a diagram for explaining the positions of menus and recognition areas.
  • Video image input section 101
  • FIG. 1 is a diagram showing a basic configuration of a multimedia playback system in an embodiment of the present invention.
  • the multimedia playback system is a composite device capable of playing back or executing various contents via various media. Examples of content include broadcast content, web content, games, movies, music, still images, and moving images.
  • the multimedia playback system 10 is configured around a multimedia playback device 20.
  • the multimedia player 20 is essentially a CPU, memory
  • the following functions can be realized by performing processing according to various computer programs.
  • a television receiver 30 and an operation unit 40 are connected to the multimedia playback device 20.
  • the television receiver 30 includes a display screen 50 and has a function of displaying or outputting video and audio output from the multimedia playback device 20.
  • the operation unit 40 is a device that acquires various instructions related to content reproduction when operated by a user.
  • the operation unit 40 may function as a game controller, or may be realized as a remote controller used for controlling various functions of the multimedia playback device 20.
  • the operation unit 40 is not necessarily provided. That is, the user can give various instructions regarding content reproduction without using the operation unit 40.
  • the multimedia playback device 20 can input electronic information such as content through various media.
  • data such as video and audio of a program is input to the multimedia playback device 20 via the television line 32 as broadcast content.
  • the broadcast content may be recorded by the multimedia playback device 20, and may be output to the television receiver 30 through a decoding process by the multimedia playback device 20.
  • data on the web is input to the multimedia playback device 20 via the Internet line 34 as web content.
  • This web content may be stored in the multimedia playback device 20, or may be used by various functions such as a game function of the multimedia playback device 20.
  • the multimedia playback device 20 has a function of reading data stored on an optical disk 36 such as a DVD or CD, and a function of reading and writing data stored on a removable memory card.
  • the multimedia playback device 20 may read data such as a movie or a music album from the optical disc 36, or may read data such as a shot image or a shot image from the memory card 38.
  • a video camera 45 is connected to the multimedia playback device 20 via a cable 47 such as a USB.
  • the video camera 45 is preferably a television receiver.
  • the user is placed on the device 30 so that the user, particularly the upper body, can be photographed at the position facing the television receiver 30.
  • the multimedia playback device 20 captures a moving image captured by the video camera 45, performs mirror processing (left-right reversal processing), and displays it on the display screen 50 of the television receiver 30 in real time. . That is, the user's operation displayed on the television receiver 30 is in the same state as when the user is looking at the mirror.
  • the multimedia playback device 20 creates a superimposed image by superimposing the mirror motion image captured by the video camera 45 and the computer image generated by the multimedia playback device 20, particularly the menu image. Displayed on the television receiver 30.
  • the user can perform the menu operation while performing the operation while viewing the appearance and the menu image displayed on the display screen 50 of the television receiver 30.
  • a two-dimensional array is displayed.
  • the media icon array 70 includes a photo icon 52, a music icon 54, a video icon 56, a broadcast icon 58, a disc icon 60, and a game icon 62 as marks indicating the types of media that can be played back by the multimedia playback device 20. Is included.
  • the content icon array 72 includes icons such as thumbnails of a plurality of contents that the multimedia playback device 20 can actually execute.
  • a media icon located in a region where the media icon array 70 and the content icon array 72 intersect is enlarged and displayed in a color different from that of other media icons as illustrated as a moving image icon 56.
  • the position of the intersection area 76 is deferred while being located at the approximate center of the display screen 50. And as will be described later, In response to the instruction, the entire array of media icons moves in the horizontal direction, and the color and icon size of the media icon located in the intersection area 76 change.
  • the user can select a medium only by instructing left and right directions.
  • the media icon located in the intersection area 76 is displayed in a display mode different from other media icons, the user can easily select the media.
  • the content icon array 72 is not displayed, and any media icon is fixed in the intersection area 76.
  • the content icon array 72 is expanded and displayed so as to be drawn up and down from the intersection area 76.
  • the user can recognize the content belonging to the media by simply scrolling the media icon to the left and right with the intersection area 76 as the target point, and recognizes and recognizes the content from the expanded display. You can also
  • the attention area 75 located below the intersection area 76 is an area in which an icon of content to be operated by the user is displayed.
  • the attention area 75 constitutes a part of the content icon array 72, and the content icons located in the attention area 75 are enlarged and displayed as the attention thumbnail 64.
  • the video thumbnail 66 which is another content icon, is displayed in a size smaller than the target thumbnail 64. In the vicinity of the target thumbnail 64, for example, on the right side, the title and the recording date are displayed as attributes relating to the video of the target thumbnail 64.
  • each content icon moves in the vertical direction in accordance with the instruction.
  • the movement of the content icons in the vertical direction is realized by scrolling the entire area of the content icon array 72 in the vertical direction.
  • the multimedia playback device 20 displays all the content icons in the same size while quickly moving them up and down, and the vertical movement is stopped and any content icon is positioned in the attention area 75.
  • the size of the notice thumbnail 64 that is the content icon is enlarged.
  • elements such as lightness, saturation, and hue of the target thumbnail 64 may be further changed, or may be blinked.
  • the multimedia playback device 20 hides the image data on the menu screen and starts playback / execution of the selected content.
  • a photo icon 52 is an icon to be selected when an image read into the multimedia playback device 20 is played back.
  • the images to be played back are mainly still images and moving images taken with a digital camera, and are read from, for example, the memory card 38.
  • the content icon displayed when the photo icon 52 is positioned in the intersection area 76 is a thumbnail of a still image or a moving image.
  • shooting information such as the shooting date and the size of the camera is displayed.
  • the music icon 54 is an icon to be selected when music data read into the multimedia playback device 20 is played back.
  • the music data to be reproduced is generated, for example, by encoding data read from the optical disc 36 in a specific compression format.
  • the content icon displayed when the music icon 54 is located in the intersection area 76 may be displayed in units of music or may be displayed in units of albums. As attributes, information such as the titles of music and albums and playback times is displayed.
  • the music data may include video data such as music promotion videos. In that case, the thumbnail of the video may be used as a content icon.
  • the moving image icon 56 is an icon to be selected when the recorded video stored in the multimedia playback device 20 is played back.
  • the recorded video to be played back is a moving image obtained by recording a television program input from the television circuit 32 or a moving image taken by a digital video camera, and is encoded in a specific compression format. In this case, a thumbnail obtained by reducing the frame included in the moving image is used as the content icon. Information such as the recording date and playback time is displayed as attributes.
  • the broadcast icon 58 is an icon to be selected when a television program input from the television line 32 is viewed.
  • the content icon developed for viewing may be a program unit, a broadcast station or a broadcast channel unit.
  • attributes information such as broadcast station name, broadcast channel name, program title, and broadcast time acquired based on EPG (electronic program guide) data is displayed.
  • the disc icon 60 is selected when viewing video or music stored on the optical disc 36. Icon to be selected.
  • DVD is displayed below the media icon.
  • CD is displayed below the media icon.
  • a moving image is stored on a DVD or CD, the thumbnail of the moving image is used as a content icon.
  • a mark indicating music or a mark indicating a music genre is used as a content icon.
  • Information such as video and music titles and playback time is displayed as attributes.
  • the game icon 62 is an icon to be selected when the game program is executed.
  • the execution target is a game program stored in the multimedia playback device 20 or a game program read from the optical disc 36. If the game program contains a game icon as data, the icon is displayed as a content icon. Information such as the title of the game program is displayed as the attribute.
  • the multimedia playback device 20 displays the menu screen including the media arrangement and the content arrangement on the display screen 50.
  • icons of different contents of different media are displayed one after another by scrolling up, down, left, and right in one row or one column. Therefore, the user can feel as if many contents are arranged in a matrix over the entire screen.
  • the user can select the content as if the user wants to focus on the desired content while freely moving the matrix in which a large number of content is arranged. However, since the actual number of icons displayed on the screen is small, it does not give a complicated impression to the user.
  • the user can select content one after another by simply pointing up, down, left, and right by the operations described later, and can perform so-called zabbing operations with simple and comfortable operations.
  • the multimedia playback device 20 includes a video image input unit 101 that inputs a moving image from the video camera 45, and a mirrored moving image that performs left-right reversal of the input moving image.
  • An image inversion unit 102 that generates an image
  • a main control unit 103 that controls various processes in the multimedia playback device 20
  • a menu image generation unit that generates a menu image to be displayed on the display screen 50 of the television receiver 30.
  • a superimposed image generation unit 105 that generates a superimposed image of the mirrored moving image and the menu image
  • a content processing unit 106 that performs reproduction / execution processing of the content specified by the menu operation
  • a superimposed image or content A display control unit 107 that performs display control and a content DB 108 that stores content are provided.
  • the main control unit 103 includes a face position recognition unit 103a, a recognition region setting unit 103b for setting a recognition region to be described later, and an operation determination unit 103c for determining a user operation included in the moving image. ing.
  • the face position recognition unit 103a determines whether or not the moving image captured by the video camera 45 and mirror-processed includes the user's face. Performs the process of recognizing the position.
  • the face position recognition unit 103a only needs to be able to determine in which position of the moving image the face shape is included, and does not need to recognize each user. In other words, it is sufficient to detect that the user's face is reflected in a certain part of the image.
  • conventional pattern recognition techniques such as boosting and support vector machines can be used.
  • the recognition area set by the recognition area setting unit 103b will be described.
  • the recognition area is an area 80 set on the screen 50 by the multimedia playback device 20, and is set for recognizing a user's action, particularly a hand action, in the area.
  • a plurality of recognition areas 80 can be set in various sizes according to the purpose, and are not displayed here.
  • the setting is made in accordance with the menu image.
  • an image of the recognition area 80 at a certain time (t) ((t) X in FIG. 5) and each peripheral area at a time (t + 1) after a predetermined time has elapsed.
  • T + 1) A to (t + 1) H) in Fig. 5 and the recognition area image at time (t + 1). Then, an image of the most similar peripheral area or recognition area is determined, and it is recognized that the user has moved in the direction of the peripheral area.
  • FIG. 5 an image of the recognition area at time (t) and an image of each peripheral area at time (t + 1) are as shown in FIG. This figure corresponds to FIG. 5, and the image of the recognition area at time (t) ((t) X)) and the image of each peripheral area at time (t + 1) ((t + 1) A ⁇
  • the multimedia playback device 20 can recognize that the user's operation has been performed in the upper right direction.
  • This recognition processing is performed in the operation determination unit 103c of the main control unit 103.
  • the main control unit 103 can continuously recognize user actions in the recognition area. It is also possible to detect the moving speed. Furthermore, by recording an action history, it is possible to distinguish between a one-way action and an action whose direction is frequently reversed (for example, a state of waving).
  • a method for determining similar peripheral region images includes, for example, each pixel in the recognition region at time (t) and the peripheral region for each peripheral region.
  • the absolute values of the differences in RGB values from the pixels at the corresponding positions are integrated, and the peripheral area with the smallest value can be set as a similar peripheral area.
  • the present invention is not limited to this, and various conventionally proposed techniques can be used.
  • the image of the recognition area does not change, that is, if the image of the recognition area at time (t + 1) is most similar to the image of the recognition area at time ⁇ , the user's action Is treated as not detected.
  • a user action is detected for each recognition area.
  • FIG. 8 a case as shown in FIG. 8 may occur. That is, for example, as shown in FIG. 8 (a), the user's hand that was outside the recognition area at time (t) becomes the recognition area at time (t + 1) as shown in 8 (b). It is the case of entering the left end of
  • the motion recognition of the present embodiment is essentially for recognizing the moving direction based on the similarity of the position of the user's hand.
  • the similarity of the surrounding area in the upper, lower, and left directions that include the user's hand at time (t + 1) is shown.
  • the similarity of the surrounding area on the right side that does not include the user's hand increases, and the movement in the right direction is recognized. Since the user's hand moves in the right direction, this recognition is consistent with the case where the user's hand is included in the recognition area at time ( t ), and is considered to be appropriate as a result. It is done.
  • FIG. 9 is a flowchart showing the above operation recognition process.
  • the recognition area setting unit 103b of the main control unit 103 sets one or more recognition areas according to a predetermined rule (S)
  • the predetermined rule will be described later.
  • the user's direction of motion is determined (S106). This direction of movement is at that moment. Although this movement direction may be adopted as it is, it is recorded here as a history (S107), and the user's movement is determined based on the tendency of the movement direction (S108). This is to prevent minor movements from being determined as user actions.
  • the user's motion is determined according to a predetermined motion determination rule.
  • the operation determination rule can be determined, for example, by referring to an operation history as having the following operation. In other words, if movement in the same direction continues for a predetermined time, it is determined that movement has occurred in that direction.If movement in which the direction is frequently reversed in the same recognition area continues, It is determined that there has been a motion of shaking hands.If there is a sudden movement from the same direction to the opposite direction, it is determined that there has been a reversal operation. It can be determined that there was no error.
  • the main control unit 103 repeats the above processing until the region recognition ends (S109).
  • next moving direction may be predicted with reference to the history, and the similarity weight in the direction may be increased. By doing so, it is possible to reduce the influence of the motion fluctuation of the user on the motion determination. Also, check the operation speed and determine the speed of the operation.
  • FIG. 10 is a flowchart for explaining the processing of the multimedia playback device 20 at this time.
  • the menu operation in the present embodiment starts when the moving image captured by the video camera 45 and mirror-processed includes the user's face (S201). In other words, recognizing the user's face is used as a switch. As a result, if the user is in front of the television receiver 30, the menu processing is not performed, and the reception of inadvertent menu operations due to movement of the background or the like is prevented. I have to.
  • the position of the menu specifically, the media icon array 70 in the horizontal direction and the content icon array 72 in the vertical direction are set to positions as shown in FIG. That is, based on the determined position 90 of the user's face, the horizontal media icon array 70 is positioned below the face, and the vertical content icon array 72 is positioned on the right side of the face toward the screen.
  • the user can easily perform menu operations by the action of the right hand.
  • the content icon array 72 may be positioned on the left side of the face when the user performs a menu operation by the action of the left hand.
  • the horizontal media icon array 70 can be operated by left and right hand movements.
  • the recognition area 80 is set in correspondence with the area of the media icon column 70 in the horizontal direction and the content icon column 72 in the vertical direction (S203).
  • a plurality of recognition areas are set for each icon array. This is because the operation can be recognized accurately even when a new user's hand enters the recognition area, as explained in FIG.
  • a recognition area 80 corresponding to the attention area 75 may be set so that a specific action for the attention area 75, for example, a decision operation for a reproduction instruction, can be recognized.
  • each recognition area 80 eight peripheral areas that are diagonally up, down, left, and right are set.
  • the multimedia playback device 20 regards this as an instruction in the vertical direction.
  • content Priority is given to scrolling the icon array 72.
  • the user's action is determined in each recognition area 80, and it is determined whether or not a left / right instruction, an up / down instruction, and a determination instruction are accepted in the left or right area (S204).
  • the decision instruction S can be assigned to the decision instruction when the user shakes his / her hand on the recognition area 80. That is, when a hand is waved on the recognition area 80, it is determined that the content is indicated as the content icon corresponding to the recognition area 80. Instead of waving, you can assign the decision to move your hand to the right or left.
  • the user can perform the menu operation by his / her own operation displayed on the television receiver 30, so that visual and intuitive operability is achieved. Can be obtained. Therefore, the user's operability in multimedia playback is further enhanced.
  • the menu format is a combination of a vertical icon arrangement and a horizontal icon arrangement.
  • a circular shape is displayed and a rotation method is displayed. It is also possible to accept an instruction imitating a so-called jog dial by recognizing the movement in the direction.

Abstract

A multimedia reproducing apparatus for reproducing a content designated by a menu operation. The multimedia reproducing apparatus comprises a moving image entering means that enters a moving image of the user; a menu image generating means that generates a menu image for accepting an operation related to a content reproduction; a superimposed image generating means that generates a superimposed moving image obtained by superimposing a mirror moving image of the entered moving image on the menu image; and a movement direction determining means that determines the direction of a user's movement in a movement recognition area established in the superimposed moving image. The menu image generating means accepts, as an operational instruction of the menu image, the determined direction of the user's movement.

Description

明 細 書  Specification
マルチメディア再生装置、メニュー操作受付方法およびコンピュータプロ グラム  Multimedia playback device, menu operation reception method, and computer program
技術分野  Technical field
[0001] 本発明は、ビデオカメラで撮影した画像からユーザの動作を認識してメニュー操作 を受け付ける情報処理システムに関する。  [0001] The present invention relates to an information processing system that recognizes a user's action from an image taken by a video camera and receives a menu operation.
背景技術  Background art
[0002] 特許文献 1には、再生できるメディアの種類を示した複数のメディアアイコンからな るメディアアイコン配列と、再生できるコンテンツの項目を示した複数のコンテンツアイ コンからなるコンテンツアイコン配列 72とを、表示画面の中央付近にぉレ、て交差させ る形で表示することにより、マルチメディア再生におけるユーザの利便性を高めること が開示されている。  [0002] Patent Document 1 includes a media icon array including a plurality of media icons indicating types of media that can be played back, and a content icon array 72 including a plurality of content icons indicating content items that can be played back. In addition, it is disclosed that the convenience of the user in multimedia playback is improved by displaying the display screen so as to cross the center of the display screen.
[0003] 特許文献 1 :特開 2004— 356774号公報  [0003] Patent Document 1: Japanese Unexamined Patent Application Publication No. 2004-356774
発明の開示  Disclosure of the invention
発明が解決しょうとする課題  Problems to be solved by the invention
[0004] 特許文献 1に開示されている入力インタフェースは、上下方向の指示と左右方向の 指示により、所望のマルチメディアコンテンツを選択し、再生、実行することができるた め万人にわかりやすい操作性を有している。このため、特に、ユーザの年齢層が幅 広いマルチメディア再生システムの分野での応用が期待される。  [0004] The input interface disclosed in Patent Document 1 is capable of selecting, playing, and executing desired multimedia content according to an up / down direction and a left / right direction, so that it is easy to understand for everyone. have. For this reason, application in the field of multimedia playback systems with a wide range of users is expected.
[0005] 一方、マルチメディア再生システムの分野での応用には、さらに、視覚的で直感的 な操作性も要求される。  [0005] On the other hand, visual and intuitive operability is also required for applications in the field of multimedia playback systems.
[0006] 本発明は、マルチメディア再生におけるユーザの操作性をさらに高めることを目的 とする。  [0006] An object of the present invention is to further improve the user operability in multimedia playback.
課題を解決するための手段  Means for solving the problem
[0007] 上記課題を解決するための本発明の第 1の態様であるマルチメディア再生装置は メニュー操作により指定されたコンテンツを再生するマルチメディア再生装置であつ て、 [0007] A multimedia playback device according to a first aspect of the present invention for solving the above-described problem is a multimedia playback device that plays back content specified by a menu operation. And
ユーザの動画像を入力する動画像入力手段と、  Moving image input means for inputting a user's moving image;
コンテンツ再生に関する操作を受け付けるメニュー画像を生成するメニュー画像生 成手段と、  A menu image generating means for generating a menu image for accepting an operation relating to content reproduction;
前記入力した動画像の鏡面動画像と前記メニュー画像との重畳動画像を生成する 重畳画像生成手段と、  A superimposed image generating means for generating a superimposed moving image of the mirrored moving image of the input moving image and the menu image;
前記重畳動画像内に設定された動作認識領域において、ユーザの動作の方向を 判定する動作方向判定手段とを備え、  Motion direction determining means for determining the direction of the user's motion in the motion recognition area set in the superimposed moving image,
前記メニュー画像生成手段は、前記判定されたユーザの動作方向を、前記メニュ 一画像の操作指示として受け付けることを特徴とする。  The menu image generation means receives the determined user movement direction as an operation instruction for the menu image.
[0008] ユーザは重畳動画像に含まれる自身の動作により、メニュー操作を行なうことができ るため、視覚的で直感的な操作性を得ることができる。したがって、マルチメディア再 生におけるユーザの操作性がさらに高められることになる。  [0008] Since the user can perform the menu operation by his / her own operation included in the superimposed moving image, it is possible to obtain visual and intuitive operability. Therefore, the user operability in multimedia playback is further enhanced.
[0009] 上記課題を解決するための本発明の第 2の態様であるメニュー操作受付方法は、 メニュー操作により指定されたコンテンツを再生するマルチメディア再生装置におけ るメニュー操作受付方法であって、  [0009] A menu operation accepting method according to a second aspect of the present invention for solving the above-mentioned problem is a menu operation accepting method in a multimedia reproducing apparatus for reproducing content specified by a menu operation,
ユーザの動画像を撮像する撮像ステップと、  An imaging step for capturing a moving image of the user;
コンテンツ再生に関する操作を受け付けるメニュー画像を生成するメニュー画像生 成ステップと、  A menu image generation step for generating a menu image for accepting an operation relating to content reproduction;
前記ユーザの動画像の鏡面動画像と前記メニュー画像との重畳動画像を生成する 重畳画像生成ステップと、  Generating a superimposed moving image of the mirror moving image of the user's moving image and the menu image;
前記重畳動画像内に設定された動作認識領域において、ユーザの動作の方向を 判定する動作方向判定ステップと、  A motion direction determination step of determining a direction of the user's motion in the motion recognition area set in the superimposed moving image;
前記判定されたユーザの動作方向を、前記メニュー画像の操作指示として受け付 ける操作指示受付ステップとを有することを特徴とする。  And an operation instruction receiving step of receiving the determined operation direction of the user as an operation instruction of the menu image.
[0010] 上記課題を解決するための本発明の第 3の態様であるコンピュータプログラムは、 情報処理装置をメニュー操作により指定されたコンテンツを再生するマルチメディア 再生装置として機能させるコンピュータプログラムであって、 ユーザの動画像を入力する動画像入力手段と、 [0010] A computer program according to a third aspect of the present invention for solving the above-described problem is a computer program that causes an information processing device to function as a multimedia playback device that plays back content specified by a menu operation. Moving image input means for inputting a user's moving image;
コンテンツ再生に関する操作を受け付けるメニュー画像を生成するメニュー画像生 成手段と、  A menu image generating means for generating a menu image for accepting an operation relating to content reproduction;
前記入力した動画像の鏡面動画像と前記メニュー画像との重畳動画像を生成する 重畳画像生成手段と、  A superimposed image generating means for generating a superimposed moving image of the mirrored moving image of the input moving image and the menu image;
前記重畳動画像内に設定された動作認識領域において、ユーザの動作の方向を 判定する動作方向判定手段として情報処理装置をさらに機能させ、  In the motion recognition area set in the superimposed moving image, the information processing apparatus further functions as a motion direction determination unit that determines the direction of the user's motion,
前記メニュー画像生成手段は、前記判定されたユーザの動作方向を、前記メニュ 一画像の操作指示として受け付けることを特徴とする。  The menu image generation means receives the determined user movement direction as an operation instruction for the menu image.
図面の簡単な説明  Brief Description of Drawings
[0011] [図 1]マルチメディア再生システムの基本的な構成を示す図である。  FIG. 1 is a diagram showing a basic configuration of a multimedia playback system.
[図 2]本実施形態でメニューの構成の概略について説明する図である。  FIG. 2 is a diagram for explaining an outline of a menu configuration in the present embodiment.
[図 3]マルチメディア再生装置の機能構成を示すブロック図である。  FIG. 3 is a block diagram showing a functional configuration of the multimedia playback device.
[図 4]画面に設定される認識領域を示す図である。  FIG. 4 is a diagram showing recognition areas set on the screen.
[図 5]認識領域と周辺領域を説明する図である。  FIG. 5 is a diagram for explaining a recognition area and a peripheral area.
[図 6]認識領域内におけるユーザの動作を示す図である。  FIG. 6 is a diagram showing a user operation in the recognition area.
[図 7]時刻(t)における認識領域の画像と、時刻(t+ 1)における各周辺領域の画像 を示す図である。  FIG. 7 is a diagram showing an image of a recognition area at time (t) and an image of each peripheral area at time (t + 1).
[図 8]動作認識の別例を説明するための図である。  FIG. 8 is a diagram for explaining another example of motion recognition.
[図 9]動作認識処理を示すフロー図である。  FIG. 9 is a flowchart showing motion recognition processing.
[図 10]メニュー操作受付処理を説明するフロー図である。  FIG. 10 is a flowchart illustrating menu operation acceptance processing.
[図 11]メニューおよび認識領域の位置を説明する図である。  FIG. 11 is a diagram for explaining the positions of menus and recognition areas.
符号の説明  Explanation of symbols
[0012] 10…マルチメディア再生システム [0012] 10 ... Multimedia playback system
20· · ·マルチメディア再生装置  20 ··· Multimedia playback device
30…テレビジョン受像機  30 ... Television receiver
32…テレビジョン回線  32 ... TV line
34…インターネット回線 36…光ディスク 34… Internet access 36 ... Optical disc
38…メモリカード  38 ... Memory card
40…操作部  40 ... Operation part
45…ビデオカメラ  45 ... Video camera
47…ケーブル  47 ... Cable
50…表示画面  50 ... Display screen
70…メディアアイコン酉己歹 IJ  70… Media Icon IJI IJ
72…コンテンツアイコン配列  72… Content icon array
80· · ·認識領域  80
101…ビデオ画像入力部  101 ... Video image input section
102…画像反転部  102: Image inversion part
103…主制御部  103 ... Main control unit
103a…顔位置認識部  103a: Face position recognition unit
103b…認識領域設定部  103b ... Recognition area setting section
103c…動作判定部  103c: Motion determination unit
104…メニュー画像生成部  104 ... Menu image generator
105…重畳画像生成部  105 ... Superimposed image generator
106…コンテンツ処理部  106 ... Content processing section
107…表示制御部  107: Display control unit
発明を実施するための最良の形態  BEST MODE FOR CARRYING OUT THE INVENTION
[0013] 以下、本発明の形態について、図面を用いて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0014] 図 1は、本発明の実施の形態におけるマルチメディア再生システムの基本的な構成 を示す図である。ここで、マルチメディア再生システムは、各種メディアを介した様々 なコンテンツを再生または実行できる複合機器である。コンテンツとしては、例えば、 放送コンテンツ、ウェブコンテンツ、ゲーム、映画、音楽、静止画像、動画等が挙げら れる。  FIG. 1 is a diagram showing a basic configuration of a multimedia playback system in an embodiment of the present invention. Here, the multimedia playback system is a composite device capable of playing back or executing various contents via various media. Examples of content include broadcast content, web content, games, movies, music, still images, and moving images.
[0015] 本図に示すように、マルチメディア再生システム 10は、マルチメディア再生装置 20 を中心として構成される。マルチメディア再生装置 20は、本質的には、 CPU,メモリ 等を備える情報処理装置であり、各種コンピュータプログラムにしたがって処理を行 なうことで、以下に示すような種々の機能を実現することができる。 As shown in the figure, the multimedia playback system 10 is configured around a multimedia playback device 20. The multimedia player 20 is essentially a CPU, memory The following functions can be realized by performing processing according to various computer programs.
[0016] マルチメディア再生装置 20には、例えば、テレビジョン受像機 30と操作部 40とが接 続される。テレビジョン受像機 30は、表示画面 50を備え、マルチメディア再生装置 2 0から出力される映像や音声を表示または出力する機能を有している。操作部 40は 、ユーザによって操作されることによりコンテンツ再生に関する各種の指示を取得す る装置である。この操作部 40は、ゲーム用のコントローラとして機能させてもよいし、 マルチメディア再生装置 20がもつ各種機能の制御に用いられるリモートコントローラ として実現してもよい。ただし、本実施形態では、操作部 40は、必ずしも備える必要 はない。すなわち、ユーザは、操作部 40を用いることなぐコンテンツ再生に関する各 種指示を行なうことができる。  [0016] For example, a television receiver 30 and an operation unit 40 are connected to the multimedia playback device 20. The television receiver 30 includes a display screen 50 and has a function of displaying or outputting video and audio output from the multimedia playback device 20. The operation unit 40 is a device that acquires various instructions related to content reproduction when operated by a user. The operation unit 40 may function as a game controller, or may be realized as a remote controller used for controlling various functions of the multimedia playback device 20. However, in the present embodiment, the operation unit 40 is not necessarily provided. That is, the user can give various instructions regarding content reproduction without using the operation unit 40.
[0017] マルチメディア再生装置 20は、各種メディアを通じてコンテンツ等の電子情報を入 力すること力 Sできる。  The multimedia playback device 20 can input electronic information such as content through various media.
[0018] 例えば、放送コンテンツとして、テレビジョン回線 32を介して番組の映像や音声など のデータがマルチメディア再生装置 20に入力される。放送コンテンツは、マルチメデ ィァ再生装置 20により録画されてもょレ、し、マルチメディア再生装置 20による復号処 理などを経てテレビジョン受像機 30へ出力されてもよい。  [0018] For example, data such as video and audio of a program is input to the multimedia playback device 20 via the television line 32 as broadcast content. The broadcast content may be recorded by the multimedia playback device 20, and may be output to the television receiver 30 through a decoding process by the multimedia playback device 20.
[0019] また、ウェブコンテンツとして、インターネット回線 34を介してウェブ上のデータがマ ルチメディア再生装置 20に入力される。このウェブコンテンツは、マルチメディア再生 装置 20に保存されてもよいし、マルチメディア再生装置 20がもつゲーム機能などの 各種機能により利用されてもよい。  In addition, data on the web is input to the multimedia playback device 20 via the Internet line 34 as web content. This web content may be stored in the multimedia playback device 20, or may be used by various functions such as a game function of the multimedia playback device 20.
[0020] マルチメディア再生装置 20は、 DVDや CDなどの光ディスク 36に格納されたデー タの読取機能と、着脱可能なメモリカードに格納されたデータの読取機能および書込 機能とを有する。マルチメディア再生装置 20は、光ディスク 36からは映画や音楽ァ ルバムなどのデータを読み込んでもよいし、メモリカード 38からは撮影画像や撮影映 像などのデータを読み込んでもよい。  [0020] The multimedia playback device 20 has a function of reading data stored on an optical disk 36 such as a DVD or CD, and a function of reading and writing data stored on a removable memory card. The multimedia playback device 20 may read data such as a movie or a music album from the optical disc 36, or may read data such as a shot image or a shot image from the memory card 38.
[0021] 本実施形態においてマルチメディア再生装置 20には、 USB等のケーブル 47を介 して、ビデオカメラ 45が接続される。ビデオカメラ 45は、好ましくは、テレビジョン受像 機 30の上に置くようにし、テレビジョン受像機 30に向き合った位置にいるユーザの姿 、特に上半身を撮影できるようにする。 In the present embodiment, a video camera 45 is connected to the multimedia playback device 20 via a cable 47 such as a USB. The video camera 45 is preferably a television receiver. The user is placed on the device 30 so that the user, particularly the upper body, can be photographed at the position facing the television receiver 30.
[0022] マルチメディア再生装置 20は、ビデオカメラ 45が撮影した動画像を取り込んで、鏡 面処理 (左右反転処理)を行なった上でテレビジョン受像機 30の表示画面 50にリア ルタイムに表示させる。すなわち、テレビジョン受像機 30に映し出されるユーザの動 作等は、ユーザが鏡を見ているのと同じ状態となる。  [0022] The multimedia playback device 20 captures a moving image captured by the video camera 45, performs mirror processing (left-right reversal processing), and displays it on the display screen 50 of the television receiver 30 in real time. . That is, the user's operation displayed on the television receiver 30 is in the same state as when the user is looking at the mirror.
[0023] また、マルチメディア再生装置 20は、ビデオカメラ 45が取り込んだ鏡面動画像と、 マルチメディア再生装置 20が生成したコンピュータ画像、特に、メニュー画像とを重 ね合わせた重畳画像を作成してテレビジョン受像機 30に表示させる。これにより、ュ 一ザが、テレビジョン受像機 30の表示画面 50に表示された自身の姿とメニュー画像 とを見ながら動作を行なレ、、メニュー操作ができるようになつている。  [0023] Further, the multimedia playback device 20 creates a superimposed image by superimposing the mirror motion image captured by the video camera 45 and the computer image generated by the multimedia playback device 20, particularly the menu image. Displayed on the television receiver 30. As a result, the user can perform the menu operation while performing the operation while viewing the appearance and the menu image displayed on the display screen 50 of the television receiver 30.
[0024] ここで、本実施形態で用いるメニュー形式の概略について図 2を参照して説明する 。なお、このメニュー構成については、上述の特許文献 1 (特開 2004— 356774号 公報)に詳しく説明されているため、詳細には特許文献 1を参照されたい。  Here, an outline of the menu format used in the present embodiment will be described with reference to FIG. Since this menu configuration is described in detail in the above-mentioned Patent Document 1 (Japanese Patent Laid-Open No. 2004-356774), refer to Patent Document 1 for details.
[0025] ただし、本発明は、以下に説明するメニュー形式のみならず、種々の形式のメニュ 一操作に適用することができる。  However, the present invention can be applied not only to the menu format described below, but also to various types of menu operations.
[0026] 本図に示すように、表示画面 50において、水平方向に複数のメディアアイコンが並 んだメディアアイコン配列 70と、垂直方向に複数のコンテンツアイコンが並んだコンテ ンッアイコン配列 72とが交差する二次元配列が表示される。  [0026] As shown in the figure, on the display screen 50, a media icon array 70 in which a plurality of media icons are arranged in the horizontal direction intersects with a content icon array 72 in which a plurality of content icons are arranged in the vertical direction. A two-dimensional array is displayed.
[0027] メディアアイコン配列 70には、マルチメディア再生装置 20が再生可能なメディアの 種類を示すマークとして、写真アイコン 52、音楽アイコン 54、動画アイコン 56、放送 アイコン 58、ディスクアイコン 60、ゲームアイコン 62が含まれる。  [0027] The media icon array 70 includes a photo icon 52, a music icon 54, a video icon 56, a broadcast icon 58, a disc icon 60, and a game icon 62 as marks indicating the types of media that can be played back by the multimedia playback device 20. Is included.
[0028] コンテンツアイコン配列 72には、マルチメディア再生装置 20が実際に再生'実行可 能な複数のコンテンツのサムネイルなどのアイコンが含まれる。  [0028] The content icon array 72 includes icons such as thumbnails of a plurality of contents that the multimedia playback device 20 can actually execute.
[0029] メディアアイコン配列 70とコンテンツアイコン配列 72が交差する領域に位置するメ ディアアイコンは、動画アイコン 56として図示するように他のメディアアイコンと異なる 色彩にて拡大表示される。交差領域 76は、表示画面 50の略中央に位置したままそ の位置が据え置かれる。そして、後述するようにユーザの動作に基づく左右方向の 指示に応じてメディアアイコンの配列全体が左右方向に移動し、交差領域 76に位置 したメディアアイコンの色彩とアイコンサイズが変化する。 A media icon located in a region where the media icon array 70 and the content icon array 72 intersect is enlarged and displayed in a color different from that of other media icons as illustrated as a moving image icon 56. The position of the intersection area 76 is deferred while being located at the approximate center of the display screen 50. And as will be described later, In response to the instruction, the entire array of media icons moves in the horizontal direction, and the color and icon size of the media icon located in the intersection area 76 change.
[0030] したがって、ユーザは左右の方向を指示をするだけでメディアを選択することができ る。また、交差領域 76に位置するメディアアイコンをその他のメディアアイコンと異な る表示態様で表示するため、ユーザは容易にメディアを選択することができる。 [0030] Therefore, the user can select a medium only by instructing left and right directions. In addition, since the media icon located in the intersection area 76 is displayed in a display mode different from other media icons, the user can easily select the media.
[0031] メディアアイコンが左右方向へ移動中であって交差領域 76にいずれのメディアアイ コンも位置していないときにはコンテンツアイコン配列 72は表示させず、いずれかの メディアアイコンが交差領域 76で位置確定したときに、コンテンツアイコン配列 72が 交差領域 76から上下方向に繰り出すように展開表示される。 [0031] When the media icon is moving in the left-right direction and no media icon is positioned in the intersection area 76, the content icon array 72 is not displayed, and any media icon is fixed in the intersection area 76. When this is done, the content icon array 72 is expanded and displayed so as to be drawn up and down from the intersection area 76.
[0032] ユーザは、交差領域 76を目標地点にしてメディアアイコンを左右にスクロール操作 するだけでそのメディアに属するコンテンツを認識することができ、また展開表示され るコンテンツ力、らメディアを認、識することもできる。 [0032] The user can recognize the content belonging to the media by simply scrolling the media icon to the left and right with the intersection area 76 as the target point, and recognizes and recognizes the content from the expanded display. You can also
[0033] 交差領域 76の下部に位置する注目領域 75は、ユーザによる操作の対象となるコン テンッのアイコンが表示される領域である。注目領域 75はコンテンツアイコン配列 72 の一部を構成するとともに、注目領域 75内に位置するコンテンツアイコンは、注目サ ムネイル 64として拡大表示される。その他のコンテンツアイコンである映像サムネイル 66は、注目サムネイル 64より小さいサイズで表示される。注目サムネイル 64の近傍 位置、例えば、右方には注目サムネイル 64の映像に関する属性として、タイトルと録 画日とが表示される。  [0033] The attention area 75 located below the intersection area 76 is an area in which an icon of content to be operated by the user is displayed. The attention area 75 constitutes a part of the content icon array 72, and the content icons located in the attention area 75 are enlarged and displayed as the attention thumbnail 64. The video thumbnail 66, which is another content icon, is displayed in a size smaller than the target thumbnail 64. In the vicinity of the target thumbnail 64, for example, on the right side, the title and the recording date are displayed as attributes relating to the video of the target thumbnail 64.
[0034] ユーザが上下方向の指示を行なう間は、その指示に応じて各コンテンツアイコンが 上下方向に移動する。コンテンツアイコンの上下方向の移動は、コンテンツアイコン 配列 72の領域全体を上下方向にスクロールさせることにより実現される。  [0034] While the user gives an instruction in the vertical direction, each content icon moves in the vertical direction in accordance with the instruction. The movement of the content icons in the vertical direction is realized by scrolling the entire area of the content icon array 72 in the vertical direction.
[0035] マルチメディア再生装置 20は、各コンテンツアイコンを上下に素早く移動させる間 はこれらをすベて同サイズで表示し、上下の移動が停止されていずれかのコンテンツ アイコンが注目領域 75で位置確定すると、そのコンテンツアイコンである注目サムネ ィル 64のサイズを拡大させる。このとき、注目サムネイル 64の明度、彩度、色相など の要素をさらに変化させてもよいし、点滅表示してもよい。  [0035] The multimedia playback device 20 displays all the content icons in the same size while quickly moving them up and down, and the vertical movement is stopped and any content icon is positioned in the attention area 75. When confirmed, the size of the notice thumbnail 64 that is the content icon is enlarged. At this time, elements such as lightness, saturation, and hue of the target thumbnail 64 may be further changed, or may be blinked.
[0036] この状態で注目サムネイル 64として示されたコンテンツの再生決定指示を、後述す る動作によりユーザから取得すると、マルチメディア再生装置 20は、メニュー画面の 画像データを非表示にし、選択されたコンテンツの再生 ·実行を開始する。 In this state, an instruction to determine the reproduction of the content indicated as the target thumbnail 64 will be described later. The multimedia playback device 20 hides the image data on the menu screen and starts playback / execution of the selected content.
[0037] 図 2において、写真アイコン 52は、マルチメディア再生装置 20に読み込まれた画像 を再生する場合に選択されるべきアイコンである。再生の対象となる画像は、主にデ ジタルカメラで撮影された静止画および動画であり、例えばメモリカード 38から読み 込まれる。写真アイコン 52が交差領域 76に位置したときに展開表示されるコンテンツ アイコンは、静止画または動画のサムネイルである。属性としては、撮影日ゃフアイノレ サイズなどの撮影情報が表示される。  In FIG. 2, a photo icon 52 is an icon to be selected when an image read into the multimedia playback device 20 is played back. The images to be played back are mainly still images and moving images taken with a digital camera, and are read from, for example, the memory card 38. The content icon displayed when the photo icon 52 is positioned in the intersection area 76 is a thumbnail of a still image or a moving image. As attributes, shooting information such as the shooting date and the size of the camera is displayed.
[0038] 音楽アイコン 54は、マルチメディア再生装置 20に読み込まれた音楽データを再生 する場合に選択されるべきアイコンである。再生の対象となる音楽データは、例えば 光ディスク 36から読み込まれたデータが特定の圧縮形式で符号化されて生成される 。音楽アイコン 54が交差領域 76に位置したときに展開表示されるコンテンツアイコン は、楽曲単位で表示されてもよいし、アルバム単位で表示されてもよレヽ。属性としては 、楽曲やアルバムのタイトル、再生時間などの情報が表示される。音楽データは楽曲 のプロモーションビデオなどの動画データを含んでもよぐその場合、その動画のサ ムネイルをコンテンツアイコンとしてもよレ、。  [0038] The music icon 54 is an icon to be selected when music data read into the multimedia playback device 20 is played back. The music data to be reproduced is generated, for example, by encoding data read from the optical disc 36 in a specific compression format. The content icon displayed when the music icon 54 is located in the intersection area 76 may be displayed in units of music or may be displayed in units of albums. As attributes, information such as the titles of music and albums and playback times is displayed. The music data may include video data such as music promotion videos. In that case, the thumbnail of the video may be used as a content icon.
[0039] 動画アイコン 56は、マルチメディア再生装置 20に格納された録画映像を再生する 場合に選択されるべきアイコンである。再生の対象となる録画映像は、テレビジョン回 線 32から入力されたテレビ番組を録画した動画像や、デジタルビデオカメラで撮影さ れた動画像であり、特定の圧縮形式で符号化される。この場合、動画像に含まれるフ レームを縮小したサムネイルをコンテンツアイコンとする。属性としては、記録日や再 生時間などの情報が表示される。  [0039] The moving image icon 56 is an icon to be selected when the recorded video stored in the multimedia playback device 20 is played back. The recorded video to be played back is a moving image obtained by recording a television program input from the television circuit 32 or a moving image taken by a digital video camera, and is encoded in a specific compression format. In this case, a thumbnail obtained by reducing the frame included in the moving image is used as the content icon. Information such as the recording date and playback time is displayed as attributes.
[0040] 放送アイコン 58は、テレビジョン回線 32から入力されるテレビ番組を視聴する場合 に選択されるべきアイコンである。視聴の対象として展開されるコンテンツアイコンは、 番組単位であってもよいし、放送局や放送チャンネル単位であってもよレ、。属性とし ては、 EPG (電子番組案内)のデータに基づいて取得される放送局名、放送チャン ネル名、番組タイトル、放送時間などの情報が表示される。  [0040] The broadcast icon 58 is an icon to be selected when a television program input from the television line 32 is viewed. The content icon developed for viewing may be a program unit, a broadcast station or a broadcast channel unit. As attributes, information such as broadcast station name, broadcast channel name, program title, and broadcast time acquired based on EPG (electronic program guide) data is displayed.
[0041] ディスクアイコン 60は、光ディスク 36に格納された映像や音楽を視聴する場合に選 択されるべきアイコンである。光ディスク 36として DVDが認識されたときは「DVD」の 文字をメディアアイコンの下方に表示し、 CDが認識されたときは「CD」の文字をメデ ィァアイコンの下方に表示する。 DVDまたは CDに動画像が格納されているときは、 その動画像のサムネイルをコンテンツアイコンとする。 DVDまたは CDに音楽が格納 されているときは、音楽を示すマークゃ曲番または曲ジャンルを示すマークなどをコ ンテンツァイコンとする。属性としては、映像や音楽のタイトル、再生時間などの情報 が表示される。 [0041] The disc icon 60 is selected when viewing video or music stored on the optical disc 36. Icon to be selected. When a DVD is recognized as the optical disc 36, “DVD” is displayed below the media icon. When a CD is recognized, “CD” is displayed below the media icon. When a moving image is stored on a DVD or CD, the thumbnail of the moving image is used as a content icon. When music is stored on a DVD or CD, a mark indicating music or a mark indicating a music genre is used as a content icon. Information such as video and music titles and playback time is displayed as attributes.
[0042] ゲームアイコン 62は、ゲームプログラムを実行する場合に選択されるべきアイコンで ある。実行の対象は、マルチメディア再生装置 20に格納されたゲームプログラムまた は光ディスク 36から読み込まれたゲームプログラムである。ゲームプログラムがゲー ムのアイコンをデータとして含んでいる場合は、そのアイコンをコンテンツアイコンとし て表示する。属性としては、ゲームプログラムのタイトルなどの情報が表示される。  [0042] The game icon 62 is an icon to be selected when the game program is executed. The execution target is a game program stored in the multimedia playback device 20 or a game program read from the optical disc 36. If the game program contains a game icon as data, the icon is displayed as a content icon. Information such as the title of the game program is displayed as the attribute.
[0043] 以上のように、マルチメディア再生装置 20は表示画面 50にメディアの配列とコンテ ンッの配列からなるメニュー画面を表示する。実際に表示されるメディアアイコン配列 70とコンテンツアイコン配列 72はそれぞれ 1行または 1列である力 上下左右のスク ロールにより次々に異なるメディアの異なるコンテンツのアイコンが表示される。した がって、あた力も画面全面にわたって多数のコンテンツがマトリクス状に並べられてい るかのような感覚をユーザに与えることができる。 [0043] As described above, the multimedia playback device 20 displays the menu screen including the media arrangement and the content arrangement on the display screen 50. In the media icon array 70 and the content icon array 72 that are actually displayed, icons of different contents of different media are displayed one after another by scrolling up, down, left, and right in one row or one column. Therefore, the user can feel as if many contents are arranged in a matrix over the entire screen.
[0044] ユーザは多数のコンテンツが並べられたマトリクスを自在に動かしながら所望のコン テンッにフォーカスを当てるような感覚でコンテンツを選択できる。ただし、実際に画 面表示されるアイコン数は少ないため、煩雑な印象をユーザに与えることはなレ、。ュ 一ザは、後述する動作により上下左右の方向を指示するだけで次々にコンテンツを 選ぶことができ、いわゆるザッビングの動作を簡単かつ快適な操作で行うことができる [0044] The user can select the content as if the user wants to focus on the desired content while freely moving the matrix in which a large number of content is arranged. However, since the actual number of icons displayed on the screen is small, it does not give a complicated impression to the user. The user can select content one after another by simply pointing up, down, left, and right by the operations described later, and can perform so-called zabbing operations with simple and comfortable operations.
[0045] つぎに、本実施形態に係るマルチメディア再生装置 20の機能構成について図 3に 示したブロック図を参照して説明する。 Next, the functional configuration of the multimedia playback device 20 according to the present embodiment will be described with reference to the block diagram shown in FIG.
[0046] 本図に示すように、マルチメディア再生装置 20は、ビデオカメラ 45からの動画像を 入力するビデオ画像入力部 101と、入力した動画像の左右反転を行ない鏡面動画 像を生成する画像反転部 102と、マルチメディア再生装置 20における各種処理を制 御する主制御部 103と、テレビジョン受像機 30の表示画面 50上に表示するメニュー 画像を生成するメニュー画像生成部 104と、鏡面動画像とメニュー画像との重畳画 像を生成する重畳画像生成部 105と、メニュー操作により指定されたコンテンツの再 生-実行処理を行なうコンテンツ処理部 106と、重畳画像あるいはコンテンツの表示 制御を行なう表示制御部 107と、コンテンツを格納するコンテンツ DB108とを備えて いる。 [0046] As shown in the figure, the multimedia playback device 20 includes a video image input unit 101 that inputs a moving image from the video camera 45, and a mirrored moving image that performs left-right reversal of the input moving image. An image inversion unit 102 that generates an image, a main control unit 103 that controls various processes in the multimedia playback device 20, and a menu image generation unit that generates a menu image to be displayed on the display screen 50 of the television receiver 30. 104, a superimposed image generation unit 105 that generates a superimposed image of the mirrored moving image and the menu image, a content processing unit 106 that performs reproduction / execution processing of the content specified by the menu operation, and a superimposed image or content A display control unit 107 that performs display control and a content DB 108 that stores content are provided.
[0047] また、主制御部 103は、顔位置認識部 103aと、後述する認識領域を設定する認識 領域設定部 103bと、動画像に含まれるユーザの動作を判定する動作判定部 103cと を備えている。  [0047] Further, the main control unit 103 includes a face position recognition unit 103a, a recognition region setting unit 103b for setting a recognition region to be described later, and an operation determination unit 103c for determining a user operation included in the moving image. ing.
[0048] 顔位置認識部 103aは、ビデオカメラ 45で撮像され鏡面処理された動画像にユー ザの顔が含まれてレ、るか否力、を判定し、含まれてレ、る場合にはその位置を認識する 処理を行なう。顔位置認識部 103aは、顔の形状が動画像のどの位置に含まれてい るかを判定できれば足り、それぞれのユーザを認識する必要はない。すなわち、画像 のある部分にユーザの顔が映ってレ、ることを検出できれば十分である。顔の位置の 認識には、ブースティング、サポートベクターマシン等の従来のパターン認識技術等 を用いることができる。  [0048] The face position recognition unit 103a determines whether or not the moving image captured by the video camera 45 and mirror-processed includes the user's face. Performs the process of recognizing the position. The face position recognition unit 103a only needs to be able to determine in which position of the moving image the face shape is included, and does not need to recognize each user. In other words, it is sufficient to detect that the user's face is reflected in a certain part of the image. For pattern recognition, conventional pattern recognition techniques such as boosting and support vector machines can be used.
[0049] ここで、認識領域設定部 103bが設定する認識領域について説明する。認識領域 は、図 4に示すように、マルチメディア再生装置 20によって画面 50に設定される領域 80であり、その領域内におけるユーザの動作、特に手の動作を認識するために設定 される。認識領域 80は、その目的に応じて種々の大きさで複数個設定することができ 、ここでは、非表示とする。後に説明するように、本実施形態では、特に、メニュー画 像に合わせて設定するようにする。  [0049] Here, the recognition area set by the recognition area setting unit 103b will be described. As shown in FIG. 4, the recognition area is an area 80 set on the screen 50 by the multimedia playback device 20, and is set for recognizing a user's action, particularly a hand action, in the area. A plurality of recognition areas 80 can be set in various sizes according to the purpose, and are not displayed here. As will be described later, in this embodiment, the setting is made in accordance with the menu image.
[0050] なお、認識領域 80以外の領域では、動作の認識は行なわれなレ、。これにより、マル チメディア再生装置 20における動作認識処理の負荷を軽減することができる。  [0050] It should be noted that in regions other than the recognition region 80, the motion is not recognized. Thereby, it is possible to reduce the load of motion recognition processing in the multimedia playback device 20.
[0051] つぎに、認識領域において、ユーザの動作を認識する方法について説明する。図 5に示すように、 1つの認識領域 80 (破線の矩形領域)に対して、同じ形状で、位置を 、その周囲に少しずらした領域を設定する(実線の矩形領域)。これを周辺領域と称 するものとする。ここでは、上下左右および斜め方向に 8つの周辺領域が設定される 。ただし、これに限られない。例えば、上下左右の 4つの周辺領域としたり、さらに細 力べ領域を設定するようにしてもょレ、。 [0051] Next, a method for recognizing the user's action in the recognition area will be described. As shown in FIG. 5, for one recognition area 80 (dashed rectangular area), an area having the same shape and slightly shifted around the area is set (solid rectangular area). This is called the peripheral area It shall be. Here, eight peripheral areas are set in the up / down / left / right and diagonal directions. However, it is not limited to this. For example, you may have four surrounding areas, top, bottom, left, and right, or even more powerful areas.
[0052] なお、周辺領域を 8つとした場合には、ユーザの動作として 8つの方向を検出するこ とができ、周辺領域を 4つとした場合には、ユーザの動作として 4つの方向を検出する こと力 Sできる。すなわち、本実施形態は、ユーザの動作をある方向への動作として認 識するものである。 [0052] Note that when there are eight peripheral areas, eight directions can be detected as user actions, and when there are four peripheral areas, four directions are detected as user actions. That power S. That is, the present embodiment recognizes the user's motion as a motion in a certain direction.
[0053] このため、本実施形態では、ある時刻(t)における認識領域 80の画像(図 5におけ る(t) X)と、所定時間経過後の時刻(t + 1)における各周辺領域の画像(図 5におけ る(t+ 1) A〜(t + 1) H)および時刻(t + 1)における認識領域の画像とを比較する。 そして、最も類似する周辺領域または認識領域の画像を決定し、その周辺領域の方 向へのユーザの動作があったものと認識する。  Therefore, in the present embodiment, an image of the recognition area 80 at a certain time (t) ((t) X in FIG. 5) and each peripheral area at a time (t + 1) after a predetermined time has elapsed. (T + 1) A to (t + 1) H) in Fig. 5 and the recognition area image at time (t + 1). Then, an image of the most similar peripheral area or recognition area is determined, and it is recognized that the user has moved in the direction of the peripheral area.
[0054] 例えば、図 6に示すように、認識領域内において、時刻(t)から時刻(t+ 1)の間に ユーザの手が右上方向に移動したとする。  For example, as shown in FIG. 6, it is assumed that the user's hand moves in the upper right direction between time (t) and time (t + 1) in the recognition area.
[0055] この場合、時刻(t)における認識領域の画像と、時刻(t + 1)における各周辺領域 の画像は図 7に示すようになる。なお、本図は、図 5に対応しており、時刻(t)におけ る認識領域の画像((t) X) )と、時刻(t + 1)における各周辺領域の画像((t + 1) A〜In this case, an image of the recognition area at time (t) and an image of each peripheral area at time (t + 1) are as shown in FIG. This figure corresponds to FIG. 5, and the image of the recognition area at time (t) ((t) X)) and the image of each peripheral area at time (t + 1) ((t + 1) A ~
(t + l) H)を示している。 (t + l) H).
[0056] 本例の場合、(t + 1) Cの画像が、最も時刻(t)における認識領域の画像と類似する ことになる。そこで、マルチメディア再生装置 20は、ユーザの動作が右上方向に行な われたことを認識することができる。なお、この認識処理は、主制御部 103の動作判 定部 103cにおいて行なわれる。 In this example, the (t + 1) C image is most similar to the image of the recognition area at time (t). Therefore, the multimedia playback device 20 can recognize that the user's operation has been performed in the upper right direction. This recognition processing is performed in the operation determination unit 103c of the main control unit 103.
[0057] このような処理を繰り返すことにより、主制御部 103は、認識領域におけるユーザの 動作を連続的に認識することができる。また、移動速度も検出することが可能である。 さらには、動作の履歴を記録することで、一方向的な動作と頻繁に方向が反転する 動作 (例えば、手を振っている状態)とを区別することもできる。 By repeating such processing, the main control unit 103 can continuously recognize user actions in the recognition area. It is also possible to detect the moving speed. Furthermore, by recording an action history, it is possible to distinguish between a one-way action and an action whose direction is frequently reversed (for example, a state of waving).
[0058] ここで、連続的に認識する場合において、基準となる時刻(t)における認識領域の 画像の位置または中身を、随時更新していくかどうかは任意であり、動作認識の目的 、動作の性質等に基づいて定めることができる。 Here, in the case of continuous recognition, whether or not to update the position or contents of the image in the recognition area at the reference time (t) at any time is arbitrary, and the purpose of motion recognition It can be determined based on the nature of the operation.
[0059] なお、類似する周辺領域の画像(時刻(t+ 1)における認識領域の画像も含む)の 決定方法は、例えば、各周辺領域について、時刻(t)における認識領域の各画素と 周辺領域の対応する位置の画素との RGB値の差の絶対値を積算し、その値が最も 小さい周辺領域を類似する周辺領域とすることができる。もちろん、これに限られず、 従来提案されている種々の技術を用いることができる。  [0059] It should be noted that a method for determining similar peripheral region images (including recognition region images at time (t + 1)) includes, for example, each pixel in the recognition region at time (t) and the peripheral region for each peripheral region. The absolute values of the differences in RGB values from the pixels at the corresponding positions are integrated, and the peripheral area with the smallest value can be set as a similar peripheral area. Of course, the present invention is not limited to this, and various conventionally proposed techniques can be used.
[0060] また、認識領域の画像が変化しなレ、場合、すなわち、時刻(t+ 1)における認識領 域の画像が、時刻 ωにおける認識領域の画像と最も類似する場合は、ユーザの動 作は検出されなかったものとして取り扱う。認識領域が複数設定されている場合には 、認識領域毎にユーザの動作を検出するものとする。  [0060] If the image of the recognition area does not change, that is, if the image of the recognition area at time (t + 1) is most similar to the image of the recognition area at time ω, the user's action Is treated as not detected. When a plurality of recognition areas are set, a user action is detected for each recognition area.
[0061] また、別な場合として、図 8に一例を示すようなケースが起こり得る。すなわち、例え ば、図 8 (a)に示すように、時刻(t)において認識領域の外側にあったユーザの手が 、 8 (b)に示すように、時刻(t + 1)において認識領域の左端に入ってきた場合である  [0061] As another case, a case as shown in FIG. 8 may occur. That is, for example, as shown in FIG. 8 (a), the user's hand that was outside the recognition area at time (t) becomes the recognition area at time (t + 1) as shown in 8 (b). It is the case of entering the left end of
[0062] 上述のように、本実施形態の動作認識は、本来的には、ユーザの手の位置の類似 度により移動方向を認識するものであるが、この場合は、図 8 (c)に示すように、時亥 t)にユーザの手が認識領域に含まれていないため、時刻(t + 1)においてユーザの 手が含まれている上、下、左方向の周辺領域の類似度が低くなる。結果として、ユー ザの手が含まれていない右側の周辺領域の類似度が高くなり、右方向への動作を認 識することになる。なお、ユーザの手は右方向への動作であるため、この認識は、時 刻(t)にユーザの手が認識領域に含まれていた場合とも合致し、結果的に妥当なも のと考えられる。 [0062] As described above, the motion recognition of the present embodiment is essentially for recognizing the moving direction based on the similarity of the position of the user's hand. As shown, since the user's hand is not included in the recognition area at time t), the similarity of the surrounding area in the upper, lower, and left directions that include the user's hand at time (t + 1) is shown. Lower. As a result, the similarity of the surrounding area on the right side that does not include the user's hand increases, and the movement in the right direction is recognized. Since the user's hand moves in the right direction, this recognition is consistent with the case where the user's hand is included in the recognition area at time ( t ), and is considered to be appropriate as a result. It is done.
[0063] 図 9は、以上の動作認識処理を示すフロー図である。まず、主制御部 103の認識領 域設定部 103bは、所定の規則にしたがって 1または複数の認識領域を設定する(S FIG. 9 is a flowchart showing the above operation recognition process. First, the recognition area setting unit 103b of the main control unit 103 sets one or more recognition areas according to a predetermined rule (S
101)。なお、所定の規則については、後述する。 101). The predetermined rule will be described later.
[0064] そして、時刻(t)における認識領域の画像データを取得し (S102)、次いで、時刻( t + 1)における各周辺領域の画像データを取得する(S103)。なお、併せて、時刻(tThen, the image data of the recognition area at time (t) is acquired (S102), and then the image data of each peripheral area at time (t + 1) is acquired (S103). In addition, the time (t
+ 1)における認識領域の画像データも取得するようにする。 [0065] それぞれの周辺領域の画像(時刻(t+ 1)における認識領域の画像も含む)毎に時 刻(t)における認識領域の画像との類似度を算出し (S104)、類似する周辺領域の 画像データを決定する(S105)。 + Get the image data of the recognition area in 1). [0065] For each peripheral area image (including the recognition area image at time (t + 1)), the similarity with the recognition area image at time (t) is calculated (S104), and similar peripheral areas are calculated. The image data of is determined (S105).
[0066] 決定された周辺領域にしたがって、ユーザの動作方向が決定される(S106)。この 動作方向は、その瞬間におけるものである。この動作方向をそのまま採用してもよい が、ここでは、履歴として記録し (S107)、動作方向の傾向により、ユーザの動作を判 定するものとする(S108)。軽微な動きがユーザの動作として判定されてしまうことを 防ぐためである。  [0066] According to the determined peripheral area, the user's direction of motion is determined (S106). This direction of movement is at that moment. Although this movement direction may be adopted as it is, it is recorded here as a history (S107), and the user's movement is determined based on the tendency of the movement direction (S108). This is to prevent minor movements from being determined as user actions.
[0067] ユーザの動作の判定は、あらかじめ定められた動作判定ルールにしたがって行なう ものとする。ここで、動作判定ルールは、例えば、動作の履歴を参照して、以下のよう な動作をがあったものとして判定することができる。すなわち、所定時間、同一の方向 の動作が続いた場合には、その方向への動作があったものと判定する、同一の認識 領域内で頻繁に方向が反転する動作が続いた場合には、手を振る動作があったも のと判定する、同一の方向から突然反対方向への動作があった場合には、反転動作 があったものと判定する、動作が不安定の場合には、動作がなかったものと判定する 等とすることができる。  [0067] The user's motion is determined according to a predetermined motion determination rule. Here, the operation determination rule can be determined, for example, by referring to an operation history as having the following operation. In other words, if movement in the same direction continues for a predetermined time, it is determined that movement has occurred in that direction.If movement in which the direction is frequently reversed in the same recognition area continues, It is determined that there has been a motion of shaking hands.If there is a sudden movement from the same direction to the opposite direction, it is determined that there has been a reversal operation. It can be determined that there was no error.
[0068] 主制御部 103は、以上の処理を、領域認識を終了するまで繰り返すようにする(S1 09)。  The main control unit 103 repeats the above processing until the region recognition ends (S109).
[0069] なお、動作の判定においては、履歴を参照して、次の移動方向を予測し、その方向 への類似度の重み付けを強くするようにしてもよい。このようにすることで、ユーザの 動作のぶれ等が動作判定に与える影響を軽減することができる。また、それぞれの動 作判定にぉレ、て、動作の速度も判定するようにしてもょレ、。  [0069] It should be noted that in determining the motion, the next moving direction may be predicted with reference to the history, and the similarity weight in the direction may be increased. By doing so, it is possible to reduce the influence of the motion fluctuation of the user on the motion determination. Also, check the operation speed and determine the speed of the operation.
[0070] つぎに、これらの動作認識処理を、上記のメニュー操作に適用した場合について説 明する。すなわち、本実施形態では、図 2に示したようなメニュー画面をテレビジョン 受像機 30の画面 50に表示し、重畳されて表示されるユーザの鏡面動画像の動作を 認識することで、メニュー操作をユーザから受け付けるようにする。具体的には、メニ ユー操作に関する上下左右の指示を、ユーザの上下左右方向への動作により受け 付けるようにする。 [0071] 図 10は、このときのマルチメディア再生装置 20の処理を説明するフロー図である。 [0070] Next, a case where these motion recognition processes are applied to the menu operation will be described. That is, in this embodiment, the menu screen as shown in FIG. 2 is displayed on the screen 50 of the television receiver 30, and the operation of the menu is recognized by recognizing the operation of the mirror moving image of the user displayed in a superimposed manner. Is accepted from the user. Specifically, the up / down / left / right instructions regarding the menu operation are received by the user's up / down / left / right movements. FIG. 10 is a flowchart for explaining the processing of the multimedia playback device 20 at this time.
[0072] 本実施形態におけるメニュー操作は、ビデオカメラ 45で撮像され鏡面処理された 動画像にユーザの顔が含まれている場合に処理を開始する(S201)。すなわち、ュ 一ザの顔を認識することをスィッチとして用いるようにしている。これにより、ユーザが テレビジョン受像機 30の前にレ、なレ、場合には、メニュー処理が行なわれなレ、ようにし 、また、背景等の動きによる不用意なメニュー操作の受け付けを防ぐようにしている。  [0072] The menu operation in the present embodiment starts when the moving image captured by the video camera 45 and mirror-processed includes the user's face (S201). In other words, recognizing the user's face is used as a switch. As a result, if the user is in front of the television receiver 30, the menu processing is not performed, and the reception of inadvertent menu operations due to movement of the background or the like is prevented. I have to.
[0073] 動画像内にユーザの顔を認識した場合(S201: Y)には、顔の位置の判定し、その 位置に基づレ、てメニューの位置を設定する(S202)。  When the user's face is recognized in the moving image (S201: Y), the position of the face is determined, and the menu position is set based on the position (S202).
[0074] ここで、メニューの位置、具体的には、水平方向のメディアアイコン配列 70と垂直方 向のコンテンツアイコン配列 72とを、図 11に示すような位置に設定する。すなわち、 判定されたユーザの顔の位置 90を基準に、顔の下側に水平方向のメディアアイコン 配列 70が位置し、画面向かって顔の右側に垂直方向のコンテンツアイコン配列 72 が位置するように設定する  Here, the position of the menu, specifically, the media icon array 70 in the horizontal direction and the content icon array 72 in the vertical direction are set to positions as shown in FIG. That is, based on the determined position 90 of the user's face, the horizontal media icon array 70 is positioned below the face, and the vertical content icon array 72 is positioned on the right side of the face toward the screen. Set
これにより、ユーザが右手の動作によりメニュー操作を簡易に行なうことができるよう になる。もちろん、ユーザが左手の動作によりメニュー操作を行なう場合には、コンテ ンッアイコン配列 72を顔の左側に位置するようにしてもよい。また、水平方向のメディ ァアイコン配列 70は、左右の手の動作によりメニュー操作を行なうことも可能である。  As a result, the user can easily perform menu operations by the action of the right hand. Of course, the content icon array 72 may be positioned on the left side of the face when the user performs a menu operation by the action of the left hand. In addition, the horizontal media icon array 70 can be operated by left and right hand movements.
[0075] そして、 平方向のメディアアイコン酉己列 70と垂直方向のコンテンツアイコン酉己列 7 2の領域に対応させて認識領域 80を設定する(S203)。  [0075] Then, the recognition area 80 is set in correspondence with the area of the media icon column 70 in the horizontal direction and the content icon column 72 in the vertical direction (S203).
[0076] ここでは、各アイコン配列に、複数個の認識領域を設定している。これは、図 8で説 明したように、認識領域にユーザの手が新たに入ってきた場合にも精度よく動作を認 識することができるようにするためである。ここで、上下左右の動作を認識できれば足 りるため、各アイコンと認識領域とを対応させる必要はなレ、。ただし、注目領域 75に 対する特定の動作、例えば、再生指示のための決定動作等を認識できるように、注 目領域 75に対応した認識領域 80を設定するようにしてもょレ、。  Here, a plurality of recognition areas are set for each icon array. This is because the operation can be recognized accurately even when a new user's hand enters the recognition area, as explained in FIG. Here, it is only necessary to recognize the up / down / left / right movement, so it is not necessary to associate each icon with the recognition area. However, a recognition area 80 corresponding to the attention area 75 may be set so that a specific action for the attention area 75, for example, a decision operation for a reproduction instruction, can be recognized.
[0077] なお、本実施形態では、各認識領域 80について、上下左右斜めの 8個の周辺領 域を設定しているものとする。ただし、斜め方向の動作を認識した場合、マルチメディ ァ再生装置 20は、これを上下方向の指示とみなすようにする。すなわち、コンテンツ アイコン配列 72のスクロール表示を優先する。これにより、ユーザが複数のコンテン ッをスクロールさせる間に、不意のメディア変更、すなわちメディアアイコン配列 70の 左右方向のスクロールを実行してしまうような誤操作を防止できる。なお、周辺領域を 上下左右の 4個として、上下左右方向の動作のみを認識できるようにしてもよい。 In the present embodiment, for each recognition area 80, eight peripheral areas that are diagonally up, down, left, and right are set. However, when the operation in the oblique direction is recognized, the multimedia playback device 20 regards this as an instruction in the vertical direction. Ie, content Priority is given to scrolling the icon array 72. As a result, it is possible to prevent an erroneous operation in which the user suddenly changes media, that is, scrolls the media icon array 70 in the horizontal direction while scrolling a plurality of contents. It should be noted that it is possible to recognize only the movements in the up / down / left / right directions by setting the surrounding area to four in the vertical and horizontal directions.
[0078] そして、各認識領域 80でユーザの動作を判定し、レ、ずれかの領域で、左右の指示 、上下の指示、決定の指示を受け付けたかどうかを判断する(S204)。なお、決定の 指示は例えば、ユーザが認識領域 80上で手を振った場合を決定の指示に割り当て ること力 S考えられる。すなわち、認識領域 80上で手を振った場合には、当該認識領 域 80に対応するコンテンツアイコンとして示されたコンテンツに決定したものとする。 手を振る代わりに、手を右または左方向に動かした場合を決定の指示に割り当てても よい。 [0078] Then, the user's action is determined in each recognition area 80, and it is determined whether or not a left / right instruction, an up / down instruction, and a determination instruction are accepted in the left or right area (S204). For example, the decision instruction S can be assigned to the decision instruction when the user shakes his / her hand on the recognition area 80. That is, when a hand is waved on the recognition area 80, it is determined that the content is indicated as the content icon corresponding to the recognition area 80. Instead of waving, you can assign the decision to move your hand to the right or left.
[0079] また、いずれかの認識領域 80で、例えば、急激に方向を反転させる動作を認識し た場合には、メニュー操作を中止する指示があったものとして扱うようにしてもよい。  [0079] Also, for example, when an operation of rapidly reversing the direction is recognized in any of the recognition areas 80, it may be handled as an instruction to stop the menu operation.
[0080] その結果、左右の指示を受け付けた場合には、メディアアイコンの配列を左右に移 動させる処理を行なう(S205)。  As a result, when a left / right instruction is received, a process of moving the arrangement of media icons to the left / right is performed (S205).
[0081] また、上下の指示を受け付けた場合には、コンテンツアイコンの配列を上下に移動 させる処理を行なう (S206)。  If an up / down instruction is accepted, a process of moving the content icon array up / down is performed (S206).
[0082] また、決定の指示を受け付けた場合には、注目領域 75に注目サムネイル 64として 示されたコンテンツの再生.実行を行なう(S207)。その後、終了の指示があった場 合(S208 :Y)には、メニュー処理を終了し、終了の指示がなかった場合(S209 :Y) には、再度顔の位置を認識して(S201)、上述の処理を繰り返す。ここで、終了の指 示を行なうための操作自体が本発明によるメニュー画面に含まれてレ、てもよレ、。  If a determination instruction is accepted, the content indicated as the attention thumbnail 64 in the attention area 75 is reproduced and executed (S207). After that, if there is an instruction to end (S208: Y), the menu processing is ended. If there is no instruction to end (S209: Y), the face position is recognized again (S201). The above process is repeated. Here, the operation itself for instructing the end is included in the menu screen according to the present invention.
[0083] 以上示したように、本実施形態によれば、ユーザはテレビジョン受像機 30に映し出 される自身の動作により、メニュー操作を行なうことができるため、視覚的で直感的な 操作性を得ることができる。したがって、マルチメディア再生におけるユーザの操作性 力さらに高められることになる。  [0083] As described above, according to the present embodiment, the user can perform the menu operation by his / her own operation displayed on the television receiver 30, so that visual and intuitive operability is achieved. Can be obtained. Therefore, the user's operability in multimedia playback is further enhanced.
[0084] なお、上記の実施形態では、メニュー形式として、縦方向のアイコン配列と横方向 のアイコン配列とを組み合わせた形状としたが、例えば、円形状を表示して、回転方 向の動作を認識するようにして、いわゆるジョグダイヤルを模した指示を受け付けるよ うにしてもよい。 [0084] In the above embodiment, the menu format is a combination of a vertical icon arrangement and a horizontal icon arrangement. For example, a circular shape is displayed and a rotation method is displayed. It is also possible to accept an instruction imitating a so-called jog dial by recognizing the movement in the direction.
また、画面上に複数のメニューセットを表示して、複数人が同時に別々のメニュー 操作を行なえるようにしてもょレ、。  You can also display multiple menu sets on the screen so that multiple people can perform different menu operations at the same time.

Claims

請求の範囲 The scope of the claims
[1] メニュー操作により指定されたコンテンツを再生するマルチメディア再生装置であつ て、  [1] A multimedia playback device that plays back content specified by menu operations.
ユーザの動画像を入力する動画像入力手段と、  Moving image input means for inputting a user's moving image;
コンテンツ再生に関する操作を受け付けるメニュー画像を生成するメニュー画像生 成手段と、  A menu image generating means for generating a menu image for accepting an operation relating to content reproduction;
前記入力した動画像の鏡面動画像と前記メニュー画像との重畳動画像を生成する 重畳画像生成手段と、  A superimposed image generating means for generating a superimposed moving image of the mirrored moving image of the input moving image and the menu image;
前記重畳動画像内に設定された動作認識領域において、ユーザの動作の方向を 判定する動作方向判定手段とを備え、  Motion direction determining means for determining the direction of the user's motion in the motion recognition area set in the superimposed moving image,
前記メニュー画像生成手段は、前記判定されたユーザの動作方向を、前記メニュ 一画像の操作指示として受け付けることを特徴とするマルチメディア再生装置。  The multimedia playback apparatus according to claim 1, wherein the menu image generation means receives the determined user movement direction as an operation instruction for the menu image.
[2] 請求項 1に記載のマルチメディア再生装置であって、  [2] The multimedia playback device according to claim 1,
前記メニュー画像生成手段は、  The menu image generation means includes
再生できるメディアの種類を示したメディアアイコン群と、それぞれのメディアにおい て再生対象となるコンテンツを示したコンテンツアイコン群とを二次元配列した形式の メニュー画像を生成することを特徴とするマルチメディア再生装置。  Multimedia playback characterized by generating a menu image in a two-dimensional array of media icons that indicate the types of media that can be played and content icons that indicate the content to be played on each media apparatus.
[3] 請求項 2に記載のマルチメディア再生装置であって、 [3] The multimedia playback device according to claim 2,
前記メディアアイコンとコンテンツアイコンとは、上下左右の指示により選択可能で あり、  The media icon and the content icon can be selected by up / down / left / right instructions,
前記動作方向判定手段は、ユーザの動作方向を少なくとも上下左右の方向で判定 することを特徴とするマルチメディア再生装置。  The multimedia playback device according to claim 1, wherein the motion direction determination means determines the motion direction of the user in at least the vertical and horizontal directions.
[4] 請求項 1に記載のマルチメディア再生装置であって、 [4] The multimedia playback device according to claim 1,
前記動作方向判定手段は、ある時刻における前記動作認識領域の画像と、所定時 間後における前記動作認識領域の周辺の複数の画像とを比較することにより、ユー ザの動作方向を判定することを特徴とするマルチメディア再生装置。  The movement direction determination means determines the movement direction of the user by comparing an image of the movement recognition area at a certain time with a plurality of images around the movement recognition area after a predetermined time. A multimedia playback device.
[5] 請求項 4に記載のマルチメディア再生装置であって、 [5] The multimedia playback device according to claim 4,
前記動作方向判定手段は、 前記動作認識領域の周辺の複数の画像として、少なくとも、前記動作認識領域から 上下左右方向にずれた 4つの領域における画像を用いることを特徴とするマルチメ ディア再生装置。 The movement direction determination means includes The multimedia playback device characterized in that images in at least four regions shifted in the vertical and horizontal directions from the motion recognition region are used as the plurality of images around the motion recognition region.
[6] 請求項 5に記載のマルチメディア再生装置であって、 [6] The multimedia playback device according to claim 5,
前記動作方向判定手段は、  The movement direction determination means includes
前記 4つの領域における画像のうち、前記動作認識領域の画像と最も類似する画 像に対応する領域の方向を、ユーザの動作方向として判定することを特徴とするマル チメディア再生装置。  The multimedia playback device, wherein among the images in the four regions, the direction of the region corresponding to the image most similar to the image in the motion recognition region is determined as the user motion direction.
[7] 請求項 5に記載のマルチメディア再生装置であって、 [7] The multimedia playback device according to claim 5,
前記動作方向判定手段は、  The movement direction determination means includes
判定した前記ユーザの動作方向の履歴を記録し、その履歴に基づいてユーザの 動作方向を判断し、前記メニュー画像生成手段に対する操作指示として出力するこ とを特徴とするマルチメディア再生装置。  A multimedia playback device, wherein a history of the determined user's motion direction is recorded, the user's motion direction is determined based on the history, and output as an operation instruction to the menu image generating means.
[8] 請求項 1に記載のマルチメディア再生装置であって、 [8] The multimedia playback device according to claim 1,
前記重畳動画像内にユーザの顔が存在するかどうかを判定する顔判定手段をさら に備え、  A face determination means for determining whether or not a user's face is present in the superimposed moving image;
前記動作方向判定手段は、ユーザの顔が存在すると判定された場合に、前記ユー ザの動作方向を判定することを特徴とするマルチメディア再生装置。  The multimedia playback device according to claim 1, wherein the motion direction determination means determines the motion direction of the user when it is determined that a user's face exists.
[9] 請求項 2に記載のマルティメディア再生装置であって、 [9] The multimedia playback device according to claim 2,
前記重畳動画像内におけるユーザの顔の位置を検出する顔位置検出手段をさら に備え、  Face position detecting means for detecting the position of the user's face in the superimposed moving image;
前記メニュー画像生成手段は、  The menu image generation means includes
前記検出された顔位置を基準に前記メディアアイコン群とコンテンツアイコン群を配 置することを特徴とするマルチメディア再生装置。  A multimedia reproducing apparatus, wherein the media icon group and the content icon group are arranged based on the detected face position.
[10] 請求項 1に記載のマルチメディア再生装置であって、 [10] The multimedia playback device according to claim 1,
前記動作認識領域は、前記メニュー画像に対応した位置に設定されることを特徴と するマルチメディア再生装置。  The multimedia playback device characterized in that the motion recognition area is set at a position corresponding to the menu image.
[11] メニュー操作により指定されたコンテンツを再生するマルチメディア再生装置におけ るメニュー操作受付方法であって、 [11] In a multimedia playback device that plays back content specified by menu operations. Menu operation reception method,
ユーザの動画像を撮像する撮像ステップと、  An imaging step for capturing a moving image of the user;
コンテンツ再生に関する操作を受け付けるメニュー画像を生成するメニュー画像生 成ステップと、  A menu image generation step for generating a menu image for accepting an operation relating to content reproduction;
前記ユーザの動画像の鏡面動画像と前記メニュー画像との重畳動画像を生成する 重畳画像生成ステップと、  Generating a superimposed moving image of the mirror moving image of the user's moving image and the menu image;
前記重畳動画像内に設定された動作認識領域において、ユーザの動作の方向を 判定する動作方向判定ステップと、  A motion direction determination step of determining a direction of the user's motion in the motion recognition area set in the superimposed moving image;
前記判定されたユーザの動作方向を、前記メニュー画像の操作指示として受け付 ける操作指示受付ステップとを有することを特徴とするメニュー操作受付方法。  An operation instruction receiving step of receiving the determined user operation direction as an operation instruction for the menu image.
情報処理装置をメニュー操作により指定されたコンテンツを再生するマルチメディア 再生装置として機能させるコンピュータプログラムであって、  A computer program that causes an information processing device to function as a multimedia playback device that plays back content specified by a menu operation,
ユーザの動画像を入力する動画像入力手段と、  Moving image input means for inputting a user's moving image;
コンテンツ再生に関する操作を受け付けるメニュー画像を生成するメニュー画像生 成手段と、  A menu image generating means for generating a menu image for accepting an operation relating to content reproduction;
前記入力した動画像の鏡面動画像と前記メニュー画像との重畳動画像を生成する 重畳画像生成手段と、  A superimposed image generating means for generating a superimposed moving image of the mirrored moving image of the input moving image and the menu image;
前記重畳動画像内に設定された動作認識領域において、ユーザの動作の方向を 判定する動作方向判定手段として情報処理装置をさらに機能させ、  In the motion recognition area set in the superimposed moving image, the information processing apparatus further functions as a motion direction determination unit that determines the direction of the user's motion,
前記メニュー画像生成手段は、前記判定されたユーザの動作方向を、前記メニュ 一画像の操作指示として受け付けることを特徴とするコンピュータプログラム。  The computer program according to claim 1, wherein the menu image generation unit receives the determined user movement direction as an operation instruction for the menu image.
PCT/JP2006/312029 2005-09-05 2006-06-15 Multimedia reproducing apparatus, menu operation accepting method, and computer program WO2007029393A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005-256242 2005-09-05
JP2005256242A JP2007072564A (en) 2005-09-05 2005-09-05 Multimedia reproduction apparatus, menu operation reception method, and computer program

Publications (1)

Publication Number Publication Date
WO2007029393A1 true WO2007029393A1 (en) 2007-03-15

Family

ID=37835524

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2006/312029 WO2007029393A1 (en) 2005-09-05 2006-06-15 Multimedia reproducing apparatus, menu operation accepting method, and computer program

Country Status (2)

Country Link
JP (1) JP2007072564A (en)
WO (1) WO2007029393A1 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010081466A (en) * 2008-09-29 2010-04-08 Hitachi Ltd Operation control device and operation display method
US20100091085A1 (en) * 2008-10-15 2010-04-15 Sony Corporation And Sony Electronics Inc. Augmenting tv menu icon with images in front of tv
WO2010085221A1 (en) * 2009-01-21 2010-07-29 Thomson Licensing Method to control media with face detection and hot spot motion
WO2010095204A1 (en) * 2009-02-18 2010-08-26 株式会社 東芝 Interface controller and method thereof
CN102474592A (en) * 2009-08-21 2012-05-23 阿瓦雅公司 Camera-based facial recognition as a method of effecting telecom device alerting
US9086726B2 (en) 2010-12-27 2015-07-21 Hitachi Maxell, Ltd. Image processing device and image display device

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101874404B (en) 2007-09-24 2013-09-18 高通股份有限公司 Enhanced interface for voice and video communications
JP4907483B2 (en) * 2007-09-28 2012-03-28 パナソニック株式会社 Video display device
JP5183398B2 (en) * 2008-09-29 2013-04-17 株式会社日立製作所 Input device
US9591118B2 (en) * 2009-01-01 2017-03-07 Intel Corporation Pose to device mapping
JP5614014B2 (en) 2009-09-04 2014-10-29 ソニー株式会社 Information processing apparatus, display control method, and display control program
US20120331506A1 (en) * 2011-06-24 2012-12-27 Sony Network Entertainment International Llc User interface and content integration
JP5865615B2 (en) * 2011-06-30 2016-02-17 株式会社東芝 Electronic apparatus and control method
JP5386645B2 (en) * 2013-01-10 2014-01-15 日立コンシューマエレクトロニクス株式会社 input method
EP3165993B1 (en) * 2014-06-30 2020-05-06 Clarion Co., Ltd. Non-contact operation detection device

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002083302A (en) * 2000-09-07 2002-03-22 Sony Corp Information processing device, action recognition processing method, and program storage medium
JP2002196855A (en) * 2000-10-06 2002-07-12 Sony Computer Entertainment Inc Image processor, image processing method, recording medium, computer program and semiconductor device
JP2004356774A (en) * 2003-05-27 2004-12-16 Sony Computer Entertainment Inc Multimedia reproducing apparatus and multimedia reproducing method
JP2005174356A (en) * 2000-02-01 2005-06-30 Toshiba Corp Direction detection method
JP2005216061A (en) * 2004-01-30 2005-08-11 Sony Computer Entertainment Inc Image processor, image processing method, recording medium, computer program and semiconductor device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005174356A (en) * 2000-02-01 2005-06-30 Toshiba Corp Direction detection method
JP2002083302A (en) * 2000-09-07 2002-03-22 Sony Corp Information processing device, action recognition processing method, and program storage medium
JP2002196855A (en) * 2000-10-06 2002-07-12 Sony Computer Entertainment Inc Image processor, image processing method, recording medium, computer program and semiconductor device
JP2004356774A (en) * 2003-05-27 2004-12-16 Sony Computer Entertainment Inc Multimedia reproducing apparatus and multimedia reproducing method
JP2005216061A (en) * 2004-01-30 2005-08-11 Sony Computer Entertainment Inc Image processor, image processing method, recording medium, computer program and semiconductor device

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010081466A (en) * 2008-09-29 2010-04-08 Hitachi Ltd Operation control device and operation display method
US20100091085A1 (en) * 2008-10-15 2010-04-15 Sony Corporation And Sony Electronics Inc. Augmenting tv menu icon with images in front of tv
WO2010085221A1 (en) * 2009-01-21 2010-07-29 Thomson Licensing Method to control media with face detection and hot spot motion
WO2010095204A1 (en) * 2009-02-18 2010-08-26 株式会社 東芝 Interface controller and method thereof
JPWO2010095204A1 (en) * 2009-02-18 2012-08-16 株式会社東芝 Interface control apparatus and method
JP5318189B2 (en) * 2009-02-18 2013-10-16 株式会社東芝 Interface control apparatus and method
US8593399B2 (en) 2009-02-18 2013-11-26 Kabushiki Kaisha Toshiba Interface apparatus and method for controlling a device
CN102474592A (en) * 2009-08-21 2012-05-23 阿瓦雅公司 Camera-based facial recognition as a method of effecting telecom device alerting
US9086726B2 (en) 2010-12-27 2015-07-21 Hitachi Maxell, Ltd. Image processing device and image display device
US9746931B2 (en) 2010-12-27 2017-08-29 Hitachi Maxell, Ltd. Image processing device and image display device

Also Published As

Publication number Publication date
JP2007072564A (en) 2007-03-22

Similar Documents

Publication Publication Date Title
WO2007029393A1 (en) Multimedia reproducing apparatus, menu operation accepting method, and computer program
KR100830739B1 (en) Multimedia playback device and playback method
US7844916B2 (en) Multimedia reproducing apparatus and menu screen display method
US7681128B2 (en) Multimedia player and method of displaying on-screen menu
KR100918905B1 (en) Multimedia reproduction device and menu screen display method
JP4938733B2 (en) Menu screen display method and menu screen display device
JP5398719B2 (en) User command input method, and video equipment and input equipment to which the method is applied
JP4203741B2 (en) Data reproducing apparatus and data reproducing method
KR102519592B1 (en) Display apparatus and controlling method thereof
US8897625B2 (en) Slideshow display control for a display control apparatus
JP2007096840A (en) Information browsing apparatus
JP4595807B2 (en) Imaging device
JP4772583B2 (en) Multimedia playback device, menu screen display method, menu screen display program, and computer-readable storage medium storing menu screen display program
JP2022040586A (en) Image display device and program
CN113261302A (en) Electronic device
JP2011035485A (en) Display controller and program
JP2010073199A (en) Reproducing apparatus, and method and program of switching reproduction
JP2006108931A (en) Menu display device

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 06766763

Country of ref document: EP

Kind code of ref document: A1