WO2022215725A1 - 情報処理装置、プログラム、及び、情報処理方法 - Google Patents

情報処理装置、プログラム、及び、情報処理方法 Download PDF

Info

Publication number
WO2022215725A1
WO2022215725A1 PCT/JP2022/017255 JP2022017255W WO2022215725A1 WO 2022215725 A1 WO2022215725 A1 WO 2022215725A1 JP 2022017255 W JP2022017255 W JP 2022017255W WO 2022215725 A1 WO2022215725 A1 WO 2022215725A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
user
avatar
information processing
unit
Prior art date
Application number
PCT/JP2022/017255
Other languages
English (en)
French (fr)
Inventor
昌 坂牧
将 上出
直也 伊藤
孝司 栗山
Original Assignee
株式会社ニコン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ニコン filed Critical 株式会社ニコン
Publication of WO2022215725A1 publication Critical patent/WO2022215725A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/403D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings

Definitions

  • the present invention relates to an information processing device, a program, and an information processing method.
  • This application claims priority based on Japanese Patent Application No. 2021-066019 filed on April 8, 2021, the content of which is incorporated herein.
  • Patent Document 1 An avatar system configured to animate an avatar as a graphical representation of the user based on the user's facial expression and head posture is known.
  • an information processing device includes first information related to a first user's profile, second information related to a second user's profile, and third information related to a state of the first user.
  • a generating unit that generates fourth information used for controlling a controlled object associated with the first user based on the first information, the second information, and the third information; and , provided.
  • an information processing apparatus includes an acquisition unit that acquires first information related to a first action having a first meaning, and a second action having the first meaning and different from the first action. and a generating unit that generates second information about based on the first information.
  • a program stores first information related to a first user's profile, second information related to a second user's profile, and third information related to said first user's status. and a process of generating fourth information used for controlling a controlled object associated with the first user based on the first information, the second information, and the third information. let it run.
  • an information processing method includes first information related to a first user's profile, second information related to a second user's profile, and third information related to a state of the first user. and generating fourth information used for controlling a controlled object associated with the first user based on the first information, the second information, and the third information. include.
  • an information processing method includes obtaining first information relating to a first action having a first meaning; generating second information based on the first information.
  • an information processing apparatus includes an acquisition unit that acquires first information related to a first user's action and second information related to a second user, and a generation unit that generates information in which the motion of the first user is converted into a motion adapted to the second user based on the information.
  • an information processing method includes obtaining first information related to a first user's behavior and second information related to a second user; and generating information that transforms the first user's motion into a motion adapted to the second user based on.
  • the information processing device includes an acquisition unit that acquires first information related to a first user's behavior and second information related to a situation in which the first user communicates with another user. and a generator configured to generate third information obtained by converting the motion of the first user based on the first information and the second information.
  • an information processing method includes obtaining first information related to actions of a first user and second information related to situations in which the first user communicates with other users. and generating third information in which the motion of the first user is converted based on the first information and the second information.
  • FIG. 1 is a diagram schematically showing a configuration example of an information communication system according to an embodiment
  • FIG. 1 is a block diagram showing a configuration example of an information communication system according to an embodiment
  • FIG. It is a figure for demonstrating an example of the comparison table which concerns on embodiment.
  • FIG. 4 is a diagram for explaining an example of processing by the information processing device according to the embodiment; 4 is a flowchart showing an operation example of the information processing device according to the embodiment; 4 is a flowchart showing an operation example of the information processing device according to the embodiment;
  • FIG. 1 is a diagram schematically showing a configuration example of an information communication system 1 according to an embodiment.
  • An information communication system (information processing system) 1 includes a plurality of information processing devices 100 (information processing device 100a and information processing device 100b in the example shown in FIG. 1) and information processing devices 200 (server 200 in the example shown in FIG. ) and The information processing device 100 is connectable to a network and configured to communicate with the server 200 and other information processing devices 100 .
  • Server 200 may be a centralized server or a distributed server.
  • a plurality of information processing devices 100 and a server 200 communicate to control a control target (avatar in this embodiment) associated with a user.
  • a control target avatar in this embodiment
  • information related to the avatar hereinafter referred to as avatar information
  • avatar information is generated based on the state of the user and used to control the avatar.
  • Avatars are represented by images, voice, text, etc., and are used to represent themselves.
  • An avatar can also be used as an alter ego or incarnation.
  • the avatar image uses an image of the user, an illustration, a virtual character, or other objects that can substitute for the user.
  • the avatar is associated (associated) with the user and used for communication on the network.
  • Avatar information includes information about images used as avatar images, information about avatar actions, information about avatar sounds, and so on.
  • avatar information is generated, transmitted and received, and users can communicate using avatars. Communication between the user and avatars of others and communication between the avatars of the user and avatars of others can be performed.
  • the information processing devices 100a and 100b are terminals (terminal devices) and are used by users A and B, respectively.
  • the information processing device 100a uses the avatar information of the user B who uses the information processing device 100b to output the image and sound of the user B's avatar.
  • the information processing device 100b uses the avatar information of the user A who uses the information processing device 100a to output the image and sound of the user A's avatar. Thereby, the user A and the user B can communicate while looking at each other's avatar.
  • the information processing apparatus 100 can communicate with other information processing apparatuses 100 and the server 200 to acquire information related to images of other users, and can also output images of other users.
  • users can also communicate with other people's avatars without using their own avatars.
  • FIG. 2 is a block diagram showing a configuration example of the information communication system 1 according to the embodiment.
  • the information processing apparatus 100 includes an information processing section 10 , a communication section 20 , a storage section 30 , an output section 40 , a detection section 50 and an operation section 60 .
  • the information processing device 100 is configured by an electronic device such as a computer, smart phone, tablet terminal, or wearable terminal.
  • the information processing unit 10, the communication unit 20, the storage unit 30, the output unit 40, the detection unit 50, and the operation unit 60 transmit and receive information through wired communication or wireless communication.
  • the information processing section 10 has a processor and memory, and performs information processing based on a program.
  • the information processing unit 10 has devices such as CPU, GPU, FPGA, and ASIC, and memories such as ROM and RAM.
  • the information processing unit 10 is also a control unit, reads and executes a program stored in the memory, and controls each unit of the information processing apparatus 100 .
  • the information processing section 10 can also be said to be a signal processing section that performs signal processing.
  • the information processing unit 10 communicates with the server 200 and other information processing devices 100 via the communication unit 20 to transmit and receive information bidirectionally.
  • the communication unit 20 is configured by a communication module or the like, and can communicate with the server 200 and other information processing devices 100 .
  • the communication unit 20 transmits and receives information such as image data, audio data, and position data.
  • the communication unit 20 acquires information about other users' profiles, information about other users' states, and information about other users' avatars through communication with the server 200 and other information processing devices 100 .
  • the information processing device 100 may communicate with other information processing devices 100 without going through the server 200 .
  • the storage unit 30 is composed of a non-volatile storage medium or the like, and stores (records) programs and data.
  • the storage unit 30 is a storage device such as a memory such as a ROM or flash memory, a hard disk, or an SSD, and stores various information.
  • the information stored in the storage unit 30 includes programs and data used for controlling each unit of the information processing apparatus 100, programs and data used for generating avatar information, programs and data used for communication using avatars, and the like.
  • profile information Information related to the user's profile (hereinafter referred to as profile information) is stored in the storage unit 30 .
  • the profile information is input by the user's operation of the operation unit 60 , voice, or the like, and is stored in the storage unit 30 .
  • the profile information may be automatically acquired by the information processing device 100 and the server 200 and stored in the storage unit 30 .
  • profile information includes a geographic profile, a demographic profile, a developmental profile.
  • User profile information includes current information such as current country of residence, area of residence, place of work, nationality, native language, gender, organization (company, school, etc.) to which the user belongs, religion, and ethnicity.
  • profile information not only current information such as current country of residence, current place of work, but also past information such as past country of residence, region of residence, place of work, nationality, native language, gender, affiliation Organizations, religions, ethnicities, etc. are also included.
  • the profile information includes information on overseas experience, information on language used, age, and the like.
  • the profile information may include information about interaction history on the SNS.
  • Profile information may be linked to information on a mobile terminal (smartphone, etc.) owned by the user and automatically updated.
  • the profile information may be acquired by reading from information managed by a public institution (for example, My Number Card, American Green Card, etc.).
  • the profile information is regularly or irregularly output to the server 200 and other information processing devices 100 via the communication unit 20 .
  • the profile information may be changed (updated) by operating the operation unit 60 or the like, and transmitted to an external device such as the server 200 each time the value changes.
  • the programs stored in the storage unit 30 include programs for moving avatars.
  • the storage unit 30 also stores information about virtual space, information about music, and the like. Part or all of this information may be stored in the internal memory of the information processing section 10, or may be obtained from an external device (for example, the server 200).
  • the output unit 40 has a display unit 40a that displays images, and a sound output unit 40b that outputs sounds.
  • the display unit 40a is a liquid crystal display, an organic EL display, or the like
  • the sound output unit 40b is a speaker, an earphone, or the like.
  • the output unit 40 may include a touch panel, a microphone, etc. functioning as an input unit, and may also function as an input/output unit.
  • the output unit (input/output unit) 40 may generate a signal based on the user's operation and a signal based on the user's voice, and output to the information processing unit 10 .
  • the output unit 40 may be a head mounted display (HMD).
  • the display unit 40a and the sound output unit 40b may be provided separately.
  • the display unit 40a displays images based on avatar information, objects that can be operated by the user, menu screens, and the like.
  • the display unit 40a displays an image of the other person's avatar based on the avatar information about the other person's avatar.
  • the display unit 40a displays, for example, a full body image, an upper body image, a face image, and the like.
  • the display unit 40a also displays an effect image, a background image, an object image, etc. given to the avatar.
  • the display unit 40a may also display an image of the own user's avatar when displaying the other person's avatar.
  • the display unit 40a may display images of the own user's avatar and other users' avatars viewed from a third-person perspective in the virtual space. Users can see their own avatars and avatars of other users communicating in the virtual space.
  • the sound output unit 40b outputs sounds, sound effects, etc. based on the avatar information.
  • the sound output unit 40b outputs the sound of the other person's avatar based on the other person's avatar information.
  • the sound output unit 40b also outputs effect sounds, music (BGM), etc. to be given to the avatar.
  • BGM music
  • the sound output part 40b may change or move the sound output position according to the movement of the avatar.
  • the user can view images and sounds of other users' avatars reproduced by the output unit 40 and interact with other users. It should be noted that the output unit 40 can also output images of other users based on information about images of other users.
  • the detection unit 50 is composed of an RGB camera, a depth camera, a motion capture device, a sound detection device, etc., and detects the state of the user.
  • the detection unit 50 may include sensors such as a line-of-sight sensor, an acceleration sensor, and a body temperature sensor.
  • the detection unit 50 generates information about the state of the user (hereinafter referred to as state information).
  • state information includes information about the user's actions (movements), information about the user's position, information about the user's voice, information about the user's facial expression, information about the user's line of sight (line of sight), and the like.
  • the detection unit 50 may include a depth sensor, a multi-view camera, etc., and may detect depth information and generate user state information.
  • the detection unit 50 detects the user's state at a predetermined cycle and repeatedly generates user's state information.
  • the state information generated by the detection unit 50 is output to the server 200 and other information processing devices 100 via the communication unit 20 on a regular or irregular basis. Part or all of the detection unit 50 may be provided outside the information processing device 100 . In this case, the detection unit 50 may repeatedly output the generated state information to the information processing device 100 and the server 200 periodically or irregularly.
  • the state information may be transmitted to an external device such as the server 200 every time the value changes.
  • the operation unit 60 includes members such as a power button (switch), operation buttons, keyboard, etc., and receives operations on the information processing device 100 .
  • the operation unit 60 detects an operation by a user and outputs a signal (operation signal) based on the operation.
  • the operation unit 60 may include the touch panel of the output unit 40 and a head-mounted display.
  • the information processing apparatus 100 can also accept an instruction by line-of-sight input or voice input based on the state of the user detected by the detection unit 50 or the voice input to the input/output unit 40 .
  • the information processing apparatus 100 can accept an operation on the information processing apparatus 100 by operating the operation unit 60, or accept an operation on the information processing apparatus 100 by a line of sight or voice.
  • the user can determine whether or not to use an avatar, which avatar to use, and the like, by operating the operation unit 60 or the like.
  • the information processing section 10 has an acquisition section 11 , a generation section 12 , a control section 13 , a state determination section 14 , and a permission determination section 15 .
  • a part or all of the acquisition unit 11, the generation unit 12, the control unit 13, the state determination unit 14, and the availability determination unit 15 are configured by a processor and a memory.
  • the acquisition unit 11 acquires state information about the state of the user, state information about the states of other users, profile information of the user, profile information of other users, operation signals, and the like.
  • the acquisition unit 11 acquires status information and profile information of other users from an external device via the communication unit 20, and acquires status information and profile information of the own user from the detection unit 50 and the storage unit 30. Then, an operation signal is obtained from the operation unit 60 .
  • Status information and profile information are input to the acquisition unit 11 regularly or irregularly.
  • the acquisition unit 11 is also an input unit for inputting status information, profile information, and the like.
  • the acquisition unit 11 may acquire situation information (atmosphere information of the communication space) related to situations in which multiple users communicate.
  • the situation information may be an integrated volume of voice, an integrated amount of conversation, an integrated amount of movement, or a predetermined facial expression value (e.g., positive value, negative value, etc.) of a single user or multiple users within a predetermined time. ), etc.
  • the acquisition unit 11 acquires other user's situation information from an external device via the communication unit 20 , acquires own user's situation information from the detection unit 50 , and acquires an operation signal from the operation unit 60 .
  • the generator 12 has a first generator 12a and a second generator 12b, which will be described later.
  • the first generating unit 12a generates avatar information as information used for controlling the avatar.
  • the avatar information includes data regarding the image of the avatar and data regarding the action of the avatar, as described above.
  • the avatar information may be information to which voice data, language data, etc. are added.
  • the avatar information may include information such as effects given to the avatar and objects to be displayed with the avatar.
  • the first generation unit 12a Based on the state information acquired by the acquisition unit 11, the first generation unit 12a generates avatar information including information indicating the image and state of the user's avatar.
  • the first generation unit 12a adds information indicating the action of the avatar to the avatar information using information indicating the action of the user included in the state information.
  • the first generating unit 12a uses the information indicating the user's voice included in the state information to add the information indicating the voice to the avatar information.
  • the image used as the avatar image is determined by the user, the information processing apparatus 100, or the like. For example, the user selects an image to be used as an avatar from multiple types of images stored in the storage unit 30 .
  • the first generation unit 12a generates avatar information indicating an image of the user's avatar based on selection by the user.
  • the first generation unit 12a repeatedly generates avatar information of other users using status information of other users sequentially input to the acquisition unit 11 .
  • the first generation unit 12a can also generate avatar information of the user based on the state information of the user.
  • the first generating unit 12a may output the generated own user's avatar information to the server 200 and other information processing devices 100 via the communication unit 20 on a regular or irregular basis. Note that the avatar information may be transmitted to an external device such as the server 200 every time the value changes.
  • the control unit 13 performs processing for controlling the avatar based on the control program.
  • the control unit 13 controls the image and sound of the avatar by controlling the output unit 40 .
  • the control unit 13 uses the avatar information of other users, the control unit 13 causes the display unit 40a to display an image based on the avatar information, and outputs a sound based on the avatar information from the sound output unit 40b.
  • the display unit 40a displays an image of the avatar performing the action indicated by the avatar information, and the sound output unit 40b outputs the sound indicated by the avatar information. Thereby, the user can view and listen to the images and sounds of other users' avatars.
  • the control unit 13 controls the image displayed by the display unit 40a and the sound output by the sound output unit 40b based on the information about the image and state of the avatar included in the avatar information. change.
  • the avatar information is reflected in the image displayed on the display unit 40a and the sound output from the sound output unit 40b.
  • the control unit 13 changes the image and voice of the other user's avatar according to the state (action, position, remark, etc.) indicated by the other user's state information.
  • the other user's avatar displayed on the display unit 40a moves in accordance with the movement of the other user.
  • a user can communicate with an avatar that moves in accordance with the actions of other users.
  • the action of ⁇ waving the palm left and right'' which has the meaning of ⁇ restraint and denial'' for Japanese, has the meaning of ⁇ smell'' in English-speaking countries such as the United States.
  • Japan the act of "sticking out your tongue” can be considered an act of misconductuling or insulting the other person, but in China it is a greeting that expresses "respect for the other person.”
  • the motion of "bringing the upper and lower teeth together to show the gums” is a motion that expresses a strong feeling of "anger” toward the other party.
  • the action of crossing the index and middle fingers is a sign of good luck in English-speaking countries, but it is a sign of insult in Vietnam.
  • Information processing apparatus 100 estimates actions that have different meanings for the own user and for other users based on the user's own profile information and other users' profile information. Based on the estimation result, the information processing apparatus 100 performs processing for converting the action to be performed by the avatar so that the action of the avatar is suitable for the other user. It can be said that the information processing apparatus 100 translates actions such as gestures.
  • the information processing apparatus 100 can control avatars in consideration of differences in culture, etc., and can prevent situations in which misunderstandings occur during communication. Processing performed by the information processing apparatus 100 will be further described below.
  • the second generation unit 12b of the information processing unit 10 refers to the profile information of each user acquired by the acquisition unit 11, and estimates, for each user, the behavior of the user that may require conversion. .
  • the second generation unit 12b estimates user gestures, hand signs, sign language, etc. that may require conversion.
  • the second generation unit 12b compares the estimated motions of each user and generates information (hereinafter referred to as a comparison table) regarding the correspondence between motions that may require conversion between users. In this case, the second generating unit 12b generates a comparison table by associating the actions of the user having the same intention with the actions of other users.
  • the comparison table serves as information indicating the correspondence between the user's motion and the other user's motion, and is used for conversion (replacement) of the avatar's motion.
  • the second generation unit 12b may generate, as a comparison table, information indicating the correspondence between the user's actions and the meanings of the actions.
  • the second generation unit 12b may generate a comparison table each time the acquisition unit 11 acquires new profile information of another user.
  • FIG. 3 is a diagram for explaining an example of the comparison table according to the embodiment.
  • FIG. 3(a) shows a possible operation example of user A and user B
  • FIG. 3(b) schematically shows an example of a comparison table.
  • the second generating unit 12b estimates the motion of the user A that may require conversion of the motion.
  • the second generation unit 12b estimates user B's motion that may require motion conversion based on user B's profile information.
  • the second generator 12b generates information indicating the estimated motion of user A and information indicating the estimated motion of user B, as schematically shown in FIG.
  • the second generation unit 12b compares the assumed actions of user A and the actions of user B, and selects actions that are assumed to require conversion. In the example shown in FIGS. 3A and 3B, for user A, “motion 2", “motion 4", “motion 5", “motion 7", and “motion 10" are selected. For user B, “motion b”, “motion d”, “motion e”, “motion g”, and “motion j" are selected.
  • the second generation unit 12b associates (associates) the actions of user A and the actions of user B.
  • the meaning of "motion 2" shown in FIG. 3 for user A is the same as the meaning for user B of "motion b". Therefore, the second generation unit 12b associates user A's "motion 2" with user B's "motion b".
  • the meaning of "motion 4" for user A and the meaning of "motion d" for user B are the same.
  • the second generator 12b associates user A's "motion 4" with user B's "motion d".
  • the second generating unit 12b generates a comparison table showing the motions of the user A and the motions of the user B that are associated with each other.
  • the second generation unit 12b deletes the data of the motion for which it is determined that conversion is not necessary, so that it is not included in the comparison table. good too.
  • the comparison table generated by the second generation unit 12b is stored in the storage unit 30.
  • FIG. The comparison table indicates actions to be converted, and is generated and registered in advance, for example, before the start of conversation. The generation processing and storage processing of the comparison table are performed before the start of communication.
  • the second generation unit 12b compares the actions of each user based on the user's A to C profile information and generates a comparison table.
  • the second generation unit 12b may compare the comparison table between users A and B and the behavior of user C estimated from the profile information of user C, and update the comparison table.
  • the second generator 12b may generate a common comparison table among users A, B, and C.
  • FIG. Also, the second generation unit 12b may generate a comparison table between each user. In this case, the second generation unit 12b generates a comparison table indicating the correspondence between the actions of the user A and the actions of the user B, a comparison table indicating the correspondence between the actions of the user B and the actions of the user C, and the user A comparison table showing the correspondence between C's actions and user A's actions may be generated.
  • the comparison table may be stored in a memory inside the information processing section 10 .
  • the second generation unit 12b may periodically or irregularly output the generated comparison table to the server 200 and other information processing devices 100 via the communication unit 20 .
  • the state determination unit 14 uses the user's state information to perform processing for determining the state of the user.
  • the state determination unit 14 compares the user's state information with the comparison table, and determines (determines) whether or not the user's action indicated by the state information is the action listed in the comparison table.
  • the state determination unit 14 determines whether or not the user has performed an action included in the comparison table, and generates a signal (determination signal) indicating the determination result.
  • the state determination unit 14 detects a state that requires conversion processing and generates a determination signal indicating the detection result.
  • the state determination unit 14 refers to the comparison table to determine whether or not the user has performed a predetermined gesture, whether or not the user has performed a predetermined hand sign, whether or not the user has performed predetermined sign language, and the like. .
  • the first generation unit 12a Based on the user's state information and the comparison table, the first generation unit 12a generates information about the state of the avatar (hereinafter referred to as "avatar additional information") as information additionally used for controlling the avatar together with the above-described avatar information. ).
  • avatar additional information is information for causing the avatar to perform a converted action, and includes information on the avatar's action, information on the avatar's facial expression, information on the avatar's voice, and the like.
  • the avatar additional information includes, for example, information related to upper-body or whole-body movements (gestures, etc.).
  • the first generation unit 12a When the first generation unit 12a recognizes that the user performs an action that requires conversion from the determination signal of the state determination unit 14, the first generation unit 12a refers to the correspondence shown in the comparison table for the action, and Determines avatar behavior.
  • the first generator 12a generates avatar additional information indicating the determined avatar action.
  • the first generation unit 12a converts, for example, a motion having the first meaning in the country to which the user A belongs into a motion having the same first meaning in the country to which the user B belongs, and converts the motion after the conversion into Generate additional avatar information to show.
  • the first generation unit 12a refers to the comparison table to generate "motion Select "motion b" corresponding to "2". Further, for example, when the user B performs "motion d”, the first generation unit 12a refers to the comparison table and selects "motion 4" corresponding to "motion d" as the action of the user B's avatar. to select.
  • the first generation unit 12a generates avatar additional information for causing the avatar to perform actions suitable for the other user when an action included in the comparison table is detected. Therefore, when an action included in the comparison table is detected, the action of the avatar can be automatically converted.
  • the avatar additional information generated by the first generation unit 12 a may be output to the server 200 and other information processing devices 100 via the communication unit 20 .
  • the availability determination unit 15 determines whether or not to control the avatar based on the avatar additional information.
  • the propriety determination unit 15 determines whether or not to control the avatar based on the avatar additional information based on the user's speech and facial expression indicated by the user's status information, the user's operation of the operation unit 60, and the like.
  • the approval/disapproval determination unit 15 generates a signal (determination signal) indicating a determination result as to whether or not control based on the avatar additional information is permitted.
  • the availability determination unit 15 and the above-described state determination unit 14 may be configured integrally.
  • the propriety determination unit 15 determines whether or not to control the avatar based on the avatar additional information, for example, based on the degree of intimacy between the user and other users. For example, if the degree of intimacy is low, the propriety determination unit 15 determines to control the avatar based on the avatar additional information, and if the degree of intimacy is high, determines not to control the avatar based on the avatar additional information.
  • the propriety determination unit 15 may determine the degree of intimacy between users based on the user's actions (behavior), remarks, facial expressions, etc. grasped by the user's state information.
  • the availability determination unit 15 may determine that the degree of intimacy is high when the conversation time between the users is longer than or equal to a predetermined time, and determine that the degree of intimacy is low when the conversation time is less than the predetermined time. .
  • the availability determination unit 15 may determine that the degree of intimacy is high when the user makes a predetermined statement, or may determine that the degree of intimacy is high when the user performs a predetermined action.
  • the propriety determination unit 15 may determine the degree of intimacy based on the flow of conversation, tone of voice, facial expression, past exchanges between users, and the like.
  • the acceptability determination unit 15 quantifies and adds the words used in the conversation, tone of voice, facial expressions, interaction history on SNS, etc., and if the added value is equal to or greater than a predetermined threshold, it is determined that the degree of intimacy is high. If the added value is less than the threshold, it may be determined that the degree of intimacy is low.
  • the propriety determination unit 15 may update the degree of intimacy at predetermined time intervals. In this case, the availability determining unit 15 may predict a change in the degree of intimacy, and determine that the degree of intimacy is high when it is predicted that the degree of intimacy will exceed the threshold value within a predetermined period of time. The propriety determination unit 15 may determine the degree of intimacy in consideration of the history of the degree of intimacy in the past.
  • the acceptability determination unit 15 may suppress the decrease in intimacy when users A and B quarrel. .
  • the availability determination unit 15 may determine the degree of intimacy between each user each time a new user is added.
  • the control unit 13 determines whether or not to perform control using the avatar additional information. When the control based on the avatar additional information is permitted, the control unit 13 switches between control of the avatar based on the avatar information and control of the avatar based on the avatar additional information. The control unit 13 changes the image displayed by the display unit 40a according to the avatar additional information. Note that the control unit 13 may also change the sound output by the sound output unit 40b according to the avatar additional information.
  • the display unit 40a displays an image of the avatar performing the action indicated by the avatar additional information
  • the sound output unit 40b outputs the sound (for example, effect sound) indicated by the avatar additional information.
  • the avatar additional information is reflected in the image displayed on the display unit 40a and the sound output from the sound output unit 40b.
  • the control unit 13 and the output unit 40 can use the avatar additional information to cause the avatar to perform actions such as gestures suited to the other user.
  • the information processing device 100 may allow the user to select whether or not to allow control of the avatar based on the avatar additional information by means of the user's operation (operation of the operation unit 60, voice input, etc.).
  • the information processing apparatus 100 is in a state (first mode) in which control based on the avatar additional information is permitted, or in a state (second mode) in which control based on the avatar additional information is not permitted, by operating the operation unit 60 or the like by the user. ) may be settable.
  • the availability determination unit 15 generates a determination signal indicating that the control based on the avatar additional information is permitted when the first mode is set, and when the second mode is set, A determination signal may be generated indicating that the control based on the avatar additional information is not permitted.
  • the information processing apparatus 100 displays an image 80 (80a, 80b) indicating that the first mode is set, as in the example schematically shown in FIG. may be displayed together with the image of the avatar.
  • an image 80a is an image displayed on the display unit 40a of the information processing apparatus 100 on the user B side, and indicates that the user A has set the first mode. .
  • An image 80b is an image displayed on the display unit 40a of the information processing apparatus 100 on the user A side, and indicates that the user B has set the first mode.
  • the images 80a and 80b may be images of colors (personal colors) assigned to the users A and B, respectively.
  • the information processing apparatus 100 may not display the image 80 (80a, 80b) as shown in FIG. 4(b).
  • Information processing apparatus 100 may display an image indicating that the second mode is set.
  • FIG. 4(a) shows an example in which both user A and user B have selected the first mode, and the motions of the avatars of users A and B are converted.
  • FIGS. 4A and 4B it is assumed that user A is Japanese and user B is American.
  • the action of "showing the palm to the opponent and shaking it left and right” means “goodbye”
  • the action of "showing the palm and bending and stretching the fingers of the hand” means “goodbye”.
  • user A's avatar is automatically converted, user A's avatar "shows palm and bends and stretches fingers” instead of user A's action of "showing palm to opponent and shaking left and right”. take action.
  • On the display unit 40a of the information processing device 100 on the user B side an image of an avatar of the user A performing the action of "showing the palm and bending and stretching the fingers of the hand” is displayed.
  • the avatar of user B when the avatar of user B is automatically converted, the avatar of user B performs the action of "showing the palm to the other party and bending and stretching the fingers of the hand” instead of “showing the palm and bending and stretching the fingers of the hand” performed by user B. "Shake” action.
  • an image of an avatar of the user B performing the action of "showing the palm to the opponent and shaking it left and right” is displayed.
  • both user A and user B select the second mode, and the actions of the avatars of users A and B are not converted.
  • the user himself/herself can try a motion that matches the other user.
  • user A corresponds to user B, and when conveying "goodbye", instead of "showing the palm of the other party and shaking it left and right", "show the palm and bend and extend the fingers of the hand". 'is working.
  • the information processing apparatus 100 switches whether to automatically convert the motion of the avatar based on the user's selection.
  • the information processing apparatus 100 can reflect the user's intentions in the screen display, and can prevent conversions unintended by the user from being performed without permission. Also, each user can communicate while confirming whether or not the avatar is being automatically converted.
  • the information processing section 10 generates avatar additional information used for controlling the avatar based on the user's profile. Therefore, the information processing section 10 can change the state of the avatar in consideration of cultural differences and the like.
  • the user can cause the avatar to perform an action corresponding to the other user, and can avoid a situation where the meaning of the action such as a gesture is not understood. It is possible to overcome barriers such as cultural differences and communicate.
  • the information processing section 10 determines whether or not to automatically convert the actions of the avatar according to the degree of intimacy between users, the user's intention, and the like. Therefore, the avatars can be appropriately controlled in consideration of the degree of intimacy between users and the like. It is possible to prevent excessive automatic conversion of actions.
  • the information processing unit 10 cancels the user's action so that the avatar does not perform it. You may make it Further, the information processing section 10 may cause the avatar to perform general actions that are determined to be close to the user's actions.
  • the information processing unit 10 replaces the action of the avatar with a positive action (for example, a "smiling" expression) or a negative action (for example, a "smiling" expression).
  • FIG. 5 is a flowchart showing an operation example of the information processing device 100 according to the embodiment.
  • the process shown in FIG. 5 is executed, for example, when the operation unit 60 is operated in each of the information processing devices 100 of the user A and the user B shown in FIGS. 1 and 2 and communication using an avatar is started. be.
  • processing in the information processing device 100b of the user B will be mainly described.
  • step S100 the state determination unit 14 determines whether or not user A has performed an action included in the comparison table based on the state information of user A and the comparison table described above.
  • the generation unit 12 refers to the comparison table and selects an avatar to be used for controlling the avatar of the user A according to the state of the user A. Additional information is generated, and the process proceeds to step S110. If a negative determination is made in step S100, avatar additional information is not generated, and the process proceeds to step S130.
  • step S110 the propriety determination unit 15 determines whether or not to control the avatar based on the avatar additional information, based on the intimacy of the users A and B and the set mode (first mode and second mode described above). to decide. In this case, for example, when it is determined that the degree of intimacy between users A and B is low and the above-described first mode is set, the propriety determination unit 15 determines to perform avatar control based on the avatar additional information. do. If it is determined that users A and B have a high degree of intimacy, or if the above-described second mode is set, the propriety determination unit 15 determines not to control the avatars based on the avatar additional information. If the availability determination unit 15 determines to control the avatar based on the avatar additional information, the process proceeds to step S120, and if a negative determination is made in step S110, the process proceeds to step S130.
  • step S120 the control unit 13 controls the avatar of user A by controlling the output unit 40 using the avatar additional information.
  • the output unit 40 displays an avatar image of user A performing actions suitable for user B based on the avatar additional information generated according to user A's actions and the comparison table.
  • step S130 when user A or user B performs an operation to end communication using an avatar, the information processing apparatus 100 ends the processing shown in FIG. 5, and returns to step S100 when a negative determination is made in step S130. .
  • the first generation unit 12a can generate avatar additional information based on the situation information (atmosphere information of the communication space).
  • the avatar additional information includes information about the avatar's actions, information about the avatar's facial expressions, information about the avatar's voice, and the like.
  • the availability determination unit 15 determines whether or not to control the avatar based on the avatar additional information.
  • the propriety determination unit 15 determines the situation (atmosphere) of the communication space based on situation information related to situations in which a plurality of users communicate. In one example, the liveliness (excitement level) of the communication space can be calculated based on multiple parameter values related to the situation information.
  • the availability determination unit 15 compares the calculated liveliness with a single or a plurality of predetermined values (thresholds). Based on the comparison result, the propriety determination unit 15 determines whether or not to control the avatar based on the avatar additional information.
  • the propriety determination unit 15 determines to control the avatar based on the avatar additional information so that the avatar moves loudly and sounds loud. If the liveliness is low, the propriety determination unit 15 determines to control the avatar based on the avatar additional information so that the avatar's motion is small and the avatar's voice is small. The propriety determination unit 15 determines not to control the avatar based on the avatar additional information when the liveliness is medium (standard).
  • the propriety determination unit 15 may determine the degree of liveliness between users based on the user's actions (acts), remarks, facial expressions, etc. grasped by the user's state information. The propriety determination unit 15 may determine that the liveliness is high when the user makes a specific statement, or may determine that the liveliness is high when the user performs a predetermined action. The propriety determination unit 15 may determine the liveliness based on the flow of conversation, tone of voice, facial expression, past exchanges between users, and the like. The propriety determination unit 15 quantifies and adds the words, tone, facial expressions, etc. used in the conversation, and determines that the degree of liveliness is high when the added value is equal to or greater than a predetermined threshold value. If the value obtained is less than the threshold, it may be determined that the activity level is low.
  • the propriety determination unit 15 may update the liveliness at predetermined time intervals. In this case, the propriety determination unit 15 may predict a change in the liveliness, and determine that the liveliness is high when it is predicted that the liveliness will exceed the threshold value within a predetermined period of time. The propriety determination unit 15 may determine the degree of vigor in consideration of the history of the degree of vigor in the past. When it is estimated from the history that the communication between the user A and the user B is normally highly active, the propriety determination unit 15 increases the threshold for determination of the level of vigor in the communication space including the user A and the user B. may The propriety determination unit 15 may determine the degree of vigor among users each time a new user is added.
  • the control unit 13 determines whether or not to perform control using the avatar additional information. When the control based on the avatar additional information is permitted, the control unit 13 switches between control of the avatar based on the avatar information and control of the avatar based on the avatar additional information. The control unit 13 changes the image displayed by the display unit 40a and changes the sound output by the sound output unit 40b according to the avatar additional information.
  • the display unit 40a displays an image of the avatar performing the action indicated by the avatar additional information
  • the sound output unit 40b outputs the sound indicated by the avatar additional information.
  • the avatar additional information is reflected in the image displayed on the display unit 40a and the sound output from the sound output unit 40b.
  • the control unit 13 and the output unit 40 can use the avatar additional information to cause the avatar to perform an optimum action that matches the atmosphere of the communication space.
  • the avatar additional information used to control the avatar is generated based on the atmosphere of the communication space. Therefore, the actions and voices of the avatars are controlled according to the atmosphere of the communication space, promoting communication between users. That is, the avatar's actions and sounds are optimized according to the situation of the communication space.
  • FIG. 6 is a flowchart showing an operation example of the information processing apparatus 100 according to the embodiment, taking into consideration the atmosphere of the communication space.
  • the processing shown in FIG. 6 is executed, for example, when the operation unit 60 is operated in each of the information processing devices 100 of the user A and the user B shown in FIGS. 1 and 2 and communication using an avatar is started. be.
  • processing in the information processing device 100b of the user B will be mainly described.
  • step S210 the propriety determination unit 15 determines whether or not to control the avatar based on the avatar additional information, based on the situation information related to the situation in which multiple users communicate. In this case, for example, the propriety determination unit 15 determines to control the avatar based on the avatar additional information when it is determined that the liveliness of the communication space is low or high. If the liveliness of the communication space is determined to be medium (standard), the propriety determining unit 15 determines not to control the avatar based on the avatar additional information. If the availability determination unit 15 determines to control the avatar based on the avatar additional information, the process proceeds to step S220, and if a negative determination is made in step S210, the process proceeds to step S230.
  • step S220 the control unit 13 controls the avatar of user A by controlling the output unit 40 using the avatar additional information. Based on the avatar additional information, the output unit 40 displays an avatar image of the user A performing actions and voice output that match the atmosphere of the communication space.
  • step S230 when user A or user B performs an operation to end communication using an avatar, the information processing apparatus 100 ends the processing shown in FIG. .
  • the size of user A's or user B's movements may be optimized.
  • the propriety determination unit 15 determines whether or not the size of the motion of user A or user B has reached a predetermined size. If the propriety determination unit 15 determines that the size of the motion of the user A or the user B has not reached the predetermined size, the control unit 13 controls the size of the motion of the avatar to reach the predetermined size. to control the first generator 12a. For example, if the hand swing of user A is smaller than a predetermined size, control is performed to increase the hand swing.
  • small actions corresponding to various actions may be stored in the storage unit 30, and when the user performs a certain small action, the avatar may perform the corresponding action. For example, when the user shakes his/her index finger sideways, it is stored in association with the meaning of "goodbye" and a big wave of the hand.
  • the first generator 12a is controlled so that the avatar waves its hand.
  • the information processing device 100 acquires first information related to the profile of the first user, second information related to the profile of the second user, and third information related to the state of the first user.
  • the generation unit 12 performs motion conversion processing based on the user's profile information and state information, and generates avatar additional information representing the converted motion of the avatar.
  • the control unit 13 controls the other person's avatar based on the avatar additional information. Therefore, the information processing apparatus 100 can cause the avatar to perform an action suitable for the other user. This makes it possible to achieve communication that transcends barriers such as cultural differences.
  • Information processing apparatus 100 determines whether or not to automatically convert the motion of an avatar based on the degree of intimacy between users, the user's intention, and the like. Therefore, the avatars can be appropriately controlled in consideration of the degree of intimacy between users and the like. Excessive automatic conversion of actions can be suppressed.
  • the information processing apparatus 100 determines whether or not to automatically convert the motion of the avatar based on the atmosphere of the communication space between users. Therefore, the actions and voices of the avatars are controlled according to the atmosphere of the communication space, promoting communication between users.
  • the first generation unit 12a of the information processing device 100 generates avatar additional information used for controlling the user's avatar based on the state information of the user and the comparison table, and transmits the avatar additional information to the server 200 and the server 200 via the communication unit 20 and the like. You may make it transmit to the other information processing apparatus 100.
  • the information processing device 100a of the user A displays the image of the avatar and outputs the voice based on the avatar additional information generated by the first generation unit 12a in the information processing device 100b of the user B.
  • FIG. Thereby, user A can view user B's avatar image and voice that have been converted to match user A's.
  • a part of the information processing unit 10 of the information processing device 100 may be provided in the server 200 (information processing device 200).
  • the server 200 may have part or all of the acquisition unit 11 , the generation unit 12 , the control unit 13 , the state determination unit 14 , and the availability determination unit 15 .
  • the information processing device 100 and the server 200 can be collectively referred to as an information processing device.
  • a plurality of information processing apparatuses 100 and the server 200 connected through lines can be collectively referred to as an information processing apparatus.
  • the server 200 includes an acquisition unit that acquires state information about the state of the user, a generation unit that generates avatar information, a comparison table, and avatar additional information, avatar information, etc. to an external device.
  • the server 200 also has a state determination unit that determines the states of the user and the avatar, and a propriety determination unit that determines whether or not to perform control based on the avatar additional information.
  • the acquisition unit of the server 200 acquires user A's profile information and status information from user A's information processing device 100a, and acquires user B's profile information and status information from user B's information processing device 100b.
  • the generation unit of the server 200 generates a comparison table using the user A and B profile information.
  • the generation unit can generate avatar additional information using the state information of users A and B and the comparison table based on the determination result by the state determination unit.
  • the communication unit of server 200 transmits user A's avatar information and avatar additional information to user B's information processing device 100b, and transmits user B's avatar information and avatar additional information to user A's information processing device 100a.
  • the communication unit transmits user A's avatar information and avatar additional information to both information processing apparatuses 100a and 100b, and transmits user B's avatar information and avatar additional information to both information processing apparatuses 100a and 100b. good too.
  • the communication unit may transmit avatar additional information according to the determination result of the availability determination unit. For example, when it is determined that the avatar is controlled based on the avatar additional information of the user A, the communication unit transmits the avatar additional information of the user A and controls the avatar based on the avatar additional information of the user B. If determined, user B's avatar additional information may be transmitted.
  • User A's information processing device 100a displays avatar images and outputs audio based on user B's avatar information and avatar additional information. User A can view the avatar image and voice of user B, and can communicate with them. User B's information processing device 100b displays an avatar image and outputs audio based on user A's avatar information and avatar additional information. User B can view the avatar image and voice of user A and can communicate with them.
  • a device that generates a smell (aroma) may be provided inside or outside the information processing device 100 .
  • the information processing device 100 may control the odor generating device to reproduce the odor when the avatar performs an odor-related action (for example, an action having the meaning of "smell").
  • the information processing apparatus may be configured by causing a computer (processor) to execute a program that performs processing based on the flowcharts described above.
  • the program can be supplied as computer program products in various forms, such as storage media and provision via communication lines.
  • an avatar is described as an example of a controlled object associated with a user, but the controlled object is not limited to an avatar, and may be, for example, a robot associated with a user.
  • the present invention can also be applied when determining the control contents such as the motion of the robot.

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

情報処理装置は、第1ユーザのプロフィールに関連する第1情報と、第2ユーザのプロフィールに関連する第2情報と、前記第1ユーザの状態に関連する第3情報とを取得する取得部と、前記第1情報と前記第2情報と前記第3情報とに基づいて、前記第1ユーザに関連付けられた制御対象の制御に用いる第4情報を生成する生成部と、を備える。

Description

情報処理装置、プログラム、及び、情報処理方法
 本発明は、情報処理装置、プログラム、及び、情報処理方法に関する。
 本願は、2021年4月8日に出願された特願2021-066019号に基づき優先権を主張し、その内容をここに援用する。
 ユーザの顔の表情および頭部姿勢に基づいて、ユーザのグラフィック表現としてのアバターをアニメートするように構成されたアバターシステムが知られている(特許文献1)。
特表2018-530017号公報
 第1の態様によると、情報処理装置は、第1ユーザのプロフィールに関連する第1情報と、第2ユーザのプロフィールに関連する第2情報と、前記第1ユーザの状態に関連する第3情報とを取得する取得部と、前記第1情報と前記第2情報と前記第3情報とに基づいて、前記第1ユーザに関連付けられた制御対象の制御に用いる第4情報を生成する生成部と、を備える。
 第2の態様によると、情報処理装置は、第1の意味を有する第1動作に関する第1情報を取得する取得部と、前記第1の意味を有し前記第1動作とは異なる第2動作に関する第2情報を、前記第1情報に基づいて生成する生成部と、を備える。
 第3の態様によると、プログラムは、第1ユーザのプロフィールに関連する第1情報と、第2ユーザのプロフィールに関連する第2情報と、前記第1ユーザの状態に関連する第3情報とを取得する処理と、前記第1情報と前記第2情報と前記第3情報とに基づいて、前記第1ユーザに関連付けられた制御対象の制御に用いる第4情報を生成する処理と、をプロセッサに実行させる。
 第4の態様によると、情報処理方法は、第1ユーザのプロフィールに関連する第1情報と、第2ユーザのプロフィールに関連する第2情報と、前記第1ユーザの状態に関連する第3情報とを取得することと、前記第1情報と前記第2情報と前記第3情報とに基づいて、前記第1ユーザに関連付けられた制御対象の制御に用いる第4情報を生成することと、を含む。
 第5の態様によると、情報処理方法は、第1の意味を有する第1動作に関する第1情報を取得することと、前記第1の意味を有し前記第1動作とは異なる第2動作に関する第2情報を、前記第1情報に基づいて生成することと、を含む。
 第6の態様によると、情報処理装置は、第1ユーザの動作に関連する第1情報、および、第2ユーザに関連する第2情報を取得する取得部と、前記第1情報および前記第2情報に基づいて、前記第1ユーザの動作を前記第2ユーザに適応した動作に変換した情報を生成する生成部と、を備える。
 第7の態様によると、情報処理方法は、第1ユーザの動作に関連する第1情報、および、第2ユーザに関連する第2情報を取得することと、前記第1情報および前記第2情報に基づいて、前記第1ユーザの動作を前記第2ユーザに適応した動作に変換した情報を生成することと、を含む。
 第8の態様によると、情報処理装置は、第1ユーザの動作に関連する第1情報、および、前記第1ユーザが他のユーザとコミュニケーションをとる状況に関連する第2情報を取得する取得部と、前記第1情報および前記第2情報に基づいて、前記第1ユーザの動作を変換した第3情報を生成する生成部と、を備える。
 第9の態様によると、情報処理方法は、第1ユーザの動作に関連する第1情報、および、前記第1ユーザが他のユーザとコミュニケーションをとる状況に関連する第2情報を取得することと、前記第1情報および前記第2情報に基づいて、前記第1ユーザの動作を変換した第3情報を生成することと、を含む。
実施の形態に係る情報通信システムの構成例を模式的に示す図である。 実施の形態に係る情報通信システムの構成例を示すブロック図である。 実施の形態に係る対比テーブルの一例を説明するための図である。 実施の形態に係る情報処理装置による処理の一例を説明するための図である。 実施の形態に係る情報処理装置の動作例を示すフローチャートである。 実施の形態に係る情報処理装置の動作例を示すフローチャートである。
(実施の形態)
 図1は、実施の形態に係る情報通信システム1の構成例を模式的に示す図である。情報通信システム(情報処理システム)1は、複数の情報処理装置100(図1に示す例では、情報処理装置100a、情報処理装置100b)と、情報処理装置200(図1に示す例ではサーバー200)とを含む。情報処理装置100は、ネットワークに接続可能であり、サーバー200及び他の情報処理装置100と通信可能に構成される。サーバー200は、集中型のサーバーであってもよいし、分散型のサーバーであってもよい。
 情報通信システム1では、複数の情報処理装置100及びサーバー200が通信を行って、ユーザに関連付けられた制御対象(本実施形態ではアバター)の制御が行われる。情報通信システム1においては、ユーザの状態に基づいてアバターに関連する情報(以下、アバター情報と称する)が生成され、アバターの制御に用いられる。
 アバターは、画像、音声、テキスト等により表現され、自身を示すものとして用いられる。アバターは、分身または化身として使用されるものともいえる。アバターの画像には、ユーザを模したもの、イラスト化したもの、仮想キャラクター、その他ユーザの代わりとなり得るオブジェクトが用いられる。アバターは、ユーザとの関連付け(対応付け)が行われ、ネットワーク上でのコミュニケーションに利用される。
 アバター情報は、アバターの画像として用いる画像に関する情報、アバターの動作に関する情報、アバターの音声に関する情報等を含む。情報通信システム1では、アバター情報の生成、送受信が行われ、ユーザがアバターを用いたコミュニケーションを行うことが可能となる。ユーザと他者のアバターとのコミュニケーション、ユーザのアバターと他者のアバターとのコミュニケーションを行い得る。
 情報処理装置100a、100bは、端末(端末装置)であり、それぞれ、ユーザA、ユーザBにより利用される。情報処理装置100aは、情報処理装置100bを使用するユーザBのアバター情報を用いて、ユーザBのアバターの画像及び音声を出力する。情報処理装置100bは、情報処理装置100aを使用するユーザAのアバター情報を用いて、ユーザAのアバターの画像及び音声を出力する。これにより、ユーザAとユーザBは、相手のアバターを見ながらコミュニケーションを行うことができる。
 なお、情報処理装置100は、他の情報処理装置100及びサーバー200と通信を行って、他のユーザ本人の画像に関する情報を取得し、他のユーザ本人の画像も出力可能である。情報通信システム1では、ユーザは、自身はアバターを使用せずに他者のアバターとコミュニケーションを行うこともできる。
 図2は、実施の形態に係る情報通信システム1の構成例を示すブロック図である。情報処理装置100は、情報処理部10と、通信部20と、記憶部30と、出力部40と、検出部50と、操作部60とを備える。情報処理装置100は、コンピュータ、スマートフォン、タブレット端末、ウェアラブル端末等の電子機器により構成される。情報処理部10、通信部20、記憶部30、出力部40、検出部50、及び操作部60は、有線通信または無線通信によって情報を送受信する。
 情報処理部10は、プロセッサ及びメモリを有し、プログラムに基づいて情報処理を行う。情報処理部10は、CPU、GPU、FPGA、ASIC等のデバイス、及びROM、RAM等のメモリを有する。情報処理部10は、制御部でもあり、メモリに格納されたプログラムを読み込んで実行し、情報処理装置100の各部の制御を行う。情報処理部10は、信号処理を行う信号処理部ともいえる。情報処理部10は、通信部20を介して、サーバー200及び他の情報処理装置100と双方向に情報を送受信する通信を行う。
 通信部20は、通信モジュール等により構成され、サーバー200及び他の情報処理装置100と通信し得る。通信部20は、画像データ、音声データ、位置データ等、情報の送受信を行う。通信部20は、サーバー200及び他の情報処理装置100との通信によって、他ユーザのプロフィールに関する情報、他ユーザの状態に関する情報、他ユーザのアバターに関する情報を取得する。なお、情報処理装置100は、サーバー200を介さずに、他の情報処理装置100と通信するようにしてもよい。
 記憶部30は、不揮発性の記憶媒体等により構成され、プログラム及びデータが記憶(記録)される。記憶部30は、ROM、フラッシュメモリ等のメモリ、ハードディスク、SSD等の記憶装置であり、種々の情報が記憶される。記憶部30に記憶される情報には、情報処理装置100の各部の制御に用いるプログラム及びデータ、アバター情報の生成に用いるプログラム及びデータ、アバターを利用したコミュニケーションを行う際に用いられるプログラム及びデータ等がある。
 記憶部30には、ユーザのプロフィールに関連する情報(以下、プロフィール情報と称する)が記憶される。プロフィール情報は、ユーザによる操作部60の操作、音声等によって入力され、記憶部30に記憶される。プロフィール情報は、情報処理装置100及びサーバー200により自動的に取得され、記憶部30に記憶されてもよい。例えば、プロフィール情報は、地理学的プロフィール(geographic profile)人口統計学的プロフィール(demographic profile)、発育的プロフィール(developmental profile)を含む。ユーザのプロフィール情報としては、現在の情報、例えば現在の居住国、居住地域、勤務地、国籍、母国語、性別、所属する組織(会社、学校等)、宗教、民族などが挙げられる。また、プロフィール情報としては、現在の居住国、現在の勤務地等の現在の情報だけでなく、過去の情報、例えば過去の居住国、居住地域、勤務地、国籍、母国語、性別、所属する組織、宗教、民族なども挙げられる。さらに、プロフィール情報には、海外経験に関する情報、使用言語に関する情報、年齢なども含まれる。プロフィール情報は、SNSにおける交流履歴に関する情報を含んでいてもよい。プロフィール情報は、ユーザが所有するモバイル端末(スマートフォン等)の情報とリンクされて、自動的に更新されてもよい。また、プロフィール情報は、公的機関が管理する情報(例えば、マイナンバーカード、アメリカのグリーンカード等)から読み取って取得されてもよい。プロフィール情報は、定期的又は不定期に、通信部20を介してサーバー200及び他の情報処理装置100に出力される。なお、プロフィール情報は、操作部60の操作等によって変更(更新)され、その値が変化する毎にサーバー200等の外部機器へ送信されるようにしてもよい。
 記憶部30に記憶されるプログラムには、アバターを動かすためのプログラムが含まれる。また、記憶部30には、仮想空間に関する情報、音楽に関する情報等も記憶される。なお、これらの情報の一部または全部は、情報処理部10の内部のメモリに記憶するようにしてもよいし、外部の機器(例えばサーバー200)から取得するようにしてもよい。
 出力部40は、画像を表示する表示部40a、及び、音を出力する音出力部40bを有する。表示部40aは、液晶ディスプレイ、有機ELディスプレイ等であり、音出力部40bは、スピーカー、イヤホン等である。出力部40は、入力部として機能するタッチパネル、マイク等を含んでもよく、入出力部としても機能し得る。出力部(入出力部)40は、ユーザによる操作に基づく信号、ユーザの音声に基づく信号を生成し、情報処理部10に出力してもよい。出力部40は、ヘッドマウントディスプレイ(HMD)であってもよい。表示部40aと音出力部40bとは、別々に設けられてもよい。
 表示部40aは、アバター情報に基づく画像、ユーザが操作可能なオブジェクト、及びメニュー画面等を表示する。表示部40aは、他者のアバターに関するアバター情報に基づいて、他者のアバターの画像を表示する。表示部40aは、例えば、全身の画像、上半身の画像、顔の画像等を表示する。また、表示部40aは、アバターに与えられるエフェクト画像、背景画像、オブジェクト画像なども表示する。表示部40aは、他者のアバターを表示する際に、自ユーザのアバターの画像も表示するようにしてもよい。ユーザによる操作部60の操作等によって、他ユーザ側の情報処理装置100の表示部40aにおいて表示される自ユーザのアバターの画像を、自ユーザ側の情報処理装置100の表示部40aに表示するか否かを選択可能としてもよい。表示部40aは、仮想空間内の第三者目線で見た自ユーザのアバター及び他ユーザのアバターの画像を表示するようにしてもよい。ユーザは、仮想空間においてコミュニケーションを行う自ユーザのアバター及び他ユーザのアバターを見ることができる。
 音出力部40bは、アバター情報に基づく音声、効果音などを出力する。音出力部40bは、他者のアバター情報に基づいて、他者のアバターによる音声を出力する。音出力部40bは、アバターに与えられるエフェクト音、音楽(BGM)なども出力する。なお、音出力部40bは、複数個所から音声を出力可能な場合、アバターの動きに応じて、音声の出力箇所を変更、移動させるようにしてもよい。ユーザは、出力部40により再生される他のユーザのアバターの画像と音声を視聴し、他のユーザと交流を行うことができる。なお、出力部40は、他ユーザの画像に関する情報に基づいて、他ユーザ自身の画像も出力可能である。
 検出部50は、RGBカメラ、Depthカメラ、モーションキャプチャ装置、音検出装置等により構成され、ユーザの状態を検出する。検出部50は、視線センサ、加速度センサ、体温センサ等のセンサを含んでいてもよい。検出部50は、ユーザの状態に関する情報(以下、状態情報と称する)を生成する。状態情報には、ユーザの動作(動き)に関する情報、ユーザの位置に関する情報、ユーザの音声に関する情報、ユーザの表情に関する情報、ユーザの視線(目線)に関する情報等が含まれる。検出部50は、深度センサ、多眼カメラ等を含んで構成されてもよく、Depth情報を検出し、ユーザの状態情報を生成するようにしてもよい。
 検出部50は、ユーザの状態を所定の周期で検出し、ユーザの状態情報を繰り返し生成する。検出部50により生成される状態情報は、定期的又は不定期に、通信部20を介してサーバー200及び他の情報処理装置100に出力される。なお、検出部50の一部または全部を、情報処理装置100の外部に設けてもよい。この場合、検出部50は、生成した状態情報を、定期的又は不定期に、繰り返し情報処理装置100及びサーバー200に出力するようにしてもよい。状態情報は、その値が変化する毎に、サーバー200等の外部機器へ送信されるようにしてもよい。
 操作部60は、電源ボタン(スイッチ)、操作ボタン、キーボード等の部材を含み、情報処理装置100に対する操作を受け付ける。操作部60は、ユーザによる操作を検出し、操作に基づく信号(操作信号)を出力する。なお、操作部60は、出力部40のタッチパネル、ヘッドマウントディスプレイを含み得る。なお、情報処理装置100は、検出部50により検出されるユーザの状態または入出力部40に入力される音声に基づき、視線入力または音声入力による指示を受け付けることも可能である。情報処理装置100は、操作部60の操作によって情報処理装置100に対する操作を受け付けることも、視線又は音声によって情報処理装置100に対する操作を受け付けることもできる。ユーザは、操作部60の操作等によって、アバターの使用の有無、使用するアバター等を決定することが可能である。
 次に、本実施の形態に係る情報処理部10について、さらに説明する。情報処理部10は、取得部11と、生成部12と、制御部13と、状態判定部14と、可否判断部15とを有する。取得部11、生成部12、制御部13、状態判定部14、及び可否判断部15の一部または全部は、プロセッサ及びメモリにより構成される。
 取得部11は、自ユーザの状態に関する状態情報、他ユーザの状態に関する状態情報、自ユーザのプロフィール情報、他ユーザのプロフィール情報、操作信号などを取得する。本実施の形態では、取得部11は、通信部20を介して外部の機器から他ユーザの状態情報及びプロフィール情報を取得し、検出部50及び記憶部30から自ユーザの状態情報及びプロフィール情報を取得し、操作部60から操作信号を取得する。取得部11には、定期的又は不定期に、状態情報及びプロフィール情報が入力される。取得部11は、状態情報及びプロフィール情報等が入力される入力部でもある。
 取得部11は、複数のユーザがコミュニケーションをとる状況に関連する状況情報(コミュニケーション空間の雰囲気情報)を取得してもよい。例えば、状況情報は、所定時間内における単一ユーザ又は複数ユーザの、音声の大きさの積算値、会話量の積算値、動作量の積算値、所定の表情値(例えばポジティブ値、ネガティブ値など)の積算値などに基づく。一例において、取得部11は、通信部20を介して外部の機器から他ユーザの状況情報を取得し、検出部50から自ユーザの状況情報を取得し、操作部60から操作信号を取得する。
 生成部12は、第1の生成部12aと、後述する第2の生成部12bとを有する。第1の生成部12aは、アバターの制御に用いる情報としてアバター情報を生成する。アバター情報は、上述したように、アバターの画像に関するデータ、及びアバターの動作に関するデータを含む。アバター情報は、音声データ、言語データ等が付加された情報であってもよい。アバター情報は、アバターに付与されるエフェクト、アバターと共に表示するオブジェクト等の情報を含んでいてもよい。
 第1の生成部12aは、取得部11により取得された状態情報に基づき、ユーザのアバターの画像及び状態を示す情報を含むアバター情報を生成する。第1の生成部12aは、状態情報に含まれるユーザの動作を示す情報を用いて、アバターの動作を示す情報をアバター情報に付加する。第1の生成部12aは、状態情報に含まれるユーザの音声を示す情報を用いて、音声を示す情報をアバター情報に付加する。なお、アバターの画像として用いる画像は、ユーザ又は情報処理装置100等により決定される。例えば、ユーザは、記憶部30に記憶された複数種の画像のうちから、アバターに用いる画像を選択する。第1の生成部12aは、ユーザによる選択に基づいて、ユーザのアバターの画像を示すアバター情報を生成する。
 第1の生成部12aは、取得部11に順次に入力される他ユーザの状態情報を用いて、他ユーザのアバター情報を繰り返し生成する。第1の生成部12aは、自ユーザの状態情報に基づき、自ユーザのアバター情報も生成し得る。第1の生成部12aは、生成した自ユーザのアバター情報を、定期的又は不定期に、通信部20を介してサーバー200及び他の情報処理装置100に出力するようにしてもよい。なお、アバター情報は、その値が変化する毎に、サーバー200等の外部機器へ送信されるようにしてもよい。
 制御部13は、制御プログラムに基づいてアバターを制御する処理を行う。制御部13は、出力部40を制御することにより、アバターの画像と音声の制御を行う。制御部13は、他ユーザのアバター情報を用いて、アバター情報に基づく画像を表示部40aに表示させると共に、アバター情報に基づく音声を音出力部40bから出力させる。表示部40aは、アバター情報が示す動作を行うアバターの画像を表示し、音出力部40bは、アバター情報が示す音声を出力する。これにより、ユーザは、他ユーザのアバターの画像と音声を視聴することができる。
 制御部13は、アバター情報が変更(更新)されると、アバター情報に含まれるアバターの画像及び状態に関する情報に基づき、表示部40aにより表示される画像、音出力部40bにより出力される音を変更する。アバター情報が、表示部40aに表示される画像、音出力部40bから出力される音声に反映されることになる。制御部13は、他ユーザの状態情報が示す状態(動作、位置、発言等)に応じて、他ユーザのアバターの画像及び音声を変更する。表示部40aに表示される他ユーザのアバターは、他ユーザの動きに伴って動く状態となる。ユーザは、他ユーザの動作に伴って動作するアバターとコミュニケーションを行うことが可能となる。
 上述のようにユーザの動作に合わせてアバターを動作させることが可能となるが、同一の動作であっても、国、地域、文化等の違いによって異なる意味を有する場合がある。国、文化等の違いに起因して、ジェスチャー、ハンドサイン、手話等を行った場合に、意図する内容が相手に正しく伝わらない場合が生じ得る。同じジェスチャー等であっても、文化等の違いによって感じ方が異なるために、コミュニケーションの際に誤解が生じたり、ユーザに違和感を与えたりするおそれがある。
 例えば、日本人にとって「遠慮、否定」の意味を有する「手のひらを左右に振る」動作は、アメリカ等の英語圏では「臭い」の意味を有する。「相手に向けて舌を出す」行為は、日本では相手を馬鹿にしたり侮辱したりする行為となり得るが、チベットでは「相手を敬う気持ち」を表す挨拶となる。また、「上下の歯を噛み合わせて歯茎を見せる」動作は、アメリカ等では相手に強い「怒り」の感情をもっていることを表す動作となる。また、「人差し指と中指を交差させる」動作は、英語圏では「幸運を祈る」という合図となるが、ベトナムでは「侮辱」のサインとなってしまう。
 本実施の形態に係る情報処理装置100は、自ユーザのプロフィール情報と他ユーザのプロフィール情報に基づいて、自ユーザの場合と他ユーザの場合とで異なる意味を有する動作を推定する。情報処理装置100は、推定結果に基づいて、アバターの動作が相手ユーザに適した動作となるように、アバターに行わせる動作を変換する処理を行う。情報処理装置100は、ジェスチャー等の動作の翻訳を行うともいえる。情報処理装置100は、文化等の違いを考慮したアバターの制御を行うことができ、コミュニケーションの際に誤解が生じるといった状況となることを防ぐことが可能となる。以下に、情報処理装置100が行う処理について、さらに説明する。
 情報処理部10の第2の生成部12bは、取得部11により取得された各ユーザのプロフィール情報を参照して、ユーザ毎に、変換が必要となる場合が想定されるユーザの動作を推定する。第2の生成部12bは、変換が必要となり得るユーザのジェスチャー、ハンドサイン、手話等を推定する。第2の生成部12bは、推定した各ユーザの動作を比較して、ユーザ間で変換が必要となり得る動作の対応関係に関する情報(以下、対比テーブルと称する)を生成する。この場合、第2の生成部12bは、同様の意図を有するユーザの動作と他ユーザの動作との対応付けを行って、対比テーブルを生成する。対比テーブルは、ユーザの動作と他ユーザの動作との対応関係を示す情報となり、アバターの動作の変換(置き換え)に用いられる。なお、第2の生成部12bは、ユーザの動作とその動作が有する意味との対応関係を示す情報を、対比テーブルとして生成してもよい。第2の生成部12bは、取得部11により新たな他ユーザのプロフィール情報が取得される度に、対比テーブルを生成するようにしてもよい。
 図3は、実施の形態に係る対比テーブルの一例を説明するための図である。図3(a)は、想定されるユーザA、ユーザBの動作例を示し、図3(b)は、対比テーブルの一例を模式的に示している。第2の生成部12bは、ユーザAのプロフィール情報に基づいて、動作の変換が必要となり得るユーザAの動作を推定する。また、第2の生成部12bは、ユーザBのプロフィール情報に基づき、動作の変換が必要となり得るユーザBの動作を推定する。第2の生成部12bは、図3(a)に模式的に示すように、推定したユーザAの動作を示す情報、及び推定したユーザBの動作を示す情報を生成する。
 第2の生成部12bは、想定されるユーザAの動作とユーザBの動作とを比較し、変換が必要となる場合が想定される動作を選定する。図3(a)、(b)に示す例では、ユーザAについては、「モーション2」、「モーション4」、「モーション5」、「モーション7」、及び「モーション10」が選定される。また、ユーザBについては、「モーションb」、「モーションd」、「モーションe」、「モーションg」、及び「モーションj」が選定される。
 第2の生成部12bは、ユーザAの動作とユーザBの動作との対応付け(関連付け)を行う。例えば、図3に示す「モーション2」が有するユーザAにとっての意味は、「モーションb」が有するユーザBにとっての意味と同様である。そこで、第2の生成部12bは、ユーザAの「モーション2」とユーザBの「モーションb」とを対応付ける。また、例えば、「モーション4」のユーザAにとっての意味と「モーションd」のユーザBにとっての意味とが同様である。第2の生成部12bは、ユーザAの「モーション4」とユーザBの「モーションd」とを対応付ける。
 図3(b)に示す例では、「モーション2」及び「モーションb」の組(セット)、「モーション4」及び「モーションd」の組、「モーション5」及び「モーションe」の組、「モーション7」及び「モーションg」の組、及び「モーション10」及び「モーションj」の組について、それぞれ対応付けが行われる。第2の生成部12bは、対応付けられたユーザAの動作とユーザBの動作とを表す対比テーブルを生成する。
 第2の生成部12bは、図3(b)にハッチングで模式的に表したように、変換が不要と判断される動作のデータについては削除して、対比テーブルには含まれないようにしてもよい。第2の生成部12bにより生成された対比テーブルは、記憶部30に記憶される。対比テーブルは、変換対象となる動作を示し、例えば会話の開始前に予め生成されて登録される。対比テーブルの生成処理および記憶処理が、コミュニケーション開始前に行われることになる。新たなユーザCのプロフィール情報が追加された場合、第2の生成部12bは、ユーザA~Cのプロフィール情報に基づいて各ユーザの動作を比較し、対比テーブルを生成する。第2の生成部12bは、ユーザA、B間の対比テーブルと、ユーザCのプロフィール情報から推定されるユーザCの動作とを比較し、対比テーブルを更新するようにしてもよい。第2の生成部12bは、ユーザA、B、C間の共通の対比テーブルを生成するようにしてもよい。また、第2の生成部12bは、各ユーザ間の対比テーブルをそれぞれ生成してもよい。この場合、第2の生成部12bは、ユーザAの動作とユーザBの動作との対応関係を示す対比テーブルと、ユーザBの動作とユーザCの動作との対応関係を示す対比テーブルと、ユーザCの動作とユーザAの動作との対応関係を示す対比テーブルとを生成するようにしてもよい。なお、対比テーブルは、情報処理部10の内部のメモリに記憶するようにしてもよい。第2の生成部12bは、生成した対比テーブルを、定期的又は不定期に、通信部20を介してサーバー200及び他の情報処理装置100に出力するようにしてもよい。
 状態判定部14は、ユーザの状態情報を用いて、ユーザの状態を判定する処理を行う。状態判定部14は、ユーザの状態情報と対比テーブルとを照らし合わせて、状態情報が示すユーザの動作が対比テーブルに挙げられた動作であるか否かを判定(判断)する。状態判定部14は、対比テーブルに含まれる動作をユーザが行ったか否かを判定し、判定結果を示す信号(判定信号)を生成する。
 状態判定部14は、変換処理が必要となる状態を検出し、検出結果を示す判定信号を生成するともいえる。状態判定部14は、対比テーブルを参照して、ユーザが所定のジェスチャーを行ったか否か、ユーザが所定のハンドサインを行ったか否か、ユーザが所定の手話を行ったか否か等を判定する。
 第1の生成部12aは、ユーザの状態情報と対比テーブルとに基づき、上述したアバター情報と合わせて付加的にアバターの制御に用いる情報として、アバターの状態に関する情報(以下、「アバター付加情報」と称する)を生成する。アバター付加情報は、アバターに変換した動作をさせるための情報であり、アバターの動作に関する情報、アバターの表情に関する情報、アバターの音声に関する情報等を含む。アバター付加情報は、例えば、上半身または全身の動作(ジェスチャー等)に関する情報を含む。
 第1の生成部12aは、状態判定部14の判定信号によって変換が必要となるユーザの動作が行われたことを把握すると、その動作について対比テーブルが示す対応関係を参照して、そのユーザのアバターの動作を決定する。第1の生成部12aは、決定したアバターの動作を示すアバター付加情報を生成する。第1の生成部12aは、例えば、ユーザAが属する国等において第1の意味を有する動作を、ユーザBが属する国等において同じ第1の意味を有する動作に変換し、変換後の動作を示すアバター付加情報を生成する。
 例えば、ユーザAとユーザBのコミュニケーションにおいて、ユーザAにより「モーション2」が行われた場合、第1の生成部12aは、対比テーブルを参照することにより、ユーザAのアバターの動作として、「モーション2」に対応する「モーションb」を選択する。また、例えば、ユーザBが「モーションd」を行った場合、第1の生成部12aは、対比テーブルを参照して、ユーザBのアバターの動作として、「モーションd」に対応する「モーション4」を選択する。
 このように、第1の生成部12aは、対比テーブルに含まれる動作が検出された場合に、相手ユーザに合った動作をアバターに行わせるためのアバター付加情報を生成する。このため、対比テーブルに含まれる動作が検出された場合に、アバターの動作を自動的に変換することが可能となる。なお、第1の生成部12aにより生成されたアバター付加情報は、通信部20を介してサーバー200及び他の情報処理装置100に出力されてもよい。
 可否判断部15は、アバター付加情報に基づくアバターの制御を行うか否かを判断する。可否判断部15は、ユーザの状態情報が示すユーザの発言及び表情、ユーザによる操作部60の操作等によって、アバター付加情報に基づくアバターの制御を行うか否かを判断する。可否判断部15は、アバター付加情報に基づく制御を許可するか否かの判断結果を示す信号(判断信号)を生成する。なお、可否判断部15と上述した状態判定部14とは、一体的に構成されてもよい。
 可否判断部15は、例えば、ユーザと他のユーザとの親密度に基づき、アバター付加情報に基づくアバターの制御を行うか否かを判断する。可否判断部15は、例えば、親密度が低い場合にアバター付加情報に基づくアバターの制御を行うと判断し、親密度が高い場合にはアバター付加情報に基づくアバターの制御を行わないと判断する。可否判断部15は、ユーザの状態情報によって把握されるユーザの行動(行為)、発言、表情等に基づいて、ユーザ間の親密度を判定するようにしてもよい。
 可否判断部15は、ユーザ間の会話時間が所定の時間以上である場合は、親密度は高いと判定し、会話時間が所定時間未満である場合は、親密度は低いと判定してもよい。可否判断部15は、ユーザが所定の発言を行った場合に親密度が高いと判定してもよいし、ユーザが所定の行動を行った場合に親密度が高いと判定してもよい。可否判断部15は、会話の流れ、口調、表情、ユーザ間の過去のやりとり等によって、親密度を判定してもよい。
 可否判断部15は、会話で用いられた単語、口調、表情、SNSにおける交流履歴等をそれぞれ数値化して加算し、加算された値が予め定められた閾値以上である場合は親密度が高いと判定し、加算された値が閾値未満である場合は親密度が低いと判定してもよい。可否判断部15は、所定の時間間隔毎に、親密度を更新してもよい。この場合、可否判断部15は、親密度の変化を予測し、所定時間内に親密度が閾値を超えることが予測された場合、親密度が高いと判定するようにしてもよい。可否判断部15は、過去の親密度の履歴を加味して親密度を判定してもよい。親密度の履歴からユーザAとユーザBが基本的には仲良しと推測される場合、可否判断部15は、ユーザAとユーザBが喧嘩した場合の親密度の低下量を抑えるようにしてもよい。可否判断部15は、新たなユーザが追加される毎に、各ユーザ間の親密度を判定するようにしてもよい。
 制御部13は、可否判断部15により生成される判断信号に基づき、アバター付加情報を用いた制御を行うか否かを把握する。アバター付加情報に基づく制御が許可されると、制御部13は、アバター情報に基づくアバターの制御と、アバター付加情報に基づくアバターの制御との切り替えを行う。制御部13は、アバター付加情報に応じて、表示部40aにより表示される画像を変更する。なお、制御部13は、アバター付加情報に応じて、音出力部40bにより出力される音も変更するようにしてもよい。
 表示部40aは、アバター付加情報が示す動作を行うアバターの画像を表示し、音出力部40bは、アバター付加情報が示す音(例えばエフェクト音)を出力する。アバター付加情報が、表示部40aに表示される画像、音出力部40bから出力される音声に反映される。制御部13及び出力部40は、アバター付加情報を用いて、相手ユーザに合わせたジェスチャー等の動作をアバターに行わせることができる。
 情報処理装置100は、ユーザによる操作(操作部60の操作、音声入力等)によって、アバター付加情報に基づくアバターの制御を許可するか否かを選択可能としてもよい。情報処理装置100は、例えば、ユーザによる操作部60の操作等によって、アバター付加情報に基づく制御を許可する状態(第1モード)、又は、アバター付加情報に基づく制御を許可しない状態(第2モード)に設定可能としてもよい。この場合、可否判断部15は、第1モードが設定されている場合は、アバター付加情報に基づく制御を許可することを示す判断信号を生成し、第2モードが設定されている場合には、アバター付加情報に基づく制御を許可しないことを示す判断信号を生成するようにしてもよい。
 情報処理装置100は、第1モードが設定されている場合は、図4(a)に模式的に示す例のように、第1モードに設定されていることを示す画像80(80a、80b)をアバターの画像と共に表示するようにしてもよい。図4(a)に示す例では、画像80aは、ユーザB側の情報処理装置100の表示部40aにおいて表示される画像であり、ユーザAにより第1モードが設定されていることを表している。
 画像80bは、ユーザA側の情報処理装置100の表示部40aにおいて表示される画像であり、ユーザBにより第1モードが設定されていることを表している。なお、画像80a、画像80bを、それぞれ、ユーザA、ユーザBに割り当てられた色(パーソナルカラー)の画像としてもよい。情報処理装置100は、第2モードが設定されている場合は、図4(b)に示すように、画像80(80a、80b)を表示しないようにしてもよい。なお、情報処理装置100は、第2モードに設定されていることを示す画像を表示するようにしてもよい。
 図4(a)は、ユーザA及びユーザBが共に第1モードを選択した場合の例を示しており、ユーザA、Bの各々のアバターの動作の変換が行われている。図4(a)、(b)において、ユーザAは日本人であり、ユーザBはアメリカ人であるとする。ユーザA側では「相手に手のひらを見せて左右に振る」動作が「さようなら」を意味し、ユーザB側では「手のひらを見せて手の指を屈伸する(グッパする)」動作が「さようなら」を意味する。ユーザAのアバターの自動変換が行われると、ユーザAのアバターは、ユーザAが行った「相手に手のひらを見せて左右に振る」動作の代わりに「手のひらを見せて手の指を屈伸する」動作を行う。ユーザB側の情報処理装置100の表示部40aでは、「手のひらを見せて手の指を屈伸する」動作を行うユーザAのアバターの画像が表示される。
 また、ユーザBのアバターの自動変換が行われると、ユーザBのアバターは、ユーザBが行った「手のひらを見せて手の指を屈伸する」動作の代わりに「相手に手のひらを見せて左右に振る」動作を行う。ユーザA側の情報処理装置100の表示部40aでは、「相手に手のひらを見せて左右に振る」動作を行うユーザBのアバターの画像が表示される。
 一方、図4(b)に示す例では、ユーザA及びユーザBが共に第2モードを選択し、ユーザA、Bの各々のアバターの動作の変換行われないことになる。この場合、ユーザは、自身で相手ユーザに合わせた動作を試すこともできる。図4(b)の場合では、ユーザAがユーザBに対応し、「さようなら」を伝える際に「相手に手のひらを見せて左右に振る」動作ではなく「手のひらを見せて手の指を屈伸する」動作を行っている。
 このように、情報処理装置100では、ユーザによる選択に基づいて、アバターの動作の自動変換を行うか否かを切り替える。情報処理装置100は、ユーザの意図を画面表示に反映させることができ、ユーザの意図しない変換が勝手に行われてしまうことを防ぐことが可能となる。また、各ユーザは、アバターの自動変換が行われているか否かを確認しながら、コミュニケーションを行うことができる。
 上述のように、本実施の形態に係る情報処理部10は、ユーザのプロフィールに基づき、アバターの制御に用いるアバター付加情報を生成する。このため、情報処理部10は、文化の違い等を考慮して、アバターの状態を変化させることが可能となる。ユーザは、アバターに相手ユーザに対応した動作を行わせることができ、ジェスチャー等の動作の意味が通じないといった状況となることを回避することができる。文化の違い等の壁をこえて、コミュニケーションを行うことが可能となる。
 また、情報処理部10は、ユーザ間の親密度、ユーザの意思等に応じて、アバターの動作の自動変換を行うか否かを決定する。このため、ユーザ間の親密度等を考慮して、アバターの制御を適切に行うことができる。動作の自動変換が過度に行われてしまうことを防ぐことができる。
 なお、情報処理部10は、ユーザの動作(モーション)が相手にとって不快な動作となり変換すべき動作であるが変換先の動作が無い場合、そのユーザの動作をアバターには行わせないようにキャンセルするようにしてもよい。また、情報処理部10は、そのユーザの動作に近いと判断される一般的な動作を、アバターに行わせるようにしてもよい。情報処理部10は、アバターの動作を、肯定的な部類の動作(例えば「にこっ」とする表情)、又は否定的な部類の動作(例えば「への字口」の表情)に置き換えるようにしてもよい。
 図5は、実施の形態に係る情報処理装置100の動作例を示すフローチャートである。図5に示す処理は、例えば、図1及び図2に示したユーザA及びユーザBの各々の情報処理装置100において操作部60が操作され、アバターを用いたコミュニケーションが開始された場合に実行される。以下では、ユーザBの情報処理装置100bにおける処理について主に説明する。
 ステップS100において、状態判定部14は、ユーザAの状態情報と上述した対比テーブルとに基づき、ユーザAが対比テーブルに含まれる動作をとったか否かを判定する。状態判定部14によりユーザAが対比テーブルに含まれる動作をとったと判定されると、生成部12は、対比テーブルを参照して、ユーザAの状態に応じてユーザAのアバターの制御に用いるアバター付加情報を生成し、ステップS110へ進む。なお、ステップS100で否定判定された場合には、アバター付加情報の生成は行われず、処理はステップS130へ進む。
 ステップS110において、可否判断部15は、ユーザA、Bの親密度及び設定されたモード(上述した第1モード、第2モード)等に基づき、アバター付加情報に基づくアバターの制御を行うか否かを決定する。この場合、例えば、可否判断部15は、ユーザA、Bの親密度が低いと判定され、かつ上述した第1モードが設定されている場合に、アバター付加情報に基づくアバターの制御を行うと判定する。可否判断部15は、ユーザA、Bの親密度が高いと判定された場合、又は上述した第2モードが設定されている場合は、アバター付加情報に基づくアバターの制御を行わないと判定する。可否判断部15は、アバター付加情報に基づくアバターの制御を行うと判定すると、ステップS120へ進み、ステップS110で否定判定すると、ステップS130へ進む。
 ステップS120では、制御部13は、アバター付加情報を用いて出力部40を制御することにより、ユーザAのアバターの制御を行う。出力部40は、ユーザAの動作及び対比テーブルに応じて生成されたアバター付加情報に基づいて、ユーザBに合った動作を行うユーザAのアバター画像を表示する。
 ステップS130において、情報処理装置100は、ユーザA又はユーザBによりアバターを用いたコミュニケーションを終了する操作がされると、図5に示す処理を終了し、ステップS130で否定判定すると、ステップS100へ戻る。
 追加的及び/又は代替的に、第1の生成部12aは、状況情報(コミュニケーション空間の雰囲気情報)に基づき、アバター付加情報を生成することができる。アバター付加情報は、アバターの動作に関する情報、アバターの表情に関する情報、アバターの音声に関する情報等を含む。
 可否判断部15は、アバター付加情報に基づくアバターの制御を行うか否かを判断する。可否判断部15は、複数のユーザがコミュニケーションをとる状況に関連する状況情報に基づき、コミュニケーション空間の状況(雰囲気)を判定する。一例において、状況情報に関する複数のパラメータ値に基づき、コミュニケーション空間の活気度(盛り上がり度)が算出され得る。可否判断部15は、算出された活気度と単一又は複数の所定値(閾値)とを比較する。可否判断部15は、比較結果に基づき、アバター付加情報に基づくアバターの制御を行うか否かを判断する。例えば、可否判断部15は、活気度が高い場合、アバターの動作が大きくかつ音声が大きくなるように、アバター付加情報に基づく、アバターの制御を行うと判断する。可否判断部15は、活気度が低い場合、アバターの動作が小さくかつアバターの音声が小さくなるように、アバター付加情報に基づく、アバターの制御を行うと判断する。可否判断部15は、活気度が中(標準)の場合にはアバター付加情報に基づくアバターの制御を行わないと判断する。
 可否判断部15は、ユーザの状態情報によって把握されるユーザの行動(行為)、発言、表情等に基づいて、ユーザ間の活気度を判定するようにしてもよい。可否判断部15は、ユーザが特定の発言を行った場合に活気度が高いと判定してもよいし、ユーザが所定の行動を行った場合に活気度が高いと判定してもよい。可否判断部15は、会話の流れ、口調、表情、ユーザ間の過去のやりとり等によって、活気度を判定してもよい。可否判断部15は、会話で用いられた単語、口調、表情等をそれぞれ数値化して加算し、加算された値が予め定められた閾値以上である場合は活気度が高いと判定し、加算された値が閾値未満である場合は活気度が低いと判定してもよい。
 可否判断部15は、所定の時間間隔毎に、活気度を更新してもよい。この場合、可否判断部15は、活気度の変化を予測し、所定時間内に活気度が閾値を超えることが予測された場合、活気度が高いと判定するようにしてもよい。可否判断部15は、過去の活気度の履歴を加味して活気度を判定してもよい。履歴からユーザAとユーザBとのコミュニケーションが標準的に活気度が高いと推測される場合、可否判断部15は、ユーザAとユーザBとを含むコミュニケーション空間での活気度の判定閾値を高くしてもよい。可否判断部15は、新たなユーザが追加される毎に、各ユーザ間の活気度を判定するようにしてもよい。
 制御部13は、可否判断部15により生成される判断信号に基づき、アバター付加情報を用いた制御を行うか否かを把握する。アバター付加情報に基づく制御が許可されると、制御部13は、アバター情報に基づくアバターの制御と、アバター付加情報に基づくアバターの制御との切り替えを行う。制御部13は、アバター付加情報に応じて、表示部40aにより表示される画像を変更するとともに、音出力部40bにより出力される音を変更する。
 表示部40aは、アバター付加情報が示す動作を行うアバターの画像を表示し、音出力部40bは、アバター付加情報が示す音を出力する。アバター付加情報が、表示部40aに表示される画像、音出力部40bから出力される音声に反映される。制御部13及び出力部40は、アバター付加情報を用いて、コミュケーション空間の雰囲気に合わせた最適な動作をアバターに行わせることができる。
 例えば、コミュニケーション空間の雰囲気が盛り上がっているときは、ユーザAのアバターの笑い動作および笑い声が大きくなる。コミュニケーション空間の雰囲気が静かで落ち着いているときはユーザAのアバターの笑い動作および笑い声が小さくなる。
 上述のように、本例では、コミュニケーション空間の雰囲気に基づき、アバターの制御に用いるアバター付加情報を生成する。このため、コミュニケーション空間の雰囲気に合わせて、アバターの動作や音声が制御され、ユーザ間のコミュニケーションが促進される。すなわち、コミュニケーション空間の状況に応じてアバターの動作や音声が最適化される。
 図6は、コミュニケーション空間の雰囲気を考慮した、実施の形態に係る情報処理装置100の動作例を示すフローチャートである。図6に示す処理は、例えば、図1及び図2に示したユーザA及びユーザBの各々の情報処理装置100において操作部60が操作され、アバターを用いたコミュニケーションが開始された場合に実行される。以下では、ユーザBの情報処理装置100bにおける処理について主に説明する。
 ステップS210において、可否判断部15は、複数のユーザがコミュニケーションをとる状況に関連する状況情報に基づき、アバター付加情報に基づくアバターの制御を行うか否かを決定する。この場合、例えば、可否判断部15は、コミュニケーション空間の活気度が低い又は高いと判定された場合に、アバター付加情報に基づくアバターの制御を行うと判定する。可否判断部15は、コミュニケーション空間の活気度が中(標準)と判定された場合、アバター付加情報に基づくアバターの制御を行わないと判定する。可否判断部15は、アバター付加情報に基づくアバターの制御を行うと判定すると、ステップS220へ進み、ステップS210で否定判定すると、ステップS230へ進む。
 ステップS220では、制御部13は、アバター付加情報を用いて出力部40を制御することにより、ユーザAのアバターの制御を行う。出力部40は、アバター付加情報に基づいて、コミュニケーション空間の雰囲気に合った動作及び音声出力を行うユーザAのアバター画像を表示する。
 ステップS230において、情報処理装置100は、ユーザA又はユーザBによりアバターを用いたコミュニケーションを終了する操作がされると、図6に示す処理を終了し、ステップS230で否定判定すると、ステップS210へ戻る。
 アバターの最適化の別の例として、ユーザAまたはユーザBの動作の大きさを最適化してもよい。この場合、例えば、可否判断部15は、ユーザAまたはユーザBの動作の大きさが所定の大きさに達しているか否かを判断する。可否判断部15が、ユーザAまたはユーザBの動作の大きさが所定の大きさに達していないと判断して場合に、制御部13は、アバターの動作の大きさが所定の大きさとなるように第1の生成部12aを制御する。例えば、ユーザAの手の振りが所定の大きさよりも小さい場合に、手の振りを大きくするように制御する。
 また、各種の動作に対応する小さな動作を記憶部30に記憶させておき、ある小さな動作をユーザが行ったときに、対応する動作をアバターが行うように制御してもよい。例えば、ユーザが人差し指を横に振ることを、「さようなら」の意味であり手を大きく振ることに対応付けして記憶させておき、ユーザが人差し指を横に振ったときに、制御部13は、アバターが手を大きく振るように第1の生成部12aを制御する。
 上述した実施の形態によれば、次の作用効果が得られる。
(1)情報処理装置100は、第1ユーザのプロフィールに関連する第1情報と、第2ユーザのプロフィールに関連する第2情報と、第1ユーザの状態に関連する第3情報とを取得する取得部(取得部11)と、第1情報と第2情報と第3情報とに基づいて、第1ユーザに関連付けられた制御対象の制御に用いる第4情報を生成する生成部(生成部12)と、を備える。本実施の形態では、生成部12は、ユーザのプロフィール情報と状態情報に基づいて動作の変換処理を行い、変換されたアバターの動作を表すアバター付加情報を生成する。制御部13は、アバター付加情報に基づいて他者のアバターを制御する。このため、情報処理装置100は、相手ユーザに合った動作をアバターに行わせることができる。これにより、文化の違い等の壁をこえたコミュニケーションを実現することが可能となる。
(2)本実施の形態に係る情報処理装置100は、ユーザ間の親密度及びユーザの意思等に基づいて、アバターの動作の自動変換を行うか否かを判断する。このため、ユーザ間の親密度等を考慮して、アバターの制御を適切に行うことができる。動作の自動変換が過度に行われてしまうといったことを抑制することができる。
(3)情報処理装置100は、ユーザ間のコミュニケーション空間の雰囲気に基づいて、アバターの動作の自動変換を行うか否かを判断する。このため、コミュニケーション空間の雰囲気に応じて、アバターの動作や音声が制御され、ユーザ間のコミュニケーションが促進される。
 次のような変形も本発明の範囲内であり、変形例の一つ、もしくは複数を上述の実施形態と組み合わせることも可能である。
(変形例1)
 情報処理装置100の第1の生成部12aは、自ユーザの状態情報と対比テーブルに基づいて、自ユーザのアバターの制御に用いるアバター付加情報を生成し、通信部20等を介してサーバー200及び他の情報処理装置100に送信するようにしてもよい。例えば、ユーザAの情報処理装置100aは、ユーザBの情報処理装置100b内の第1の生成部12aにより生成されたアバター付加情報に基づき、アバターの画像の表示及び音声の出力を行う。これにより、ユーザAは、ユーザAに合わせて変換されたユーザBのアバター画像及び音声を視聴することできる。
(変形例2)
 情報処理装置100の情報処理部10の一部を、サーバー200(情報処理装置200)内に設けるようにしてもよい。取得部11、生成部12、制御部13、状態判定部14、及び可否判断部15の一部または全部を、サーバー200が有していてもよい。なお、情報処理装置100とサーバー200とを併せて、情報処理装置ということもできる。また、回線を通じて接続されている複数の情報処理装置100とサーバー200とを併せて、情報処理装置ということもできる。
 一例として、本変形例に係る情報通信システム1では、サーバー200は、ユーザの状態に関する状態情報を取得する取得部と、アバター情報及び対比テーブル及びアバター付加情報を生成する生成部と、アバター情報等を外部機器に出力する通信部とを有する。また、サーバー200は、ユーザおよびアバターの状態を判定する状態判定部と、アバター付加情報に基づく制御を行うか否かを判断する可否判断部とを有する。
 サーバー200の取得部は、ユーザAの情報処理装置100aからユーザAのプロフィール情報及び状態情報を取得し、ユーザBの情報処理装置100bからユーザBのプロフィール情報及び状態情報を取得する。サーバー200の生成部は、ユーザA、Bのプロフィール情報を用いて対比テーブルを生成する。生成部は、状態判定部による判定結果に基づき、ユーザA、Bの状態情報と対比テーブルを用いて、アバター付加情報を生成し得る。
 サーバー200の通信部は、ユーザAのアバター情報およびアバター付加情報をユーザBの情報処理装置100bに送信し、ユーザBのアバター情報およびアバター付加情報をユーザAの情報処理装置100aに送信する。なお、通信部は、ユーザAのアバター情報およびアバター付加情報を情報処理装置100a、100bの両方に送信し、ユーザBのアバター情報およびアバター付加情報を情報処理装置100a、100bの両方に送信してもよい。
 通信部は、可否判断部による判断結果に応じて、アバター付加情報を送信するようにしてもよい。通信部は、例えば、ユーザAのアバター付加情報に基づくアバターの制御を行うと判断された場合に、ユーザAのアバター付加情報を送信し、ユーザBのアバター付加情報に基づくアバターの制御を行うと判断された場合に、ユーザBのアバター付加情報を送信してもよい。
 ユーザAの情報処理装置100aは、ユーザBのアバター情報およびアバター付加情報に基づき、アバターの画像の表示及び音声の出力を行う。ユーザAは、ユーザBのアバター画像及び音声を視聴することができ、コミュニケーションを行うことが可能となる。ユーザBの情報処理装置100bは、ユーザAのアバター情報およびアバター付加情報に基づき、アバターの画像の表示及び音声の出力を行う。ユーザBは、ユーザAのアバター画像及び音声を視聴することができ、コミュニケーションを行うことが可能となる。
(変形例3)
 上述した実施の形態および変形例で説明したアバターの制御は、あくまでも一例であって、種々の変換を行うことができる。例えば、日本での「手のひらを相手に向けた状態で指先を上下する」動作と、欧米での「手のひらを上に向けた状態で指先を手前側へ動かす」動作とを、予め対比テーブルにおいて対応付けを行い、互いに変換可能としてもよい。
 日本での「腕をクロスさせて×の形を作る」動作と、欧米での「首を横に振る」動作と、ギリシャでの「首を後ろにそらす、目を大きく見開く」動作と、インドでの「口の中でチッと舌打ちする」動作とを、互いに変換可能としてもよい。また、日本での「頷く」動作と、ギリシャ、トルコ、イタリア南部、シチリアでの「顎をそらす」動作と、イスラエルでの「首をかしげる」動作と、フィリピンでの「片方の眉毛を吊り上げる」動作と、ブルガリア、インド、パキスタンでの「頭を左右方向に交互に傾けて揺らす」動作とを、互いに変換可能としてもよい。
(変形例4)
 情報処理装置100の内部または外部に、匂い(香り)を発生する装置(匂い発生装置)が設けられていてもよい。情報処理装置100は、アバターが匂いに関連する動作(例えば「臭い」の意味を有する動作)を行う場合に、匂い発生装置を制御して、匂いを再現させるようにしてもよい。
(変形例5)
 上述したフローチャートに基づく処理を行うプログラムをコンピュータ(プロセッサ)に実行させることにより、情報処理装置を構成してもよい。プログラムは、記憶媒体、通信回線を介する提供など、種々の形態のコンピュータプログラム製品として供給することができる。
(変形例6)
 上述した実施の形態および変形例では、ユーザに関連付けられた制御対象としてアバターを例として説明したが、制御対象はアバターに限られず、例えばユーザに関連付けられたロボットであってもよい。コミュニケーションにおいてロボットを利用する場合に、ロボットの動作等の制御内容を決定する場合に本発明を適用することもできる。
 上記では、種々の実施の形態および変形例を説明したが、本発明はこれらの内容に限定されるものではない。本発明の技術的思想の範囲内で考えられるその他の態様も本発明の範囲内に含まれる。
1…情報通信システム、10…情報処理部、11…取得部、12…生成部、13…制御部、14…状態判定部、15…可否判断部、20…通信部、30…記憶部、40…出力部、50…検出部、60…操作部、100…情報処理装置、200…サーバー(情報処理装置)

Claims (19)

  1.  第1ユーザのプロフィールに関連する第1情報と、第2ユーザのプロフィールに関連する第2情報と、前記第1ユーザの状態に関連する第3情報とを取得する取得部と、
     前記第1情報と前記第2情報と前記第3情報とに基づいて、前記第1ユーザに関連付けられた制御対象の制御に用いる第4情報を生成する生成部と、
    を備える情報処理装置。
  2.  請求項1に記載の情報処理装置において、
     前記第1情報は、前記第1ユーザの居住国、居住地域、勤務地、国籍、母国語、年齢、性別、所属する組織、宗教、民族、海外経験、使用言語のうちの少なくとも一つに関する情報を含み、
     前記第2情報は、前記第2ユーザの居住国、居住地域、勤務地、国籍、母国語、年齢、性別、所属する組織、宗教、民族、海外経験、使用言語のうちの少なくとも一つに関する情報を含む情報処理装置。
  3.  請求項1または請求項2に記載の情報処理装置において、
     前記第4情報は、ユーザ間のコミュニケーションにおいて前記第1ユーザの状態に基づいて変化する前記制御対象の制御に用いる情報である情報処理装置。
  4.  請求項1から請求項3までのいずれか一項に記載の情報処理装置において、
     前記第3情報は、前記第1ユーザにとって第1の意味を有する第1動作に関する情報であり、
     前記第4情報は、前記第2ユーザにとって前記第1の意味を有する第2動作に関する情報である情報処理装置。
  5.  請求項4に記載の情報処理装置において、
     前記生成部は、前記第1動作が前記第2ユーザにとって前記第1の意味とは異なる第2の意味を有する場合に、前記第1の意味を有する前記第2動作に関する前記第4情報を生成する情報処理装置。
  6.  請求項1から請求項5までのいずれか一項に記載の情報処理装置において、
     前記生成部は、前記第1情報に基づいて想定される前記第1ユーザの動作と前記第2情報に基づいて想定される前記第2ユーザの動作との対応関係に関する第5情報と、前記第3情報とに基づいて前記第4情報を生成する情報処理装置。
  7.  請求項6に記載の情報処理装置において、
     前記第5情報を記憶する記憶部を有し、
     前記生成部は、前記記憶部に記憶された前記第5情報に基づいて前記第4情報を生成する情報処理装置。
  8.  請求項1から請求項7までのいずれか一項に記載の情報処理装置において、
     前記制御対象は、前記第1ユーザのアバターである情報処理装置。
  9.  請求項8に記載の情報処理装置において、
     画像を表示する表示部を有し、
     前記第4情報は、前記表示部に表示する前記アバターの画像を制御する情報を含む情報処理装置。
  10.  請求項8または請求項9に記載の情報処理装置において、
     前記第4情報に基づく前記アバターの画像の制御を行うか否かを判断する判断部を有する情報処理装置。
  11.  請求項1から請求項10までのいずれか一項に記載の情報処理装置において、
     ユーザの状態を検出する検出部を有し、
     前記生成部は、前記検出部から出力される前記第3情報に基づいて前記第4情報を生成する情報処理装置。
  12.  第1の意味を有する第1動作に関する第1情報を取得する取得部と、
     前記第1の意味を有し前記第1動作とは異なる第2動作に関する第2情報を、前記第1情報に基づいて生成する生成部と、
    を備える情報処理装置。
  13.  第1ユーザのプロフィールに関連する第1情報と、第2ユーザのプロフィールに関連する第2情報と、前記第1ユーザの状態に関連する第3情報とを取得する処理と、
     前記第1情報と前記第2情報と前記第3情報とに基づいて、前記第1ユーザに関連付けられた制御対象の制御に用いる第4情報を生成する処理と、
    をプロセッサに実行させるプログラム。
  14.  第1ユーザのプロフィールに関連する第1情報と、第2ユーザのプロフィールに関連する第2情報と、前記第1ユーザの状態に関連する第3情報とを取得することと、
     前記第1情報と前記第2情報と前記第3情報とに基づいて、前記第1ユーザに関連付けられた制御対象の制御に用いる第4情報を生成することと、
    を含む情報処理方法。
  15.  第1の意味を有する第1動作に関する第1情報を取得することと、
     前記第1の意味を有し前記第1動作とは異なる第2動作に関する第2情報を、前記第1情報に基づいて生成することと、
    を含む情報処理方法。
  16.  第1ユーザの動作に関連する第1情報、および、第2ユーザに関連する第2情報を取得する取得部と、
     前記第1情報および前記第2情報に基づいて、前記第1ユーザの動作を前記第2ユーザに適応した動作に変換した情報を生成する生成部と、
    を備える情報処理装置。
  17.  第1ユーザの動作に関連する第1情報、および、第2ユーザに関連する第2情報を取得することと、
     前記第1情報および前記第2情報に基づいて、前記第1ユーザの動作を前記第2ユーザに適応した動作に変換した情報を生成することと、
    を含む情報処理方法。
  18.  第1ユーザの動作に関連する第1情報、および、前記第1ユーザが他のユーザとコミュニケーションをとる状況に関連する第2情報を取得する取得部と、
     前記第1情報および前記第2情報に基づいて、前記第1ユーザの動作を変換した第3情報を生成する生成部と、
    を備える情報処理装置。
  19.  第1ユーザの動作に関連する第1情報、および、前記第1ユーザが他のユーザとコミュニケーションをとる状況に関連する第2情報を取得することと、
     前記第1情報および前記第2情報に基づいて、前記第1ユーザの動作を変換した第3情報を生成することと、
    を含む情報処理方法。
PCT/JP2022/017255 2021-04-08 2022-04-07 情報処理装置、プログラム、及び、情報処理方法 WO2022215725A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021-066019 2021-04-08
JP2021066019 2021-04-08

Publications (1)

Publication Number Publication Date
WO2022215725A1 true WO2022215725A1 (ja) 2022-10-13

Family

ID=83546137

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/017255 WO2022215725A1 (ja) 2021-04-08 2022-04-07 情報処理装置、プログラム、及び、情報処理方法

Country Status (1)

Country Link
WO (1) WO2022215725A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015035769A (ja) * 2013-08-09 2015-02-19 株式会社リコー 情報処理装置、情報処理システム及びプログラム
WO2016088566A1 (ja) * 2014-12-03 2016-06-09 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015035769A (ja) * 2013-08-09 2015-02-19 株式会社リコー 情報処理装置、情報処理システム及びプログラム
WO2016088566A1 (ja) * 2014-12-03 2016-06-09 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム

Similar Documents

Publication Publication Date Title
US10933321B2 (en) Information processing device and information processing method
CN110609620B (zh) 基于虚拟形象的人机交互方法、装置及电子设备
JP4395687B2 (ja) 情報処理装置
TW201919388A (zh) 視頻通信的方法、裝置、終端及電腦可讀儲存介質
US11960792B2 (en) Communication assistance program, communication assistance method, communication assistance system, terminal device, and non-verbal expression program
US11544968B2 (en) Information processing system, information processingmethod, and recording medium
WO2022215725A1 (ja) 情報処理装置、プログラム、及び、情報処理方法
JP2003108502A (ja) 身体性メディア通信システム
JP2000349920A (ja) 意思伝達装置
US9420111B2 (en) Communication device, method, and program
KR20210040208A (ko) 모바일 디바이스 기반 능동형 인공지능 영상 캐릭터 시스템
WO2021140800A1 (ja) コミュニケーション支援システムおよびコミュニケーション支援プログラム
WO2024219506A1 (ja) 電子機器、行動制御システムおよび制御システム
WO2024214750A1 (ja) 行動制御システム、学習用データの生成方法、表示制御装置及びプログラム
JP7496128B2 (ja) 仮想人物対話システム、映像生成方法、映像生成プログラム
JP7123028B2 (ja) 情報処理システム、情報処理方法、及びプログラム
US20230230293A1 (en) Method and system for virtual intelligence user interaction
WO2024214708A1 (ja) 行動制御システム
JP2024106619A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2024155861A (ja) 電子機器
JP2023072110A (ja) 情報処理装置、制御プログラムおよび制御方法
JP2024155786A (ja) 電子機器
JP2022050192A (ja) 情報処理装置、及び、プログラム
JP2024155799A (ja) 電子機器
JP2024155785A (ja) 電子機器

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22784707

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 22784707

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP