JP2005251133A - Method and system for physical pull-in appealing to tactile sense - Google Patents

Method and system for physical pull-in appealing to tactile sense Download PDF

Info

Publication number
JP2005251133A
JP2005251133A JP2004064856A JP2004064856A JP2005251133A JP 2005251133 A JP2005251133 A JP 2005251133A JP 2004064856 A JP2004064856 A JP 2004064856A JP 2004064856 A JP2004064856 A JP 2004064856A JP 2005251133 A JP2005251133 A JP 2005251133A
Authority
JP
Japan
Prior art keywords
motion
speaker
unit
listener
physical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004064856A
Other languages
Japanese (ja)
Inventor
Tomio Watanabe
富夫 渡辺
Hiroshi Nagai
弘志 長井
Michiya Yamamoto
倫也 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
Okayama Prefectural Government
Original Assignee
Japan Science and Technology Agency
Okayama Prefectural Government
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Agency, Okayama Prefectural Government filed Critical Japan Science and Technology Agency
Priority to JP2004064856A priority Critical patent/JP2005251133A/en
Publication of JP2005251133A publication Critical patent/JP2005251133A/en
Pending legal-status Critical Current

Links

Abstract

<P>PROBLEM TO BE SOLVED: To provide a physical pull-in method for providing nonverbal information which does not require switching of a sight line for a speaker or a listener and produces a physical pull-in phenomenon for each, in a conversation when a concerned party is present right before, or in a scene when speakers or listeners are unspecified or many. <P>SOLUTION: For producing, for a speaker, a physical pull-in phenomenon with respect to a listener, the speaker is made to carry an operation unit 14 driven by a driving part 13 at operation timing calculated by the operation part of a computer 31, the operation part calculates, as the operation timing, the time point when an operation predictive value estimated from a signal of the voice of the speaker exceeds a predetermined operation threshold, and at the operation timing, the driving part 13 drives the operation unit 14 to teach the speaker about the operation timing as tactile sensory information, thus producing, for the speaker, the physical pull-in phenomenon with respect to the listener. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、話し手又は聞き手に身体的引き込み現象をもたらすノンバーバル情報を触覚的な感覚情報として与える身体的引き込み方法と、前記触覚的な感覚情報を与えるシステムとに関する。   The present invention relates to a physical pull-in method that provides non-verbal information that causes a physical pull-in phenomenon to a speaker or listener as tactile sensory information, and a system that provides the tactile sensory information.

会話によりコミュニケーションを図る話し手及び聞き手は、自分又は相手の音声(バーバル情報)を聞き取ると共に、自分又は相手の身体動作をはじめとした感覚情報(ノンバーバル情報)を五感で取得して身体リズムを共有し、より話しやすい又は聞きやすい状態を作り出して、会話に引き込まれていく。こうした身体リズムの共有により会話に引き込まれていく現象を、「身体的引き込み現象」と呼ぶ。これから、聞き手に代わって話し手に身体的引き込み現象をもたらす装置又はシステム、また話し手に代わって聞き手に身体的引き込み現象をもたらす装置又はシステムがあれば、話し手又は聞き手に、それぞれ身体的引き込み現象をもたらすことができる。   Talkers and listeners who communicate through conversations listen to their own or the other's voice (verbal information) and acquire sensory information (non-verbal information) including their own or other's body movements to share their physical rhythms. , Create a state that is easier to talk or hear, and get drawn into the conversation. This phenomenon of being drawn into conversation by sharing physical rhythm is called “physical attraction”. From now on, if there is a device or system that causes a physical retraction phenomenon to the speaker instead of the listener, or a device or system that causes a physical retraction phenomenon to the listener instead of the speaker, the physical retraction phenomenon will be brought to the speaker or listener, respectively. be able to.

こうした身体的引き込み現象を利用した装置としては、例えば特許文献1がある。この特許文献1は、ノンバーバル情報として視覚的な感覚情報、すなわちロボットの身体動作により、このロボットに話しかける話し手、又はロボットから流れる音声を聞く聞き手に身体的引き込み現象をもたらす。ここで、前記身体動作は、口の開閉動作、目の瞬き動作又は身体の身振り動作の選択的な組み合わせからなるが、各部の動作は頭の頷き動作の動作タイミングを基準として決定される。この頷き動作タイミングは、聞き手の反応が最も顕著に現れると推定される時系列上の特定時点であり、この特許文献1では音声から推定される頷き予測値が予め定めた頷き閾値を越えた時点としている。ここで、ロボットに代えて、コンピュータ画像によるキャラクタであってもよい。   As an apparatus using such a physical pull-in phenomenon, for example, there is Patent Document 1. This patent document 1 causes a physical pull-in phenomenon to a speaker who talks to the robot or a listener who hears a voice flowing from the robot, based on visual sensory information as non-verbal information, that is, a body motion of the robot. Here, the body motion includes a selective combination of mouth opening / closing operation, eye blinking operation, or body gesture operation, and the operation of each part is determined based on the operation timing of the head movement operation. This whispering operation timing is a specific time point on the time series where it is estimated that the listener's reaction appears most prominently. In this patent document 1, the whirling prediction value estimated from speech exceeds a predetermined whispering threshold. It is said. Here, instead of the robot, a character based on a computer image may be used.

特開2001-009169号公報(2頁〜6頁、図1)Japanese Patent Laid-Open No. 2001-009169 (pages 2 to 6, FIG. 1)

上記特許文献1の装置は、目前に相手方がいない会話を想定し、視覚的な感覚情報として捉えられるロボットの身体動作をノンバーバル情報として与え、話し手又は聞き手に身体的引き込み現象をもたらしている。しかし、会話では通常相手方が目前にいるため、ノンバーバル情報として視覚的な感覚情報を与えにくい。例えば、話し手に対し、聞き手とは別にロボット又はコンピュータ画像のキャラクタを用意すれば、話し手の視線は聞き手とロボット又はキャラクタの間で切り替えざるを得なくなる。しかし、こうした視線の切替は、聞き手やロボット又はキャラクタから得られるノンバーバル情報としての視覚的な感覚情報による身体的引き込み現象を引き起こしにくくする。   The apparatus of the above-mentioned patent document 1 assumes a conversation where there is no other party at hand, and gives the robot's body motion, which is captured as visual sensory information, as non-verbal information, causing a physical pull-in phenomenon to the speaker or listener. However, it is difficult to give visual sensory information as non-verbal information because the other party is usually at hand in conversation. For example, if a robot or computer image character is prepared for a speaker separately from the listener, the gaze of the speaker must be switched between the listener and the robot or character. However, such gaze switching makes it difficult to cause a physical pull-in phenomenon due to visual sensory information as non-verbal information obtained from a listener, a robot, or a character.

上記視線の切替による問題は、話し手又は聞き手が不特定又は多数である場面、具体的にはテレビ放送、講演、街頭演説やプレゼンテーションでも起きうる。特に、プレゼンテーションでは、ノンバーバル情報を視覚的な感覚情報として与えにくいと考えられる。通常のプレゼンテーションでは、全体として暗くされ、発表内容の表示画面に話し手又は聞き手の視線が向けられる。このため、表示画面以外からノンバーバル情報として視覚的な感覚情報を与えることは難しい。   The problem due to the switching of the line of sight can also occur in scenes where the number of speakers or listeners is unspecified or many, specifically, television broadcasting, lectures, street speeches or presentations. In particular, it is difficult to give nonverbal information as visual sensory information in presentations. In a normal presentation, the screen is darkened as a whole, and a speaker or listener's line of sight is directed to the display screen of the presentation contents. For this reason, it is difficult to give visual sense information as non-verbal information from other than the display screen.

ここで、特許文献1の装置は、頷き動作を中心としたロボットの身体動作を視覚的な感覚情報として特定の動作タイミングで実行している点に、身体的引き込み現象をもたらす働きがある。これから、視覚的な感覚情報以外のノンバーバル情報を特定のタイミングで与えれば、話し手又は聞き手に身体的引き込み現象をもたらすことができると考えられる。そこで、目前に相手方がいる会話や、話し手又は聞き手が不特定又は多数である場面においても、話し手又は聞き手に視線の切替を要求することなく、それぞれに対して身体的引き込み現象をもたらすノンバーバル情報を与える身体的引き込み方法と、前記ノンバーバル情報を与えるシステムとを開発するため、検討した。   Here, the apparatus of Patent Document 1 has a function of causing a physical pull-in phenomenon in that a body motion of a robot centering on a whispering motion is executed as visual sense information at a specific motion timing. From this, it can be considered that if non-verbal information other than visual sensory information is given at a specific timing, a physical pull-in phenomenon can be brought to the speaker or listener. Therefore, in conversations where the other party is in front of you, or in situations where the number of speakers or listeners is unspecified or large, non-verbal information that causes physical pull-in to each other without requiring the speakers or listeners to switch gazes. In order to develop a physical pull-in method to give and a system to give the non-verbal information, it was studied.

検討の結果開発したものが、ノンバーバル情報として触覚的な感覚情報を話し手又は聞き手に与えて、身体的引き込み現象をもたらす方法及びシステムである。まず、目前に相手方がいる会話や、話し手又は聞き手が不特定又は多数である場面で、聞き手に対する身体的引き込み現象を話し手にもたらすに際し、演算部が算出する動作タイミングで駆動部により駆動する動作単位を話し手に所持させ、演算部は話し手の音声の信号から推定される動作予測値が予め定めた動作閾値を越えた時点を動作タイミングとして算出し、前記動作タイミングで駆動部が動作単位を駆動させて触覚的な感覚情報として動作タイミングを話し手に教示することにより、聞き手に対する身体的引き込み現象を話し手にもたらす触覚に訴える身体的引き込み方法を用いる。ここで、話し手が動作単位を「所持」するとは、話し手の身体に動作単位が直接又は間接に接触していることを意味し、動作単位を手に持つ場合のほか、動作単位をポケットに入れる場合を含む(以下、同じ)。   What has been developed as a result of the study is a method and system that provides tactile sensory information as non-verbal information to a speaker or listener to bring about a physical pull-in phenomenon. First, in a conversation where the other party is in front of you, or in a scene where the number of speakers or listeners is unspecified or many, the unit of motion that is driven by the drive unit at the timing calculated by the calculation unit when bringing the physical pull-in phenomenon to the speaker to the speaker The calculation unit calculates the operation timing when the predicted motion value estimated from the speaker's voice signal exceeds a predetermined operation threshold, and the drive unit drives the operation unit at the operation timing. A physical pull-in method that appeals to the tactile sensation that brings the speaker to the physical pull-in phenomenon is used by teaching the timing of movement to the speaker as tactile sensory information. Here, when a speaker “has” a motion unit, it means that the motion unit is in direct or indirect contact with the body of the speaker. In addition to holding the motion unit in the hand, the motion unit is put in a pocket. Including cases (hereinafter the same).

上記動作タイミングは動作単位を駆動する時系列上の特定時点であるが、身体的引き込み現象との関係で言えば、動作タイミングは聞き手の反応が顕著に現れると推定される時系列上の特定時点を意味する。すなわち、話し手に対する触覚に訴える身体的引き込み方法は、聞き手の反応が顕著に現れると推定される時系列上の特定時点で駆動する動作単位により、触覚的な感覚情報を話し手に直接与えて反応させ、この動作単位を所持する話し手に適切な身体的引き込み現象をもたらす。   The above operation timing is a specific time point on the time series that drives the operation unit, but in relation to the physical pull-in phenomenon, the operation timing is a specific time point on the time series where it is estimated that the listener's reaction will appear prominently. Means. In other words, the physical pull-in method that appeals to the tactile sensation of the speaker gives the tactile sensory information directly to the speaker in response to a motion unit that is driven at a specific point in time on the time series where it is estimated that the listener's response will appear prominently. This brings about a physical pull-in phenomenon suitable for a speaker possessing this movement unit.

話し手の音声の信号から推定される動作予測値は、現在から一定時間範囲の過去に取得した話し手の音声の信号の現在に対する影響の度合いを積算して算出するとよい。前記影響の度合いは、現在と過去とを線形結合、非線形結合又はニューラルネットワーク等で関係づけることにより導き出すことができる。例えば、現在から一定時間範囲の過去に取得した話し手の音声の信号の現在に対する影響の度合いを線形結合で導き出す場合、動作予測値は話し手の音声の信号の移動平均(Moving Average)により推定する。前記移動平均は、例えば次式を用いる。数1中、y(i)は動作予測値、a(j)は予測係数、そしてx(i−j)は話し手の音声の信号を表す。   The motion prediction value estimated from the speaker's voice signal may be calculated by integrating the degree of influence of the speaker's voice signal acquired in the past within a certain time range from the present. The degree of influence can be derived by relating the present and the past by a linear combination, a non-linear combination, a neural network, or the like. For example, when the degree of influence of a speaker's voice signal acquired in the past in a certain time range from the present on the present is derived by linear combination, the motion prediction value is estimated by a moving average of the speaker's voice signal. For example, the moving average is used as the moving average. In Equation 1, y (i) represents a motion prediction value, a (j) represents a prediction coefficient, and x (i−j) represents a speaker's voice signal.

上記数1に対し、下記数2に見られるように、乱数に基づくノイズw(i)を加え、動作予測値y(i)を算出する度に異なる値にしてもよい。前記ノイズw(i)は、動作予測値y(i)に自然なゆらぎを加味し、動作タイミングの決定から不自然な規則性を除外する働きがある。   As can be seen from the following equation (2), a noise w (i) based on a random number may be added to the equation (1), and a different value may be set each time the motion prediction value y (i) is calculated. The noise w (i) has a function of adding natural fluctuation to the motion prediction value y (i) and excluding unnatural regularity from the determination of motion timing.

本発明では、動作タイミングで動作単位を駆動し、触覚的な感覚情報を話し手に与えることができればよく、動作単位の構成は問わない。これから、動作単位は、所持する話し手に引っ張り運動を与える構成、所持する話し手に押圧運動を与える構成、所持する話し手に振動を与える構成、又は所持する話し手に風を与える構成のいずれか又は組み合わせて用いることができる。   In the present invention, the operation unit is not limited as long as the operation unit is driven at the operation timing and tactile sensory information can be given to the speaker. From now on, the motion unit may be one of or a combination of a configuration in which a pulling motion is given to a possessed speaker, a configuration in which a pressing motion is imparted to a possessed speaker, a configuration in which a vibration is imparted to a possessed speaker, or a configuration in which a wind is given to a possessed speaker. Can be used.

次に、目前に相手方がいる会話や、話し手又は聞き手が不特定又は多数である場面で、話し手に対する身体的引き込み現象を聞き手にもたらすに際し、演算部が算出する動作タイミングで駆動部により駆動する動作単位を聞き手に所持させ、演算部は話し手の音声の信号から推定される動作予測値が予め定めた動作閾値を越えた時点を動作タイミングとして算出し、前記動作タイミングで駆動部が動作単位を駆動させて聞き手に触覚的な感覚情報として動作タイミングを教示することにより、話し手に対する身体的引き込み現象を聞き手にもたらす触覚に訴える身体的引き込み方法を用いる。   Next, in a conversation where the other party is in front of you, or in a scene where the number of speakers or listeners is unspecified or many, an operation driven by the drive unit at the operation timing calculated by the calculation unit when bringing the physical pull-in phenomenon to the speaker to the listener The operation unit calculates the point in time when the predicted motion value estimated from the speaker's voice signal exceeds a predetermined motion threshold, and the drive unit drives the motion unit at the motion timing. Then, a physical pull-in method that appeals to the tactile sensation that brings the physical pull-in phenomenon to the speaker to the listener by teaching the operation timing as tactile sensory information to the listener is used.

上記動作タイミングは動作単位を駆動する時系列上の特定時点であるが、身体的引き込み現象との関係で言えば、動作タイミングは聞き手の反応が顕著に現れると推定される時系列上の特定時点を意味する。すなわち、聞き手に対する触覚に訴える身体的引き込み方法は、聞き手の反応が顕著に現れると推定される時系列上の特定時点で駆動する動作単位により、触覚的な感覚情報を聞き手に直接与えて同期させ、この動作単位を所持する聞き手に適切な身体的引き込み現象をもたらす。   The above operation timing is a specific time point on the time series that drives the operation unit, but in relation to the physical pull-in phenomenon, the operation timing is a specific time point on the time series where it is estimated that the listener's reaction will appear prominently. Means. In other words, the physical pull-in method that appeals to the listener's tactile sensation directly synchronizes the listener with tactile sensory information that is driven at a specific point in time on the time series where it is estimated that the listener's response will appear prominently. This brings about a physical pull-in phenomenon appropriate for the listener who possesses this movement unit.

話し手の音声の信号から推定される動作予測値は、現在から一定時間範囲の過去に取得した話し手の音声の信号の現在に対する影響の度合いを積算して算出するとよい。前記影響の度合いは、現在と過去とを線形結合、非線形結合又はニューラルネットワーク等で関係づけることにより導き出すことができる。例えば、現在から一定時間範囲の過去に取得した話し手の音声の信号の現在に対する影響の度合いを線形結合で導き出す場合、動作予測値は話し手の音声の信号の移動平均(Moving Average)により推定する。前記移動平均は、例えば上記数1を用いることができる。   The motion prediction value estimated from the speaker's voice signal may be calculated by integrating the degree of influence of the speaker's voice signal acquired in the past within a certain time range from the present. The degree of influence can be derived by relating the present and the past by a linear combination, a non-linear combination, a neural network, or the like. For example, when the degree of influence of the speaker's voice signal acquired in the past in a certain time range from the present on the current is derived by linear combination, the motion prediction value is estimated by the moving average of the speaker's voice signal. As the moving average, for example, the above equation 1 can be used.

また、上記数2を用いて、乱数に基づくノイズw(i)を加え、動作予測値y(i)を算出する度に異なる値にしてもよい。前記ノイズw(i)は、動作予測値y(i)に自然なゆらぎを加味し、動作タイミングの決定から不自然な規則性を除外する働きがある。   Further, the value 2 may be used to add a noise w (i) based on a random number, and a different value each time the motion prediction value y (i) is calculated. The noise w (i) has a function of adding natural fluctuation to the motion prediction value y (i) and excluding unnatural regularity from the determination of motion timing.

ここで、上記話し手及び聞き手の各動作予測値は、基礎となる話し手の音声の信号が同じであることから、予測係数を同じにして、同じ値にすることができる。この場合、更に話し手及び聞き手の各動作閾値が同じであれば、話し手及び聞き手の各動作単位の動作タイミングも一致する。通常の会話におけるノンバーバル情報は、話し手に対する聞き手の反応が大半を占めている。このため、話し手及び聞き手は、前記話し手に対する聞き手の反応が顕著に現れると推定される時系列上の特定時点を等しく感得して身体リズムを共有し、それぞれに身体的引き込み現象をもたらすと考えられる。これから、話し手及び聞き手の各動作単位の動作タイミングは一致させ、話し手及び聞き手それぞれに同じタイミングで触覚的な感覚情報を与えることが現実的と考えられる。厳密に言えば、話し手に対して身体的引き込み現象をもたらすことに適した特定時点である動作タイミングは、聞き手の動作単位の動作タイミングと異なることも考えられるが、この場合は各算出式の予測係数を違えるほか、算出式そのものを異ならせるとよい。   Here, the predicted motion values of the speaker and the listener can be set to the same value by using the same prediction coefficient because the speech signal of the basic speaker is the same. In this case, if the operation thresholds of the speaker and the listener are the same, the operation timings of the operation units of the speaker and the listener also coincide. Nonverbal information in normal conversation is dominated by the listener's response to the speaker. For this reason, it is considered that the speaker and the listener can equally feel the specific time point on the time series estimated to have a noticeable response of the listener to the speaker, share the physical rhythm, and bring about the physical pull-in phenomenon respectively. It is done. From this, it is considered realistic that the operation timings of the respective operation units of the speaker and the listener are made coincident and tactile sensory information is given to the speaker and the listener at the same timing. Strictly speaking, the motion timing, which is a specific point in time that is suitable for bringing a physical pull-in phenomenon to the speaker, may be different from the motion timing of the listener's motion unit. In addition to using different coefficients, it is better to use different calculation formulas.

聞き手の動作単位も、上述した話し手の動作単位同様、動作タイミングで駆動し、触覚的な感覚情報を聞き手に与えることができればよく、構成を問わない。これから、動作単位は、所持する聞き手に引っ張り運動を与える構成、所持する聞き手に押圧運動を与える構成、所持する聞き手に振動を与える構成、又は所持する聞き手に風を与える構成のいずれか又は組み合わせて用いることができる。   The operation unit of the listener is not limited to the configuration as long as it can be driven at the operation timing and can provide tactile sensory information to the listener, like the operation unit of the speaker described above. From now on, the motion unit is one of or a combination of a configuration in which a pulling motion is given to a listener, a configuration in which a pressing motion is given to a listener, a configuration in which a vibration is given to a listener, or a configuration in which a wind is given to a listener Can be used.

本発明の触覚に訴える身体的引き込み方法を用いたシステムは、次のように構成できる。すなわち、目前に相手方がいる会話や、話し手又は聞き手が不特定又は多数である場面で、聞き手に対する身体的引き込み現象を話し手にもたらすシステムであって、所持した話し手に触覚的な感覚情報を与える動作単位と、この動作単位を駆動する駆動部と、この駆動部の動作タイミングを算出する演算部と、この演算部へ話し手の音声の信号を取り込む信号入力部とからなり、演算部は信号入力部から取り込まれた話し手の音声の信号から推定される動作予測値が予め定めた動作閾値を越えた時点を動作タイミングとして算出し、駆動部は前記動作タイミングで動作単位を駆動させて触覚的な感覚情報として動作タイミングを話し手に教示して、聞き手に対する身体的引き込み現象を話し手にもたらす触覚に訴える身体的引き込みシステムである。   The system using the physical pull-in method appealing to the sense of touch of the present invention can be configured as follows. In other words, in a conversation where the other party is in front of you or a scene where the number of speakers or listeners is unspecified or many, this system provides the speaker with a physical pull-in phenomenon to the speaker, and gives tactile sensory information to the speaker Unit, a drive unit that drives the operation unit, a calculation unit that calculates the operation timing of the drive unit, and a signal input unit that captures the voice signal of the speaker into the calculation unit. When the predicted motion value estimated from the speech signal of the speaker captured from the speaker exceeds the predetermined motion threshold, the drive unit calculates the motion timing, and the drive unit drives the motion unit at the motion timing to sense a tactile sensation. A physical retraction system that tells the speaker the timing of movement as information and appeals to the sense of touch that brings the physical retraction phenomenon to the speaker. It is.

上記身体的引き込みシステムの動作単位は触覚により駆動が感得される物体、駆動部は前記物体を駆動するモータやシリンダ、演算部はコンピュータ、そして信号入力部は前記コンピュータに接続するマイク等の入力インタフェースから構成される。ここで、駆動部は動作単位を駆動させる部分を意味し、例えば小型振動モータでは、振動用錘を 動作単位、モータを駆動部と考えてもよいし、振動用錘を取り付けたモータを一体の動作単位とし、前記モータに駆動信号を送り出す部分を駆動部と考えてもよい。こうした身体的引き込みシステムにおいても、動作予測値は、話し手の音声の信号の移動平均(Moving Average)により推定するとよい。この場合、前記移動平均は、例えば上記数1又は数2を用いることにより、演算部の負担を軽くしながら、動作予測値を算出する時間間隔を短くすることができ、きめ細やかな動作タイミングの算出が可能となる。   The operation unit of the physical pull-in system is an object that can be sensed by tactile sense, the drive unit is a motor or cylinder that drives the object, the calculation unit is a computer, and the signal input unit is an input such as a microphone connected to the computer. Consists of interfaces. Here, the drive unit means a part that drives an operation unit. For example, in a small vibration motor, a vibration weight may be considered as an operation unit and the motor may be considered as a drive unit, or a motor equipped with a vibration weight is integrated. A portion that sends a drive signal to the motor as an operation unit may be considered as a drive unit. Even in such a physical entrainment system, the motion prediction value may be estimated by a moving average of a speaker's voice signal. In this case, for example, by using the above Equation 1 or Equation 2, the moving average can reduce the time interval for calculating the motion prediction value while reducing the burden on the calculation unit, and can provide detailed motion timing. Calculation is possible.

具体的な動作単位は、所持する話し手に引っ張り運動を与える構成、例えばモータ又はシリンダによる反復運動するリングに話し手の指を挿入させてリングにより繰り返し引っ張らせる構成や、所持する話し手に押圧運動を与える構成、例えば例えばモータ又はシリンダにより拡大及び縮小を繰り返すリングに話し手の指を挿入させてリングにより繰り返し締め付ける構成や、所持する話し手に振動を与える構成、例えば偏心させた錘をモータにより所定ケース内で自転させて前記所定ケースを握る話し手の手に振動を感得させる構成や、又は所持する話し手に風を与える構成、例えばモータにより断続的又は周期的に回転数を変化させるファンで話し手の手に風を感得させる構成を例示できる。   The specific motion unit is configured to give the speaker a pulling motion, for example, a configuration in which a speaker's finger is inserted into a ring that repeatedly moves by a motor or a cylinder and pulled repeatedly by the ring, or a pressing motion is given to the speaker Configuration, for example, a configuration in which a speaker's finger is inserted into a ring that repeatedly expands and contracts by a motor or a cylinder and the ring is repeatedly tightened by a ring, a configuration that gives vibration to the speaker in possession, for example, an eccentric weight within a predetermined case by a motor A configuration in which the speaker's hand that rotates and grasps the predetermined case feels vibration, or a configuration that gives wind to the speaker in possession, for example, a fan that changes the rotation speed intermittently or periodically by a motor. The structure which makes wind feel can be illustrated.

また、目前に相手方がいる会話や、話し手又は聞き手が不特定又は多数である場面で、話し手に対する身体的引き込み現象を聞き手にもたらすシステムであって、所持した聞き手に触覚的な感覚情報を与える動作単位と、この動作単位を駆動する駆動部と、この駆動部の動作タイミングを算出する演算部と、この演算部へ話し手の音声の信号を取り込む信号入力部とからなり、演算部は信号入力部から取り込まれた話し手の音声の信号から推定される動作予測値が予め定めた聞き手動作閾値を越えた時点を動作タイミングとして算出し、駆動部は前記動作タイミングで動作単位を駆動させて聞き手に触覚的な感覚情報として動作タイミングを教示して、話し手に対する身体的引き込み現象を聞き手にもたらす触覚に訴える身体的引き込みシステムもある。   In addition, a system that provides the listener with a physical pull-in phenomenon to the listener in conversations where the other party is in front of you, or in situations where the number of speakers or listeners is unspecified or large, and provides tactile sensory information to the listener Unit, a drive unit that drives the operation unit, a calculation unit that calculates the operation timing of the drive unit, and a signal input unit that captures the voice signal of the speaker into the calculation unit. When the predicted motion estimated from the speech signal of the speaker captured from the speaker exceeds the predetermined listener motion threshold, it is calculated as the motion timing, and the drive unit drives the motion unit at the motion timing to sense the listener Physical pull-in system that teaches the tactile sensation that tells the listener the physical pull-in phenomenon to the speaker by teaching the timing of movement as realistic sensory information Arm also.

上記身体的引き込みシステムの動作単位は触覚により駆動が感得される物体、駆動部は前記物体を駆動するモータやシリンダ、演算部はコンピュータ、そして信号入力部は前記コンピュータに接続するマイク等の入力インタフェースから構成される。ここで、駆動部は動作単位を駆動させる部分を意味し、例えば小型振動モータでは、振動用錘を 動作単位、モータを駆動部と考えてもよいし、振動用錘を取り付けたモータを一体の動作単位とし、前記モータに駆動信号を送り出す部分を駆動部と考えてもよい。こうした身体的引き込みシステムにおいても、動作予測値は、話し手の音声の信号の移動平均(Moving Average)により推定するとよい。この場合、前記移動平均は、例えば上記数1又は数2を用いることにより、演算部の負担を軽くしながら、動作予測値を算出する時間間隔を短くすることができ、きめ細やかな動作タイミングの算出が可能となる。   The operation unit of the physical pull-in system is an object that can be sensed by tactile sense, the drive unit is a motor or cylinder that drives the object, the calculation unit is a computer, and the signal input unit is an input such as a microphone connected to the computer. Consists of interfaces. Here, the drive unit means a part that drives an operation unit. For example, in a small vibration motor, a vibration weight may be considered as an operation unit and the motor may be considered as a drive unit, or a motor equipped with a vibration weight is integrated. A portion that sends a drive signal to the motor as an operation unit may be considered as a drive unit. Even in such a physical entrainment system, the motion prediction value may be estimated by a moving average of a speaker's voice signal. In this case, for example, by using the above Equation 1 or Equation 2, the moving average can reduce the time interval for calculating the motion prediction value while reducing the burden on the calculation unit, and can provide detailed motion timing. Calculation is possible.

具体的な動作単位は、所持する聞き手に引っ張り運動を与える構成、例えばモータ又はシリンダによる反復運動するリングに聞き手の指を挿入させてリングにより繰り返し引っ張らせる構成や、所持する聞き手に押圧運動を与える構成、例えば例えばモータ又はシリンダにより拡大及び縮小を繰り返すリングに聞き手の指を挿入させてリングにより繰り返し締め付ける構成や、所持する聞き手に振動を与える構成、例えば偏心させた錘をモータにより所定ケース内で自転させて前記所定ケースを握る聞き手の手に振動を感得させる構成や、又は所持する聞き手に風を与える構成、例えばモータにより断続的又は周期的に回転数を変化させるファンで聞き手の手に風を感得させる構成を例示できる。   The specific motion unit is configured to give the listener a pulling motion, for example, a configuration in which the finger of the listener is inserted into a ring that is repeatedly moved by a motor or a cylinder and pulled repeatedly by the ring, or a pressing motion is given to the listener Configuration, for example, a configuration in which a listener's finger is inserted into a ring that repeatedly expands and contracts by a motor or a cylinder and the ring is repeatedly tightened by the ring, or a configuration that gives vibration to the listener in possession, for example, an eccentric weight within a predetermined case by a motor. A configuration in which the listener's hand that rotates and grasps the predetermined case is perceived to vibrate, or a configuration that imparts wind to the listener in possession, for example, a fan that changes the rotation speed intermittently or periodically by a motor. The structure which makes wind feel can be illustrated.

本発明により、目前に相手方がいる会話や、話し手又は聞き手が不特定又は多数である場面においても、話し手又は聞き手に視線の切替を要求することなく、それぞれに対して身体的引き込み現象をもたらすノンバーバル情報として触覚的な感覚情報を与え、話し手又は聞き手それぞれに適切な身体的引き込み現象をもたらすことができる。これにより、話し手及び聞き手は、それぞれ相手方から目を逸らさずに済み、話し手は話しやすく、また聞き手は話し手の話を聞きやすくなる効果がある。   According to the present invention, even in a conversation in which the other party is in front of you, or in a scene where the number of speakers or listeners is unspecified or many, non-verbal that causes a physical pull-in phenomenon for each speaker or listener without requiring a change of line of sight Tactile sensory information can be given as information, and an appropriate physical pull-in phenomenon can be brought about for each speaker or listener. As a result, the speaker and the listener do not have to take their eyes away from the other party, so that the speaker is easy to talk and the listener is easy to hear the speaker.

とりわけ、触覚的な感覚情報を与えることから、周囲が暗く、又は見通しの悪い場面であっても、話し手又は聞き手にそれぞれ身体的引き込み現象をもたらすことができる。これにより、テレビ放送、講演、街頭演説やプレゼンテーション等においても、話し手は話しやすく、また聞き手は放送内容、講演内容、演説内容又は発表内容をよりよく聴取できるようになる効果がある。   In particular, since tactile sensory information is given, a physical pull-in phenomenon can be caused to a speaker or a listener even when the surroundings are dark or the scene has poor visibility. As a result, in television broadcasting, lectures, street speeches, presentations, etc., the speaker is easy to talk, and the listener can listen to the broadcast contents, lecture contents, speech contents, or presentation contents more effectively.

以下、図面を参照して本発明の実施形態について説明する。図1は話し手及び聞き手にそれぞれ振動体10,20を所持させて構成した身体的引き込みシステムの構成図、図2は同身体的引き込みシステムのブロック図である。本例は、話し手及び聞き手が一対一の場合を想定している。これに対し、話し手又は聞き手のいずれかが複数の場合、それぞれに所持させる振動体10,20が増えるだけであるため、ここでは代表として話し手及び聞き手が一対一の場合の説明に留める。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram of a physical pull-in system in which a speaker and a listener have vibrators 10 and 20 respectively, and FIG. 2 is a block diagram of the physical pull-in system. This example assumes a case where there is a one-to-one speaker and listener. On the other hand, when there are a plurality of speakers or listeners, the number of vibrators 10 and 20 to be held is increased, and therefore, here, only a case where there is a one-to-one speaker and listener will be described.

本例の身体的引き込みシステムは、図1及び図2に見られるように、話し手及び聞き手に所持させる振動体10,20のみが個別で、その他は兼用である。具体的には、話し手の音声をピンマイク11で拾って送受信装置30へ無線で送信してコンピュータ31に取り込み、コンピュータ31で前記音声から動作タイミングを算出して、前記動作タイミングに合わせて駆動信号を前記送受信装置30から話し手及び聞き手の各振動体10,20へ送信し、話し手又は聞き手に振動を与える。ピンマイク11とコンピュータ31、そしてコンピュータ31と各振動体10,20とをそれぞれ無線で接続することで、有線によるシステム構成の複雑さを避け、話し手及び聞き手の人数の増減に対応しやすくなり、例えば出入り自由な講演会等に適したシステム構成ができる。   As shown in FIGS. 1 and 2, the physical pull-in system of this example is such that only the vibrators 10 and 20 that are held by the speaker and the listener are separate, and the others are combined. Specifically, the voice of the speaker is picked up by the pin microphone 11 and wirelessly transmitted to the transmission / reception device 30 and captured by the computer 31. The computer 31 calculates the operation timing from the voice, and the drive signal is matched to the operation timing. The data is transmitted from the transmitting / receiving device 30 to each of the vibrating bodies 10 and 20 of the speaker and the listener to give vibration to the speaker or the listener. By connecting the pin microphone 11 and the computer 31 and the computer 31 and the vibrators 10 and 20 wirelessly, the complexity of the wired system configuration can be avoided, and the number of speakers and listeners can be easily increased and decreased. A system configuration suitable for lectures where people can enter and exit freely is possible.

動作タイミングは、信号入力部であるピンマイク11から取り込む話し手の音声から算出する。話し手又は聞き手に対する振動体10,20の動作タイミングは異ならせることもできるが、前記各振動体10,20の動作タイミングは同じであるほうが、話し手及び聞き手の身体リズムを共有しやすくなる。そこで、本例では、話し手及び聞き手を区別することなく、単一のアルゴリズムにより推定された動作予測値を単一の動作閾値と比較して算出した動作タイミングを、話し手又は聞き手の各振動体10,20の動作タイミングとしている。   The operation timing is calculated from the voice of the speaker captured from the pin microphone 11 that is a signal input unit. Although the operation timings of the vibrators 10 and 20 with respect to the speaker or the listener can be made different, it is easier to share the body rhythm of the speaker and the listener when the operation timings of the vibrators 10 and 20 are the same. Therefore, in this example, without distinguishing between the speaker and the listener, the motion timing calculated by comparing the motion prediction value estimated by a single algorithm with a single motion threshold is determined for each vibrator 10 of the speaker or the listener. 20 operation timings.

演算部は、コンピュータ31により構成する。上述のように、本例では、話し手及び聞き手に対する動作予測値の推定は単一のアルゴリズムを用い、そして単一の動作閾値と比較しているため、話し手及び聞き手それぞれに対する動作タイミングの算出に係る時間差はない。コンピュータ31は、演算部を構成するプログラムを実行させ、動作タイミングを算出する。このように、演算部はコンピュータ上のプログラムの実行により構成されることから、例えば話し手及び聞き手に対する動作タイミングの算出に同じ算出式を用いながら異なる予測係数や動作閾値を用いる場合や、話し手及び聞き手に対する動作タイミングの算出に異なる算出式を用いる場合でも、話し手用及び聞き手用の各演算部を容易に構成できる。   The calculation unit is configured by the computer 31. As described above, in this example, since the estimation of the motion prediction value for the speaker and the listener uses a single algorithm and is compared with a single motion threshold, it relates to the calculation of the motion timing for each of the speaker and the listener. There is no time difference. The computer 31 executes a program constituting the calculation unit and calculates an operation timing. As described above, since the calculation unit is configured by executing a program on the computer, for example, when using the same calculation formula for calculating the operation timing for the speaker and the listener, different prediction coefficients and operation thresholds are used, or when the speaker and the listener are used. Even when different calculation formulas are used to calculate the operation timing for the speaker, the calculation units for the speaker and the listener can be easily configured.

コンピュータ31は、送受信装置30を介して話し手又は聞き手が所持する振動体10,20へ駆動信号を送信する。本例の各振動体10,20は、略円筒状のケース12,22内に、前記駆動信号を受けて駆動する駆動部13,23と、この駆動部13,23の駆動により振動体10,20全体を振動させる動作単位14,24とを内蔵している。上述のように、本例では話し手及び聞き手に対する動作タイミングを一致させ、話し手及び聞き手が所持する振動体10,20は同じ構成にしているから、実際には、話し手が所持する振動体10と聞き手が所持する振動体20とを区別して取り扱う必要はない。これから、本発明の身体的引き込みシステムでは、実際上、話し手及び聞き手の区別なく同じ構成の振動体等を所持させれば、話し手及び聞き手それぞれに身体的引き込み現象をもたらすことができる。   The computer 31 transmits a drive signal to the vibrators 10 and 20 possessed by the speaker or the listener via the transmission / reception device 30. The vibrating bodies 10 and 20 of the present example are provided in the substantially cylindrical cases 12 and 22, respectively, by driving units 13 and 23 that are driven by receiving the driving signal, and the driving units 13 and 23 are driven by the driving units 13 and 23. Built-in motion units 14 and 24 that vibrate the entire 20. As described above, in this example, the operation timings for the speaker and the listener are matched, and the vibrators 10 and 20 possessed by the speaker and the listener have the same configuration. Therefore, actually, the vibrator 10 and the listener possessed by the speaker are actually the same. Therefore, it is not necessary to distinguish and handle the vibrating body 20 possessed by the. From the above, in the physical pulling system of the present invention, if a vibrating body or the like having the same configuration is actually possessed without distinguishing between the speaker and the listener, a physical pulling phenomenon can be brought about for each of the speaker and the listener.

本例の身体的引き込みシステムは、次のように働く。話し手が話し始めると、聞き手は話し手の音声(バーバル情報)を聞き取りながら、話し手の身振り等(ノンバーバル情報)を視覚的な感覚情報として取得することで、身体的引き込み現象がもたらされる。しかし、聞き手が話し手から目を逸らした場合、前記視覚的な感覚情報が激減し、円滑に身体的引き込み現象がもたらされなくなる虞れがある。ところが、本例の身体的引き込みシステムを用いれば、聞き手の視線を問わず、聞き手の反応が顕著に現れると推定される時系列上の特定時点を振動体20が振動によって聞き手に教えることにより、聞き手に不足するノンバーバル情報が補われ、円滑に身体的引き込み現象がもたらされる。聞き手が話し手から目を逸らさない場合、視覚的な感覚情報に加え、触覚的な感覚情報が与えられることから、より積極的に身体的引き込み現象が聞き手にもたらされる。   The physical retraction system of this example works as follows. When the speaker starts speaking, the listener obtains the gesture of the speaker (non-verbal information) as visual sensory information while listening to the speaker's voice (verbal information), thereby causing a physical pull-in phenomenon. However, if the listener turns away from the speaker, the visual sensory information is drastically reduced, and there is a possibility that the physical pull-in phenomenon will not be brought about smoothly. However, if the physical pull-in system of this example is used, regardless of the line of sight of the listener, the vibrating body 20 teaches the listener by vibration at a specific time point on the time series where the listener's reaction is estimated to appear prominently. Non-verbal information that the listener lacks is compensated for, and the physical pull-in phenomenon is brought about smoothly. When the listener does not look away from the speaker, tactile sensory information is given in addition to visual sensory information, so that a physical pull-in phenomenon is more positively brought to the listener.

話し手は、聞き手の反応(ノンバーバル情報)を取得することにより、身体的引き込み現象がもたらされる。よって、聞き手の反応が十分でないと、話し手に身体的引き込み現象が円滑にもたらされなくなる。この場合でも、本例の身体的引き込みシステムを用いれば、聞き手の反応を問わず、聞き手の反応が顕著に現れると推定される時系列上の特定時点を振動体10が振動によって話し手に教えることができ、話し手に不足するノンバーバル情報を補って、円滑に身体的引き込み現象が話し手にもたらされる。また、本例の身体的引き込みシステムにより身体的引き込み現象が聞き手にもたらされているので、聞き手の反応はよくなっており、この良好な聞き手の反応を話し手が視覚的な感覚情報として受け取ることにより、身体的引き込み現象が話し手によりよくもたらされる。   The speaker obtains the listener's reaction (non-verbal information), thereby causing a physical pull-in phenomenon. Therefore, if the listener's reaction is not sufficient, the physical pull-in phenomenon will not be brought smoothly to the speaker. Even in this case, if the physical pull-in system of this example is used, the vibrating body 10 teaches the speaker by vibration at a specific point in time series where it is estimated that the listener's response will appear prominently regardless of the listener's response. Can compensate for non-verbal information that the speaker lacks, and the physical pull-in phenomenon is smoothly brought to the speaker. In addition, because the physical pull-in system of this example brings the physical pull-in phenomenon to the listener, the listener's response is good and the speaker receives this good listener's response as visual sensory information. Thus, the physical pull-in phenomenon is better brought to the speaker.

このほか、本例では、話し手及び聞き手に対する動作タイミングを一致させ、同じ構成の振動体10,20により触覚的な感覚情報を与えているので、身体リズムの共有が容易になる利点もある。また、上述したことから明らかなように、視覚的な感覚情報と触覚的な感覚情報とは、互いが排斥する関係になく、むしろ相乗する関係にあることから、例えば話し手及び聞き手が身体的引き込み現象をもたらすキャラクタが表示されるテレビ電話で会話をする場合等に、各テレビ電話に表示されるキャラクタに加えて、同じ動作単位を話し手及び聞き手に所持させることで、会話がよりしやすくなる。このように、本発明は身体的引き込み現象を話し手又は聞き手に効率よくもたらす効果を有する。   In addition, in this example, since the operation timings for the speaker and the listener are matched and tactile sensory information is given by the vibrators 10 and 20 having the same configuration, there is an advantage that sharing of the body rhythm is facilitated. As is clear from the above, visual sensory information and tactile sensory information are not mutually exclusive, but rather synergistic. For example, the speaker and the listener are physically attracted. When a conversation is made on a videophone on which a character causing a phenomenon is displayed, the same operation unit is held by the speaker and the listener in addition to the character displayed on each videophone, thereby making the conversation easier. As described above, the present invention has an effect of efficiently bringing a physical pull-in phenomenon to a speaker or a listener.

次に、本発明の触覚に訴える身体的引き込みシステムが話し手に身体的引き込み現象をどの程度もたらすかを確認するため、数種類の触覚的な感覚情報を与える動作単位を実際に制作し、使用感を確認する官能評価試験を実施した。この度の官能評価試験では、従前より提案している視覚的な感覚情報により身体的引き込み現象をもたらすディスプレイ表示のキャラクタと併用することにより、視覚的な感覚情報及び触覚的な感覚情報を併用することの相乗効果についても確認した。   Next, in order to confirm how much the physical retraction system that appeals to the tactile sensation of the present invention brings about a physical retraction phenomenon to the speaker, we actually created motion units that give several types of tactile sensory information, The sensory evaluation test to confirm was implemented. In this sensory evaluation test, visual sensory information and tactile sensory information will be used in combination with a display-displayed character that causes physical pull-in phenomenon by the previously proposed visual sensory information. The synergistic effect was also confirmed.

この度の官能評価試験では、試験の簡略化のため、話し手側の装置のみからなる身体的引き込みシステムを用いている。実際には、更に聞き手側に同様な装置を配して、図3に見られる対称な身体的引き込みシステムとして使用する。前記対称な身体的引き込みシステムは、相手方に代わって身体動作するディスプレイ上のキャラクタにより、視覚的な感覚情報を話し手又は聞き手に与えて、それぞれに身体的引き込み現象をもたらす。キャラクタは人間を模した構成で、頷き動作、瞬き動作、口の開閉動のほか、首、腰、肩、肘又は手首の関節を動かして、全体的な身振り動作をする。   In this sensory evaluation test, a physical pull-in system consisting only of a speaker side device is used for the sake of simplicity of the test. In practice, a similar device is also placed on the listener side to use as a symmetrical physical retraction system as seen in FIG. The symmetrical physical retraction system provides visual sensory information to a speaker or listener by a character on the display that moves in place of the other party, thereby causing a physical retraction phenomenon. The character has a structure imitating a human being, and in addition to a whispering action, a blinking action, and a mouth opening / closing action, it moves the neck, waist, shoulder, elbow or wrist joint to perform an overall gesture action.

この度の官能評価試験では、上記話し手側の装置のみからなる身体的引き込みシステムに、触覚的な感覚情報を与える動作単位を加え、話し手に対してディスプレイ上のキャラクタによる視覚的な感覚情報と、前記動作単位による触覚的な感覚情報とを話し手に与えるようにしている。このような視覚的な感覚情報と触覚的な感覚情報との併用は、次に示す効果が期待される。   In this sensory evaluation test, a motion unit that gives tactile sensory information is added to the physical pull-in system consisting only of the device on the speaker side, and the visual sensory information by the character on the display for the speaker, The tactile sensory information by the motion unit is given to the speaker. The combined use of such visual sensory information and tactile sensory information is expected to have the following effects.

第一に、視覚的な感覚情報を与えるキャラクタと触覚的な感覚情報を与える動作単位とを併用することにより、話し手に与えることのできるノンバーバル情報を増加させることができると考えられる。これは、視覚的な感覚情報と触覚的な感覚情報とが合わさってノンバーバル情報の総量を増加させる効果(相乗効果)である。   First, it is considered that non-verbal information that can be given to a speaker can be increased by using a character that gives visual sensory information in combination with a motion unit that gives tactile sensory information. This is an effect (synergistic effect) of increasing the total amount of non-verbal information by combining visual sensory information and tactile sensory information.

第2に、触覚的な感覚情報は、仮想的な別の聞き手の存在を話し手に想像させやすく、身体的引き込み現象をもたらしやすくすると考えられる。これは、視覚的な感覚情報を触覚的な感覚情報が補完することによる効果(補完効果)である。すなわち、話し手に触覚的な感覚情報を与えることで、キャラクタ以外の仮想的な別の聞き手を話し手に認識させ、この話し手に身体的引き込み現象をもたらしやすくなると考えられる。聞き手に関して言えば、自分以外の仮想的な別の聞き手の存在を聞き手に認識させ、この聞き手に身体的引き込み現象をもたらしやすくなると考えられる。   Second, tactile sensory information is thought to make it easier for a speaker to imagine the existence of another virtual listener and to cause a physical pull-in phenomenon. This is an effect (complementary effect) obtained by complementing visual sensory information with tactile sensory information. That is, by providing tactile sensory information to the speaker, it is considered that the speaker can recognize a virtual other listener other than the character, and this speaker can be easily brought into a physical pull-in phenomenon. As for the listener, it is likely that the listener will be able to recognize the existence of another virtual listener other than his / her own, and this will be likely to cause a physical pull-in phenomenon.

第3に、仮に視覚的な感覚情報が損なわれても、触覚的な感覚情報が存在すれば、話し手に身体的引き込み現象がもたらされると考えられる。これは、話し手及び聞き手が会話における身体リズムを共有しているとの認識を持つことのできる触覚的な感覚情報を与えることによる直接的な効果(固有効果)である。これから、場合によっては、視覚的な感覚情報に代えて、触覚的な感覚情報のみを扱うことができれば、遠隔地者である話し手及び聞き手のコミュニケーションが図れるようになると考えられる。   Thirdly, even if visual sensory information is impaired, if tactile sensory information exists, it is considered that a physical pull-in phenomenon is brought to the speaker. This is a direct effect (inherent effect) by providing tactile sensory information that allows the speaker and listener to recognize that they share a physical rhythm in conversation. From this, it can be considered that, in some cases, if only tactile sensory information can be handled instead of visual sensory information, communication between a remote speaker and a listener can be achieved.

具体的な話し手側の装置の構成を図4に、前記話し手側の装置の使用状態を図5に示す。図4中、動作単位は振動する構成=振動型を図示しているが、後述するように、この度の官能評価試験では、様々な触覚的な感覚情報を比較する目的もあり、引っ張り型、押圧型、振動型又は風型の4種類の動作単位を用いている、各動作単位は、それぞれ話し手の手又は指に対する引っ張り、絞り、振動又は送風によって、聞き手の反応が顕著に現れると推定される時系列上の特定時点を、触覚的な感覚情報として話し手に教える。   FIG. 4 shows a specific configuration of the apparatus on the speaker side, and FIG. 5 shows a usage state of the apparatus on the speaker side. In FIG. 4, the operation unit is shown as a vibrating structure = vibration type. However, as will be described later, in this sensory evaluation test, there is also a purpose of comparing various tactile sensory information. 4 types of motion units of type, vibration type and wind type are used, and each motion unit is estimated to have a noticeable reaction of the listener by pulling, squeezing, vibrating or blowing on the hand or finger of the speaker. Teach a speaker a specific point in time as tactile sensory information.

話し手の音声は、マイクによりコンピュータへ取り込まれる。コンピュータでは、取り込まれた話し手の音声の信号から動作予測値を推定し、予め定めた動作閾値と比較して動作タイミングを算出するプログラムを実行させて、演算部を構成している。そして、コンピュータは、算出された動作タイミングで駆動信号を出力し、USBインタフェース(USB I/O)を介して駆動部(アクチュエータ)へ前記駆動信号を送り込み、この駆動部が各種動作単位を駆動する。   The speaker's voice is captured into the computer by a microphone. In the computer, a motion prediction value is estimated from the captured speaker's voice signal, and a program for calculating motion timing is executed by comparing with a predetermined motion threshold value, thereby constituting a calculation unit. Then, the computer outputs a drive signal at the calculated operation timing, sends the drive signal to the drive unit (actuator) via the USB interface (USB I / O), and this drive unit drives various operation units. .

コンピュータは、CPUがAMD K6 266MHz、メモリが128MBであり、マイクからの話し手の音声を取り込むためのサウンドカードと、駆動信号を出力するためのUSB ポートを備えている。演算部を構成するプログラム(実行ファイル)は約300KBで、前記プログラムはMicrosoft Windows(登録商標) 2000上で実行されている。また、USBインタフェースは、USBコントローラマイコンとしてサイプレスセミコンダクタのCY7C63001A-PC(USB 1.1規格、Low-Speedタイプ1.5Mbps)を使用し、コンピュータのUSBポートから+5Vの電源供給を受けて、バスパワー駆動させている。駆動部は、モルフィー企画社製汎用USB I/Oを利用して制御している。   The computer has a AMD K6 266MHz CPU and 128MB memory, and is equipped with a sound card for capturing the speaker's voice from the microphone and a USB port for outputting drive signals. The program (executable file) constituting the calculation unit is about 300 KB, and the program is executed on Microsoft Windows (registered trademark) 2000. The USB interface uses Cypress Semiconductor's CY7C63001A-PC (USB 1.1 standard, Low-Speed type 1.5 Mbps) as the USB controller microcomputer, and is powered by + 5V from the computer's USB port. ing. The drive unit is controlled using a general-purpose USB I / O manufactured by Morphee Planning.

話し手の音声の信号から推定される動作予測値は、現在から一定時間範囲の過去に取得した話し手の音声の信号の現在に対する影響の度合いを線形結合で導き出すこととして、既述した数1に見られる算出式を用いる話し手の音声の信号の移動平均(Moving Average)により推定している。ここで、話し手の音声の信号x(i−j)は、現時点から過去2secの範囲の信号を60分割、すなわちJ=1〜60として、1/30sec単位の値を用いている。この度の官能評価試験では、予測係数a(j)に前記1/30sec単位の時間間隔で予め定めた定数を用いている。実際の身体的引き込みシステムでは、ノイズw(i)を加えた数2に基づいて、動作予測値を推定するとよい。   The predicted motion value estimated from the speech signal of the speaker is expressed by Equation 1 described above as a linear combination of deriving the degree of influence of the speech signal of the speaker acquired in the past for a certain time range from the present to the present. It is estimated by the moving average of the speaker's voice signal using the calculated formula. Here, the speaker's voice signal x (ij) uses a value in units of 1/30 sec, assuming that the signal in the past 2 sec from the present time is divided into 60, that is, J = 1-60. In this sensory evaluation test, a predetermined constant is used for the prediction coefficient a (j) at a time interval of 1/30 sec. In an actual physical pull-in system, the motion prediction value may be estimated based on the number 2 to which the noise w (i) is added.

この度の官能評価試験に用いる身体的引き込みシステムは、視覚的な感覚情報と触覚的な感覚情報とを話し手に与えるため、両者が同じ動作タイミングで身体動作又は駆動することにしている。このため、視覚的な感覚情報を話し手に与えるキャラクタの身体動作の動作タイミングを算出する動作予測値と、触覚的な感覚情報を話し手に与える動作単位の動作タイミングを算出する動作予測値とは、同じ値を用いている。   The physical pull-in system used in this sensory evaluation test gives the speaker both visual sensory information and tactile sensory information, so that both of them are physically operated or driven at the same operation timing. Therefore, the motion prediction value for calculating the motion timing of the body motion of the character that gives visual sense information to the speaker, and the motion prediction value for calculating the motion timing of the motion unit that gives tactile sensory information to the speaker are: The same value is used.

具体的には、キャラクタの身体動作は頷き動作、瞬き動作及び身振り動作に大別し、頷き動作は上記動作予測値を動作閾値とを比較して算出される動作タイミングで実行し、瞬き動作は前記動作タイミングを起点として指数分布して実行し、そして身振り動作は記動作予測値を頷き動作の動作閾値より低い閾値とを比較して算出される動作タイミングで実行している。これに対し、動作単位は運動態様が一つであるため、上記動作予測値を動作閾値とを比較して算出される動作タイミングで駆動するのみである。   Specifically, the body motion of a character is roughly divided into a whispering motion, a blinking motion, and a gesture motion, and the whispering motion is executed at the motion timing calculated by comparing the motion prediction value with the motion threshold value. The gesture timing is executed with an exponential distribution starting from the motion timing, and the gesture motion is performed at the motion timing calculated by comparing the predicted motion value with a threshold value lower than the motion threshold value of the motion motion. In contrast, since the motion unit has one motion mode, the motion prediction value is only driven at the motion timing calculated by comparing the motion predicted value with the motion threshold value.

この度の官能評価試験で用意した触覚的な感覚情報を与える動作単位は、図6〜図9に見られる4種類である。触覚的な感覚情報を話し手に与える具体的な手段としては、多種多様なものが考えられることから、手に持たせた場合に感じやすい触覚的な感覚情報として、引っ張り運動(図6)、押圧運動(図7)、振動(図8)及び送風(図9)の触覚的感覚情報を与える動作単位を作成した。各動作単位は、身体的引き込み現象をもたらす身体動作をするロボット(増田屋コーポレーション社製「うなずき君」)の駆動部分を利用している。   There are four types of motion units that provide tactile sensory information prepared in this sensory evaluation test as shown in FIGS. There are a variety of specific means for giving tactile sensory information to the speaker, so pulling motion (Fig. 6), pressing as tactile sensory information that is easy to feel when held in the hand A motion unit giving tactile sensation information of motion (FIG. 7), vibration (FIG. 8) and air blowing (FIG. 9) was created. Each motion unit uses the drive part of a robot (Masudaya Corporation's “Nozuki-kun”) that performs physical motion that causes physical pull-in.

押圧型の動作単位は、図6に見られるように、揺動運動する動作単位にゴム紐を掛け回し、話し手の指に前記ゴム紐を引っ掛けて、動作単位の揺動運動に従って話し手の指に引っ張り運動を与える構成である。引っ張り運動は、人間の気を引く運動として代表的なものと考えられ、身体的引き込み現象をもたらす触覚的な感覚情報として有望である。   As shown in FIG. 6, the pressing-type motion unit is formed by hanging a rubber string around a motion unit that swings and hooking the rubber cord around the speaker's finger. It is the structure which gives a pulling motion. The pulling movement is considered to be a representative movement that attracts human attention, and is promising as tactile sensory information that brings about a physical pull-in phenomenon.

押圧型動作単位は、図7に見られるように、ペットボトル内にカムを回転させる動作単位を収め、前記カムに接続したゴム紐をペットボトルから外に取り出し、話し手の指に掛け回しており、カムの回転によりゴム紐を引っ張ったり、緩めることで、ゴム紐を掛け回した話し手の指にゴム紐を絞り込んで、押圧運動を与える構成である。ゴム紐による絞りは、上記引っ張り運動と似ているが、ゴム紐の長さを短くしておくことで、ゴム紐の引っ張りは話し手の指に押圧感を与える。   As shown in FIG. 7, the pressing-type operation unit contains the operation unit for rotating the cam in the plastic bottle, and the rubber string connected to the cam is taken out from the plastic bottle and hung around the finger of the speaker. In this configuration, the rubber cord is squeezed into the finger of the speaker who hangs the rubber cord to give a pressing motion by pulling or loosening the rubber cord by rotating the cam. The drawing with the rubber string is similar to the above-described pulling motion, but pulling the rubber string gives a feeling of pressing to the speaker's finger by shortening the length of the rubber string.

振動型動作単位は、図8に見られるように、動作単位として小型振動モータ(TPC社製CM05J)をペットボトル内に収め、前記動作単位の駆動によりペットボトル全体に振動を与えることで、このペットボトルを握る話し手の手に振動を与える構成である。こうした振動による触覚的な感覚情報は、例えば携帯電話等の着信音の代用として広く利用されており、馴染みがあることから、身体的引き込み現象をもたらす触覚的な感覚情報として有望である。   As shown in FIG. 8, the vibration-type operation unit includes a small vibration motor (CM05J manufactured by TPC Co.) as an operation unit in a plastic bottle, and the whole plastic bottle is vibrated by driving the operation unit. In this configuration, the speaker's hand holding the plastic bottle is vibrated. Such tactile sensory information by vibration is widely used as a substitute for a ring tone of, for example, a mobile phone, and since it is familiar, it is promising as tactile sensory information that causes a physical pull-in phenomenon.

風型動作単位は、図9に見られるように、動作単位としてモータをスティック状の筐体内に収め、前記モータによりファンを回転させることにより、筐体を握る話し手の手にファンから風を送る構成である。送風による触覚的な感覚情報は、寒冷を伴うことから、引っ張り、押圧又は振動といった物理的な運動に比較してより自然な触覚的な感覚情報を与えることができると考えられる。この度の官能評価試験では、他の動作単位との兼ね合いから、モータへの電源供給をUSBに頼っているため、ファンの回転及び停止の迅速な応答が望めない。そこで、ファンは常時低速回転させ、動作タイミングに合わせて高速回転に切り替えることとした。   As shown in FIG. 9, the wind-type motion unit sends a wind from the fan to the speaker's hand holding the housing by housing the motor in a stick-like housing as the motion unit and rotating the fan by the motor. It is a configuration. Since the tactile sensory information by blowing is accompanied by cold, it is considered that more natural tactile sensory information can be given compared to physical movement such as pulling, pressing or vibration. In this sensory evaluation test, since the power supply to the motor is relied on USB in consideration of other operation units, a quick response of fan rotation and stop cannot be expected. Therefore, the fan is always rotated at a low speed and switched to a high speed rotation according to the operation timing.

各動作単位の仕様を、キャラクタの身体動作の駆動時間と共に表1に示す。ここで、起動時間とは、キャラクタが実際に頷き動作を開始する時点を基準時間(0msec)とした場合の前記基準時間からの遅延時間である。表1から明らかなように、各動作単位は駆動手段及び態様が異なるため、起動時間が異なっており、こうした起動時間の長短の影響についても評価対象にすることした。キャラクタは、1フレーム33msec(30fps)で動作する。   Table 1 shows the specifications of each motion unit together with the driving time of the body motion of the character. Here, the activation time is a delay time from the reference time when the reference time (0 msec) is a time point at which the character actually starts the whispering action. As can be seen from Table 1, since each operation unit has a different driving means and mode, the activation time is different, and the influence of the length of the activation time is also evaluated. The character operates at 33 msec (30 fps) per frame.

まず、身体的引き込み現象の発現については、いずれの動作単位でも話し手が感じる程度にもたらされることが確認できた。しかし、詳細には、各動作単位の起動時間の違いにより、もたされる身体的引き込み現象に程度差があることがわかった。具体的には、起動時間の大きな動作単位ほど、キャラクタの頷き動作をはじめとした身体動作と、各動作単位の駆動とのずれに、違和感が感じられるようである。これは、異なる感覚情報を話し手に与える場合、各感覚情報にずれが生じては、両感覚情報は相乗するのではなく、相殺してしまうことを意味する。これから、触覚的な感覚情報を与える動作単位を単独で用いることは有効であるが、視覚的な感覚情報を与えるキャラクタと併用する場合は、両感覚情報にずれが生じないようにする必要があることがわかった。   First, it was confirmed that the physical pull-in phenomenon was brought about to the extent that the speaker felt in any movement unit. However, in detail, it was found that there is a difference in physical pull-in phenomenon caused by the difference in activation time of each motion unit. Specifically, it seems that the longer the activation unit, the more the sense of discomfort is felt between the movement of the body, including the character's whirling movement, and the driving of each movement unit. This means that when different sensory information is given to the speaker, if the sensory information is shifted, the sensory information is not synergized but offset. From now on, it is effective to use a motion unit that gives tactile sensory information alone, but when used in combination with a character that gives visual sensory information, it is necessary to prevent deviations in both sensory information. I understood it.

そこで、上記官能評価試験の結果を受け、図10に見られるような身体的引き込みシステムの構成を考えた。この身体的引き込みシステムは、動作単位が起動する遅延時間だけ遅延させてキャラクタを身体動作させるため、コンピュータからディスプレイの間に遅延回路を追加した構成になっている。動作単位がキャラクタの身体動作に比べて遅延して駆動する理由の一つに、機械的な動作をもたらす駆動部の存在がある。前記遅延回路は、この駆動部による遅延をキャラクタの身体動作にもたらす付加回路と見ることができる。   Therefore, based on the results of the sensory evaluation test, a configuration of a physical pull-in system as shown in FIG. 10 was considered. This physical pull-in system has a configuration in which a delay circuit is added between the computer and the display in order to cause the character to physically move by delaying by a delay time for starting the motion unit. One of the reasons why the motion unit is driven with a delay compared to the physical motion of the character is the presence of a drive unit that provides mechanical motion. The delay circuit can be regarded as an additional circuit that brings a delay caused by the drive unit to the body motion of the character.

この遅延回路を備えた身体的引き込みシステムにより、上記同様な官能評価試験を実施した結果、各動作単位の起動時間が短くなるほど、すなわちキャラクタの身体動作と各動作単位の駆動とのずれが小さくなるほど、違和感なく身体的引き込み現象がもたらされるのみならず、キャラクタの身体動作のみの場合に比べて、引き込まれやすいとの回答を得た。これにより、触覚的な感覚情報により身体的引き込み現象がもたらされること、視覚的な感覚情報と触覚的な感覚情報とを併用することで、よりよく身体的引き込み現象がもたらされることが分かった。   As a result of performing the same sensory evaluation test using the physical pull-in system including this delay circuit, the shorter the activation time of each motion unit, that is, the smaller the difference between the character's physical motion and the drive of each motion unit. In addition to the physical pull-in phenomenon that was not uncomfortable, the answer was that it was easier to pull in compared to the case of the character's physical movement alone. As a result, it has been found that physical pull-in phenomenon is brought about by tactile sensory information, and that physical pull-in phenomenon is brought about better by using visual sensory information and tactile sensory information together.

本発明は、ロボットやディスプレイ上に表示されるキャラクタの身体動作によって視覚的な感覚情報を話し手又は聞き手に与えて、前記話し手又は聞き手に身体的引き込み現象を与える身体的引き込みシステムに対し、前記ロボットやキャラクタに代えて使用し得る触覚的な感覚情報を与える動作単位の有効性と、前記ロボットやキャラクタと共に使用し得る触覚的な感覚情報を与える動作単位の有効性とを提案する。   The present invention provides a robot with respect to a physical retraction system in which visual sensation information is given to a speaker or a listener by a physical movement of a character displayed on a robot or a display, and a physical retraction phenomenon is given to the speaker or the listener. We propose the effectiveness of motion units that provide tactile sensory information that can be used in place of characters and characters, and the effectiveness of motion units that provide tactile sensory information that can be used with the robot or character.

具体的には、対面する話し手及び聞き手が会話する場合、両者がそれぞれ動作単位を所持して会話をすれば、各動作単位の駆動が、いわば「合いの手」となって、話し手には話しやすさを、聞き手には聞きやすさを与えて、より緊密な会話ができるようにする。また、上記官能評価試験にも見られた身体的引き込みシステムは、そのまま遠隔地者である話し手及び聞き手のテレビ電話に応用し得る。   Specifically, when the talking speakers and listeners converse with each other, if both have a unit of action and have a conversation, the driving of each unit of action becomes a so-called “hand of hand”, making it easier for the speaker to speak. Give the listener an easier listening experience so that they can have a closer conversation. In addition, the physical pull-in system found in the sensory evaluation test can be directly applied to a videophone for a speaker and a listener who are remote persons.

このほか、話し手又は聞き手が不特定又は多数である場面、具体的にはテレビ放送、講演、街頭演説やプレゼンテーション等において、各話し手及び聞き手が動作単位を所持することにより、話し手及び聞き手全員が身体リズムを共有できるようになる。ここで、視覚的な感覚情報による身体的引き込み現象と異なる点は、話し手又は聞き手の視線が拘束を受けない点にある。例えばプレゼンテーションでは、話し手及び聞き手がそれぞれ発表内容を表示する表示画面を見ている場面を想像すれば、触覚的な感覚情報によりもたらされる身体的引き込み現象の優位性が理解できる。このように、本発明は身体的引き込み現象の利用範囲を拡大する特徴を有する。   In addition, in situations where the number of speakers or listeners is unspecified or large, specifically in TV broadcasting, lectures, street speeches or presentations, each speaker and listener possesses a unit of motion, so that all speakers and listeners are physically You can share rhythms. Here, the difference from the physical pull-in phenomenon by visual sensory information is that the line of sight of the speaker or listener is not constrained. For example, in a presentation, if you imagine a scene where a speaker and a listener are looking at a display screen that displays the contents of the presentation, you can understand the superiority of the physical pull-in phenomenon brought about by tactile sensory information. Thus, the present invention has a feature that expands the range of use of the physical pull-in phenomenon.

話し手及び聞き手にそれぞれ振動体を所持させて構成した身体的引き込みシステムの構成図である。It is a block diagram of the physical drawing-in system comprised by having a speaker and a listener each possess a vibrating body. 同身体的引き込みシステムのブロック図である。1 is a block diagram of the same physical retraction system. 話し手側の装置及び聞き手側の装置が対称に配された身体的引き込みシステムの構成図である。It is a block diagram of the physical retraction system in which the apparatus on the speaker side and the apparatus on the listener side are arranged symmetrically. 身体的引き込みシステムにおける具体的な話し手側の装置の構成図である。It is a block diagram of the apparatus by the side of the concrete speaker in a physical retraction system. 話し手側の装置の使用状態を表す写真である。It is a photograph showing the usage state of the apparatus on the speaker side. 実際に制作した引っ張り型動作単位の写真である。It is a photograph of the pull-type motion unit actually produced. 実際に制作した押圧型動作単位の写真である。It is a photograph of the actual pressing type motion unit. 実際に制作した振動型動作単位の写真である。It is a photograph of the vibration type motion unit actually produced. 実際に制作した風型動作単位の写真である。It is a photograph of the wind-type motion unit actually produced. 遅延回路を付加した身体的引き込みシステムにおける話し手側の装置の構成図である。It is a block diagram of the apparatus by the side of the speaker in the physical retraction system which added the delay circuit.

符号の説明Explanation of symbols

10 話し手の振動体
11 ピンマイク
12 略円筒状のケース
13 駆動部
14 動作単位
20 聞き手の振動体
22 略円筒状のケース
23 駆動部
24 動作単位
30 送受信装置
31 コンピュータ
10 Speaker's vibrator
11 pin microphone
12 Substantially cylindrical case
13 Drive unit
14 operation units
20 Listener vibration body
22 Substantially cylindrical case
23 Drive unit
24 operation units
30 Transceiver
31 computers

Claims (24)

目前に相手方がいる会話や、話し手又は聞き手が不特定又は多数である場面で、聞き手に対する身体的引き込み現象を話し手にもたらすに際し、演算部が算出する動作タイミングで駆動部により駆動する動作単位を話し手に所持させ、演算部は話し手の音声の信号から推定される動作予測値が予め定めた動作閾値を越えた時点を動作タイミングとして算出し、前記動作タイミングで駆動部が動作単位を駆動させて触覚的な感覚情報として動作タイミングを話し手に教示することにより、聞き手に対する身体的引き込み現象を話し手にもたらす触覚に訴える身体的引き込み方法。 In a conversation with the other party in front of you, or in a scene where the number of speakers or listeners is unspecified or many, the speaker is the unit of motion driven by the drive unit at the operation timing calculated by the calculation unit when bringing the physical pull-in phenomenon to the speaker to the speaker. The calculation unit calculates a time point when the predicted motion value estimated from the speaker's voice signal exceeds a predetermined motion threshold as a motion timing, and the drive unit drives the motion unit at the motion timing and senses the touch. A physical pull-in method that appeals to the tactile sensation that brings the speaker with a physical pull-in phenomenon to the listener by teaching the timing of movement to the speaker as realistic sensory information. 動作予測値は、話し手の音声の信号の移動平均により推定される請求項1記載の触覚に訴える身体的引き込みシステム。 The tactile physical pull-in system according to claim 1, wherein the motion prediction value is estimated by a moving average of a speaker's voice signal. 動作単位は、所持する話し手に引っ張り運動を与える請求項1記載の触覚に訴える身体的引き込み方法。 The physical pull-in method for tactile sensation according to claim 1, wherein the motion unit applies a pulling motion to the possessed speaker. 動作単位は、所持する話し手に押圧運動を与える請求項1記載の触覚に訴える身体的引き込み方法。 The physical pull-in method for tactile sensation according to claim 1, wherein the motion unit applies a pressing motion to the possessed speaker. 動作単位は、所持する話し手に振動を与える請求項1記載の触覚に訴える身体的引き込み方法。 The physical pull-in method for tactile sensation according to claim 1, wherein the motion unit applies vibration to a speaker possessed. 動作単位は、所持する話し手に風を与える請求項1記載の触覚に訴える身体的引き込み方法。 The physical pull-in method for tactile sensation according to claim 1, wherein the unit of motion gives wind to a possessed speaker. 目前に相手方がいる会話や、話し手又は聞き手が不特定又は多数である場面で、話し手に対する身体的引き込み現象を聞き手にもたらすに際し、演算部が算出する動作タイミングで駆動部により駆動する動作単位を聞き手に所持させ、演算部は話し手の音声の信号から推定される動作予測値が予め定めた動作閾値を越えた時点を動作タイミングとして算出し、前記動作タイミングで駆動部が動作単位を駆動させて触覚的な感覚情報として動作タイミングを聞き手に教示することにより、話し手に対する身体的引き込み現象を聞き手にもたらす触覚に訴える身体的引き込み方法。 In a conversation where the other party is in front of you, or in a scene where the number of speakers or listeners is unspecified or many, the listener will hear the unit of motion driven by the drive unit at the timing calculated by the calculation unit when bringing the physical pull-in phenomenon to the speaker. The calculation unit calculates a time point when the predicted motion value estimated from the speaker's voice signal exceeds a predetermined motion threshold as a motion timing, and the drive unit drives the motion unit at the motion timing and senses the touch. A physical pull-in method that appeals to the tactile sensation that brings the listener to the physical pull-in phenomenon of the speaker by teaching the listener the movement timing as realistic sensory information. 動作予測値は、聞き手の音声の信号の移動平均により推定される請求項7記載の触覚に訴える身体的引き込みシステム。 The physical pull-in system that appeals to the sense of touch according to claim 7, wherein the motion prediction value is estimated by a moving average of a listener's voice signal. 動作単位は、所持する聞き手に引っ張り運動を与える請求項7記載の触覚に訴える身体的引き込み方法。 The physical pull-in method for tactile sensation according to claim 7, wherein the motion unit gives a pulling motion to a possessed listener. 動作単位は、所持する聞き手に押圧運動を与える請求項7記載の触覚に訴える身体的引き込み方法。 The physical pull-in method for tactile sensation according to claim 7, wherein the motion unit gives a pressing motion to the listener possessed. 動作単位は、所持する聞き手に振動を与える請求項7記載の触覚に訴える身体的引き込み方法。 The physical pull-in method for tactile sensation according to claim 7, wherein the motion unit applies vibration to a listener possessed. 動作単位は、所持する聞き手に風を与える請求項7記載の触覚に訴える身体的引き込み方法。 The physical pull-in method for tactile sensation according to claim 7, wherein the motion unit gives wind to a listener possessed. 目前に相手方がいる会話や、話し手又は聞き手が不特定又は多数である場面で、聞き手に対する身体的引き込み現象を話し手にもたらすシステムであって、所持した話し手に触覚的な感覚情報を与える動作単位と、該動作単位を駆動する駆動部と、該駆動部の動作タイミングを算出する演算部と、該演算部へ話し手の音声の信号を取り込む信号入力部とからなり、演算部は信号入力部から取り込まれた話し手の音声の信号から推定される動作予測値が予め定めた動作閾値を越えた時点を動作タイミングとして算出し、駆動部は前記動作タイミングで動作単位を駆動させて触覚的な感覚情報として動作タイミングを話し手に教示して、聞き手に対する身体的引き込み現象を話し手にもたらす触覚に訴える身体的引き込みシステム。 A system that provides the speaker with a physical pull-in phenomenon to the speaker in a conversation where the other party is in front of the user, or where the number of speakers or listeners is unspecified or many, and a unit of action that gives tactile sensory information to the speaker A driving unit that drives the operation unit, a calculation unit that calculates an operation timing of the driving unit, and a signal input unit that captures a speaker's voice signal into the calculation unit, and the calculation unit is captured from the signal input unit. When the predicted motion value estimated from the voice signal of the talker exceeds a predetermined motion threshold, the motion timing is calculated as motion timing, and the drive unit drives the motion unit at the motion timing as tactile sensory information. A physical retraction system that teaches the timing of movement to the speaker and appeals to the sense of touch that brings the physical retraction phenomenon to the speaker. 動作予測値は、話し手の音声の信号の移動平均により推定される請求項13記載の触覚に訴える身体的引き込みシステム。 14. The tactile physical pull-in system according to claim 13, wherein the motion prediction value is estimated by a moving average of a speaker's voice signal. 動作単位は、所持する話し手に引っ張り運動を与える請求項13記載の触覚に訴える身体的引き込みシステム。 14. The physical retraction system for tactile sensation according to claim 13, wherein the motion unit gives a pulling motion to the possessed speaker. 動作単位は、所持する話し手に押圧運動を与える請求項13記載の触覚に訴える身体的引き込みシステム。 14. The physical retraction system for tactile sensation according to claim 13, wherein the motion unit applies a pressing motion to the possessed speaker. 動作単位は、所持する話し手に振動を与える請求項13記載の触覚に訴える身体的引き込みシステム。 14. The physical retraction system for tactile sensation according to claim 13, wherein the motion unit applies vibration to a speaker possessed by the motion unit. 動作単位は、所持する話し手に風を与える請求項13記載の触覚に訴える身体的引き込みシステム。 14. The physical pull-in system for tactile sensation according to claim 13, wherein the motion unit gives wind to a possessed speaker. 目前に相手方がいる会話や、話し手又は聞き手が不特定又は多数である場面で、話し手に対する身体的引き込み現象を聞き手にもたらすシステムであって、所持した聞き手に触覚的な感覚情報を与える動作単位と、該動作単位を駆動する駆動部と、該駆動部の動作タイミングを算出する演算部と、該演算部へ話し手の音声の信号を取り込む信号入力部とからなり、演算部は信号入力部から取り込まれた話し手の音声の信号から推定される動作予測値が予め定めた聞き手動作閾値を越えた時点を動作タイミングとして算出し、駆動部は前記動作タイミングで動作単位を駆動させて聞き手に触覚的な感覚情報として動作タイミングを教示して、話し手に対する身体的引き込み現象を聞き手にもたらす触覚に訴える身体的引き込みシステム。 A system that provides the listener with a physical pull-in phenomenon to the listener in conversations where the other party is in front of the audience, or where the number of speakers or listeners is unspecified or numerous, and a unit of motion that provides tactile sensory information to the listener A driving unit that drives the operation unit, a calculation unit that calculates an operation timing of the driving unit, and a signal input unit that captures a speaker's voice signal into the calculation unit, and the calculation unit is captured from the signal input unit. The motion prediction value estimated from the speaker's voice signal is calculated as a motion timing when the predicted motion value exceeds a predetermined listener motion threshold, and the drive unit drives the motion unit at the motion timing to provide a tactile feel to the listener. A physical retraction system that teaches movement timing as sensory information and appeals to the sense of touch that brings the physical retraction phenomenon to the listener. 動作予測値は、聞き手の音声の信号の移動平均により推定される請求項19記載の触覚に訴える身体的引き込みシステム。 20. The tactile physical pull-in system according to claim 19, wherein the motion prediction value is estimated by a moving average of a listener's voice signal. 動作単位は、所持する聞き手に引っ張り運動を与える請求項19記載の触覚に訴える身体的引き込みシステム。 20. The physical retraction system for tactile sensation according to claim 19, wherein the motion unit gives a pulling motion to the listener possessed. 動作単位は、所持する聞き手に押圧運動を与える請求項19記載の触覚に訴える身体的引き込みシステム。 20. The physical retraction system for tactile sensation according to claim 19, wherein the motion unit gives a pressing motion to the listener possessed. 動作単位は、所持する聞き手に振動を与える請求項19記載の触覚に訴える身体的引き込みシステム。 20. The physical retraction system for tactile sensation according to claim 19, wherein the motion unit applies vibration to a listener possessed. 動作単位は、所持する聞き手に風を与える請求項19記載の触覚に訴える身体的引き込みシステム。 20. The physical retraction system for tactile sensation according to claim 19, wherein the motion unit gives wind to a listener possessed.
JP2004064856A 2004-03-08 2004-03-08 Method and system for physical pull-in appealing to tactile sense Pending JP2005251133A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004064856A JP2005251133A (en) 2004-03-08 2004-03-08 Method and system for physical pull-in appealing to tactile sense

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004064856A JP2005251133A (en) 2004-03-08 2004-03-08 Method and system for physical pull-in appealing to tactile sense

Publications (1)

Publication Number Publication Date
JP2005251133A true JP2005251133A (en) 2005-09-15

Family

ID=35031522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004064856A Pending JP2005251133A (en) 2004-03-08 2004-03-08 Method and system for physical pull-in appealing to tactile sense

Country Status (1)

Country Link
JP (1) JP2005251133A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014086093A (en) * 2012-10-26 2014-05-12 Immersion Corp System for converting stream-independent sound to haptic effect

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10111786A (en) * 1996-10-03 1998-04-28 Sharp Corp Rhythm control dialog device
JPH11312040A (en) * 1998-01-12 1999-11-09 Xerox Corp Computer user interface and computer
JPH11352876A (en) * 1998-06-08 1999-12-24 Yamatake Corp Sound collector for speaking and pronunciation training and speaking and pronunciation training device
JP2000349920A (en) * 1999-06-01 2000-12-15 Interrobot Inc Intention transmitter
JP2002149339A (en) * 2000-11-09 2002-05-24 Fuji Xerox Co Ltd Information processor, information processing method and recording medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10111786A (en) * 1996-10-03 1998-04-28 Sharp Corp Rhythm control dialog device
JPH11312040A (en) * 1998-01-12 1999-11-09 Xerox Corp Computer user interface and computer
JPH11352876A (en) * 1998-06-08 1999-12-24 Yamatake Corp Sound collector for speaking and pronunciation training and speaking and pronunciation training device
JP2000349920A (en) * 1999-06-01 2000-12-15 Interrobot Inc Intention transmitter
JP2002149339A (en) * 2000-11-09 2002-05-24 Fuji Xerox Co Ltd Information processor, information processing method and recording medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014086093A (en) * 2012-10-26 2014-05-12 Immersion Corp System for converting stream-independent sound to haptic effect
CN103793048A (en) * 2012-10-26 2014-05-14 英默森公司 Stream-independent sound to haptic effect conversion system
CN103793048B (en) * 2012-10-26 2018-06-26 意美森公司 Independently of stream sound to haptic effect converting system

Similar Documents

Publication Publication Date Title
Chang et al. ComTouch: design of a vibrotactile communication device
CN110609620B (en) Human-computer interaction method and device based on virtual image and electronic equipment
Watanabe Human-entrained embodied interaction and communication technology
MX2021010316A (en) A reflective video display apparatus for interactive training and demonstration and methods of using same.
Watanabe et al. InterActor: Speech-driven embodied interactive actor
EP1648150A2 (en) Method and apparatus for multi-sensory speech enhancement on a mobile device
CN111147444B (en) Interaction method and electronic equipment
US11671562B2 (en) Method for enabling synthetic autopilot video functions and for publishing a synthetic video feed as a virtual camera during a video call
CN106527678A (en) Social interaction equipment of mixed reality, system and head-mounted display equipment
JP4845183B2 (en) Remote dialogue method and apparatus
WO2016157993A1 (en) Information processing device, information processing method, and program
JP3526785B2 (en) Communication device
US20230353707A1 (en) Method for enabling synthetic autopilot video functions and for publishing a synthetic video feed as a virtual camera during a video call
JP5143114B2 (en) Preliminary motion detection and transmission method, apparatus and program for speech
JP2003108502A (en) Physical media communication system
JP2005251133A (en) Method and system for physical pull-in appealing to tactile sense
JP2007018433A (en) Speech communication terminal with avatar display function
US11627283B2 (en) Method for enabling synthetic autopilot video functions and for publishing a synthetic video feed as a virtual camera during a video call
JP6410346B2 (en) Remote communication device and program
JP6977463B2 (en) Communication equipment, communication systems and programs
JP2021086474A (en) Avatar control system
US11212488B2 (en) Conference system
TWI680660B (en) Real-time communication system and dynamic expression rendering device
WO2022215725A1 (en) Information processing device, program, and information processing method
CN108169898B (en) VR equipment with communication function

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071005

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071016

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071213

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20071227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080226