JPH07325868A - Visitor guiding system - Google Patents

Visitor guiding system

Info

Publication number
JPH07325868A
JPH07325868A JP6140792A JP14079294A JPH07325868A JP H07325868 A JPH07325868 A JP H07325868A JP 6140792 A JP6140792 A JP 6140792A JP 14079294 A JP14079294 A JP 14079294A JP H07325868 A JPH07325868 A JP H07325868A
Authority
JP
Japan
Prior art keywords
face image
visitor
voice
database
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6140792A
Other languages
Japanese (ja)
Inventor
Masahiko Suzaki
昌彦 須崎
Yuji Kuno
裕次 久野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP6140792A priority Critical patent/JPH07325868A/en
Publication of JPH07325868A publication Critical patent/JPH07325868A/en
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Lock And Its Accessories (AREA)

Abstract

PURPOSE:To facilitate operations by a visitor similarly to an attended reception job. CONSTITUTION:When video images photographed by a CCD camera 3 and stored in an image memory 8 are analyzed by a knowledge processing part 9 and the arrival of the visitor is recognized, the data of the expression of a smile are taken out from a face image data base 13 and displayed on a display 1. At the time, the visitor pushes the selection key of a display device 2 with keys and specifies a visiting party corresponding to the voice guidance of a speaker 4 by a voice data base 14. Then, the data of a speech for reporting the arrival of the visitor are taken out from the voice data base 14 and transmitted to a telephone set 7 by a telephone control part 12. Then, corresponding to selection by the push buttons of the telephone set 7 or the like, when the visiting party is present, the message of that effect is outputted along with the face image of the expression of the smile. On the other hand, when the visiting party is not present, the message of that effect is outputted along with the face image of the expression of slight sadness.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、オフィスビル等におい
て、受付業務の無人化を可能とする来訪者案内システム
に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a visitor guidance system that enables unmanned reception work in office buildings and the like.

【0002】[0002]

【従来の技術】従来、受付嬢によらずに無人で受付業務
を行なえるようにしたシステムがある。この種のシステ
ムは、CCDカメラからの映像入力を一旦画像メモリに
蓄え、知識処理部によりその映像を解析して来訪者が来
たことを検出する。来訪者を検出すると、知識処理部は
音声合成部で音声信号を合成したり、キー付き表示装置
に文字による表示を行う等して様々な案内情報を来訪者
に伝える。そして、来訪者はキー付き表示装置によりデ
ータを入力しつつ、対話的に案内情報を得る。この際、
来訪者が会おうとしている相手先のデータをシステムに
対して入力すると、システムがその相手に電話をつなぎ
来訪者との通話を取り持つ。通話が終れば来訪者はシス
テムからの質問に応じてその後の処理を入力し、その入
力によってシステムが案内情報を来訪者に伝える(例え
ば、特開平5−216888号公報参照)。
2. Description of the Related Art Conventionally, there is a system that enables unmanned reception work regardless of the receptionist. This type of system temporarily stores the image input from the CCD camera in the image memory, and analyzes the image by the knowledge processing unit to detect the arrival of the visitor. When the visitor is detected, the knowledge processing unit conveys various guidance information to the visitor by synthesizing a voice signal in the voice synthesizing unit or displaying characters on the keyed display device. Then, the visitor interactively obtains the guidance information while inputting the data through the keyed display device. On this occasion,
When a visitor enters the data of the other party with whom he / she is going to meet, the system connects the other party to the call and establishes a call with the visitor. When the call ends, the visitor inputs the subsequent processing in response to the question from the system, and the system transmits the guidance information to the visitor by the input (see, for example, JP-A-5-216888).

【0003】[0003]

【発明が解決しようとする課題】しかしながら、上述し
た従来の技術には、次のような課題があった。即ち、上
記構成の装置では、来訪者が機械に不慣れな場合、文字
や音声による情報のやり取りだけでは依然として機械の
操作に対する違和感や不安感があり、人間による受付案
内の代用とはならなかった。従って、無人では、円滑に
受付業務を進めることが困難であった。また、予め来訪
者が来ることが分かっていてすぐに応対に出る準備がで
きている場合等においては、有人の場合は受付担当者と
オフィス内の人間との電話での簡単なやり取りで受付を
済ますことができたが、無人にすると、来訪者が自ら電
話をとってオフィス内の人間と話をしなければならなく
なった。更に、人の出入りの多いオフィス等では来訪者
と応対者が顔見知りでない場合、お互いを認識するのに
手間がかかっていた。
However, the above-mentioned conventional techniques have the following problems. That is, in the device having the above configuration, when a visitor is unfamiliar with the machine, there is still a feeling of discomfort or anxiety about the operation of the machine only by exchanging information by characters or voices, and it is not a substitute for reception guidance by humans. Therefore, it was difficult for the unmanned person to smoothly proceed with the reception work. In addition, when it is known that a visitor will come in advance and you are ready to respond immediately, in the case of a manned person, you can accept the reception by a simple telephone exchange between the receptionist and the person in the office. I was able to do it, but when I left it unattended, the visitor had to call himself to talk to someone in the office. Further, in an office or the like where many people come and go, it takes a lot of time to recognize each other when the visitor and the respondent do not know each other.

【0004】[0004]

【課題を解決するための手段】本発明の来訪者案内シス
テムは、上述した課題を解決するため、以下の点を特徴
とするものである。 (1) 顔画像のデータを格納した顔画像データベースを備え
る。 当該顔画像データベースから取り出したデータにより
顔画像を合成する顔画像合成部を備える。 当該顔画像合成部から出力される顔画像を来訪者に対
して表示するディスプレイを備える。 顔画像に対応する音声のデータを格納した音声データ
ベースを備える。 当該音声データベースから取り出したデータにより音
声を合成する音声合成部を備える。
The visitor guidance system of the present invention is characterized by the following points in order to solve the above-mentioned problems. (1) A face image database storing face image data is provided. A face image synthesizing unit for synthesizing a face image with the data extracted from the face image database is provided. A display for displaying the face image output from the face image synthesis unit to the visitor is provided. A voice database storing voice data corresponding to a face image is provided. A voice synthesizing unit for synthesizing a voice with the data extracted from the voice database is provided.

【0005】当該音声合成部から出力される音声を出
力するスピーカを備える。 入力操作部から入力された指示に対する処理結果に応
じたセリフの音声を音声データベースから取り出し、音
声合成部により音声を合成してスピーカから出力すると
ともに、セリフに対応する表情の顔画像を顔画像データ
ベースから取り出し、顔画像合成部によりその顔画像を
合成してディスプレイに表示する処理を行なう知識処理
部を備える。 入力操作部からの入力により指定された相手先の電話
器に音声データベースから取り出した音声データを音声
合成部を介して送信し、相手先の電話器から入力された
応答を知識処理部に送る電話制御部を備える。
A speaker for outputting the voice output from the voice synthesizer is provided. The voice of the speech according to the processing result for the instruction input from the input operation unit is taken out from the voice database, the voice is synthesized by the voice synthesis unit and output from the speaker, and the face image of the facial expression corresponding to the voice is stored in the face image database. And a knowledge processing unit for performing processing of synthesizing the face images by the face image synthesizing unit and displaying on the display. A telephone that sends the voice data extracted from the voice database to the destination telephone specified by the input from the input operation unit via the voice synthesizer and sends the response input from the destination telephone to the knowledge processing unit. A control unit is provided.

【0006】(2)顔画像データベースは、来訪者に応
対する応対者の顔画像のデータを格納し、音声データベ
ースは、その応対者の声のデータを格納し、知識処理部
は、来訪者の訪問相手が不在の場合に、画像合成部及び
音声合成部を介して、ディスプレイ及びスピーカにより
来訪者の訪問相手の代わりに応対する応対者を来訪者に
対し紹介する。尚、伝言データベース及び文字合成部を
備え、スピーカによる音声出力の代わりにディスプレイ
による文字出力を行なうようにしても差し支えない。
(2) The face image database stores the data of the face image of the responder who responds to the visitor, the voice database stores the data of the voice of the respondent, and the knowledge processing unit stores the data of the visitor. When a visitor is absent, a display and a speaker are used to introduce the visitor to the visitor, instead of the visitor's visitor, through the image synthesizer and the voice synthesizer. The message database and the character synthesizing unit may be provided so that the character output may be performed by the display instead of the voice output by the speaker.

【0007】[0007]

【作用】[Action]

(1)撮影手段により撮影された映像に静止画像が映し
出されると、知識処理部により来訪者が現われたことが
認識される。このとき、顔画像データベースから例えば
ほほえみの表情のデータが取り出され、ディスプレイに
表示され、また、音声データベースから訪問相手の指定
入力の案内のセリフのデータが取り出され、スピーカか
ら音声が出力される。この結果、来訪者に対し、音声に
よる聴覚を通じた案内とともに、映像による視覚を通じ
た案内がなされる。この後、来訪者は、選択キーの押下
により訪問相手を指定する。来訪者が指定入力を完了す
ると、音声データベースから訪問相手の確認のセリフの
データが取り出され、スピーカから音声が出力される。
来訪者が訪問相手を確認すると、音声データベースから
訪問相手の呼出の処理の間待機してほしい旨のセリフの
データが取り出され、スピーカから音声が出力される。
この後、顔画像データベースから無表情のデータが取り
出され、ディスプレイに表示される。
(1) When a still image is displayed on the image captured by the image capturing unit, the knowledge processing unit recognizes that the visitor has appeared. At this time, for example, smiley face expression data is retrieved from the face image database and displayed on the display. Further, guidance input dialogue data of the visitor is retrieved from the voice database, and voice is output from the speaker. As a result, the visitor is visually guided by audio and is also visually guided. After this, the visitor specifies the visitor by pressing the selection key. When the visitor completes the designated input, the data of the confirmation line of the visitor is retrieved from the voice database and the voice is output from the speaker.
When the visitor confirms the visitor, the speech data requesting that the visitor wait for the call processing of the visitor is retrieved from the voice database, and the voice is output from the speaker.
Thereafter, the expressionless data is retrieved from the face image database and displayed on the display.

【0008】訪問相手の呼出の際は、音声データベース
から来訪者が来たことを伝えるセリフのデータが取り出
され、電話制御部により電話器が鳴らされ、応対者が受
話器を取ると、音声が出力される。このとき、電話器の
プッシュボタン等により訪問相手本人がいるか、いない
か等が選択される。この選択結果は、電話制御部を介し
て知識処理部に伝えられる。訪問相手本人がいる場合
は、顔画像データベースからほほえみの表情のデータが
取り出され、ディスプレイに表示されるとともに、音声
データベースから本人が応対することを伝えるセリフの
データが取り出され、スピーカから音声が出力される。
訪問相手本人がいない場合は、顔画像データベースから
微かな悲しみの表情のデータが取り出され、ディスプレ
イに表示されるとともに、音声データベースから本人が
不在であることを伝えるセリフのデータが取り出され、
スピーカから音声が出力される。この結果、来訪者に対
し、訪問相手の所在の状況を音声とともに、視覚的に伝
えることができる。
When calling the person to be visited, the data of the line telling that the visitor has come is retrieved from the voice database, the telephone is ringed by the telephone controller, and the voice is output when the answerer picks up the receiver. To be done. At this time, the presence or absence of the person to be visited is selected by the push button or the like of the telephone. The selection result is transmitted to the knowledge processing unit via the telephone control unit. When the person you are visiting is present, the facial expression data is retrieved from the face image database and displayed on the display, and the line data that tells you that the person is responding is retrieved from the voice database and the voice is output from the speaker. To be done.
If there is no person to visit, the data of the expression of a slight sadness is retrieved from the face image database, displayed on the display, and the data of the line telling that the person is absent is retrieved from the voice database,
Sound is output from the speaker. As a result, it is possible to visually inform the visitor of the location of the visitor together with the voice.

【0009】(2)(1)において、訪問相手本人がい
ない場合は、知識処理部により顔画像データベースから
代わりの応対者の顔画像のデータが取り出され、ディス
プレイに表示される。また、音声データベースからその
代わりの応対者の声のデータが取り出され、スピーカか
ら出力される。この結果、来訪者が代わりの応対者に面
会する前に、予め来訪者に対し代わりの応対者の紹介が
行なわれる。尚、スピーカからの音声の代わりにディス
プレイに文字を表示することより、来訪者が聴覚障害者
等である場合にも、受付案内を行なうことが可能となる
が、その場合も、顔画像の表情により来訪者の機械に対
する違和感を緩和できる。
(2) In (1), when there is no person to visit, the knowledge processing section retrieves the face image data of the substitute respondent from the face image database and displays it on the display. In addition, the data of the voice of the other respondent is taken out from the voice database and output from the speaker. As a result, the visitor is previously introduced to the substitute responder before the visitor visits the substitute respondent. By displaying characters on the display instead of the sound from the speaker, it is possible to provide reception guidance even when the visitor is a hearing impaired person, etc. This can reduce the discomfort of visitors to the machine.

【0010】[0010]

【実施例】以下、本発明を図の実施例を用いて詳細に説
明する。以下の説明では、オフィス等に訪れてシステム
を利用する人を来訪者と呼び、来訪者が会おうとしてい
る相手を訪問相手と呼ぶ。また、訪問相手を含め、来訪
者の応対を行なう人を応対者と呼ぶ。図1は、本発明の
来訪者案内システムの一実施例を示すブロック図であ
る。図示のシステムは、ディスプレイ1、キー付き表示
装置2、CCDカメラ3、スピーカ4、電話器5、知識
処理部9、音声合成部10、画像合成部11、電話制御
部12、顔画像データベース13、音声データベース1
4等を備えている。
The present invention will be described in detail below with reference to the embodiments shown in the drawings. In the following description, a person who visits an office or the like and uses the system is called a visitor, and a person whom the visitor is going to meet is called a visitor. In addition, a person who handles a visitor, including a visitor, is called a responder. FIG. 1 is a block diagram showing an embodiment of a visitor guidance system of the present invention. The illustrated system includes a display 1, a display device with keys 2, a CCD camera 3, a speaker 4, a telephone 5, a knowledge processing unit 9, a voice synthesis unit 10, an image synthesis unit 11, a telephone control unit 12, a face image database 13, Voice database 1
It has 4 etc.

【0011】ディスプレイ1は、CRTや液晶表示装置
等から成り、画像合成部11で合成された顔画像を表示
する。キー付き表示装置2は、CRTや液晶表示装置等
の上にタッチパネル等を設けたものからなり、タッチパ
ネル等がキーとなる。これは、知識処理部9の制御によ
り文字情報の表示を行ない、キー入力の受付を行なう。
CCDカメラ3は、ディスプレイ1の前方にいる人間を
写すことができるようにディスプレイ1の上方又はその
周辺に設置される。CCDカメラ3からの映像出力はデ
ィジタル化され、画像処理を行なうために画像メモリ8
に一時的に蓄えられる。スピーカ4は、音声合成部10
から出力される音声電気信号を音声に変換して出力す
る。
The display 1 is composed of a CRT, a liquid crystal display device or the like, and displays the face image combined by the image combining unit 11. The display device 2 with a key is configured by providing a touch panel or the like on a CRT or a liquid crystal display device, and the touch panel or the like serves as a key. Under the control of the knowledge processing unit 9, the character information is displayed and the key input is accepted.
The CCD camera 3 is installed above or around the display 1 so that a person in front of the display 1 can be photographed. The video output from the CCD camera 3 is digitized, and the image memory 8 is used for image processing.
Is temporarily stored in. The speaker 4 is the voice synthesizer 10
The audio electrical signal output from is converted into audio and output.

【0012】電話器5は、電話制御部12に接続される
とともに、電話回線6を介してオフィス内の電話器7に
接続されており、オフィス内の人間と話をすることを可
能とする。知識処理部9は、プロセッサ等から成り、各
種の知識処理を行なう。例えば、画像メモリ8に蓄えら
れた画像を背景画像と比較することにより、背景画像か
らの変化の検出により侵入物体を検出する。また、侵入
物体の変化がなくなったことを検出することにより、侵
入物体がディスプレイ1の前で静止したことを検出す
る。そして、キー付き表示装置2への文字情報の出力を
制御し、キー付き表示装置2からのキー入力を受け取
る。また、画像合成部11を制御し、音声合成部10を
制御し、電話制御部12を制御する。更に、これら全体
のプログラムの監視と制御を行なう。
The telephone 5 is connected to the telephone controller 12 and is also connected to the telephone 7 in the office via the telephone line 6 so that it is possible to talk with a person in the office. The knowledge processing unit 9 is composed of a processor and the like, and performs various kinds of knowledge processing. For example, by comparing an image stored in the image memory 8 with a background image, an intruding object is detected by detecting a change from the background image. Further, by detecting that the change of the intruding object disappears, it is detected that the intruding object stands still in front of the display 1. Then, the output of the character information to the keyed display device 2 is controlled, and the key input from the keyed display device 2 is received. It also controls the image synthesis unit 11, the voice synthesis unit 10, and the telephone control unit 12. Furthermore, it monitors and controls the program of all of these.

【0013】音声合成部10は、プロセッサ等から成
り、知識処理部9の制御により音声信号を合成し、合成
した音声信号をスピーカ4及び電話制御部12に伝え
る。画像合成部11は、プロセッサ等から成り、知識処
理部9の制御により顔画像のイメージを合成し、ディス
プレイ1に表示する。電話制御部12は、プロセッサ等
から成り、知識処理部9の制御により電話器5から訪問
相手に電話をつなぎ、電話回線6を通して訪問相手の電
話器7からのプッシュホン等による信号出力を受け取
る。顔画像データベース13は、磁気ディスク装置等か
ら成り、オフィス内の人間の顔の個人データを有する。
この個人データは、ID番号によって検索することが可
能であり、検索されたデータは画像合成部11で顔画像
に合成される。
The voice synthesizing unit 10 is composed of a processor or the like, synthesizes a voice signal under the control of the knowledge processing unit 9, and transmits the synthesized voice signal to the speaker 4 and the telephone control unit 12. The image synthesizing unit 11 is composed of a processor or the like, and synthesizes images of face images under the control of the knowledge processing unit 9 and displays them on the display 1. The telephone control unit 12 is composed of a processor or the like, connects a telephone from the telephone 5 to the visitor under the control of the knowledge processing unit 9, and receives a signal output by a touch-tone telephone or the like from the telephone 7 of the visitor through the telephone line 6. The face image database 13 is composed of a magnetic disk device or the like, and has personal data of human faces in the office.
This personal data can be searched by the ID number, and the searched data is combined with the face image by the image combining unit 11.

【0014】音声データベース14は、磁気ディスク装
置等から成り、オフィス内の人間の音声の個人データを
格納する。この個人データも、画像の場合と同様に、I
D番号によって検索することができる。図2に、図1の
システムにおける来訪者応対装置の外観を示す。正面の
ディスプレイ1には、画像合成部11により合成された
顔画像が表示され、これが有人の場合に受付担当者が負
担していた役割を果たす。ディスプレイ1の前方には、
キー付き表示装置が設けられている。また、ディスプレ
イ1の上方には、来訪者の存在を検知するCCDカメラ
3が設けられている。そして、キー付き表示装置2の側
方にスピーカ4が設けられており、ディスプレイ1の側
方に電話器5が設けられている。
The voice database 14 is composed of a magnetic disk device or the like, and stores personal data of voice of a person in the office. This personal data is also I
You can search by D number. FIG. 2 shows the appearance of the visitor reception device in the system of FIG. The face image synthesized by the image synthesizing unit 11 is displayed on the display 1 on the front side, which plays the role that the receptionist bears when this is manned. In front of the display 1,
A display device with a key is provided. A CCD camera 3 that detects the presence of a visitor is provided above the display 1. A speaker 4 is provided on the side of the keyed display device 2, and a telephone 5 is provided on the side of the display 1.

【0015】次に、上述した図1のシステムの動作を説
明する。図3は、システム全体の処理を示すフローチャ
ートであり、システムの処理は大きく3つの段階に分か
れる。これらは、オフィス等に来訪者が訪れたことを認
識する部分(ステップS301)と、来訪者が会おうと
している訪問相手を指定する際に来訪者に手順を説明す
る部分(ステップS302)と、システムが訪問相手に
来訪者が来たことを伝え、来訪者に対して訪問相手の意
志を伝える部分(ステップS303)である。
Next, the operation of the system shown in FIG. 1 will be described. FIG. 3 is a flowchart showing the processing of the entire system, and the processing of the system is roughly divided into three stages. These are a part that recognizes that a visitor has visited the office (step S301), and a part that explains the procedure to the visitor when the visitor is going to meet (step S302). This is a part where the system informs the visitor that the visitor has arrived and informs the visitor of the intention of the visitor (step S303).

【0016】図4は来訪者の認識部分の処理のフローチ
ャートであり、図5は訪問相手の指定部分の処理のフロ
ーチャートであり、図6〜図9は訪問相手の呼び出し部
分の処理のフローチャートである。最初に、図4を用い
て来訪者の認識部分の動作を説明する。まず、初期設定
として無表情の正面を向いた顔画像を合成する(ステッ
プS401)。次に、侵入物体のない背景画像と現在の
画像との差分を取ること等により、ディスプレイ1の前
に侵入してくる物体を検出する(ステップS402)。
侵入物体が検出されると、その物体がディスプレイ1の
前で静止しているか否かを判定し(ステップS40
3)、静止している場合はほほえみの表情の顔画像を合
成する(ステップS404)。そして、来訪者であるか
どうかを質問する内容のセリフを出力する(ステップS
405)。セリフの例としては、「御用の方はボタンを
お押し下さい。」等である。来訪者であれば次の段階に
進み、キー付き表示装置2によるキーの押下があったか
否かが判定され(ステップS406)、一定時間反応が
なければ(ステップS407)、静止物体が来訪者では
ないとみなして静止物体検出の処理を繰り返す(ステッ
プS401)。
FIG. 4 is a flow chart of the processing of the visitor recognition portion, FIG. 5 is a flow chart of the processing of the designated portion of the visitor, and FIGS. 6 to 9 are flow charts of the processing of the calling portion of the visitor. . First, the operation of the recognition part of the visitor will be described with reference to FIG. First, as an initial setting, a faceless front face image is combined (step S401). Next, an intruding object is detected in front of the display 1 by taking a difference between the background image having no intruding object and the current image (step S402).
When an intruding object is detected, it is determined whether the object is stationary in front of the display 1 (step S40).
3) If it is stationary, a face image with a smiling expression is combined (step S404). Then, the dialogue that asks whether or not the visitor is output is output (step S
405). An example of the line is "Please push the button if you need it." If it is a visitor, the process proceeds to the next stage, it is determined whether or not a key is pressed by the keyed display device 2 (step S406), and if there is no reaction for a certain time (step S407), the stationary object is not a visitor. And the process of detecting a stationary object is repeated (step S401).

【0017】次に、図5を用いて訪問相手の指定部分の
動作を説明する。まず、視線をキー付き表示装置2に向
けた顔画像を合成し(ステップS501)、訪問先を指
定を促すセリフで案内を行なう(ステップS502)。
セリフの例としては、「いらっしゃいませ。訪問先を指
定して下さい。」等である。訪問相手の検索は音声によ
る指示とキー付き表示装置2による表示と入力を繰り返
すことにより対話的に行なう(ステップS503)。検
索が終れば(ステップS504)、指定した訪問相手を
呼び出してよいかどうかの確認を促すセリフで案内を行
なう(ステップS505)。セリフの例としては、「*
*に取り次ぎます。よろしいでしょうか。」等である。
来訪者により訪問相手が確認されると(ステップS50
6)、視線を来訪者に向けた顔画像を合成し、システム
が訪問相手と連絡を取るために来訪者に少し待ってほし
いという主旨のセリフで案内を行なう(ステップS50
5)。セリフの例としては、「少々お待ち下さい。」等
である。そして、次の段階で訪問相手とのやり取りを行
なうため、視線を下に落した無表情の顔画像を合成する
(ステップS508)。
Next, the operation of the designated part of the visited partner will be described with reference to FIG. First, a face image in which the line of sight is directed to the keyed display device 2 is synthesized (step S501), and guidance is provided by a dialog prompting the designation of a visited place (step S502).
An example of the line is "Welcome. Please specify the place to visit." The search for a visitor is performed interactively by repeating voice instructions and display and input on the keyed display device 2 (step S503). When the search is completed (step S504), guidance is given by a dialog prompting confirmation of whether or not the designated visitor can be called (step S505). As an example of dialogue, "*
I will go to *. is this good. , Etc.
When the visitor confirms the visitor (step S50)
6) The face image with the line of sight directed to the visitor is synthesized, and the system guides the user with a dialogue to the effect that the visitor should wait a little for contacting the visitor (step S50).
5). An example of the line is "Please wait a moment." Then, in order to communicate with the person to be visited at the next stage, an expressionless face image with a lowered line of sight is synthesized (step S508).

【0018】最後に、訪問相手の呼び出し部分を図6〜
図9を参照して説明する。図1において、音声合成部1
0の合成した音声信号は訪問相手の電話器7のスピーカ
で再生され、訪問相手は電話器7のボタンを押すこと等
により電話制御部12を介して知識処理部9に制御信号
を送る。このときの知識処理部9の詳細な処理手順が図
6〜図9に示されている。知識処理部9は、まず来訪者
によって指定された訪問相手に電話を掛け(ステップS
601)、来訪者が来たことを伝える内容のセリフを合
成する(ステップS602)。このセリフの例は、「*
*様がいらしゃっております。」等である。これによ
り、訪問相手は、本人が応対に出るか、代わりの者が応
対に出るか来訪者と電話で話をするかのいずれかの処理
を選択し、知識処理部9に伝える(ステップS603、
S604)。この場合、訪問相手の選択ミス等を防ぐた
め、知識処理部9は訪問相手に選択肢の確認を促すセリ
フを合成し(ステップS605、S606、S60
7)、確認を行なう(ステップS608、S609、S
610)。訪問相手の代わりの者が応対に出ると選択さ
れた場合、知識処理部9はその応対者のID番号の入力
を受け付け(ステップS701)、誰が対応に出るのか
を確認する。
Finally, the calling portion of the visitor is shown in FIG.
This will be described with reference to FIG. In FIG. 1, the speech synthesizer 1
The synthesized voice signal of 0 is reproduced by the speaker of the telephone 7 of the visitor, and the visitor sends a control signal to the knowledge processing unit 9 via the telephone controller 12 by pressing a button of the telephone 7. The detailed processing procedure of the knowledge processing unit 9 at this time is shown in FIGS. The knowledge processing unit 9 first calls the visitor designated by the visitor (step S
601), The words which tell the arrival of the visitor are combined (step S602). An example of this line is "*
* We are looking forward to seeing you. , Etc. As a result, the visitor selects either processing in which the person himself / herself responds, a substitute person responds, or talks with the visitor by telephone, and informs the knowledge processing unit 9 (step S603,
S604). In this case, in order to prevent the visitor from making a selection mistake, the knowledge processing unit 9 synthesizes a dialogue prompting the visitor to confirm the option (steps S605, S606, S60).
7) Confirmation is performed (steps S608, S609, S
610). When it is selected that a person instead of the person to visit visits to answer, the knowledge processing unit 9 accepts the input of the ID number of the answerer (step S701), and confirms who will respond.

【0019】訪問相手本人が応対に出ることを選択した
場合、視線を来訪者に向けたほほえみの表情の顔画像を
合成し(ステップS611、S612)、本人が対応に
出ることを伝えるセリフを出力する(ステップS61
3)。セリフの例としては、「すぐに参りますので、少
々お待ち下さい。」等である。その後、訪問相手のID
番号によって顔画像データを顔画像データベース13か
ら検索し(ステップS614)、顔画像を本人の顔に変
化させる(ステップS615)。同様に、音声も訪問相
手のものに変化させ(ステップS616)、「私が**
です。ただいま参ります。」等のセリフを出力し、来訪
者に訪問相手の顔と声のイメージを認識させる。
When the person visiting the person chooses to respond, he or she synthesizes a face image with a smiling face with a line of sight to the visitor (steps S611 and S612), and outputs a line telling that the person responds. Yes (step S61
3). An example of a line is "I will come soon, so please wait a while." After that, the ID of the visitor
The face image data is retrieved from the face image database 13 by the number (step S614), and the face image is changed to the person's face (step S615). Similarly, the voice is changed to that of the visitor (step S616), and "I am **
is. I'll come right now. ", Etc. are output to make the visitor recognize the image of the face and voice of the visitor.

【0020】一方、ステップS604で、訪問相手が不
在である等の理由で代わりの者が対応に出ることを選択
した場合、一旦視線を来訪者に向け謝罪の意味である微
かな悲しみの表情を合成した後、訪問相手が不在である
ことを伝えるセリフを出力しながら15で伝えながら視
線を下に向けた表情を合成する(ステップS702〜S
704)。セリフの例としては、「申し訳ございません
が、**は不在です。」等である。次に、視線を来訪者
に向けたほほえみの表情の顔画像を合成し、代わりの者
が対応に出ることを伝えるセリフを出力する(ステップ
S705〜S707)。セリフの例としては、「代わり
の者が参りますので、少々お待ち下さい。」等である。
その後、応対者のID番号によって顔画像データを顔画
像データベース13から検索し(ステップS708)、
顔画像を応対者の顔に変化させる(ステップS70
9)。同様に、音声も応対者のものに変化させ(ステッ
プS710)、「私が**です。ただいま参ります。」
等のセリフによって紹介を行ない、来訪者に応対者の顔
と声のイメージを認識させる。
On the other hand, in step S604, if the substitute person chooses to respond because the visitor is absent or the like, he / she turns his line of sight to the visitor and expresses the expression of slight sorrow, which means an apology. After synthesizing, a facial expression in which the line of sight is directed downward is synthesized while outputting at 15 a message telling that the person to be visited is absent (steps S702 to S702).
704). An example of a line is "Sorry, but ** is absent." Next, a face image with a smiling face with a line of sight directed to the visitor is synthesized, and a line is output to notify that a substitute person will respond (steps S705 to S707). An example of a dialogue is "Please wait, because a substitute will come."
After that, the face image data is retrieved from the face image database 13 by the ID number of the respondent (step S708),
The face image is changed to the face of the respondent (step S70).
9). Similarly, the voice is also changed to that of the respondent (step S710), and "I am **. I will come."
Introduce by the lines such as, and let the visitors recognize the image of the face and voice of the respondent.

【0021】また、訪問相手が来訪者と電話で話をする
ことを選択した場合、視線を来訪者に向けたほほえみの
表情の顔画像を合成し、受話器を取るように案内するセ
リフを出力しながら視線を電話器に向けた顔画像を合成
する(ステップS801〜S804)。次に、視線を下
に向けた無表情の顔画像を合成し(ステップS80
5)、訪問相手からの信号を待つ。来訪者と訪問相手と
の電話での会話が終ると(ステップS806)、訪問相
手は応対に出るか、そのまま帰ってもらうかのいずれか
の処理を選択し、知識処理部9に伝える(ステップS8
07〜S809)。この場合、訪問相手の選択ミス等を
防ぐため、訪問相手に選択肢の確認を促すセリフを出力
する。
[0021] When the other party chooses to talk to the visitor by telephone, a face image with a smiling face with a line of sight toward the visitor is synthesized, and a line for guiding the user to pick up the receiver is output. While synthesizing the face image with the line of sight facing the telephone (steps S801 to S804). Next, an expressionless face image with the eyes directed downward is synthesized (step S80).
5) Wait for the signal from the person you are visiting. When the telephone conversation between the visitor and the visitor is over (step S806), the visitor selects either a response or a return to the knowledge processing unit 9 (step S8).
07-S809). In this case, in order to prevent the visitor from making a selection mistake, a line is output to encourage the visitor to confirm the options.

【0022】応対者が対応に出ることを選択した場合、
知識処理部9はその応対者のID番号の入力を受け付け
(ステップS904)、誰が応対に出るのかを認識す
る。この場合、視線を来訪者に向けたほほえみの表情の
顔画像を合成し(ステップS902、S903)、「少
々お待ち下さい。」等のセリフにより応対者が来ること
を案内する(ステップS904)。その後、応対者のI
D番号によって顔画像データを顔画像データベース13
から検索し(ステップS905)、顔画像を応対者のも
のに変化させる(ステップS906)。同様に、音声も
応対者のものに変化させ(ステップS907)、所定の
セリフによって紹介を行ない、来訪者に応対者の顔と声
のイメージを認識させる。
When the respondent chooses to respond,
Knowledge processing unit 9 accepts the input of the ID number of the respondent (step S904), and recognizes who will respond. In this case, a face image with a smiling expression with a line of sight directed to the visitor is synthesized (steps S902 and S903), and a dialogue such as "please wait a moment" is used to guide the arrival of the respondent (step S904). After that, the respondent I
The face image data is converted into the face image database 13 by the D number.
(Step S905), and the face image is changed to that of the respondent (step S906). Similarly, the voice is also changed to that of the respondent (step S907), and introduction is made by a predetermined line so that the visitor recognizes the image of the face and voice of the respondent.

【0023】他方、図8のステップS809で来訪者に
そのまま帰ってもらう場合、視線を来訪者に向けたほほ
えみの表情の顔画像を合成し、視線を下に向けながら別
れの挨拶のセリフを出力する。セリフの例としては、
「またのお越しをお待ちしております。」等である。以
上の来訪者の案内が終了すると、再び図4の来訪者の認
識部分に戻る。このようにして、受付担当者と同様なき
め細かい案内を来訪者に対して行なうことができる。
On the other hand, in the case where the visitor returns as it is in step S809 of FIG. 8, a face image with a smiling face with a line of sight toward the visitor is synthesized, and a farewell greeting line is output while the line of sight is directed downward. To do. Examples of lines are:
"We are looking forward to seeing you again." When the above visitor guidance is completed, the process returns to the visitor recognition part in FIG. In this way, it is possible to provide the visitor with the same detailed guidance as the receptionist.

【0024】図10に、上述した各処理段階での顔画像
の表情の変化を示す。ディスプレイ1に表示される顔画
像の表情は、通常は、図2に示すように無表情である。
ところが、CCDカメラ3により撮影された映像により
来訪者が現われたことが認識されたとき、図10(a)
のようなほほえみの表情の顔画像が表示される。これに
従い、来訪者が訪問相手の指定入力を完了すると、図1
0(b)に示すように再び無表情に戻る。この間に、訪
問相手の呼出が行なわれ、オフィス内の人間により訪問
相手本人がいるか、いないか等が知識処理部9に伝えら
れる。訪問相手本人がいる場合は、図10(a)のほほ
えみの表情が表示される。訪問相手本人がいない場合
は、図10(c)のような微かな悲しみの表情が表示さ
れる。その後、代わりの応対者の顔画像が表示される。
FIG. 10 shows changes in the facial expression of the face image at each processing stage described above. The expression of the face image displayed on the display 1 is usually expressionless as shown in FIG.
However, when it is recognized that the visitor appears by the image taken by the CCD camera 3, FIG.
A face image with a smiling face like is displayed. Following this, when the visitor completes the designated input of the visitor,
As shown in 0 (b), he returns to expressionless again. During this time, the person to be visited is called, and the person in the office informs the knowledge processing unit 9 whether or not there is the person to visit. When the person to be visited is present, the smiling expression of FIG. 10 (a) is displayed. When there is no person to visit, a slight expression of sadness is displayed as shown in FIG. After that, the face image of the substitute respondent is displayed.

【0025】また、本人又は代わりの応対者が電話で応
対することを選択した場合に、図10(d)に示すよう
に電話器5の位置が視線により示される。このようにし
て、顔画像の表情の変化により、受付担当者と同様な案
内が行なわれるとともに、代わりの応対者の紹介も行な
われる。尚、本発明は、上述した実施例に限定されず、
種々の変形が可能であることはもちろんである。例え
ば、上述した実施例では、撮影手段は、所定の場所にお
ける来訪者の存在の有無を検出するためにのみ用いてい
るが、来訪者の顔を撮影して訪問相手にその映像を送る
ために用いてもよい。
Further, when the person himself or his or herself or a substitute respondent chooses to respond by telephone, the position of the telephone 5 is indicated by the line of sight as shown in FIG. 10 (d). In this way, according to the change in the facial image, the same guidance as that of the receptionist is given, and the substitute respondent is also introduced. The present invention is not limited to the above-mentioned embodiment,
Of course, various modifications are possible. For example, in the above-described embodiment, the photographing means is used only to detect the presence or absence of a visitor at a predetermined place, but in order to photograph the face of the visitor and send the image to the visitor. You may use.

【0026】[0026]

【発明の効果】以上、詳細に説明したように、この発明
では、従来、文字や音声のみで行なっていた来訪者案内
システムに表情を持つ顔画像の表示を導入するようにし
たので、来訪者が機械に不慣れな場合でも機械の操作に
対する不安を減少させ、安心して利用できるようにする
ことが可能となる。また、システムがオフィス内の人間
からの信号を直接処理するため、来訪者の手続きを簡素
化することができる。更に、来訪者に対し、応対者の顔
と声を提示することにより、来訪者と応対者の面識がな
い場合でも、来訪者が応対者の識別を容易に行えるよう
にできる。
As described above in detail, in the present invention, the display of the facial image having the facial expression is introduced in the visitor guidance system which has been conventionally performed only by the characters and the voices. Even if the user is not accustomed to the machine, it is possible to reduce anxiety about the operation of the machine and use the machine with peace of mind. Also, since the system directly processes signals from people in the office, the procedure for visitors can be simplified. Furthermore, by presenting the face and voice of the respondent to the visitor, the visitor can easily identify the respondent even if the visitor and the respondent do not know each other.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の来訪者案内システムの一実施例のブロ
ック図である。
FIG. 1 is a block diagram of an embodiment of a visitor guidance system of the present invention.

【図2】本発明のシステムの来訪者応対装置の外観図で
ある。
FIG. 2 is an external view of a visitor reception device of the system of the present invention.

【図3】システム全体の処理手順を説明するフローチャ
ートである。
FIG. 3 is a flowchart illustrating a processing procedure of the entire system.

【図4】来訪者の認識部分の処理手順を説明するフロー
チャートである。
FIG. 4 is a flowchart illustrating a processing procedure of a recognition portion of a visitor.

【図5】訪問相手の指定部分の処理手順を説明するフロ
ーチャートである。
FIG. 5 is a flowchart illustrating a processing procedure of a designated portion of a visiting party.

【図6】訪問相手の呼び出し部分の処理手順を説明する
フローチャート(その1)である。
FIG. 6 is a flowchart (No. 1) for explaining the processing procedure of the calling portion of the called party.

【図7】訪問相手の呼び出し部分の処理手順を説明する
フローチャート(その2)である。
FIG. 7 is a flowchart (No. 2) for explaining the processing procedure of the calling portion of the called party.

【図8】訪問相手の呼び出し部分の処理手順を説明する
フローチャート(その3)である。
FIG. 8 is a flowchart (No. 3) for explaining the processing procedure of the calling portion of the called party.

【図9】訪問相手の呼び出し部分の処理手順を説明する
フローチャート(その4)である。
FIG. 9 is a flowchart (No. 4) for explaining the processing procedure of the calling portion of the called party.

【図10】顔画像の表情の変化の説明図である。FIG. 10 is an explanatory diagram of changes in facial expressions of a face image.

【符号の説明】[Explanation of symbols]

1 ディスプレイ 4 スピーカ 9 知識処理部 10 音声合成部 11 画像合成部 12 電話制御部 13 顔画像データベース 14 音声データベース 1 Display 4 Speaker 9 Knowledge Processing Section 10 Voice Synthesis Section 11 Image Synthesis Section 12 Telephone Control Section 13 Face Image Database 14 Voice Database

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 顔画像のデータを格納した顔画像データ
ベースと、 当該顔画像データベースから取り出したデータにより顔
画像を合成する顔画像合成部と、 当該顔画像合成部から出力される顔画像を表示するディ
スプレイと、 前記顔画像に対応する音声のデータを格納した音声デー
タベースと、 当該音声データベースから取り出したデータにより音声
を合成する音声合成部と、 当該音声合成部から出力される音声を出力するスピーカ
と、 入力操作部から入力された指示に対する処理結果に応じ
たセリフの音声を前記音声データベースから取り出し、
前記音声合成部により音声を合成して前記スピーカから
出力するとともに、前記セリフに対応する表情の顔画像
を前記顔画像データベースから取り出し、前記顔画像合
成部によりその顔画像を合成して前記ディスプレイに表
示する処理を行なう知識処理部と、 前記入力操作部からの入力により指定された相手先の電
話器に前記音声データベースから取り出した音声データ
を前記音声合成部を介して送信し、相手先の電話器から
入力された応答を前記知識処理部に送る電話制御部とを
備えたことを特徴とする来訪者案内システム。
1. A face image database storing face image data, a face image synthesizing unit for synthesizing a face image with data extracted from the face image database, and a face image output from the face image synthesizing unit. A display, a voice database storing voice data corresponding to the face image, a voice synthesizing unit for synthesizing voices by the data extracted from the voice database, and a speaker for outputting voices output from the voice synthesizing unit. And, the voice of the speech corresponding to the processing result for the instruction input from the input operation unit is retrieved from the voice database,
The voice is synthesized by the voice synthesizer and output from the speaker, and a face image having an expression corresponding to the dialogue is taken out from the face image database, and the face image synthesizer synthesizes the face image to display on the display. The knowledge processing unit that performs a display process and the telephone data of the other party designated by the input from the input operation unit transmit the voice data extracted from the voice database through the voice synthesis unit to the other party's telephone. A visitor guidance system, comprising: a telephone control unit that sends a response input from the device to the knowledge processing unit.
【請求項2】 前記顔画像データベースは、来訪者に応
対する応対者の顔画像のデータを格納し、前記音声デー
タベースは、その応対者の声のデータを格納し、前記知
識処理部は、来訪者の訪問相手が不在の場合に、前記画
像合成部及び音声合成部を介して、前記ディスプレイ及
びスピーカにより来訪者の訪問相手の代わりに応対する
応対者を来訪者に対し紹介することを特徴とする請求項
1記載の来訪者案内システム。
2. The face image database stores data of face images of a responder who responds to the visitor, the voice database stores data of voice of the respondent, and the knowledge processing unit stores the visitor's voice. When the visitor of the visitor is absent, the display and the speaker are used to introduce the visitor to the visitor through the image synthesizer and the voice synthesizer instead of the visitor of the visitor. The visitor guidance system according to claim 1.
【請求項3】 顔画像のデータを格納した顔画像データ
ベースと、 当該顔画像データベースから取り出したデータにより顔
画像を合成する顔画像合成部と、 文字による伝言のデータを格納した伝言データベース
と、 当該伝言データベースから取り出したデータにより表示
文字を合成する文字合成部と、 前記顔画像合成部から出力される顔画像及び前記文字合
成部から出力される文字を表示するディスプレイと、 入力操作部から入力された指示に対する処理結果に応じ
たセリフの文字を前記伝言データベースから取り出し、
前記文字合成部により文字を合成して前記ディスプレイ
に表示するとともに、前記セリフに対応する表情の顔画
像を前記顔画像データベースから取り出し、前記顔画像
合成部によりその顔画像を合成して前記ディスプレイに
表示する処理を行なう知識処理部と、 前記入力操作部からの入力により指定された相手先の電
話器に音声データベースから取り出した音声データを音
声合成部を介して送信し、相手先の電話器から入力され
た応答を前記知識処理部に送る電話制御部とを備えたこ
とを特徴とする来訪者案内システム。
3. A face image database storing face image data, a face image synthesizing unit for synthesizing a face image with data extracted from the face image database, a message database storing message data in characters, A character synthesizing unit for synthesizing display characters based on the data retrieved from the message database, a display for displaying a face image output from the face image synthesizing unit and characters output from the character synthesizing unit, and an input operation unit. Take out the serif characters according to the processing result for the specified instruction from the message database,
The character is synthesized by the character synthesizing unit and displayed on the display, and a face image having an expression corresponding to the serif is taken out from the face image database, and the face image synthesizing unit synthesizes the face image on the display. The knowledge processing unit that performs the display process, and the voice data extracted from the voice database is transmitted to the destination telephone device specified by the input from the input operation unit through the voice synthesis unit, and the destination telephone device transmits the voice data. A visitor guidance system, comprising: a telephone control unit for sending an input response to the knowledge processing unit.
JP6140792A 1994-05-31 1994-05-31 Visitor guiding system Pending JPH07325868A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6140792A JPH07325868A (en) 1994-05-31 1994-05-31 Visitor guiding system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6140792A JPH07325868A (en) 1994-05-31 1994-05-31 Visitor guiding system

Publications (1)

Publication Number Publication Date
JPH07325868A true JPH07325868A (en) 1995-12-12

Family

ID=15276855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6140792A Pending JPH07325868A (en) 1994-05-31 1994-05-31 Visitor guiding system

Country Status (1)

Country Link
JP (1) JPH07325868A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6434525B1 (en) 1998-05-27 2002-08-13 Nec Corporation Human image dialogue device and a recording medium storing a human image dialogue device
JP2007164381A (en) * 2005-12-12 2007-06-28 Honda Motor Co Ltd Reception system
CN106799009A (en) * 2017-03-07 2017-06-06 程燕 Smile Special training device
JP2021047369A (en) * 2019-09-20 2021-03-25 株式会社 資生堂 Information processing device and virtual customer service system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6434525B1 (en) 1998-05-27 2002-08-13 Nec Corporation Human image dialogue device and a recording medium storing a human image dialogue device
JP2007164381A (en) * 2005-12-12 2007-06-28 Honda Motor Co Ltd Reception system
JP4594857B2 (en) * 2005-12-12 2010-12-08 本田技研工業株式会社 Reception system
CN106799009A (en) * 2017-03-07 2017-06-06 程燕 Smile Special training device
JP2021047369A (en) * 2019-09-20 2021-03-25 株式会社 資生堂 Information processing device and virtual customer service system

Similar Documents

Publication Publication Date Title
US6181778B1 (en) Chronological telephone system
US6477239B1 (en) Sign language telephone device
JP2019029984A (en) Information processing apparatus, information processing method, video data, program, and information processing system
US8210848B1 (en) Method and apparatus for determining user feedback by facial expression
KR100698942B1 (en) The Sign Language Interpretation System By Using The Sign Language Conversation Video Telephone And Its Supplementary Device
KR100698932B1 (en) The Sign Language Interpretation System By Using The Sign Language Interpretation Video Telephone And Its supplementary Device
WO2010010736A1 (en) Conference image creating method, conference system, server device, conference device, and so forth
JPH0983630A (en) Telephone system
JP6291303B2 (en) Communication support robot system
JP2019086858A (en) Customer service system and customer service method
US20200413009A1 (en) Bidirectional video communication system and kiosk terminal
JP2004129071A (en) Two-way communication system
JP2020009177A (en) Bidirectional video communication system and method of managing an operator therefor
KR20000070998A (en) System for obtaining assistance in operating an apparatus
JPH07325868A (en) Visitor guiding system
CN115865875A (en) Display method, display device and display system
JPH06121310A (en) Video conference device
JP4968663B2 (en) Intercom system
JPH07123389A (en) Communication conference terminal equipment and communication conference equipment
JPH06337631A (en) Interaction controller in sign language interaction
JPH1141578A (en) Electronic conference system
JP2005269207A (en) Information delivery method and communication apparatus for realizing this method, and program therefor
JP2010213127A (en) Call center reception system
JPH11266443A (en) Picture and sound transmission-reception equipment
WO2006106671A1 (en) Image processing device, image display device, reception device, transmission device, communication system, image processing method, image processing program, and recording medium containing the image processing program

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees