JP2019149630A - 双方向映像通信システム及びキオスク端末 - Google Patents

双方向映像通信システム及びキオスク端末 Download PDF

Info

Publication number
JP2019149630A
JP2019149630A JP2018032233A JP2018032233A JP2019149630A JP 2019149630 A JP2019149630 A JP 2019149630A JP 2018032233 A JP2018032233 A JP 2018032233A JP 2018032233 A JP2018032233 A JP 2018032233A JP 2019149630 A JP2019149630 A JP 2019149630A
Authority
JP
Japan
Prior art keywords
operator
terminal
monitor
avatar
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018032233A
Other languages
English (en)
Inventor
和幸 堀尾
Kazuyuki Horio
和幸 堀尾
一生 池崎
Kazuo Ikezaki
一生 池崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2018032233A priority Critical patent/JP2019149630A/ja
Priority to PCT/JP2019/004508 priority patent/WO2019163547A1/ja
Priority to GB2014244.4A priority patent/GB2585779A/en
Priority to US16/975,608 priority patent/US20200413009A1/en
Priority to DE112019000991.5T priority patent/DE112019000991T5/de
Publication of JP2019149630A publication Critical patent/JP2019149630A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5133Operator terminal details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/0289Telephone sets for operators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/157Conference systems defining a virtual conference space and using avatars or agents
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/0295Mechanical mounting details of display modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/0297Telephone sets adapted to be mounted on a desk or on a wall
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/247Telephone sets including user guidance or feature selection means facilitating their use
    • H04M1/2478Telephone terminals specially adapted for non-voice services, e.g. email, internet access
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/50Telephonic communication in combination with video communication

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

【課題】ユーザが望むサービスの内容などの状況に応じて、キオスク端末でアバターがユーザに応対したりオペレータ本人がユーザに応対したりできるようにする。【解決手段】キオスク端末1の制御部31は、オペレータ表示モードにおいて、オペレータの映像をモニタ12に表示するとともに、オペレータの原音声をスピーカー17から出力し、アバター表示モードにおいて、オペレータの映像から抽出された特徴情報に基づいて生成したアバターの動画をモニタに表示するとともに、オペレータの原音声をアバターに適合した声質に変換した変換音声をスピーカーから出力する。【選択図】図4

Description

本発明は、キオスク端末とオペレータ端末との間で、キオスク端末を操作するユーザの映像とオペレータ端末を操作するオペレータの映像とを双方向に通信する双方向映像通信システム、及びキオスク端末に関するものである。
近年、遠隔地にいる複数の人物をそれぞれ撮影した映像を双方向に通信する双方向映像通信システムが普及している。一方、各種の情報を提供する案内業務や金融機関などの窓口業務などのサービスを、人に代わって提供するキオスク端末が普及しており、このようなキオスク端末と、ユーザに応対するオペレータが操作するオペレータ端末とで、双方向映像通信システムを構築すると、ユーザにオペレータが対面して応対することができるため、キオスク端末によるサービスの品質を向上させることができる。
このようなキオスク端末で構築される双方向映像通信システムに関する技術として、従来、キオスク端末に複数のモニタを設けて、ユーザに向かい合うモニタに、オペレータの顔を撮影した映像を表示する技術が知られている(特許文献1参照)。
また、人物を撮像した映像をそのまま相手側の端末に表示させたくない場合に、音声だけではコミュニケーション力が低下するため、人物の顔を撮像した顔画像から抽出した特徴情報に基づいて、人物の表情の変化をアバター(キャラクタ)で再現した動画を生成して、その動画を相手側の端末に表示する技術が知られている(特許文献2参照)。
特開2004−147105号公報 特許第3593067号公報
さて、キオスク端末とオペレータ端末とで双方向映像通信システムを構築した場合、キオスク端末のモニタにオペレータの顔が表示されるが、オペレータの中には、自分の顔が公開されることを望まない人もおり、人材確保の面で、自分の顔が公開されることを望まないオペレータでも業務に携わることができるようにすることが望まれる。このような要望に対しては、特許文献2に開示された技術のように、アバターの動画を表示することで解決される。しかしながら、ユーザが望むサービスの内容によっては、オペレータ本人が対面で説明する必要がある場合もあり、状況に応じて、オペレータ本人がユーザに応対できるようすることが望まれる。
しかしながら、前記従来の技術では、ユーザが望むサービスの内容などに応じて、アバターがユーザに応対したり、オペレータ本人がユーザに応対したりできないという問題があった。
そこで、本発明は、ユーザが望むサービスの内容などに応じて、キオスク端末でアバターがユーザに応対したりオペレータ本人がユーザに応対したりできる双方向映像通信システム及びキオスク端末を提供することを主な目的とする。
本発明の双方向映像通信システムは、キオスク端末とオペレータ端末との間で、前記キオスク端末を操作するユーザの映像と前記オペレータ端末を操作するオペレータの映像とを双方向に通信する双方向映像通信システムであって、前記オペレータ端末は、前記キオスク端末と通信を行う通信部と、オペレータの顔を撮影するカメラと、オペレータが発話した音声を収音するマイクと、制御部と、を備え、前記キオスク端末は、前記オペレータ端末と通信を行う通信部と、前記カメラで撮影したオペレータの映像を表示するモニタと、前記マイクで収音したオペレータの原音声を出力するスピーカーと、制御部と、を備え、前記キオスク端末の前記制御部は、オペレータ表示モードにおいて、前記オペレータの映像を前記モニタに表示するとともに、前記オペレータの原音声を前記スピーカーから出力し、アバター表示モードにおいて、前記オペレータの映像から抽出された特徴情報に基づいて生成したアバターの動画を前記モニタに表示するとともに、前記オペレータの原音声をアバターに適合した声質に変換した変換音声を前記スピーカーから出力する構成とする。
また、本発明のキオスク端末は、自装置を操作するユーザの映像とオペレータ端末を操作するオペレータの映像とを、前記オペレータ端末との間で双方向に通信するキオスク端末であって、前記オペレータ端末と通信を行う通信部と、前記オペレータ端末のカメラで撮影したオペレータの映像を表示するモニタと、前記オペレータ端末のマイクで収音したオペレータの原音声を出力するスピーカーと、制御部と、を備え、前記制御部は、オペレータ表示モードにおいて、前記オペレータの映像を前記モニタに表示するとともに、前記オペレータの原音声を前記スピーカーから出力し、アバター表示モードにおいて、前記オペレータの映像から抽出された特徴情報に基づいて生成したアバターの動画を前記モニタに表示するとともに、前記オペレータの原音声をアバターに適合した声質に変換した変換音声を前記スピーカーから出力する構成とする。
本発明によれば、オペレータ表示モードでは、オペレータの映像がキオスク端末に表示されて、オペレータ本人がユーザに応対し、アバター表示モードでは、アバターの動画がキオスク端末に表示されて、オペレータの代わりにアバターがユーザに応対する。これにより、ユーザが望むサービスの内容などに応じて、アバターがユーザに応対したりオペレータ本人がユーザに応対したりできる。また、アバター表示モードでは、アバターの声質で音声が出力されるため、ユーザに違和感を与えないようにすることができる。
本実施形態に係る双方向映像通信システムの全体構成図 キオスク端末1の外観を示す斜視図 オペレータ端末2の外観を示す斜視図 キオスク端末1およびオペレータ端末2の概略構成を示すブロック図 キオスク端末1に表示される画面を示す説明図 キオスク端末1に表示される画面を示す説明図 オペレータ端末2に表示される画面を示す説明図 オペレータ端末2で管理されるアバターデータベースの登録内容を示す説明図 オペレータ端末2で行われるキオスク端末1の正面モニタ12に関する画面制御の手順を示すフロー図 オペレータ端末2で行われるキオスク端末1の手元モニタ13に関する画面制御の手順を示すフロー図 キオスク端末1で行われる音声制御の手順を示すフロー図
前記課題を解決するためになされた第1の発明は、キオスク端末とオペレータ端末との間で、前記キオスク端末を操作するユーザの映像と前記オペレータ端末を操作するオペレータの映像とを双方向に通信する双方向映像通信システムであって、前記オペレータ端末は、前記キオスク端末と通信を行う通信部と、オペレータの顔を撮影するカメラと、オペレータが発話した音声を収音するマイクと、制御部と、を備え、前記キオスク端末は、前記オペレータ端末と通信を行う通信部と、前記カメラで撮影したオペレータの映像を表示するモニタと、前記マイクで収音したオペレータの原音声を出力するスピーカーと、制御部と、を備え、前記キオスク端末の前記制御部は、オペレータ表示モードにおいて、前記オペレータの映像を前記モニタに表示するとともに、前記オペレータの原音声を前記スピーカーから出力し、アバター表示モードにおいて、前記オペレータの映像から抽出された特徴情報に基づいて生成したアバターの動画を前記モニタに表示するとともに、前記オペレータの原音声をアバターに適合した声質に変換した変換音声を前記スピーカーから出力する構成とする。
これによると、オペレータ表示モードでは、オペレータの映像がキオスク端末に表示されて、オペレータ本人がユーザに応対し、アバター表示モードでは、アバターの動画がキオスク端末に表示されて、オペレータの代わりにアバターがユーザに応対する。これにより、ユーザが望むサービスの内容などに応じて、アバターがユーザに応対したりオペレータ本人がユーザに応対したりできる。また、アバター表示モードでは、アバターの声質で音声が出力されるため、ユーザに違和感を与えないようにすることができる。
また、第2の発明は、前記オペレータ端末の前記制御部は、前記オペレータの映像から特徴情報を抽出して、その特徴情報を前記通信部から前記キオスク端末に送信し、前記キオスク端末の前記制御部は、前記オペレータ端末から受信した前記特徴情報に基づいて前記アバターの動画を生成して前記モニタに表示する構成とする。
これによると、オペレータ端末からキオスク端末に特徴情報を送信するため、アバターの動画を送信する構成と比較して、通信量を削減することができ、また、エンコードやデコードなどの映像処理が不要となるため、キオスク端末の負荷を軽減することができる。
また、第3の発明は、前記オペレータ端末は、オペレータの顔を撮影する正面カメラと、オペレータの手元を撮影する手元カメラと、を備え、前記キオスク端末は、前記正面カメラで撮影したオペレータの正面映像を表示する正面モニタと、前記手元カメラで撮影したオペレータの手元映像を表示する手元モニタと、を備え、前記キオスク端末の前記制御部は、前記正面モニタに、前記オペレータの正面映像、およびアバターの正面動画のいずれかを表示し、前記手元モニタに、前記オペレータの手元映像、アバターの手元動画、および操作画面のいずれかを表示する構成とする。
これによると、キオスク端末の正面モニタおよび手元モニタにそれぞれオペレータの正面映像および手元映像を表示させることで、ユーザがオペレータとカウンタ越しで向き合っているような臨場感を実現することができる。また、手元モニタにオペレータの手元映像を表示させることで、オペレータが書類を手先で指し示しながら説明することができる。また、手元モニタに操作画面を表示させることで、ユーザが必要な操作を行うことができる。
また、第4の発明は、前記キオスク端末の前記制御部は、前記アバターの正面動画を前記正面モニタに表示するとともに、前記オペレータの手元映像を前記手元モニタに表示する構成とする。
これによると、書類を手先で指し示しながら説明する場合、アバターでは細かい手の動きを再現しにくいため、オペレータの手元映像をそのまま表示することで、書類をわかりやすく説明することができる。
また、第5の発明は、前記オペレータ端末の前記制御部は、前記キオスク端末でのユーザの操作内容に応じて、前記オペレータ表示モードと前記アバター表示モードとを切り替える構成とする。
これによると、オペレータ表示モードとアバター表示モードとを適切に切り替えることができる。例えば、簡単な画面操作で済む場合には、アバターの動画を表示して、アバターがユーザに応対するようにする。これにより、顔の公開を望まないオペレータでも業務を行うことができる。一方、詳細な案内が必要で時間がかかる場合には、オペレータの映像を表示して、オペレータ本人がユーザに応対するようにする。これにより、ユーザの応対を円滑に進めることができる。なお、オペレータやユーザが表示モードを切り替えることができるようにしてもよい。
また、第6の発明は、前記キオスク端末の前記制御部は、案内情報、オペレータの発話内容を表す文字情報、およびユーザとオペレータとで共有する共有情報の少なくとも1つを、前記モニタに表示する構成とする。
これによると、ユーザが天気予報などの案内情報を閲覧することができ、また、ユーザがオペレータの発話内容を文字で認識することができ、また、ユーザとオペレータとで情報を共有することができるため、ユーザの利便性を向上させることができる。
また、第7の発明は、自装置を操作するユーザの映像とオペレータ端末を操作するオペレータの映像とを、前記オペレータ端末との間で双方向に通信するキオスク端末であって、前記オペレータ端末と通信を行う通信部と、前記オペレータ端末のカメラで撮影したオペレータの映像を表示するモニタと、前記オペレータ端末のマイクで収音したオペレータの原音声を出力するスピーカーと、制御部と、を備え、前記制御部は、オペレータ表示モードにおいて、前記オペレータの映像を前記モニタに表示するとともに、前記オペレータの原音声を前記スピーカーから出力し、アバター表示モードにおいて、前記オペレータの映像から抽出された特徴情報に基づいて生成したアバターの動画を前記モニタに表示するとともに、前記オペレータの原音声をアバターに適合した声質に変換した変換音声を前記スピーカーから出力する構成とする。
これによると、第1の発明と同様に、ユーザが望むサービスの内容などに応じて、キオスク端末でアバターがユーザに応対したりオペレータ本人がユーザに応対したりできる。
以下、本発明の実施の形態を、図面を参照しながら説明する。
図1は、本実施形態に係る双方向映像通信システムの全体構成図である。
この双方向映像通信システムは、キオスク端末1と、オペレータ端末2と、を備えている。キオスク端末1とオペレータ端末2とは、インターネットやVPN(Virtual Private Network)やイントラネットなどのネットワークを介して接続される。
キオスク端末1は、各種の施設に設置され、ユーザが操作するものであり、ユーザを撮影した映像をオペレータ端末2に送信し、オペレータ端末2から受信したオペレータの映像を表示する。
オペレータ端末2は、コールセンターなど、ユーザに応対するオペレータが常駐する施設に設置され、オペレータが操作するものであり、オペレータを撮影した映像をキオスク端末1に送信し、キオスク端末1から受信したユーザの映像を表示する。
なお、キオスク端末1では、様々なサービスを提供することができる。例えば、キオスク端末1を空港などの交通施設のロビーなどに設置することで、周辺の観光地の案内や、施設内のフロアの案内や、周辺の宿泊施設の案内などのサービスを提供することができる。また、キオスク端末1を銀行などの金融機関の店舗に設置することで、窓口などで行われる各種のサービス、例えば、口座開設や金融取引やローン契約の相談などのサービスを提供することができる。また、キオスク端末1をホテルなどの宿泊施設のフロントなどに設置することで、係員(コンシェルジュ)が行う各種の案内サービスを提供することができる。また、マンションなどの共同住宅の玄関ロビーなどに設置することで、管理人が行う各種のサービスを提供することができる。
このようにキオスク端末1では、各種のサービスを担当者に代わって常時提供することができるため、サービスの品質を向上させることができ、また、オペレータが複数の施設を掛け持ちで担当することができるため、人員削減を図ることができる。
また、キオスク端末1とオペレータ端末2との間では、ユーザの映像とオペレータの映像とを双方向に通信するが、この他に、キオスク端末1やオペレータ端末2において、ユーザやオペレータが操作した内容に関する操作情報、ユーザやオペレータが入力したテキスト情報などが双方向に通信される。
特に、機密情報、例えば、ユーザの氏名や住所などの個人情報や、金融機関の口座番号などの情報がやり取りされる場合がある。このような機密情報の通信については、サービス提供者が、セキュリティを高度に確保した専用のネットワークを既に運用しているため、機密情報を含む映像以外の情報は既存のネットワークで通信し、これとは別のネットワークで映像を通信するようにしてもよい。これにより、セキュリティを確保するとともに、通信量が大きい映像を別のネットワークで通信することで、既存のネットワークの負荷が増大しないようにすることができる。
次に、キオスク端末1について説明する。図2は、キオスク端末1の外観を示す斜視図である。
キオスク端末1は、筐体11と、正面モニタ12と、手元モニタ13と、正面カメラ14と、手元カメラ15と、ICカードリーダ16と、スピーカー17と、マイク18と、を備えている。
正面モニタ12は、画面を前向きにした状態で配置され、手元モニタ13は、画面を上向きにした状態で配置されている。また、手元モニタ13はタッチパネルを備えており、ユーザが画面操作を行うことができる。
正面カメラ14は、ユーザの顔を含む上半身を正面から撮影する。手元カメラ15は、ユーザの手元、すなわち、手元モニタ13上に置いたユーザの手と手元モニタ13の画面とを上方から撮影する。ユーザは、手元モニタ13の画面を手先で指し示す動作を行い、この状況が手元カメラ15で撮影される。
ICカードリーダ16は、ユーザが所持するICカードを読み取る。
スピーカー17は、オペレータが発した音声を出力する。マイク18は、ユーザが発した音声を収音する。
このように構成されたキオスク端末1は、カウンタなどの台に載置され、ユーザが椅子に座った状態で、あるいは、立ったままの状態でキオスク端末1を操作する。
次に、オペレータ端末2について説明する。図3は、オペレータ端末2の外観を示す斜視図である。
オペレータ端末2は、架台21と、第1モニタ22と、第2モニタ23と、正面カメラ24と、手元カメラ25と、ヘッドセット26と、テーブル27と、を備えている。
第1モニタ22は、所定の高さとなるように架台21に支持されている。第2モニタ23は、タッチパネルを備えており、オペレータが画面操作を行うことができる。
正面カメラ24は、オペレータの顔を含む上半身を正面から撮影する。手元カメラ25は、オペレータの手元、すなわち、テーブル27上に置いたオペレータの手とテーブル27とを上方から撮影する。オペレータは、テーブルにパンフレットなどの書類を置いて、書類を手先で指し示しながら書類を説明し、この状況が手元カメラ25で撮影される。
ヘッドセット26は、スピーカー28と、マイク29と、を備えている。スピーカー28は、ユーザが発した音声を出力する。マイク29は、オペレータが発した音声を収音する。
また、オペレータ端末2には、モニタ5が併設される。このモニタ5には、オペレータ端末2、または、図示しないPCで起動させたアプリケーションの画面が表示される。このアプリケーションの画面はキオスク端末1と共有され、同一の画面がキオスク端末1の手元モニタ13に表示される(画面共有機能)。また、モニタ5はタッチパネルを備えており、オペレータが手書きで画面上に描画することができる(ホワイトボード機能)。
なお、コールセンターでは、オペレータが、オペレータ端末2を使用して映像と音声でユーザに応対する対面応対業務とは別に、電話による音声のみでユーザに応対する電話応対業務を行うため、電話応対業務用のモニタ(図示せず)がオペレータ端末2に併設される。
次に、キオスク端末1およびオペレータ端末2の概略構成について説明する。図4は、キオスク端末1およびオペレータ端末2の概略構成を示すブロック図である。
キオスク端末1は、前記のように、正面モニタ12と、手元モニタ13と、正面カメラ14と、手元カメラ15と、ICカードリーダ16と、スピーカー17と、マイク18と、を備えている。また、キオスク端末1は、制御部31と、通信部32と、記憶部33と、を備えている。
通信部32は、ネットワークを介してオペレータ端末2と通信を行う。
記憶部33は、制御部31を構成するプロセッサで実行されるプログラムを記憶する。また、記憶部33は、アバター動画生成部36でアバターの動画を生成するのに必要なアバターモデル情報を記憶する。
制御部31は、画面制御部35と、アバター動画生成部36と、音声制御部37と、音声変換部38と、を備えている。この制御部31は、プロセッサで構成され、制御部31の各部は、記憶部33に記憶されたプログラムをプロセッサで実行することで実現される。
画面制御部35は、正面モニタ12および手元モニタ13の表示画面を制御する。本実施形態では、オペレータ端末2からオペレータの正面映像を受信すると、そのオペレータの正面映像を正面モニタ12に表示する。また、オペレータ端末2からオペレータの手元映像を受信すると、そのオペレータの手元映像を手元モニタ13に表示する。
また、オペレータ端末2からオペレータの顔の特徴情報を受信すると、アバター動画生成部36にアバターの正面動画を生成させて、そのアバターの正面動画を正面モニタ12に表示する。また、オペレータ端末2からオペレータの手の特徴情報を受信すると、アバター動画生成部36にアバターの手元動画を生成させて、そのアバターの手元動画を手元モニタ13に表示する。
また、オペレータ端末2から字幕の文字情報を受信すると、字幕の画像を生成して、その字幕の画像をアバターの正面動画上に重畳して表示する。また、オペレータ端末2から案内情報を受信すると、案内情報を可視化した帯情報の画像を生成して、その帯情報の画像をアバターの正面動画上に重畳して表示する。
アバター動画生成部36は、オペレータ端末2から受信した特徴情報(トラッキング情報)に基づいて、オペレータの顔の動きに合わせてアバター(キャラクタ)が動くアバターの動画を生成する(フィッティングおよびレンダリング)。本実施形態では、オペレータの顔の特徴情報に基づいて、オペレータの顔の表情をアバターで再現した正面動画を生成し、また、オペレータの手の特徴情報に基づいて、オペレータの手の動きをアバターで再現した手元動画を生成する。
音声制御部37は、スピーカー17から出力する音声を制御する。本実施形態では、音声変換が有効であるか否かに応じて、オペレータ端末2から受信したオペレータの原音声と、音声変換部38で音声変換された音声とのいずれかをスピーカー17から出力する。
音声変換部38は、オペレータ端末2から受信したオペレータの原音声を、アバターのキャラクタに適合した声質の音声に変換する。この音声変換には、ディープラーニングを用いた声質変換など、公知の音声変換技術を用いればよい。
また、制御部31は、この他に、オペレータ端末2に接続する接続制御を行い、また、キオスク端末1で撮影したユーザの映像と、オペレータ端末2で撮影したオペレータの映像と、をリアルタイムで送受信する映像伝送制御などを行う。
オペレータ端末2は、前記のように、第1モニタ22と、第2モニタ23と、正面カメラ24と、手元カメラ25と、ヘッドセット26と、を備えている。また、オペレータ端末2は、制御部41と、通信部42と、記憶部43と、を備えている。
通信部42は、ネットワークを介してキオスク端末1と通信を行う。
記憶部43は、制御部41を構成するプロセッサで実行されるプログラムを記憶する。また、記憶部43は、アバターの動画をキオスク端末1に表示したときの状況に関するアバターデータベース(図8参照)の登録情報を記憶する。
制御部41は、画面制御部45と、特徴抽出部46と、音声認識部47と、を備えている。この制御部41は、プロセッサで構成され、制御部41の各部は、記憶部43に記憶されたプログラムをプロセッサで実行することで実現される。
画面制御部45は、キオスク端末1の正面モニタ12および手元モニタ13の表示画面を制御する。本実施形態では、キオスク端末1の正面モニタ12に関する画面制御として、オペレータの正面映像を表示させるオペレータ表示モードと、アバターの正面動画を表示させるアバター表示モードとを切り替える。また、キオスク端末1の手元モニタ13に関する画面制御として、オペレータの手元映像を表示させるオペレータ表示モードと、アバターの手元動画を表示させるアバター表示モードと、操作画面(メニュー画面など)を表示させる操作画面モードと、アプリケーション画面を表示させる画面共有モードとを切り替える。
なお、本実施形態では、キオスク端末1の正面モニタ12および手元モニタ13の表示モードが、キオスク端末1でのユーザの操作内容に応じて切り替えられるが、オペレータが表示モードを選択できるようにしてもよい。
特徴抽出部46は、正面カメラ24で撮影したオペレータの正面映像から、オペレータの顔の特徴情報、すなわち、顔に設定された複数の特徴点の位置情報(座標)を抽出する。また、手元カメラ25で撮影したオペレータの手元映像から、オペレータの手の特徴情報、すなわち、手に設定された複数の特徴点の位置情報(座標)を抽出する。
音声認識部47は、マイク29で収音したオペレータの音声に対して音声認識を行い、文字情報を出力する。
また、制御部41は、この他に、キオスク端末1に接続する接続制御を行い、また、キオスク端末1で撮影したユーザの映像と、オペレータ端末2で撮影したオペレータの映像と、をリアルタイムで送受信する映像伝送制御などを行う。
なお、オペレータ端末2に、手持ちの書類を読み取るスキャナを設けるようにしてもよい。また、オペレータ端末2に、操作する人物が正規のオペレータであることの認証を行うために、ICカードリーダを設けるようにしてもよい。また、キオスク端末1に、オペレータ端末2から送信された書類や画面表示された情報などを印刷出力するプリンタを設けるようにしてもよい。
また、第2モニタ23をタブレットPCで構成する、すなわち、第2モニタ23の筐体内に、制御部41、通信部42および記憶部43を収容した構成としてもよい。
次に、キオスク端末1に表示される画面について説明する。図5および図6は、キオスク端末1に表示される画面を示す説明図である。
キオスク端末1では、スタンバイ時(オペレータ端末2に接続する前)には、正面モニタ12がデジタルサイネージとして動作し、図5(A−1)に示すように、正面モニタ12に、お薦めプランなどの広告や施設などの案内に関するコンテンツの映像が表示される。
また、スタンバイ時には、図5(A−2)に示すように、手元モニタ13に、メインメニュー画面(操作画面)が表示される。このメインメニュー画面には、サービスメニューを選択する操作ボタン51が表示されている。本実施形態では、サービスメニューとして、「手続き」および「相談」を選択することができる。「相談」を選択すると、オペレータ表示モードとなり、オペレータ画面(図6(A−1),(A−2)参照)に遷移する。一方、「手続き」を選択すると、アバター表示モードとなり、アバター画面(図6(B−1),(B−2)参照)に遷移する。
ここで、「手続き」は、口座開設などの手続きを行う場合であり、簡単な画面操作で済み、通常、オペレータ本人が対面して案内する必要がないため、アバター表示モードとなり、アバター画面でアバターがユーザに応対する。一方、「相談」は、ローンや信託に関する契約などに関する相談を行う場合であり、詳細な案内が必要で時間がかかるため、オペレータ本人と対面して案内する必要があるため、オペレータ表示モードとなり、オペレータ画面でオペレータ本人がユーザに応対する。なお、サービスメニューを選択した際に、アバター表示モードとオペレータ表示モードのいずれかを選択する選択画面(図示せず)を表示させるようにしてもよい。
また、手元モニタ13のメインメニュー画面には、通話ボタン52が表示されている。この通話ボタン52を操作すると、キオスク端末1がオペレータ端末2に接続された上で、オペレータ表示モードとなり、オペレータ画面(図6(A−1),(A−2)参照)に遷移する。これにより、簡単な操作で済む「手続き」の場合でも、オペレータに案内してもらうことができる。
なお、オペレータ表示モードでは、オペレータ画面に遷移する前に、オペレータと対話するか否かをユーザに問い合わせる画面を表示して、ユーザが承諾する操作を行った場合に、オペレータ画面に遷移するようにしてもよい。
また、メインメニュー画面でサービスメニューを選択した場合に、必要に応じて、図5(B−2)に示すように、サブメニュー画面に遷移するようにしてもよい。このサブメニュー画面には、各種のサブメニュー項目に対応した操作ボタン53が表示されている。また、このサブメニュー画面には、メインメニュー画面(図5(A−2)参照)と同様に、通話ボタン52が表示されている。
キオスク端末1がオペレータ端末2に接続されると、オペレータ表示モードでは、図6(A−1)に示すように、正面モニタ12に、オペレータ端末2の正面カメラ24で撮影したオペレータの正面映像61が表示され、同時に、図6(A−2)に示すように、手元モニタ13に、オペレータ端末2の手元カメラ25で撮影したオペレータの手元映像62が表示される。
一方、アバター表示モードでは、図6(B−1)に示すように、正面モニタ12に、アバターの正面動画65が表示される。このアバターの正面動画65は、オペレータの正面映像から抽出した顔の特徴情報に基づいて生成され、オペレータの顔の動きに応じてアバターの顔が動く。
また、アバター表示モードでは、字幕66(発話文字表示部)がアバターの正面動画65上に重畳表示される(オーバーレイ)。この字幕には、オペレータが発話した音声の文字列が表示される。また、情報帯67(案内情報表示部)がアバターの正面動画65上に重畳表示される(スーパーインポーズ)。この情報帯67には、天気予報、渋滞情報、株価情報などの種々の案内情報が表示される。
また、正面モニタ12をアバター表示モードとした場合、手元モニタ13は、アバター表示モード、オペレータ表示モード、および操作画面表示モードのいずれかとなる。
アバター表示モードでは、図6(B−2)に示すように、手元モニタ13に、アバターの手元動画68が表示される。このアバターの手元動画68は、オペレータの手元映像から抽出した手の特徴情報に基づいて生成され、オペレータの手の動きに応じてアバターの手が動く。
一方、オペレータ表示モードでは、図6(A−2)に示した例と同様に、手元モニタ13に、オペレータの手元映像62が表示される。また、操作画面表示モードでは、図5(B−2)に示した例と同様に、操作画面が表示される。
また、画面共有モードでは、手元モニタ13に、オペレータ端末2、または、オペレータ側の図示しないPCで起動させたアプリケーションの画面が表示される。このアプリケーションの画面はオペレータ端末2と共有され、同一の画面がオペレータ端末2のモニタ5に表示される(画面共有機能)。また、画面共有モードでは、ユーザが手書きで画面上に描画することができる(ホワイトボード機能)。
次に、オペレータ端末2に表示される画面について説明する。図7は、オペレータ端末2に表示される画面を示す説明図である。
オペレータ端末2では、スタンバイ時には、第1モニタ22に、待ち受け画面が表示され、キオスク端末1で通話ボタン52(図5(A−2),(B−2)参照)を操作すると、図7(A−1)に示すように、着信画面が表示される。この着信画面には、接続相手となるキオスク端末1に関する情報(設置場所や端末名称など)が表示される。
また、スタンバイ時には、図7(A−2)に示すように、第2モニタ23に、操作画面が表示される。この操作画面には、オペレータ端末2の制御やキオスク端末1に対する指示などを行うための各種の操作ボタン71が表示される。
また、第2モニタ23には、オペレータ端末2の正面カメラ24で撮影したオペレータの正面映像61と、オペレータ端末2の手元カメラ25で撮影したオペレータの手元映像62とが表示される。このオペレータの正面映像61および手元映像62は、キオスク端末1に表示されるものと同じものである。なお、オペレータの手元映像62は、元の状態と上下反転した状態とを切り替えることができる。
一方、オペレータ端末2がキオスク端末1に接続されると、図7(B−1)に示すように、第1モニタ22に、キオスク端末1の正面カメラ14で撮影したユーザの正面映像72が表示される。なお、第1モニタ22は、所定の高さとなるように架台21に支持されており(図3参照)、これにより、オペレータとユーザとで視線を一致させることができる。
また、図7(B−2)に示すように、第2モニタ23に、スタンバイ時と同様に、操作ボタン71が表示される。また、第2モニタ23には、スタンバイ時と同様に、オペレータの正面映像61が表示される。このオペレータの正面映像61は、オペレータの手元映像と切り替えることができる。また、第2モニタ23には、オペレータの手元映像が表示された状態でキオスク端末1の手元カメラ15で撮影したユーザの手元映像73が表示される。なお、ユーザの手元映像73は、元の状態と上下反転した状態とを切り替えることができる。
第2モニタ23に表示されるユーザの手元映像73には、キオスク端末1の手元モニタ13上で画面に映るパンフレットなどの書類を指し示すユーザの手先が映り、ユーザとオペレータとで互いに書類を指し示しながら対話することができる。
なお、本実施形態では、ユーザの正面映像72を第1モニタ22に表示し、ユーザの手元映像73を第2モニタ23に表示するようにしたが、ユーザの正面映像72と手元映像63とを1つのモニタに表示するようにしてもよい。この場合、オペレータ側からもユーザとカウンタ越しで向き合っているような臨場感を実現することができる。
次に、オペレータ端末2で管理されるアバターデータベースについて説明する。図8は、アバターデータベースの登録内容を示す説明図である。
オペレータ端末2では、アバター表示モードでアバターの動画をキオスク端末1に表示したときの状況に関する情報を、アバターデータベースに登録する。このデータベース(テーブル)には、過去にアバターの動画を表示したイベントごとに、レコードID、アバターに採用されたキャラクタ、手元モニタ13の表示内容、出力された音声の種類、座標ログなどが登録される。
ここで、座標ログ(特徴情報の履歴)は、オペレータの正面映像から抽出された顔の特徴点の座標(位置情報)である。この座標ログを蓄積することで、過去にキオスク端末1に表示したアバターの動画を再生することができる。これにより、オペレータの正面映像やアバターの動画を録画するより、データ量を大きく削減できる。
なお、アバターのキャラクタに応じて、動かす顔の部位が異なる場合がある。例えば、「うさぎ」では目、鼻および口を動かし、「くま」では目および口のみを動かし、鼻は動かさないようにしてもよい。この場合、動かす顔の部位、すなわち、特徴情報を抽出する部位を指定した情報を、データベースに登録するようにしてもよい。
また、アバターの顔以外の部位、例えば、アバターの肩を動かすようにしてもよい。この場合、オペレータの正面映像からオペレータの肩の特徴情報を抽出すればよい。
次に、オペレータ端末2で行われるキオスク端末1の正面モニタ12に関する画面制御について説明する。図9は、正面モニタ12に関する画面制御の手順を示すフロー図である。
オペレータ端末2では、まず、キオスク端末1の正面モニタ12の表示モードを判定し(ST101)、オペレータ表示モードである場合には、正面カメラ24で撮影したオペレータの正面映像をキオスク端末1に送信し、キオスク端末1の正面モニタ12にオペレータの正面映像を表示させる(ST102)。
一方、アバター表示モードである場合には、正面カメラ24で撮影したオペレータの正面映像からオペレータの顔の特徴情報を抽出して、その特徴情報をキオスク端末1に送信し、キオスク端末1において、特徴情報からアバターの正面動画を生成させて、そのアバターの正面動画を正面モニタ12に表示させる(ST103)。
次に、字幕が有効である場合には(ST104でYes)、マイク29で収音したオペレータの音声を音声認識により文字情報に変換して、その文字情報をキオスク端末1に送信し、キオスク端末1において、文字情報に基づいて、字幕の画像、すなわち、オペレータが発話した音声の文字列の画像を生成させて、その字幕の画像をアバターの正面動画上に重畳して表示させる(ST105)。
また、帯情報が有効である場合には(ST106でYes)、図示しないサーバから天気予報などの案内情報を取得して、その案内情報をキオスク端末1に送信し、キオスク端末1において、案内情報を可視化した帯情報の画像を生成させて、その帯情報の画像をアバターの正面動画上に重畳して表示させる(ST107)。
次に、オペレータ端末2で行われるキオスク端末1の手元モニタ13に関する画面制御について説明する。図10は、手元モニタ13に関する画面制御の手順を示すフロー図である。
オペレータ端末2では、まず、キオスク端末1の手元モニタ13の表示モードを判定し(ST201)、オペレータ表示モードである場合には、手元カメラ25で撮影したオペレータの手元映像をキオスク端末1に送信して、キオスク端末1の手元モニタ13にオペレータの手元映像を表示させる(ST202)。
また、アバター表示モードである場合には、手元カメラ25で撮影したオペレータの手元映像から手の特徴情報を抽出して、その特徴情報をキオスク端末1に送信して、キオスク端末1において、特徴情報からアバターの手元動画を生成させて、そのアバターの手元動画を手元モニタ13に表示させる(ST203)。
また、操作画面モードである場合には、操作画面(メニュー画面など)を生成して、その操作画面をキオスク端末1に送信して、キオスク端末1の手元モニタ13に操作画面を表示させる(ST204)。
また、画面共有モードである場合には、アプリケーション画面を生成して、そのアプリケーション画面をキオスク端末1に送信して、キオスク端末1の手元モニタ13にアプリケーション画面を表示させる(ST205)。
このとき、オペレータ端末2では、オペレータによる手書きの操作情報が入力されると、その操作情報に基づいて、アプリケーション画面上に、オペレータの手書き画像を重畳する。また、ユーザによる手書きの操作情報をキオスク端末1から受信すると、その操作情報に基づいて、アプリケーション画面上に、ユーザの手書き画像を重畳する。
次に、キオスク端末1で行われる音声制御について説明する。図11は、音声制御の手順を示すフロー図である。
キオスク端末1では、まず、音声変換が有効であるか否かを判定する(ST301)。ここで、音声変換が有効である場合には(ST301でYes)、オペレータ端末2から受信したオペレータの原音声に対して音声変換を行い、音声変換された音声をスピーカー17から出力する(ST302)。
一方、音声変換が無効である場合には(ST301でNo)、オペレータ端末2から受信したオペレータの原音声をスピーカー17から出力する(ST303)。
なお、正面モニタ12の表示モードがアバター表示モードである場合には、音声変換が有効となり、オペレータ表示モードである場合には、音声変換が無効となる。また、アバター表示モードで字幕が有効となっている場合には、音声を出力しないようにしてもよい。また、字幕を設定する操作ボタン等を配置することで、表示モードの如何に関わらず、常時、字幕を有効にすることができ、聴覚の衰えや障害のあるユーザに対しても、各種の手続きなどを案内することができる。
以上のように、本出願において開示する技術の例示として、実施形態を説明した。しかしながら、本開示における技術は、これに限定されず、変更、置き換え、付加、省略などを行った実施形態にも適用できる。また、上記の実施形態で説明した各構成要素を組み合わせて、新たな実施形態とすることも可能である。
本発明に係る双方向映像通信システム及びキオスク端末は、ユーザが望むサービスの内容などの状況に応じて、キオスク端末でアバターがユーザに応対したりオペレータ本人がユーザに応対したりできる効果を有し、キオスク端末とオペレータ端末との間で、キオスク端末を操作するユーザの映像とオペレータ端末を操作するオペレータの映像とを双方向に通信する双方向映像通信システム、及びキオスク端末などとして有用である。
1 キオスク端末
2 オペレータ端末
12 正面モニタ
13 手元モニタ
14 正面カメラ
15 手元カメラ
17 スピーカー
18 マイク
22 第1モニタ
23 第2モニタ
24 正面カメラ
25 手元カメラ
26 ヘッドセット
28 スピーカー
29 マイク
31 制御部
32 通信部
33 記憶部
41 制御部
42 通信部
43 記憶部
61 オペレータの正面映像
62 オペレータの手元映像
65 アバターの正面動画
66 字幕
67 情報帯
68 アバターの手元動画

Claims (7)

  1. キオスク端末とオペレータ端末との間で、前記キオスク端末を操作するユーザの映像と前記オペレータ端末を操作するオペレータの映像とを双方向に通信する双方向映像通信システムであって、
    前記オペレータ端末は、
    前記キオスク端末と通信を行う通信部と、
    オペレータの顔を撮影するカメラと、
    オペレータが発話した音声を収音するマイクと、
    制御部と、
    を備え、
    前記キオスク端末は、
    前記オペレータ端末と通信を行う通信部と、
    前記カメラで撮影したオペレータの映像を表示するモニタと、
    前記マイクで収音したオペレータの原音声を出力するスピーカーと、
    制御部と、
    を備え、
    前記キオスク端末の前記制御部は、
    オペレータ表示モードにおいて、前記オペレータの映像を前記モニタに表示するとともに、前記オペレータの原音声を前記スピーカーから出力し、アバター表示モードにおいて、前記オペレータの映像から抽出された特徴情報に基づいて生成したアバターの動画を前記モニタに表示するとともに、前記オペレータの原音声をアバターに適合した声質に変換した変換音声を前記スピーカーから出力することを特徴とする双方向映像通信システム。
  2. 前記オペレータ端末の前記制御部は、
    前記オペレータの映像から特徴情報を抽出して、その特徴情報を前記通信部から前記キオスク端末に送信し、
    前記キオスク端末の前記制御部は、
    前記オペレータ端末から受信した前記特徴情報に基づいて前記アバターの動画を生成して前記モニタに表示することを特徴とする請求項1に記載の双方向映像通信システム。
  3. 前記オペレータ端末は、
    オペレータの顔を撮影する正面カメラと、
    オペレータの手元を撮影する手元カメラと、
    を備え、
    前記キオスク端末は、
    前記正面カメラで撮影したオペレータの正面映像を表示する正面モニタと、
    前記手元カメラで撮影したオペレータの手元映像を表示する手元モニタと、
    を備え、
    前記キオスク端末の前記制御部は、
    前記正面モニタに、前記オペレータの正面映像、およびアバターの正面動画のいずれかを表示し、前記手元モニタに、前記オペレータの手元映像、アバターの手元動画、および操作画面のいずれかを表示することを特徴とする請求項1または請求項2に記載の双方向映像通信システム。
  4. 前記キオスク端末の前記制御部は、
    前記アバターの正面動画を前記正面モニタに表示するとともに、前記オペレータの手元映像を前記手元モニタに表示することを特徴とする請求項3に記載の双方向映像通信システム。
  5. 前記オペレータ端末の前記制御部は、
    前記キオスク端末でのユーザの操作内容に応じて、前記オペレータ表示モードと前記アバター表示モードとを切り替えることを特徴とする請求項1から請求項4のいずれかに記載の双方向映像通信システム。
  6. 前記キオスク端末の前記制御部は、
    案内情報、オペレータの発話内容を表す文字情報、およびユーザとオペレータとで共有する共有情報の少なくとも1つを、前記モニタに表示することを特徴とする請求項1から請求項5のいずれかに記載の双方向映像通信システム。
  7. 自装置を操作するユーザの映像とオペレータ端末を操作するオペレータの映像とを、前記オペレータ端末との間で双方向に通信するキオスク端末であって、
    前記オペレータ端末と通信を行う通信部と、
    前記オペレータ端末のカメラで撮影したオペレータの映像を表示するモニタと、
    前記オペレータ端末のマイクで収音したオペレータの原音声を出力するスピーカーと、
    制御部と、
    を備え、
    前記制御部は、
    オペレータ表示モードにおいて、前記オペレータの映像を前記モニタに表示するとともに、前記オペレータの原音声を前記スピーカーから出力し、アバター表示モードにおいて、前記オペレータの映像から抽出された特徴情報に基づいて生成したアバターの動画を前記モニタに表示するとともに、前記オペレータの原音声をアバターに適合した声質に変換した変換音声を前記スピーカーから出力することを特徴とするキオスク端末。
JP2018032233A 2018-02-26 2018-02-26 双方向映像通信システム及びキオスク端末 Pending JP2019149630A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2018032233A JP2019149630A (ja) 2018-02-26 2018-02-26 双方向映像通信システム及びキオスク端末
PCT/JP2019/004508 WO2019163547A1 (ja) 2018-02-26 2019-02-07 双方向映像通信システム及びキオスク端末
GB2014244.4A GB2585779A (en) 2018-02-26 2019-02-07 Bidirectional video communication system and kiosk terminal
US16/975,608 US20200413009A1 (en) 2018-02-26 2019-02-07 Bidirectional video communication system and kiosk terminal
DE112019000991.5T DE112019000991T5 (de) 2018-02-26 2019-02-07 Bidirektionales video-kommunikationssystem und kiosk-endgerät

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018032233A JP2019149630A (ja) 2018-02-26 2018-02-26 双方向映像通信システム及びキオスク端末

Publications (1)

Publication Number Publication Date
JP2019149630A true JP2019149630A (ja) 2019-09-05

Family

ID=67686960

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018032233A Pending JP2019149630A (ja) 2018-02-26 2018-02-26 双方向映像通信システム及びキオスク端末

Country Status (5)

Country Link
US (1) US20200413009A1 (ja)
JP (1) JP2019149630A (ja)
DE (1) DE112019000991T5 (ja)
GB (1) GB2585779A (ja)
WO (1) WO2019163547A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021056940A (ja) * 2019-10-01 2021-04-08 エヌ・ティ・ティ・コミュニケーションズ株式会社 コミュニケーションシステム、応対端末装置およびそのプログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11652921B2 (en) * 2020-08-26 2023-05-16 Avaya Management L.P. Contact center of celebrities
US11076128B1 (en) * 2020-10-20 2021-07-27 Katmai Tech Holdings LLC Determining video stream quality based on relative position in a virtual space, and applications thereof
JP2024061694A (ja) * 2021-03-09 2024-05-08 ソニーグループ株式会社 情報処理装置、情報処理方法、およびプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002165194A (ja) * 2000-11-28 2002-06-07 Omron Corp 情報提供システム及び方法
JP2005051554A (ja) * 2003-07-29 2005-02-24 Mitsubishi Electric Corp 応答コールセンターシステムの顧客端末及びオペレータ端末
JP2010103704A (ja) * 2008-10-22 2010-05-06 Yamaha Corp 音声変換装置
WO2017163897A1 (ja) * 2016-03-25 2017-09-28 パナソニックIpマネジメント株式会社 情報表示システム及び情報提供端末

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002165194A (ja) * 2000-11-28 2002-06-07 Omron Corp 情報提供システム及び方法
JP2005051554A (ja) * 2003-07-29 2005-02-24 Mitsubishi Electric Corp 応答コールセンターシステムの顧客端末及びオペレータ端末
JP2010103704A (ja) * 2008-10-22 2010-05-06 Yamaha Corp 音声変換装置
WO2017163897A1 (ja) * 2016-03-25 2017-09-28 パナソニックIpマネジメント株式会社 情報表示システム及び情報提供端末

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021056940A (ja) * 2019-10-01 2021-04-08 エヌ・ティ・ティ・コミュニケーションズ株式会社 コミュニケーションシステム、応対端末装置およびそのプログラム
JP7411369B2 (ja) 2019-10-01 2024-01-11 エヌ・ティ・ティ・コミュニケーションズ株式会社 コミュニケーションシステム、応対端末装置およびそのプログラム

Also Published As

Publication number Publication date
US20200413009A1 (en) 2020-12-31
GB202014244D0 (en) 2020-10-28
WO2019163547A1 (ja) 2019-08-29
GB2585779A (en) 2021-01-20
DE112019000991T5 (de) 2020-12-03

Similar Documents

Publication Publication Date Title
WO2019163547A1 (ja) 双方向映像通信システム及びキオスク端末
US20070265949A1 (en) Method and system for video communication
JP7073116B2 (ja) オフィス用バーチャルリアリティシステム、及びオフィス用バーチャルリアリティプログラム
JP7153888B2 (ja) 双方向映像通信システム及びそのオペレータの管理方法
JPWO2004028162A1 (ja) 手話映像提示装置、手話映像入出力装置、および手話通訳システム
US20060125914A1 (en) Video input for conversation with sing language, video i/o device for conversation with sign language, and sign language interpretation system
JP2012160793A (ja) テレビ会議システム及びテレビ会議用装置並びにプログラム
JP2020136921A (ja) ビデオ通話システム、およびコンピュータプログラム
WO2019163544A1 (ja) 双方向映像通信システム及びオペレータ端末
JP2003092628A (ja) 電話リレーサービス方法
JP2001211437A (ja) マルチメディアctiシステム
WO2019163546A1 (ja) 双方向映像通信システム及び通信制御装置
JP3074679B2 (ja) 双方向対話型システム
WO2019163545A1 (ja) オペレータ端末及びキャリブレーション方法
JP2003264636A (ja) コールセンタシステムおよび相談システム
JPH09327006A (ja) 双方向対話型システム
JP7390670B2 (ja) 共同玄関子機、共同玄関子機の画像出力方法、及びプログラム
KR20170064730A (ko) Vr 기기를 활용한 가상 고객 서비스 방법 및 시스템
JP2015100061A (ja) 遠隔受付システム、遠隔受付方法及びプログラム
WO2022130798A1 (ja) 表示装置、表示制御方法、およびプログラム
TW201002036A (en) Mobile phone for deaf-mute person
Zimmermann et al. Internet Based Personal Services on Demand
JPH08265449A (ja) テレビ対話システム
Ponsard et al. Video relay service for signing deaf-lessons learnt from a pilot study
JPH10290789A (ja) 双方向対話型システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200806

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210629

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220105