JP2020160108A - エージェント装置、エージェント装置の制御方法、およびプログラム - Google Patents

エージェント装置、エージェント装置の制御方法、およびプログラム Download PDF

Info

Publication number
JP2020160108A
JP2020160108A JP2019055984A JP2019055984A JP2020160108A JP 2020160108 A JP2020160108 A JP 2020160108A JP 2019055984 A JP2019055984 A JP 2019055984A JP 2019055984 A JP2019055984 A JP 2019055984A JP 2020160108 A JP2020160108 A JP 2020160108A
Authority
JP
Japan
Prior art keywords
agent
unit
occupant
service
agent function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019055984A
Other languages
English (en)
Other versions
JP7274901B2 (ja
Inventor
賢吾 内木
Kengo Uchiki
賢吾 内木
基嗣 久保田
Mototsugu Kubota
基嗣 久保田
佐和子 古屋
Sawako Furuya
佐和子 古屋
善史 我妻
Yoshifumi Wagatsuma
善史 我妻
俊克 倉持
Toshikatsu Kuramochi
俊克 倉持
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2019055984A priority Critical patent/JP7274901B2/ja
Priority to CN202010198716.2A priority patent/CN111739524B/zh
Priority to US16/826,490 priority patent/US11355114B2/en
Publication of JP2020160108A publication Critical patent/JP2020160108A/ja
Application granted granted Critical
Publication of JP7274901B2 publication Critical patent/JP7274901B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • H04W4/40Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/80Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/02Terminal devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Instructional Devices (AREA)

Abstract

【課題】より適切な応答結果を提供することができるエージェント装置、エージェント装置の制御方法、およびプログラムを提供すること。【解決手段】エージェント装置は、それぞれが車両の乗員の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、乗員の発話内容に対して前記複数のエージェント機能部のそれぞれが実行したサービスの品質の履歴を示す履歴情報を参照し、前記車両の乗員の発話に対して応答するエージェント機能部を、前記複数のエージェント機能部から選択する選択部と、を備える。【選択図】図2

Description

本発明は、エージェント装置、エージェント装置の制御方法、およびプログラムに関する。
従来、車両の乗員と対話を行いながら、乗員の要求に応じた運転支援に関する情報や車両の制御、その他のアプリケーション等を提供するエージェント機能に関する技術が開示されている(例えば、特許文献1参照)。
特開2006−335231号公報
近年では、複数のエージェント機能を車両に搭載することについて実用化が進められているが、複数のエージェントを用いた場合であっても、乗員が一つのエージェントを呼び出して要求を伝える必要がある。そのため、乗員は、エージェントごとの特徴を把握していないと、要求に対する処理を実行させるのに最適なエージェントを呼び出すことができず、適切な結果が得られない場合があった。
本発明は、このような事情を考慮してなされたものであり、より適切な応答結果を提供することができるエージェント装置、エージェント装置の制御方法、およびプログラムを提供することを目的の一つとする。
この発明に係るエージェント装置、エージェント装置の制御方法、およびプログラムは、以下の構成を採用した。
(1):この発明の一態様に係るエージェント装置は、それぞれが車両の乗員の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、乗員の発話内容に対して前記複数のエージェント機能部のそれぞれが実行したサービスの品質の履歴を示す履歴情報を参照し、前記車両の乗員の発話に対して応答するエージェント機能部を、前記複数のエージェント機能部から選択する選択部と、を備える、エージェント装置である。
(2):上記(1)の態様において、前記履歴情報には、実行されたサービスの内容、提供元のエージェント機能部、及びサービスの品質を示す情報を含むレコードが含まれ、前記選択部は、前記乗員の発話を示す情報と実行されたサービスが合致するレコードの中で、前記サービスの品質が良いレコードに対応する前記エージェント機能部を、前記車両の乗員の発話に対して応答するエージェント機能部として選択するものである。
(3):上記(1)又は(2)の態様において、エージェント装置は、出力部を用いて前記乗員に各種情報を通知する通知制御部を更に備え、前記選択部は、前記履歴情報に基づいて、ある発話に対してサービスを提供する前記エージェント機能部を動的に選択する状態から固定的に選択する状態に移行し、前記通知制御部は、前記選択部が固定的に選択すると確定した前記エージェント機能部に関して、前記出力部を用いて前記乗員に通知するものである。
(4):上記(3)の態様において前記通知制御部は、前記乗員の発話と、前記サービスの提供との間に、前記選択部が固定的に選択すると確定した前記エージェント機能部に関して、前記出力部を用いて前記乗員に通知するものである。
(5):上記(3)又は(4)の態様において、前記通知制御部は、前記サービスの提供の後に、前記選択部が固定的に選択すると確定した前記エージェント機能部に関して、前記出力部を用いて前記乗員に通知するものである。
(6):上記(3)〜(5)のうち何れか1つの態様において、前記複数のエージェント機能部には、起動に用いられるフレーズがそれぞれ設定され、前記選択部は、前記乗員の発話に前記フレーズが含まれていても、前記乗員の発話のうちフレーズ以外の部分が要求するサービスを提供する前記エージェント機能部が確定している場合、当該確定している前記エージェント機能部を、前記車両の乗員の発話に対して応答するエージェント機能部として選択するものである。
(7):上記(1)〜(5)のうち何れか1つの態様において、前記複数のエージェント機能部には、起動に用いられるフレーズがそれぞれ設定され、前記選択部は、前記乗員の発話に前記フレーズが含まれていない場合に、前記エージェント機能部を選択するものである。
(8):本発明の他の態様に係るエージェント装置の制御方法は、コンピュータが、それぞれが車両の乗員の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部を起動し、乗員の発話内容に対して前記複数のエージェント機能部のそれぞれが実行したサービスの品質の履歴を示す履歴情報を参照し、前記車両の乗員の発話に対して応答するエージェント機能部を、前記複数のエージェント機能部から選択するものである。
(9):本発明の他の態様に係るプログラムは、コンピュータに、それぞれが車両の乗員の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部を起動させ、乗員の発話内容に対して前記複数のエージェント機能部のそれぞれが実行したサービスの品質の履歴を示す履歴情報を参照させ、前記車両の乗員の発話に対して応答するエージェント機能部を、前記複数のエージェント機能部から選択させるものである。
上記(1)〜(9)の態様によれば、より適切な応答結果を提供することができる。
第1実施形態に係るエージェント装置100を含むエージェントシステム1の構成図である。 第1実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。 表示・操作装置20およびスピーカユニット30の配置例を示す図である。 スピーカユニット30の配置例を示す図である。 エージェントサーバ200の構成と、エージェント装置100の構成の一部とを示す図である。 履歴情報164の内容の一例を示す図である。 履歴情報生成部124が応答時間、及び情報量の評価指標を取得する処理を概念的に示す図である。 履歴情報生成部124が確信度の評価指標を取得する処理を概念的に示す図である。 第1実施形態に係るエージェント装置100の動作の一連の流れを示すフローチャートである。 第2実施形態に係るエージェント装置100Aの構成と、車両Mに搭載された機器とを示す図である。 確定エージェント情報166の内容の一例を示す図である。 乗員の発話とサービスの提供との間に、確定したエージェントを紹介する対話の一例を示す図である。 サービスの提供後に、確定したエージェントを紹介する対話の一例を示す図である。 選択部126が確定エージェント情報166を生成する処理の一連の流れを示すフローチャートである。 第2実施形態に係るエージェント装置100Aの動作の一連の流れを示すフローチャートである。
以下、図面を参照し、本発明のエージェント装置、エージェント装置の制御方法、およびプログラムの実施形態について説明する。エージェント装置は、エージェントシステムの一部または全部を実現する装置である。以下では、エージェント装置の一例として、車両(以下、車両M)に搭載され、複数種類のエージェント機能を備えたエージェント装置について説明する。エージェント機能とは、例えば、車両Mの乗員と対話をしながら、乗員の発話の中に含まれる要求(コマンド)に基づく各種の情報提供を行ったり、ネットワークサービスを仲介したりする機能である。複数種類のエージェントは、それぞれに果たす機能、処理手順、制御、出力態様・内容がそれぞれ異なってもよい。また、エージェント機能の中には、車両内の機器(例えば運転制御や車体制御に関わる機器)の制御等を行う機能を有するものがあってよい。
エージェント機能は、例えば、乗員の音声を認識する音声認識機能(音声をテキスト化する機能)に加え、自然言語処理機能(テキストの構造や意味を理解する機能)、対話管理機能、ネットワークを介して他装置を検索し、或いは自装置が保有する所定のデータベースを検索するネットワーク検索機能等を統合的に利用して実現される。これらの機能の一部または全部は、AI(Artificial Intelligence)技術によって実現されてよい。また、これらの機能を行うための構成の一部(特に、音声認識機能や自然言語処理解釈機能)は、車両Mの車載通信装置または車両Mに持ち込まれた汎用通信装置と通信可能なエージェントサーバ(外部装置)に搭載されてもよい。以下の説明では、構成の一部がエージェントサーバに搭載されており、エージェント装置とエージェントサーバが協働してエージェントシステムを実現することを前提とする。また、エージェント装置とエージェントサーバが協働して仮想的に出現させるサービス提供主体(サービス・エンティティ)をエージェントと称する。
<第1実施形態>
<全体構成>
図1は、第1実施形態に係るエージェント装置100を含むエージェントシステム1の構成図である。エージェントシステム1は、例えば、エージェント装置100と、複数のエージェントサーバ200−1、200−2、200−3、…とを備える。符号の末尾のハイフン以下数字は、エージェントを区別するための識別子であるものとする。何れのエージェントサーバであるかを区別しない場合、単にエージェントサーバ200と称する場合がある。図1では3つのエージェントサーバ200を示しているが、エージェントサーバ200の数は2つであってもよいし、4つ以上であってもよい。それぞれのエージェントサーバ200は、例えば、互いに異なるエージェントシステムの提供者が運営するものである。したがって、本実施形態におけるエージェントは、互いに異なる提供者により実現されるエージェントである。提供者としては、例えば、自動車メーカー、ネットワークサービス事業者、電子商取引事業者、携帯端末の販売者や製造者が挙げられ、任意の主体(法人、団体、個人等)がエージェントシステムの提供者となり得る。
エージェント装置100は、ネットワークNWを介してエージェントサーバ200と通信する。ネットワークNWは、例えば、インターネット、セルラー網、Wi−Fi網、WAN(Wide Area Network)、LAN(Local Area Network)、公衆回線、電話回線、無線基地局等のうち一部または全部を含む。ネットワークNWには、各種ウェブサーバ300が接続されており、エージェントサーバ200またはエージェント装置100は、ネットワークNWを介して各種ウェブサーバ300からウェブページを取得することができる。
エージェント装置100は、車両Mの乗員と対話を行い、乗員からの音声をエージェントサーバ200に送信し、エージェントサーバ200から得られた回答を、音声出力や画像表示の形で乗員に提示する。
<第1実施形態>
[車両]
図2は、第1実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。車両Mには、例えば、一以上のマイク10と、表示・操作装置20と、スピーカユニット30と、ナビゲーション装置40と、車両機器50と、車載通信装置60と、乗員認識装置80と、エージェント装置100とが搭載される。また、スマートフォン等の汎用通信装置70が車室内に持ち込まれ、通信装置として使用される場合がある。これらの装置は、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。なお、図2に示す構成はあくまで一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。
マイク10は、車室内で発せられた音を収集する収音部である。表示・操作装置20は、画像を表示すると共に、入力操作を受付可能な装置(或いは装置群)である。表示・操作装置20は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。表示・操作装置20は、更に、HUD(Head Up Display)や機械式の入力装置を含んでもよい。スピーカユニット30は、例えば、車室内の互いに異なる位置に配設された複数のスピーカ(音出力部)を含む。表示・操作装置20は、エージェント装置100とナビゲーション装置40とで共用されてもよい。これらの詳細については後述する。
ナビゲーション装置40は、ナビHMI(Human Machine Interface)と、GPS(Global Positioning System)等の位置測位装置と、地図情報を記憶した記憶装置と、経路探索等を行う制御装置(ナビゲーションコントローラ)とを備える。マイク10、表示・操作装置20、およびスピーカユニット30のうち一部または全部がナビHMIとして用いられてもよい。ナビゲーション装置40は、位置測位装置によって特定された車両Mの位置から、乗員によって入力された目的地まで移動するための経路(ナビ経路)を探索し、経路に沿って車両Mが走行できるように、ナビHMIを用いて案内情報を出力する。経路探索機能は、ネットワークNWを介してアクセス可能なナビゲーションサーバにあってもよい。この場合、ナビゲーション装置40は、ナビゲーションサーバから経路を取得して案内情報を出力する。なお、エージェント装置100は、ナビゲーションコントローラを基盤として構築されてもよく、その場合、ナビゲーションコントローラとエージェント装置100は、ハードウェア上は一体に構成される。
車両機器50は、例えば、エンジンや走行用モータ等の駆動力出力装置、エンジンの始動モータ、ドアロック装置、ドア開閉装置、窓、窓の開閉装置及び窓の開閉制御装置、シート、シート位置の制御装置、ルームミラー及びその角度位置制御装置、車両内外の照明装置及びその制御装置、ワイパーやデフォッガー及びそれぞれの制御装置、方向指示灯及びその制御装置、空調装置、走行距離やタイヤの空気圧の情報や燃料の残量情報などの車両情報装置などを含む。
車載通信装置60は、例えば、セルラー網やWi−Fi網を利用してネットワークNWにアクセス可能な無線通信装置である。
乗員認識装置80は、例えば、着座センサ、車室内カメラ、画像認識装置等を含む。着座センサは座席の下部に設けられた圧力センサ、シートベルトに取り付けられた張力センサ等を含む。車室内カメラは、車室内に設けられたCCD(Charge Coupled Device)カメラやCMOS(Complementary Metal Oxide Semiconductor)カメラである。画像認識装置は、車室内カメラの画像を解析し、座席ごとの乗員の有無、顔向き等を認識する。
図3は、表示・操作装置20およびスピーカユニット30の配置例を示す図である。表示・操作装置20は、例えば、第1ディスプレイ22と、第2ディスプレイ24と、操作スイッチASSY26とを含む。表示・操作装置20は、更に、HUD28を含んでもよい。また、表示・操作装置20は、更に、インストルメントパネルのうち運転席DSに対面する部分に設けられるメーターディスプレイ29を含んでもよい。第1ディスプレイ22と、第2ディスプレイ24と、HUD28と、メーターディスプレイ29とを合わせたものが「表示部」の一例である。
車両Mには、例えば、ステアリングホイールSWが設けられた運転席DSと、運転席DSに対して車幅方向(図中Y方向)に設けられた助手席ASとが存在する。第1ディスプレイ22は、インストルメントパネルにおける運転席DSと助手席ASとの中間辺りから、助手席ASの左端部に対向する位置まで延在する横長形状のディスプレイ装置である。第2ディスプレイ24は、運転席DSと助手席ASとの車幅方向に関する中間あたり、且つ第1ディスプレイの下方に設置されている。例えば、第1ディスプレイ22と第2ディスプレイ24は、共にタッチパネルとして構成され、表示部としてLCD(Liquid Crystal Display)や有機EL(Electroluminescence)、プラズマディスプレイ等を備えるものである。操作スイッチASSY26は、ダイヤルスイッチやボタン式スイッチ等が集積されたものである。表示・操作装置20は、乗員によってなされた操作の内容をエージェント装置100に出力する。第1ディスプレイ22または第2ディスプレイ24が表示する内容は、エージェント装置100によって決定されてよい。
図4は、スピーカユニット30の配置例を示す図である。スピーカユニット30は、例えば、スピーカ30A〜30Fを含む。スピーカ30Aは、運転席DS側の窓柱(いわゆるAピラー)に設置されている。スピーカ30Bは、運転席DSに近いドアの下部に設置されている。スピーカ30Cは、助手席AS側の窓柱に設置されている。スピーカ30Dは、助手席ASに近いドアの下部に設置されている。スピーカ30Eは、第2ディスプレイ24の近傍に設置されている。スピーカ30Fは、車室の天井(ルーフ)に設置されている。また、スピーカユニット30は、右側後部座席や左側後部座席に近いドアの下部に設置されてもよい。
係る配置において、例えば、専らスピーカ30Aおよび30Bに音を出力させた場合、音像は運転席DS付近に定位することになる。「音像が定位する」とは、例えば、乗員の左右の耳に伝達される音の大きさを調節することにより、乗員が感じる音源の空間的な位置を定めることである。また、専らスピーカ30Cおよび30Dに音を出力させた場合、音像は助手席AS付近に定位することになる。また、専らスピーカ30Eに音を出力させた場合、音像は車室の前方付近に定位することになり、専らスピーカ30Fに音を出力させた場合、音像は車室の上方付近に定位することになる。これに限らず、スピーカユニット30は、ミキサーやアンプを用いて各スピーカの出力する音の配分を調整することで、車室内の任意の位置に音像を定位させることができる。
[エージェント装置]
図2に戻り、エージェント装置100は、管理部110と、エージェント機能部150−1、150−2、150−3と、ペアリングアプリ実行部152とを備える。管理部110は、例えば、音響処理部112と、エージェントごとWU(Wake Up)判定部114と、表示制御部116と、音声制御部118と、音声認識部120と、自然言語処理部122と、履歴情報生成部124と、選択部126とを備える。何れのエージェント機能部であるか区別しない場合、単にエージェント機能部150と称する。3つのエージェント機能部150を示しているのは、図1におけるエージェントサーバ200の数に対応させた一例に過ぎず、エージェント機能部150の数は、2つであってもよいし、4つ以上であってもよい。図2に示すソフトウェア配置は説明のために簡易に示しており、実際には、例えば、エージェント機能部150と車載通信装置60の間に管理部110が介在してもよいように、任意に改変することができる。
エージェント装置100の各構成要素は、例えば、CPU(Central Processing Unit)等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。
エージェント装置100は、記憶部160を備える。記憶部160は、上記の各種記憶装置により実現される。記憶部160には、例えば、辞書DB(データベース)162と、及び履歴情報164等のデータやプログラムが格納される。辞書DB162、及び履歴情報164の詳細については、後述する。
管理部110は、OS(Operating System)やミドルウェア等のプログラムが実行されることで機能する。
管理部110の音響処理部112は、マイク10から収集される音を受け付け、受け付けた音に対して、自然言語処理部122で音の認識をするのに適した状態となるように音響処理を行う。音響処理とは、例えば、バンドパスフィルタ等のフィルタリングによるノイズ除去や音の増幅等である。
エージェントごとWU判定部114は、エージェント機能部150−1、150−2、150−3のそれぞれに対応して存在し、エージェントごとに予め定められているウエイクアップワードを認識する。エージェントごとWU判定部114は、音響処理が行われた音声(音声ストリーム)から音声の意味を認識する。まず、エージェントごとWU判定部114は、音声ストリームにおける音声波形の振幅と零交差に基づいて音声区間を検出する。エージェントごとWU判定部114は、混合ガウス分布モデル(GMM;Gaussian mixture model) に基づくフレーム単位の音声識別および非音声識別に基づく区間検出を行ってもよい。
次に、エージェントごとWU判定部114は、検出した音声区間における音声をテキスト化し、文字情報とする。そして、エージェントごとWU判定部114は、テキスト化した文字情報がウエイクアップワード(フレーズ)に該当するか否かを判定する。ウエイクアップワードであると判定した場合。エージェントごとWU判定部114は、対応するエージェント機能部150を示す情報を選択部に通知する。なお、エージェントごとWU判定部114に相当する機能がエージェントサーバ200に搭載されてもよい。この場合、管理部110は、音声認識部120によって音響処理が行われた音声ストリームをエージェントサーバ200に送信し、エージェントサーバ200がウエイクアップワードであると判定した場合、エージェントサーバ200からの指示に従ってエージェント機能部150が起動する。なお、各エージェント機能部150は、常時起動しており且つウエイクアップワードの判定を自ら行うものであってよい。この場合、管理部110がエージェントごとWU判定部114を備える必要はない。
表示制御部116は、選択部126またはエージェント機能部150からの指示に応じて表示部の少なくとも一部の領域に画像を表示させる。以下では、エージェントに関する画像を第1ディスプレイ22に表示させるものとして説明する。表示制御部116は、選択部126またはエージェント機能部150の制御により、例えば、車室内で乗員とのコミュニケーションを行う擬人化されたエージェントの画像(以下、エージェント画像と称する)を生成し、生成したエージェント画像を第1ディスプレイ22に表示させる。エージェント画像は、例えば、乗員に対して話しかける態様の画像である。エージェント画像は、例えば、少なくとも観者(乗員)によって表情や顔向きが認識される程度の顔画像を含んでよい。例えば、エージェント画像は、顔領域の中に目や鼻に擬したパーツが表されており、顔領域の中のパーツの位置に基づいて表情や顔向きが認識されるものであってよい。また、エージェント画像は、立体的に感じられ、観者によって三次元空間における頭部画像を含むことでエージェントの顔向きが認識されたり、本体(胴体や手足)の画像を含むことで、エージェントの動作や振る舞い、姿勢等が認識されるものであってもよい。また、エージェント画像は、アニメーション画像であってもよい。例えば、表示制御部116は、乗員認識装置80により認識された乗員の位置に近い表示領域にエージェント画像を表示させたり、乗員の位置に顔を向けたエージェント画像を生成して表示させてもよい。
音声制御部118は、選択部126またはエージェント機能部150からの指示に応じて、スピーカユニット30に含まれるスピーカのうち一部または全部に音声を出力させる。音声制御部118は、複数のスピーカユニット30を用いて、エージェント画像の表示位置に対応する位置にエージェント音声の音像を定位させる制御を行ってもよい。エージェント画像の表示位置に対応する位置とは、例えば、エージェント画像がエージェント音声を喋っていると乗員が感じると予測される位置であり、具体的には、エージェント画像の表示位置付近(例えば、2〜3[cm]以内)の位置である。
音声認識部120は、音響処理が行われた音声(音声ストリーム)から音声の意味を認識する。まず、音声認識部120は、音声ストリームにおける音声波形の振幅と零交差に基づいて音声区間を検出する。また、音声認識部120は、混合ガウス分布モデル(GMM;Gaussian mixture model) に基づくフレーム単位の音声識別および非音声識別に基づく区間検出を行ってもよい。次に、音声認識部120は、検出した音声区間における音声をテキスト化し、テキスト化された文字情報を自然言語処理部122に出力する。
自然言語処理部122は、音声認識部120から入力された文字情報に対して辞書DB162を参照しながら意味解釈を行う。辞書DB162は、文字情報に対して抽象化された意味情報が対応付けられたものである。辞書DB162は、同義語や類義語の一覧情報を含んでもよい。音声認識部120の処理と、自然言語処理部122の処理とは、段階が明確に分かれるものではなく、自然言語処理部122の処理結果を受けて音声認識部120が認識結果を修正する等、相互に影響し合って行われてよい。
自然言語処理部122は、例えば、認識結果として、「今日の天気は」、「天気はどうですか」等の意味(要求)が認識された場合、標準文字情報「今日の天気」に置き換えたコマンドを生成する。コマンドとは、例えば、エージェント機能部150−1〜150−3のそれぞれが備える機能を実行させるための命令である。これにより、リクエストの音声に文字揺らぎがあった場合にも要求にあった対話をし易くすることができる。また、自然言語処理部122は、例えば、確率を利用した機械学習処理等の人工知能処理を用いて文字情報の意味を認識したり、認識結果に基づくコマンドを生成してもよい。また、それぞれのエージェント機能部150で機能を実行させるためのコマンドのフォーマットやパラメータが異なる場合、自然言語処理部122は、エージェント機能部150ごとに認識可能なコマンドを生成してもよい。
自然言語処理部122は、生成したコマンドを、エージェント機能部150−1〜150−3に出力する。また、音声認識部120は、エージェント機能部150−1〜150−3のうち、音声ストリームの入力が必要であるエージェント機能部については、音声コマンドに加えて音声ストリームを出力してもよい。
履歴情報生成部124は、エージェント機能部150がコマンドをエージェントサーバ200に送信し、エージェントサーバ200から応答結果を取得するまでの処理に係る情報に基づいて、履歴情報164を生成する。履歴情報生成部124の処理の詳細については、後述する。
選択部126は、エージェントごとWU判定部114によってウエイクアップワードが認識されたエージェント機能部150を、乗員の発話に対する応答を行うエージェント機能部150として選択する。また、選択部126は、エージェントごとWU判定部114によってウエイクアップワードが認識されなかった場合には、履歴情報164を参照し、自然言語処理部122によって特定された機能を実現する(つまり、乗員の発話に対応する)エージェント機能部150を選択する。選択部126がエージェント機能部150を選択する処理の詳細については、後述する。選択部126は、選択したエージェント機能部150に音声ストリームを送信し、エージェント機能部150を起動させる。
エージェント機能部150は、対応するエージェントサーバ200と協働してエージェントを出現させ、車両の乗員の発話に応じて、音声による応答を含むサービスを提供する。エージェント機能部150には、車両機器50を制御する権限が付与されたものが含まれてよい。また、エージェント機能部150には、ペアリングアプリ実行部152を介して汎用通信装置70と連携し、エージェントサーバ200と通信するものがあってよい。例えば、エージェント機能部150−1には、車両機器50を制御する権限が付与されている。エージェント機能部150−1は、車載通信装置60を介してエージェントサーバ200−1と通信する。エージェント機能部150−2は、車載通信装置60を介してエージェントサーバ200−2と通信する。エージェント機能部150−3は、ペアリングアプリ実行部152を介して汎用通信装置70と連携し、エージェントサーバ200−3と通信する。
ペアリングアプリ実行部152は、例えば、Bluetooth(登録商標)によって汎用通信装置70とペアリングを行い、エージェント機能部150−3と汎用通信装置70とを接続させる。なお、エージェント機能部150−3は、USB(Universal Serial Bus)等を利用した有線通信によって汎用通信装置70に接続されるようにしてもよい。以下、エージェント機能部150−1とエージェントサーバ200−1が協働して出現させるエージェントをエージェント1、エージェント機能部150−2とエージェントサーバ200−2が協働して出現させるエージェントをエージェント2、エージェント機能部150−3とエージェントサーバ200−3が協働して出現させるエージェントをエージェント3と称する場合がある。エージェント機能部150−1〜150−3のそれぞれは、管理部110から入力された音声コマンドに基づく処理を実行し、実行結果を管理部110に出力する。
[エージェントサーバ]
図5は、エージェントサーバ200の構成と、エージェント装置100の構成の一部とを示す図である。以下、エージェントサーバ200の構成と共にエージェント機能部150等の動作について説明する。ここでは、エージェント装置100からネットワークNWまでの物理的な通信についての説明を省略する。また、以下では、主にエージェント機能部150−1およびエージェントサーバ200−1を中心として説明するが、他のエージェント機能部やエージェントサーバの組についても、それぞれの詳細な機能が異なる場合はあるものの、ほぼ同様の動作を行う。
エージェントサーバ200−1は、通信部210を備える。通信部210は、例えば、NIC(Network Interface Card)等のネットワークインターフェースである。更に、エージェントサーバ200−1は、例えば、対話管理部220と、ネットワーク検索部222と、応答文生成部224とを備える。これらの構成要素は、例えば、CPU等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPU等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDDやフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。
エージェントサーバ200は、記憶部250を備える。記憶部250は、上記の各種記憶装置により実現される。記憶部250には、例えば、パーソナルプロファイル252、知識ベースDB254、応答規則DB256等のデータやプログラムが格納される。
エージェント装置100において、エージェント機能部150−1は、コマンド(或いは圧縮や符号化等の処理を行ったコマンド)を、エージェントサーバ200−1に送信する。エージェント機能部150−1は、ローカル処理(エージェントサーバ200−1を介さない処理)が可能なコマンドを認識した場合は、コマンドで要求された処理を実行してもよい。ローカル処理が可能なコマンドとは、例えば、エージェント装置100が備える記憶部160を参照することで回答可能なコマンドである。より具体的には、ローカル処理が可能なコマンドとは、例えば、電話帳から特定者の名前を検索し、合致した名前に対応付けられた電話番号に電話をかける(相手を呼び出す)コマンドである。したがって、エージェント機能部150−1は、エージェントサーバ200−1が備える機能の一部を有してもよい。
対話管理部220は、入力されたコマンドに基づいて、パーソナルプロファイル252や知識ベースDB254、応答規則DB256を参照しながら車両Mの乗員に対する応答内容(例えば、乗員への発話内容や出力する画像)を決定する。パーソナルプロファイル252は、乗員ごとに保存されている乗員の個人情報、趣味嗜好、過去の対話の履歴等を含む。知識ベースDB254は、物事の関係性を規定した情報である。応答規則DB256は、コマンドに対してエージェントが行うべき動作(回答や機器制御の内容等)を規定した情報である。
また、対話管理部220は、音声ストリームから得られる特徴情報を用いて、パーソナルプロファイル252と照合を行うことで、乗員を特定してもよい。この場合、パーソナルプロファイル252には、例えば、音声の特徴情報に、個人情報が対応付けられている。音声の特徴情報とは、例えば、声の高さ、イントネーション、リズム(音の高低のパターン)等の喋り方の特徴や、メル周波数ケプストラム係数(Mel Frequency Cepstrum Coefficients)等による特徴量に関する情報である。音声の特徴情報は、例えば、乗員の初期登録時に所定の単語や文章等を乗員に発声させ、発声させた音声を認識することで得られる情報である。
対話管理部220は、コマンドが、ネットワークNWを介して検索可能な情報を要求するものである場合、ネットワーク検索部222に検索を行わせる。ネットワーク検索部222は、ネットワークNWを介して各種ウェブサーバ300にアクセスし、所望の情報を取得する。「ネットワークNWを介して検索可能な情報」とは、例えば、車両Mの周辺にあるレストランの一般ユーザによる評価結果であったり、その日の車両Mの位置に応じた天気予報であったりする。
応答文生成部224は、対話管理部220により決定された発話の内容が車両Mの乗員に伝わるように、応答文を生成し、エージェント装置100に送信する。また、応答文生成部224は、乗員認識装置80による認識結果をエージェント装置100から取得し、取得した認識結果によりコマンドを含む発話を行った乗員がパーソナルプロファイル252に登録された乗員であることが特定されている場合に、乗員の名前を呼んだり、乗員の話し方に似せた話し方にした応答文を生成してもよい。
エージェント機能部150は、応答文を取得すると、音声合成を行って音声を出力するように音声制御部118に指示する。また、エージェント機能部150は、音声出力に合わせてエージェント画像を表示するように表示制御部116に指示する。このようにして、仮想的に出現したエージェントが車両Mの乗員に応答するエージェント機能が実現される。
[履歴情報生成部124の処理について]
以下、履歴情報生成部124が履歴情報164を生成する処理の詳細について説明する。図6は、履歴情報164の内容の一例を示す図である。履歴情報164には、例えば、エージェントが提供可能なサービス(つまり、実行可能な機能)と、当該サービスの品質を示す情報とが、サービスの提供元のエージェント毎にそれぞれ対応付けられたレコードRが含まれるである。サービスの品質には、例えば、コマンドをエージェントサーバ200に送信してから回答が得られるまでに係る時間の程度(以下、応答時間)と、乗員の問合せに対してエージェントサーバ200から得られた回答の情報量と、当該回答の確信度とが含まれる。確信度とは、例えば、コマンドに対する応答結果が、正しい答えであると推定される度合(指標値)である。また、確信度とは、乗員の発話に対する応答が、乗員の要求に合致している、または乗員が期待していた答えであると推定される度合である。なお、サービスの品質を示す情報は、一例であってこれに限らず、上述した以外の情報が含まれてもよい。
以下、履歴情報164のサービスの品質が、それぞれ3段階の評価指標で示される場合を一例に説明する。この一例において、応答時間は、「短い」、「普通」、及び「長い」のいずれかによって示され、情報量は、「多い」、「普通」、及び「少ない」のいずれかによって示され、確信度は、「高い」、「普通」、及び「低い」いずれかによって示される。なお、サービスの品質は、2段階の評価指標によって示されてもよく、4段階以上の評価指標によって示されてもよく、無段階の値によって示されてもよい。
図6に示す履歴情報164において、エージェント1〜3は、それぞれが「地図検索機能」、「天気予報機能」、及び「情報検索機能」を実行可能である。また、図6に示す履歴情報164において、エージェント1が実行可能な機能には、いずれも、応答時間が「短い」ことを示す情報と、情報量が「多い」ことを示す情報と、確信度が「高い」ことを示す情報とが対応付けられる。エージェント2が実行可能な機能には、いずれも、応答時間が「普通」であることを示す情報と、情報量が「普通」であることを示す情報と、確信度が「普通」であることを示す情報とが対応付けられる。また、エージェント2は、「天気予報機能」が用いられたことがないため、エージェント2の「天気予報機能」には、サービスの品質を示す情報が対応付けられていない。エージェント3が実行可能な機能には、いずれも、応答時間が「長い」ことを示す情報と、情報量が「少ない」ことを示す情報と、確信度が「低い」ことを示す情報とが対応付けられる。また、エージェント3は、「天気予報機能」が用いられたことがないため、エージェント2の「情報検索機能」には、サービスの品質を示す情報が対応付けられていない。
まず、履歴情報生成部124は、履歴情報164を生成するに際して、エージェント機能部150−1〜150−3のそれぞれが、自然言語処理部122により認識されたサービスに係るコマンドをエージェントサーバ200−1〜200−3に出力し、コマンドが出力されてから、エージェントサーバ200−1〜200−3から応答結果A〜Cを取得するまでの応答時間をそれぞれカウントする。そして、履歴情報生成部124は、応答時間に係る所定のしきい値に基づいて、カウントした応答時間を「短い」、「普通」、及び「長い」のうち、いずれかに分類し、分類した情報を、履歴情報164の当該コマンドによって提供されるサービスにそれぞれ対応付ける。
なお、履歴情報生成部124は、エージェント機能部150−1〜150−3の各応答時間のカウントを、同一のタイミングで行ってもよく、異なるタイミングによって行ってもよい。同一のコマンドについて応答時間をカウントする場合、履歴情報生成部124は、自然言語処理部122が、乗員の発話に基づいてコマンドを生成し、生成したコマンドをエージェント機能部150−1〜150−3の全てに同時に出力した際の応答時間を、それぞれカウントする。この場合、コマンドの出力タイミングが一致するため、各応答時間のカウントのスタートタイミングを統一でき、履歴情報生成部124は、カウントに係る処理負荷を低減することができる。異なるコマンドについて応答時間をカウントする場合、履歴情報生成部124は、自然言語処理部122が、乗員の発話に基づいてコマンドを生成し、生成したコマンドをエージェント機能部150−1〜150−3のいずれか(例えば、ウエイクアップワードで指定されたエージェントに対応するエージェント機能部150)に出力した際の応答時間をカウントする。この場合、あるコマンドに対する応答結果を一意に取得することができるため、選択部126は、複数の応答結果から乗員に提供する応答結果を選択する処理、又は複数の応答結果を統合する処理を省略することができる。
図7は、履歴情報生成部124が応答時間、及び情報量の評価指標を取得する処理を概念的に示す図である。図7の例において、エージェント機能部150−1〜150−3が「地図検索機能」に係るコマンドに対する応答結果A〜Cを管理部110に出力した場合に、それぞれの応答時間が2.0[秒]、3.5[秒]、5.8[秒]であったとする。応答時間に係る所定のしきい値によって、2.5[秒]未満を「短い」、2.5[秒]以上〜5[秒]未満を「普通」、5[秒]以上を[長い]と分類する場合、履歴情報生成部124は、応答結果Aの応答時間を「短い」と分類し、応答結果Bの応答時間を「普通」と分類し、応答結果Cの応答時間を「長い」と分類して、履歴情報164の対応する機能にそれぞれ対応付ける。
また、履歴情報生成部124は、エージェントサーバ200−1〜200−3から取得した応答結果A〜Cの情報量をそれぞれ取得する。そして、履歴情報生成部124は、情報量にかかる所定のしきい値に基づいて、取得した情報量を「多い」、「普通」、及び「少ない」のうち、いずれかに分類し、分類した情報を履歴情報164の当該コマンドによって提供されるサービスに対応付ける。
図7の例において、例えば、エージェントサーバ200−1〜200−3の対話管理部220は、乗員から「〇〇レストランまで道順は?」というコマンドを受け付けた場合、ネットワーク検索部222によりコマンドに対応する情報として各種ウェブサーバ300から「〇〇レストラン」までの道順に係る情報を取得する。エージェント機能部150−1〜150−3は、エージェントサーバ200−1〜200−3から取得した応答結果A〜Cのそれぞれの情報量が、512[KB]、143[KB]、27[KB]であったとする。情報量に係る所定のしきい値によって、500[KB]以上を情報量が「多い」とし、500[KB]未満〜100[KB]以上を情報量が「普通」とし、100[KB]未満を情報量が「少ない」として分類する場合、履歴情報生成部124は、応答結果Aの情報量を「多い」と分類し、応答結果Bの情報量を「普通」と分類し、応答結果Cの情報量を「少ない」と分類して、履歴情報164の対応する機能にそれぞれ対応付ける。
なお、応答時間に係る所定のしきい値、及び情報量に係る所定のしきい値は、サービスの種類によってそれぞれ異なる値であってもよい。ここで、サービスの種類によっては、応答結果の情報量が異なり、情報量によっては応答時間が異なる場合がある。履歴情報生成部124は、情報量が多く、応答時間が長くなる機能については、応答時間に係る所定のしきい値を比較的長く設定し、情報量に係る所定のしきい値を比較的多く設定する。また、履歴情報生成部124は、情報量が少なく、応答時間が短くなる機能については、応答時間に係る所定のしきい値を比較的短く設定し、情報量に係る所定のしきい値を比較的少なく設定する。
図8は、履歴情報生成部124が確信度の評価指標を取得する処理を概念的に示す図である。複数のエージェント機能部150−1〜150−3のそれぞれは、例えば、個々の記憶部250に設けられたパーソナルプロファイル252や知識ベースDB254、応答規則DB256に基づいて応答内容を決定すると共に、応答内容に対する確信度を決定する。
例えば、対話管理部220は、乗員から「最近流行っているお店は?」というコマンドを受け付けた場合、ネットワーク検索部222によりコマンドに対応する情報として各種ウェブサーバ300から「洋服のお店」、「靴のお店」、「イタリアンレストランのお店」の情報を取得したとする。ここで、対話管理部220は、パーソナルプロファイル252を参照し、乗員の趣味との合致度が高い応答結果の確信度を高く設定する。例えば、乗員の趣味が「食事」である場合、対話管理部220は、「イタリアンレストランのお店」の確信度を他の情報よりも高く設定する。また、対話管理部220は、各種ウェブサーバ300から取得したそれぞれの店に対する一般ユーザの評価結果(お勧め度合)が高いほど確信度を高く設定してもよい。
また、対話管理部220は、コマンドに対する検索結果として得られた応答候補の数に基づいて確信度を決定してもよい。例えば、対話管理部220は、応答候補の数が1つである場合、他の候補が存在しないため、確信度を最も高く設定する。また、対話管理部220は、応答候補の数が多くなるほど、それぞれの確信度を低くなるように設定する。
また、対話管理部220は、コマンドに対する検索結果として得られた応答内容の充実度に基づいて確信度を決定してもよい。例えば、対話管理部220は、検索結果として文字情報だけでなく画像情報も取得できた場合には、画像が取得できていない場合よりも充実度が高いため確信度を高く設定する。
また、対話管理部220は、コマンドと応答内容の情報を用いて知識ベースDB254を参照し、両者の関係性に基づいて確信度を設定してもよい。また、対話管理部220は、パーソナルプロファイル252を参照し、最近(例えば、1か月以内)の対話の履歴で同様の質問があったか否かを参照し、同様の質問があった場合に、その回答と同様の応答内容の確信度を高く設定してもよい。対話の履歴は、発話した乗員との対話の履歴でもよく、乗員以外のパーソナルプロファイル252に含まれる対話の履歴でもよい。また、対話管理部220は、上述した複数の確信度の設定条件のそれぞれを組み合わせて確信度を設定してもよい。
また、対話管理部220は、確信度に対する正規化を行ってもよい。例えば、対話管理部220は、上述したそれぞれの設定条件ごとに確信度が0〜1の範囲となる正規化を行う。これにより、複数の設定条件によって設定された確信度で比較を行う場合であっても均一に定量化されるため、何れかの設定条件の確信度だけが大きくなることがない。その結果、確信度に基づいて、より適切な応答結果を選択することができる。
図8の例において、エージェント機能部150−1が決定した応答結果Aの確信度が0.8、エージェント機能部150−2が決定した応答結果Bの確信度が0.5、エージェント機能部150−3が決定した応答結果Cの確信度が0.2であったとする。確信度に係る所定のしきい値によって、0.8以上を確信度が「高い」とし、0.8未満〜0.5以上を確信度が「普通」とし、0.5未満を確信度が「低い」として分類する場合、履歴情報生成部124は、応答結果Aの確信度を「高い」と分類し、応答結果Bの確信度を「普通」と分類し、応答結果Cの確信度を「低い」と分類して、履歴情報164の対応する機能にそれぞれ対応付ける。
履歴情報生成部124は、例えば、上述した処理によって、乗員が発話する度、又は対応するエージェントの機能が用いられる度に、サービスの品質に係る情報を取得し、履歴情報164を生成(更新)する。
なお、上述では、エージェント装置100が履歴情報生成部124を備え、履歴情報164を生成する場合について説明したが、これに限られない。エージェント装置100の記憶部160には、予め生成された履歴情報164が記憶されていてもよい。この場合、エージェント装置100以外の装置が履歴情報164を生成するものであり、エージェント装置100は、履歴情報生成部124を備えていなくてもよい。
[選択部126の処理について]
以下、選択部126が、履歴情報164に基づいて乗員の発話に対する応答を行うエージェント機能部150を選択する処理の詳細について説明する。選択部126は、乗員の発話よりも前に生成された履歴情報164を参照し、エージェント機能部150−1〜150−3のそれぞれのサービスの品質を比較し、品質が良いエージェント機能部150を、乗員の発話に対する応答を行うエージェント機能部150(エージェント)として選択する。まず、選択部126は、自然言語処理部122によって特定された機能を検索キーとして履歴情報164を検索し、当該機能を実行可能なエージェントを特定する。そして、選択部126は、特定されたエージェントのうち、最もサービス品質が良い機能を提供するエージェント機能部150を、乗員の発話に対する応答を行うエージェント機能部150として選択する。選択部126は、例えば、サービスの品質を示す評価指標が複数存在する場合、全ての評価指標を総合してエージェント機能部150を選択してもよく、複数の評価指標のうち、一以上の(任意の)評価指標に基づいて、エージェント機能部150を選択してもよい。
選択部126は、例えば、3段階によって示される評価指標を、サービスの品質が低い順に「1」、「2」、及び「3」の数値に変換し、最も評価指標の合計値が高いエージェント機能部150を、乗員の発話に対する応答を行うエージェント機能部150として選択する。
なお、上述では、履歴情報164には、サービスの品質を示す情報として3段階によって表される評価指標が含まれる場合について説明したが、これに限られない。例えば、履歴情報164には、履歴情報生成部124によって取得されたサービスの品質を取得する際に用いられた直値(応答時間、情報量、確信度等)が含まれていてもよい。この場合、選択部126は、履歴情報164に示される直値に基づいて、サービスの品質が良いエージェント機能部150を選択する。選択部126は、例えば、応答速度が最も速いエージェント、情報量が最も多いエージェント、及び確信度が最も高いエージェント等を、サービスの品質が良いエージェント機能部150として選択する。また、選択部126は、複数の評価指標を総合してエージェント機能部150を選択する場合、サービスの品質を取得する際に用いられた各種直値(応答時間、情報量、確信度等)に対して符号変換や標準化等のデータ変換を行うことにより、同一のスケールによって評価できるようにした後、その値の合計値に基づいてエージェント機能部150を選択してもよい。例えば、選択部126は、値が大きい方がサービスの品質が良く、値が小さいほうがサービスの品質が悪いように、それぞれの直値に対してデータ変換を行う。選択部126は、データ変換後の値の合計値が最も大きいエージェントを特定し、特定したエージェントを実現するエージェント機能部150を選択する。
[動作フロー]
図9は、第1実施形態に係るエージェント装置100の動作の一連の流れを示すフローチャートである。本フローチャートの処理は、例えば、所定時間間隔毎、又は所定のタイミングによって繰り返し実行される。
まず、音声認識部120は、マイク10によって乗員の発話が受け付けられたか否かを判定する(ステップS100)。音声認識部120は、マイク10によって乗員の発話が受け付けられたと判定した場合、乗員の発話の音声に対する音響処理を行う(ステップS102)。次に、音声認識部120は、音響処理が行われた音声(音声ストリーム)の認識を行い、音声をテキスト化する(ステップS104)。次に、自然言語処理部122は、テキスト化された文字情報に対する自然言語処理を実行し、文字情報の意味解析を行う(ステップS106)。
次に、自然言語処理部122は、意味解析によって得らえた乗員の発話内容にコマンドが含まれるか否かを判定する(ステップS108)。自然言語処理部122は、乗員の発話内容にコマンドが含まれない場合、処理を終了する。選択部126は、自然言語処理部122によって乗員の発話内容にコマンドが含まれると判定された場合、自然言語処理部122によって特定されたコマンド(機能)を検索キーとして履歴情報164を検索し、最もサービスの品質が良いエージェントを実現するエージェント機能部150を、乗員の発話に対する応答を行うエージェント機能部150として選択する(ステップS110)。
選択部126は、自然言語処理部122によって特定されたコマンドを、選択したエージェント機能部150に対して出力する(ステップS112)。コマンドを受け付けたエージェント機能部150は、コマンドに対する処理を実行する(ステップS114)。選択部126は、選択したエージェント機能部150から応答結果を取得し、乗員の発話に対する応答を実行する(ステップS116)。これにより、本フローチャートの処理は、終了する。
[第1実施形態のまとめ]
以上説明したように、本実施形態のエージェント装置100によれば、車両Mの乗員の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部150と、乗員の発話に含まれる音声コマンドを認識する認識部(音声認識部120、自然言語処理部122)と、認識部により認識された音声コマンドを実行して乗員の発話に対応するエージェント機能部150であり、サービスの品質が良いエージェント機能部150を、複数のエージェント機能部150から選択する選択部126と、を備えることにより、より適切な応答結果を提供することができる。
<第2実施形態>
以下、第2実施形態について説明する。第2実施形態では、サービスの品質が良いことが既に確定しているエージェントが存在する場合について説明する。なお、上述した実施形態と同様の構成については、同一の符号を付して説明を省略する。
図10は、第2実施形態に係るエージェント装置100Aの構成と、車両Mに搭載された機器とを示す図である。車両Mには、例えば、一以上のマイク10と、表示・操作装置20と、スピーカユニット30と、ナビゲーション装置40と、車両機器50と、車載通信装置60と、乗員認識装置80と、エージェント装置100Aとが搭載される。また、汎用通信装置70が車室内に持ち込まれ、通信装置として使用される場合がある。これらの装置は、CAN通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。
また、エージェント装置100Aは、エージェント装置100が備える記憶部160に変えて(或いは、加えて)、記憶部160Aを備える。記憶部160Aには、例えば、辞書DB162と、履歴情報164と、確定エージェント情報166等のデータやプログラムが格納される。確定エージェント情報166は、サービスの品質が良いことが確定しているエージェントを示す情報である。
図11は、確定エージェント情報166の内容の一例を示す図である。確定エージェント情報166には、例えば、エージェントが提供可能なサービス(つまり、実行可能な機能)と、当該機能を最もサービスの品質が良く提供できるエージェントとが互いに対応付けられた情報である。本実施形態の選択部126は、例えば、確定エージェント情報166を生成する処理を実行する。選択部126は、例えば、例えば、あるエージェントの機能について、サービスの品質に係る情報が所定のしきい値以上で(つまり、サービスの品質が良く)、且つ当該機能が所定回数以上乗員に提供されたことがある場合、当該エージェントを、最もサービスの品質が良く当該機能を提供することができるエージェントと判定し、当該機能と、当該エージェントとを互いに対応付けて確定エージェント情報166を生成(更新)する。
また、本実施形態の選択部126は、履歴情報164に基づいて、最もサービスの品質が良いエージェントを動的に選択する状態から、確定エージェント情報166に基づいて、最もサービスの品質が良く提供できるエージェントを実現するエージェント機能部150を固定的に選択する状態に移行する。まず、自然言語処理部122によって特定された機能を検索キーとして確定エージェント情報166を検索し、当該機能が確定エージェント情報166に含まれるか否かを判定する。選択部126は、当該機能が確定エージェント情報166に含まれる場合、当該機能に対応付けられたエージェントを、最もサービスの品質が良いエージェントとして特定する。そして、選択部126は、特定されたエージェントを実現するエージェント機能部150を、乗員の発話に対する応答を行うエージェント機能部150として固定的に選択する。選択部126によってエージェント機能部150が選択された後の処理、及び確定エージェント情報166に自然言語処理部122によって特定された機能が含まれない場合の処理は、上述した実施形態と同様であるため、説明を省略する。
なお、選択部126は、最もサービスの品質が良いエージェントを確定する処理を、判定対象の機能がいずれのエージェントにも使用されている場合に行ってもよい。例えば、図6の履歴情報164において、エージェント2の「天気予報機能」には、サービスの品質を示す情報が対応付けられていないため、選択部126は、「天気予報機能」を最もサービスの品質が良く提供できるエージェントを確定する処理を行わない。これにより、選択部126は、まだ機能が使用されていないエージェントが最もサービスの品質が良く提供できるエージェントである場合に、他のエージェントがサービスの品質が良く提供できるエージェントとして確定されることを抑制することができる。
ここで、確定エージェント情報166にある機能が含まれた後に、初めて当該機能が乗員に提供される場合、エージェント機能部150は、乗員の発話とサービスの提供との間に、当該ある機能について、最もサービスの品質が良く提供できるエージェントが確定し、固定的に選択されることとなったことを、乗員に通知してもよい。図12は、乗員の発話とサービスの提供との間に、確定したエージェントを紹介する対話の一例を示す図である。まず、乗員は、エージェントに対して、地図検索機能の提供を要求する旨を含む発話CV1を行う。発話CV1は、例えば、「〇〇レストランまでの道順は?」等の言葉である。これを受けて、選択部126は、例えば、上述した処理によって自然言語処理部122が特定した機能(この一例では、地図検索機能)を検索キーとして、確定エージェント情報166を検索する。図11に示す確定エージェント情報166において、「地図検索機能」は、エージェント1が最もサービスの品質が良く提供できるエージェントとして確定している。このため、選択部126は、エージェント機能部150−1を乗員の発話に対する応答を行うエージェント機能部150として固定的に選択する。
選択部126によって固定的に選択されたエージェント機能部150(この一例では、エージェント機能部150−1)は、発話CV1に対する応答結果RP1を、対応するエージェントサーバ200(この一例では、エージェントサーバ200−1)から取得し、当該応答結果RP1に音声合成を行って音声を出力するように音声制御部118に指示する。
応答結果RP1には、例えば、発話CV1において、要求されている機能を実現するエージェント機能部150のエージェントを紹介する言葉が含まれる。また、応答結果RP1には、例えば、最もサービスの品質が良いエージェントが確定していることを乗員に伝える言葉が含まれる。また、応答結果RP1には、最もサービスの品質が良いエージェントを伝えた後に、サービスの提供に係る言葉(つまり、乗員の発話の回答を示す言葉)が含まれる。応答結果RP1には、例えば、「こんにちは、△△(エージェント1)です。今後は、私が地図検索機能を提供します。〇〇レストランまでは…」等の言葉である。
また、応答結果は、サービスの提供に係る言葉の後に、最もサービスの品質が良いエージェントを伝えるものであってもよい。図13は、サービスの提供後に、確定したエージェントを紹介する対話の一例を示す図である。応答結果RP2には、例えば、発話CV1において、要求されている機能を実現するエージェント機能部150のエージェントを紹介する言葉が含まれる。また、応答結果RP2には、サービスの提供に係る言葉が含まれる。また、応答結果RP2には、例えば、サービスを提供した後に、最もサービスの品質が良いエージェントが確定していることを乗員に伝える言葉が含まれる。この場合、応答結果RP2には、例えば、「こんにちは、△△(エージェント1)です。〇〇レストランまでは、…、今後は、私が地図検索機能を提供します。」等の言葉である。
図12の応答結果RP1、又は図13の応答結果RP2のように回答することにより、エージェント機能部150は、乗員に対して自然に最もサービスの品質が良いエージェントを知らせることができる。また、選択部126は、最もサービスの品質が良いエージェントが確定している場合、乗員の発話において、サービスの要求さえ受け付ければエージェント(エージェント機能部150)を選択することができるため、サービスの要求に際してウエイクアップワードを省略することができる。
なお、エージェント機能部150は、最もサービスの品質が良いエージェントに係る情報は、サービスの提供に係る言葉の前にしてほしい旨、乗員から指定があった場合には、図12の応答結果RP1のように通知し、サービスの提供に係る言葉の後にしてほしい旨、乗員から指定があった場合には、図13の応答結果RP2のように通知するように、通知の態様を制御してもよい。また、エージェント機能部150は、最もサービスの品質が良いエージェントに係る情報を、サービスの提供に係る言葉の前と後との両方に通知してもよい。
また、選択部126は、確定エージェント情報166を参照し、乗員の発話にウエイクアップワードと、コマンドとが認識された場合であっても、当該ウエイクアップワードにより指定されたエージェントが、自然言語処理部122により認識されたサービスを最も良い品質によって提供できるエージェントではない場合には、確定エージェント情報166に示されるサービスを最も良い品質によって提供できるエージェントを、乗員の発話に対する応答を行うエージェント(エージェント機能部150)として選択してもよい。また、選択部126は、確定エージェント情報166を参照し、乗員の発話にウエイクアップワードと、コマンドとが認識された場合であっても、当該ウエイクアップワードにより指定されたエージェントが、自然言語処理部122により認識されたサービスを最も良い品質によって提供できるエージェントではない場合には、最も良い品質によってサービスを提供できるエージェントを乗員に通知してもよい。この場合、選択部126は、例えば、最も良い品質によってサービスを提供できるエージェントを紹介する音声を音声制御部118によって出力させる。エージェントを紹介する処理において、音声制御部118は、「通知制御部」の一例である。なお、表示制御部116は、エージェントを紹介する画像を第1ディスプレイ22、第2ディスプレイ24、及びメーターディスプレイ29党に表示してもよい。この場合、表示制御部116は、「通知制御部」の一例である。
[動作フロー]
図14は、選択部126が確定エージェント情報166を生成する処理の一連の流れを示すフローチャートである。本フローチャートの処理は、例えば、所定時間間隔毎、又は所定のタイミングによって繰り返し実行させる。
まず、選択部126は、履歴情報164に示される機能のうち、最もサービスの品質が良いエージェントであるか否かを判定する判定対象の機能を特定する(ステップS200)。選択部126は、履歴情報164に基づいて、特定した機能を実現可能なエージェントのうち、当該機能を未実行のエージェントが存在するか否かを判定する(ステップS202)。選択部126は、当該機能を未実行のエージェントが存在する場合、最もサービスの品質が良いエージェントを確定する段階にないものとして、処理をステップS210に進める。選択部126は、特定した機能を実現するエージェントのうち、当該機能の提供が乗員の発話によって要求された際に、最もサービスの品質が良いエージェントとして、所定回数以上選択したエージェントが存在するか否かを判定する(ステップS204)。選択部126は、所定回数以上選択したエージェントが存在しない場合、最もサービスの品質が良いエージェントを確定する段階にないものとして、処理をステップS210に進める。
選択部126は、所定回数以上選択したエージェントが存在する場合、ステップS200において特定された機能に係る当該エージェントのサービスの品質を示す情報が、所定のしきい値以上(例えば、応答速度が所定のしきい値以上に速い、情報量が所定のしきい値以上に多い、或いは、確信度が所定のしきい値以上に高い等)であるか否かを判定する(ステップS206)。選択部126は、サービスの品質を示す情報が所定のしきい値以上ではない場合、最もサービスの品質が良いエージェントとして確定せずに、処理をステップS208に進める。
選択部126は、サービスの品質を示す情報が所定のしきい値以上である場合、当該エージェントを最もサービスの品質が良く提供するエージェントとして確定し、当該エージェントと、ステップS200において特定された機能とを対応付けて確定エージェント情報166を生成(更新)する(ステップS208)。選択部126は、履歴情報164に示される全ての機能に対して、上述した処理を行うまでの間、ステップS200〜S208の処理を繰り返す(ステップS210)。
図15は、第2実施形態に係るエージェント装置100Aの動作の一連の流れを示すフローチャートである。本フローチャートの処理は、例えば、所定時間間隔毎、又は所定のタイミングによって繰り返し実行される。図15に示すフローチャートは、上述した図10の第1実施形態におけるフローチャートと比較して、ステップS100〜S116の処理に代えて、ステップS300〜S306の処理を備える点で相違する。したがって、以下では、主にステップS300〜S306の処理を中心として説明する。
選択部126は、ステップS108において、自然言語処理部122が意味解析によって得らえた乗員の発話内容にコマンドが含まれると判定した場合、確定エージェント情報166を参照し、当該コマンドに係る機能を提供する最もサービス品質の良いエージェントが確定しているか否かを判定する(ステップS300)。選択部126は、最もサービス品質の良いエージェントが確定していない場合、処理をステップS110に進める。選択部126は、最もサービス品質の良いエージェントが確定していると判定した場合、当該確定しているエージェント(エージェント機能部150)を固定的に選択し、自然言語処理部122によって特定されたコマンドを、選択したエージェント機能部150に対して出力する(ステップS302)。コマンドを受け付けたエージェント機能部150は、コマンドに対する処理を実行する(ステップS304)。選択部126は、選択したエージェント機能部150から応答結果を取得し、乗員の発話に対する応答を実行する(ステップS306)。これにより、本フローチャートの処理は、終了する。
[第2実施形態のまとめ]
以上説明したように、本実施形態のエージェント装置100Aによれば、車両Mの乗員の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部150と、乗員の発話に含まれる音声コマンドを認識する認識部(音声認識部120、自然言語処理部122)と、認識部により認識された音声コマンドを実行して乗員の発話に対応するエージェント機能部150であり、サービスの品質が良いエージェント機能部150を、複数のエージェント機能部150から選択する選択部126と、を備え、選択部126が確定エージェント情報166に基づいて、最もサービスの品質が良いことが既に確定しているエージェントを選択することにより、より適切な応答結果を提供することができる。
[音声認識部、及び自然言語処理部の機能について]
なお、上述した実施形態では、音声認識部120、及び自然言語処理部122をエージェント装置100、及び100Aが備える場合について説明したが、これに限られない。音声認識部120、及び自然言語処理部122に相当する機能は、エージェントサーバ200に供えられるものであってもよい。この場合、エージェント装置100、及び100Aは、音響処理部112によって音響処理が行われた音声ストリームをエージェントサーバ200に供給し、音声認識部120、及び自然言語処理部122に相当する機能によって、乗員の発話中(つまり、音声ストリーム)に含まれるコマンド(機能)を特定し、選択部126に供給する。選択部126は、エージェントサーバ200によって供給された機能に係る情報に基づいて、処理を実行する。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1…エージェントシステム、10…マイク、20…表示・操作装置、22…第1ディスプレイ、24…第2ディスプレイ、29…メーターディスプレイ、30…スピーカユニット、30A、30B、30C、30D、30E、30F…スピーカ、40…ナビゲーション装置、50…車両機器、60…車載通信装置、70…汎用通信装置、80…乗員認識装置、100、100A…エージェント装置、110…管理部、112…音響処理部、114…エージェントごとWU判定部、116…表示制御部、118…音声制御部、120…音声認識部、122…自然言語処理部、124…履歴情報生成部、126…選択部、150、150−1、150−2、150−3…エージェント機能部、152…ペアリングアプリ実行部、160、160A…記憶部、164…履歴情報、166…確定エージェント情報、200、200−1、200−2、200−3…エージェントサーバ、210…通信部、220…対話管理部、222…ネットワーク検索部、224…応答文生成部、250…記憶部、252…パーソナルプロファイル、300…ウェブサーバ、162…辞書DB162、254…知識ベースDB、256…応答規則DB、M…車両

Claims (9)

  1. それぞれが車両の乗員の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、
    乗員の発話内容に対して前記複数のエージェント機能部のそれぞれが実行したサービスの品質の履歴を示す履歴情報を参照し、前記車両の乗員の発話に対して応答するエージェント機能部を、前記複数のエージェント機能部から選択する選択部と、
    を備えるエージェント装置。
  2. 前記履歴情報には、実行されたサービスの内容、提供元のエージェント機能部、及びサービスの品質を示す情報を含むレコードが含まれ、
    前記選択部は、前記乗員の発話を示す情報と実行されたサービスが合致するレコードの中で、前記サービスの品質が良いレコードに対応する前記エージェント機能部を、前記車両の乗員の発話に対して応答するエージェント機能部として選択する、
    請求項1に記載のエージェント装置。
  3. 出力部を用いて前記乗員に各種情報を通知する通知制御部を更に備え、
    前記選択部は、前記履歴情報に基づいて、ある発話に対してサービスを提供する前記エージェント機能部を動的に選択する状態から固定的に選択する状態に移行し、
    前記通知制御部は、前記選択部が固定的に選択すると確定した前記エージェント機能部に関して、前記出力部を用いて前記乗員に通知する、
    請求項1又は請求項2に記載のエージェント装置。
  4. 前記通知制御部は、前記乗員の発話と、前記サービスの提供との間に、前記選択部が固定的に選択すると確定した前記エージェント機能部に関して、前記出力部を用いて前記乗員に通知する、
    請求項3に記載のエージェント装置。
  5. 前記通知制御部は、前記サービスの提供の後に、前記選択部が固定的に選択すると確定した前記エージェント機能部に関して、前記出力部を用いて前記乗員に通知する、
    請求項3又は請求項4に記載のエージェント装置。
  6. 前記複数のエージェント機能部には、起動に用いられるフレーズがそれぞれ設定され、
    前記選択部は、前記乗員の発話に前記フレーズが含まれていても、前記乗員の発話のうちフレーズ以外の部分が要求するサービスを提供する前記エージェント機能部が確定している場合、当該確定している前記エージェント機能部を、前記車両の乗員の発話に対して応答するエージェント機能部として選択する、
    請求項3から請求項5のうちいずれか一項に記載のエージェント装置。
  7. 前記複数のエージェント機能部には、起動に用いられるフレーズがそれぞれ設定され、
    前記選択部は、前記乗員の発話に前記フレーズが含まれていない場合に、前記エージェント機能部を選択する、
    請求項1から請求項5のうちいずれか一項に記載のエージェント装置。
  8. コンピュータが、
    それぞれが車両の乗員の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部を起動し、
    乗員の発話内容に対して前記複数のエージェント機能部のそれぞれが実行したサービスの品質の履歴を示す履歴情報を参照し、
    前記車両の乗員の発話に対して応答するエージェント機能部を、前記複数のエージェント機能部から選択する、
    エージェント装置の制御方法。
  9. コンピュータに、
    それぞれが車両の乗員の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部を起動させ、
    乗員の発話内容に対して前記複数のエージェント機能部のそれぞれが実行したサービスの品質の履歴を示す履歴情報を参照させ、
    前記車両の乗員の発話に対して応答するエージェント機能部を、前記複数のエージェント機能部から選択させる、
    プログラム。
JP2019055984A 2019-03-25 2019-03-25 エージェント装置、エージェント装置の制御方法、およびプログラム Active JP7274901B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019055984A JP7274901B2 (ja) 2019-03-25 2019-03-25 エージェント装置、エージェント装置の制御方法、およびプログラム
CN202010198716.2A CN111739524B (zh) 2019-03-25 2020-03-19 智能体装置、智能体装置的控制方法及存储介质
US16/826,490 US11355114B2 (en) 2019-03-25 2020-03-23 Agent apparatus, agent apparatus control method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019055984A JP7274901B2 (ja) 2019-03-25 2019-03-25 エージェント装置、エージェント装置の制御方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2020160108A true JP2020160108A (ja) 2020-10-01
JP7274901B2 JP7274901B2 (ja) 2023-05-17

Family

ID=72643068

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019055984A Active JP7274901B2 (ja) 2019-03-25 2019-03-25 エージェント装置、エージェント装置の制御方法、およびプログラム

Country Status (3)

Country Link
US (1) US11355114B2 (ja)
JP (1) JP7274901B2 (ja)
CN (1) CN111739524B (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018067402A1 (en) * 2016-10-03 2018-04-12 Google Inc. Selection of computational agent for task performance

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4645310B2 (ja) 2005-06-02 2011-03-09 株式会社デンソー エージェントキャラクタ表示を利用した表示システム
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
JP2008090545A (ja) * 2006-09-29 2008-04-17 Toshiba Corp 音声対話装置および音声対話方法
JP5312771B2 (ja) * 2006-10-26 2013-10-09 株式会社エム・シー・エヌ クエリに応答して、関連性のある広告を決定する技術
US20140275834A1 (en) * 2013-03-15 2014-09-18 Commercial Vehicle Group, Inc. Health monitoring
JP6411017B2 (ja) * 2013-09-27 2018-10-24 クラリオン株式会社 サーバ、及び、情報処理方法
JP6621613B2 (ja) * 2015-08-10 2019-12-18 クラリオン株式会社 音声操作システム、サーバー装置、車載機器および音声操作方法
JP6686226B2 (ja) * 2016-04-18 2020-04-22 グーグル エルエルシー 適切なエージェントの自動化アシスタント呼び出し
US10115400B2 (en) * 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US10311856B2 (en) * 2016-10-03 2019-06-04 Google Llc Synthesized voice selection for computational agents
US10748531B2 (en) * 2017-04-13 2020-08-18 Harman International Industries, Incorporated Management layer for multiple intelligent personal assistant services

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018067402A1 (en) * 2016-10-03 2018-04-12 Google Inc. Selection of computational agent for task performance
JP2019535037A (ja) * 2016-10-03 2019-12-05 グーグル エルエルシー コンピュータによるエージェントのための合成音声の選択

Also Published As

Publication number Publication date
US11355114B2 (en) 2022-06-07
CN111739524B (zh) 2024-03-08
CN111739524A (zh) 2020-10-02
JP7274901B2 (ja) 2023-05-17
US20200321001A1 (en) 2020-10-08

Similar Documents

Publication Publication Date Title
JP2020147214A (ja) エージェント装置、システム、エージェント装置の制御方法、およびプログラム
JP2020144260A (ja) 車載エージェントシステム、車載エージェントシステムの制御方法、およびプログラム
JP7340943B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
CN111717142A (zh) 智能体装置、智能体装置的控制方法及存储介质
JP2020144274A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020131805A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020144264A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020160833A (ja) 情報提供装置、情報提供方法、およびプログラム
JP2020144275A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020160135A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
US11797261B2 (en) On-vehicle device, method of controlling on-vehicle device, and storage medium
JP7175221B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
US11437035B2 (en) Agent device, method for controlling agent device, and storage medium
US11542744B2 (en) Agent device, agent device control method, and storage medium
US20200320997A1 (en) Agent apparatus, agent apparatus control method, and storage medium
JP2020152298A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP7274901B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020160848A (ja) サーバ装置、情報提供システム、情報提供方法、およびプログラム
JP2020160133A (ja) エージェントシステム、エージェントシステムの制御方法、およびプログラム
JP2020154994A (ja) エージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラム
JP2020142758A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP7280074B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
CN111559317B (zh) 智能体装置、智能体装置的控制方法及存储介质
JP7297483B2 (ja) エージェントシステム、サーバ装置、エージェントシステムの制御方法、およびプログラム
JP2020160132A (ja) エージェント装置、エージェント装置の制御方法、プログラム、エージェントサーバ、およびエージェントサーバの制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230411

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230502

R150 Certificate of patent or registration of utility model

Ref document number: 7274901

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150